Next generation sequencing

Animatie

Animatie sequencing

Samenvatting

  • DNA wordt opgeknipt in stukken van ca. 500 bp en de dubbele strands worden uit elkaar gehaald tot single strands.

  • Er wordt een overvloed aan A-primer en B-primer toegevoegd, die met ligase aan de uiteinden van het DNA worden geplakt. De ligase plakt niet de losse stukjes DNA aan elkaar, omdat hier de energie middels een fosfaatgroep voor ontbreekt. Deze fosfaatgroep hebben de primers wel.

  • Alle stukjes DNA van ca. 500 bp worden via de A-primer aan beads geplakt. Vervolgens worden alleen beads geselecteerd waar slechts één stukje DNA aan geplakt zit. Beads met meerdere stukjes DNA worden verwijderd.

  • De beads worden samen met een overvloed aan nucleotiden in emulsie gebracht door een vetoplossing toe te voegen. Vervolgens ontstaan rond elke beat een waterbelletje, waar precies één bead in past. Binnen zo'n belletje wordt vervolgens een PCR op gang gebracht, waardoor de stukjes DNA van ca. 500 bp worden gedupliceerd (binnen het belletje). De gedupliceerde stukjes DNA plakken automatisch weer vast aan de bead. Door dit proces een tijdje te herhalen ontstaan uiteindelijke beads met vele identieke stukjes DNA van ca. 500 bp.

  • De beads worden vervolgens over een glasplaat met een honingraatstructuur uitgestreken. In elke honingraat past precies één bead. Vervolens wordt er eerst een overvloed aan A-nucleotiden, vervogens, T-nucleotiden, vervolgens C-nucleotiden en vervolgens G-nucleotiden toegevoegd, telkens na het wegwassen van de vorige nucleotiden. Het toevoegen van deze nucleotiden aan het DNA zorgt voor het vrijkomen van energie wat wordt opgepikt door een sterke camera. Daardoor kom je uiteindelijk de exacte sequentie van het DNA op elke bead te weten. Met software kun je vervolgens uitvogelen wat de overlappende stukjes DNA zijn, zodat je uiteindelijk de volgorde van alle 46 chromosomen kunt bepalen.

Genetische epidemiologie

Hardy-Weinberg equilibrium

Wet van Hardy-Weinberg: voor een SNP met allelen A en B veranderen de allelproportie (bv. A of B) en genotype proporties (bv. AA, AB, BB) niet over tijd. Er is geen Hardy-Weinberg equilibrium in de volgende gevallen: kleine steekproef, non-random geslachtelijke voortplanting, selectie, mutaties, migratie en genetic drifting. De formule is: p² + 2pq + q² = 1. Dus, de proportie homozygositeit in de populatie is hetzelfde als het kwadraat van de allelproportie (of ) en de proportie heterozygositeit is hetzelfde als het product p x q. Vervolgens kun de drie genotypen AA, AB en BB aangegeven worden met een dosis 0, 1 en 2, waardoor regressie mogelijk is voor een bepaalde ziekte/trait. Als de wet van Hardy-Weinberg niet standhoudt, dan kunnen de drie genotypes proporties (AA, AB en BB = 2 vrijheidsgraden) niet weergegeven op basis van enkel p en q (= 1 vrijheidsgraad).

Het testen van de wet van Hardy-Weinberg wordt ook gedaan in GWAS studies: je test of de geobserveerde proportie heterozygoten significant anders is dan de verwachte proportie heterzygoten. De P-waarde wordt gecorrigeerd voor het aantal testen (Bonferroni correctie). Indien geen Hardy-Weinberg equilibrium, dan kan dat duiden op genotyping errors (meestal), batch effecten, populatiestratificatie of (zelden) een associatie. Overweeg deze SNPs te verwijderen uit analyse indien P<10^-6 in controles.

Slechts één set van genotype frequenties resulteert in Hardy-Weinberg equilibrium
Om te beoordelen of de wet van Hardy-Weinberg standhoudt voor een bepaalde SNP is door de proportie geobserveerde heterozygoten (2pq) te delen door de proportie verwachte heterozygoten o.b.v. Hardy-Weinberg (2 * (p² + 0.5*2pq) + (q² + 0.5*2pq)), een ratio die 1 zou moeten zijn. Vervolgens kan met een Chi-kwadraat toets getest worden of 1 minus dit getal (= f) significant verschillend is van 0.

Genetic drift

Van generatie op generatie is de verwachte genotype frequentie altijd hetzelde als de eerste generatie, maar de geobserveerde variatie zal steeds minder worden. Een populatie beweegt altijd richting AA of BB door random variatie. Dit heet genetic drift. Dat betekent dat de verwachte allelfrequentie hetzelfde blijft (bijvoorbeeld 0.5 voor allel A van generatie op generatie), alleen de variantie wordt steeds groter (omdat een populatie ofwel richting AA of richting BB beweegt). De kans dat twee allen uit de populatie (dus twee verschillende personen) identiek zijn by descent kan geschat worden.

Assocation en linkage mapping

Quantitave trait loci (QTL) zijn genen die betrokken zijn bij complexe traits. Om te detecteren dat deze QTL een bepaalde trait veroorzaken kan gebruik gemaakt worden van asociation mapping.

Stel dat een een nieuwe mutatie op een bepaald chromosoom die een bepaalde trait veroorzaakt enkele generaties geleden is opgetreden (zie voorbeeld in rood op het blauw chromosoom). Door recombinatie zullen uiteindelijk verschillende varianten van dit chromosoom ontstaan. Als vervolgens varianten gevonden weer die significant vaker vóórkomen in patiënte met dan zonder de ziekte, dan moeten die wel dichtbij de QTL liggen die de ziekte veroorzaakt.