CRISPR-Cas9 is een adaptief verdedigingsmechanisme van bacteriën tegen virussen. Het is een ribonucleoproteïne (RNP) bestaande uit de volgende elementen
Cas9 eiwit: een endonuclease dat DNA knipt op precies 3 nucleotiden afstand van de PAM.
guide RNA (gRNA of single guide RNA, sgRNA): bestaat uit tracrRNA en crRNA (crisprRNA) die met een loop aan elkaar gemaakt zijn. De sgRNA heeft een target-specifieke sequence waar het het stukje DNA herkent dat geknipt moet worden.
Een belangrijke voorwaarde is dat Cas9 (van S. pyogenes) een PAM (een Protospacer Adjacent Motif) moet herkennen. Dit is een stukje DNA bestaan uit '5’-NGG-3’ (i.e. nucleotide [A, G, C, of T] - guanine - guanine), bijvoorbeeld TGG. Deze NGG sequenties komen iedere 8 tot 12 basenparen voor in het genoom, dus elk gen heeft veel NGGs om uit te kiezen. De PAM ligt op de non-target strand. De 20 nucleotiden naast de PAM op de target strand vormen het DNA target. De sgRNA is complementair aan dit target. Een sgRNA kan ontworpen worden via websites (bv. https://chopchop.cbu.uib.no/) waardoor ook andere (off-target) locaties in het DNA geïdentificeerd kunnen worden.
Mechanisme
Cas9 komt random in contact met DNA en zoekt naar PAMs (5′-NGG-3′). De PAMs worden herkend via het PAM interacting (PI) domein.
Na binding van Cas9 aan een PAM gaan de twee DNA strands uit elkaar, en wordt getest of de 20 nucleotiden van sgRNA een match vormen met het DNA op de target strand. De laatste nucleotiden van het stukje DNA (dus het verst van de PAM) mogen enigszins verschillen van de sgRNA sequence. Als er een match is, dan wordt een R-loop gevormd: drie strands, te weten DNA:RNA hybrid en single-stranded DNA.
Bij een match worden de endonucleases geactiveerd. Het HNH domein knipt de target DNA strand precies 3 nucleotiden na de PAM. Het RuvC domein knipt de non-target strand meestal op 3 nucleotiden na de PAM, maar soms ook 4 of 5 nucleotiden na de PAM. Hierdoor ontstaat een double-strand break (DSB).
Na het vormen van de DSB probeert de cel dit te repareren via non-homologous end joining (NHEJ) en homology directed repair (HDR).
Bij NHEJ worden de uiteinden van het DNA weer aan elkaar geplakt. Dit kan foutloos gebeuren of leiden tot een mutatie. Als het foutloos gebeurt, dan zal Cas9 simpelweg weer het DNA herkennen en knippen. Er kunnen voorafgaand aan de re-ligatie ook nucletoiden toegevoegd of verwijderd worden; dit kan leiden tot een insertie of deletie ('indels'), wat kan leiden tot een frameshift mutatie (en dus een dysfunctionele sequence). Een nadeel van NHEJ is dat er (grote) deleties ontstaan, chromosomale translocaties, chromotripsis, en activatie van het tumorsuppressor gen p53. Dit kan nadelige gevolgen hebben, zeker als het off-target (dus ergens anders in het genoom) gebeurt.
Bij HDR wordt een kopie van het DNA op het andere chromosoom als template gebruikt. Dit systeem kan ook misbruikt worden om een specifieke (kunstmatige) sequence in het DNA in te bouwen, door een exogeen DNA template mee te leveren met CRISPR-Cas9. Echter, HDR is alleen actieve in mitotische cellen, aangezien reparatiefactoren nodig zijn die doorgaans alleen tot expressie worden gebracht in de S en G2 fase van de celcyclus. Daarnaast wordt HDR meestal 'outcompeted' door NHEJ. Daarnaast kan het exogene DNA template ook digested worden voordat het gebruikt kan worden.
Single guide RNA
NHEJ vs HDR
Base editing voorkomt dat er een double-strand break in het DNA ontstaat. Er kan gebruik worden gemaakt van dead Cas9 (dCas9) of nickase Cas9 (nCas9). Nickase Cas9 bevat een mutatie in Cas9 waardoor het RUVC domein (vaak D10A mutatie) óf het HNH (vaak H840A mutatie) niet in staat is om een DNA strand te knippen. Hierdoor wordt slechts één DNA strand geknipt (single-strand break), wat een 'nick' wordt genoemd; de RuvC-inactivated nickase Cas9 (D10A mutatie) zorgt ervoor dat alleen de pairing (target) strand geknipt wordt, en de H840A mutatie zorgt ervoor dat alleen de non-pairing (non-target) strand geknipt wordt. Dit wordt daarom ook nCas9 (nickase Cas9) genoemd.
De voordelen zijn (1) grotere efficiëntie, (2) veel minder indel byproducts, (3) veel moinder ongewenste consequenties van DSBs. Nadelen kunnen verdeeld worden in off-target vs on-target, en Cas9 afhankelijk vs onafhankelijk.
Algemeen: enkel 6 van de 12 mogelijke puntmutaties kunnen gecorrigeerd worden
On-target:
Excisie van deaminated bases wat kan leiden tot inserties of deletes (maar wel minder risico dan met conventionele CRISPR-Cas9 therapie)
Bystander editing
Nicking kan alsnog leiden tot DNA schade en daarmee DSBs
Off-target:
Cas9-afhankelijke off-target editing door vergelijkbare target sequence elders in genoom
Cas-9 onafhankelijke off-target editing van DNA substraten die tijdelijk single stranded zijn
Guide RNA onafhankelijke RNA editing
Nadelen zijn (1), (2) nog steeds (kleine) kans op inserties of deleties, (3) bystander editing, (4) geen mogelijkheid tot het uitvoeren van specifieke inserties, deleties of transversies, (4) off-target effecten en (5) (bron).
Het doel van base editing is om één basepaar te veranderen. Alleen de volgende opties zijn mogelijk
C•G-naar T•A (cytosine base editors)
A•T naar G•C (adenosine base editors)
C•G naar G•C (C-to-G base editor)
Een adenosine base editor (ABE) maakt gebruikt van adenosine deaminase (ADA) dat de nucleotide adenosine omzet in inosine. Inosine wordt door polymerases gelezen als guanosine, waardoor dus een A-->G verandering plaatsvindt. Aangezien alleen RNA-specifieke ADA (ADAR) voorkomen in de natuur wordt voor base eiditing gebruikt gemaakt van een engineered tRNA-specifieke ADA (tADA) uit E. coli met DNA specificiteit. Door de ADA ontstaat een G*T mismatch die wordt hersteld door DNA reparatie-eiwitten naar ófwel de oorspronkelijk sequentie ófwel de mutatie. Het gebruik van de nickase Cas9 (in plaats van dead Cas9) zorgt ervoor dat de cel de deaminated DNA strand als repair template gebruikt.
Een cytosine base editor maakt gebruikt van van cytidine deaminase waardoor cytidine naar uridine wordt omgezet en een C-->T verandering plaatsvindt. Een uracil glycosylase remmer wordt toegevoegd om de excisie van uracil uit het genoom te remmen.
Een adenine base editor (ABE) bestaat uit nCas9 (D10A) gekoppeld aan een tRNA specifieke adenosine deaminase (tADA). Het 'editing window' voor een ABE (m.a.w. welke A moet er ge-edit worden binnen de 20 nucleotiden van het target DNA?) is ongeveer 2-5 basen. Nucleotiden dichtbij het target kunnen dus ook gedeamineerd worden ('bystander edit').
Aangezien een deel van de R-loop buiten het Cas9 complex ligt wordt deze toegankelijk voor ADA. De locatie van de deaminase activiteit is afhankelijk van de linker length (tussen de Cas9 en ADA). Het activiteitswindow van ABE8.8 is meestal tussen positie 3 en 9 van de protospacer (+17 tot +11 van PAM), met piek editing op positie 6 (+14 van PAM) (bron).
Prime editing geeft meer mogelijkheden, flexibiliteit en puriteit dan base editing. De opties zijn alle 12 single-base substituties, multiple base substituties, kleine inserties , kleine deletes en combinaties hiervan.
Het prime editing complex bestaat uit:
Prime editor (PE) protein bestaande uit nickase Cas9 (nCas9) en een reverse transcriptase (RT)
Prime editing guide RNA (pegRNA) die de target site specificeert voor de editor en ook een programmeerbaar RNA template bevat voor de gewenste DNA sequence verandering.
Bij prime editing wordt (i.t.t. bij base editing) gebruik gemaakt van de H840A nCas9 waardoor alleen de non-pairing strand geknipt wordt. Daardoor ontstaat een kort stukje 'accessible' single-stranded DNA (ssDNA) met een vrije 3' end.
De pegRNA bestaat uit een template voor de RT (10-80 nt) en een primer binding site (PBS; 7-15 nt). De PBS bindt na het nicken van de non-target strand aan de vrije ssDNA. De PBS is dus in principe gelijk aan de de DNA sequence op de pairing strand (maar dan in de RNA vorm).
Prime editing complex
Non-pairing strand wordt genickt, PBS bindt
RT kopieert de RNA template
Animatie sequencing
Samenvatting
DNA wordt opgeknipt in stukken van ca. 500 bp en de dubbele strands worden uit elkaar gehaald tot single strands.
Er wordt een overvloed aan A-primer en B-primer toegevoegd, die met ligase aan de uiteinden van het DNA worden geplakt. De ligase plakt niet de losse stukjes DNA aan elkaar, omdat hier de energie middels een fosfaatgroep voor ontbreekt. Deze fosfaatgroep hebben de primers wel.
Alle stukjes DNA van ca. 500 bp worden via de A-primer aan beads geplakt. Vervolgens worden alleen beads geselecteerd waar slechts één stukje DNA aan geplakt zit. Beads met meerdere stukjes DNA worden verwijderd.
De beads worden samen met een overvloed aan nucleotiden in emulsie gebracht door een vetoplossing toe te voegen. Vervolgens ontstaan rond elke beat een waterbelletje, waar precies één bead in past. Binnen zo'n belletje wordt vervolgens een PCR op gang gebracht, waardoor de stukjes DNA van ca. 500 bp worden gedupliceerd (binnen het belletje). De gedupliceerde stukjes DNA plakken automatisch weer vast aan de bead. Door dit proces een tijdje te herhalen ontstaan uiteindelijke beads met vele identieke stukjes DNA van ca. 500 bp.
De beads worden vervolgens over een glasplaat met een honingraatstructuur uitgestreken. In elke honingraat past precies één bead. Vervolens wordt er eerst een overvloed aan A-nucleotiden, vervogens, T-nucleotiden, vervolgens C-nucleotiden en vervolgens G-nucleotiden toegevoegd, telkens na het wegwassen van de vorige nucleotiden. Het toevoegen van deze nucleotiden aan het DNA zorgt voor het vrijkomen van energie wat wordt opgepikt door een sterke camera. Daardoor kom je uiteindelijk de exacte sequentie van het DNA op elke bead te weten. Met software kun je vervolgens uitvogelen wat de overlappende stukjes DNA zijn, zodat je uiteindelijk de volgorde van alle 46 chromosomen kunt bepalen.
Hardy-Weinberg equilibrium
Wet van Hardy-Weinberg: voor een SNP met allelen A en B veranderen de allelproportie (bv. A of B) en genotype proporties (bv. AA, AB, BB) niet over tijd. Er is geen Hardy-Weinberg equilibrium in de volgende gevallen: kleine steekproef, non-random geslachtelijke voortplanting, selectie, mutaties, migratie en genetic drifting. De formule is: p² + 2pq + q² = 1. Dus, de proportie homozygositeit in de populatie is hetzelfde als het kwadraat van de allelproportie (p² of q²) en de proportie heterozygositeit is hetzelfde als het product p x q. Vervolgens kun de drie genotypen AA, AB en BB aangegeven worden met een dosis 0, 1 en 2, waardoor regressie mogelijk is voor een bepaalde ziekte/trait. Als de wet van Hardy-Weinberg niet standhoudt, dan kunnen de drie genotypes proporties (AA, AB en BB = 2 vrijheidsgraden) niet weergegeven op basis van enkel p en q (= 1 vrijheidsgraad).
Het testen van de wet van Hardy-Weinberg wordt ook gedaan in GWAS studies: je test of de geobserveerde proportie heterozygoten significant anders is dan de verwachte proportie heterzygoten. De P-waarde wordt gecorrigeerd voor het aantal testen (Bonferroni correctie). Indien geen Hardy-Weinberg equilibrium, dan kan dat duiden op genotyping errors (meestal), batch effecten, populatiestratificatie of (zelden) een associatie. Overweeg deze SNPs te verwijderen uit analyse indien P<10^-6 in controles.
Genetic drift
Van generatie op generatie is de verwachte genotype frequentie altijd hetzelde als de eerste generatie, maar de geobserveerde variatie zal steeds minder worden. Een populatie beweegt altijd richting AA of BB door random variatie. Dit heet genetic drift. Dat betekent dat de verwachte allelfrequentie hetzelfde blijft (bijvoorbeeld 0.5 voor allel A van generatie op generatie), alleen de variantie wordt steeds groter (omdat een populatie ofwel richting AA of richting BB beweegt). De kans dat twee allen uit de populatie (dus twee verschillende personen) identiek zijn by descent kan geschat worden.
Assocation en linkage mapping
Quantitave trait loci (QTL) zijn genen die betrokken zijn bij complexe traits. Om te detecteren dat deze QTL een bepaalde trait veroorzaken kan gebruik gemaakt worden van asociation mapping.