Il viaggio per comprendere l'informazione nascosta nel genoma inizia dai geni.
Un gene è l'unità fisica e funzionale minima dell'ereditabilità. I geni, composti di una sequenza di DNA, servono da istruzioni per la costruzione di molecole proteiche oppure codificano per molecole di RNA con propria funzione. Nell'uomo i geni variano in dimensioni da poche centinaia a più di 2 milioni di basi. Il Progetto Genoma Umano ha stimato che il numero di geni umani sia circa 20.000.
Ogni individuo possiede due copie di ogni gene, ciascuna ereditata da uno dei 2 genitori. La maggior parte della sequenza dei geni è identica fra due individui qualunque, solo una piccola frazione inferiore all'1 % differerisce. Gli alleli sono forme diverse dello stesso gene che differiscono per la loro sequenza di basi. Queste piccole differenze contribuisco alle caratteristiche uniche di ogni individuo.
La sequenza di un gene di interesse e della proteina codificata può essere ricavata rapidamente da Entrez Gene cercando il nome del gene di interesse e scorrendo alla sezione "NCBI Reference Sequences (RefSeq)". Per ogni gene possono essere presenti diverse sequenze che rappresentano le diverse isoforme.
Ogni gene è identificato da un nome esteso, un simbolo ufficiale e un codice univoco (es. Entrez gene ID o ENSEMBL id). Ogni gene può codificare per diversi trascritti (isoforme), ognuna identificata da un suo codice univoco.
Esercizio 1: Provate con uno di questi geni o con un altro di vostro interesse cercando il simbolo relativo:
Esercizio 2: Recuperare da Entrez Gene la sequenza del trascritto (NM_000492.3) e della proteina (NP_000483.3) di CFTR e salvarle in un file di testo. Dopo aver cliccato sul codice corrispondente nella sezione "NCBI Reference Sequences (RefSeq)" nella scheda del gene, vengono visualizzate informazioni dettagliate sulla sequenza. Utilizzando il link "FASTA" in alto viene visualizzata la solo sequenza, che può essere selezionata e incollata in un file di testo.
Una potente risorsa che consente di esplorare il genoma umano e di svariate specie animali sequenziate.
Dal menù "Genomes" (barra in alto) selezionare il genoma di interesse. Le diverse versioni del genoma umano corrispondono a successivi assemblaggi del DNA umano di riferimento. Attualmente la versione più recente è hg38.
La barra di navigazione
Immettere il simbolo o codice del gene per la ricerca. Consente di zoomare e spostarsi nel genoma. Provate ad esplorare la regione del vostro gene.
Il pannello principale
Visualliza le informazioni selezionate in forma di diverse tracce. La struttura del gene è rappresentata in alto. La rappresentazione del gene è composta da blocchi, gli esoni, e linee sottili, gli introni.
Diversi livelli di informazione possono essere condensati per una visione globale.
Selezione tracce
Consente di selezionare quali informazioni visualizzare nel pannello principale. Le diverse tracce disponibili sono divise in categorie. Ogni traccia può essere nascosta ("hide"), rappresentata in modo esteso ("full"), oppure in modo condensato ("pack" o "dense")
Nel corso degli il sequenziamento di migliaia di individui nei progetti di ricerca ha permesso di creare un catalogo delle variazioni genetiche presenti nell'uomo e della loro distribuzione nelle diverse popolazioni. Le varianti vengono depositate nel database dbSNP, associate ad un codice identificativo univoco (rs code). Altre risorse utili sono SNPedia, enciclopedia delle varianti genetiche umane, e ClinVar, catalogo delle variazioni genetiche associate a fenotipi umani.
A seconda della conseguenza sulla proteina codificata, le variazioni genetiche vengono indicate come: sinonime, missenso, non-senso, frameshift o splicing.
Esercizio 1: Per il gene CFTR, recupere le informazioni da dbSNP per la variante rs113993960. "Clinical significance" riporta indicazioni circa il significato clinico noto ad oggi per questa variante. "MAF/MinorAlleleCount" riporta la frequenza di questa variante nelle popolazione umana, come rilevata nei diversi progetti di sequenziamento. Provate a consultare SNPedia per una descrizione più discorsiva.
Esercizio 2: Cercare in ClinVar la medesima variante o l'intero gene CFTR. E' possibile recuperare informazioni sui fenotipi associati alla variante o ottenere l'elenco delle varianti del gene con indicazione del loro significato clinico.
ExAC browser raccoglie dati su ~65.000 sequenziamenti umani, permettendo di valutare la distribuzione delle variazioni nelle diverse popolazioni umane. "Allele frequency" indica la frequenza della variante nella popolazione globale. "Annotation" indica il tipo di variante. Cliccando sul nome della variante è possibile accedere ad informazioni dettagliate per le diverse popolazioni.
Esercizio 3: Cercare la variante rs113993960 in ExAC browser e recuperare informazioni sulla sua diffusione in diverse popolazioni umane. Cercare il gene CFTR ed esplorarne le varianti.