I geni meglio caratterizzati nel genoma sono quelli codificanti proteine. Ogni proteina è composta da una precisa sequenza di 20 possibili aminoacidi, che compongono una catena detta polipeptide. Questa catena viene ripiegata nello spazio ad assumere una precisa conformazione tridimensionale, essenziale perchè la proteina possa svolgere la sua funzione, sia essa una reazione biochimicao una funzione strutturale. In genere la parte di un gene che viene tradotta in proteina è detta "porzione codificante" o ORF. Nella quasi totalità dei geni la porzione ORF inizia con una triplett ATG e termina con uno dei codoni di stop.
La traduzione delle proteine a partire da una ORF avviene seguendo il codice genetico. A ogni tripletta composta da 3 nucleotidi corrisponde un preciso aminoacido, così che la sequenza nucleotidica dell'mRNA viene tradotta in una sequenza di aminoacidi che compongono la proteina.
Esercizio 1. Utilizzare ORFinder per identificare possibili ORF nella sequenza dell'mRNA del gene CFTR (vedi sezione WHO o WHEN per scaricarla). Copiare la sequenza nel box "Entry query sequence" e cliccare il pulsante "Submit" al fondo della pagina. I risultati mostrano le diverse ORF identificate, la più estesa viene selezionata di default e viene mostrata la corrispondente sequenza proteica tradotta nel box "ORF1".
Esercizio 2. Utilizzare Expasy translate tool per tradurre la sequenza della ORF del gene CFTR riporta sotto. Basandosi sul codice genetico il tool fornisce tutte le possibili traduzione della proteina. Infatti, visto che la traduzione avviene per triplette, per ogni sequenza nucleotidica esistono 3 possibili traduzioni, a seconda che si inizi la lettura dal primo, dal secondo o dal terzo nucleotide. Per avviare la traduzione è sufficiente copiare la sequenza nel box ed utilizzare il pulsante "TRANSLATE".
Le proteine possono esplicare molteplici funzioni all'interno della cellula. In generale, esse possono svolgere reazioni biochimiche (enzimi), avere un ruolo strutturale determinando la struttura della cellula stesso o avere funzioni regolatorie interagendo con altre proteine o con il DNA. La funzione di una proteina dipende non solo dalla sua sequenza, ma ancor più dalla conformazione tridimensionale che essa assume nello spazio. La stringa di aminoacidi infatti si ripiega secondo precisi vincoli fisici a formare una struttura 3D che porta i diversi aminoacidi nella corretta configurazione. Le strutture delle proteine vengono determinate sperimentalmente con tecniche spettroscopiche, analizzando al proteina cristallizzata. Le strutture così determinate vengono depositate presso il RCSB pdb database con un codice univoco.
Esercizio 3. Visualizzare la struttura pdb del gene CFTR dal pdb database (codice 5UAK). Per una visualizzazione 3D interattiva utilizzare il link "JSMol" sotto l'immagine della struttura. Con il pulsante sinistro è possibile ruotare la struttura, mentre la rotella modifica lo zoom. Le opzioni sulla destra nel box "Display options" consentono di modificare il tipo di visualizzazione. In basso sono presenti informazioni su eventuali molecole (ligandi) che interagiscono con la proteina presenti nella visualizzazione.
Utilizzare PyMol (oggi non disponibile). Scaricare la struttura pdb del gene CFTR dal pdb database (codice 5UAK). Utilizzare "Download files", selezionando "PDB Format". Aprire il programma PyMol (è possibile scaricare gratuitamente una versione educational usando il link educational) e caricare la struttura caricata per visualizzarla (File>Open). Premere tasto sinistro per ruotare la struttura, tasto destro per zoomare, tasto centrale per spostare. Nel pannello di destra cliccando la lettera "A" è possibile cambiare il tipo di visualizzazione selezionando "as" e quindi "lines", "sticks", "ribbon" o "cartoon". Provare la visualizzazione cartoon che permette di visualizzare intuitivamente le diverse conformazioni della struttura. Le immagini visualizzate possono essere salvate utilizzando File > Save image as...
Esempio di visualizzazione su PyMol
Lo studio e la predizione delle strutture proteiche diventa un gioco con FoldIT! Aiuta a scoprire la struttura di nuove proteine di interesse biomedico