BIOINFORMATICA Filzi-Biotech
4. Bioinformatica
attività1
SCOPO: Partendo dalle sequenze nucleotidiche delle proteine del lab precedente , il n3, utilizzare gli strumenti informatici per risalire alla stuttura primaria secondaria e terziaria delle proteine
questo processo si chiama PRIMARY STRUCTURE ANALYSIS
Qui seguito sono descritti i passi che si trovano nel documento BioBits® Protein Structure and Function: Bioinformatics Extension il file di riferimento è questo https://drive.google.com/file/d/1-cM0Ewe1i-YN8bTRYtbiP5qyg9TTpjak/view?usp=drive_link (nella solita cartella "materiale wondergene")
1
LO STRUMENTO PRINCIPALE
2
Copia e incolla la sequenza nucleotidica scegliendo dal menu a tendina l'organismo opportuno, nel caso delle GFP bisogna selezionare "Standard"
3
La risposta
e' una cosa simile allo screen shot che trovi accanto
4
Ho scelto le sequenze con piu parti rosse. Ho copiato e incollato la sequenza aminoacidica delle due sequenze in un file di testo , usando questo accorgimento
Iniziare sempre con il triangoletto + il nome della sequenza (a piacere) + ENTER( a capo) + incollare la sequenza di aminoacidi + ENTER (a capo)
di seguito la seconda sequenza rispettando lo stesso linguaggio
Alla fine salvare il file con il nome che si vuole ma che finisce con .fasta
5
Vai a questo strumento (o equivalente) https://www.ebi.ac.uk/Tools/msa/clustalo/
Upload il file fasta da te appena creato
LEGGERE IL RISULTATO
* - significa che i due aminoacidi corrispondono perfettamente
. e : indicano che i due aminoacidi appartengono alla stessa famiglia di aminoacidi (: molto simili mentre . debolmente simili)
7
PREDIZIONE DELLA STRUTTURA TERZIARIA
Lo strumento https://swissmodel.expasy.org/interactive
attività2
SCOPO: COSTRUIRE ALBERI FILOGENETICI
1 vai su GENEBANK https://www.ncbi.nlm.nih.gov/genbank/
2 digita il nome del gene ad esempio "cytb sus scrofa " che è il gene del citocromo b del maiale
3 entro nel primo record e scarcio il file FASTA di questo gene A
4 digita il nome del gene ad esempio "cytb bos taurus "
5 scarico il file FASTA e questo è il gene B
6 digita il nome del gene ad esempio "cytb sus sapiens" che è il gene del citocromo b del uomo
7 scarico il file FASTA e questo è il gene C
8 unisco tutti i geni in un unico file FASTA
SE HO PIU OPZIONI SCELGO QUEI FILE CHE HANNO UN NUMERO DI bp IL PIU SIMILE TRA DI LORO
9 Vado su CLUSTAL OMEGA e carico il file. Ecco lo screen shot
Quello di sinistra è un cladogramma, quello di destra è un albero filogenetico.
E' importante osservare che l'albero ha una scala (il cladogramma NO) che si misura in sub/pos cioè sostituzioni per ogni posizione. La parte di albero che è comune sono sostituzioni che sono uguali tra i due rami, la parte di albro dei due rami separate sono posizioni che non corrispondono, mentre la parte di ramo che sborda indica posizioni che nn son state trovate tra i due set
Stessa attività ma con Phylot (è un sito di NCBI ma per scopi educativi)
Altra risorsa MABL http://phylogeny.lirmm.fr/phylo_cgi/index.cgi
Nella modalità "one click" mode fa un albero filogeneitco piu rigorso che porta anche la scala e anche la probabilità. Ecco il risultato