BIOINFORMATICA Filzi-Biotech

4. Bioinformatica

attività1

SCOPO: Partendo dalle sequenze nucleotidiche delle proteine del lab precedente , il n3, utilizzare gli strumenti informatici per risalire alla stuttura primaria secondaria e terziaria delle proteine

questo processo si chiama PRIMARY STRUCTURE ANALYSIS

Qui seguito sono descritti i passi che si trovano nel documento BioBits® Protein Structure and Function: Bioinformatics Extension il file di riferimento è questo https://drive.google.com/file/d/1-cM0Ewe1i-YN8bTRYtbiP5qyg9TTpjak/view?usp=drive_link (nella solita cartella "materiale wondergene")

1

LO STRUMENTO PRINCIPALE

2

Copia e incolla la sequenza nucleotidica scegliendo dal menu a tendina l'organismo opportuno, nel caso delle GFP bisogna selezionare "Standard"

3

La risposta

e' una cosa simile allo screen shot che trovi accanto

4

Ho scelto le sequenze con piu parti rosse. Ho copiato e incollato la sequenza aminoacidica delle due sequenze in un file di testo , usando questo accorgimento

Iniziare sempre con il triangoletto + il nome della sequenza (a piacere) + ENTER( a capo) + incollare la sequenza di aminoacidi + ENTER (a capo)

di seguito la seconda sequenza rispettando lo stesso linguaggio

Alla fine salvare il file con il nome che si vuole ma che finisce con .fasta

5

Vai a questo strumento (o equivalente) https://www.ebi.ac.uk/Tools/msa/clustalo/

Upload il file fasta da te appena creato

LEGGERE IL RISULTATO

* - significa che i due aminoacidi corrispondono perfettamente

. e : indicano che i due aminoacidi appartengono alla stessa famiglia di aminoacidi (: molto simili mentre . debolmente simili)

6

PREDIZIONE DELLA STRUTTURA SECONDARIA

Lo strumento https://www.compbio.dundee.ac.uk/jpred/

7

PREDIZIONE DELLA STRUTTURA TERZIARIA

Lo strumento https://swissmodel.expasy.org/interactive

attività2

SCOPO: COSTRUIRE ALBERI FILOGENETICI

1 vai su GENEBANK https://www.ncbi.nlm.nih.gov/genbank/

2 digita il nome del gene ad esempio "cytb sus scrofa " che è il gene del citocromo b del maiale

3 entro nel primo record e scarcio il file FASTA di questo gene A

4 digita il nome del gene ad esempio "cytb bos taurus "

5 scarico il file FASTA e questo è il gene B

6 digita il nome del gene ad esempio "cytb sus sapiens" che è il gene del citocromo b del uomo

7 scarico il file FASTA e questo è il gene C

8 unisco tutti i geni in un unico file FASTA

SE HO PIU OPZIONI SCELGO QUEI FILE CHE HANNO UN NUMERO DI bp IL PIU SIMILE TRA DI LORO

9 Vado su CLUSTAL OMEGA e carico il file. Ecco lo screen shot

Quello di sinistra è un cladogramma, quello di destra è un albero filogenetico.

E' importante osservare che l'albero ha una scala (il cladogramma NO) che si misura in sub/pos cioè sostituzioni per ogni posizione. La parte di albero che è comune sono sostituzioni che sono uguali tra i due rami, la parte di albro dei due rami separate sono posizioni che non corrispondono, mentre la parte di ramo che sborda indica posizioni che nn son state trovate tra i due set

Stessa attività ma con Phylot (è un sito di NCBI ma per scopi educativi)

Altra risorsa MABL http://phylogeny.lirmm.fr/phylo_cgi/index.cgi

Nella modalità "one click" mode fa un albero filogeneitco piu rigorso che porta anche la scala e anche la probabilità. Ecco il risultato