4. Analysis of sequence evolution

Φυλογενετική Ανάλυση σε γονίδια Ευκαρυωτικών

Εισαγωγή

Στην άσκηση αυτή θα ασχοληθούμε με κάποιες απλές αρχές της μοριακής εξέλιξης. Θα μελετήσουμε το βαθμό ομοιότητας αλληλουχιών μέσω πολλαπλών στοιχίσεων και θα δημιουργήσουμε φυλογενετικά δέντρα των εξελικτικών σχέσεων.

Μεθοδολογία

Για τους σκοπούς της σημερινής άσκησης θα χρησιμοποιήσουμε

α) Πρωτεϊνικές αλληλουχίες από διάφορους ευκαρυωτικούς

β)Ένα πρόγραμμα πολλαπλής στοίχισης (Τ-Coffee)

γ) Ένα πρόγραμμα δημιουργίας φυλογενετικών δέντρων (Clustal-W)

Υπολογιστικό Μέρος

1. Αποκομιδή Αλληλουχιών: Αρχικά θα αναλύσουμε το γονίδιο μιας πολύ σημαντικής πρωτεϊνης, της ιστόνης Η4. Από τη σελίδα Shared Files (δείτε menu στα αριστερά), κατεβάστε το αρχείο με τίτλο histone4.txt (https://sites.google.com/site/uocbio315/sharedfiles/histone4.txt). To αρχείο αυτό είναι ένα multifasta δηλαδή περιέχει πολλαπλές αλληλουχίες σε fasta format. Oι αλληλουχίες αυτές είναι οι πρωτεϊνικές αλληλουχίες της πρωτεϊνης Η4α για διάφορους ευκαρυωτικούς οργανισμούς. Παρατηρήστε λίγο το αρχείο για να δείτε ποιοι είναι αυτοί οι οργανισμοί.

2. Πολλαπλή Στοίχιση: Για να εξάγουμε τις φυλογενετικές σχέσεις θα πρέπει πρώτα να κάνουμε μια πολλαπλή στοίχιση. Αυτή θα γίνει με τη βοήθεια του T-coffee ενός προγράμματος πολλαπλής στοίχισης που βασίζεται στην αρχή της μέγιστης σταθερότητας (consistency). Για να τρέξετε το T-coffee αρκεί να πλοηγηθείτε στην ιστοσελίδα του στο site του ΕΒΙ : http://www.ebi.ac.uk/Tools/msa/tcoffee/ . Στη σελίδα αυτή θα επικολλήσετε το αρχείο που κατεβάσατε προηγουμένως. Χωρίς να αλλάξετε τις ρυθμίσεις επιλέξτε SUBMIT. Το αποτέλεσμα εμφανίζεται στην οθόνη μετά από μερικά δευτερόλεπτα. Για να αξιολογήσετε καλύτερα την πολλαπλή στοίχιση επιλέξτε Show Colors για να δείτε τα αποτελέσματα χρωματισμένα με βάση το βαθμό συντήρησης.

3. Δημιουργία Φυλογενετικού Δέντρου: Θα δημιουργήσουμε στη συνέχεια ένα φυλογενετικό δέντρο με μια απλή αποστολή των αποτελεσμάτων της πολλαπλής στοίχισης στο Clustal W, ένα πρόγραμμα που κάνει φυλογενετική ανάλυση με βάση πολλαπλές στοιχίσεις. Επιλέξτε Send to ClustalW2_Phylogeny. Από τις επιλογές αλλάξτε μόνο το tree format από default σε clustal. Σε ό,τι αφορά την μέθοδο Clustering Method επιλέξτε Neighbour-joining. Στη συνέχεια επιλέξτε SUBMIT. Το αποτέλεσμα θα προβληθεί στην οθόνη σε δύο μορφές, μια μη-γραφική με παρενθέσεις και αγκύλες που ονομάζεται newick format και μια γραφική που είναι το δέντρο που ζητούμε. Τι παρατηρείτε; Ποια είδη βρίσκονται κοντά σε ποια άλλα; Είναι τα αποτελέσματα αναμενόμενα;

4. Επιστρέψτε πίσω στο Clustal W και επαναλάβετε με την μέθοδο Clustering Method: UPGMA. Αλλάζει κάτι στο δέντρο; και τι;

5. Τέλος, επαναλάβετε όλη τη διαδικασία για μια άλλη πρωτεϊνη της οικογένειας των ιστονών, την Η1. Κατεβάστε την από εδώ:

https://sites.google.com/site/uocbio315/sharedfiles/histone1.txt. Τι συμπεράσματα βγάζετε συγκρίνοντας το δέντρο της Η4 και της Η1; Ποια πρωτεϊνη είναι πιο συντηρημένη από τις δύο;