4. Sequence similarity using BLAST

Αναζητώντας ομοιότητα αλληλουχιών σε πρωτεΐνες με το Blast

[Δείτε ένα ενημερωτικό βίντεο για την άσκηση εδώ]

Πρωτεϊνες στην UNIPROT

Στη σημερινή άσκηση θα μελετήσουμε τις σχέσεις ομοιότητας και ομολογίας μιας ανθρώπινης πρωτεΐνης, της TMEM189-UBE2V1.

Σε πρώτη φάση θα πάρουμε την αλληλουχία της πρωτεΐνης από την ιστοσελίδα της Uniprot: http://www.uniprot.org

Στο πεδίο αναζήτησης της βάσης δεδομένων τυπώνουμε τον κωδικό πρόσβασης της πρωτεΐνης I3L0A0 Θα μεταφερθούμε τελικά στη σελίδα της πρωτεϊνης στην Uniprot.

Η σελίδα αυτή περιέχει πολλές από τις πληροφορίες που θα μας ενδιέφερε να έχουμε για μια δεδομένη πρωτεϊνη οργανωμένες σε ενότητες. Μπορείτε να πλοηγηθείτε στη σελίδα και να δείτε μερικές από αυτές.

Αποκομιδή αλληλουχίας σε FASTA

Από το αριστερό μέρος της σελίδας μπορούμε να δούμε το είδος των πληροφοριών που περιέχονται στο αρχείο της βάσης δεδομένων για τη συγκεκριμένη πρωτεϊνη. Ένα από τα πεδία περιέχει την πρωτοταγή αλληλουχία της πρωτεϊνης αυτής (ή τις αλληλουχίες όλων των καταγραμμένων ισομορφών της). Το πεδίο αυτό ονομάζεται (εύλογα) sequences. Επιλέξτε το για να μεταβείτε στο πεδίο των αλληλουχιών. Η αλληλουχία που εμφανίζεται έχει μήκος 370 αμινοξέα και είναι η πλήρης πρωτεϊνη. Επιλέξτε το σύνδεσμο μέσα στο πλαίσιο με το όνομα FASTA ακριβώς πάνω από την αλληλουχία και θα μεταβείτε σε ένα αρχείο txt που περιέχει την αλληλουχία αυτή (σε μονογράμματο κώδικα) και σε format fasta.

BLAST

Αντιγράψτε ή αποθηκεύστε την αλληλουχία σε ένα αρχείο ώστε στη συνέχεια να αναζητήσουμε ομοιότητές της μέσω BLAST.

  • Θα τρέξουμε αρχικά το BLAST χωρίς καμία προεπιλογή έναντι του συνόλου της βάσης δεδομένων πρωτεϊνών.

1. Αρχικά θα μεταβούμε στη σελίδα του BLAST από το NCBI εδώ.

2. Στη συνέχεια επιλέγουμε την εκδοχή Protein BLAST που αναζητά πρωτεϊνες σε πρωτεϊνες.

3. Στην επόμενη σελίδα επικολλούμε την αλληλουχία στο πεδίο "Enter Query Sequence"

4. Aφήνουμε για την ώρα όλες τις παραμέτρους ώς έχουν με τις προεπιλεγμένες τιμές και εκτελούμε το BLAST πατώντας στο αντίστοιχο κουμπί στο τέλος αριστερά της σελίδας.

Δείτε τα αποτελέσματα και εξετάστε τα πρώτα από αυτά.

Δώστε ιδιαίτερη σημασία στη γραφική αναπαράσταση των αποτελεσμάτων μέσω του tab: Graphic Summary

Προσέξτε καταρχάς τον σχολιασμό της πρωτεϊνικής αλληλουχίας μέσω των λειτουργικών υπομονάδων που δίνει το BLAST ακριβώς κάτω από την αλληλουχία. Τι το παράξενο έχουν; Πώς αποτυπώνεται αυτό στα αποτελέσματα της αναζήτησης; Πώς δηλαδή οι υπομονάδες σχετίζονται με τα αποτελέσματά σας;

Σε ποιες πρωτεϊνές αντιστοιχούν; Για τι ποσοστό του μήκους της πρωτεϊνης έχουν ταύτιση και πόσο σημαντική είναι αυτή; Κάντε αριστερό κλικ πάνω στα αποτελέσματα για να δείτε τις στοιχίσεις.

BLAST σε συγκεκριμένους οργανισμούς

Στο επόμενο στάδιο θα δούμε πως περιορίζουμε την αναζήτηση στο πρωτέωμα συγκεκριμένων οργανισμών. Στην κορυφή της σελίδας που είστε (Αριστερά πάνω) επιλέγετε Edit and Resubmit.

1. Στο πεδίο Organism του τμήματος Choose Search Set προσθέστε το συστηματικό όνομα του αρουραίου: "Rattus norvegicus" (taxid: 10116)

2. Διατηρώντας το Expect threshold=10 εκτελέστε εκ νέου.

Τι προκύπτει για τη στοίχιση; Τι αλλάζει σε σχέση με πριν;

Επαναλάβετε την ίδια ακριβώς εκτέλεση αυτή τη φορά στο πρωτέωμα του κοινού ποντικιού βάζοντας στο Organism: "Μus musculus" (taxid:10090) και δείτε συγκρίνετε τα αποτελέσματά σας με αυτά του αρουραίου έχοντας υπ' όψιν ότι πρόκειται (προφανώς) για δύο πολύ συγγενικούς οργανισμούς.

Άσκηση

Aφού έχετε εκτελέσει το BLAST με τις παραπάνω εντολές να σχολιάσετε τα αποτελέσματά σας σε μια γραπτή αναφορά. Συγκεκριμένα:

1. Για καθεμία από τις τρεις αναζητήσεις που κάνατε να επιστρέψετε το αποτέλεσμα του BLAST και να συζητήσετε τα ονόματα, τα scores και κυρίως έκταση στοίχισης των καλύτερα στοιχημένων αλληλουχιών (σημ: αυτών δηλαδή που βρίσκονται πάνω-πάνω στη λίστα)

2. Με βάση τη σύγκριση των στοιχίσεων για όλα τα είδη και τα δύο τρωκτικά ξεχωριστά, να σχολιάσετε τη λειτουργία της αρχικής ανθρώπινης πρωτεΐνης και να εντοπίσετε ένα ιδιαίτερο χαρακτηριστικό που έχει. Τι συμπεράσματα προκύπτουν σε σχέση με την ύπαρξή της στον άνρθωπο και στους άλλους δύο οργανισμούς.

Σημ: Για περισσότερες πληροφορίες σχετικά με την αρχική πρωτεϊνη που ελέγξαμε (την TMEM189-UBE2V1) μπορείτε να διαβάσετε τη σελίδα της στη Uniprot αλλά και κάποια επιπλέον στοιχεία εδώ.

H αναφορά σας δε θα πρέπει να ξεπερνάει τις τρεις σελίδες. Ζητούμε ένα αρχείο κειμένου στο οποίο θα περιγράφονται τα βήματα της διαδικασίας που ακολουθήσατε και τα αποτελέσματα στις παραπάνω ερωτήσεις σαφώς διατυπωμένα. Πίνακες/διαγράμματα που συνοδεύουν τις αναλύσεις σας θα πρέπει να βρίσκονται μέσα στην αναφορά και όχι σε ξεχωριστά αρχεία. Ονομάστε το αρχείο χρησιμοποιώντας το ονοματεπώνυμο και τον ΑΜ σας.

Ανεβάστε την αναφορά σας στο παρακάτω link:

https://www.dropbox.com/request/uEsNqGp35TMqc53EnUpH

μέχρι την Κυριακή 26/4/2020 στις 23.59