Αναζητώντας ομόλογες πρωτεΐνες με το Blast
Σημείωση: Χρησιμοποιείστε τον Firefox ως WebBrowser λόγω της μεγαλύτερης ευελιξίας του με πολλαπλά παράθυρα
Στη σημερινή άσκηση θα μελετήσουμε τις σχέσεις ομοιότητας και ομολογίας μιας ανθρώπινης πρωτεΐνης με “κωδικό όνομα 40806190"
- Σε πρώτη φάση θα πάρουμε την αλληλουχία της πρωτεΐνης από την ιστοσελίδα του NCBI:www.ncbi.nlm.nih.gov
- Στο πεδίο αναζήτησης της βάσης δεδομένων και αφού στο πεδίο "Search" έχουμε επιλέξει τη βάση δεδομένων "protein" τυπώνουμε το “όνομα” της πρωτεΐνης 40806190.
- Επιλέγουμε FASTA ως επιθυμητό FORMAT και ζητούμε να δούμε την πρωτεΐνη στην οθόνη με το 'display'
Σε ένα νέο παράθυρο (tab) πηγαίνετε στη σελίδα του Ensembl: www.ensembl.org και επιλέξτε το κουμπί Blast (στα αριστερά).
- Κάντε copy/ paste την αλληλουχία που πήρατε από το NCBI.
- Επιλέξτε 'peptide queries' για να δηλώσετε ότι θα αναζητήσετε πρωτεϊνικά μόρια
- Επιλέξτε 'Rattus_norvegicus' ως οργανισμό αναζήτησης.
- Επιλέξτε 'Protein database' και 'Ab-initio proteins' για να προσδιορίσετε πιο ειδικά τη βάση δεδομένων αναζήτησης
Ερώτηση. Δεδομένης της αλληλουχίας μας και της βάσης δεδομένων που προσδιορίσαμε ποιον τύπο του BLAST θα χρησιμοποιήσουμε;
- Κάντε κλικ στο 'Configure' και επιλέξτε παράμετρο '-E 0.1'.
Ερώτηση.Ποια είναι η έννοια των πιο κάτω παραμέτρων;
- -E : Μέγιστη τιμή Ε για τις αναφερόμενες στοιχίσεις
- -B : Μέγιστος αριθμός αλληλουχιών της βάσης για τις οποίες θα αναφερθεί επιτυχία
- -V : Μέγιστος αριθμός HSP (ζεύγη υψηλής αρχικής ομοιότητας)
- -W : Μήκος λέξης (default = 4)
- -T : Ελάχιστη τιμή ομοιότητας για να θεωρηθεί επιτυχής η αναζήτηση
Η στοίχιση που θα πραγματοποιήσουμε είναι τοπική. Καθώς οι πρωτεΐνες είναι γενικώς δομημένες σε λειτουργικές περιοχές (domains) είναι αναμενόμενο η ομοιότητα να περιορίζεται στις περιοχές εκείνες που συγκεντρώνουν την λειτουργική δράση της πρωτεΐνης. Τμήματα της πρωτεΐνης που δεν ανήκουν σε λειτουργικές περιοχές (συνδέτες, μη-δομημένα στοιχεία κλπ) είναι αναμενόμενο να μην εμφανίζουν σημαντική ομοιότητα.
Ερώτηση. Τι συμβαίνει αν αλλάξουμε την τιμή του W;
Αλλαγές στις τιμές των παραμέτρων επιτρέπουν ένα “παζάρι” μεταξύ ταχύτητας και ευαισθησίας. Για παράδειγμα, υψηλότερες τιμές Τ θα αυξήσουν την ταχύτητα όμως θα μας οδηγήσουν να χάσουμε τις αλληλουχίες με ασθενή ομοιότητα. Το ίδιο θα συμβεί με υψηλές τιμές του W.
- Για να εκτελέσετε, επιλέξτε RUN.
- Επιλέξτε το 'retrieve' για να αποκομίσετε τα αποτελέσματα. Επιλέξτε μια μορφή παρουσίασης των αποτελεσμάτων που θα περιέχει τα κωδικά ονόματα τόσο της αναζήτησης όσο και των στόχων, καθώς και τις συντεταγμένες τις στοίχισης.
- Σημειώστε τον αριθμό των επιτυχιών.
- Με το 'View' παρατηρείστε την κατανομή των επιτυχιών στα χρωμοσώματα.
Τώρα επικεντρωθείτε στην πρώτη επιτυχία:
- Επιλέξτε [A] για να δείτε τη στοίχιση. Τι είναι τα X;
- Επιλέξτε [S] για να δείτε το τμήμα της αλληλουχίας αναζήτησης που στοιχήθηκε.
- Επιλέξτε [C] για να δείτε τη θέση της αλληλουχίας αναζήτησης στο γονιδίωμα στόχο.
- Αποκομίστε πληροφορίες για την πρωτεΐνη – αποτέλεσμα (ProteinView).
Άσκηση 3
Επαναλάβετε την πιο πάνω ανάλυση χρησιμοποιώντας ως βάση δεδομένων την "Proteins". Παρατηρείστε διαφορές στις τιμές Ε-.
Επαναλάβετε με διαφορετικό πίνακα βαρών. Βρίσκετε τον ίδιο αριθμό επιτυχιών;
Αναζητήστε ομολογία χρησιμοποιώντας την ίδια πρωτεΐνη αλλά χρησιμοποιώντας τις αλληλουχίες cDNA ως στόχο.
- Πόσες επιτυχίες βρίσκετε τώρα; Είναι αυτό αναμενόμενο; Αναζητούμε την ίδια πρωτεΐνη στο ίδιο γονιδίωμα μόνο που την αναζητούμε σε επίπεδο DNA αντί αμινοξέων.
- Μπορείτε να σκεφτείτε κάποιον τρόπο για να αυξήσετε την ευαισθησία της αναζήτησης; (Βοήθεια. Τι είναι πιο συντηρημένο η πρωτεϊνική αλληλουχία σε αμινοξέα ή το γονίδιό της σε DNA;)