Lecture 02: Analysing biological sequences. Markov Models.Using the observation of co-occurrences in genomic sequences as a starting point we will be discussing the basic properties of Markovian Processes and Markov Models. There will be a short introduction into Hidden Markov Models, their training and implementation.
Περίληψη
Στο προηγούμενο μάθημα εξετάσαμε τις ιδιότητες βιολογικών αλληλουχιών εστιάζοντας στη σύστασή τους και αντιμετωπίζοντάς τις σαν σύνολα συμβόλων. Ωστόσο μια από τις βασικές ιδιότητες όλων των βιολογικών αλληλουχιών είναι η οργάνωσή τους σε ό,τι αφορά τη διαδοχή των δομικών τους στοιχείων, αυτό που ονομάζουμε πρωτοταγή διάταξη. Στη διάλεξη αυτή περνάμε σε προβλήματα που σχετίζονται με τη διαδοχή των καταλοίπων σε βιολογικές αλληλουχίες και τρόπους για την ανάλυσή της. Το βασικό βιολογικό ερώτημα γύρω από το οποίο διαρθρώνεται το μάθημα είναι η διάκριση αλληλουχιών με βάση τη λειτουργικότητά τους. Σε βιολογικό επίπεδο, εξετάζονται έννοιες όπως οι συνεμφανίσεις καταλοίπων σε βιολογικές αλληλουχίες (γιατί κάποια νουκλεοτίδια ή αμινοξέα τείνουν να εμφανίζονται σε άμεση διαδοχή και άλλα όχι) καθώς και γενικότερες χαρακτηριστικές ιδιότητες πρωτοταγούς οργάνωσης αλληλουχιών. Η βασική μαθηματική έννοια που συνδέεται με τη διαδοχή καταλοίπων και τη μελέτη των συνεμφανίσεών τους είναι αυτή της δεσμευμένης πιθανότητας η οποία παρουσιάζεται στη συνέχεια. στο πλαίσιο της περιγραφής σύνθετων δεσμευμένων πιθανοτήτων, γίνεται αναφορά στον κανόνα του Bayes και στη σημασία του. Στο δεύτερο μέρος εισάγουμε τα Μοντέλα Markov ως ένα από τα βασικά υπολογιστικά εργαλεία για την αναλύση της πρωτοταγούς δομής αλληλουχιών και παρουσιάζουμε αναλυτικά τους σχετικούς αλγορίθμους για τη μοντελοποίηση βιολογικών αλληλουχιών ως πιθανοκρατικών διαδικασιών Markov.
Στο τέλος του μαθήματος θα πρέπει να μπορείτε:
Διαβάστε το αντίστοιχο Κεφάλαιο
02. Πρωτοταγής Οργάνωση Βιολογικών Αλληλουχιών
Και κατεβάστε τις διαφάνεις της διάλεξης