Lecture 03: Finding and analyzing signals in biological sequences. The lecture will focus on the problem of motif detection and discovery in genomic/protein sequences. We will be discussing techniques such as positional weight matrices for motif discovery. There will be an introduction to randomized alogrithms such as Gibbs sampling. We will also discuss the notion of informational entropy in genomic sequences.
Περίληψη
Στα προηγούμενα μαθήματα συζητήσαμε προβλήματα που σχετίζονται με τη σύσταση και την πρωτοταγή οργάνωση βιολογικών αλληλουχιών. Αντιμετωπίσαμε τους συνδυασμούς καταλοίπων ως “λέξεις” σε βιολογικά κείμενα και εξετάσαμε τρόπους για την ανάλυσή τους και τη χρήση τους ως δεικτών προέλευσης και λειτουργικότητας σε γονιδιωματικό επίπεδο. Στο συγκεκριμένο μάθημα θα επικεντρωθούμε στη μελέτη ακριβώς αυτών των λέξεων, που στη βιολογία ονομάζουμε “μοτίβα αλληλουχίας” από πλευράς λειτουργίας. Σημείο εκκίνησης θα είναι η περιγραφή της λειτουργίας των σημείων πρόσδεσης μεταγραφικών παραγόντων, μικρών αλληλουχιών που κωδικοποιούν πολύ συγκεκριμένα μηνύματα σε γονιδιωματικές αλληλουχίες και ο ορισμός της έννοιας του “μοτίβου”. Στη συνέχεια θα διατυπωθούν μια σειρά από προβλήματα που σχετίζονται με αυτές τις αλληλουχίες και αφορούν την περιγραφή τους, τον εντοπισμό τους μέσα σε μεγαλύτερες αλληλουχίες, και την εκτίμηση της σημασίας τους. Στο πρώτο μέρος του κεφαλαίου συζητιούνται τρόποι περιγραφής των μοτίβων, όπως είναι οι συναινετικές αλληλουχίες και οι πίνακες βαρών και αναλύεται το “εύκολο” πρόβλημα του εντοπισμού ενός γνωστού μοτίβου σε μεγαλύτερες αλληλουχίες. Στη συνέχεια, και στο επίπεδο των μαθηματικών θα γίνει μια εισαγωγή στη Θεωρία Πληροφορίας και θα δούμε πώς έννοιες όπως η Εντροπία Shannon και το Πληροφοριακό Περιεχόμενο μπορούν να χρησιμοποιηθούν για να αξιολογήσουν τη σημασία ενός μοτίβου αλληλουχίας. Έχοντας καλύψει τα “εύκολα” προβλήματα θα περάσουμε στο “δύσκολο” πρόβλημα της de novo ανακάλυψης ενός άγνωστου μοτίβου και θα εξετάσουμε διαφορετικούς αλγορίθμους για την επίλυσή του, με έμφαση τυχαιοκρατικές προσεγγίσεις τύπου Monte Carlo όπως η δειγματοληψία Gibbs.
Στο τέλος του μαθήματος θα πρέπει να μπορείτε:
Διαβάστε το αντίστοιχο Κεφάλαιο
03. Μοτίβα Βιολογικών Αλληλουχιών
Και κατεβάστε τις διαφάνειες της διάλεξης