Lecture 01: Analysis of sequence compositionAn introductory lecture to the analysis of sequence composition. Why nucleotides and oligonucleotides may be seen as "words" in the genomic text. Introduction to the notions of probability and probability distributions.
Περίληψη
Η συγκεκριμένη διάλεξη έχει ως αντικείμενο την ανάλυση της σύστασης βιολογικών αλληλουχιών. Στο επίκεντρό της βρίσκεται η σχέση της νουκλεοτιδικής σύστασης με την προέλευση και τη λειτουργικότητα γονιδιωματικών αλληλουχιών. Σε αυτό το πλαίσιο, το πραγματικό βιολογικό πρόβλημα που αναπτύσσεται, σχετίζεται με την ανάλυση του ποσοστού βάσεων γουανίνης/κυτοσίνης (GC content) με σκοπό τη διάκριση αλληλουχιών διαφορετικής προέλευσης σε ένα βακτηριακό γονιδίωμα, ως προϊόντα οριζόντιας μεταφοράς γονιδιωματικού υλικού. Στο πλαίσιο του προβλήματος αυτού παρουσιάζονται αναλυτικά οι βιολογικές έννοιες της γονιδιωματικής σύστασης και της οργάνωσης των γονιδιωμάτων των ανώτερων ευκαρυωτικών οργανισμών σε ισόχωρες περιοχές σταθερού ποσοστού GC. Στο δεύτερο μέρος του μαθήματος θα εξετάσουμε μια ενδιαφέρουσα ιδιότητα όλων των γνωστών γονιδιωμάτων που είναι γνωστή ως ο δεύτερος κανόνας ισοδυναμίας του Chargaff και θα παρουσιάσουμε γονιδιωματικά χαρακτηριστικά που σχετίζονται με αυτόν. Στο επίπεδο των μαθηματικών και υπολογιστικών εννοιών, εισάγονται οι έννοιες της πιθανότητας και των κατανομών. Η κύρια μεθοδολογία που παρουσιάζεται είναι ο έλεγχος απλών στατιστικών υποθέσεων με τη χρήση κανονικοποιημένων κατανομών, οι οποίες παρουσιάζονται μετά από μια εκτενή αναφορά στο Κεντρικό Οριακό Θεώρημα (ΚΟΘ).
Στο τέλος του μαθήματος θα πρέπει να μπορείτε να:
Διαβάστε το αντίστοιχο Κεφάλαιο
01. Ανάλυση της Σύστασης Βιολογικών Αλληλουχιών
Και κατεβάστε τις διαφάνειες της διάλεξη