Олон дарааллын харьцуулалт ба удам төрлийн (филогенетикийн) мод
MEGA програмыг филогенетикийн мод байгуулах
Товчлол
Эволюцийн мод байгуулах нь оюутнуудад генийн дарааллууд хэрхэн ялгардаг эсвэл организмууд хоорондоо хэрхэн холбоотой болохыг ойлгоход тусалдаг. Molecular Evolutionary Genetics Analysis (MEGA) нь филогенетик модыг байгуулах хэрэглэхэд хялбар, үнэгүй багц програм юм. MEGA -ийн молекул өгөгдлөөс мод байгуулахдаа сонгох хэд хэдэн сонголт байдаг боловч хамгийн түгээмэл хэрэглэгддэг нь хөршүүдийг нийлүүлэх (neighbor joining), хамгийн их магадлалт арга (maximum likelihood). Энэ дасгалаар GenBank -аас хэрхэн өгөгдөл цуглуулах, өгөгдлийг текст editor программд ачааллах, өгөгдлийг MEGA программд импортлох, тухайн өгөгдлүүдийн филогенетик модыг байгуулах зэрэг чадваруудыг эзэмшинэ.
Оршил
Филогенетик бол организмуудын ялгаатай бүлгүүдийн хоорондын эволюцийн хамаарлыг судалдаг шинжлэх ухаан юм (Nei & Kumar, 2000). Эдгээр бүлгүүд жижиг масштабтай (жишээлбэл, хөхтөн амьтад) эсвэл том масштабтай (жишээлбэл, амьдралын ялгаатай домэйнууд) байж болно. Филогенетикийн шинжилгээний үр дүнг ихэвчлэн хувьслын мод хэлбэрээр харуулдаг бөгөөд ялгаатай мөчрүүд нь ялгаатай генийн дараалал эсвэл өөр төрөл зүйлийг илэрхийлдэг. Модны салаалсан байдал нь дараалал эсвэл төрөл зүйлүүд хоорондоо хэрхэн холбоотой болохыг харуулдаг.
https://www.ncbi.nlm.nih.gov/genome/gdv/ холбоосоор нэвтэрч геномын өгөгдөл харах хуудсыг ачаалла. Организмын удам төрлийг харуулах интерактив мод байгаа (Зураг 1).
Уг модны хамгийн доод хэсэгт ургамалын салаа мөрчир байгаа. Үүнд эрдэнэшиш (maize), будаа, арабидобсис, усан үзэм болон шар буурцгийн шош зэрэг харагдаж байгаа. Эдгээрийн ерөнхий өвгийн холбоос цэг дээрх + тэмдэг дээр дарж илүү олон төрөл зүйлүүдийг мэдэх боломжтой.
Уг модны хамгийн доод хэсэгт ургамалын салаа мөрчир байгаа. Үүнд эрдэнэшиш (maize), будаа, арабидобсис, усан үзэм болон шар буурцгийн шош зэрэг харагдаж байгаа. Эдгээрийн ерөнхий өвгийн холбоос цэг дээрх + тэмдэг дээр дарж илүү олон төрөл зүйлүүдийг мэдэх боломжтой.
Оюутнуудад энэ ажлаар MEGA програмыг (http://www.megasoftware.net) ашиглан эволюцийн модыг хэрхэн байгуулахыг үзүүлж, генийн дарааллыг ашиглан төрөл зүйлийн хоорондын хувьслын холбоо хамаарлыг тодорхойлох хөрш нийлүүлэх (NJ) ба хамгийн их магадлалт арга (ML) өргөн хэрэглэгддэг хоёр аргыг суралцах юм. Генийн дарааллыг татаж авч болох олон тооны онлайн эх сурвалжууд буюу өгөгдлийн сангууд байдаг ба жишээлбэл, Биотехнологийн Мэдээллийн Үндэсний Төвийн [NCBI] GenBank. ДНХ ба уургийн дарааллыг аль алийг нь татаж авах боломжтой бөгөөд эдгээрийг хэрхэн ашиглах талаар хэд хэдэн мэдээлэл өгөх хичээлүүдийг NCBI вэбсайтаас олж үзэж болно. Амьтан, ургамал, протист, бактери, вирусын олон мянган генийн дараалсан өгөгдлийг GenBank-аар дамжуулан авах боломжтой.
Зорилго
Бид ургамлын хоорондын эволюцийн судлахад rbcl генийн дарааллыг өргөн хэрэглэдэг (Newmaster et al. 2006). Олон төрлийн ургамлын rbcl генийн дарааллыг GenBank -аас татаж авах боломжтой. Дараа нь rbcL генийн дарааллын өгөгдлийг MEGA -д импортолж, харьцуулж (alignment), филогенетик модыг байгуулна.
Дасгалын зорилго
Энэ ажлын төгсгөлд оюутнууд сурах зүйлс
GenBank (http://www.ncbi.nlm.nih.gov/genbank/) -аас молекулын өгөгдлийг хэрхэн олж авах талаар сурна.
MEGA (http://www.megasoftware.net/mega.php) үнэгүй програмыг ашиглаж филогенетикийн мод барьж сурна.
Өвөг эсвэл үе удмын утга учрыг ойлгох, моно-филитик групп буюу clade-ийг ойлгох, төрөл зүйлийн хоорондын эволюцийн хамаарлыг тайлбарлах чадвартай болно.
Дасгалыг хийх явцдаа оюутнууд дараах асуултуудыг анхаарах нь зүйтэй.
1. Яагаад rbcL генийг ашигласан бэ?
2. RbcL ген нь ямар органеллээс гаралтай вэ?
3. RbcL генээр кодлогддог уураг ямар үүрэг гүйцэтгэдэг вэ?
Дасгал
Google хайлтаар GenBank -ийг олж, GenBank Home -ийн үр дүнгийн хуудсанд шилж (http://www.ncbi.nlm.nih.gov/genbank/).
GenBank гэдэг үгийн хажууд байгаа урсдаг менюг ашиглан үндсэн хайлт болох Nucleotide-ийг Gene болгож.
Хайлтыг RuBisCO large subunit гэсэн түлхүүр үгийг ашиглан хайлт хийнэ. Энд эхний жишээнд Nicotiana tabacum rbcL холбоосыг сонгоно уу
Баруун дээд талд байгаа Table of Contents хэсгийн Genomic regions, transcripts, and products дээр дарна уу (Зураг 2)
FASTA дээр дарснаар Nicotiana tabacum -ын rbcL генийн дарааллыг Зураг 3-т харуулсан байдлаар харуулж болно.
Send to урсдаг цэс дээр дарж, File-ыг сонгож дарааллыг FASTA форматаар татаж ав. Цаашид татаж авсан файлуудыг нэг фолдерт цуглуулах нь тохиромжтой.
Текст файлаар нээж > тэмдгийн араас бичигдсэн хэсэг буюу дарааллын нэрийг нийтлэг нэр болох Tobacco болгож, файлыг нэрийг мөн tobacco.fasta болгон хадгал.
Одоо бидэнд нэг зүйлийн генийн дараалал байгаа. Бид MEGA -д харьцуулахын тулд бусад есөн зүйлийн дарааллыг цуглуулах хэрэгтэй (Хүснэгт 1). Цаашлаад тусдаа групп болгон ашиглах Euglena viridis -ийн дарааллыг татаж ав. Хайлтын талбарт GenBank Gene ID -ийг бичиж доор жагсаасан төрөл тус бүрээр процедурыг давтана. Хүснэгт 1 -д санал болгосноор дараалал бүрийг тусдаа файлд хадгална.
Rbcl генийг ашиглан филогенетик модыг үүсгэж болох ургамлын жагсаалт, тэдгээрийн GenBank ID дугаар (нэвтрэх дугаар) болон санал болгосон файлын нэрс.
Салангид бүлэг (outgroup) үүсгэх
Euglena viridis -ийг манай филогенетик модны хэсэг болгон ашиглах болно. Бид GenBank -ийг ашиглан E. viridis -ийн дарааллыг олох болно.
GenBank Home -ээс эхлэн бид хайлтын талбарын зүүн талд байрлах Nucleotide хайлтаар олно.
Хайлтын талбарт U21010.1 гэж бичиж Search товчийг дарна уу.
FASTA дээр дарна уу.
Дарааллыг хуулж шинэ Notepad файлд буулгана эсвэл “send to” зэсийг ашиглан татаж ав.
Файлын euglenaviridis.fasta хэлбэрээр мөн генийн дарааллын нэрийг засаж хадгална уу.
Удам төрлийн мод барих
Эдгээр молекул өгөгдлөөр хувьслын модыг байгуулах эхний алхам бол MEGA програмыг татаж авч компьютерууд дээр суулгана. MEGA 11 хувилбарыг татаж ав.
MEGA ашиглах заавар
MEGA -ийг нээнэ үү.
Align дээр дараад Edit/Build Alignment -ийг сонгоно уу.
Create a new alignment сонголтыг дарж шаардлагатай хоёрдогч цэс гарч ирнэ. Create a new alignment сонгож OK дарна.
Хоёрдахь дэд цэс гарч ирэх ба харьцуулалт хийх дарааллуудыг файлуудыг сонгоно. Ямар дараалал агуулж байгаа тухай сонголтын ДНХ сонголтыг сонгож ОК дарна. Энэ нь MEGА Alignment Explorer -ийн шинэ цонхонд нээнэ.
MEGA Alignment Explorer цонхны дээд хэсэгт Edit цэсийг дарж сонгоно уу. Энэ цэснээс Файлаас дараалал оруулах сонголтыг сонгоно уу. Энэ нь шинэ цонх нээх болно.
Нээлттэй харилцах цонхны цонхонд хадгалагдсан .fasta өгөгдлийн файлыг агуулсан директор руу очно уу. Зөв хавтсанд орсны дараа, хэрэв ямар ч файл гарч ирэхгүй бол Файлын нэр хайрцгийн хажууд байрлах Файлын төрөл доош дарна уу. Дэмжигдсэн дараалсан файлуудын сонголтыг сонгоно уу. Мэдээллийн файлууд одоо харагдах ёстой.
.Fasta файлуудыг сонгоод Open дээр дарна уу. Харьцуулалт хийх бүх дарааллууд буюу файлуудаа сонгосны дараа Open товчийг дарна уу. Дарааллыг MEGA -д ачаалсны дараа бид тэдгээрийг харьцуулна. Үүнийг Alignment Explorer цонхны дээд хэсэгт байрлах Alignment цэс рүү орох замаар хийдэг. Унтраах цэсийг нээхийн тулд дарж Align by ClustalW дээр дарж сонгоно уу.
Энэ нь ClustalW параметрүүдээр дүүрсэн өөр цонхыг нээх болно. Бидний зорилгын хувьд анхдагч тохиргоо хангалттай байна. Үргэлжлүүлэхийн тулд энэ цэсний доод хэсэгт байгаа OK сонголтыг сонгоно уу. Энэ нь тэгшлэх алгоритмыг хөдөлгөөнд оруулах болно. Шалгаж буй дарааллын хэмжээ, тооноос хамааран дарааллыг тэгшлэх нь хэдэн минут болно. ClustalW Parameters харилцах цонх: Бүх тохиргоог анхдагчаар нь үлдээнэ үү.
Дарааллыг уялдуулсны дараа бид дарааллынхаа төгсгөлийг хайчилж, маш сайн өгөгдөл агуулаагүй байхаар таслах шаардлагатай болж магадгүй юм. Үүнийг хийхийн тулд Alignment Explorer цонхны эхний дарааллын дээрх мөрөөс од (*) хайх хэрэгтэй. Дарааллын эхэн үеийн эхний одны хувьд Click and Drag товчлуурыг ашиглан нуклеотидыг устгах дарааллын эхлэл хүртэл сонгоно уу (Зураг 2).
Дарааллын сүүлний төгсгөлд энэ процессыг давтах шаардлагатай болно. Эндээс сүүлчийн оддыг төгсгөлөөс нь олж, дараа нь дарж чирж дарааллын төгсгөл хүртэлх нуклеотидыг тодруулна уу.
Одоо дарааллыг тэгшлээд тайрч байна.
Одоо бид өгөгдлийг MEGA филогенетик модыг бүтээх форматаар хадгалахын тулд Alignment Sess -ийг хадгалах хэрэгтэй. Alignment Explorer цонхны баруун дээд буланд байрлах Data цэсийг сонгоод Alignment Session -ийг хадгална уу. Сессийг хадгалах сонголтыг дарна уу. Үүнийг дуусгаад сессийг хадгалсны дараа Alignment Explorer цонхыг хаа.
Одоо бид ерөнхий MEGA цонхны File цэсийг сонгоод File/Session нээх сонголтыг дарж хадгалсан тохируулгын сессийг нээх хэрэгтэй.
Файлыг нээх цонхноос хадгалсан тохируулгын файлыг (энэ нь .MAS файл болно) сонгоод, дээр нь дарж Нээхийг сонгоно уу.
Энэ нь танд дүн шинжилгээ хийх эсвэл зэрэгцүүлэхийн тулд .MAS -ийг нээх сонголттой болох хоёр дахь цонх гарч ирэх болно. Үүнийг дарж дүн шинжилгээ хийх командыг сонгоно уу. OK дарна уу.
Филогенетик модыг бүтээхийн тулд MEGA цонхны дээд талд байрлах цэсийн хоёр дахь талбайн дундуур филогений цэсийг сонгоно уу. Энд бид жишээг хөрш зэргэлдээ модоор үргэлжлүүлэх болно, гэхдээ бусад төрлийн филогенетик модны хувьд процесс ижил байна. Барилгын/хөрш зэргэлдээ модыг сонгоно уу.
Та одоогоор идэвхтэй байгаа мэдээллийн хуудсыг ашиглахыг хүсч байгаа эсэхийг асуух цэс гарч ирэх болно; Тийм гэж сонгоно уу. Энэ нь Analysis Preferences нэртэй харилцах цонхыг нээх болно. Статистикийн аргын хувьд хөршүүдтэйгээ нэгдэх, филогенезийг шалгахын тулд Bootstrap аргыг сонгоно уу. Модны найдвартай байдлын тогтвортой үнэлгээг авахын тулд Bootstrap Replications -ийн дугаар гэсэн 1000 хэсэгт сонгоно уу. Орлуулах хэлбэрийн хувьд эхлээд нуклеотидыг сонгоод Jukes-Cantor загварыг сонгоно уу. Бусад бүх талбарууд үндсэн утгаараа үлдсэн байна. Модыг үүсгэхийн тулд тооцоолох дээр дарна уу.
Хэдэн минутын дараа мод үүснэ. Үүнд шаардагдах хугацаа нь модыг бүтээхэд ашиглаж буй дарааллын урт, тооноос хамаарна.
Модны мөчир дээрх тоонууд нь bootstrap -ийн утгыг илэрхийлдэг бөгөөд энэ нь bootstrap шинжилгээгээр салбар бүрийн хүлээн авдаг статистик дэмжлэг юм. Илүү их тоо байгаа нь тухайн салбар илүү өндөр дэмжлэг авч, жинхэнэ салбар болох магадлал өндөр гэсэн үг юм.
Модыг хялбарчлахын тулд бид дэмжлэг багатай, жинхэнэ мөчир байх магадлал багатай мөчрүүдийг нягтруулах буюу огтлохыг хүсч байна. Үүнийг хийхийн тулд TreeExplorer цэсэн дэх Compute цэс рүү ороод Condense Tree -ийг сонгоно уу.
Энэ нь модны сонголт гэсэн шинэ цэсийг нээнэ. Cutoff дэд цэсийг сонгоод өтгөрүүлсэн модны захын утгыг 50 гэж оруулаад OK дарна уу. Бусад бүх утгыг анхдагчаар нь орхи.
Одоо TreeExplorer дээрх мод өөрчлөлтийг тусгах болно. 50% -иас бага дэмжлэгтэй бүх салбарыг хасах болно.
Бидний хийх ёстой хамгийн сүүлийн зүйл бол үнсээ тохируулах буюу салангид бүлгээ тохируулах явдал. Энд байгаа бидний жишээнд энэ бол E. viridis юм. Үүнийг хийхийн тулд E. viridis байгаа салбар дээр хулганы баруун товчийг дарна уу. Энэ нь дэд цэсийг бий болгодог. Энэ дэд цэсэнд Root буюу эх байрлуулах сонголтыг сонгоно уу. Энэ нь бидэнд үндэстэй филогенетик модыг өгдөг.
Дүгнэлт хийх
Уг ген ямар үүрэгтэй вэ?
Энэ генийг яагаад энэ дасгалд ашигласан вэ?
Энэ дасгалыг гүйцэтгэснээр юу ойлгож авах боломжтой эсвэл юу ойлгож авсан бэ?