Асуудал: Та саяхан өөрийн сонирхсон ген (your favorite gene, yfg)-ыг ялгаж, дарааллыг нь тогтоосон. Энэ ген дээрээ мутацтай дрожж фруктозод ургах чадваргүй байсан. Та уургийн дарааллыг өөрийнхөө хатуу дискэнд хадгалсан боловч агуулгыг тусгаагүй файлын нэр өгчихсөн байна. Та тэр өдөр зөвхөн 2 дараалал хадгалсан гэдгийгээ л мэдэж байгаа. Харамсалтай нь тэдгээрийн нэг нь энэ судалгаатай хамааралгүй дарааллын харьцуулалтыг үнэлэхийн тулд үүсгэсэн санамсаргүй дараалал байсан. Дээрх 2 дарааллын аль нь санамсаргүй, аль нь таны сонирхсон дараалал (yfg) болохыг тогтоохыг хүссэн гэж бодьё. Хоёр дараалал доор FASTA форматаар өгөгдсөн байна.
>sequence_1
MPDHDFIDFWIMCAETVEYRVLLGCGEWDAIQVNEHFAIPCSYRSFEGRYPMTTQQTYLTPHQIWLCQMFRCYFEPAHGACKTVART RYQRHVHCRYEKCALESPAVSWSIHMNSSLTLFNQQWSRVYMPSKMEDFDDLSGFWANMQHFKGQWHNDEGNLYFLMSEWWAS WTWEQWGFDIPNVEGHDVVPLLQNEISKRELPLCTEKAHVTHVLNPQPQMRMTDPETKHNPAYVQKRPGVDGCIHWTGAANRTPGD QWTWHGMEFFQCFQHHRYDCDEWDPGFRMWHRWNVRIREYESPEAGYYFYQCNIFECASAVIRYEEHAIASYLKDQDLSKLKQPYI MDTSYPARIEDDPFVFLEDTDDIFQKDFGVKTTLPERKLIRRLCEYSETEAARLAVCGIAAICQKRGYKTGHIAADGSVYNKYPGFKEAP QSHEVHRKIMEMPATTQPITIVPAEDGSGAGAAVIAALSEKRIAEGKSLGIIGA
>sequence_2
PHYRKRGKWQFTPDFPPINLAAHAIQCAPPAAENCIPRQCLKIEQQRLNDLRVGGVFTWFFACPETEEYKHHIINDALVWGEVFPYQVA DTKVRQHEEEKVLTLLLKWAGAQQYNKEPRIAKSSWTIPREWNPFMWHQIPQIKQTIKNNRMSLERYTRLDQIDNTQYYCIMGNANRY SRKPTCWWPGVMRKYCNGVHQCILKNPDVSSTQFGPMCCGKLWNHLNETYNATPRCKIETTLYDVSKPYPFIELKLPCHPEPFNMLM WHKHKGIMRHDKLAQRGGRSYLWLTTEIMRNLKCKIHVSWNANTYFRMWRFKEYIASVGGWDWRTFLCVNHIVICEANDMDSITANW GVDCFWCGYFLGQYSQDCAGTYATPNFTGSQFPPQEPEMPQQVAHSHWQCCAFMLRNMCEIGSHPYMWTWDTWEDSRQSQVGK FACVHLWFVQVLYIMEMKQQYEDNYAVAMERGWDMVWHKLDDMRIIGVPFYA
А. Програмыг ашилан хайлт хийх
http://www.genome.jp/tools/blast/ вэб хуудасруу орж “Protein BLAST (blastp)”-г сонго. Дараалал тус бүрээр nr (RefSeq) өгөгдлийн санд BLAST-ийн параметрыг өөрчлөлгүйгээр хайлт хийж дараалал тус бүрийн хувьд дараах асуултанд хариул.
1) E-утга, бит оноо, хамгийн их оноотой үр дүнгийн анхдагч (raw) оноо хэд байгааг тэмдэглэж ав.
2) BLAST-ийн үр дүнгийн хуудасны дээд талд байрлах “Search Summary” хэсгийг нээхэд завсрын зайтай (gapped), завсрын зайгүй (ungapped) харьцуулалт тус бүрийн хувьд l, K, H-ийн хоёр хэсэг утга байгаа. Бит оноо, анхдагч оноо зэргээс харвал l, K, H-ийн аль хэсэг утгуудыг хэрэглэсэн гэж бодож байгаагаа бич. Нөгөө хэсэг утгыг хэрэглэвэл өндөр оноотой үр дүнгийн хувьд ямар бит оноо байх вэ?
3) Авсан оноонуудаас хараад хоёр дарааллын аль нь yfg болохыг тогтоо. Яагаад гэдгээ тайлбарла.
4) Таны 3-р хэсэгт хийсэн таамаглал дрожжийн энэ ген байхгүй (yeast deficient in this gene) фенотипын талаарх мэдэж байгаатай тань холбоотой юу?
Б. Алгоритмын параметрүүд
Чи генийг зөв тодорхойлсон гэж үзээд, завсрын зайн торгуулыг 10 (Gap Open Penalty), завсрын зайн торгуулын өргөсөлтийг 1-ээр (Gap Extension Penalty) авч BLAST-ийг дахин ажиллуул. Энэ үр дүнд хэрхэн нөлөөлж байна вэ? Тайлбарла.