Пример 5
Тема: Симметрия нуклеотидных последовательностей, связанная со вторым правилом Чаргаффа, и её нарушения.
Темлякова Евгения Андреевна, 5 курс, группа ФФ06-24С.
1. Ключевые слова & Key words1) Правило Чаргаффа – Chargaff’s rule* (Chargaff second rule, Chargaff’s second parity rule)
2) ДНК – DNA
3) Геном – Genome
4) Симметрия – Symmetry
5) Нуклеотидный состав – Base/ nucleotide composition/distribution
6) Олигонуклеотидный состав - oligonucleotide composition
7) Биоинформатика – Bioinformatics
8) Частота - Frequency
9) Частотный словарь – Frequency dictionary
*Примечание: при поиске по ключевым словам достаточно ввести «Chargaff’s rule», он выдает статьи, касающиеся второго правила Чаргаффа. Причина, по-видимому, в том, что работ связанных с первым правилом очень мало (скорее с ним всё ясно).
2. Поиск по ключевым словам
Затем произведите поиск по ключевым словам в следующих основных базах данных:
i. http://elibrary.ru/querybox.asp?scope=newquery
ii. http://scholar.google.com/advanced_scholar_search
iii. http://pubs.acs.org/
iv. http://www.sciencedirect.com/
Если используете другие базы, то укажите их URL адрес.
viii. http://www.biomedcentral.com
ix. http://www.plosbiology.org
3. Список важных журналов [8-11]:
a. Составьте перечень российских и иностранных ЖУРНАЛОВ, в которых публикуются статьи с Вашими ключевыми словами, и которые Вам следовало бы РЕГУЛЯРНО просматривать при Вашей научной работе.
1) Bioinformatics – журнал издательства Оксфордского университета, является лидирующим в области биоинформатики. Импакт фактор за 2009 г. составил 4.926. Основной фокус журнала – новые разработки в геномной биоинформа-тике и вычислительной биологии.
2) Gene – реферируемый научный журнал о генетике издательства “Elsevier”. Основной фокус – клонирование генов, исследования функции и структуры генов. Он полезен для того, чтобы быть в курсе последних исследований в области молекулярной генетики. Также в нем встречается немало статей по биоинформатике. Последние данные по импакт фактору – 2,416.
3) BMC Genomics и BMC Bioinformatics - журналы издательства BioMed Central, находятся в открытом доступе и содержат реферируемые исследовательские работы по самому широкому спектру тем в области геномики и биоинформатики. Импакт факторы: 3,76 и 3,43, соответственно.
4) Genomics - реферируемый научный журнал издательства “Elsevier”, содержит публикации, описывающиеся разработки техник в масштабах генома и их приложение к другим областям биологических исследований. Вошел в список 100 самых влиятельных журналов биологии и медицины за последние 100 лет составленный организацией «Special Libraries Association» (SLA, США) на основе опроса специалистов в 2009 году. Импакт фактор – 3,327. Среди основных тем издания – исследования в области вычислительной биологии, биоинформатики и биостатистики, эволюция генетических последовательностей.
4. Список ключевых статей [1-7]
a. Выберите среди найденных статей с Вашими ключевыми словами по 2-3 важных статьи.
5. Постарайтесь кратко ответить на вопросы (письменно!):
5a.Состояние исследований в моей области
В 1952 г. Эрвин Чаргафф сформулировал правило касающееся комплементарности азотистых оснований в молекуле ДНК (А=Т, Г=Ц). Все, кто так или иначе знаком с историей открытия структуры молекулы ДНК, знает какое огромное значение сыграло это эмпирическое соотношение в построении модели двойной спирали. Однако мало кто знает, что несколькими годами позднее (1968 г.) в лаборатории Чаргаффа тем же методом бумажной хроматографии был подсчитан нуклеотидный состав уже для единственной цепочки ДНК и Внимание! было получено все тоже соотношение! Только вот точность не была такой высокой как при анализе двойной спирали, однако в процентном соотношении, различие было совсем небольшим. Таким образом, было сформулировано второе правило Чаргаффа: для одного стрэнда А≈Т, Г≈Ц.
И если причины выполнения первого правила были объективно ясны, то природа второго остается загадкой и по сей день. С появлением баз генетических данных было установлено, что правило универсально для всех геномов, и претерпевает сильное нарушение лишь у непарных цепочек ДНК клеточных органелл [1-3, 5]. Более того, правило было расширено – оказалось, что помимо количества комплементарных мононуклеотидов (А и Т, Г и Ц), совпадают и количества комплементарных олигонуклеотидов (пример комплементарных олигонуклеотидов →АТЦ - САТ), что значит, что в двух цепочках встречается приблизительно равное число одинаковых «слов». Притом, совпадение «слов» при подсчете наблюдается как для целых хромосом, так и для любых ее участков (и кодирующих, и некодирующих). Будем называть это симметрией.
В чем же её причины? Пока нет единого объяснения этого феномена. Наиболее достоверно выглядят работы, в которых соблюдение второго правила Чаргаффа связывают с необходимостью спирали ДНК сворачиваться в трехмерную структуру [12,13].
Так Scholar Google нашел по запросу
«base composition» ~ 3 610 000 статей, «oligonucleotide composition» ~ 234 000 статей, «dna, symmetry» ~ 240 000 статей;
5b. Какое место занимает в этой области Ваша проблема, которой Вы посвятили свой диплом?
Симметрия не абсолютна. Каковы причины её нарушения, тоже пока не ясно. Разные исследовательские лаборатории предлагаю свои гипотезы, и их условно можно разделить на два типа:
1. геномы организмов стремятся к симметрии, и через инверсии и мутации асимптотически приближаются к ней[1-3];
2. геном отдаляются от симметрии по причине эволюционных изменений – все тех же инверсий, мутаций, вставок и делеций[6].
Мало кто изучает то, как симметрия нарушается на разных фрагментах реальных генетических последовательностей. В моей работе хотелось бы проверить участки с различным «поведением» частот комплементарных «слов» (участки, где правило довольно точно выполняется и участки с сильным отклонением) и найти некоторые биологические причины, скрывающиеся в не точности соблюдения второго правила Чаргаффа.
Оценим количество публикаций, связанных непосредственно со вторым правилом Чаргаффа:
Результат запроса «Chargaff second rule» в Scholar Google ~ 1 810 статей. Однако «"Chargaff second rule"» - всего 15.
5.c. Какие самые важные открытия в Вашей области произошли недавно? [12-13]
Я считаю одним из важнейших произошедших недавно открытий в моей области – открытие фрактальной структуры геномов. Назвать эту тему новой сложно, ведь она поднималась ещё 20 лет назад (Nature, Peng at al., 1992 [?]), однако недавно она вновь вернулась на обозрение широкой публике.
2009 г. в Science вышла статья [13], в которой была построена 3D модель архитектуры генома, соответствующая фрактальной модели глобулы. В масштабах мегабазы (мегабаза - единица изменения длины молекулы ДНК, равная миллиону пар оснований[15]) 3D структура напоминает аналог кривой Гильберта, однако ученые не исключают того, что вероятно полученные математические выкладки могут подходить под описание и других регулярных структур. Кстати, обложку того номера Science украшала кривая Гильберта и заявление научного советника президента США Эрика Ландера : «Mr.Presedent, the Genome is Fractal!»
Кривая гильберта – непрерывная фрактальная заполняющая пространство кривая, впервые описанная немецким математиком Дэвидом Гильбертом в 1891. Представляет собой один из вариантов кривых Пеано (в математике чаще такое написание фамилии Peano, нежели Пиано) [16]. Кривая заполняет пространство, не пересекая себя, ниже показано как она выглядит, и как можно её построить.
Рис.1. Кривые Гильберта: первого (а), второго (б) и третьего (в) порядков[17].
Рис.2. Способ укладки хроматина на плоскости и в трехмерном пространстве [18].
В общем случае она строится для заполнения плоскости, однако можно обобщить процедуру и до трехмерного пространства.
В статье независимого французского исследователя Жана-Клода Переса [12] приводится доказательство того, что геном представляет собой иной фрактал – кривую Дракона (также известный как дракон Хартера — Хейтуэя). В своей работе автор учитывает второе правило Чаргаффа и симметрию, которую оно порождает.
Рис.3. Кривая дракона [19]
6. Проделанная работа была, несомненно, полезной. Было найдено большое количество интересных статей по предмету моего исследования, многие из них будут подробно разобраны и включены в диплом.
7. Список использованных источников:
1) Albrecht-Buehler, G. Asymptotically increasing compliance of genomes with Chargaff’s second parity rules through inversions and inverted transpositions / G. Albrecht-Buehler// PNAS. – 2006. – vol.103, no 47. – pp. 17828-17833. doi:10.1016/j.ygeno.2007.05.010
2) Albrecht-Buehler, G. Inversions and inverted transpositions as the basis for an almost universal “format” of genome sequences / G. Albrecht-Buehler// Genomics. – 2007. – №90. – pp. 297-305. doi:10.1073/pnas.0605553103
3) Mitchell, D. A test of Chargaff’s second rule/ D.Mitchell, R.Bridge// Biochemical and Biophysical Research Communications. – 2006. - №340. – pp.90-94. doi:10.1016/j.bbrc.2005.11.160
4) Sorimachi, K. A Proposed Solution to the Historic Puzzle of Chargaff's Second Parity Rule / K. Sorimachi // The Open Genomics Journal. - 2009. – Vol.2. – pp. 12-14. doi: 10.2174/1875693X00902010012
5) Nikolaou, C. Deviations from Chargaff's second parity rule in organellar DNA Insights into the evolution of organellar genomes / C. Nikolaou, Y. Almirantis // Gene. – 2006. - №381. – рр. 34–41 doi:10.1016/j.gene.2006.06.010
6) Усанов, Н. Н. Симметричные структуры в комплементарных цепях геномных ДНК и возможные алгоритмы их организации Решение [Текст]: препринт / Н. Н. Усанов, Н.Г.Усанов ; Институт биологии Уфимского научного центра РАН. – Москва: ИПМ № 43, 2008. – 28 с.
7) Журнал Bioinformatics; режим доступа: URL Online ISSN: 1460-2059 - Print ISSN: 1367-4803; Impact Factor: 4.926
8) Журнал Gene; режим доступа: URL ISSN: 0378-1119; Impact Factor: 2.416
9) Журнал BMC Genomics; режим доступа: URL ISSN: 1471-2164; Impact Factor: 3.76
10) Журнал BMC Bioinformatics; режим доступа: URL ISSN: 1471-2105; Impact Factor: 3.43
11) Журнал Genomics; режим доступа: URL ISSN: 0888-7543; Impact Factor: 3.327
12) Perez, J. Codon populations in single-stranded whole human genome DNA are fractal and fine-tuned by the Golden Ratio 1.618/ J.Perez // Interdisciplinary Sciences: Computational Life Sciences. – 2010. - №2. – pp.1-13. doi:10.1007/s12539-010-0022-0
13) Lieberman-Aiden, E. Comprehensive mapping of long-range interactions reveals folding principles of the human genome./ E.Lieberman-Aiden, N. L. Van Berkum, L.Williams, M.Imakaev, T.Ragoczy, A.Telling, I. Amit, B.R.Lajoie, P.J.Sabo, M.O. Dorschner, R. Sandstrom, B. Bernstein, M.A. Bender, M. Groudine, A. Gnirke, J. Stamatoyannopoulos, L.A. Mirny, E.S.Lander, J. Dekker//Science (New York, N.Y.). - 2009. – Vol. 326 Is.5950 – pp.289-293 doi:10.1126/science.1181369.
14) S. J. Bell, D. R. Forsdyke. Deviations from Chargaff's Second Parity Rule Correlate with Direction of Transcription // Journal of Theoretical Biology, Volume 197, Issue 1, 7 March 1999, Pages 63-76. doi:10.1006/jtbi.1998.0858
15) Дезоксирибонуклеиновая кислота. Статья из Глоссария – режим доступа: URL
16) Hilbert curve. Статья из Википедии – режим доступа: URL
17) Златопольский, Д.М. Рекурсия. Информатика/ Златопольский Д.М - 1996. - № 7, 8.
18) The Human Genome is 3 Dimensions. Wired Science. - режим доступа: URL
19) Кривая дракона. Статья из Википедии – режим доступа: URL
Рецензия. Технических замечаний нет. Предложенное в работе [4] решение следует обсудить, например, на основе работ, которые цитируют статью [4]. Их легко найти URL. Scholar Google стал фактически рабочим инструментом, т.к. указывает те статьи, которые цитируют данную работу. Это поможет Вам при постановке и решении задач в дипломной работе.