Пример 5

Тема: Симметрия нуклеотидных последовательностей, связанная со вторым правилом Чаргаффа, и её нарушения.

Темлякова Евгения Андреевна, 5 курс, группа ФФ06-24С.

1. Ключевые слова & Key words1) Правило Чаргаффа – Chargaff’s rule* (Chargaff second rule, Chargaff’s second parity rule)

2) ДНК – DNA

3) Геном – Genome

4) Симметрия – Symmetry

5) Нуклеотидный состав – Base/ nucleotide composition/distribution

6) Олигонуклеотидный состав - oligonucleotide composition

7) Биоинформатика – Bioinformatics

8) Частота - Frequency

9) Частотный словарь – Frequency dictionary

*Примечание: при поиске по ключевым словам достаточно ввести «Chargaff’s rule», он выдает статьи, касающиеся второго правила Чаргаффа. Причина, по-видимому, в том, что работ связанных с первым правилом очень мало (скорее с ним всё ясно).

2. Поиск по ключевым словам

Затем произведите поиск по ключевым словам в следующих основных базах данных:

i. http://elibrary.ru/querybox.asp?scope=newquery

ii. http://scholar.google.com/advanced_scholar_search

iii. http://pubs.acs.org/

iv. http://www.sciencedirect.com/

v. http://www.iop.org/EJ/

vi. http://publish.aps.org/

Если используете другие базы, то укажите их URL адрес.

vii. http://www.gopubmed.org

viii. http://www.biomedcentral.com

ix. http://www.plosbiology.org

3. Список важных журналов [8-11]:

a. Составьте перечень российских и иностранных ЖУРНАЛОВ, в которых публикуются статьи с Вашими ключевыми словами, и которые Вам следовало бы РЕГУЛЯРНО просматривать при Вашей научной работе.

1) Bioinformatics – журнал издательства Оксфордского университета, является лидирующим в области биоинформатики. Импакт фактор за 2009 г. составил 4.926. Основной фокус журнала – новые разработки в геномной биоинформа-тике и вычислительной биологии.

2) Gene – реферируемый научный журнал о генетике издательства “Elsevier”. Основной фокус – клонирование генов, исследования функции и структуры генов. Он полезен для того, чтобы быть в курсе последних исследований в области молекулярной генетики. Также в нем встречается немало статей по биоинформатике. Последние данные по импакт фактору – 2,416.

3) BMC Genomics и BMC Bioinformatics - журналы издательства BioMed Central, находятся в открытом доступе и содержат реферируемые исследовательские работы по самому широкому спектру тем в области геномики и биоинформатики. Импакт факторы: 3,76 и 3,43, соответственно.

4) Genomics - реферируемый научный журнал издательства “Elsevier”, содержит публикации, описывающиеся разработки техник в масштабах генома и их приложение к другим областям биологических исследований. Вошел в список 100 самых влиятельных журналов биологии и медицины за последние 100 лет составленный организацией «Special Libraries Association» (SLA, США) на основе опроса специалистов в 2009 году. Импакт фактор – 3,327. Среди основных тем издания – исследования в области вычислительной биологии, биоинформатики и биостатистики, эволюция генетических последовательностей.

4. Список ключевых статей [1-7]

a. Выберите среди найденных статей с Вашими ключевыми словами по 2-3 важных статьи.

5. Постарайтесь кратко ответить на вопросы (письменно!):

5a.Состояние исследований в моей области

В 1952 г. Эрвин Чаргафф сформулировал правило касающееся комплементар­ности азотистых оснований в молекуле ДНК (А=Т, Г=Ц). Все, кто так или иначе знаком с историей открытия структуры молекулы ДНК, знает какое огромное значение сыграло это эмпирическое соотношение в построении модели двойной спирали. Однако мало кто знает, что несколькими годами позднее (1968 г.) в лаборатории Чаргаффа тем же методом бумажной хроматографии был подсчитан нуклеотидный состав уже для единственной цепочки ДНК и Внимание! было получено все тоже соотношение! Только вот точность не была такой высокой как при анализе двойной спирали, однако в процентном соотношении, различие было совсем небольшим. Таким образом, было сформулировано второе правило Чаргаффа: для одного стрэнда А≈Т, Г≈Ц.

И если причины выполнения первого правила были объективно ясны, то природа второго остается загадкой и по сей день. С появлением баз генетических данных было установлено, что правило универсально для всех геномов, и претерпевает сильное нарушение лишь у непарных цепочек ДНК клеточных органелл [1-3, 5]. Более того, правило было расширено – оказалось, что помимо количества комплементарных мононуклеотидов (А и Т, Г и Ц), совпадают и количества комплементарных олигонуклеотидов (пример комплементарных олигонуклеотидов →АТЦ - САТ), что значит, что в двух цепочках встречается приблизительно равное число одинаковых «слов». Притом, совпадение «слов» при подсчете наблюдается как для целых хромосом, так и для любых ее участков (и кодирующих, и некодирующих). Будем называть это симметрией.

В чем же её причины? Пока нет единого объяснения этого феномена. Наиболее достоверно выглядят работы, в которых соблюдение второго правила Чаргаффа связывают с необходимостью спирали ДНК сворачиваться в трехмерную структуру [12,13].

Так Scholar Google нашел по запросу

«base composition» ~ 3 610 000 статей, «oligonucleotide composition» ~ 234 000 статей, «dna, symmetry» ~ 240 000 статей;

5b. Какое место занимает в этой области Ваша проблема, которой Вы посвятили свой диплом?

Симметрия не абсолютна. Каковы причины её нарушения, тоже пока не ясно. Разные исследовательские лаборатории предлагаю свои гипотезы, и их условно можно разделить на два типа:

1. геномы организмов стремятся к симметрии, и через инверсии и мутации асимптотически приближаются к ней[1-3];

2. геном отдаляются от симметрии по причине эволюционных изменений – все тех же инверсий, мутаций, вставок и делеций[6].

Мало кто изучает то, как симметрия нарушается на разных фрагментах реальных генетических последовательностей. В моей работе хотелось бы проверить участки с различным «поведением» частот комплементарных «слов» (участки, где правило довольно точно выполняется и участки с сильным отклонением) и найти некоторые биологические причины, скрывающиеся в не точности соблюдения второго правила Чаргаффа.

Оценим количество публикаций, связанных непосредственно со вторым правилом Чаргаффа:

Результат запроса «Chargaff second rule» в Scholar Google ~ 1 810 статей. Однако «"Chargaff second rule"» - всего 15.

5.c. Какие самые важные открытия в Вашей области произошли недавно? [12-13]

Я считаю одним из важнейших произошедших недавно открытий в моей области – открытие фрактальной структуры геномов. Назвать эту тему новой сложно, ведь она поднималась ещё 20 лет назад (Nature, Peng at al., 1992 [?]), однако недавно она вновь вернулась на обозрение широкой публике.

2009 г. в Science вышла статья [13], в которой была построена 3D модель архитектуры генома, соответствующая фрактальной модели глобулы. В масштабах мегабазы (мегабаза - единица изменения длины молекулы ДНК, равная миллиону пар оснований[15]) 3D структура напоминает аналог кривой Гильберта, однако ученые не исключают того, что вероятно полученные математические выкладки могут подходить под описание и других регулярных структур. Кстати, обложку того номера Science украшала кривая Гильберта и заявление научного советника президента США Эрика Ландера : «Mr.Presedent, the Genome is Fractal!»

Кривая гильберта – непрерывная фрактальная заполняющая пространство кривая, впервые описанная немецким математиком Дэвидом Гильбертом в 1891. Представляет собой один из вариантов кривых Пеано (в математике чаще такое написание фамилии Peano, нежели Пиано) [16]. Кривая заполняет пространство, не пересекая себя, ниже показано как она выглядит, и как можно её построить.

Рис.1. Кривые Гильберта: первого (а), второго (б) и третьего (в) порядков[17].

Рис.2. Способ укладки хроматина на плоскости и в трехмерном пространстве [18].

В общем случае она строится для заполнения плоскости, однако можно обобщить процедуру и до трехмерного пространства.

В статье независимого французского исследователя Жана-Клода Переса [12] приводится доказательство того, что геном представляет собой иной фрактал – кривую Дракона (также известный как дракон Хартера — Хейтуэя). В своей работе автор учитывает второе правило Чаргаффа и симметрию, которую оно порождает.

Рис.3. Кривая дракона [19]

6. Проделанная работа была, несомненно, полезной. Было найдено большое количество интересных статей по предмету моего исследования, многие из них будут подробно разобраны и включены в диплом.

7. Список использованных источников:

1) Albrecht-Buehler, G. Asymptotically increasing compliance of genomes with Chargaff’s second parity rules through inversions and inverted transpositions / G. Albrecht-Buehler// PNAS. – 2006. – vol.103, no 47. – pp. 17828-17833. doi:10.1016/j.ygeno.2007.05.010

2) Albrecht-Buehler, G. Inversions and inverted transpositions as the basis for an almost universal “format” of genome sequences / G. Albrecht-Buehler// Genomics. – 2007. – №90. – pp. 297-305. doi:10.1073/pnas.0605553103

3) Mitchell, D. A test of Chargaff’s second rule/ D.Mitchell, R.Bridge// Biochemical and Biophysical Research Communications. – 2006. - №340. – pp.90-94. doi:10.1016/j.bbrc.2005.11.160

4) Sorimachi, K. A Proposed Solution to the Historic Puzzle of Chargaff's Second Parity Rule / K. Sorimachi // The Open Genomics Journal. - 2009. – Vol.2. – pp. 12-14. doi: 10.2174/1875693X00902010012

5) Nikolaou, C. Deviations from Chargaff's second parity rule in organellar DNA Insights into the evolution of organellar genomes / C. Nikolaou, Y. Almirantis // Gene. – 2006. - №381. – рр. 34–41 doi:10.1016/j.gene.2006.06.010

6) Усанов, Н. Н. Симметричные структуры в комплементарных цепях геномных ДНК и возможные алгоритмы их организации Решение [Текст]: препринт / Н. Н. Усанов, Н.Г.Усанов ; Институт биологии Уфимского научного центра РАН. – Москва: ИПМ № 43, 2008. – 28 с.

7) Журнал Bioinformatics; режим доступа: URL Online ISSN: 1460-2059 - Print ISSN: 1367-4803; Impact Factor: 4.926

8) Журнал Gene; режим доступа: URL ISSN: 0378-1119; Impact Factor: 2.416

9) Журнал BMC Genomics; режим доступа: URL ISSN: 1471-2164; Impact Factor: 3.76

10) Журнал BMC Bioinformatics; режим доступа: URL ISSN: 1471-2105; Impact Factor: 3.43

11) Журнал Genomics; режим доступа: URL ISSN: 0888-7543; Impact Factor: 3.327

12) Perez, J. Codon populations in single-stranded whole human genome DNA are fractal and fine-tuned by the Golden Ratio 1.618/ J.Perez // Interdisciplinary Sciences: Computational Life Sciences. – 2010. - №2. – pp.1-13. doi:10.1007/s12539-010-0022-0

13) Lieberman-Aiden, E. Comprehensive mapping of long-range interactions reveals folding principles of the human genome./ E.Lieberman-Aiden, N. L. Van Berkum, L.Williams, M.Imakaev, T.Ragoczy, A.Telling, I. Amit, B.R.Lajoie, P.J.Sabo, M.O. Dorschner, R. Sandstrom, B. Bernstein, M.A. Bender, M. Groudine, A. Gnirke, J. Stamatoyannopoulos, L.A. Mirny, E.S.Lander, J. Dekker//Science (New York, N.Y.). - 2009. – Vol. 326 Is.5950 – pp.289-293 doi:10.1126/science.1181369.

14) S. J. Bell, D. R. Forsdyke. Deviations from Chargaff's Second Parity Rule Correlate with Direction of Transcription // Journal of Theoretical Biology, Volume 197, Issue 1, 7 March 1999, Pages 63-76. doi:10.1006/jtbi.1998.0858

15) Дезоксирибонуклеиновая кислота. Статья из Глоссария – режим доступа: URL

16) Hilbert curve. Статья из Википедии – режим доступа: URL

17) Златопольский, Д.М. Рекурсия. Информатика/ Златопольский Д.М - 1996. - № 7, 8.

18) The Human Genome is 3 Dimensions. Wired Science. - режим доступа: URL

19) Кривая дракона. Статья из Википедии – режим доступа: URL

Рецензия. Технических замечаний нет. Предложенное в работе [4] решение следует обсудить, например, на основе работ, которые цитируют статью [4]. Их легко найти URL. Scholar Google стал фактически рабочим инструментом, т.к. указывает те статьи, которые цитируют данную работу. Это поможет Вам при постановке и решении задач в дипломной работе.