Славяне, кавказцы, евреи с точки зрения ДНК-генеалогии
Шрифт:
Мутации второго типа – STR (Short Tandem Repeats, или «короткие тандемные повторы») – значительно более быстрые, и происходят в определенных участках, или локусах, или маркерах (это все синонимы) ДНК раз в несколько десятков или сотен поколений. Набор этих маркеров составляет гаплотип, примеры гаплотипов будут даны ниже. Гаплотип – это по сути цепочка чисел, показывающих число повторов в определенных маркерах. Поэтому гаплотипы ДНК выбирают так, чтобы в них таких маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17– и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111-маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов). В 67-маркерных
Например, предковый гаплотип осетин со снипом Z6638 (в гаплогруппе G2a1, о которой речь пойдет ниже) c «возрастом» 1375±210 лет выглядит так:
14 23 15 9 15 17 11 12 11 11 10 28 17 9 9 12 11 25 16 21 28 13 13 14 14 11 11 19 21 15 15 16 18 37 38 12 9 11 8 15 16 8 11 10 8 12 10 12 21 22 14 10 12 12 15 8 13 21 22 15 13 11 13 10 11 11 13 30 15 8 16 11 23 27 21 9 11 13 13 11 9 10 12 10 11 12 27 10 12 22 14 11 10 24 15 17 14 23 18 12 15 27 12 21 18 11 14 17 9 12 11
А предковый гаплотип карачаево-балкарцев c тем же снипом и в той же гаплогруппе, с «возрастом» 4650±750 лет, но в 67-маркерном формате (111-маркерных гаплотиппов карачаево-балкарцы себе не определяли), имеет вид:
14 22 15 10 15 16 11 12 11 12 10 29 17 9 9 11 11 25 16 21 29 13 13 14 14 10 10 20 21 15 15 15 18 36 38 11 10 11 8 15 16 8 11 10 8 12 10 12 21 22 14 10 12 12 15 8 13 21 22 16 13 11 13 10 11 11 13
Между этими предковыми гаплотипами – 14 мутаций на первых 67 маркерах. Это очень много, и это разводит их общих предков на 14/0.12 = 117 -> 133 условных поколений (по 25 лет каждое), то есть примерно на 3325 лет, и их общий предок жил примерно 4675 лет назад. Но это и есть «возраст» общего предка карачаево-балкарцев гаплогруппы G2a1, к которой относится треть всего народа, точнее, его мужской половины. Иначе говоря, и карачаево-балкарцы, и осетины гаплогруппы G2a1 происходят от одного общего предка, который жил в первой половине III тыс до н. э. Осталось выяснить, где он жил, и это ДНК-генеалогия тоже способна определить. Состояние ответа на сегодняшний день – это историческая Бактрия, область на сопредельных территориях Узбекистана, Таджикистана и северного Афганистана. Именно там современные жители той же гаплогруппы имеют подобные предковые гаплотипы. В формуле выше 0.12 (мутаций на гаплотип за условное поколение) – это константа скорости мутаций для 67-маркерных гаплотипов, стрелка показывает табличную поправку на возвратные мутации. Это упрощенный пример, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам и сотням гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых цифрах, и т. д. Здесь только иллюстрируется принцип расчета.
В гаплотипах, приведенных выше, первое число показывает, что в одном из маркеров Y-хромосомы определенная последовательность нуклеотидов повторяется 14 раз. В другом маркере, который здесь показан как следующий, блок нуклеотидов повторяется 23 раза у осетин, и 22 раза у карачаево-балкарцев, и так далее. Чтобы показать, что все это на самом деле четко определено и зафиксировано, [6] добавим, что в первом маркере (под названием DYS393) повторяется четверка нуклеотидов AGAT, то есть аденин-гуанин-аденин-тимин
6
Интернет-сайт Sorenson Molecular Genealogy Foundation. URL: http://www.smgf.org/ychromosome/marker_details.jspx?marker.
GTGGTCTTCTACTTGTGTCAATAC/AGAT/AGAT/AGAT/AGAT/ AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AT GTATGTCTTTTCTATGAGACATACCTCATTTTTTGGACTTGAGTTC
и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше. Во втором маркере, под названием DYS390, повторяется уже другая четверка, TCTG, то есть тимин-цитозин-тимин-гуанин, которая переходит в четверку TCTA, то есть тимин-цитозин-тимин-аденин, и число повторов складывается (здесь показана последовательности для 22 повторов, как у карачаево-балкарцев):
TATATTTTACACATTTTTGGGCCCTGCATTTTGGTACCCCATAA TATATTCTATCTA/TCTG/TCTG/TCTG/TCTG/TCTG/TCTG/TCTA/ TCTA/TCTA/TCTA/TCTATCTA/TCTA/TCTA/TCTA/TCTA/TCTA/ TCTA/TCTG/TCTA/TCTA/TCTA/TCATCTATCTATCTTTCCTTGTTT CTGAGTATACACATTGCAATGTTTTCATTTTACTGTCAC
Перечисленные
четыре нуклеотида – это язык ДНК, который состоит из этих четырех слов, или четырех букв, при сокращенной записи. Эти нуклеотиды комбинируются парами, и их так и называют – «пары оснований». Они фактически держат двойную спираль ДНК.Нам эти четверки (а также тройки нуклеотидов, и другие типы повторов) в маркерах ДНК в дальнейшем не понадобятся, это описание мы даем только для того, чтобы показать, что за числами в гаплотипах стоят масштабные исследования, которыми занимаются в мире сотни и тысячи человек.
Гаплотипы ДНК выбирают так, чтобы в них таких маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17– и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111-маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов).
В 67-маркерных гаплотипах одна мутация происходит в среднем за 8 поколений, в 111-маркерных – за 5 поколений. Поэтому у 111-маркерных гаплотипов разрешение лучше. Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Длинные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно [7] .
7
Интернет-сайт R1a. URL:http://r1a.org Интернет-сайт A Free Public Service from Family Tree DNA. URL:http://www.smgf.org/pages/ydatabase.jspx Интернет-сайт Family Tree DNA. URL:familytreedna.com/public/R1aY-Haplogroup/default. aspx?section=yresults;R1a/default.aspx?section=yresults
Klyosov A.A., Rozhanskii I.L. Re-Examining the “Out of Africa”
Theory and the Origin of Europeoids (Caucasoids) in Light of DNA Genealogy // Advances in Anthropology. 2012. Vol. 2, No. 2. P. 80–86. URL: http://dx.doi.org/10.4236/aa.2012.22009
Как мы покажем ниже, эти гаплотипы, а именно числа в них, напрямую связаны с хронологией древних миграций людей, переходами людей на новые места, событиями прошлого – войнами, климатическими катаклизмами, эпидемиями, в общем, со всем тем, что так или иначе влияло на численность популяций человека в определенные времена и на определенных территориях. Например, расчеты могут показать, когда древние арии появились на Русской равнине, когда они появились в Индии, Иране, на Ближнем Востоке – потому что эти события приводили к появлению на этих территориях и в те времена общих предков популяций, которые разрастались вплоть до нашего времени, образуя «кусты» гаплотипов со всеми мутациями в них, то есть изменениями чисел в маркерах.
Поскольку уже показано и доказано, что мутации в маркерах происходят в основном (или исключительно) неупорядоченно, то к ним оказалось возможным применять правила и подходы химической кинетики, или биологической кинетики, кому какой термин больше нравится – суть одна. И снипы, и маркеры мутируют по законам кинетики первого порядка, других закономерностей пока не обнаружено. Это означает, что каждому маркеру свойственна определенная константа скорости мутации, и каждому гаплотипу (состоящему из набора маркеров) – тоже свойственна определенная средняя константа скорости мутации, равная сумме констант скоростей мутаций отдельных маркеров. Поэтому чем древнее общий предок популяции, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с ним, тем больше поколений (и лет) отделяет современных потомков от их общего предка, и это число поколений (и лет) рассчитывается методами ДНК-генеалогии. Как это делается, тоже будет показано ниже на многих примерах.