Статьи
ДНК-генеалогия – это не генетика
Увидев в термине «ДНК-генеалогия» слово «ДНК», можно подумать, что речь пойдет о генетике. Безусловно, генетики изучают ДНК, но не только они. ДНК – это кислота и полимер, а химики работают с кислотами и полимерами, значит, изучают и ДНК, но инструментами другой науки – химии. Простой пример: если химик растворит ДНК в воде и исследует вязкость раствора, то он занимается не генетикой, а коллоидной химией.
Генетика – это раздел биологии, наука о генах и мутациях в них, а ДНК-генеалогия гены не изучает, ДНК-генеалогия не относится к биологии, а является разделом физической химии, входя в ее подраздел «химическая кинетика». Кинетика – это раздел физической химии, наука о скоростях и механизмах химических и биологических процессов. Методы химической кинетики и расчеты, сделанные этими методами, лежат за пределами генетики.
Далее надо сказать, что уже очень давно ведутся работы на стыках наук, и здесь очень показателен следующий исторический пример. В XVII веке жил натуралист, основатель научной микроскопии Антони ван Левенгук. Он изготавливал линзы, и однажды, сложив линзы в стопку и посмотрев через нее на каплю воды, Левенгук увидел много разных «зверюшек», как он сам написал. Сначала ему не поверили, но сформировали комиссию, и она подтвердила, что действительно в природе существуют столь малые организмы, которые невидимы для невооруженного глаза. Итак, микроскопист Левенгук внес огромный вклад в микробиологию. Из своей области он заглянул в сферу, которая относилась к другой науке. Разумеется, он вовсе не заменил своим наблюдением микробиологию. Но дал подсказку в виде прямого эксперимента тем людям, которые потом стали микробиологами, на что им обратить внимание.
Другим очень важным примером является создание Уиллардом Либби метода радиоуглеродного датирования, который используется для определения возраста археологических образцов. Либби – не археолог, не историк, он получил степень доктора химии в Калифорнийском университете в Беркли. Однако его результаты, достигнутые в рамках совсем другой сферы, оказались востребованы в исторической науке. Так вот, ДНК-генеалогия получает результаты, которые также могут быть очень полезны историкам, археологам, антропологам, лингвистам, этнографам, этнологам и представителям других смежных наук. Разумеется, ДНК-генеалогия не подменяет собой историю, не изучает культуру, традиции и обычаи народов, не дает ответов на вопрос, чем вызваны те или иные исторические события, и так далее. Очевидно же, что культура, язык и традиции не записаны в ДНК.
Но чем же тогда ДНК-генеалогия способна помочь в изучении истории? Чтобы ответить на этот вопрос, необходимо сделать некоторые предварительные пояснения и дать определение терминам, которыми мы будем пользоваться. Генетики проводят тесты ДНК методами своей науки, которые уже давно стали автоматическими и выполняются квалифицированными лаборантами, а затем полученные данные обрабатываются методами химической кинетики в рамках ДНК-генеалогии. Какие данные, полученные генетиками, точнее, лаборантами, которые, как правило, генетического образования не имеют, нас интересуют в контексте ДНК-генеалогии? Это информация по гаплогруппам, гаплотипам и субкладам. Приведу определения этих терминов.
Различные близкие варианты одного и того же фрагмента ДНК называют аллелями, гаплотип – совокупность аллелей на локусах (определенных фрагментов ДНК) одной хромосомы, как правило, Y-хромосомы, то есть мужской половой хромосомы.
Гаплогруппа – группа схожих гаплотипов, имеющих общего предка, у которого произошла мутация (или снип-мутация), унаследованная всеми потомками. Иначе говоря, каждая гаплогруппа имеет свою специфическую метку (снип), которую обозначают уникальными индексами. Этих меток-индексов-снипов специалисты уже идентифицировали в количестве более ста тысяч, они внесены в справочники, таблицы, в профессиональные базы данных. Их так много потому, что понятие «гаплогруппа» относится также к многочисленным ветвям основных гаплогрупп, которых сейчас насчитывают 36, а ветвей – суммарно многие тысячи. Эти ветви называют еще «субклады», и каждый имеет тоже уникальную (за редким исключением) метку. Их много еще и потому, что многие метки, по сути, дублируются, но названы по-разному в разных лабораториях. Поэтому каждая гаплогруппа и каждый субклад порой имеют десятки и сотни этих меток-снипов, и никакая лаборатория не хочет уступать, никакая не хочет унификации наименований индексов-снипов. Каждая использует свой индекс. Это раздувает списки снипов, но таковы реальности в генетике, точнее, в ее части, которая называется филогенией.
Субклады – это подгруппы (ветви) в составе гаплогруппы, как описано в предшествующем абзаце. Но поскольку «подгруппа» – это тоже группа, то часто основные субклады тоже называют гаплогруппами. Но никакой путаницы, как может показаться неспециалисту, нет. Так и в обыденной жизни. Москвичам (то есть «специалистам» в этом контексте), когда говорят, скажем, Кунцево, мало кто уточняет, что это район Москвы, это и так понятно. А когда говорят «Васильевский остров», то понятно, что это в Санкт-Петербурге. Поэтому когда говорят «R1a», что есть субклад гаплогруппы R, часто называют «гаплогруппа R1a». И так – в каждой гаплогруппе, ведь R1a, R1b, I2a и т.п. – это действительно группа гаплотипов, как и носителей этих субкладов, порой насчитывающих десятки и сотни миллионов человек. Мужчин, разумеется.
На практике сведения о гаплотипах представляются в виде последовательности чисел, каждое из которых показывает, сколько раз в Y-хромосоме повторяется один и тот же фрагмент, то есть совокупность нуклеотидов. Обычно в каждом повторе есть последовательности трех или четырех нуклеотидов. Понятно, что число переборов трех или четырех нуклеотидов, которых в ДНК всего четыре (тимин, аденин, цитозин, гуанин), может быть огромным. Так, Y-хромосома, которая тоже состоит из тех же четырех нуклеотидов, соединенных в разных переборах, содержит 58 миллионов нуклеотидов. Так что вариантов гаплотипов может быть очень много, и число локусов, или маркеров (что одно и то же), по реалистичным подсчетам в Y-хромосоме не менее 2500. Из них пока используют для большинства ДНК-тестов максимум 111 маркеров. Но уже в экспериментальном варианте получают гаплотипы из 500-600 маркеров, впрочем, они на практике почти не используются. На современном уровне ДНК-генеалогии это избыточно.
Сейчас я приведу практический пример того, как работает ДНК-генеалогия и какие результаты она способна получить, и как работает популяционная генетика, к методологии которой ДНК-генеалогия не имеет отношения. Возьмем реальный пример из литературы, в котором генетики рассматривали 131 гаплотип донских казаков, причем все гаплотипы были в 17-маркерном формате. Как обычно у генетиков, гаплотипы не разделяли по гаплогруппам, что немыслимо для ДНК-генеалогии. А немыслимо, потому что разные гаплогруппы – это разные рода, с разной историей миграций, да и вообще с разной историей. Это примерно как складывать метры и килограммы, и получать некие числа, которые никакого практического смысла не имеют. Так вот, авторы «научной статьи» написали, что среди 131 гаплотипа казаков 8 были идентичны друг другу и остальные 123 гаплотипа были «уникальны», то есть отличались друг от друга. Разумеется, для смеси гаплогрупп это не удивительно, и для того, чтобы убедиться, что там именно смесь, авторы статьи наугад выбрали два образца (из 131) и определили их гаплогруппы. Оказались I2a и R1a.
Дальнейший «анализ» авторы проводили как обычно у генетиков. А именно, определяли «гаплотипическое разнообразие» всех гаплотипов (n=131). Понятно, что определять «разнообразие» в смеси гаплотипов разных гаплогрупп – это совершенно бессмысленное занятие. Понятно, что смесь будет «разнообразной», и потому, что разные гаплогруппы, и потому, что в каждой гаплогруппе (и в каждом субкладе) будет свой «общий предок», что и даст дополнительную смесь. Так и оказалось. Считали по специальной формуле, в которой суммировали квадрат частоты встречи каждого гаплотипа, и эту сумму вычитали из единицы. Понятно, что поскольку гаплотипы «уникальные», то частоты встречи тоже будут малыми, а при возведении в квадрат сумма вообще окажется мизерной, и при вычитании ее из единицы эта единица и получилась. Короче, авторы заключили, что это «гаплотипное разнообразие» очень велико и это «характерно для многих европейских популяций». Больше это «разнообразие» нигде в статье не использовалось. Наконец, авторы попытались понять географическое «происхождение донских казаков» по своим данным и в итоге пришли к такому выводу: «становится возможным определить происхождение географически очень приблизительно – “Восточная Европа”». Трудно удержаться от сарказма при чтении такой работы, а ведь в авторах – цвет российской популяционной генетики, 10 человек. Из гуманности фамилии опустим.
Понятно, что ДНК-генеалогия так не работает. Во-первых, потому что ДНК-генеалогия – это не генетика, во-вторых, столь бессмысленные «подходы» и столь же пустые выводы ее не интересуют. Приведу пример, как работает ДНК-генеалогия в отношении ее расчетного аппарата. Во-первых, серию гаплотипов надо непременно разделить по гаплогруппам, и гаплотипы в каждой гаплогруппе (подсерии) обрабатывать раздельно. Допустим, что в одной из подсерий оказался 131 гаплотип в 17-маркерном формате, и 8 из них были идентичны друг другу (чтобы воспроизвести те же числа, что и в предыдущем примере). Эти 8 гаплотипов соответствуют предковому гаплотипу для всей подсерии из 131 гаплотипа, то есть за время, прошедшее от времени жизни общего предка, 123 гаплотипа мутировали в той или иной степени, а 8 пока не успели мутировать, остались теми же, что был у общего предка. Тогда общий предок 131 гаплотипа жил (ln 131/8)/0,0365 условных поколений назад, каждое поколение по 25 лет, а 0,0365 – константа скорости мутации для 17-маркерных гаплотипов, рассчитанная именно для условного поколения в 25 лет. Если кто решит выбрать другую продолжительность для условного поколения, то константу скорости придется пропорционально изменить, и получится тот же самый результат для времени жизни общего предка. Взяв натуральный логарифм, как показано выше, и разделив на константу скорости мутации, получим, что общий предок жил 77 - 84 условных поколений назад, то есть 2100 лет назад. Здесь стрелка – поправка на возвратные мутации, что рассчитывается по соответствующей формуле, которую тут разбирать не будем (она приведена в книге А.А. Клёсова «Практическая ДНК-генеалогия для всех», М.: Концептуал, 2018; там же дан список констант скоростей мутаций для самых разных гаплотипов). Это так называемый логарифмический метод расчета, как видим, для него вообще не нужно считать число мутаций во всех гаплотипах (n=131) от предкового, который в ДНК-генеалогии называется базовым гаплотипом.
Но что, если в этих гаплотипах есть ошибки, внесенные невнимательным исследователем и мы получили неверный результат? Такое на практике бывает. Поэтому всегда желательно проводить проверку ответа, как многие помнят еще из школы. Проверкой будет использование не логарифмического, а линейного способа расчета. Рассмотрим все гаплотипы (n=131) и посчитаем, сколько в них есть мутаций от базового (предкового) гаплотипа. Допустим, что их оказалось 368 мутаций. Тогда согласно линейному методу получаем 368/131/0,0365 = 77 - 84 условных поколений. Как видим, здесь в числителе число мутаций, в знаменателе 131 гаплотип (то есть число человек, для которых делали ДНК-тестирование) и константа скорости мутаций для 17-маркерных гаплотипов. Также видим, что ответ ровно тот же самый, что и для логарифмического метода. Это и есть проверка того, что рассчитано правильно обоими методами. Более того, рискнем предположить, что эта подсерия гаплотипов, на которой мы остановились и которая происходит от общего предка, жившего примерно 2100 лет назад (с определенной погрешностью, расчет которой пояснен в той же книге, названной выше, – на самом деле это учебник по ДНК-генеалогии), относится к гаплогруппе (субкладу) I2a-Y3120; она охватывает южных, или дунайских, славян по их происхождению. Их потомки в большом количестве сейчас живут на Балканах, а также (в меньших количествах) на Украине, в Белоруссии и России. Их общий предок жил 2200±200 лет назад. Понятно, что совпадение датировок общих предков в примере выше не есть основание считать, что в нашем случае для 131 гаплотипа мы непременно нашли снип I2a-Y3120, это надо специально показывать отдельной идентификацией снипов.
Это – пример из сотен и тысяч, которые демонстрируют, что ДНК-генеалогия – не генетика и не популяционная генетика. Это – отдельная научная дисциплина, со своей методологией, своей постановкой задач, своими выводами, совсем не свойственными генетике. Генетика этим не занимается, у нее свои задачи, своя методология, свой «типаж» получаемых выводов. Генетика обычно занимается вопросами наследственности путем передачи генов от родителей их потомству. Генетика занимается наследственными заболеваниями, а популяционная генетика – как эти наследственные заболевания распространены в той или иной степени по регионам мира. Генетика идентифицирует наследственные заболевания по «поломанным генам» и выявляет эти «поломанные гены» у людей, делая заключения об их предрасположенности к тем заболеваниям или о наличии заболеваний. ДНК-генеалогия ничем этим не занимается. Она вообще не занимается генами.
Другой пример из ДНК-генеалогии, по сути принципиально отличающийся от приведенных выше. У браминов (брахманов) Индии сделали ДНК-тесты, и среди 367 брахманов у 95% выявилась гаплогруппа R1a. Это та самая гаплогруппа, которая есть у половины современных этнических русских. Можно ли сказать, что современные брамины и половина современных этнических русских являются потомками одних и тех же людей, которые в древности жили на Русской равнине? Да, можно. Те общие предки браминов и русских гаплогруппы R1a жили 5200 лет назад и имели гаплогруппу (субклад) R1a-Z645. Это – гаплогруппа, которая получила название древней арийской, потому что она, пройдя миграциями по Русской равнине и далее по степям Средней Азии до Южного Урала, а потом, повернув на юг, прошла в Индостан, как древние арии примерно 3500 лет назад. Сейчас в высших кастах Индии до 72% носителей R1a-Z645, а среди браминов, как видим, таких абсолютное большинство. В то же время среди тех 367 браминов не оказалось ни одного носителя гаплогруппы R1b, которая (гаплогруппа R1b) выявляется примерно у 60% населения Западной и Центральной Европы. Таким образом, носители гаплогруппы R1b ариями не были. В Индии вообще почти нет носителей гаплогруппы R1b, даже несмотря на вековое колониальное владычество там англичан, у которых почти поголовно наблюдается гаплогруппа R1b. Причина проста: англичане с индийцами практически не смешивались. У них порабощенные народы за людей особенно не считались.
Но во избежание недоразумений надо отметить, что 5200 лет назад, когда общие предки современных русских и современных индийцев уже разошлись и образовали отдельные ветви гаплогруппы R1a, в этих ветвях возникли отличающиеся друг от друга мутации: R1a-Z645-Z280 и R1a-Z645-M458 в ветвях будущих русских (будущие восточные и западные славяне, соответственно) и R1a-Z645-Z93 в ветвях будущих индийцев, и не только индийцев, а и тех потомков древних ариев, которые родились во время миграций в Волжском регионе (будущие татары и чуваши гаплогруппы R1a), в Средней Азии (будущие таджики гаплогруппы R1a), на Южном Урале и там, куда арии ушли миграциями на восток, в Алтайский регион и на Енисей (алтайцы и хакасы гаплогруппы R1a, енисейские киргизы, все они и их потомки далее стали скифами гаплогруппы R1a). Так что современные русские гаплогруппы R1a не произошли от индийцев, как и наоборот, это разные ветви гаплогруппы R1a, как и татары, чуваши, таджики, киргизы, узбеки, пуштуны, хакасы, алтайцы, китайцы, монголы гаплогруппы R1a. Хотя далекие предки 5200 лет назад у них были общие.
Могут спросить: как так получилось, что предки общие, а многие киргизы, хакасы, алтайцы, монголы гаплогруппы R1a по своей антропологии монголоиды, а русские, индийцы, таджики, пуштуны той же гаплогруппы – европеоиды. А причина проста: как говорят французы, «ищите женщину».
Дело в том, что гаплогруппа R1a, точнее, мутация, ей соответствующая, передается сыну только по отцовской линии, наряду с генами отца, закодированными в других хромосомах. А другая половина хромосом передается сыну (если говорить о нем) от матери. Поэтому если мать монголоидная по антропологии, то сын почти неизбежно будет хотя бы отчасти монголоидным, и это несмотря на его гаплогруппу R1a. А если и его сын будет от монголоидной женщины, то он, сын, будет уже почти полностью монголоидным. Третье поколение процесс монголоидности завершит. И это при гаплогруппе R1a у отца, дедушки и прадедушки, и сотен предшествующих поколений по отцовской линии. Вот потому скифы были и европеоидными, и монголоидными, как установили при изучении ДНК их захоронений на Алтае. Гаплогруппа скифов была R1a почти во всех случаях, а митохондриальная ДНК, полученная от матери, у половины тех скифов была «европеоидная», а у другой половины – «монголоидная», обычно мтДНК групп A, C, D и G.
Но нас, русских, это мало касается. Мы – не потомки скифов, во всяком случае это показывают все гаплогруппы, обнаруженные у ископаемых костных остатков скифов. До сих пор все они были R1a-Z645-Z93. Как говорилось выше, у этнических русских таких гаплогрупп практически нет. У них в гаплогруппе R1a наблюдаются только R1a-Z645-Z280 и R1a-Z645-M458. Это – две основные славянские ветви (восточные и западные славяне, соответственно), и обе выражены не только у этнических русских, но также у украинцев, белорусов, поляков, литовцев, латышей, чехов, словаков, словенцев, сербов, хорватов, македонцев и других славян. Литовцев и латышей некоторые исследователи к славянам не причисляют, но другие относят их к балто-славянам. Это потому, что их язык классифицируется лингвистами как балтский, или балтийский, но это скорее игра в слова, поскольку сами лингвисты сообщают, что балтские языки мало изучены, что в переводе на обычный, честный язык означает, что они лингвистам не очень интересны, не приоритетны. Как видим, по современным данным, ни один из перечисленных выше народов не произошел от скифов даже в малой части, субклада Z93 у них практически нет. Так что, когда Блок провозглашал – «Да, скифы мы!», он на самом деле этого не знал. Правда, претензий к нему нет, он не был ученым. А хлесткие фразы – любимое дело поэтов.
Кстати, я не случайно писал несколько раз выше «этнические русские». Этот оборот имеет научный смысл. Дело в том, что просто «русским» себя назвать может любой, в виде самоназвания. Например, при Всероссийской переписи населения как себя человек назовет, так и запишут. А как проверить? Да и нет нужды проверять. Но при научных выборках – антропологических, ДНК-генеалогических, социологических, этнологических – это уже имеет значение. Иначе там окажется «сборная солянка». Поэтому, в отличие от простого самоназвания, вводится понятие «этнический русский». Это тот, кто называет себя русским, у которого родной язык русский, который принадлежит русской культуре и чьи предки в нескольких поколениях (обычно принимают, что в трех-четырех поколениях) жили на территории европейской части Российской Федерации. Или даже центральной части Российской Федерации. Потому что за Уралом в основном переселенцы.
Принято считать, что цыгане – выходцы из Индии, хотя сами цыгане в своей части полагают, что вышли из Египта. Но лингвисты пришли к выводу, что место их обитания – Индия в I тысячелетии н.э., а Египет – промежуточный регион их древней миграции. ДНК-генеалогия с легкостью показала, что их основная гаплогруппа H1, которая является одной из самых распространенных в Индии. Гаплотипы тоже типично индийские. Остальные гаплогруппы цыгане приобрели в Восточной Европе, их много, самых разнообразных. Это и западно-славянские, и южно-славянские, что неудивительно, в тех регионах цыган в последнюю тысячу лет было больше всего, особенно в Молдавии, Сербии, Словакии, Хорватии.
ДНК-генеалогия вышла на новый методологический уровень после 2008 года, когда впервые провели ДНК-анализ ископаемых костных остатков, которые нашли в Германии. Обычно (но не только) производят тестирование образцов ДНК, извлеченных из древних зубов. Если они дошли до наших времен в хорошем состоянии, то такой тест технически выполним, и уже их сделано более полутора тысяч. Гаплотипы при таких тестах определяют редко, главным образом потому, что палеогенетики с гаплотипами работать не умеют, в лучшем случае их сводят в короткие таблицы, и на этом «изучение» прекращается. Относительно редко определяют гаплогруппы и поверхностные (как правило) снипы, то есть субклады. Но и их помещают не в основной текст статьи, а в приложения к статье, и тоже не анализируют. В самой статье их обычно и не упоминают. Иначе говоря, это рассматривают как «отчетный материал», без анализа.
Поэтому тогда в дело вступает ДНК-генеалогия, в рамках которой изучают и гаплотипы, и гаплогруппы, и снип-мутации. Как видим, здесь есть аналогия между, например, экспериментальной и теоретической физикой, которые показывают эффективное разделение труда, и не только труда как такового, но разделение соответствующих методологий анализа данных и вида соответствующих выводов. Правда, специалисты в ДНК-генеалогии порой сами занимаются определением гаплотипов, гаплогрупп и снипов в ископаемых образцах, которые им предоставляют партнеры-археологи. Как видим, и здесь есть разделение труда, поскольку никто не требует от ДНК-генеалогии заниматься археологией. Современная наука все больше работает на стыках наук, на которых профессионал «с одной стороны» трудится в партнерстве с профессионалами «с другой стороны», и этим достигается успех в науке, дальнейшее продвижение знания.
Анатолий А. Клёсов (доктор химических наук, профессор)