Дослідження генетики татар Поволжя за допомогою аналізу на IBD-сегменти

Дослідження генетики татар Поволжя за допомогою аналізу на IBD-сегменти

Не секрет, що під етнонімом «татари» в Росії часто ховаються зовсім різні етнічні групи. Існують татари казанські, астраханські, сибірські, кримські і т.д. В даному дослідженні нас цікавлять татари середнього Поволжя - казанці і мишари.

Це досить численний і активно тестується народ, непогано представлений в аутосомних базах 23andMe і FTDNA. У міру зростання статистики прогонів татарських генотипів через калькулятор Вадима Вереніч К27, я почав впадати в деяке замішання. У своїй більшості татари виходили досить близькими один до одного по співвідношенню предкової компонентів Admixture. Однак одночасно існували і відмінності, де було досить складно зрозуміти - не результат чи це просто випадкових відхилень? Поділ між казанськими татарами і мішарей виявлялося швидше як тенденція до дещо більших значень «балто-слов'янських» і «фінських» компонентів у друге, чим як явний сигнал.

Тому при появі у мене нового інструменту - скрипта , Аналізує наявність загальних IBD-сегментів з науковими вибірками, я не забарився пропустити через нього наявні генотипи татар з комерційних вибірок. Відразу ж проявилися відмінності, що дозволило зробити висновок - незважаючи на схожість татар за пропорціями предкової компонентів, їх джерела частково різняться.

Щоб по можливості знизити вплив випадкових відхилень, я постарався виділити усереднення по територіально-етнічних груп. Найбільш впадає в очі ознакою казанських татар виявилася велика кількість загальних сегментів з марійської та чуваської вибірками. Однак це ще не означає, що казанці поділяють більшу частину спільних предків з марійцями або чуваші. Справа в тому, що ці вибірки випробували дуже сильний генний дрейф. В результаті навіть не дуже значне споріднення з ними проявляється досить яскраво. У минулій замітці я назвав це «ефект ашкеназі», по імені найбільш відомого прикладу. Судячи з усього, марійці і чуваші поділяють помітну частину спільних предків, тому і «ефект ашкеназі» у них спільний.

Усереднення за трьома казанським татарам з Апастовского району Татарстану:

Досить типова картина - фонова засвічення по Східній Європі, яскрава пляма у марійців і чувашів і більш бліде - у татарської наукової вибірки. Точний джерело татарської вибірки мені невідомий, але порівняно слабкі показники можуть добре пояснюватися більшою чисельністю і генетичною різноманітністю татар.

Татари з Тархановского району, 5 осіб, виглядають вельми схоже, лише марийско-чуваське пляма менш яскраве:

Татари з Тархановского району, 5 осіб, виглядають вельми схоже, лише марийско-чуваське пляма менш яскраве:

Татари з північно-західної частини Башкирії, чотири людини. У порівнянні з попередніми вибірками, додалося деякий вплив удмуртів і башкирів:

У порівнянні з попередніми вибірками, додалося деякий вплив удмуртів і башкирів:

Наскільки ж велика може бути кількість спільних предків татар з чуваші і марійцями? Спробуємо порівняти Апастовского вибірку, розподілених на трьох чувашам:

Спробуємо порівняти Апастовского вибірку, розподілених на трьох чувашам:

У калькуляторах на базі Admixture у чувашів яскраво проявляється «уральський» компонент, і тут ми добре бачимо його поширення - від саамі до мансі. Рівень перетину з чуваської вибіркою при моїх типових настройках - 115 сМ. Приблизно такий же рівень вийшов у марійців (відміну від чувашів - в більш високому перетині з марійської вибіркою). При цьому у людей з наполовину марійським або чувашским походженням цей показник склав трохи менше 80. У Апастовского вибірки - 67. Можна зробити примірку, що при недавньому Адмікс це відповідало б приблизно 1/3 спільних предків. Однак якщо ці предки жили давно, коли дрейф проявився ще не так сильно, їх частка могла бути вище. Таким чином, оцінкою знизу буде 30%. Провести оцінку зверху допоможе згадуваний «уральський» компонент. При калібрування К27 його зміст у чувашів вийшло рівним 19, усереднення по татарам з Апастовского вибірки - близько 9. Таким чином, навіть якщо все не перетинаються з чуваші предки були з популяцій з нульовим вмістом цього компонента (що малореально), вклад чувашів не міг бути вище 50%. Думаю, що найбільш реалістичним варіантом буде все ж 1/3.

Зрозуміло, існує ще варіант, що чуваші отримали «уральський» компонент вже після поділу з татарами. Тоді кількість спільних предків може бути і набагато більшим. Однак цим варіантом скоріше відповідає якийсь давніший рівень спорідненості, ніж розглянуті тут історичні часи.

Я спробував підрахувати, виходячи з припущення, що «чуваські» компоненти склали 1/3 спадковості татар, на що могли бути схожі решту 2/3 по К27. В одиночному режимі результат виявився несхожим ні на один народ, окрім самих татар. У режимі суміші комбінації теж здалися на перший погляд дуже дивними, проте, як ми пізніше побачимо, сякий-такий сенс в них був:

Using 2 populations approximation:
1 Nogay_D + Russian_Novgorod_D @ 6,174824

Using 3 populations approximation:
1 50% Russian_North_R8 + 25% Kazakh_R2 + 25% Romanian_D @ 3,826868

2 50% Russian_North_R8 + 25% Bulgarian_S14 + 25% Kazakh_R2 @ 4,087314

У мене не знайшлося повноцінної мішарской вибірки з районів за межами Татарстану і Башкирії, тому довелося об'єднати три зразка, отримані схожими і по IBD-картографові, і по предковим компонентів в калькуляторі Вадима Вереніч. Перший відбувається з мішарей Нижегородської області, другий - з пензенських мішарей, третій - з служилихтатар Самарської області.

Перший відбувається з мішарей Нижегородської області, другий - з пензенських мішарей, третій - з служилихтатар Самарської області

Як ми можемо бачити, тут не тільки немає «марійського» плями, але навіть навпаки - на цьому місці показано зменшення кількості загальних сегментів в порівнянні з сусідніми популяціями. Спорідненість з чуваші є, однак, очевидно, йде по іншій лінії предків чувашів, яка не співпадає з предками марійців. Найбільш же сильно виділяються ерзяни. Як і в разі споріднення казанських татар з чуваші, це зовсім не говорить про визначальний внесок ерзян в генетику мішарей. Нижня межа я б оцінив аналогічних попередньому випадку методом приблизно в 20-25%. Що стосується верхнього обмежувача, тут складніше через відсутність специфічного «ерзянської» компонента Admixture. Якщо орієнтуватися на загальний східноєвропейський компонент Balto-Slavic, то він обмежує максимальний рівень приблизно 70-80 відсотками. Цілком можливо, що предками мішарей були самі ерзяни або мокшане, а споріднена їм сусідня популяція - це додатково ускладнює оцінку.

Для порівняння, Ерзянський вибірка, п'ять чоловік:

Мішарі з Дрожжановского району Татарстану, три людини:

Картина схожа з попередньою мішарской вибіркою, однак у марійців вже немає провалу. Можливо, це пов'язано з близькістю до Чувашії, можливо - з впливом казанських татар.

Вибірка мішарей з Башкирії вийшла ближче до казанському варіанту. Це може пояснюватися специфікою саме даної вибірки, або відмінностями між мішарей в цілому. Придумати пояснень можна багато, але думаю, тут немає сенсу в них вдаватися.

Придумати пояснень можна багато, але думаю, тут немає сенсу в них вдаватися

Отже, для кожного з народів (або, при іншому підході, субетносів), ми бачимо на картах один з предкової джерел. Однак спроба вивести залишилися джерела шляхом перерахунку предкової компонентів виявилася малоудачной. Щоб вирішити цю проблему, я спробував візуалізувати різницю з першим джерелом. На карті приведена різниця між першою ( «збірної») мішарской вибіркою і ерзяни, для контрастності помножена на три:

На карті приведена різниця між першою ( «збірної») мішарской вибіркою і ерзяни, для контрастності помножена на три:

Зелені тони показують вибірки, ближчі ерзяни, червоно-бурі - мішарской вибірці. Проміжні варіанти однаково близькі і тим, і іншим. Максимум різниці на користь мішарей досягається з великих вибірок у бурят і тувинців, що дуже добре збігається з недавньою роботою по генетичним слідах тюркської експансії . Трохи відстають від них і башкири з казахами. Цікаво, що кавказькі вибірки, за винятком ногайців і балкарців (наявність в цій компанії вірмен залишається загадкою))), вийшли кілька ближче до Ерзянь, що говорить проти теорії про зв'язок мішарей з Кавказом (або вона якимось чином йде через ерзяноподобную сторону) . Пляма у вепсів, думаю, теж щось означає, оскільки в слабкому вигляді видно у багатьох татар. Однак це може бути і наслідком більш високого рівня дрейфу у вепсів в порівнянні з сусідами.

При побудові аналогічної карти для пари казанці / чуваші в якості базової вибірки я вибрав Апастовского. Башкирські зі зрозумілих причин не можуть бути типовим зразком, а тархановская демонструє тенденцію зсуву до мішарей. До того ж найбільш споріднена чувашам вибірка може виявити відмінності з ними більш показово.

Зелена зона вздовж північної частини Сибіру пояснюється більш високим рівнем спорідненості з цими народами у чувашів, ніж у татар (все той же уральський компонент). Спорідненість з народами степової смуги і можливої ​​тюркської прабатьківщини знаходиться на приблизно одному рівні у «чуваської» і «нечувашской» частини генома казанських татар. Спорідненість ж з вибірками Середньої Азії, Кавказу, Середземномор'я - вище. Ймовірно, середземноморськими ж перетинами пояснюється підвищений рівень загальних сегментів з ашкеназі (не забуваємо, що це число треба ділити в рази через ашкеназі-ефекту). Приблизно такого ж рівня пляма з кримськими татарами виглядає блідіше через невелику площу півострова. Цікаво також перетин з болгарами. Не думав, що їх тюркський компонент проявиться настільки помітно. Втім, можливо, це пояснюється турецькими або татарськими вливаннями, а не стародавніми булгарами. Ну і звертає на себе увагу знайоме пляма у вепсів і естонців.

А тепер згадаємо ще раз розкладку при спробі реконструкції «нечувашской» частини на базі К27:

2 50% Russian_North_R8 + 25% Bulgarian_S14 + 25% Kazakh_R2 @ 4,087314

Неправильно, проте вже не так дивно, як здавалося спочатку.

Не слід думати, що перераховані популяції складають 2/3 спадковості казанських татар (якщо вже 1/3 ми оцінюємо вклад «чуваської» сторони). Більш вірогідним здається варіант, коли помітну частину від цих 2/3 займає якась нейтральна по відношенню до чувашам популяція, у якій рівень IBD сегментів з іншими уральцями і східноєвропейцями був близький до неї. Через нейтральності вона погано виділяється на картах IBD-різниці, однак калькулятори на базі Admixture показують - внесок прибульців з далекого Півдня або Сходу не міг бути визначальним. Можливо, саме на цю популяцію натякають «вепської-естонське» і «південно-російське» плями.

На завершення я хочу привести карту різниці між мішарей і Казанцев:

На завершення я хочу привести карту різниці між мішарей і Казанцев:

З казанської боку ми бачимо знайомі марийско-чуваське і кримсько-татарське плями, а також, злегка несподівано, але не дивно, азербайджанське (з розширенням уздовж Південного Каспію). З мішарской боку знайомі ерзяни, несподівано виділилася територія ВКЛ (якісь вливання звідти в геном мішарей?), І, по зовсім незрозумілої причини, вибірка комі. Спорідненість з азіатськими вибірками йде з деякою перевагою на користь казанців, особливо в «зоні марийско-чуваської впливу».

Аналогічно з приміткою до попередньої карті, не слід забувати - тут показана різниця. Нейтральна спільність може бути велика, але не видна цим методом.

Однак одночасно існували і відмінності, де було досить складно зрозуміти - не результат чи це просто випадкових відхилень?
Кісь вливання звідти в геном мішарей?