72
МЕДИЦИНСКИ УНИВЕРСИТЕТ – СОФИЯ МЕДИЦИНСКИ ФАКУЛТЕТ КАТЕДРА ПО МЕДИЦИНСКА ГЕНЕТИКА ДЕСИСЛАВА ВАЛЕНТИНОВА НЕШЕВА ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА НАСЕЛЕНИЕТО ПО БЪЛГАРСКИТЕ ЗЕМИ А В Т О Р Е Ф Е Р А Т на дисертационен труд за присъждане на образователна и научна степен “ДОКТОР” Област на висше образование: 4.3 „Природни науки, математика и информатика” Професионално направление: „Биологически науки” Докторска програма: „Генетика” НАУЧЕН РЪКОВОДИТЕЛ: ЧЛ. КОР. ПРОФ. Д-Р ДРАГА ТОНЧЕВА, ДБН София, 2016

ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

  • Upload
    others

  • View
    25

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

МЕДИЦИНСКИ УНИВЕРСИТЕТ – СОФИЯ

МЕДИЦИНСКИ ФАКУЛТЕТ

КАТЕДРА ПО МЕДИЦИНСКА ГЕНЕТИКА

ДЕСИСЛАВА ВАЛЕНТИНОВА НЕШЕВА

ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА

НАСЕЛЕНИЕТО ПО БЪЛГАРСКИТЕ ЗЕМИ

А В Т О Р Е Ф Е Р А Т

на дисертационен труд за присъждане на образователна и научна степен

“ДОКТОР”

Област на висше образование: 4.3 „Природни науки, математика и информатика”

Професионално направление: „Биологически науки”

Докторска програма: „Генетика”

НАУЧЕН РЪКОВОДИТЕЛ: ЧЛ. КОР. ПРОФ. Д-Р ДРАГА ТОНЧЕВА, ДБН

София, 2016

Page 2: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

2

Проучването на дисертационният труд е частично финансирано от Фонд „Научни

изследвания” на МОН по научен проект „Характеризиране на антропо-генетичната

идентичност на българския народ”, договор № ДОО 2-110/22 май 2009 и от спонсор

господин Георги Василев, посредством фондацията Транс Медия.

Изследванията са извършени в:

Катедра по Медицинска генетика, Медицински факултт, Медицински университет-София,

лаборатория по Молекулярна антропология и Палеогенетика към Университета във

Флоренция, Италия и в лаборатория на Проген ООД, София.

Докторанта е зачислен за задочна докторантура към Катедра по Медицинска генетика,

Медицински факултт, Медицински университет-София.

Дисертацията съдържа 205 страници и е онаглдена с 87 фигури, 18 таблици и 2 приложения.

Литературните източници са 373, от които 205 са от последните 10 години.

Дисертационният труд е обсъден, одобрен и насочен за защита на заседание на катедрен

съвет н Катедра по Медицинска генетика, Медицински факултет, Медицински университет –

София на 11.03.2016г.

Чл. кор. проф. д-р Драга Иванова Тончева, дм, дбн - Председател на научното жури

Акад. проф. Иван Георгиев Иванов, дбн - Рецензент

Проф. д-р Стоян Ганчев Лалчев, дм – Рецензент

Проф. д-р Върбан Стоянов Ганев, дм, дбн - Становище

Проф. Севдалин Георгиев Ангелов, дбн - Становище

Официалната защита ще се проведе на 29.06.2016г. в сградата на Предклиничен учебен

център (ПУЦ) на МУ-София, на улица „Здраве“ № 2, етаж 2, II аудитория от 11:00 ч.

Page 3: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

3

СЪДЪРЖАНИЕ

Списък на използваните съкращения…………………………………………….……….……...4

I. ВЪВЕДЕНИЕ……………………………………………………………..………………….....5

II. ЦЕЛ И ЗАДАЧИ………………………………………...……..…….......................................6

III. МАТЕРИАЛИ И МЕТОДИ……………………………………..……..………...........7

1. Материали………………………………………………………………..…………………......7

1.1. Подбор на материали…………………………………………...……………….…......7

1.2. Избор на антични некрополи……………………………………..………………..…..9

1.3. Абревиатура на пробите и разпределението им по некрополи…………….……...13

2. Методи…………………………………………………………….…….………………..…....13

2.1. Метод на Gabriel et al. със стратегията за амплификация на“mini-primer set”......13

2.2. Класически метод за анализ………………………………….….……………….......16

2.3. Метод за анализ от ново поколение (NGS)…………….....…..……………............20

IV. РЕЗУЛТАТИ………………………………………………..………………….….…..29

1. Резултати получени при изследване по метода на Gabriel et al със стратегията за

амплификация на“mini-primer set”……………………………………………………….....…..29

2. Резултати получени при изследване по класическият метод……………………………...29

2.1. Изследвани прабългари………………………………………………………….…...30

2.2. Изследвани траки……………………………………………………..…………..….31

3. Резултати от изследвани проби на траки посредством методите

от ново поколение………………………………………………………..………….………......32

3.2. Филтриране на получените секвенции…………………….…………………….....32

3.3. Съставяне на генетични карти…………………………………………..…..............33

3.4. Анализ на пробите за неправилни замени бази и наличие на

нарушения в секвенциите…………………………………………………...……………….....35

3.5. Проверка за наличие на замърсяване…………………………………...……..…....36

3.6. Определяне на хаплогрупната принадлежност на пробите

посредством Haplofind софтуер……………………………………...………...........................37

4. Сравнение на честотата на мтДНК хаплогрупи при прабългари, съвременни българи,

европейски и азиатски популации…………………………………………..….......................39

5. Сравнение на честотата на мтДНК хаплогрупи при траките, съвременни българи,

европейски и азиатски популации………………………………………………………….....42

6. Сравнение на честотата на мтДНК хаплогрупи при прабългари, траки, съвременни

българи, европейски и азиатски популации. Обобщен сравнителен анализ…………..…...45

V. ОБСЪЖДАНЕ………………………………………...………………………….……….…..48

VI. ЗАКЛЮЧЕНИЕ…………………………………………………..............……........62

VII. ИЗВОДИ……………………………………………………………...…………….…63

VIII. ПРИНОСИ………………………………………………………………….…..……..64

IX. ИЗПОЛЗВАНА ЛИТЕРАТУРА……………………………………………….……….......65

Page 4: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

4

Списък на използвани съкращения

Съкращения на кирилица:

ДНК - дезоксирибонуклеинова киселина

мтДНК - митохондриална ДНК

аДНК – антична митохондриална ДНК

Съкращения на латиница:

bp - base pair (базова двойка- б. дв.)

dNTP - deoxyribonucleotide triphosphate (дезоксирибонуклеотид трифосфат)

ddNTP – dideoxyribonucleotide triphosphate (дидезоксирибонуклеотид трифосфат)

EDTA - Ethylene Diamine Tetraacetic Acid (етилендиаминтетраоцетна киселина)

HVS-I– Hypervariable Segment I (първи хипервариабилен сегмент)

HVS II- Hypervariable Segment II (втори хипервариабилен сегмент)

PCA- Principal Component Analysis (анализ на главните компоненти)

PCR - Polymerase Chain Reaction(полимеразна верижна реакция)

rCRS - revised Cambridge Reference Sequence (ревизирана кеймбриджка референтна

последователност)

rpm- revolution per minute (обороти в минута)

SDS- Sodium Dodecyl Sulfate (натриев додецил сулфат)

µl – microliter (микролитра)

ml – mililiter (милилитър)

µm- micromole (микромол)

ng- nanogram (нанограм)

mM- milimolar (милимоларен)

µM- micromolar (микромоларен)

kb- kilobases (килобази)

pH- пе ха (водороден показател)

UV- ultra violet (ултравиолетова светлина)

NGS- Next Generation Sequencing (Секвениране от ново поколение)

Page 5: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

5

I. ВЪВЕДЕНИЕ

Миналото на българите е една от най- дискутираните теми, подбуждаща много въпроси

и теории за произхода и развитието на популациите живели по нашите земи. Не е изяснена

връзката между предците ни и до колко те са оставили следа и до днес.

Развитието на научните направления като палеогенетика и антропогенетика спомогнаха

за изясняване ролята на популациите от миналото посредством изследване на антични

останки от различни периоди. Един от най-ефективните подходи за вникване в миналото е

изследването на определени варианти в антична митохондриална ДНК (аДНК). Това е

възможно благодарение на специфичните характеристики на мтДНК. Еднородителското

унаследяване и липсата на рекомбинация в мтДНКи показват, че разликите в техните

последователности се дължат единствено на последователното натрупване на промени

(мутации) с времето. Изследването на натрупаната по този начин изменчивост на мтДНК

спомага за проследяване на произхода по майчина линия.

Разкриването на миналото, установяването на предците и връзките на популациите

живели по нашите земи, изисква изследване на тяхната генетична структура. Спорният

принос на траките и прабългари във формирането на съвременния българин изисква

директно изследване на материали от костни останки на тези народи.

Известно е, че основната роля в българския етногенезис е приписана на траките,

славяните и прабългарите и изследването е исторически най-релевантно с подходящо

подбрани костни останки датирани от ранно бронзовия и ранно средновековния период.

До момента не е правен антропогенетичен анализ на антични проби от миналото на

България. В много европейски държави е проведен анализ на древното население с цел да

се установи миналото им и генетичното наследство на предците им.

С настоящата работа за първи път се провежда анализ на 160 антични проби, половината

от които са на траки, а другата половина на прабългари. Чрез тяхното изследване ще се

установи приноса на тези народи във формирането на съвременния българин, неговото

генетично наследство и произход. Създава се условие за поглед на историята под друг ъгъл

и интерпретирането й с помощта на способите на генетиката.

Това изследване е първо по рода си в България и ще спомогне за разгадаване на

миналото и определяне на позицията на траки и прабългари в историята ни.

Page 6: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

6

II. ЦЕЛ И ЗАДАЧИ

Цел

Характеризиране и сравнителен анализ на митохондриалните ДНК профили на

популациите по българските земи от тракийския и ранно средновековния период.

Задачи

1. Изолиране на антична митохондриална ДНК от костни останки от различни

райони на страната, датирани от тракийския и ранно средновековния период.

2. Определяне последователността на хипервариабилен сегмент I (HVS I) в антична

митохондриална ДНК чрез класически методи за анализ и секвениране

3. Характеризиране на цялостна митохондриална ДНК на антични проби от

тракийския период посредством секвениране от ново поколение (NGS – платформа)

4. Определяне и сравняване състава на мтДНК хаплогрупи на тракийското и

прабългарското население

5. Интерпретиране на генетичните профили в исторически аспект

6. Обогатяване на базата данни с уникален генетичен материал от антични проби

Page 7: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

7

III. МАТЕРИАЛИ И МЕТОДИ

1. Материали

1.1. Подбор на материали

След продължителен анализ и подбор се установиха най- подходящите проби в

миналото. Според експертното мнение на антрополози и историци се избраха двата големи

периода в миналото, които са най- подходящи за целите на изследването. Основната роля в

българския етногенезис е предписана на траките, славяните и прабългарите, поради този

факт изследването се провежда върху костни останки, които датират от тракийския и ранно

средновековния период. Траките са племена, които се установяват по Българските земи,

създават цивилизация и техният разцвет е през III хилядолетие Пр.Хр. Най- значимият

период за изследване на прабългарите е VIII – X век, разцвета на Дунавска България.

Популацията на Дунавска България се състои предимно от прабългарски и славянски

племена, които окупират области, населени още в древността от траките. Прабългарите са

практикували типични погребални традиции основно с инхумация. Траките във вековете са

имали различни традиции като трупополагане и кремиране, докато славяните изцяло са

практикували кремирането. Поради този факт останки от славяни не могат да бъдат

изследвани. От изгоряла материя е невъзможно изолиране на ДНК. Само добре запазени,

непокътнати материали могат да се използват за анализ [Йорданов, et al., 2010; Рашев,

2008]. Най-подходящите материали за анализ са костите и зъби. Древни ДНКи се запазват

сравнително непокътнати и в по-добро състояние предимно в зъбната пулпа и бедрената

кост [Shriver, et al., 2004].

Изследването на пробите се провежда върху митохондриалната ДНК. Тя е подходящ

обект за изследване, защото се предава единствено по майчина линия на нейното

потомството. Друго предимство на мтДНК, което я прави подходящ обект за анализ е, че не

е включена в рекомбинационни процеси и вариантите й се дължат единствено на мутации.

Освен това притежава висок процент на мутации, което позволява последователно

натрупване на неутрални мутации - специфични базови замени, особено транзиции, които

са възникнали приблизително по едно и също време, когато хората са обитавали различни

региони по целия свят. Тези мутации се съхраняват непроменени и се предават в много

поколения. Те разделят човешките популации на клади (хора с най-скорошен общ

прародител с всички негови потомствени клонове) и формират групи от стабилни

хаплотипове. Хаплотиповете обикновено са споделени между популациите, но тяхната

честота може да се различава значително. Хаплотиповете се обединяват в Хаплогрупи.

Page 8: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

8

Хаплогрупите на мтДНК са специфични, регионално ориентирани и се използват, за да се

разграничат генетично популациите [Anderson, et al., 1981; Pakendorf, et al., 2005].

Класическите методи за филогенетични изследвания анализират основно Контролният

район (displacement loop (D – loop)), играещ основна роля в репликацията и

транскрипцията. Той притежава най- полиморфната последователност в мтДНК –

хипервариабилните сегменти I и II (HVSI и HVSII). Те са обект на много проучвания и

изследвания на корените на населението и човешката еволюция [Horai, et al., 1995; Tully, et

al., 2000]. Последователността HVS I е достатъчно информативен и най-често използван за

проследяване на произхода на човека, защото повечето мтДНК варианти принадлежат към

този регион. Данните от мтДНК варианти се използват за създаване на родословни дървета,

които съдържат информация за реда на еволюционните процеси във времето и

пространството. Методите за анализ на NGS- платформа изследват цялостна мтДНК, която

е достатъчно информативна.

С оглед спазването на критериите за датировка и произход на пробите костните останки,

от които ще се взимат костни проби за изолиране на антична митохондриална ДНК, се

предоставят от Националния антропологичен музей към Институт по Експериментална

морфология, патология и антропология с музей към Българската Академия на Науките

(ИЕМПАМ- БАН). Тези останки са открити в некрополи намиращи се в различни райони на

страната и са археологически и антропологично проучени.

Материалите за изследване на мтДНК от древните популации живели по Българските

земи са корени на дъвкателни зъби (молари) и фрагменти от бедрена кост (фемур). Пробите

са подбрани и взети на два етапа. При първият етап са взети 30 различни проби, а при

вторият етап са подбрани 130 различни проби ( 60 от пробите са от Бронзовата епоха и 70

проби от Ранното Средновековие). Всяка проба има по 2-3 зъба, 1-2 фрагмента от кости или

комбинация от зъби и фрагменти. Допълнителният материал за всяка проба е с цел

повторен анализ при необходимост. На фигура 1 са показани част от останките взети от

различни некрополи в България.

Page 9: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

9

Фигура 1. Част от зъбите и костите подбрани от различните некрополи в България (снимки

Николай Тюфекчиев)

1.2. Избор на антични некрополи

С оглед спазването на критериите за датировка и произход на пробите, костните останки

са подбрани от следните некрополи: Габрова могила, Шекерджа могила, Берекетска могила,

Манастира на Мостич, Ножарево, Туховище и Трошево. На фигура 2 е представена

географска карта на България с отбелязаните некрополи.

Фигура 2. Карта на съвременна България с разположение на отделните некрополи

(адаптирана от оригинална карта http://bci-moscow.ru/bg/bulgaria/maps/)

Page 10: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

10

1.2.1. Некрополи на траките

1.2.1.1. Шекерджа могила

Шекерджа могила е разположена в близост до село Камен на 1 километър на север в

Сливенска област, Източно - Централна България. Могилата е с диаметър 45 метра и

височина 5 метра (Фигура 3) [Toneva, et al., 2012; Димитрова, 2012; Димитрова, 2011].

Фигура 3. Шекерджа могила. Скелетни останки в поза „Хокер“ и керамични съдове

(източник http://www.chudesa.net/)

1.2.1.2. Габрова могила

Габрова могила е разположена в близост до Шекерджа могила, до северните къщи на

село Камен, Сливенска област, Източно- Централна България. Габрова могила е с диаметър

32 метра и височина 2,60 метра [Toneva, et al., 2012; Димитрова, 2012; Димитрова, 2011].

1.2.1.3. Берекетска могила

Берекетска могила е най-големият праисторически некропол в България, достигаща

височина 17,5 м и диаметър при основата 250 м (Фигура 4) [Турлаков, 2013-2016].

Фигура 4. Берекетска могила. Изглед от могилата, погребения и открити съдове.

(източник http://www.museum.starazagora.net/)

Page 11: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

11

1.2.2. Прабългарски некрополи

1.2.2.1. Манастир на чъргубиля Мостич

„Манастирът на чъргубиля Мостич” е разположен в източната част на Външния град на

Велики Преслав, Шуменски регион, Североизточна България. (Фигура 5)

[Попконстантинов, et al., 2011; Попконстантинов, et al., 2012; Попконстантинов, et al., 2013;

Попконстантинов, et al., 2013].

Фигура 5. Скелет на ичиргу боилът Мостич и негов надпис в Манастира на Мостич

(източник [Йорданов, 2000])

1.2.2.2. Ножарево

Ранносредновековният некропол Ножарево от село Ножарево, Силистренска област,

Североизточна България и е езически и биритуален (двуобредни с изгаряне и

трупополагане). [Йорданов, et al., 2010; Рашев, et al., 1986; Рашев, et al., 1987; Рашев, et al.,

1988; Рашев, et al., 1989].

1.2.2.3. Туховище

Некрополът Туховище е разположен в областта Чеч, в близост до югозападната част на

Родопския масив, община Сатовча. Датиран е от IX- X век (Фигура 6) [Серафимова, 1981].

Page 12: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

12

Фигура 6. Некропол Туховище. 1) Гроб на мъртвец с ампутирано ляво ходило; 2)

Жертвен съд; 3) Луновидни обици с висулка (източник https://bg.wikipedia.org/).

1.2.2.4. Трошево

Некропол Трошево е разположен в Източна България, Варненски регион. Установени са

783 гроба от средновековният период IX-X век. Погребенията са с трупополагане и

характерен погребален инвентар (Фигура 7).

Фигура 7. Костни останки от обект Трошево – череп на мъж с определена морфология и

ремъчен накрайник с релефно изображение на грифон от бронз ([Йорданов, 2000], източник

http://archaeo.museumvarna.com/bg/)

След подбор на костните останки, от тях се взима материал – фрагменти от фемур или

кътници (за предпочитане), означени със съответният код. В голяма част от материалите се

изолира антична ДНК с относително ниска концентрация, обикновено деградирала и

контаминирана. Тя изисква множество стъпки на обработка и проверка. За тази цел са

приложени три различни метода за установяване на най- подходящия за работа с античен

материал.

Page 13: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

13

1.3. Абревиатура на пробите и разпределението им по некрополи

Всяка една проба е уникална и принадлежи на определен индивид (скелет). В анализа

няма повторение на проби от един индивид. Всеки един индивид (скелет) има собствен

номер. Откритите индивиди (скелети) от един некропол имат поредни номера в зависимост

от реда на откриването им и разположение в некропола. Обозначението ММ отговаря на

Манастир на Мостич, NJ e за Ножарево, TUH е за Туховище, SM е за Шекерджа Могила,

GM е Габрова Могила и BM е за Берекетска Могила.

2. Методи

Приложени са три различни метода за получаване на аДНК от античен костен материал.

Първия метод е проведен в България върху 30 проби от Ранносредновековния период.

Втория метод е проведен в Лаборатория по Молекулярна Антропология и Палеогенетика

към Университета във Флоренция, Италия върху 62 проби от Ранносредновековния период

(VIII – X век). Третия метод е проведен в Лаборатория по Молекулярна Антропология и

Палеогенетика към Университета във Флоренция, Италия върху 44 проби от периода на

траките (III хилядолетие Пр. Хр.)

2.1. Метод на Gabriel et al. със стратегията за амплификация на“mini-primer set”.

Изследването върху античните мтДНКи е разработен и подобрен от ДНК лабораторията

на американската армия (AFDIL) с цел приложение в криминалистиката [Gabriel, et al.,

2001]. Екипа ни приложи модифицииран вариант на метода за изследване на

митохондриална ДНК от костни останки на древни българи.

2.1.1. Обработка на античния материал и изолиране на ДНК

Взетия костен материал се обработва с цел почистване и отстраняване на замърсявания и

се разпрашава с помощта на ампули с течен азот в криогенна мелница От костния прах се

екстрахира мтДНК по протокола на AFDIL.

2.1.2. Амплификация на митохондриална ДНК

Изпробвани са три различни набора от реактиви за амплификация на митохондриалната

ДНК. Подбра се най- подходящият протокол. С Ampli Taq Gold кит се осъществява

амплификация на апарат GeneAmp 9700 (Applied Biosystems)

Page 14: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

14

За целите на анализа бяха подбрани осем двойки праймера, които покриват двата

хипервариабилни сегмента (HVSI и HVSII), по 4 за всеки хипервриабилен район (Фигура

8). Всяка двойка праймери има специфична температура на хибридизация.

Фигура 8. Хипервариабилни сегменти (райони) I и II –фрагменти и дължина (графика

[Gabriel, et al., 2001]

2.1.3. Гел- електрофореза

Всеки амплификат се натоварва на 2% агарозен гел с EtBr (Етидиев Бромид) и се

селектират получени фрагменти с подходяща дължина ( между 200 – 300 б. дв.) (Фигура 9)

Фигура 9. Гел- електрофореза показваща наличие на продукти от амплификация с

подходящ размер.

2.1.4. Пречистване чрез използване на две ензимни реакции Exo - SAP

Page 15: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

15

Пробите, които имат амплификация на фрагменти от антична мтДНК се пречистват с

ензими Exo I и SAP.

2.1.5. Секвенционна реакция и софтуерен анализ

Секвенционните реакции се извършват с използването на BigDye Terminator v3.1 Cycle

Sequencing Kit, съгласно протокола на производителя. Продукти се пречистват чрез

етанолна преципитация в присъствие на 3М натриев ацетат. Секвенирането се извършва с

автоматичен ДНК секвенатор ABI 310 Genetic Analyzer по стандартен протокол с РОР6

полимер и 47см капиляра.

Получените секвенции се обработват софтуерно и се сравняват с ревизираната

референтната Кеймбриджка секвенция (rCRS). След протичане на секвенирането,

генерираните данни се обработват с два софтуера на Applied Biosystems - Data collection

software и Sequence Analyses software (Фигура 10).

Фигура 10. Електроферограма на проба

Освен графиката се генерира и файл с нуклеотидната последователност на фрагмента

(пробата) (Фигура 11).

Фигура 11. Нуклеотидна последователност на проба.

Page 16: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

16

2.2. Класически метод за анализ

Клсическият метод на анализ се прилага при антични проби, изследвайки HVS I на

мтДНК, поради достатъчната информативност. Проведен е върху 62 прабългарски и

тракийски проби в Лаборатория по Молекулярна Антропология и Палеогенетика към

Университета във Флоренция, Италия.

2.2.1. Почистване и разпрашаване на пробите и екстракция на ДНК

Предварителна подготовка на материалите чрез почистане на повърхностите и облъчване

с UV. С помощта на дрила се осъществява разпрашаването на пробите. От костният и

зъбният материал се разпрашава около 150-250 мг. (милиграма).

Екстракцията на аДНК се осъществява по стандартен протокол с екстракционен буфер,

фиксиране с Binding buffer (BB) и промивка Washing buffer (WB). Подготвя се и една

отрицателна контрола (К1), която съдържа единствено реактиви от всяка стъпка, но не и

проба. Използва се като допълнителна проверка за наличие на замърсяване на пробите по

време на работа.

2.2.2. Проверка за инхибиране

Изолираните ДНКи се тестват за наличие на инхибиране посредством реакция на

амплификация и последваща гел- електрофореза за визуализация. Ако липсва инхибиране в

пробите, се наблюдават бендовете, които трябва да са с добър интензитет на светене, да са

изминали определен път в гела и да са изравнени.

2.2.3. Амплификация на пробите

Пробите се амплифицират с три различни двойки праймери, като при всяка

амплификация се слага и отрицателна контрола за проверка наличие на контаминация.

Получените фрагменти се пускат на 3% гел- електрофореза, а пробите с подходяща

дължина 200 – 300 б дв се изрязват от гела (Фигура 12).

Page 17: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

17

Фигура 12. Гел- електрофореза на фрагменти от мтДНК

2.2.4. Клониране

Клонирането протича в няколко стъпки с прибавяне на поли А опашката към краищата

на фрагментите, вкарването на фрагментите във вектори и трансформация в компетентни

клетки Escherichia coli (Фигура 13).

Фигура 13. Трансформация на компетентни клетки E. coli с вектор съдържащ фрагмент

от мтДНК

Трансформираните клетки се посяват върху хранителна среда с Ампицилин и в

последствие поставен X-GAL. Ампицилинът и X-GAL са индикатори за успешно проведено

клониране (Фигура 14).

За всеки фрагмент на проба има по 2 петрита. От всеки фрагмент се събират по 21

колонии или общо по 63 колонии за проба.

Page 18: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

18

Фигура 14. Колонии от E. coli с вкаран вектор носещи фрагменти на пробите

2.2.5. Амплификация на продуктите от клониране

От 63 колонии за всяка проба се взимат по 39 колонии, които се подлагат на

амплификация и тестване на гел- електрофореза. Подбират се по 8 клона за фрагмент, които

са най- подходящи и те ще бъдат подготвени за секвениране (24 клона на проба).

2.2.6. Пречистване

Пречистване на клоновете става с помощта на колонки със Сефароза.

2.2.7. Секвениране

Реакцията на секвениране става с Big Dye terminator kit След реакцията пробите се

накапват в 96 ямкова плака и се пускат на автоматичен секвенатор ABI 3100 Genetic

Analyzer (Applied Biosystems).

2.2.8. Софтуерен анализ на резултатите от секвениране

Секвенатора генерира файл за всеки клон, който се отваря с програмата FINCH. С тази

програма се визуализира последователността на всеки клон (Фигура 15).

Page 19: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

19

Фигура 15. Софтуерна обработка на резултатите от секвениране и визуализация на

нуклеотидните последователности на всеки клон на отделен фрагмент от проба.

Клоновете за даден фрагмент се отварят с програмата Clustal, изравняват се помежду си

и с последователността на rCRS за даденият фрагмент, след което файловете се отварят с

програмата DAMBE и се конвертират в текстов формат. Текстовият файл се отваря с

програмата Text Pad с цел да се анализират последователностите на всеки клон за даден

фрагмент, да се сравнят помежду си и с последователността на rCRS за даденият фрагмент

(Фигура 16).

Фигура 16. Нуклеотидната последователност на клонове на фрагмент и сравнение с

последователността на rCRS за дадения фрагмент и позициите в мтДНК геном.

Консенсусната секвенция представлява обобщена последователност за даден фрагмент

най- близка до rCRS отчитаща наличните промени в нуклеотидите.

Page 20: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

20

Фигура 17. Обобщена графика на Класическия метод

На фигура 17 са представени графично стъпките на Класическият метод за анализ и

секвениране.

2.3. Метод за анализ от ново поколение (NGS)

2.3.1. Почистване, разпрашаване на пробите и екстракция на ДНК

Обработката на материалите, почистването, разпрашаването и изолирането на ДНК става

на принципа на класическия метод (точка 2.2.1.).

2.3.2. Създаване на библиотеки

Освен подбора на проби в образуването на библиотеки се включва К1 и една нова

отрицателна контрола К2 за библиотеките.

Изолираната ДНК е накъсана, деградирала и фрагментирана и е необходимо да се

поправят „тъпите краища“. Пречистване на пробите се осъществява с Min Elute колонки.

Следваща стъпка е лигиране на адаптори и пречистване с Min Elute колонки. Необходиа

стъпка е запълване на празнините при адапторите (Фигура 18).

Page 21: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

21

Фигура 18. Етапи на създаване на библиотеки, прибавяне на индекси и секвениране

2.3.3. Количествен PCR/ PCR в реално време / (qPCR/rtPCR)

Определянето на качеството и количеството на библиотеките става чрез полимеразна

верижна реакция в реално време. Всяка от пробите (библиотеките) се разреждат десет пъти

включително и контролите (К1 и К2). Полимеразната верижна реакция в реално време

протича на апарат Bio Rad с програма SSo Fast Ever Green con melting curve в 40 цикъла

(Фигура 19).

Фигура 19. Резултати от количествен PCR. Std – стандарти (отА1 до B6) Unk- проби (от

C1 до H6)

Page 22: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

22

2.3.4. Индексиране и пречистване

Прибавяне на индекси към всяка библиотека спомага за отдиференцииране на пробите в

крайната стъпка на секвениране. Индексите се разпознават и от праймерите при

амплификация. Праймерите на qPCR - IS5 и IS6 също разпознават и се свързват към

различните индекси. След индексирането, пробите се пречистват с помощта на Min Elute

колонки.

2.3.5. Количествен PCR (qPCR), амплификация на пробите и пречистване

Количественият PCR се провежда с цел контрол качеството на пробите и определяне на

тяхната концентрация. С резултатите от реакцията се определя броя на циклите за

амплификация на мтДНК библиотеки до достигане на концентрация ≤ 1013

. От всяка проба

се взимат по две до четири аликвоти, а циклите варират, но обикновено са между 20 – 25.

Пречистването се осъществява с Min Elute колонки.

2.3.6. Определяне на качеството и количеството на ДНК след амплификация на

продуктите от индексиране посредством Agilent микрочипове

Получените продукти от амплификацията се пускат на микрочипове с цел определяне

дължината на ДНК и концентрацията й. Получават се пикове при сканирането, които

отчитат дължината на фрагментите. Обикновено след индексиране и амплификация

античните проби дават един пик в границите 150- 400 б. дв (Фигура 20).

Фигура 20. Графика на амплифиирана проба след индексиране. 1) Представяне на

границата 150 б. дв. до 400 б.дв. на дължината на библиотеките, които носят античните

ДНКи. 2) Обозначаването на началния и крайния маркер с техните размери (границите на

протеклият анализ) и пика на пробата с нейният размер.

Page 23: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

23

Фигура 21. Графика на две негативни контроли

На фигура 21 са представени две негативни контроли (К1 и К2) от обработката на проби от

един сет. И двете не съдържат пикове, което показва, че са чисти.

2.3.7. Един цикъл на амплификация , пречистване и тестване с Agilent микрочипове

Провеждането на един цикъл на амплификация се прави с цел отстраняване на

хетеродуплексите. Реакцията протича по стандартен протокол и без разделяне на пробите

на аликвоти. Пречистването се осъществява с Min Elute колонки. Пробите се тестват на

микрочипове за определяне на количеството, дължината и качеството им. Проверката на

пробите след 1 цикъл на амплификация се осъществява чрез Agilent микрочипове (Фигура

22).

Фигура 22. Проба след един цикъл на амплификация

2.3.8. Залавяне на библиотеките (Capture) за микрочастици – магнитни носители

(Beads) и пречистване

След достигане на подходящите концентрации се прилага метода на отсяване на

античните ДНК библиотеки чрез улавянето им върху магнитни носители. Сондите, които се

Page 24: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

24

използват обикновено са две инкорпорирани в единият край с биотин. В процеса на работа

библиотеките, които ще се изследват се смесват по 2 до 4 библиотеки. В стъпката се

включват и 3 контроли. Към магнитните носители се прибавят разтворите на сондите, след

което се прибавят библиотеките. (Фигура 23).

Фигура 23. Процес на свързване на сондите с библиотеките

Отделяне на библиотеките от сондите става посредством NaOH и буфер PBI съдържащ рН

индикатор, който при рН 8 е жълт на цвят. При прибавяне на NaOH цвета се променя,

ставайки лилав и се неутрализира с оцетната киселина (Фигура 24).

2.3.9. Пречистване

Пречистването на пробите в разтвора с PBI става с Min Elute колонки и PE буфер.

Елюиране на ДНК с ТЕТ буфер и се съхранява за следваща стъпка на -200С.

Фигура 24. Отделяне на библиотеките от сондите

Page 25: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

25

2.3.10. Количествен PCR, амплификация и пречистване

Определяне концентрацията, размера и циклите на амплификация за достигане на

желана концетрация се осъществява чрез qPCR. За целта пробите се разреждат.

Необходимо е намножаване на пробите средно в 23-25 цикли. Амплификацията е по

стандартен протокол. Всяка проба се разделя на 2 аликвоти. Пречистването е задължителна

стъпка и се осъществява с Min Elute колонки. ДНКите се елюират с ТЕТ буфер.

2.3.11. Agilent микрочипове за определяне на качеството и количеството на ДНК след

амплификация на продуктите от стъпката със залавянето на библиотеките.

Дължината на пробите, която е релевантна и отговаря на античните ДНК фрагменти е от

150 б дв. до 250 б. дв. По- дългите фрагменти над 250 б. дв. свидетелстват за наличие на

хетеродуплекси или на замърсяване. При наличие на хетеродуплексите се прави един цикъл

на амплификация, а ако вторият пик с по- голяма дължина на продуктите не се отстрани,

това е доказателство за наличие на контаминирана ДНК (Фигура 25).

Фигура 25. Проба след амплификация на стъпката от залавяне на библиотеките

2.3.12. Един цикъл на амплификация и пречистване

Амплификацията се осъществява по стандартен протокол, без разделяне на пробите на

аликвоти. Пречистването се провежда по стандартен протокол с Min Elute колонки.

2.3.13. Определяне на качеството и количеството на проби след 1 цикъл на

амплификация

Page 26: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

26

Получените резултати се пускат на Agilent микрочипове, за да се проследи вторият пик и

ако още съществува, се дължи на хетеродуплекси или е резултат на контаминация (Фигура

26).

Фигура 26. Проба след протичане на един цикъл на амплификация

2.3.14. Количествен PCR

Количественият PCR е чувствителен метод за точно определяне на концентрацията на

пробите и спомага за подготовката им за секвениране. Всяка проба се разрежда

предварително 1000 и 10 000 пъти. Тези две разредки се пускат на qPCR за определяне на

концентрацията на пробите.

2.3.15. Подобряване на методологията

В част от случаите се наблюдават контаминации. С цел подобряване на методологията и

възможност за използване на тези проби, а не изключването им от анализа. Промених

частично протокола за проби, които имаха контаминация прибавяйки няколко стъпки, за да

отстраня механично замърсяването и да съхраня античната ДНК. Приложих тези промени

на две групи проби от различни стадии на обработка.

Първата група проби са от стадии амплификация от стъпката с прибавяне на индекси, а

втората група са от стадия амплификация след улавяне на библиотеките върху

микрочастици магнитни носители.

Page 27: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

27

След протичане на електрофореза всяка една проба се разглежда поотделно и от

получените бендове се изрязват със специални типове само тези бендове, които са с размер

150 б. дв. до 250 б.дв. Пречистват се и концентрират с Min Elute колонки. Проверка на

резултатите от изрязването на късите фрагменти ДНК от гела става с помощта на Agilent

микрочипове. Проследява се качеството и размера на фрагментите. Установява се, че добри

резултати се наблюдават при втората група от проби, а при първата се наблюдава

деградация на голямо количество ДНК и е необходимо да се направят допълнително

изследвания, за да се провери на какво се дължи тази деградация. Поради ниската

концентрация на пробите те се намножават по стандартният протокол в рамките на 23- 25

цикъла и се тестват на количествен PCR, разреждайки се 100 пъти. След анализиране на

резултатите се установи, че е необходимо голямо разреждане и тестване отново на

количествен PCR. След втория анализ се установи, че 3 проби са с много добри резултати и

концентрацията им е доста висока (1011

– 1012

). Необходими са допълнително тестове и

оптимизиране на протокола, за да се създадат най- подходящите условия и тази стъпка да се

използва за получаване на 100% антични проби в случаи на установено замърсяване.

2.3.16. Секвениране

Секвенирането се провежда на Illumina MiSeq платформа. Протича приблизително 20

часа. Продуцират се данни в размер 3,3-3,5 Gb. Генерират се разчетени фрагменти от 75 б.

дв. и за двете вериги на ДНК молекулите. Извършва се разграничаване на отделните

прочетени последователности в пула чрез индексите, които са индивидуални за всяка

секвенция. Генерират се 2 файла за правите и обратните последователности на пробите.

2.3.17. Софтуерен анализ на резултатите от секвенирането

2.3.17.1. Обработка на секвенциите

Програмата FASTQC съдържа различни модули, които позволяват обработката на

разчетените последователности, установяване на техните дължини, качеството на всяка

база, наличие на GC и N (неидентифицирани бази).

2.3.17.2. Съставяне на генетични карти чрез MIA (Mapping Iterative Assembler)

Всички слети и филтрирани за качество секвенции се анализират с MIA асемблера, който

е съставен от последователна серия от скриптове. Съществува специфична матрица, която

се изравнява и отчита локализацията на химическите повреди на античната ДНК. Тази

Page 28: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

28

програма изравнява ДНК секвенциите от фрагментите с референтна последователност и

води до създаване на консенсусна секвенция. При античните мтДНКи първата референтна

секвенция е rCRS. Изчисляват се някои статистически параметри – средни стойности на

покритие на мтДНК геном, средната дължина на фрагментите, фактор определящ клъстера

и усредняване колко пъти уникалните секвенции покриват всяка единична мтДНК.

2.3.17.3. Модел на неправилните замени

Софтуера, който се използва е Map Damage. Изчисляват се стойностите на модела на

неправилното инкорпориране, разкриващо разпределението на замените в краищата на

фрагментите, определяйки процента на присъствие на тези нарушения в картираните

анализирани последователности. Тези нарушения са типични за античните проби и са

малко или отсъстват при съвременните проби. Оптимизирането на разчетените

последователности след обединяване и филтриране по качество се изравняват с rCRS с

помощта на програма BWA.

2.3.17.4. Изчисляване замърсяване на пробите

С цел оценка автентичността на античните мтДНКи от значение е да се определи дали

дадена ДНК последователност е от единичен биологичен източник. Софтуерът Contamix се

използва за изчисляване на вероятността дали дадена ДНК принадлежи на един индивид.

2.3.17.5. Определяне на хаплогрупи

Алгоритъма Haplofind е способен да класифицира цялостна мтДНК последователност

според хаплогрупната номенклатура.

Page 29: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

29

IV. РЕЗУЛТАТИ

1. Резултати получени при изследване по метода на Gabriel et al със стратегията за

амплификация на“mini-primer set”.

При анализа на 30 прабългарски проби с метода на Gabriel et al се изследваха HVSI и

HVSII. От изследваните костни материали при 7 от тях се получават секвенционни данни за

хипервариабилен сегмент I, но не и за хипервариабилен сегмент II. При останалите 23

проби не се получават секвенции. Резултатите от секвенирането се сравниха с ревизираната

референтната Кеймбриджка секвенция. При 2 от пробите се наблюдават полиморфизми, а

при останалите 5 не се нблюдават отклонения в последователността. На таблица 1 са

посочени размерите, установените хаплотипове и хаплогрупи на пробите.

Таблица 1. Хаплогрупи на проби изследвани по метода на Gabriel et al

ПРОБА РАЗМЕР ХАПЛОГРУПА ХАПЛОТИП

NJ127 16046-16237 H2a2a1 16126h

NJ65 16043-16237 H7f 16168T 16195h

NJ169 16043-16158;

16139-16237

H CRS

NJ42 16017-16126;

16161-16237

H CRS

NJ43 16046-16158;

1614 -16237

H CRS

NJ138 16017-16158;

16142-16237

H CRS

NJ200 16017-16158;

16167-16237

H CRS

Проба NJ65 достига качество 100% с полиморфизъм в позиция 16168 (транзиция C→T) и

хетероплазмия (в пробите наличие на нормална секвенция и такава с полиморфизъм) в

позиция 16195 (Т>А). Проба NJ127 е с хетероплазмия в позиция 16126 (Т≥С) и качество

около 50%. Останалите проби не се отличават с отклонения в нуклеотидната

последователност базирайки се на сравнението с rCRS.

2. Резултати получени при изследване по класическия метод

Върху 62 проби се приложи класическият метод на анализ със Сангер секвениране и

установяване на полиморфизми в хипервариабилен сегмент I. От тези проби 27 (20 са на

прабългари и 7 са на траки) дадоха резултат. От останалите 26 има частични резултати,

Page 30: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

30

които не са достатъчни за определяне на хаплогрупна принадлежност, а 9 нямат получени

секвенции.

2.1. Изследвани прабългари

Получените резултати от Сангер секвенирането на 20 проби от останки на древни

българи се сравняват с ревизираната референтната Кеймбриджка секвенция В резултат на

сравнението се установяват 17 различни хаплотипа, които определят 16 различни

хаплогрупи. Четири проби не показаха отклонение от референтната последователност

(NJ125, TUH474, TUH1649 и TUH2327). Пробите MM1.2, MM1.3 и MM1.4 принадлежащи

от един некропол показват различни хаплотипове, което доказва, че нямат и родствена

връзка. ММ1.2 притежава 3 транзиции C→T в позиции 16142, 16266 и 16278 и една

транзиция Т→С в позиция 16092. ММ1.3 притежава транзиция A→G в позиция 16343, а

ММ1.4 две транзиции – едната C→T в позиция 16069, а другата Т→С в16126. Следваща

група от проби принадлежащи към един некропол дават също различни хаплотипове.

Пробата NJ28 има транзиция C→T в позиция 16223; NJ48 е с замяна C→T в 16179 и

транзиция Т→С в 16356.; NJ50 притежава три транзиции C→T в позиции 16111, 16173 и

16278, както и една трансверсия А→Т в 16183; NJ54 притежава няколко транзиции – три от

вида C→T в позиции 16069, 16222 и 16261, две Т→С в 16126 и 16172 и една G→A в 16145;

NJ77 е с две транзиции C→T в 16055 и 15067; NJ84 притежава две транзиции C→T в

позиции 16294 и 16296, една Т→С в 16126 и една G→A в 16274; NJ108 има една транзиция

Т→С в 16325, а NJ126 транзиция Т→С в 16126. Други 5 проби от един некропол

притежават следните полиморфизми – TUH448 е с две транзиции C→T в позиции 16148 и

16256; TUH449 е с една транзиция Т→С в 16304; TUH1644 има две транзиции Т→С в

16126 и 16325 и две хетероплазмии Т≥С в позиции 16189 и 16193; TUH1652 е с Т→С в

16126 и C→T в 16294, а TUH1665 има замяна A→G в 16219 и Т→С в 16325. По отношение

на качеството на пробите дадено в проценти, преобладаващо е 100%, изключение правят

някои проби. Най- ниско е 60% при ММ1.2, следва 70% при TUH1665, по- високи проценти

са при TUH1644 с 85%, 91% при NJ84 и 95% е при NJ50. В таблица 2 са обединени всички

проби показвайки размера на секвенираният участък, наблюдаваните полиморфизми по

позиции, процента на качество на пробата и определените хаплогрупи.

От получените резултати за 27 проби по двата метода, 19 са надхвърлили граничната

стойност за качество на пробите (80%) и те се подлагат в последващият анализ.

Page 31: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

31

Таблица 2. Резултати от изследвани прабългарски проби по класическият метод

Проби Размер Хаплогр.

Качество на

пробата (%) Хаплотип

1 MM1.2 16024-16383 H1t1a1 60% 16092C 16142T 16266T 16278T

2 MM1.3 16225-16383 U3 100% 16343G

3 MM1.4 16024-16281 J 100% 16069T 16126C

4 NJ28 16024-16281 U4a2b 100% 16223T

5 NJ48 16024-16386 U4c1 100% 16179T 16356C

6 NJ50 16024-16383 H1 95% 16111T 16173T 16183T 16278T

7 NJ54 16024-16383 J1b1a1 100%

16069T 16126C 16145A 16172C 16222T

16261T

8 NJ77 16024-16383 HV1 100% 16055T 16067T

9 NJ84 16024-16383 T2 91% 16126C 16274A 16294T 16296T

10 NJ108 16225-16383 H1an2 100% 16325C

11 NJ125 16024-16281 H 100% CRS

12 NJ126 16083-16281 H14b1 100% 16126C

13 TUH448 16024-16281 H13a2c1 100% 16148T 16256T

14 TUH449 16024-16383 H5 100% 16304C

15 TUH474 16024-16281 H 100% CRS

16 TUH1644 16024-16383 T3 85% 16126C 16189H 16193H 16325C

17 TUH1649 16024-16383 H 100% CRS

18 TUH1652 16024-16383 T 100% 16126C 16294T

19 TUH1665 16024-16383 H1an2 70% 16219G 16325C

20 TUH2327 16024-16383 H 100% CRS

2.2. Изследвани траки

От изследваните останки на траки, 7 са дали резултат. Установени са 6 различни

хаплотипа, които определят 4 хаплогрупи. Проба SM6.1 има една замяна от вида Т→С в

позиция 16126. С най- много полиморфизми са пробите SM10.4 и GM30.2. Пробата SM10.4

притежава следните транзиции: две Т→С в позиции 16050 и 16362, две C→T в 16223, една

C→T в 16076 и 16292, една G→A в 16042, две A→G в 16051 и 16077, срещат се също така

трансверсии от типа А→Т в позиция 16043, G→T в 16047, T→G в 16061 и C→A в 16114.

Пробата GM30.2 притежава три транзиции от вида C→T в позиции 16223, 16292 и 16355, а

така също транзиция Т→С в 16366. Други проби са SM31.2 съдържаща транзиции C→T в

16142 и Т→С в 16325; SM10.3 има три различни транзиции съответно A→G в16122, C→T в

Page 32: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

32

16142 и Т→С в 16325; SM30.2 притежава транзиция Т→С в 16325 и две хетероплазмии

Т≥С в 16270 и 16251, а SM31.1 има две транзиции C→T в 16142 и Т→С в 16325.

В таблица 3 са показани пробите с размера на секвенирания участък, наблюдаваните

полиморфизми по позиции, процента на качество на отделните проби и определените

хаплогрупи.

Таблица 3. Резултати от изследвани проби на траки по класическия метод

Проба Граници Хаплогр.

Качество на

проба (%) Полиморфизми

1 SM6.1 16024-16156 H14b1 100% 16126C

2 SM10.3 16024-16383 H1an2 100% 16122G 1642T 16325C

3 SM10.4 16024-16383 W5a 87%

16042A 16043T 16047T 16050C 16051G

16061G 16076T 16077G 16114A 16223T

16292T 16362C

4 SM30.2 16024-16383 H1an2 100% 16251h 16270h 16325C

5 SM31.1 16024-16383 D1f 81% 16142T 16325C

6 SM 31.2 16084-16383 D1f 81% 16142T 16325C

7 GM30.2 16024-16383 W5a 88% 16223T 16292T 16355T 16362C

Процентите за качество на пробите варират и най- нисък процент имат пробите SM31.1 и

SM31.2 - 81%,SM10.4 е 87% ,GM30.2 е 88%, а останалите три са с по 100%.

3. Резултати от изследвани проби на траки посредством методите от ново поколение

Изследвани и завършени са 44 проби, от които 19 са секвенирани. Останалите 25 проби

са в процес на секвениране и софтуерен анализ на получените резултати. От анализираните

първоначално 19 проби, 14 дадават секвенции, които са подложени на по- нататъшен

анализ, а 5 нямат цялостни секвенции и в процеса на обработка на данните отпадат от

анализа.

3.2. Филтриране на получените секвенции

Пробите се секвенират с Illumina Miseq. В резултат на секвенирането се генерират

различен брой прочетени последователности (R1 -права и R2- обратна последователност) за

всяка проба. Всички разчетени последователности са обединени и филтрирани въз основа

на оценката им за качество.Това води до изчисляване на процент получен от стойността на

обединените разчетени последователности на една проба сравнени с първоначалният брой

прочетени последователности. Стойностите варират от 92.02% до 99%. В таблица 4 са

Page 33: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

33

представени резултатите на разчетените последователности за всяка проба, стойността на

обединението им и процента на обединение.

Данните показват, че дължината на фрагментите в библиотеките е под 142 б. дв. и са

подходящи за следваща стъпка на анализ.Резултатите от филтрирането на пробите по

качество е представено в таблица 5.

Таблица 4. Обединени разчетени последователности на 19 проби

Проби

Първоначален

брой на

разчетени

последовател-

ности (R1+R2)

Обединени

разчетени

секвенции

разчетени

последовател-

ности от права

реакция R1

разчетени

последователност

и от обратна

реакция R2

Общ брой отделни

разчетени

последователности

Процент на

обединените

разчетени

последователно-

сти (%)

BM4 1712864 846996 9171 9171 18342 97.88

BM6 1763710 871988 9360 9360 18720 97.89

BM13 691650 2981 15 15 30 99.00

BM24 673458 324477 12104 12104 24208 93.05

BM31 579878 277677 12025 12025 24050 92.02

BM36 1147756 568370 5353 5353 10706 98.15

BM40 443036 217845 3550 3550 7100 96.84

BM44 398286 197835 1257 1257 2514 98.74

BM61 496502 245975 2243 2243 4486 98.20

BM68 1071550 532645 2882 2882 5764 98.92

BM69 830688 409472 5589 5589 11178 97.34

BM73 677090 329641 8607 8607 17214 95.03

SM2 1080524 535265 4767 4767 9534 98.24

SM4 2126880 1036647 26646 26646 53292 95.11

SM6.2 648056 320656 3337 3337 6674 97.96

SM8.1 625550 309602 2946 2946 5892 98.13

SM8.2 281746 135432 5393 5393 10786 92.62

SM10.

1 98478 48033 1195 1195 2390 95.26

SM24.

2 326436 161995 1180 1180 2360 98.56

2.2. Съставяне на генетични карти

Филтрираните фрагменти за всяка проба се картират с помощта на MIA скриптове с

ревизираната Кеймбриджка референтна секвенция. С първият скрипт цялото количество от

изравнените разчетени секвенции се разделят на уникални, идентични фрагменти базирайки

се на една посока, еднакви координати на начало и край (уникални фрагменти). Създава се и

файл в който няма разделяне на последователности (неуникални секвенции). Съотношението

между неуникалните и уникални последователности дава Клъстер фактора. Този фактор

Page 34: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

34

определя степента на секвениране. Високата степен кореспондира с множество ампликони на

една молекула, докато ниската степен означава малко копия на отделен фрагмент.

Таблица 5. Филтрирани по качество проби

Проби

Обединени

последователности

Общ брой отделни

последователности

Общо филтрирани разчетени

последователности

BM4 846224 10811 857035

BM6 871689 8413 880102

BM13 2974 20 2994

BM24 324075 4636 328711

BM31 277224 14047 291271

BM36 567983 7353 575336

BM40 217783 3649 221432

BM44 197748 1280 199028

BM61 245762 2943 248705

BM68 532350 3731 536081

BM69 409278 6020 415298

BM73 329603 8165 337768

SM2 534946 4957 539903

SM4 1036172 24773 1060945

SM6.2 320475 3112 323587

SM8.1 309471 2941 312412

SM8.2 135408 5245 140653

SM10.1 48012 1176 49188

SM24.2 161961 1208 163169

В проведеният анализ Клъстер фактора е сравнително добър при повечето проби.

Пробите с добър фактор са с висок процент на покритие на мтДНК геном (при по- висока

кратност на покритие – 5 -кратно). Средната дължина на фрагментите за всяка проба

варира между 43 б.дв. до 64 б дв.

Изчисляването на средното покритие на мтДНК се осъществява определяйки колко

пъти уникалните последователности средно покриват единични мтДНК бази. Покритието

на митохондриалният геном се определя чрез изчисляване процента на всички

митохондриални нуклетиди, които са покрити поне един, два, три, четири или пет пъти от

уникалните фрагменти. Настоящите изчислявания показват, че се наблюдава петкратно

покритие. В таблица 6 са представени данните за уникалните и неуникални

последователности, клъстер фактора, петкратното покритие в проценти, средното

покритие и средната дължина.

Page 35: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

35

От получените резултати се селектират пробите, които ще продължат с анализа. Шест

от пробите имат 100% покритие (BM4, BM6, BM36, BM40, BM68, BM73), над 99% са пет

(BM24, BM31, BM44, BM61, BM69), над 95% са три (SM4, SM8.1, SM24.2). Посочените 14

проби имат много добри показатели и те се подлагат на по-нататъшен анализ.

Други 5 проби (BM13, SM2, SM6.2, SM8.2, SM10.1) дават много ниски стойности за

уникалните фрагменти и нисък процент на покритие под 95% и те се елиминират от

следващите етапи на изследването (подчертани в розово).

Таблица 6. Резултат от секвенирането и групирането на аДНК библиотеки. В розово са

подчертани проби, които не дават добри резултати и се елиминират от следващите стъпки на

анализ.

Проби

Неуникални

фрагменти

Уникални

фрагменти

Клъстер-

фактор

Покритие (5 -кратно)

в %

Средно

покритие

Средна

дължина

BM4 615 216222 1.19 100.00% 747.153 57.25

BM6 47360 196660 1.38 100.00% 637.925 53.73

BM13 35325 614 1.00 7.84% 1.957 52.79

BM24 246701 40636 1.16 99.99% 142.591 58.14

BM31 47640 32434 1.08 99.88% 125.872 64.29

BM36 41227 208051 1.18 100.00% 693.183 55.20

BM40 258261 45039 1.05 100.00% 147.560 54.27

BM44 61964 36151 1.14 99.96% 110.140 50.47

BM61 173102 58288 1.06 99.96% 193.488 54.99

BM68 68308 143515 1.20 100.00% 450.591 52.01

BM69 271823 58312 1.17 99.95% 174.065 49.45

BM73 133525 114082 1.17 100.00% 301.007 43.71

SM2 195 143 1.20 0.98% 0.554 64.17

SM4 8864 12058 1.26 97.52% 40.047 55.02

SM6.2 2044 229 1.08 0.12% 0.746 53.97

SM8.1 172 11567 1.42 95.55% 32.437 46.46

SM8.2 15270 1972 1.03 50.19% 5.343 44.89

SM10.1 248 184 1.05 0.43% 0.480 43.17

SM24.2 16539 8352 1.06 96.04% 22.749 45.12

3.3. Анализ на пробите за неправилни замени бази и наличие на нарушения в

секвенциите

Пробите, които се подбират с най- добри резултати се изследват с MapDamage (таблица

7). Софтуера изчислява неправилните замени до 25 позиция от края на секвенциите.

Page 36: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

36

Честотата на неправилните замени се определя от двата края на молекулите и се изразяват в

процент, който индикира номера на ДНК фрагментите носещи C>T спрямо общият брой на

ДНК фрагментите. По същият начин се изчислява и за носителите на G>A.

За всяка една проба се представя графика на честотите на A, T, C и G в края на

последователностите. На тази графика е обозначена с червена линия тенденцията C→T ,

със синя линия честотата G→A и с лилава неправилните инкорпорации. Честотата на всяка

база в края на разчетените последователности и на референтните секвенции преди и след

картирането на последователности по позиции е представено в графики за всяка една

отделна база.

Получените резултати оптимизирани от MapDamage съответстват на типичните антични

проби. Стойностите на пробите варират от 0,16 до 0,50.

Таблица 7. Резултати от MapDamage анализа

Честота на субституциите

Проби G->A C->T

BM4 0.17 0.16

BM6 0.32 0.30

BM24 0.30 0.26

BM31 0.14 0.13

BM36 0.34 0.31

BM40 0.36 0.32

BM44 0.38 0.37

BM61 0.30 0.27

BM68 0.35 0.32

BM69 0.35 0.33

BM73 0.43 0.40

SM4 0.45 0.43

SM8 0.50 0.46

SM24.2 0.43 0.40

3.4. Проверка за наличие на замърсяване

Софтуера ContamMix позволява да се установи вероятността едни и същи ДНКи да

принадлежат на един индивид. По този начин се установява автентичността на

секвенциите. Програмата работи, сравнявайки всички последователности на проба с rCRS,

а също така с 311 последователности на съвременни човешки мтДНКи. Сравнението с rCRS

и с 311 генома на съвременните хора се осъществява с помощта на MAFFT програмата.

Установяват се потенциални замърсени последователности и след сравнението се

Page 37: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

37

определят и диагностичните позиции. Несъответствията се използват за изчисляване на

последователностите, които съвпадат в голяма степен с rCRS в сравнение със

замърсяването. Стойността на достоверност на чистотата на пробите се определя в

интервала от 85% до 100% при отделните проби. В таблица 8 са представени резултатите от

проверка на пробите за наличие на контаминация и степента за достоверност на чистотата

на пробите.

От получените резултати за наличие на замърсяване се генерират таблици, които

показват вероятността последователностите на една проба да произлизат от един индивид.

При 8 от пробите резултатите имат стойност над 0.95 (BM4, BM6, BM40, BM44, BM68,

BM73, SM8, SM24.2), две проби имат стойност 1 (BM69, SM4), една проба дава стойност

0.94 (BM36) и една със стойност 0.82 (BM61). Пробите BM 24 и BM 31 дадоха ниски

стойности при тестовете за контаминация и автентичност и се изключиха от анализа.

Таблица 8. Резултати от ContamMix анализа

Проба ContamMix резултати

1 BM4 0.98

2 BM6 0.98

3 BM36 0.94

4 BM40 0.97

5 BM44 0.99

6 BM61 0.82

7 BM68 0.97

8 BM69 1.00

9 BM73 0.96

10 SM4 1.00

11 SM8 0.95

12 SM24.2 0.95

3.5. Определяне на хаплогрупната принадлежност на пробите посредством Haplofind

софтуер

Програмата Haplofind сравнява получената консенсусна последователност за всяка проба

с rCRS идентифицирайки мутациите, които се различават от референтната

Page 38: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

38

последователност. С помощта на метода при 12 проби се установяват 10 различни

хаплогрупи. За всяка установена хаплогрупа има определена стойност, която варира в

границите от 0.4 до 1. Тази стойност се определя от установените полиморфизми. При

някои от пробите има преоценка на полиморфизмите, защото покриването на позициите не

е 100% при реконструирането на мтДНК (липсващи участъци, обозначени като N в

консенсусната последователност) и те се превеждат като пропуски (делеции) в Haplofind

процедурата. Пробите, които имат 100% покритие имат стойност 1, при всички останали с

по- малък процент покритие, стойността е под 1.

В таблица 9 са представени резултатите от Haplofind анализа за определяне хаплогрупата

на всяка проба. Представени са и стойностите за всяка хаплогрупа в зависимост от

покритието на генома и на определените полиморфизими. Стойност 1 се среща при 9 от

пробите (BM4, BM6, BM36, BM40, BM44, BM68, BM69, BM73 и SM24.2), 0.50 при една

проба (SM8) и 0.40 при две проби (BM61 и SM4).

На фигура 27 са представени дванадесетте проби на траките и генетичната им връзката

посредством хаплогрупите изграждайки филогенетично дърво.

Таблица 9. Резултати от Haplofind процедурата

Проба Хаплогрупа Стойност

1. BM4 H6a1a 1.00

2. BM6 H7a1a 1.00

3. BM36 N1a1a1a 1.00

4. BM40 T2e2a 1.00

5. BM44 HV0 1.00

6. BM61 J1c 0.40

7. BM68 K1c1 1.00

8. BM69 H 1.00

9. BM73 H 1.00

10. SM4 J1c 0.40

11. SM8 U5a1 0.50

12. SM24.2 HV1a'b'c 1.00

Page 39: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

39

Фигура 27. Графично изображение на филогенетично дърво изобразяващо връзката на

отделните проби на траки посредством определените хаплогрупи

4. Сравнение на честотата на мтДНК хаплогрупи при прабългари, съвременни

българи, европейски и азиатски популации.

Сравнението е направено между резултатите от изследването на прабългарските

популации и още 36 отделни популации от Европа и Азия. Сравнението е направено на

базата на 22 хаплогрупи ( H*, H5, HV0, HV,R0a, JT, U1, U2e, U3, U4, U5a, U5b,U6, U7, U8,

U*, K, N1, N2, X, M и L). Прабългарските проби, участващи в сравнението са 19. Те

надхвърлят граничната стойност за качество на пробите 80%.

В таблица 10 са представени 36 популации от Европа и Азия, с които се сравняват

прабългарите. Посочени са броя на индивидите (пробите), които носят дадена хаплогрупа.

На базата на сравнението се генерира графика на основните компоненти PCA (Principal

Component Analysis), която представя в координати разположението на прабългарите сред

другите популации. Определя се връзката им и близостта със съвременните българи

(Фигура 30 в Обсъждане).

Page 40: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

40

Таблица 10. Брой лица принадлежащи към мтДНК хаплогрупи и субхаплогрупи в извадките от 37 популации включени в PCA анализ.

БРОЙ ЛИЦА (ПРОБИ)

N Популации Общо H* H5 HV0 HV R0a JT U1 U2e U3 U4 U5a U5b U6 U7 U8 U* K N1 N2 X M L Others

1 Австрия1 99 43 3 1 1 1 20* 0 1 1 4 8 0 0 0 2 1 7 2 1 1 2 0 0

2 Баски1 156 87 6 17 0 0 13* 0 0 0 0 2 17 0 1 1 0 6 0 0 2 0 1 3

3 Босна1 144 61 8 9 0 2 17* 2 0 1 8 10 7 0 0 0 0 6 5 2 2 2 1 1

4 България1 996 380 33 35 39 6 182* 13 10 21 39 45 25 0 7 4 3 59 27 25 20 11 4 8

5 Кавказ1 2650 573 61 24 104 7 439* 108 60 147 104 153 27 1 25 13 1 159 56 93 145 163 2 185

6 Хърватия1 96 36 7 5 3 0 9* 1 4 2 2 8 2 0 1 0 0 6 3 4 0 2 0 1

7 Чехия1 83 28 6 5 3 0 18* 0 1 1 1 7 3 0 0 0 0 3 3 1 3 0 0 0

8 Египет1 413 15 2 13 14 7 55* 2 1 14 5 1 15 3 2 0 0 23 27 4 7 41 94 68

9 Англия1 335 148 13 11 1 0 75* 0 3 2 7 13 15 0 1 1 0 21 10 3 3 0 2 6

10 Естония1 558 235 17 18 6 0 98* 1 7 5 32 56 24 0 0 9 1 15 13 15 5 1 0 0

11 Финландия1 312 113 8 19 0 0 37* 1 2 0 5 18 44 0 1 0 0 19 17 16 6 0 1 5

12 Германия1 905 368 43 37 3 0 177* 4 2 16 26 46 35 0 2 2 3 63 24 21 10 2 1 20

13 Гърция1 155 54 6 3 5 3 31* 3 1 3 4 7 4 0 2 0 1 7 7 2 7 4 0 1

14 Унгария1 533 136 21 25 4 7 75* 4 4 1 9 15 17 1 1 11 2 113 28 28 7 11 2 11

15 Ирландия1 300 126 5 17 4 1 54* 0 4 3 4 11 15 0 0 0 0 37 9 7 2 1 0 0

16 Централна Италия1 1273 427 52 61 45 14 251* 11 10 34 21 56 34 4 14 10 1 84 35 25 39 25 18 2

17 Северна Италия1 346 131 33 18 8 1 53* 3 5 4 10 7 4 0 0 1 0 32 12 6 17 1 0 0

18 Южна Италия1 539 209 25 19 18 5 93* 10 4 17 13 11 7 7 6 2 0 39 21 9 14 7 1 2

19 Латвия1 299 113 20 9 7 0 47* 0 9 5 28 21 6 0 0 0 0 7 13 12 1 1 0 0

20 Норвегия1 556 250 17 21 1 0 106* 1 0 8 17 35 31 0 0 2 0 31 13 9 2 6 0 6

21 Палестина1 117 28 5 0 2 3 26* 1 1 1 2 1 0 1 3 0 1 9 3 3 4 4 16 3

22 Румъния1 94 26 7 6 1 2 21* 0 0 3 4 7 5 0 0 0 0 3 0 6 2 0 0 1

23 Сицилия1 105 51 6 3 4 2 13* 2 1 1 3 1 1 1 2 0 0 6 3 0 3 0 2 0

24 Словакия1 129 49 9 3 2 0 30* 0 2 3 2 9 2 0 0 0 0 5 6 3 0 1 0 3

25 Швеция-Дания1 75 31 4 3 0 0 16* 0 1 0 3 5 0 0 0 0 0 8 1 1 0 0 0 2

26 Швейцария1 228 93 11 11 1 0 54* 0 2 2 8 11 5 1 0 1 0 12 3 4 1 0 1 7

Продължена

Page 41: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

41

N Популации Общо H* H5 HV0 HV R0a JT U1 U2e U3 U4 U5a U5b U6 U7 U8 U* K N1 N2 X M L Others

27 Турция1 340 99 10 2 17 0 61* 11 4 19 5 4 6 0 2 4 2 19 13 10 15 15 7 15

28 Уелс1 92 43 7 3 2 0 18* 0 0 0 0 3 3 0 0 0 0 7 3 0 1 0 0 2

29 Башкири2 221 25 2 7 1 0 19 0 0 0 28 15 15 0 0 1 0 3 11 1 0 61 0 33

30 Татари2 228 68 2 9 1 0 38 2 0 5 16 20 4 0 0 0 5 13 7 4 0 20 0 17

31 Чуваши2 55 15 0 4 0 0 5 0 0 1 9 8 0 0 0 1 1 4 2 1 0 4 0 0

32 Мордвини2 102 42 1 5 1 0 16 0 1 0 2 7 9 0 0 0 2 0 6 0 0 3 0 7

33 Коми- Пермияк2 74 22 2 0 0 0 13 0 0 0 7 1 3 0 0 0 1 1 9 0 0 12 0 6

34 Коми-Зиряни2 62 21 0 0 0 0 14 0 0 0 15 2 4 0 0 1 0 1 0 1 0 2 0 5

35 Мари2 136 54 1 15 2 0 17 0 0 0 14 17 2 0 0 0 0 3 1 0 0 8 0 2

36 Удмурти2 101 21 1 0 0 0 23 0 5 0 4 8 1 0 0 0 2 0 0 0 0 20 0 11

37 Прабългари3 19 9 1 0 1 0 5 0 0 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0

1Karachanak, S., V. Carossa, D. Nesheva et al. 2012. Bulgarians vs the other European populations: A mitochondrial DNA perspective. Int. J. Legal Med. 126:497–503.26

2Bermisheva, M. A., K. Tambets, R. Villems et al. 2002. Diversity of Mitochondrial DNA Haplogroups in Ethnic Populations of the Volga–Ural Region. Mol. Biol. 36:802–

812.

3Настоящото изследване

*JT – включва хаплогрупите J, T, T1 и T2

*HV- обединява HV*, HV1 и HV2

Page 42: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

42

5. Сравнение на честотата на мтДНК хаплогрупи при траките, съвременни българи,

европейски и азиатски популации.

Сравнението е направено между резултатите от изследването на траките и 36 популации

от Европа и Азия. Сравнението е направено на базата на 22 хаплогрупи ( H*, H5, HV0,

HV,R0a, JT, U1, U2e, U3, U4, U5a, U5b,U6, U7, U8, U*, K, N1, N2, X, M и L). Проби на

траки, които участват са общо 19 получени от две изследвания. Седем са с резултати

получени по класическият метод и 12 са с резултати по метода от ново поколение (NGS

платформа).

В таблица 11 са представени 36 популации от Европа и Азия с които се сравняват

траките. Посочени са броя на индивидите (пробите), които носят дадена хаплогрупа. На

базата на сравнението се прави графика на основните компоненти PCA (Principal

Component Analysis), която изобразява разположението на траките сред другите популации.

Определя се връзката им и близостта със съвременните българи (Фигура 32 в Обсъждане).

Page 43: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

43

Таблица 11. Брой лица принадлежащи към мтДНК хаплогрупи и субхаплогрупи в извадките от 37 популации включени в PCA

анализ.

БРОЙ ЛИЦА (ПРОБИ)

N Популации Общо H* H5 HVO HV R0a JT U1 U2e U3 U4 U5a U5b U6 U7 U8 U* K N1 N2 X M L Others

1 Австрия1 99 43 3 1 1 1 20 0 1 1 4 8 0 0 0 2 1 7 2 1 1 2 0 0

2 Баски1 156 87 6 17 0 0 13 0 0 0 0 2 17 0 1 1 0 6 0 0 2 0 1 3

3 Босна1 144 61 8 9 0 2 17 2 0 1 8 10 7 0 0 0 0 6 5 2 2 2 1 1

4 България1 996 380 33 35 39 6 182 13 10 21 39 45 25 0 7 4 3 59 27 25 20 11 4 8

5 Кавказ1 2650 573 61 24 104 7 439 108 60 147 104 153 27 1 25 13 1 159 56 93 145 163 2 185

6 Хърватия1 96 36 7 5 3 0 9 1 4 2 2 8 2 0 1 0 0 6 3 4 0 2 0 1

7 Чехия1 83 28 6 5 3 0 18 0 1 1 1 7 3 0 0 0 0 3 3 1 3 0 0 0

8 Египет1 413 15 2 13 14 7 55 2 1 14 5 1 15 3 2 0 0 23 27 4 7 41 94 68

9 Англия1 335 148 13 11 1 0 75 0 3 2 7 13 15 0 1 1 0 21 10 3 3 0 2 6

10 Естония1 558 235 17 18 6 0 98 1 7 5 32 56 24 0 0 9 1 15 13 15 5 1 0 0

11 Финландия1 312 113 8 19 0 0 37 1 2 0 5 18 44 0 1 0 0 19 17 16 6 0 1 5

12 Германия1 905 368 43 37 3 0 177 4 2 16 26 46 35 0 2 2 3 63 24 21 10 2 1 20

13 Гърция1 155 54 6 3 5 3 31 3 1 3 4 7 4 0 2 0 1 7 7 2 7 4 0 1

14 Унгария1 533 136 21 25 4 7 75 4 4 1 9 15 17 1 1 11 2 113 28 28 7 11 2 11

15 Ирландия1 300 126 5 17 4 1 54 0 4 3 4 11 15 0 0 0 0 37 9 7 2 1 0 0

16

Централна

Италия1 1273 427 52 61 45 14 251 11 10 34 21 56 34 4 14 10 1 84 35 25 39 25 18 2

17

Северна

Италия1 346 131 33 18 8 1 53 3 5 4 10 7 4 0 0 1 0 32 12 6 17 1 0 0

18

Южна

Италия1 539 209 25 19 18 5 93 10 4 17 13 11 7 7 6 2 0 39 21 9 14 7 1 2

19 Латвия1 299 113 20 9 7 0 47 0 9 5 28 21 6 0 0 0 0 7 13 12 1 1 0 0

20 Норвегия1 556 250 17 21 1 0 106 1 0 8 17 35 31 0 0 2 0 31 13 9 2 6 0 6

21 Палестина1 117 28 5 0 2 3 26 1 1 1 2 1 0 1 3 0 1 9 3 3 4 4 16 3

продължена

Page 44: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

44

N Популации Общо H* H5 HVO HV R0a JT U1 U2e U3 U4 U5a U5b U6 U7 U8 U* K N1 N2 X M L Others

22 Румъния1 94 26 7 6 1 2 21 0 0 3 4 7 5 0 0 0 0 3 0 6 2 0 0 1

23 Сицилия1 105 51 6 3 4 2 13 2 1 1 3 1 1 1 2 0 0 6 3 0 3 0 2 0

24 Словакия1 129 49 9 3 2 0 30 0 2 3 2 9 2 0 0 0 0 5 6 3 0 1 0 3

25

Швеция-

Дания1 75 31 4 3 0 0 16 0 1 0 3 5 0 0 0 0 0 8 1 1 0 0 0 2

26 Швейцария1 228 93 11 11 1 0 54 0 2 2 8 11 5 1 0 1 0 12 3 4 1 0 1 7

27 Турция1 340 99 10 2 17 0 61 11 4 19 5 4 6 0 2 4 2 19 13 10 15 15 7 15

28 Уелс1 92 43 7 3 2 0 18 0 0 0 0 3 3 0 0 0 0 7 3 0 1 0 0 2

29 Башкири2 221 25 2 7 1 0 19 0 0 0 28 15 15 0 0 1 0 3 11 1 0 61 0 33

30 Татари2 228 68 2 9 1 0 38 2 0 5 16 20 4 0 0 0 5 13 7 4 0 20 0 17

31 Чуваши2 55 15 0 4 0 0 5 0 0 1 9 8 0 0 0 1 1 4 2 1 0 4 0 0

32 Мордвини2 102 42 1 5 1 0 16 0 1 0 2 7 9 0 0 0 2 0 6 0 0 3 0 7

33

Коми-

Пермияк2 74 22 2 0 0 0 13 0 0 0 7 1 3 0 0 0 1 1 9 0 0 12 0 6

34 Коми-Зиряни2 62 21 0 0 0 0 14 0 0 0 15 2 4 0 0 1 0 1 0 1 0 2 0 5

35 Мари2 136 54 1 15 2 0 17 0 0 0 14 17 2 0 0 0 0 3 1 0 0 8 0 2

36 Удмурти2 101 21 1 0 0 0 23 0 5 0 4 8 1 0 0 0 2 0 0 0 0 20 0 11

37 Траки3 19 7 0 1 1 0 3 0 0 0 0 1 0 0 0 0 0 1 1 2 0 0 0 2

1Karachanak, S., V. Carossa, D. Nesheva et al. 2012. Bulgarians vs the other European populations: A mitochondrial DNA perspective. Int. J. Legal Med. 126:497–503.26

2Bermisheva, M. A., K. Tambets, R. Villems et al. 2002. Diversity of Mitochondrial DNA Haplogroups in Ethnic Populations of the Volga–Ural Region. Mol. Biol. 36:802–

812

3Настоящото изследване

*JT – включва хаплогрупите J, T, T1 и T2

*HV- обединява HV*, HV1 и HV2

Page 45: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

45

6. Сравнение на честотата на мтДНК хаплогрупи при прабългари, траки, съвременни

българи, европейски и азиатски популации. Обобщен сравнителен анализ

Сравнението е направено между резултатите от изследването на прабългарите, траките и

37 популации от Европа и Азия. Сравнението е направено на базата на 22 хаплогрупи ( H*,

H5, HV0, HV,R0a, JT, U1, U2e, U3, U4, U5a, U5b,U6, U7, U8, U*, K, N1, N2, X, M и L).

Пробите от прабългари и траки в този анализ са обединени в една таблица, като броя и

съотношението спрямо хаплогрупите не се променя.

В таблица 12 са представени 36 популации от Европа и Азия, с които се сравняват

прабългарите и траките. Посочени са броя на индивидите (пробите), които носят дадена

хаплогрупа. На получената графика след сравнението на основните компоненти PCA

(Principal Component Analysis), са посочени с координати разположението на прабългарите

и траките сред другите популации (Фигура 33 в Обсъждане). Тук се определя и наличието

или не на приемственост между траки, прабългари и съвременни българи. Тяхната

генетична позиция спрямо други популации.

Page 46: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

46

Таблица 12. Брой лица принадлежащи към мтДНК хаплогрупи и субхаплогрупи в извадките от 38 популации включени в PCA

анализ.

БРОЙ ЛИЦА (ПРОБИ)

N Популации Общо H* H5 HV0 HV R0a JT U1 U2e U3 U4 U5a U5b U6 U7 U8 U* K N1 N2 X M L Others

1 Австрия1 99 43 3 1 1 1 20* 0 1 1 4 8 0 0 0 2 1 7 2 1 1 2 0 0

2 Баски1 156 87 6 17 0 0 13* 0 0 0 0 2 17 0 1 1 0 6 0 0 2 0 1 3

3 Босна1 144 61 8 9 0 2 17* 2 0 1 8 10 7 0 0 0 0 6 5 2 2 2 1 1

4 България1 996 380 33 35 39 6 182* 13 10 21 39 45 25 0 7 4 3 59 27 25 20 11 4 8

5 Кавказ1 2650 573 61 24 104 7 439* 108 60 147 104 153 27 1 25 13 1 159 56 93 145 163 2 185

6 Хърватия1 96 36 7 5 3 0 9* 1 4 2 2 8 2 0 1 0 0 6 3 4 0 2 0 1

7 Чехия1 83 28 6 5 3 0 18* 0 1 1 1 7 3 0 0 0 0 3 3 1 3 0 0 0

8 Египет1 413 15 2 13 14 7 55* 2 1 14 5 1 15 3 2 0 0 23 27 4 7 41 94 68

9 Англия1 335 148 13 11 1 0 75* 0 3 2 7 13 15 0 1 1 0 21 10 3 3 0 2 6

10 Естония1 558 235 17 18 6 0 98* 1 7 5 32 56 24 0 0 9 1 15 13 15 5 1 0 0

11 Финландия1 312 113 8 19 0 0 37* 1 2 0 5 18 44 0 1 0 0 19 17 16 6 0 1 5

12 Германия1 905 368 43 37 3 0 177* 4 2 16 26 46 35 0 2 2 3 63 24 21 10 2 1 20

13 Гърция1 155 54 6 3 5 3 31* 3 1 3 4 7 4 0 2 0 1 7 7 2 7 4 0 1

14 Унгария1 533 136 21 25 4 7 75* 4 4 1 9 15 17 1 1 11 2 113 28 28 7 11 2 11

15 Ирландия1 300 126 5 17 4 1 54* 0 4 3 4 11 15 0 0 0 0 37 9 7 2 1 0 0

16

Централна

Италия1 1273 427 52 61 45 14 251* 11 10 34 21 56 34 4 14 10 1 84 35 25 39 25 18 2

17

Северна

Италия1 346 131 33 18 8 1 53* 3 5 4 10 7 4 0 0 1 0 32 12 6 17 1 0 0

18

Южна

Италия1 539 209 25 19 18 5 93* 10 4 17 13 11 7 7 6 2 0 39 21 9 14 7 1 2

19 Латвия1 299 113 20 9 7 0 47* 0 9 5 28 21 6 0 0 0 0 7 13 12 1 1 0 0

20 Норвегия1 556 250 17 21 1 0 106* 1 0 8 17 35 31 0 0 2 0 31 13 9 2 6 0 6

21 Палестина1 117 28 5 0 2 3 26* 1 1 1 2 1 0 1 3 0 1 9 3 3 4 4 16 3

22 Румъния1 94 26 7 6 1 2 21* 0 0 3 4 7 5 0 0 0 0 3 0 6 2 0 0 1

продължена

Page 47: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

47

N Популации Общо H* H5 HV0 HV R0a JT U1 U2e U3 U4 U5a U5b U6 U7 U8 U* K N1 N2 X M L Others

23 Сицилия1 105 51 6 3 4 2 13* 2 1 1 3 1 1 1 2 0 0 6 3 0 3 0 2 0

24 Словакия1 129 49 9 3 2 0 30* 0 2 3 2 9 2 0 0 0 0 5 6 3 0 1 0 3

25 Швеция-Дания1 75 31 4 3 0 0 16* 0 1 0 3 5 0 0 0 0 0 8 1 1 0 0 0 2

26 Швейцария1 228 93 11 11 1 0 54* 0 2 2 8 11 5 1 0 1 0 12 3 4 1 0 1 7

27 Турция1 340 99 10 2 17 0 61* 11 4 19 5 4 6 0 2 4 2 19 13 10 15 15 7 15

28 Уелс1 92 43 7 3 2 0 18* 0 0 0 0 3 3 0 0 0 0 7 3 0 1 0 0 2

29 Башкири2 221 25 2 7 1 0 19 0 0 0 28 15 15 0 0 1 0 3 11 1 0 61 0 33

30 Татари2 228 68 2 9 1 0 38 2 0 5 16 20 4 0 0 0 5 13 7 4 0 20 0 17

31 Чуваши2 55 15 0 4 0 0 5 0 0 1 9 8 0 0 0 1 1 4 2 1 0 4 0 0

32 Мордвини2 102 42 1 5 1 0 16 0 1 0 2 7 9 0 0 0 2 0 6 0 0 3 0 7

33

Коми-

Пермияк2 74 22 2 0 0 0 13 0 0 0 7 1 3 0 0 0 1 1 9 0 0 12 0 6

34 Коми-Зиряни2 62 21 0 0 0 0 14 0 0 0 15 2 4 0 0 1 0 1 0 1 0 2 0 5

35 Мари2 136 54 1 15 2 0 17 0 0 0 14 17 2 0 0 0 0 3 1 0 0 8 0 2

36 Удмурти2 101 21 1 0 0 0 23 0 5 0 4 8 1 0 0 0 2 0 0 0 0 20 0 11

37 Прабългари3 19 9 1 0 1 0 5 0 0 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0

38 Траки3 19 7 0 1 1 0 3 0 0 0 0 1 0 0 0 0 0 1 1 2 0 0 0 2

1Karachanak, S., V. Carossa, D. Nesheva et al. 2012. Bulgarians vs the other European populations: A mitochondrial DNA perspective Int. J. Legal Med. 126:497–

503.26

2Bermisheva, M. A., K. Tambets, R. Villems et al. 2002. Diversity of Mitochondrial DNA Haplogroups in Ethnic Populations of the Volga–Ural Region. Mol. Biol.

36:802–812.

3Настоящото изследване

*JT – включва хаплогрупите J, T, T1 и T2

*HV- обединява HV*, HV1 и HV2

Page 48: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

48

V. ОБСЪЖДАНЕ

Обсъждане на получените резултати от анализа на прабългарските проби

Базирайки се на установените хаплогрупи при прабългрите, направихме преглед и

анализ на тяхното разпространение. Получените резултати от анализа на 27 завършени

проби показват наличие на няколко големи хаплогрупи и техните субклонове. Най-

разпространената хаплогрупа е Н и нейните суб-клонове, срещаща се в 19 от пробите.

Друга голяма хаплогрупа е U представена посредством нейните субклонове при 3 проби.

Хаплогрупа Т е представена в 3 от пробите. Хаплогрупа J се открива при 2 проби. В една

проба се наблюдава хаплогрупа HV1.

В Европа 95% от популациите принадлежат към хаплогрупите H,I,J,K,M,T,U,V,W и X.

От тези хаплогрупи в прабългарските проби се наблюдават H, J, T и U.

Хаплогрупа Н и нейните суб-клонове обхващат 70% (19 проби) от пробите и са

представени от хаплогрупите H, H1 (H1, H1an2,H1t1a1), Н2 (H2a2a1), H5, H13 (Н13а2с1) и

H14 (Н14b1). От тях 9 съдържат Хг Н и 10 нейните суб- клонове. Всяка от хаплогрупите

H1,H1t1a1, H2a2a1, Н5, Н7f, Н13а2с1 и Н14b1 се срещат в една проба, а H1an2 е установена

в две проби.

Хаплогрупа Н се среща при 9 от пробите. Най- широко разпространена е в Европа и

Евразия. Достига до 41% при коренното европейско население и 40%-50% при повечето

европейски популации. Нейната субклада Н1 е най-честата в Европа, заема 50% от

клоновете на Хг Н в района. Най-висока честота има във Франция, Сардиния и при Баските

[Achilli, et al., 2004; Roostalu, et al., 2007]. Хг H1t1a1 е открита около 3% при Баските [Behar,

et al., 2012]. Хг H1an2 се среща най- много в Испания, Франция и Италия [van Oven, et al.,

2009]. Хг H2a2a1 е изцяло Европейска хаплогрупа. Хг H5 е концентрирана в централна

Европа и Западна Евразия. Най- висока концентрация има в Словения, Латвия и Белгия. Хг

Н7f е субклада на Н7, която се открива в Близкият Изток, Кавказ, Централна Азия и Балто-

Славянските популации. Хг Н13а2с1 е специфична субклада на Хг Н, нейната родоначална

хаплогрупа Н13а2 се среща в Евразия и основно в Южна Европа Сардиния и бреговете на

Средиземно море. Н14b1 е рядко срещана, но нейната родоначална хаплогрупа е

установена в Близкият Изток [Achilli, et al., 2004; Roostalu, et al., 2007].

Хаплогрупа U е открита в 11% от прабългарските проби и нейни субклади U3 са открити

в една от пробите, а в 2 проби U4, представена от U4а2b и U4c1.

Page 49: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

49

Хг U3 се среща слабо 1%-2% в Европа, Близкия Изток и Централна Азия. Открива се в

Йордания и Сирия, а в Европа в Гърция и Италия. Хг U4а2b се открива основно в централна

Европа и Русия, но също така в Скандиавия и Холандия, а Хг U4c1 се среща при повечето

европейски популации, както и в Иран и Централа Азия [Quintana-Murci, et al., 2004; Scott,

2011].

Хаплогрупа Т е представена в 11% от пробите - 1 с Хг Т и 2 със суб-хаплогрупите й Т2 и

Т3 (T2g2a). Хг Т е характерна за Западна и Централна Евразия, а при изследване на

коренното население на Европа се установява в 10%. Нейната субклада Т2 е с висока

честота в Европа, Англия, Ирландия и Саудитска Арабия. Хг Т3, която се определя още

като Хг T2g2a се среща главно в Европа [Pike, 2006].

Хаплогрупа J е в 7% от пробите -1 проба с Хг J и 1 със субхаплогрупата й J1b1a1. Хг J е

разпространена почти из цяла Европа, също така и в Близкият Изток. Достига най- голяма

честота в Англия, Уелс, Дания, Сардиния и др. Хг J1b1a1 е открита основно в Западна

Европа [Serk, 2004].

Хг HV е разпределена неравномерно в Европа, като най- висока честота има в Калабрия,

Сицилия, Тоскана, Сардиния, България, Беларус, Хърватия, Украйна, Румъния и др. В

малък процент се открива в Близкия Изток. Хаплогрупата HV1 се среща при една проба

(3%) и е разпространена в Украйна, Италия, Израел, Армения и Северна Африка [van Oven,

et al., 2009].

Анализирайки наблюдаваните резултати, след обобщаване на всички данни се вижда, че

прабългарските проби се доближават до европейските популации, притежавайки основно

европейски хаплогрупи. Тези данни показват тясна връзка и приемственост на

прабългарите със съвременните българи, базирайки се на едно припокриване на наличните

хаплогрупи и липсата на отклонения.

След селекцията на всички изследвани прабългарски проби в зависимост от качеството

им (над 80%), 19 от пробите имат най- добри показатели. При тях в 47% се среща Хг. Н и

нейните клонове, в 15.8% е хаплогрупа Т, в 10.5 % се откриват клонове на хаплогрупите J и

U4. В 5% се срещат клонове на Хг. H5, HV и U3.

Page 50: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

50

Фигура 28. Процентно разпределение на основните хапплогрупи в изследваните прабългарски

проби (обобщена графика на хаплогрупите).

На фигура 28 е представено в проценти разпределението на основните хаплогрупи в

изследваните и селектирани по качество 19 прабългарски проби. Във фигурата са обобщени

хаплогрупите и субкладите им в макро-хаплогрупи.

Обсъждане на получените данни от проведения анализ на главните компоненти PCA

(Principal Component Analysis) на резултатите от прабългарските проби.

Получените резултати от сравнението на прабългарите и съвременните българи с други

популации от Европа и Азия. Получената графика показва позицията на древните българи

сред другите популации.

Прабългарите са в непосредствена близост със съвременните българи, централна Италия,

Хърватия и Унгария. Много близко разположени са до Сицилия, Южна и Северна Италия,

Гърция и Румъния. Много раздалечена е от татари, удмурти, чуваши и турци. Не се

наблюдава близост и до популациите в Северна и Източна Европа.

Резултатите показват една категорична позиция на прабългарските популации сред

европейските и азиатски популации, връзката със съвременните българи и тяхната

приемственост. Отхвърля теорията за родственост с алтайските и тюркски популации.

На фигурa 29 е представена PCA графика на сравнителният анализ между прабългарите и

съвременните българи с други популации от Европа и Азия.

Page 51: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

51

Фигурa 29. PCAдиаграма Резултат от сравнение на прабългарите и съвременните българи и популации от Европа и Азия

Page 52: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

52

Обсъждане на получените резултати от анализа на проби от траки

Получените резултати от анализираните 19 проби от траки показват разнообразие на

хаплогрупи. Хаплогрупа Н и нейните субклди са установени в 7 проби (H, H1an2, Н6а1а,

H7а1а и Хг H14b1); HV в 2 проби (HV0 и HV1a`b`c); J в 2 проби (J1c); W в 2(W5a); D в 2

проби (D1f); U в 1 проба (U5a1); T в 1 проба (Т2e2a); N в 1 проба (N1a1a1a) и K в 1 проба

(K1c1).

Самата хаплогрупа Н е представена в 2 проби (10,5%) и е най- широко разпространена в

Европа и Евразия. При траките се среща H1an2, която е представена в 2 проби (10,5%). Тук

също се наблюдава и Хг H14b1 представена в една проба. Хг Н6а1а е установена в Европа,

Близкият Изток и Централна Азия, но основно в Централна Европа и Скандинавия.

Хаплогрупа H7а1а се открива основно в Западна Евразия, Средният и Близкият Изток и по-

малко в Европа [Roostalu, et al., 2007]. Обобщено наличието на хаплогрупа Н и нейните

субклади е 37%.

Хаплогрупата HV0 ( или пре-V ) се наблюдава при една от пробите на траки. Тази

хаплогрупа е установена в Западна Европа, като най- разпространена е във Финландия,

Германия и Португалия. Хаплогрупата HV1a`b`c се среща в една проба и е субклада на

HV1, която е разпространена в Украйна, Италия, Израел, Армения и Северна Африка [van

Oven, et al., 2009].

Хаплогрупа J е представена от Хг J1c в 2 проби. Тази хаплогрупа има широко

разпространение в Европа и Азия [Serk, 2004]. Хг W е представена в две проби от Хг W5а.

Тя е разпространена в Германия, Бенелюкс и Британските острови. Хг D е представена в 2

проби от Хг D1f. Тази хаплогрупа е много специфична. Възниква в Сибир и Азия, след

което се разпространява в Америка – Северна, Централна и Южна Америка [Starikovskaya,

et al., 2005; Volodko, et al., 2008]. Хг Т2e2a се локализира специфично в Индия, Ирак и

Италия. Хг N1a1a1a се ограничава на териториите на Казакстан, Алтай и Република Бурят,

както и в Европейската част на Русия [Palanichamy, et al., 2010]. Хг K1c1 е разпространена

сред славянските държави [van Oven, et al., 2009].

Направения анализ на установените хаплогрупи при траките показва различие спрямо

прабългарите, което се дължи на наличие на хаплогрупи, които не се срещат при

прабългарите.

Page 53: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

53

Фигура 30. Процентно разпределение на основните хапплогрупи в изследваните тракийски

проби (обобщена графика на хаплогрупите).

На фигура 30 е представено в проценти разпределението на основните хаплогрупи в

изследваните и селектирани по качество 19 тракийски проби. Във фигурата са обобщени

хаплогрупите и субкладите в макро-хаплогрупи.

Обсъждане на получените данни от анализа на главните компоненти PCA (Principal

Component Analysis) на резултатите от проби на траки.

Получените резултати от сравнителния анализ на проби на траки със съвременни българи и

други популации от Европа и Азия показва позицията им сред тези популации. Установява

се, че резултатите от първоначално изследвани траки, разкрива тяхното отдалечаване от

съвременните българи и липсва приемственост между тях. Траките са разположени в

близост до някои европейски популации, най- близко до Австрия, Латвия и Словакия.

На фигура 31 е представена PCA графика на сравнителния анализ между траките и

съвременните българи с други популации от Европа и Азия.

Page 54: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

54

Фигура 31. PCA диаграма. Резултат от сравнение на Траки и съвременните българи и популации от Европа и Азия

Page 55: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

55

Обсъждане на хаплогрупната принадлежност на изследваните проби и предиспозиция

към заболявания

Полиморфизмите по своята същност не водят директно до развитие на дадено

заболяване. Наличието на даден полиморфизъм в контролния район на митохондриалната

ДНК може да доведе до повишаване или намаляване на риска за развитие на определено

заболяване. Установени са заболявания, които се развиват с по- голяма вероятност при

индивиди носещи определени полиморфизми или се причисляват в зависимост от

хаплотипната им принадлежност към дадена хаплогрупа. Установяването на хаплотиповете

и хаплогрупите на популационно или индивидуално ниво би спомогнало за изясняване

предразположението към дадени заболявания или протективният ефект към други при

наличие на други показатели. Понякога единични полиморфизми могат до доведат до

повишаване или намаляване риска за заболяване, а в друг случай наличие на хаплогрупа е

фактора повлияващ проявата.

Много от соматичните мтДНК мутации участват в туморогенезата. Митохондриите

играят важна роля в енергийният метаболизъм в организма, генерирайки АТФ и участвайки

в регулация на апоптозата. Мутации свързани с процеса на окислително фосфорилиране

водят до неврологични, мускулни или метаболитни нарушения. Наличието и участието на

полиморфизмите в тези процеси водят до стимулиране или до потискане на развитие на

болести.

От изследваните общо 46 проби на прабългари и траки се установиха полиморфизми,

които създават риск за някои заболявания.

Един от полиморфизмите, който е свързан с предразположение към възникване на

различни заболявания е транзицията на Тимин в Цитозин в позиция 16189 от

митохондиралният геном (Т16189С). Тази мутация се среща в две от прабългарските проби

(TUH1644 и TUH2327). Установена е връзка на този полиморфизъм с проявата на

кардиомиопатии, рак на ендометриума, метаболитен синдром и меланома.

Замяната на база Тимин в Цитозин в позиция 16189 има значителен ефект в развитие на

коронарна артериална болест (CAD) основно в централна Европа [Mueller, et al., 2011]. Тя

предразполага към развитие на идиопаична късна кардиомиопатия. Възприема се като

функционален вариант, който води до повишаване риска от това заболяване [Khogali, et al.,

2001]. Вариантът асоциира с проявата на инсулинова резистентност при възрастни, но

Page 56: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

56

ефектът при захарен диабет тип 2 още не е напълно разяснен. Допринася за фенотипната

проява при пациенти с чести многофакторни заболявания [Poulton, et al., 1998].

Меланомата е един от най- агресивните видове рак на кожата, дължаща се на мутация

в меланоцитите и тяхното злокачествено изменение. Установени са 8 различни варианта в

пробите, три от които се повтарят и са асоциирани с повишен риск за развитие на кожен

меланом [Ebner, et al., 2011].

Таблица 13. Полиморфизми асоциирани с развитието на меланома при прабългари и траки

Варианти Честота при пациенти с

меланома

Проби, в които се

срещат варианти

G16145A 5% NJ54

T16189C 17% TUH1644 и TUH2327

C16256T 8% TUH448

C16270T 12.5% SM30.2

C16294T 10% NJ84 и TUH1652

T16304C 7% TUH449

T16311C 10% NJ196

T16362C 5% SM10.4 и GM30.2

При меланомът в най- голям процент се среща полиморфизмът T16189C (17%), следван от

C16270T (12.5%), C16294T и T16311C (10%) (Таблица 13). Тези варианти повишават риска

за злокачествено заболяване в съчетание и с други фактори като възраст и пол на

индивидите. От хаплогрупите, които предразполагат развитието на болестта са Хг Н, която

достига 42% от пациентите, следвана от Хг U и Хг J.

Замяната T16189C е асоциирана с проявата на метаболитен синдром (MS), при което става

възможна изявата на различни клинични симптоми [Palmieri, et al., 2011]. В 60% от

случаите с овариален карцином се наблюдава този вариант, повишавайки вероятността за

развитие на този бързо прогресиращ и агресивен рак [Liu, et al., 2001].

Риска от развитието на рак на простатата се повишава при наличието на 5 варианта

открити при изследваните проби (Таблица 14).

Полиморфният вариант T16126C се среща най- много в изследваните проби, 7 от тях (6

прабългарски и 1 тракийска). Останалите се срещат в прабългарски проби, като варианти

T16189C, C16278T и C16294T се открива в две проби, а C16296T в една [Arnold, et al.,

2013].

Page 57: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

57

Таблица 14. Полиморфизми асоциирани с развитие на рак на простатата при прабългари и

траки

Вариант Проби в които е установен съответния вариант

T16126C MM1.4, NJ54, NJ84, NJ126, TUH1644,

TUH1665, SM6.1

T16189C TUH1644 и TUH2327

C16278T MM1.2, NJ50

C16294T NJ84,TUH1652

C16296T NJ84

T16126C заедно с Т16092С (ММ1.2) се свързват с намаляването на антиоксидантният

капацитет в организма, което е свързано с възрастта и пола [Weng, et al., 2013].

От своя страна T16126C е силно свързан с възникването на зависимата от възрастта

дегенерация на макулата (AMD). Среща се при прабългари и траки. AMD е една от

основните причини за възникване на слепота в света при възрастни хора в границата 65 -74

години и 35% до 40% от възрастовата граница 75-84 години [Udar, et al., 2009].

Наличието на варианти T16183C (NJ50),T16189C (TUH1644 и TUH2327), С16223Т (NJ28

и GM30.2) и Т16362С (GM30.2) водят до намаляване на риска за развитие на рак на гърдата

[Czarnecka, et al., 2010]. Установени са при прабългари и при траки.

Отделните хаплогрупи при прабългари и траки, също имат влияние върху проявата на

някои заболявания. Една от най- разпространените хаплогрупи Н влияе върху някои важни

заболявания. Риска от развитие на болестта на Паркинсон (PD) се увеличава при носителите

на тази хаплогрупа. Риска намалява при Хг J и Хг K [Gaweda-Walerych, et al., 2008]. Хг J1c,

K1, U4, U5a и T понижават риска от развитие на PD [Gaweda-Walerych, et al., 2008; Ienco, et

al., 2011].

Мъже носещи Хг Н имат малък риск от развитие на астенозооспермия (редуцирана

подвижността на сперматозоидите), докато при носителите на Хг Т имат висок риск [Ienco,

et al., 2011; Ruiz-Pesini, et al., 2000].

Макро- хаплогрупата N повишава риска за рак на гърдата, както и нейните субклади

H,T,U,V,W,X с изключение на Хг К.

Върху развитието на болестта на Алцхаймер (AD) важна роля за прогресията имат

няколко хаплогрупи. Хг J, K и U имат протективен характер, докато Хг Н повишава риска

Page 58: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

58

за развитие и прогресия на заболяването, особено при късният Алцхаймер, където достига

44%. Най- висок риск има при Хг Н5, докато H6a1a има протективен ефект и намалява

риска за AD. При ранният Алцхаймер Хг U намалява възможността за възникване и

прогресия и достига 32% [Coskun, et al., 2004; Kruger, et al., 2010; Ridge, et al., 2012].

Хг Н намалява честотата на проява на асоциирана с възрастта макулопатия (ARM),

висока преживяемост след сепсис, а Хг Н1 намалява риска от исхемичен инсулт [Ienco, et

al., 2011; Rosa, et al., 2008]

Хг H (46%) и Хг U (16%) увеличават риска от исхемични кардиоваскуларни болести

[Benn, et al., 2008]. Субкладата H6a1a е асоциина с намаляване вероятността за развитие на

Алцхаймер, а Хг Н5 повишава риска за късните форми на AD [Ridge, et al., 2012].

Хг Н е свързана в най- висока степен с максимално усвояване на кислород (VOX max) в

сравнение с останалите хаплогрупи. Носителите на хаплогрупата имат висока

издръжливост при продължителни физически натоварвания. В контраст Хг J има ниска

степен на VOX max и намалена издръжливост при натоварвания [Martinez-Redondo, et al.,

2010].

При болните от спин (AIDS) и в развитието на HIV-1 се установява, че субклади на Хг Н,

K, U и W намаляват прогресията на болестта, докато Хг J и U5a я увеличава. Хг Н е

асоциирана с прогресивна липоатрофия последвана от антиретровирусна

терапия[Hendrickson, et al., 2008].

Носителите на субклади на Хг Н1, Н1а, H6a1a, HV1, U3, U5 и K са дълголетници и имат

висок праг на резистентност към стресови фактори [Chen, et al., 2012]. Някои от субкладите

на Н1 и HV1 са свързани с наследствените по майчина линия телесна слабост и повишен

индекс за телесна маса, свързано с редуциран метаболитен ефект [Liou, et al., 2007; Parker,

et al., 2005; Soini, et al., 2012].

Хаплогрупа J и К имат протективен ефект от развитието на диабет Предпазва

носителите й от развитие на AD [Coskun, et al., 2004; Gonzalez, et al., 2012]. Освен това е

свързан с дълголетието и предпазва от развитие на PD [Clark, et al., 2011; Ghezzi, et al.,

2005]

Хаплогрупите J, Т и D1 са асоциирани с дълголетието [Ienco, et al., 2011]. Повишават

риска от развитие на Лебер – унаследената оптична невропатия (LHON). Води до

Page 59: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

59

прогресивно ослепяване. Хг J1 играе важна роля в проявата на заболяването [Brown, et al.,

2002; Carelli, et al., 2006]. Хг Т повишава риска за коронарната болест на сърцето, но

понижава риска за диабет, основно диабет тип 2 [Gonzalez, et al., 2012; Kofler, et al., 2009].

Субкладите на Хг U3 повишават риска от развитие на диабет тип 2 [Poulton, et al., 2002].

Хг J в 80% намалява риска от невроретинални заболявания.

Субклади на Хг J, K1, N1a1, и W са асоциирани с дълголетие, предпазват развитието на

PD, промяна на рН в клетките, метаболитен синдром и висок риск от рак на гърдата

[Clark, et al., 2011; Ghezzi, et al., 2005; Nijiati, et al., 2013].

Хаплогрупите U4, U5 и K повишават вероятността от възникване на мигрена и инсулти

[Finnila, et al., 2001]. Хг U, U3, U5 и K се свързват и с рН в мозъка и достига най- високи

стойности при тези хаплогрупи. Високото рН се среща при хора с по- високо IQ и спомага

за по- добра проводимост между невроните. Това има протективен ефект срещу инфаркт,

психологични заболявания като шизофрения, биполярни разстройства и при множество

депресивни състояния [Rollins, et al., 2009].

Хг U повишава два пъти риска от рак на простатата и рак на бъбреците. Заедно с Хг К

повишават вероятността за инсулти и прогресивна офталмоплегия. Хг U спомага за

загубата на слуха с възрастта и до повишаване на риска за пигментна дегенерация на

ретината. Хг U води до висок риск при проводни сърдечни дефекти и до различна

клинична картина при енцефалопатии [Ienco, et al., 2011]. Хаплогрупа Т спомага за

развитието на микро- и макроваскуларни болести. Повишава риска за CAD (15%) и диабет-

асоциирана ретинопатия (12%). Слабо влияе на атеросклерозата (8%) [Kofler, et al.,

2009].

Page 60: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

60

Обсъждане на получените данни от PCA (Principal Component Analysis) анализ на

резултатите от всички проби

Сравнителният анализ между прабългари, траки и съвременните българи показва тяхната

позиция сред популациите от Европа и Азия. Графиката от PCA анализа (Фигура 32)

посочва къде се намират популациите и тяхната близост с други популации. Прабългарите

се намират в непосредствена близост до съвременните българи, което потвърждава тяхната

родственост и приемственост. В непосредствена близост са до хървати, унгарци и

населението от Централна Италия. В голяма близост са до румънци, северни италианци,

южни италианци, сицилианци и гърци. Отдалечени са от траките, което показва липса на

родственост и приемственост помежду им по първоначални данни за траките. Прабългарите

са отдалечени и от турци, татари, чуваши, удмурти, коми, башкири, мордвини и други.

Липсва и близост със Северна и Източна Европа. Траките са в близост до австрийци,

словенци, босненци. Отдалечени са от турци, татари, чуваши, удмурти, коми, башкири,

мордвини и други.

Page 61: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

61

Фигура 32. PCA диаграма. Резултат от сравнение на Прабългари, Траки и съвременните българи и популации от Европа и Азия

Page 62: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

62

VI. ЗАКЛЮЧЕНИЕ

Проведеното изследване на мтДНК показва потенциала на изменчивостта на мтДНК като

основно средство за проследяване на генетичния произход по майчина линия. В настоящето

проучване се приложиха и сравниха три основни метода с различен капацитет и резолюция.

Хвърли се нова светлина върху антропогенетичната характеристика на населението по

българските земи в различни периоди – III хилядолетие преди. Хр. и VIII – X век.

До момента подобни изследвания не са провеждани и няма категорични данни за

техният генофонд. С помощта на проведените анализи се определи хаплогрупната

принадлежност на траки и прабългари и генетичната им връзката със съвременните българи

и други популации от Европа и Азия.

При проведеното изследване на прабългари от ранното средновековие, от селектираните

19 проби се установиха 17 различни хаплотипа и 16 отделни и различни хаплогрупи.

Хаплогрупите са Евразийски, като преобладаваща е типично европейската Хг Н и нейните

клоновете (50% от пробите). След проведеното сравнение със съвременни българи и други

популации от Европа и Азия се разкри генетичната позиция на прабългарите сред другите

народи, генетичната им близост до съвременните българи и приемственост помежду им. На

физическата митохондриална карта се наблюдава най- голяма близост до днес живеещите

българи и до някои европейски популации (Италианци, Гърци, Унгарци, Хървати и др.). Те

са генетично много раздалечени от алтайските и тюркски популации. С помощта на тези

данни се отхвърля теорията за общ произход с тюрки и алтайци.

Проучените 19 представителя на траките от ранната Бронзова епоха притежават 16

различни хаплотипа, които формират 10 различни хаплогрупи. Тези хаплогрупи са

разнообразни и се срещат в Европа и Азия. Част от тях присъстват и при прабългаите, но се

различават по преобладаващите специфични хаплогрупи. Анализът разкрива генетичната

позиция на траките сред европейски и азиатски популации, съвременни и древни българи.

От първоначалните резултати от анализа на траки и в последствие от сравнителния анализ,

се разкрива значима генетична отдалеченост на траките от прабългари и съвременни

българи. Те са по- близки до австрийци и словаци.

Установените хаплогрупи имат и медицинско значение, тъй като съвременните изследвания

показват, че те създават генетична предиспозиция към някои тежки заболявания.

Page 63: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

63

VII. ИЗВОДИ

1. Характеризирани са вариантите и честотите на мтДНК хаплогрупи в прабългари

(VIII - X век). Прабългарският митохондриален генофонд е съставен от евразийски

хаплогрупи, с преобладаващо присъствие (близо 50%) на клонове на Европейската

хаплогрупа Н. Установена е хомогенност на прабългарската мтДНК изменчивост сред

изследваните проби от различни некрополи.

2. Доказана е генетична връзка и значителна роля на прабългарите за формирането

на генофонда на съвременните българи.

3. Потвърждава се тезата, че прабългарите и съвременните българи нямат общ

генетичен произход с алтайски и тюркски народи.

4. Установено е, че тракийският митохондриален генофонд е разнообразен и

принадлежи към Евразийски групи.

5. Разкри се от първоначалните изследвания на траки (III хилядолетие преди

Христа), че те притежават генетична отдалеченост от прабългарите и от съвременните

българи.

6. Определена е позицията на прабългарите и траките сред евразийските народи,

тяхната генетична близост до различни европейци популации и тяхната отдалеченост от

азиатските народи.

7. Разкрита е липса на генетична връзка на траките с азиатски, алтайски и тюркски

популации.

Page 64: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

64

VIII. ПРИНОСИ

Приноси с научен характер

1. За първи път е определена мтДНК генетична структура на прабългари и траки.

2. Установена е генетичната позиция на прабългарите и траките спрямо други

популации.

3. Доказана е генетична близост между прабългари и съвременни българи и

генетична отдалеченост между траки и съвременни българи.

4. Отхвърля се теорията за общ генетичен произход на прабългари и съвременни

българи с алтайски и тюркски популации

5. Доказано е за първи път носителство на варианти в траки T16126C, C16223T,

C16270T и T16362C, които предразполагат към болести.

Приноси с приложен характер

1. За първи път е оптимизиран и използван метод за определяне на мтДНК

хаплогрупи чрез цялостно секвениране на митохондриална ДНК с нова генерация

секвенатор.

2. Доказано е, че методът на Gabriel et al. не е подходящ за анализиране на

антични мтДНКи, изолирани от древни костни проби (фрагменти от фемур и зъби).

3. Създадена е база данни с уникален генетичен материал от антични проби

принадлежащи на два големи и съществени за българската история периоди.

Page 65: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

65

IX. ИЗПОЛЗВАНА ЛИТЕРАТУРА

1. Achilli, A., Rengo, C., et al. 2004. The molecular dissection of mtDNA haplogroup H confirms

that the Franco-Cantabrian glacial refuge was a major source for the European gene pool. Am J

Hum Genet 75(5):910-8.

2. Anderson, S., Bankier, A.T., et al. 1981. Sequence and organization of the human mitochondrial

genome. Nature 290(5806):457-65.

3. Arnold, R.S., Sun, Q., et al. 2013. An inherited heteroplasmic mutation in mitochondrial gene

COI in a patient with prostate cancer alters reactive oxygen, reactive nitrogen and proliferation.

Biomed Res Int 2013:239257.

4. Behar, D.M., Harmant, C., et al. 2012. The Basque paradigm: genetic evidence of a maternal

continuity in the Franco-Cantabrian region since pre-Neolithic times. Am J Hum Genet 90(3):486-

93.

5. Benn, M., Schwartz, M., et al. 2008. Mitochondrial haplogroups: ischemic cardiovascular

disease, other diseases, mortality, and longevity in the general population. Circulation

117(19):2492-501.

6. Brown, M.D., Starikovskaya, E., et al. 2002. The role of mtDNA background in disease

expression: a new primary LHON mutation associated with Western Eurasian haplogroup J. Hum

Genet 110(2):130-8.

7. Carelli, V., Achilli, A., et al. 2006. Haplogroup effects and recombination of mitochondrial

DNA: novel clues from the analysis of Leber hereditary optic neuropathy pedigrees. Am J Hum

Genet 78(4):564-74.

8. Chen, A., Raule, N., et al. 2012. Decreased reactive oxygen species production in cells with

mitochondrial haplogroups associated with longevity. PLoS One 7(10):e46473.

9. Clark, J., Reddy, S., et al. 2011. Association of PGC-1alpha polymorphisms with age of onset

and risk of Parkinson's disease. BMC Med Genet 12:69.

10. Coskun, P.E., Beal, M.F., et al. 2004. Alzheimer's brains harbor somatic mtDNA control-

region mutations that suppress mitochondrial transcription and replication. Proc Natl Acad Sci U S

A 101(29):10726-31.

11. Czarnecka, A.M., Krawczyk, T., et al. 2010. Mitochondrial genotype and breast cancer

predisposition. Oncol Rep 24(6):1521-34.

12. Ebner, S., Lang, R., et al. 2011. Mitochondrial haplogroups, control region polymorphisms

and malignant melanoma: a study in middle European Caucasians. PLoS One 6(12):e27192.

13. Finnila, S., Hassinen, I.E., et al. 2001. Phylogenetic analysis of mitochondrial DNA in patients

with an occipital stroke. Evaluation of mutations by using sequence data on the entire coding

region. Mutat Res 458(1-2):31-9.

14. Gabriel, M.N., Huffine, E.F., et al. 2001. Improved MtDNA sequence analysis of forensic

remains using a "mini-primer set" amplification strategy. J Forensic Sci 46(2):247-53.

15. Gaweda-Walerych, K., Maruszak, A., et al. 2008. Mitochondrial DNA haplogroups and

subhaplogroups are associated with Parkinson's disease risk in a Polish PD cohort. J Neural

Transm (Vienna) 115(11):1521-6.

16. Ghezzi, D., Marelli, C., et al. 2005. Mitochondrial DNA haplogroup K is associated with a

lower risk of Parkinson's disease in Italians. Eur J Hum Genet 13(6):748-52.

Page 66: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

66

17. Gonzalez, A.M., Maceira, B.M., et al. 2012. Genetics, environment, and diabetes-related end-

stage renal disease in the Canary Islands. Genet Test Mol Biomarkers 16(8):859-64.

18. Hendrickson, S.L., Hutcheson, H.B., et al. 2008. Mitochondrial DNA haplogroups influence

AIDS progression. AIDS 22(18):2429-39.

19. Horai, S., Hayasaka, K., et al. 1995. Recent African origin of modern humans revealed by

complete sequences of hominoid mitochondrial DNAs. Proc Natl Acad Sci U S A 92(2):532-6.

20. Ienco, E.C., Simoncini, C., et al. 2011. May "mitochondrial eve" and mitochondrial

haplogroups play a role in neurodegeneration and Alzheimer's disease? Int J Alzheimers Dis

2011:709061.

21. Khogali, S.S., Mayosi, B.M., et al. 2001. A common mitochondrial DNA variant associated

with susceptibility to dilated cardiomyopathy in two different populations. Lancet

357(9264):1265-7.

22. Kofler, B., Mueller, E.E., et al. 2009. Mitochondrial DNA haplogroup T is associated with

coronary artery disease and diabetic retinopathy: a case control study. BMC Med Genet 10:35.

23. Kruger, J., Hinttala, R., et al. 2010. Mitochondrial DNA haplogroups in early-onset

Alzheimer's disease and frontotemporal lobar degeneration. Mol Neurodegener 5:8.

24. Liou, C.W., Lin, T.K., et al. 2007. A common mitochondrial DNA variant and increased body

mass index as associated factors for development of type 2 diabetes: Additive effects of genetic

and environmental factors. J Clin Endocrinol Metab 92(1):235-9.

25. Liu, V.W., Shi, H.H., et al. 2001. High incidence of somatic mitochondrial DNA mutations in

human ovarian carcinomas. Cancer Res 61(16):5998-6001.

26. Martinez-Redondo, D., Marcuello, A., et al. 2010. Human mitochondrial haplogroup H: the

highest VO2max consumer--is it a paradox? Mitochondrion 10(2):102-7.

27. Mueller, E.E., Eder, W., et al. 2011. The mitochondrial T16189C polymorphism is associated

with coronary artery disease in Middle European populations. PLoS One 6(1):e16455.

28. Nijiati, M., Saidaming, A., et al. 2013. GNB3, eNOS, and mitochondrial DNA polymorphisms

correlate to natural longevity in a Xinjiang Uygur population. PLoS One 8(12):e81806.

29. Pakendorf, B., Stoneking, M. 2005. Mitochondrial DNA and human evolution. Annu Rev

Genomics Hum Genet 6:165-83.

30. Palanichamy, M.G., Zhang, C.L., et al. 2010. Mitochondrial haplogroup N1a phylogeography,

with implication to the origin of European farmers. BMC Evol Biol 10:304.

31. Palmieri, V.O., De Rasmo, D., et al. 2011. T16189C mitochondrial DNA variant is associated

with metabolic syndrome in Caucasian subjects. Nutrition 27(7-8):773-7.

32. Parker, E., Phillips, D.I., et al. 2005. A common mitchondrial DNA variant is associated with

thinness in mothers and their 20-yr-old offspring. Am J Physiol Endocrinol Metab 289(6):E1110-

4.

33. Pike, D.A. 2006. Phylogenetic Networks for the Human mtDNA Haplogroup T. Department

of Mathematics and Statistics, Memorial University of Newfoundland, St. John's, Newfoundland,

Canada

34. Poulton, J., Brown, M.S., et al. 1998. A common mitochondrial DNA variant is associated

with insulin resistance in adult life. Diabetologia 41(1):54-8.

35. Poulton, J., Luan, J., et al. 2002. Type 2 diabetes is associated with a common mitochondrial

variant: evidence from a population-based case-control study. Hum Mol Genet 11(13):1581-3.

Page 67: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

67

36. Quintana-Murci, L., Chaix, R., et al. 2004. Where west meets east: the complex mtDNA

landscape of the southwest and Central Asian corridor. Am J Hum Genet 74(5):827-45.

37. Ridge, P.G., Maxwell, T.J., et al. 2012. Mitochondrial genomic analysis of late onset

Alzheimer's disease reveals protective haplogroups H6A1A/H6A1B: the Cache County Study on

Memory in Aging. PLoS One 7(9):e45134.

38. Rollins, B., Martin, M.V., et al. 2009. Mitochondrial variants in schizophrenia, bipolar

disorder, and major depressive disorder. PLoS One 4(3):e4913.

39. Roostalu, U., Kutuev, I., et al. 2007. Origin and expansion of haplogroup H, the dominant

human mitochondrial DNA lineage in West Eurasia: the Near Eastern and Caucasian perspective.

Mol Biol Evol 24(2):436-48.

40. Rosa, A., Fonseca, B.V., et al. 2008. Mitochondrial haplogroup H1 is protective for ischemic

stroke in Portuguese patients. BMC Med Genet 9:57.

41. Ruiz-Pesini, E., Lapena, A.C., et al. 2000. Human mtDNA haplogroups associated with high

or reduced spermatozoa motility. Am J Hum Genet 67(3):682-96.

42. Scott, R. 2011. Phylogeny of mt-hg U4a.

43. Serk, P. 2004. Human Mitochondrial DNA Haplogroup J in Europe and Near East: Tartu.

44. Shriver, M.D., Kittles, R.A. 2004. Genetic ancestry and the search for personalized genetic

histories. Nat Rev Genet 5(8):611-8.

45. Soini, H.K., Moilanen, J.S., et al. 2012. Mitochondrial DNA sequence variation in Finnish

patients with matrilineal diabetes mellitus. BMC Res Notes 5:350.

46. Starikovskaya, E.B., Sukernik, R.I., et al. 2005. Mitochondrial DNA diversity in indigenous

populations of the southern extent of Siberia, and the origins of Native American haplogroups.

Ann Hum Genet 69(Pt 1):67-89.

47. Toneva, D., Nikolova, S., et al. 2012. Anthropometrical characteristic of human bone remains

from Shekerdzha mound and Gabrova mound, village of Kamen, Sliven region (Bronze Age).

Acta Morphologica et Anthropologica 18:129-139.

48. Tully, L.A., Parsons, T.J., et al. 2000. A sensitive denaturing gradient-Gel electrophoresis

assay reveals a high frequency of heteroplasmy in hypervariable region 1 of the human mtDNA

control region. Am J Hum Genet 67(2):432-43.

49. Udar, N., Atilano, S.R., et al. 2009. Mitochondrial DNA haplogroups associated with age-

related macular degeneration. Invest Ophthalmol Vis Sci 50(6):2966-74.

50. van Oven, M., Kayser, M. 2009. Updated comprehensive phylogenetic tree of global human

mitochondrial DNA variation. Hum Mutat 30(2):E386-94.

51. Volodko, N.V., Starikovskaya, E.B., et al. 2008. Mitochondrial genome diversity in arctic

Siberians, with particular reference to the evolutionary history of Beringia and Pleistocenic

peopling of the Americas. Am J Hum Genet 82(5):1084-100.

52. Weng, S.W., Lin, T.K., et al. 2013. Single nucleotide polymorphisms in the mitochondrial

control region are associated with metabolic phenotypes and oxidative stress. Gene 531(2):370-6.

53. Димитрова, Д. 2011. Ловците на реликви: Труд.

54. Димитрова, Д. 2012. Могили от бронзовата епоха при с. Камен, Сливенско. Наука

22(1):36-41.

55. Йорданов, Й. 2000. Възтановяване на главата по черепа: АИ Проф. Марин Дринов.

Page 68: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

68

56. Йорданов, Й. 2000. Изследване на костите на чъргубиля Мостич - Възстановяване на

черепа по главата. Академично издателство "Марин Дринов", София:193-201.

57. Йорданов, Й., Тимева, Н. 2010 Предварителните данни от антропологичен подход при

ранно средновековен езически некропол край село Ножарево, район Силистра. In

Нуизматика, Сфрагистика, Епиграфия и Музеология. Pp. 33-40. Исторически муей, Полски

Тръмбеш: Абагард.

58. Попконстантинов, К., Костова, Р. 2013. Манастира на Георги, синкел на българите в

Преслав: История на едно българско аристократично семейство от X век. НИАМ АТ БАН

(Преслав, Община Велики Преслав ):44-63.

59. Попконстантинов, К., Костова, Р. 2013. Манастир на чъргубиля Мостич: м. Селище, В.

Преслав. Археологически открития и разкопки през 2012. 384-387.

60. Попконстантинов, К., Костова, Р. 2012. Манастир на чъргубиля Мостич: м. Селище, В.

Преслав. Археологически открития и разкопки през 2011. 419-422.

61. Попконстантинов, К., Костова, Р. 2011. Манастир на чъргубиля Мостич: м. Селище, В.

Преслав. Археологически открития и разкопки през 2010. 474-477.

62. Рашев, Р. 2008. Българска езическа култура от VII–IX век: София.

63. Рашев, Р., Станилов, С., et al. 1989. Прабългарски езически некропол и селище в близост

до село Ножарево, район Силистра. Археологични открития и разкопки през 1988.

Кърджали.

64. Рашев, Р., Станилов, С., et al. 1988. Ранносредновековен езически некропол и селище в

близост до село Ножарево, район Силистра. Археологични открития и разкопки през 1987.

Благоевград.

65. Рашев, Р., Станилов, С., et al. 1987. Ранносредновековен езически некропол и селище в

близост до село Ножарево, район Силистра. Археологични открития и разкопки през 1986.

Разград.

66. Рашев, Р., Станилов, С., et al. 1986. Прабългарски езически некропол и селище в близост

до село Ножарево, район Силистра. Археологични открития и разкопки през 1985: Велико

Търново.

67. Серафимова, Д.С. 1981. Средновековен некропол при с. Туховище, Благоевградско. ДИ

"Септември".

68. Турлаков, И. 2013-2016 Берекетска селищна могила.

Page 69: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

69

НАУЧНИ ПУБЛИКАЦИИ ПО ТЕМАТА

Nesheva D. Aspcts of ancient mitochondrial DNA analysis in different populations for understanding

human evolution. Balkan J Med Genet. 2014 Dec 11;17(1):5-14. doi: 10.2478/bjmg-2014-0019.

eCollection 2014.

D.V. Nesheva, S. Karachanak-Yankova, M. Lari, Y. Yordanov, A. Galabov, D. Caramelli, D.

Toncheva. Mitochondrial DNA Suggests a Western Eurasian Origin for Ancient (Proto-)Bulgarians.

2015. HUMAN BIOLOGY 87(1):19-28

Lazaridis I, Patterson N, Mittnik A, Renaud G, Mallick S, Kirsanow K, Sudmant PH, Schraiber JG,

Castellano S, Lipson M, Berger B, Economou C, Bollongino R, Fu Q, Bos KI, Nordenfelt S, Li H, de

Filippo C, Prüfer K, Sawyer S, Posth C, Haak W, Hallgren F, Fornander E, Rohland N, Delsate D,

Francken M, Guinet JM, Wahl J, Ayodo G, Babiker HA, Bailliet G, Balanovska E, Balanovsky O,

Barrantes R, Bedoya G, Ben-Ami H, Bene J, Berrada F, Bravi CM, Brisighelli F, Busby GB, Cali F,

Churnosov M, Cole DE, Corach D, Damba L, van Driem G, Dryomov S, Dugoujon JM, Fedorova SA,

Gallego Romero I, Gubina M, Hammer M, Henn BM, Hervig T, Hodoglugil U, Jha AR, Karachanak-

Yankova S, Khusainova R, Khusnutdinova E, Kittles R, Kivisild T, Klitz W, Kučinskas V,

Kushniarevich A, Laredj L, Litvinov S, Loukidis T, Mahley RW, Melegh B, Metspalu E, Molina J,

Mountain J, Näkkäläjärvi K, Nesheva D, Nyambo T, Osipova L, Parik J, Platonov F, Posukh O,

Romano V, Rothhammer F, Rudan I, Ruizbakiev R, Sahakyan H, Sajantila A, Salas A, Starikovskaya

EB, Tarekegn A, Toncheva D, Turdikulova S, Uktveryte I, Utevska O, Vasquez R, Villena M,

Voevoda M, Winkler CA, Yepiskoposyan L, Zalloua P, Zemunik T, Cooper A, Capelli C, Thomas

MG, Ruiz-Linares A, Tishkoff SA, Singh L, Thangaraj K, Villems R, Comas D, Sukernik R, Metspalu

M, Meyer M, Eichler EE, Burger J, Slatkin M, Pääbo S, Kelso J, Reich D, Krause J. Nature. Ancient

human genomes suggest three ancestral populations for present-day Europeans.2014 Sep

18;513(7518):409-13. doi: 10.1038/nature13673.

Sena Karachanak-Yankova & Desislava Nesheva, Angel S. Galabov, Draga Toncheva. Distribution of

East Eurasian Y-Chromosome and Mitochondrial DNA Haplogroups across Eurasia: Insights into the

Genetic Ancestry of Bulgarians. 2015. ADVANCES IN ANTHROPOLOGY 05(04):205-266

Карачанак С, Нешева Д, Тончева Д. Популационна генетика. Изменчивост и еволюция на

генофонда в „Геномна медицина“,П/Р Д. Тончева 2015, 84-90, изд. „СИМЕЛПРЕС“

УЧАСТИЕ В НАУЧНИ КОНГРЕСИ ПО ТЕМАТА

D. V. Nesheva1, S. Karachanak-Yankova

1, Y. Yordanov

2, , M. Lari

3, A. Galabov

4, D. Caramelli

3, D.

Toncheva1. Ancient mtDNA diversity in Bulgaria. J16.43. ESHG 2013, PARIS, FRANCE

D. V. Nesheva1, S. Karachanak-Yankova

1, Y. Yordanov

2, , M. Lari

3, A. Galabov

4, D. Caramelli

3, D.

Toncheva1. Ancient mtDNA diversity in Bulgaria. P17.06-M. ESHG 2014 |MILAN, ITALY

Page 70: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

70

SUMMARY

The Bulgarian historical past is one of the most discussed topics inciting many questions and

theories about the origin and development of the populations lived in these lands. The link between

our ancestors and how they have left traces to the present days it is not clarified. The development

of scientific fields such as paleogenetics and anthropogenetics helped to clarify the role of the

populations of the past by the study of ancient materials from different periods.

The study of the Bulgarian past is performed using genetic analysis and population study of 130

ancient samples from two big periods – III Millennium B.C. and VIII – X Century A.D. The main

idea of the work is the characterization and comparative analysis of mitochondrial DNA profiles of

populations in Bulgarian lands from Thracian and early medieval period. For the first time

anthropogenetic analysis of ancient samples of the past of Bulgaria is performed and it is

determined the mitochondrial DNA structure of Proto-Bulgarians and Thracians. For the main goals

of the study were performed three separate methods with different capacity and resolution. The first

Gabriel et al. method is with “mini-primer set” strategy for amplification. The modified form for

study on ancient mtDNA was developed and approved by the DNA laboratory of the US Army

(AFDIL) in order to use it in forensic investigation. In this study was analyzed hyper variable

segment I (HVSI) in ancient mtDNA from proto- Bulgarian samples. The second study is classical

method for sequencing using Sanger sequencing. In the second study were analyzed hyper variable

segment I and hyper variable segment II (HVS I and HVS II) of ancient mtDNA from Thracian and

proto-Bulgaria samples. The last method is next generation strategy for analyses and sequencing. In

this third method was analyzed whole mitochondrial DNA genome in ancient samples from

Thracian period.

The obtained results from analyses on ancient mtDNA in proto-Bulgarians presented the

haplogroup affiliation and the genetic position of this population among contemporary Bulgarians

and other populations from Europe and Asia. The main haplogrop is Hg H and her clades. This

haplogroup is found in 50% among Proto-Bulgarians. Other haplogroups and subclades, which were

found, are HV, J, T and U. They are typical Eurasian haplogroups. The genetic position of Proto-

Bulgarians in the mtDNA map is close to the contemporary Bulgarians and next to some European

populations such as Italians, Hungarians, Croatians, Greeks and Romanians.

The results from analyses on ancient mtDNA in Thracians present the haplogroup affiliation and

the genetic position of this population among contemporary Bulgarians and other populations from

Page 71: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

71

Europe and Asia. The main haplogrop is Hg H and its clades. Other haplogroups and subclades,

which were found, are HV,W, D, J, T, N, K and U. The haplogroup affiliation of Thracians is

different than proto- Bulgarian and this explain genetic divergence between Thracians and Proto-

Bulgarian. Thracians in the mtDNA map are distant from contemporary and ancient Bulgarians.

They are more close to some European populations such as Austrians and Slovaks.

In this study for the first time was determined the genetic structure of Proto- Bulgarians and

Thracians and their genetic position among other populations. It was proved the genetic proximity

between Proto- Bulgarians and modern Bulgarians and genetic distance between the Thracians and

modern Bulgarians. We rejected the theory of common genetic origin of modern and ancient

Bulgarians and Altaic and Turkic populations. For the first time have been shown variants in

Thracians that predisposed for development of diseases. For the first time it is optimized and used

method (NGS) for determination of mtDNA haplogroups by sequencing whole mitochondrial DNA

with a next generation sequencer. We created a database of unique genetic material from ancient

samples belonging to two large and essential for Bulgaria historical periods.

Page 72: ХАРАКТЕРИЗИРАНЕ ГЕНЕТИЧНИТЕ КОРЕНИ НА … Desislava Nesheva.pdf · Литературните източници са 373, от които 205 са

72

БЛАГОДАРНОСТИ

Изказвам най - сърдечни благодарности на:

-Научния ми ръководител чл. кор. проф. д-р Драга Тончева, за цялостната й подкрепа и

гласуваното ми доверие, предоставената ми възможност за работа по тази интересна тема и

за помощта при изработването, написването и оформянето на настоящата дисертация;

-На акад. проф. Ангел Гълъбов за постоянната подкрепа, организирането на проучването, за

безценните съвети и препоръки при обсъждането на резултатите за написването на

публикациите и настоящата дисертация;

На проф. Дейвид Карамели и д-р Мартина Лари от Катедрата по Биология, Лаборатория по

антропология, молекулярна антропология и палеонтология към Флорентинският

Университет, Флоренция, Италия за съветите и насоките в изработване на настоящият труд;

На чл.-кор. Йордан Йорданов за помощта при организирането на проучването и

предоставеният костен материал за провеждане на изследването;

На господин Георги Василев, посредством фондацията Транс Медия за финансирането на

научното изследване и предоставената възможност за довършване на настоящият труд

На колегите от Катедрата по Медицинска генетика за моралната подкрепа и помощта при

изработването и оформянето на настоящата дисертация;

На колегите от Катедрата по Биология, Лаборатория по антропология, молекулярна

антропология и палеонтология към Флорентинският Университет, Флоренция, Италия за

подкрепата и помощта при секвенирането и софтуерният анализ на резултатите;

На семейството и приятелите ми за вечната подкрепа и разбиране