Upload
jeanlouiskouakou
View
119
Download
5
Embed Size (px)
Citation preview
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
I
RPUBLIQUE DE CTE D'IVOIRE
UNION-DISCIPLINE-TRAVAIL
-------------------------------
MINISTRE DE L'ENSEIGNEMENT SUPRIEUR
ET DE LA RECHERCHE SCIENTIFIQUE
Laboratoire de Gntique
Dr KOUASSI Abou
MASTER 2 DE GNTIQUE
COURS MAGISTRAL UE GNTIQUE QUANTITATIVE
ECUE 2 : DISSECTION GNTIQUE DES CARACTRES
QUANTITATIFS
22 BP : 582 Abidjan 22
Tl. /Fax : 22 44 58 03
Courriel : [email protected]
01 BP V 34 Abidjan 01
Tl. /Fax : +225 22 44 35 31
www.univ-cocody.ci
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
I
LES OBJECTIFS DU COURS............................................................................................................. 1
Chapitre I. GNRALITS ............................................................................................................. 2
I. DFINITION DES NOTIONS DE CARACTRE QUANTITATIF ET DE QTL ..................... 2
II LES OBJECTIFS GNRAUX DE LA CARTOGRAPHIE DES QTLs .................................... 4
III LES TAPES DE LA CARTOGRAPHIE DE QTLs ................................................................. 5
Chapitre II. LES PR REQUIS LA CARTOGRAPHIE DES QTLs ..................................... 6
I. LE CHOIX DE LA POPULATION DE CARTOGRAPHIE ....................................................... 6
I.1 Populations pour la cartographie par analyse de liaison ......................................................... 6
I.1.1 Populations de cartographie chez les espces autogames .............................................. 6
I.1.1.1 Descendances F2 et Backcross .................................................................................. 7
I.1.1.2 Populations de familles Fx : y et lignes recombinantes ............................................. 7
I.1.1.3 Lignes quasi-isogniques et Haplodes doubls ...................................................... 8
I.1.1.3.1 Dfinitions et avantages ..................................................................................... 8
I.1.1.3.2 Limites des Lignes quasi-isogniques et Haplodes doubls ............................ 9
I.1.1.4 Les limites de toutes les populations de cartographie issues de croisement initial
entre lignes pures ................................................................................................................. 11
I.1.2 Populations de cartographie chez les espces allogames .............................................. 11
I-2. Populations pour la cartographie dassociation ...................................................................... 12
II. PHNOTYPAGE ...................................................................................................................... 13
III. GNOTYPAGE ET CONSTRUCTION DE CARTES GNTIQUES ................................. 14
III.1 Introduction ........................................................................................................................ 14
III.2 Les marqueurs dans la recherche de QTL .......................................................................... 15
III.2.1 Les marqueurs molculaires ......................................................................................... 15
III.2.2 Types de marqueur molculaire .................................................................................. 16
III.2.2.1 Polymorphismes de longueur des fragments de restriction (Restriction Fragment
Lengh Polymorphism - RFLP)............................................................................................... 16
III.2.2.2 ADN Polymorphe Amplifi au hasard (Ramdom Amplified Polymorphic DNA
RAPD) ................................................................................................................................... 19
III.2.2.3 Polymorphisme de Longueur de Fragments Amplifis (Amplified Fragments
Length polymorphism AFLP) ............................................................................................. 20
III.2.2.4 Microsatellites ...................................................................................................... 20
III.2.2.5 Les marqueurs SNP -Polymorphisme mono-nuclotidique (Single Nucleotide
Polymorphism) ...................................................................................................................... 21
III.3 Les stratgies de gnotypage .............................................................................................. 22
III.3.1 Le gnotypage de l'ensemble de la population de cartographie ................................. 22
III.3.2 Le gnotypage slectif .................................................................................................. 22
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
II
III.3.3 Le gnotypage aprs constitution de pools dindividus prsentant des phnotypes
contrasts (Bulk Segregant Analysis - BSA) ............................................................................... 23
III.4 Construction de carte gntique ......................................................................................... 25
III.4.1 Analyse statistique des marqueurs molculaires ......................................................... 25
III.4.2 Taille et structure du gnome ...................................................................................... 26
III.4.3 Saturation des cartes gntiques et assignation des groupes de liaisons aux
chromosomes ............................................................................................................................ 27
IV. EFFET DE LA TAILLE DE LA POPULATION ET DE LENVIRONNEMENT SUR LA
PUISSANCE DE DTECTION DES QTLs ..................................................................................... 28
Chapitre III LA CARTOGRAPHIE DE QTLs PAR ANALYSE DE LIAISON GNTIQUE
............................................................................................................................................................... 30
I GNRALITS ........................................................................................................................... 30
II. MTHODES DE CARTOGRAPHIE DE QTLs PAR ANALYSE DE LIAISON ................... 31
II.1 Cartographie de QTL par Analyse de variance (ANOVA).................................................. 31
II.1.1 Principe de la Cartographie de QTL par analyse de variance. ....................................... 31
II.1.2 Avantages et limites de la Cartographie de QTL par analyse de variance. ................... 32
II.2 Cartographie de QTL par analyse dintervalle simple (Simple Interval Mapping SIM). .. 34
II.2.1 Principe de la SIM .......................................................................................................... 34
II.2.2 Avantages et limites de la SIM....................................................................................... 34
II.3 Cartographie dintervalle composite (Composite Interval Mapping CIM) ....................... 36
II.3.1 Principe de la CIM .......................................................................................................... 36
II.3.2 Avantages et limites de la CIM. ..................................................................................... 36
II.4 Cartographie de QTL par analyse de plusieurs intervalles (Multiple Interval Mapping
MIM) .............................................................................................................................................. 37
III. SENSIBILIT DES MTHODES DE CARTOGRAPHIE DES QTLs LCART LA
NORMALIT DES DONNES PHNOTYPIQUES. ..................................................................... 37
IV. TESTS DE LA POSITION ET DE LEFFET DES QTLs. ...................................................... 38
IV.1 Les tests de permutation ..................................................................................................... 39
IV.2 La validation croise .......................................................................................................... 39
V. LES LIMITES DES MTHODES DE CARTOGRAPHIE DE QTLs PAR ANALYSE DE
LIAISON ........................................................................................................................................... 39
Chapitre IV. LA CARTOGRAPHIE DE QTLs PAR ANALYSE DE DSQUILIBRE DE
LIAISON OU CARTOGRAPHIE DASSOCIATION .................................................................... 41
II. LES CONCEPTS DE DSQUILIBRE DE LIAISON ET DE CARTOGRAPHIE
D'ASSOCIATION ............................................................................................................................. 42
III. VISUALISATION ET SIGNIFICATION STATISTIQUE DU DSQUILIBRE DE LIAISON
........................................................................................................................................................... 45
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
III
IV. VARIATION DU DSQUILIBRE DE LIAISON SOUS L'EFFET DE FACTEURS
BIOLOGIQUES ................................................................................................................................ 47
IV.1 Recombinaison ...................................................................................................................... 47
IV.2 Systme de reproduction .................................................................................................... 48
IV.3 Le matriel gntique ......................................................................................................... 48
V. VARIATION DU DSQUILIBRE DE LIAISON SOUS lEFFET DE FACTEURS
D'VOLUTION ................................................................................................................................ 49
V.1 Slection .............................................................................................................................. 49
V.2 Structure de la population .................................................................................................... 50
V.3 Drive gntique, goulot d'tranglement et flux de gnes ................................................... 51
V.3.1 La drive gntique ....................................................................................................... 51
V.3.2 Le goulot d'tranglement .............................................................................................. 51
V.3.3 Les flux gntiques ........................................................................................................ 51
VI. MTHODES DE CARTOGRAPHIE DASSOCIATION ...................................................... 52
VI.1 Multi-parent Advanced Generation Inter-Cross (MAGIC) ................................................ 52
VI.2 Case - control (CC) ............................................................................................................ 54
VI.3 Test de Dsquilibre de Transmission (Transmission disequilibrium Test -TDT) ............. 54
VII. AVANTAGES ET LIMITES DE LA CARTOGRAPHIE DASSOCIATION ..................... 55
VII.1 Avantages de la cartographie dassociation ....................................................................... 55
VII.2 Limites de la cartographie dassociation ........................................................................... 56
VII. PROGRAMMES STATISTIQUES POUR LA CARTOGRAPHIE DES QTLs ................... 58
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
1
LES OBJECTIFS DU COURS
La plupart des caractres d'intrt pour l'amlioration des espces ont une hrdit
quantitative qui complique le processus de slection puisque les performances phnotypiques
ne refltent que partiellement les valeurs gntiques des individus. La variation gntique d'un
caractre quantitatif est suppose tre contrle par les effets collectifs de loci effet
quantitatif (QTLs), de lpistasie (interaction entre QTLs), de l'environnement, et de
l'interaction entre QTLs et environnement. Lexploitation des marqueurs molculaires en
slection implique de trouver un sous-ensemble de marqueurs associs un ou plusieurs
QTLs qui rgulent l'expression des caractres complexes. De nombreuses tudes de
cartographie de QTLs ont identifis des QTLs qui expliquent gnralement une proportion
significative de la variance phnotypique, et par consquent, ont donn lieu une valuation
optimiste des perspectives de slection assiste par marqueurs. La cartographie par analyse de
liaison et la cartographie dassociation sont les deux mthodes les plus couramment utilises
pour la cartographie des QTLs.
Ce cours, organis en quatre chapitres, a pour objectif de faire comprendre les
diffrents aspects de ces deux mthodes de cartographie de QTLs.
Un chapitre introductif prsentera un aperu gnral de la notion de QTL.
Le deuxime chapitre traitera des pr-requis la cartographie des QTLs. On y
verra : les diffrents types de populations de cartographie avec leurs avantages et limites ; les
diffrents types de marqueurs molculaires avec leurs avantages et limites ; les diffrentes
stratgies de gnotypage avec leurs avantages et limites ; le phnotypage des populations de
cartographie et notamment les dispositions exprimentales ncessaires pour sa russite.
Le troisime chapitre portera sur les diffrentes mthodes de cartographie de QTL
par analyse de liaison (principe, avantages et limites)
Le quatrime chapitre sera consacr la cartographie par analyse de dsquilibre
de liaison ou cartographie dassociation. Le concept de dsquilibre de liaison y sera
prsent travers sa dfinition, son valuation statistique, les facteurs biologiques
(recombinaison, systme de reproduction, diversit gntique) et volutifs (slection, structure
de la population, drive gntique, goulot dtranglement, flux de gnes) susceptibles de le
modifier. Diffrentes mthodes de cartographie dassociation seront enfin vues avec leurs
principes, avantages et limites
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
2
Chapitre I. GNRALITS
I. DFINITION DES NOTIONS DE CARACTRE QUANTITATIF ET DE QTL
La slection des espces (plantes et animaux) est un processus en trois tapes, dans
lequel :
1 Les populations ou les collections de matriel gntique avec une variation
gntique utile sont cres ou assembles,
2 Les individus ayant des phnotypes suprieurs sont identifis et,
3 Des individus (cultivars, varits, races) amliors sont dvelopps partir
dindividus slectionns.
La plupart des caractres d'intrt pour l'amlioration des espces (par exemple, le
rendement, la hauteur, la rsistance la scheresse, la rsistance aux maladies chez de
nombreuses espces, etc) sont quantitatifs, aussi appels caractres polygniques, continus,
multifactorielles ou complexes. Un caractre quantitatif est une caractristique mesurable
qui dpend de l'action cumule de nombreux gnes, connus sous le nom de Quantitative
Trait loci - QTL (loci effet quantitatif), et de leur interaction avec l'environnement qui
peut varier d'un individu lautre, sur une plage de valeurs donne, pour produire une
distribution continue des phnotypes
Les caractres polygniques ne suivent donc pas les lois de transmission mendlienne
des caractres. Leurs phnotypes varient plutt gnralement le long d'un gradient continu
reprsent par une courbe en cloche. Les caractres quantitatifs compliquent les travaux des
amliorateurs parce que les performances des individus ne refltent que partiellement leurs
valeurs gntiques. En effet, tant donn que les caractres quantitatifs sont contrls par
plusieurs gnes ou QTLs :
1 Des individus avec le mme phnotype peuvent porter des allles diffrents
chacun des nombreux gnes ou QTL,
2 Des individus avec les mmes gnotypes aux QTLs peuvent montrer des
phnotypes diffrents lorsqu'ils sont placs dans des environnements diffrents, et
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
3
3 L'effet d'un QTL peut dpendre de la constitution alllique de lindividu un autre
QTL.
Pour ces raisons, on ne peut pas dduire le gnotype du phnotype, et il faut construire
des ressources gntiques spcialises et les valuer pour leurs performances phnotypiques
dans des environnements strictement contrls.
Le nombre de QTLs dtects dans une tude donne dpend de diffrents
facteurs, notamment le type et la taille de la population de cartographie utilise, les
caractres tudis, le nombre d'environnements utiliss pour le phnotypage et la
couverture du gnome par les marqueurs molculaires utiliss.
Les QTLs comprennent deux groupes de gnes :
Des gnes majeurs trs grands effets sur les caractres hautement hritables,
chacun expliquant une grande partie de la variation totale des caractres dans une population
de cartographie.
Des gnes mineurs faibles effets expliquant chacun une petite partie de la variation
totale des caractres
Cependant, la variation gntique de la plupart des caractres quantitatifs implique un
petit nombre de gnes ou de QTLs majeurs, un plus grand nombre de loci avec des effets
modrs, et un trs grand nombre de loci avec des effets mineurs. Les effets des gnes
majeurs peuvent tre tudis par analyse de sgrgation ainsi que par l'histoire de l'volution
et de la slection. Les nombreux gnes avec de petits effets, par contre, ne peuvent pas tre
tudis individuellement.
La thorie de la cartographie des QTLs a t dcrite pour la premire fois par Karl
SAX (1923) qui a not que la taille des graines du haricot (un caractre complexe) est
associe la couleur du tgument des graines (un caractre simple, monognique). Ce concept
a t mieux labor par Jhon THODAY (1961), qui a suggr que si la sgrgation des
monognes simplement hrits peut tre utilise pour dtecter des QTLs lis, il devrait
finalement tre possible de cartographier et de caractriser tous les QTLs impliqus dans les
caractres complexes.
Avant l'avnement de la cartographie moderne des QTLs, les caractres montrant une
variation quantitative ont t tudis par une analyse statistique de populations exprimentales
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
4
appropries sur la base des moyennes, des variances et covariances des phnotypes des
individus apparents sans aucune connaissance relle du nombre et de l'emplacement des
gnes qui les sous-tendent. Ces tudes ont port sur les distributions phnotypiques des
populations et des corrlations des phnotypes entre les individus ou les lignes apparents.
Lintrt pour la cartographie de QTLs chez les vgtaux est ne dtudes sur les caractres de
fruits de tomate (Paterson et al., 1988) et les caractres morphologiques et agronomiques du
mas (Stuber et al., 1992) qui ont russi dmontrer que certains marqueurs molculaires
expliquent une part importante de la variance phnotypique des caractres quantitatifs.
II LES OBJECTIFS GNRAUX DE LA CARTOGRAPHIE DES QTLs
Les deux objectifs gnraux de la cartographie des QTLs sont d:
1 Accrotre notre connaissance biologique de l'hritabilit et de l'architecture
gntique des caractres quantitatifs, tant au sein d'une espce quentre espces apparentes,
2 Identifier des marqueurs qui peuvent tre utiliss comme outils de slection
indirecte en matire d'amlioration gntique.
Les rsultats des tudes de cartographie de QTLs fournissent des informations sur :
a Le nombre et la localisation chromosomique de QTLs affectant un
caractre,
b Limportance et la direction de l'effet de chaque QTL ( savoir si un
caractre phnotypique est rgul par de nombreux gnes ou de nombreux loci indpendants
effet faible ou par quelques gnes effet fort),
c Le mode d'action des gnes chaque QTL (dominance ou additivit),
d Les sources parentales des allles favorables au QTL et,
e Les interactions entre les diffrents QTLs (pistasie, c'est dire, les
interactions entre deux QTL qui se traduisent par un effet sur le caractre qui ne pourrait pas
tre prvu par la somme des effets de chacun des QTLs) ou entre les gnotypes et
lenvironnement.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
5
III LES TAPES DE LA CARTOGRAPHIE DE QTLs
La cartographie des QTLs exige que on :
1 Slectionne et/ou dveloppe des populations de cartographie appropries
(populations exprimentales pour la cartographie par analyse de liaison ou populations
naturelles/ slectionnes pour la cartographie dassociation),
2 Mesure le phnotype des individus de la population pour le (les) caractres (s)
d'intrt (caractres morphologiques, caractres agronomiques, taux de sensibilit des
maladies et ravageurs, rsistance la scheresse, etc.) dans diffrents environnements,
3 Dcide du type de marqueur (s) molculaire (s), de la stratgie de gnotypage
(ensemble de la population, gnotypage slective ou analyse de sgrgation en mlange (BSA-
Bulk Segregant Analysis) et gnre les donnes molculaires pour un nombre suffisant de
marqueurs polymorphes uniformment repartis sur le gnome de la plante tudie,
4 Identifie des marqueurs molculaires lis au (x) caractre (s) d'intrt en utilisant
des programmes statistiques (les mthodes de cartographie de QTLs par analyse de liaison
ncessite la construction de carte de liaison gntique) et
5 Teste l'applicabilit et la fiabilit des marqueurs associs aux QTLs effet moyen
fort dans la prdiction du (des) caractres (s) dans les familles apparentes (validation ou
vrification de marqueurs).
La disponibilit d'une large gamme de marqueurs molculaires et de mthodes
statistiques puissantes a considrablement facilit la cartographie des QTLs. La cartographie
de liaison et la cartographie dassociation sont les deux outils les plus couramment utiliss
pour la dissection de caractres complexes. Les deux mthodes de cartographie de QTLs
commencent par la collecte de donnes gnotypiques et phnotypiques soit de
populations en sgrgation soit de populations naturelles, suivie par des analyses
statistiques pour rvler tous les locus marqueurs o la variation alllique est en
corrlation avec le phnotype.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
6
Chapitre II. LES PR REQUIS LA CARTOGRAPHIE DES QTLs
I. LE CHOIX DE LA POPULATION DE CARTOGRAPHIE
Le choix de la population de cartographie approprie est trs important pour la
russite de tout projet de cartographie de QTLs. Les populations pour la cartographie des
QTLs peuvent tre classes en deux catgories:
1 Les populations exprimentales pour la cartographie de QTLs par analyse de
liaison. Par exemple :
a Des lignes pures [individus identiques entre eux l'intrieur d'une
gnration (homognit) et identiques entre eux d'une gnration l'autre (stabilit). Le
gnotype est fix)] pour les espces autogames ou autopollinisation;
b Des familles de demifrres ou de plein-frres pour les espces
allogames ou pollinisation croise) et
2 Les populations naturelles ou les populations slectionnes pour la cartographie
d'association par analyse de dsquilibre de liaison.
I.1 Populations pour la cartographie par analyse de liaison
I.1.1 Populations de cartographie chez les espces autogames
La Cartographie de QTL par analyse de liaison dpend de populations bien dfinies.
Chez les espces autogames, les tudes de cartographie de QTL utilisent :
1 Des descendances F2 ou des familles Fx : y qui en sont drives,
2 Des descendances de rtrocroisements (backcross - BC),
3 Des lignes recombinantes consanguines (Recombinant Inbred Lines - RIL),
4 Des lignes quasi-isogniques (Near-Isogenic Lines-NILs) et
5 Des lignes dhaplodes doubls (Double Haploids - DH).
Ces populations sont dveloppes par le croisement de deux parents homozygotes
(lignes pures) clairement diffrents au niveau du (des) caractre (s) phnotypique (s) d'intrt
(Figure 1). Chaque population de cartographie dveloppe partir des parents
homozygotes a ses propres avantages et inconvnients et les chercheurs doivent choisir
la population approprie en fonction de l'objectif de leur projet de recherche, la
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
7
complexit du (des) caractres, le temps dont-ils disposent, et selon que les marqueurs
molculaires qui seront utiliss pour le gnotypage sont dominants ou codominants.
I.1.1.1 Descendances F2 et Backcross
Les descendances F2 et les descendances de Backcross sont les types de populations
de cartographie les plus simples, car elles sont faciles construire et il faut relativement peu
de temps pour les produire. La descendance F2 est plus puissante pour dtecter des QTLs
avec des effets additifs, et peut galement tre utilise pour estimer le degr de
dominance des QTLs dtects. Lorsque la dominance est prsente, les rtrocroisements
donnent des estimations biaises des effets car les effets additifs et de dominance sont
compltement confondus.
Les deux populations F2 et Backcross ont trois limites :
1 Le dveloppement de ces populations ncessite relativement peu de mioses de
telle sorte que mme les marqueurs loigns restent fortement associs aux QTL. Ces
associations longue distance entravent la localisation prcise des QTLs.
2 les populations F2 et backcross sont des populations temporaires car elles sont
trs htrozygotes et ne peuvent tre reproduites indfiniment par les graines (par
exemple, ces populations ne peuvent pas tre values plusieurs reprises dans diffrentes
conditions environnementales, sur des annes, en diffrents lieux, etc.)
3 les interactions pistatiques peuvent difficilement tre tudies dans les
populations F2 et backcross.
I.1.1.2 Populations de familles Fx : y et lignes recombinantes
En gntique quantitative classique, si un caractre a une faible hritabilit, on peut
prendre la moyenne de la famille comme unit de mesure et choisir les parents ayant la
performance moyenne leve sur la base de la moyenne de la famille parce que lhritabilit
estime partir de la moyenne de la famille peut tre considrablement augmente en
augmentant le nombre de descendants. Cette ide a d'abord t applique la cartographie
gntique pour les caractres faible hritabilit chez les animaux l'aide du dispositif fille
ou petite-fille (daughter or grand-daughter design), o la valeur phnotypique du pre est
remplace par la valeur phnotypique moyenne des filles. La mme ide a ensuite t
applique aux plantes en remplaant la valeur phnotypique d'une plante de F2 par la moyenne
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
8
de la progniture F3. Tous les descendants F3 issue de la mme plante F2 appartiennent la
mme famille F2:3, note F2:3. Si la taille de chaque famille F2:3 (le nombre de descendants
F3) est suffisamment grande, la valeur moyenne de la famille reprsente la valeur
gnotypique de la plante F2, et donc la puissance de la cartographie des QTL peut
augmenter de faon significative.
On peut augmenter le nombre de gnrations de 3 y pour obtenir un dispositif Fx:y.
Dans de tels cas, le gnotypage sera effectu sur les plantes de la gnration x et le
phnotypage sur les plantes de la gnration y, avec y > x. Alternativement, le gnotypage
peut galement tre effectu en mlangeant l'ADN ou les feuilles d'au moins 15 individus de
mme famille de la gnration y.
Lorsque y augmente au moins 6 gnrations, le dispositif devient un dispositif de
lignes recombinantes (Recombiant Inbred Line RIL). Les RIL sont issus d'une population
F2 par des gnrations de croisements entre individus pleins-frres (croisement entre
descendants des mmes parents pour les espces pollinisation croise) ou
dautofcondations (Bulk ou Single Seed Descent). Les RIL sont des lignes homozygotes
avancs qui ont subi plusieurs cycles dautofcondation. Ces multiples gnrations de
croisements augmentent le nombre potentiel d'vnements de recombinaison et amliorent la
rsolution de la cartographie (un nombre suffisant de mioses ont eu lieu pour rduire le
dsquilibre de liaison entre les marqueurs modrment lis).
I.1.1.3 Lignes quasi-isogniques et Haplodes doubls
I.1.1.3.1 Dfinitions et avantages
Si la slection par rtrocroisement est rpte au moins sur six gnrations, plus de
99% du gnome des individus choisis au hasard dans la descendance du rtrocroisement 6
(Backcross 6 - BC6), et des rtrocroisements suivants, proviendra du parent rcurrent.
LAutofcondation des individus slectionns dans la descendance du rtrocroisement 7,
note BC7F1, va produire deux types de lignes BC7F2, homozygotes pour les deux allles au
locus du gne cible, qui sont dits quasi-isogniques lun avec l'autre et avec le parent receveur
(NearIsogenic Lines NIL).
Lanalyse de familles consanguines htrognes est aussi une mthode pour
dvelopper rapidement les lignes quasi-isogniques (NIL) pour un QTL identifi dans des
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
9
lignes consanguines. La slection pour le caractre cible est requise pour la gnration des
NIL.
En fixant essentiellement le fond gntique, les lignes quasi-isogniques sont
idales pour :
a) la cartographie gntique haute rsolution,
b) le suivi de lexpression des gnes, et une conduite plus directe
dexprimentation biologique fonde sur une hypothse.
c) l'tude des effets phnotypiques attribuables un QTL puisque le fond
gntique, contrlant les caractres morphologiques et phnologiques qui influencent
gnralement les valuations phnotypiques des caractres quantitatifs, est uniforme.
Les populations dhaplodes doubls (Double Haploids - DH) sont galement
utilises pour la cartographie des QTL chez plusieurs espces. La mthodologie de production
des haplodes doubls amliore l'efficacit de lamlioration en gnrant des lignes
consanguines avec 100% de puret et duniformit gntique en seulement deux gnrations.
Les lignes dhaplodes doubls rendent facile la conduite des tudes gntiques et
raccourcissent significativement la dure de la slection.
Les lignes recombinantes (RIL), quasi-isogniques (NILs) et haplodes doubles
(DH) sont des populations permanentes parce qu'elles sont des lignes homozygotes qui
peuvent tre multiplis sans quil ne se produise des modifications gntiques. Les
semences de RIL, NILs et DH peuvent tre transfres entre diffrents laboratoires de
cartographie afin de s'assurer que tous les collaborateurs examinent le mme matriel, de sorte
que les rsultats gntiques de phnotypage, de gnotypage et de cartographie de QTL dans
les laboratoires puissent tre mis ensemble.
I.1.1.3.2 Limites des Lignes quasi-isogniques et Haplodes doubls
Les principales limites des lignes quasi-isogniques et des lignes recombinantes
viennent du fait que :
1 Le temps et /ou le cot ncessaires pour dvelopper ces populations sont grands et
2 Ces populations ne dtectent que la composante additive, mais ne fournissent
aucune information sur les relations de dominance pour tout QTL.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
10
Les populations dhaplodes doubls sont plus rapides gnrer que les lignes
recombinantes et les lignes quasi-isogniques, mais la production dhaplodes doubls est
seulement possible pour les espces chez lesquelles un protocole de production dhaplodes
est bien tabli.
Figure 1 : Diffrentes populations de cartographies gnres partir de deux lignes parentales pures
dune espce autogame
Une fois les parents choisis, une descendance en sgrgation de plusieurs dizaines d'individus sera
ncessaire pour obtenir un chantillon d'vnements miotiques suffisant pour estimer le plus prcisment
possible les taux de recombinaison entre les marqueurs. Classiquement, les pedigrees utiliss sont :
- une descendance F2, issue de l'autofcondation d'un hybride simple F1,
- une population "bulk F3" drive d'individus F2 par une gnration d'autofcondation,
- une population de lignes recombinantes (RIL) drive des individus F2 par 5 6 gnrations
d'autofcondation sans slection,
- un croisement en retour (backcross) de premire gnration lorsque l'hybride F1 est recrois un de ses
parents,
- des lignes quasi-isognique(NIL) slectionnes aprs au moins six gnrations de rtrocroisement avec le
parent rcurrents,
- des lignes issues d'haplodes doubls (HD) chez les espces o l'on sait induire les phnomnes
d'andrognse ou de gynognse,
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
11
I.1.1.4 Les limites de toutes les populations de cartographie issues de croisement initial
entre lignes pures
Les limites communes toutes les populations de cartographie labores partir des
lignes pures sont que :
1 L'intervalle de confiance pour de nombreux QTLs cartographis en utilisant la
taille la plus couramment utilise de population (100-200 individus) est de plusieurs
centimorgans, qui pourraient correspondre des centaines de gnes;
2 Le faible nombre d'allles chantillonns par locus dans chaque population rend
difficile lexamen de l'ventail complet de la diversit gntique disponible pour de
nombreuses espces et ;
3 Pour certaines espces telles que celles pollinisation croise, il est souvent
impossible (en raison de la dpression de consanguinit ou de lauto-incompatibilit) ou trs
peu pratique, trs long et/ou coteux de produire des lignes consanguines.
I.1.2 Populations de cartographie chez les espces allogames
Les analyses gntiques chez les espces pollinisation croise sont beaucoup plus
complexes que chez les espces qui peuvent tre autofcondes pour produire des lignes
consanguines. Certaines des difficults surgissent lorsque des parents htrozygotes et
htrognes sont croiss pour dvelopper une population de cartographie.
1 Le nombre d'allles aux marqueurs et le profil de sgrgation des gnotypes
aux marqueurs peut varier d'un locus lautre chez les espces pollinisation croise,
tandis quune population en sgrgation cre partir de lignes pures a toujours deux allles
et un rapport de sgrgation prvu chacun des diffrents marqueurs.
2 Des complications surviennent si les parents ont des allles en commun au
QTL ou au locus marqueurs, ou si les parents partagent des allles au QTL dans
diffrentes phases de liaison avec le locus marqueur.
3 Les phases de liaison entre les diffrents marqueurs ne sont pas connues a
priori pour les parents homozygotes et, par consquent, un algorithme doit tre utilis pour
caractriser une phase de liaison la plus probable pour l'analyse de liaison.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
12
Pour surmonter ces problmes, les stratgies du double pseudo-testcross, des
familles de demi-frres et de plein-frres issus de croisements contrls sont utilises pour
les espces allogames. Les proprits biologiques (dpression de consanguinit, auto-
incompatibilit) des espces allogames empchent la gnration de lignes pures et, par
consquent, de tout croisement avanc. Cependant, parce que ces espces sont trs
htrozygotes, la descendance F1 issue du croisement entre deux parents affiche souvent
diffrents types de sgrgation. Certains loci peuvent avoir quatre allles diffrents entre les
parents croiss, gnrant ainsi quatre classes de gnotypes dans la descendance. Beaucoup
d'autres peuvent galement prsenter le profil de sgrgation dune descendance F2 dans les
proportions 1:2:1 ou le profil de sgrgation dune descendance de backcross dans les
proportions 1:1. La stratgie du double pseudo-testcross utilise les marqueurs en sgrgation
1 :1, c'est dire ceux qui sgrgent chez un parent mais pas chez l'autre, pour construire une
carte gntique spcifique chacun des parents. La limite de la stratgie du double pseudo
testcross est qu'elle ne permet quune utilisation partielle des marqueurs molculaires.
I-2. Populations pour la cartographie dassociation
Pour la cartographie d'association, les populations peuvent tre classes dans l'une des
cinq groupes suivants:
1 chantillon idal prsentant une structure subtile de population et des relations
familiales (En biologie ou en cologie, une population est un groupe d'organismes vivants de
la mme espce qui coexistent et se reproduisent entre eux sur un territoire dtermin ou
dans un mme habitat),
2 chantillon multi-famille,
3 chantillon prsentant une structure de population,
4 chantillon ayant la fois une structure de population et des relations familiales, et
5 chantillon avec une structure franche de population et des relations familiales.
En raison de l'adaptation locale, de la slection et de l'histoire de lamlioration de
nombreuses espces, de nombreuses populations de cartographie d'association se classent
plutt dans la catgorie quatre.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
13
Alternativement, les populations de cartographie d'association peuvent tre classes
selon leur origine telle que les collections des banques de matriel gntique, les populations
synthtiques, et le matriel gntique lite.
II. PHNOTYPAGE
Les donnes phnotypiques idales pour la cartographie des QTLs sont les valeurs des
performances phnotypiques des individus dans diffrents environnements. L'exactitude et la
prcision du phnotypage dtermine le ralisme des rsultats de la cartographie de QTL. La
puissance de dtection de QTL, dfinie comme tant la probabilit de dtection d'un QTL
un seuil de significativit statistique donn, dpend :
1 du nombre de descendants dans la population (taille de l'chantillon),
2 de l'hritabilit du caractre,
3 de la dissemblance gntique entre descendants,
4 de l'effet du QTL et,
5 de l'environnement utilis pour l'valuation phnotypique.
En raison de la disponibilit d'outils molculaires haut dbit et faible cot, le
gnotypage ne limite plus la taille de la population dans les tudes de cartographie gntique
mais le cot et la logistique de phnotypage imposent des limites sur la taille de l'chantillon.
Cela est particulirement vrai pour les phnotypes des caractres complexes.
Le niveau de l'hritabilit d'un caractre dpend en partie de la reproductibilit du
phnotypage sur diffrentes saisons, et dans diffrents lieux et environnements. Une
prcision accrue de phnotypage augmente lhritabilit qui, son tour, augmente la
puissance statistique de dtection des QTLs
Un protocole de phnotypage approprie doit comprendre :
1 un chantillon reprsentatif d'environnements diffrents et leur emplacement
optimal;
2 un nombre de rptitions par individu dans chaque environnement;
3 un dispositif exprimental tenant compte efficacement de la variation du milieu
dans les parcelles exprimentales;
4 des mthodes statistiques appropries pour l'analyse efficace des donnes et,
5 la prise en considration de linteraction QTL x environnement.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
14
La rptition indique simplement le nombre de parcelles attribues un individu. Elle
est ncessaire pour obtenir une estimation interne de la variance de l'erreur exprimentale et
pour sparer la variance de lerreur de la variance de l'interaction gnotype x environnement.
La randomisation fournit la validit statistique aux rsultats et protge contre les
biais. Le contrle local de l'erreur peut tre obtenu par la rpartition des parcelles dans des
blocs de sorte maximiser la variation inter-blocs et minimiser la variation intra - bloc.
Lorientation des blocs, dans la mesure du possible, doit tre perpendiculaire la pente du
champ exprimental, de la serre, etc. Cependant, il y a toujours une certaine variation qui reste
incontrle dans les blocs. La comparaison croise des donnes de phnotypage des
populations dans diffrents environnements est ncessaire afin de dterminer la faon dont
l'association marqueur - caractre identifie dans un environnement peut tre utilise pour la
slection dans un autre environnement.
La rptition et la randomisation des individus et le contrle local des erreurs,
lorsqu'ils sont correctement utiliss, ont trois avantages:
1 Ils permettent de sparer les vritables diffrences entre les performances
phnotypiques des individus et lerreur rsiduelle;
2 Ils maximisent le rapport diffrences entre performances phnotypiques
des individus /erreur rsiduelle,
3 ils fournissent une estimation valable et objective du niveau
derreur/incertitude dans les rsultats.
III. GNOTYPAGE ET CONSTRUCTION DE CARTES GNTIQUES
III.1 Introduction
L'hypothse de base qui sous-tend l'utilisation des locus marqueurs dans la recherche
de QTL, est quil existe un dsquilibre de liaison entre les allles au locus marqueur et le
polygne li. Le dsquilibre de liaison est, l'association non alatoire des allles des loci
diffrents dans une population, cause par la slection, la drive gntique et d'autres facteurs.
La population en sgrgation est divise en fonction des gnotypes des individus au
locus marqueur, puis des procds statistiques sont utiliss pour dterminer si les groupes
dindividus diffrent significativement l'un de l'autre par rapport au caractre mesur. Si une
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
15
diffrence significative est dtecte cela est interprt comme un gne affectant la
caractristique est li au locus marqueur utilis pour subdiviser population.
III.2 Les marqueurs dans la recherche de QTL
III.2.1 Les marqueurs molculaires
Les marqueurs lis sont utiliss dans la recherche de QTLs pour analyser
indirectement les QTLs. La capacit de dtecter la variation gntique au niveau de l'ADN a
permis un approvisionnement sans fin de marqueurs pour toutes les espces d'intrt. Il est
maintenant courant d'utiliser 50 200 marqueurs pour l'analyse fine des QTLs. Cela a
entran une explosion de l'utilisation des mthodes base de marqueurs en gntique
quantitative.
Par rapport aux marqueurs morphologiques, lintrt des marqueurs
molculaires pour la recherche de QTLs se dcline en cinq caractristiques:
1. La neutralit phnotypique - Le problme de gnes marqueurs ayant un effet
phnotypique plus grand que le polygne li est surmont par les marqueurs molculaires.
Diffrents allles ne provoquent pas un changement dans le phnotype de l'organisme ; ils se
distinguent par leurs vitesses de migration sur un gel.
2. Le polymorphisme - Le niveau de polymorphisme est maintenu par de nombreux
facteurs. Il s'agit notamment de la taille de la population, du mode de reproduction, de la
slection, du taux de mutation et de la migration. Les faibles pressions de slection et taux de
mutation provoquent des variations suprieures au niveau des marqueurs molculaires. Ceci,
combin avec la sensibilit accrue des techniques de dtection des variations molculaires,
augmente le nombre de sites d'informatifs qui sont disponibles dans les croisements.
3. Labondance Il existe plus de marqueurs molculaires que les isoenzymes ou les
marqueurs morphologiques. Des cartes compltes de liaison gntique sont maintenant
disponibles pour certaines espces.
4. La codominance - La plupart des marqueurs molculaires sont codominants. Cela
signifie qu'il y a une relation un pour un entre le gnotype et le phnotype. Les marqueurs
morphologiques ont tendance tre dominants ou rcessifs, ce qui diminue la dtection des
QTLs.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
16
5. Lpistasie - C'est l'interaction entre les gnes non allles, par laquelle lun
interfre avec l'autre. Cela tend se produire dans les caractres morphologiques et rduit le
nombre de marqueurs qui peuvent tre confirms.
III.2.2 Types de marqueur molculaire
III.2.2.1 Polymorphismes de longueur des fragments de restriction (Restriction
Fragment Lengh Polymorphism - RFLP)
Les marqueurs RFLP sont utiles dans la recherche de QTL en raison de:
1 Labsence de dominance
2 - Le nombre de multiples formes allliques
3 L'absence d'effet pliotropique sur d'autres caractres
Les fragments de restriction sont produits par le clivage des squences d'acides
nucliques spcifiques dans l'ADN par des endonuclases de restriction. Ces enzymes
reconnaissent des squences spcifiques d'acides amins et coupent lADN ces sites. Plus un
site de restriction est frquent dans l'ADN, plus souvent, il sera cliv et plus les fragments de
restriction seront produits et spars par lectrophorse.
Des fragments spcifiques peuvent tre identifis par l'utilisation d'une sonde
radioactive approprie, consistant en une squence d'ADN clone homologue un
fragment d'ADN particulier, dans des conditions favorisant l'hybridation, aprs le transfert
du profil d'lectrophorse sur un support solide de nitrocellulose. La sonde s'hybride avec
l'ADN sur le filtre, qui est ensuite plac sur une pellicule photographique pour exposition. En
utilisant des sondes spcifiques, des squences aussi rares que un sur un million peuvent tre
identifies.
Les changements dans la squence de bases d'ADN peuvent se traduire par la
suppression ou la cration de squences reconnues par les enzymes de restriction. Il en
rsulte diffrents sites de clivage chez diffrents individus. Un grand nombre d'enzymes
de restriction (Tableau I), qui clivent des squences diffrentes sont disponibles. En
consquence, une grande partie du gnome peut tre chantillonn et la capacit du procd
dtecter des polymorphismes est pratiquement illimite (Botstein el al, 1980).
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
17
Tableau I : Exemples denzymes de restriction
Enzyme Source Squence
reconnue Coupure
Extrmits
(aprs
coupure)
EcoRI Escherichia coli 5'GAATTC
3'CTTAAG
5'---G AATTC---3'
3'---CTTAA G---5' Cohsives
BamHI Bacillus
amyloliquefaciens
5'GGATCC
3'CCTAGG
5'---G GATCC---3'
3'---CCTAG G---5' Cohsives
HindIII Haemophilus
influenzae
5'AAGCTT
3'TTCGAA
5'---A AGCTT---3'
3'---TTCGA A---5' Cohsives
MstII Microcoleus species 5'CCTNAGG
3'GGAMTCC
5'---CC TNAGG---3'
3'---GGAMT CC---5' Cohsives
TaqI Thermus aquaticus 5'TCGA
3'AGCT
5'---T CGA---3'
3'---AGC T---5' Cohsives
NotI Nocardia otitidis 5'GCGGCCGC
3'CGCCGGCG
5'--GC GGCCGC--3'
3'--CGCCGG CG--5' Cohsives
HinfI Haemophilus
influenzae
5'GANTC
3'CTNAG
5'G ANTC
3'CTNA G
AluI Arthrobacter luteus 5'AGCT
3'TCGA
5'---AG CT---3'
3'---TC GA---5' Franches
BgIIII Bacillus globigii 5'AGATCT
3'TCTAGA
5'---A GATCT---3'
3'---TCTAG A---5' Cohsives
HaeIII Haemophilus
aegyptius
5'GGCC
3'CCGG
5'---GG CC---3'
3'---CC GG---5' Franches
HhaI Haemophilus
haemolyticus
5'GCGC
3'CGCG
5'---GCG C---3'
3'---C GCG---5' Cohsives
PstI Providencia stuartii 5'CTGCAG
3'GACGTC
5'---CTGCA G---3'
3'---G ACGTC---5' Cohsives
SmaI Serratia marcescens 5'CCCGGG
3'GGGCCC
5'---CCC GGG---3'
3'---GGG CCC---5' Franches
La nomenclature des enzymes de restriction est prcise. Leur nom comporte 3 ou 4 lettres correspondant entre
autres la bactrie partir de laquelle on a extrait cette enzyme :
La premire lettre est en majuscule cela correspond la premire lettre du genre de la bactrie
La seconde et la troisime lettre sont en minuscule et correspondent aux deux premires lettres de l'espce bactrienne
La quatrime lettre correspond la souche bactrienne, elle est crite en majuscule mais n'est pas prsente dans toutes les enzymes de restriction
Enfin un chiffre romain donne le numro d'ordre de caractrisation de l'enzyme
Ainsi on a EcoRI : Enzyme de restriction d'Escherichia (genre) coli (espce) souche RY317 la premire tre
caractrise (I)
Le N et le M dans les squences de MstII et HinfI peuvent tre remplacs par une des 4 bases et son
complment.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
18
Figure 2 : tapes de la rvlation du RFPL port par un ADN.
Marqueur RFLP = couple enzyme / sonde
Figure 3 : Mise en vidence d'un site RFLP rvl par une sonde X et TaqI
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
19
III.2.2.2 ADN Polymorphe Amplifi au hasard (Ramdom Amplified Polymorphic DNA RAPD)
La production de ces marqueurs se fait par l'utilisation d'amorces dans la raction de
polymrisation en chane. Les amorces fonctionnent dans le sens (5----3), inverse du sens de
lecture de l'ADN (3----5). Lorsque des squences d'amorces sont suffisamment rapproches
pour permettre lhybridation, la raction en chane de la polymrase rplique la rgion d'ADN
en aval du site dhybridation de lamorce, en produisant un fragment amplifi. Si les sites de
liaison d'amorces sont absents ou la distance entre les rgions est trop grande, la PCR choue
et l'amplification ne se produit pas. Les squences polymorphes produites par cette mthode
sont appels RAPD.
L'avantage du RAPD sur le RFLP, est qu'une seule amorce peut rvler plusieurs
loci la fois et de plus petites quantits d'ADN sont ncessaires. Un problme avec les
RAPD est qu'ils sont des marqueurs dominants du fait de marqueurs homozygotes ayant ou
non la squence de lamorce. La conclusion gnrale est que les RAPD sont en termes de
cots plus rentables que les RFLP lorsque la taille de l'chantillon est petite.
Marqueur RAPD = amorce de squence arbitraire
Figure 4 : Mise en vidence d'un marqueur RAPD
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
20
III.2.2.3 Polymorphisme de Longueur de Fragments Amplifis (Amplified Fragments
Length polymorphism AFLP)
Les marqueurs AFLP sont obtenus par l'amplification de fragments de restriction
slectionns dun ADN gnomique total digr avec deux enzymes de restriction. Les
produits amplifis sont spars par lectrophorse dnaturant sur gel de polyacrylamide. Un
grand avantage de la technique AFLP est qu'elle permet l'identification simultane d'un
grand nombre de produits d'amplification. Cest aussi un des moyens les plus efficaces
pour construire une carte gntique haute densit.
Marqueur RFLP = couple enzyme / amorce
Figure 5 : tapes de la technique AFLP
III.2.2.4 Microsatellites
Les microsatellites sont des squences d'ADN formes par une rptition continue
de motifs composs de 2 10 nuclotides. Les anglophones les nomment Simple Sequence
Repeats (SSR), Short Tandem Repeats (STR) ou Variable Number Tandem Repeats
(VNTR). Ils ont tendance tre trs polymorphes du fait dun taux lev de mutations
rsultant en des changements dans le nombre de rptitions en tandem. Lidentification des
squences se fait par le nombre de squences rptes, ce qui fait que les marqueurs
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
21
microsatellites sont codominants. Les individus homozygotes peuvent tre distingus des
htrozygotes, car ils ont deux copies du mme nombre de rptitions de motifs, mais des
homozygotes ne peuvent pas tre distingus les uns des autres.
Marqueur = paire damorces spcifiques bordant le microsatellite
Figure 6 : tapes de la mise en vidence des microsatellites
III.2.2.5 Les marqueurs SNP -Polymorphisme mono-nuclotidique (Single Nucleotide
Polymorphism)
Les rcents progrs en matire d'analyse de squences d'ADN et la mise au point de
mthodologies haut dbit ont rendu possible l'identification et l'analyse de la variation
nuclotidique grande chelle. Le marquage molculaire par SNP permet de reprer les
diffrences au niveau d'un nuclotide dans une squence d'ADN.
Cette technique consiste hybrider sur l'ADN cible une sonde complmentaire
portant une molcule fluorescente (le fluorophore). Chaque sonde est spcifique d'une
squence d'ADN donne.
La deuxime tape consiste en une longation par action de la Taq polymrase
(PCR). Cette enzyme ajoute, l'extrmit des amorces, des oligonuclotides prsents dans le
milieu de raction et libre les fluorophores fixs sur les sondes.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
22
Enfin, une visualisation par excitation et quantification du fluorophore, une
longueur d'onde qui lui est propre, est ralise. Les individus A et B ne rvlent pas la mme
fluorescence, ils ont donc un polymorphisme au niveau d'un nuclotide.
Cette technologie qui permet d'liminer entirement les tapes de sparation de taille
par lectrophorse prsente un potentiel d'automatisation trs suprieur aux technologies
prcdentes (RFLP, RAPD, AFLP, SSR...). Elle peut donc tre ralise trs haut dbit. Le
marquage SNP ou Snip permet d'obtenir des rsultats prcis pour diffrencier des allles entre
individus. Les marqueurs SNP sont des marqueurs dominants.
III.3 Les stratgies de gnotypage
Les donnes de gnotypage (avec des marqueurs molculaires) peuvent tre obtenues
de l'une des trois faons suivantes:
1 Par gnotypage de tous les individus de la population de cartographie;
2 Par gnotypage dune partie des individus de la population qui prsentent des
phnotypes extrmes pour le caractre dintrt, connu sous le nom de gnotypage slectif;
3 - Par gnotypage de mlanges dindividus choisis, connu sous le nom d'analyse de
mlanges sgrgeant (Bulk Segregant Analysis BSA).
III.3.1 Le gnotypage de l'ensemble de la population de cartographie
La mthode classique de cartographie de QTLs ncessite le gnotypage de l'ensemble
de la population de cartographie avec des marqueurs rpartis sur l'ensemble du gnome. Cette
approche est plus fiable mais vaste, longue et coteuse.
III.3.2 Le gnotypage slectif
La seconde approche est le gnotypage slectif (Figure 7) qui implique le gnotypage
d'individus slectionns qui sont choisis sur la base de leurs phnotypes (gnralement ceux
ayant des valeurs phnotypiques extrmement leves et/ou faibles). Le gnotypage slectif
permet de rduire le nombre dindividus qui doivent tre gnotyps pour dtecter des QTL en
utilisant uniquement des individus au niveau de lune ou des deux queues de la distribution
phnotypique pour le caractre quantitatif d'intrt Le gnotypage slectif est utile dans les
situations o le gnotypage de la population complte est trop coteux ou impossible, ou
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
23
lorsque l'objectif est de dtecter rapidement un grand nombre de donneurs potentiels pour les
allles utiles ayant des effets forts.
Le gnotypage unidirectionnel (gnotypage au niveau dune queue de la distribution)
est d'un intrt particulier pour son application dans les programmes de slection, car il a le
potentiel de permettre la dtection de QTLs en utilisant les descendants de qualit suprieure
qui ont t retenus par slection dans les programmes damlioration. Cela permet quun plus
grand nombre de donneurs potentiels soient analyss pour des allles ayant des effets dans
diffrents fonds gntiques.
Gnralement, il est conseill de faire le gnotypage d'environ 30% dindividus
de chaque queue de distribution. Cependant, mesure que la taille de la population
augmente, la proportion requise dindividus de chaque queue diminue de telle sorte qu un
certain moment un nombre absolu dindividus de chaque queue deviendra crucial.
Le gnotypage slectif n'est pas largement adopt, en raison de :
1 - La distorsion de sgrgation dans les populations de cartographie gntique,
2 Lestimation biaise des effets de QTLs lis et,
3 La contrainte de ne pouvoir tudier quun seul caractre la fois.
Le gnotypage slectif permet de rduire la taille de la population de
cartographie qui, en gnral, va diminuer la puissance de dtection des QTLs,
augmenter l'intervalle de confiance des QTLs et augmenter la probabilit de dtection
de QTLs faux positifs.
III.3.3 Le gnotypage aprs constitution de pools dindividus prsentant
des phnotypes contrasts (Bulk Segregant Analysis - BSA)
La troisime approche est la stratgie du mlange (Bulk Segregant Analysis - BSA,
figure 6) qui accentue un peu plus l'approche de gnotypage slectif soit par le regroupement
de dindividus (groupage de poids gal dchantillon de chaque individu avant l'extraction de
l'ADN) soit par le mlange d'ADN (mlange dADN aprs l'extraction et lhomognisation
des concentrations) partir dindividus slectionns chacun des deux phnotypes extrmes.
La BSA mesure la variation prsente dans les pools dindividus qui ont t tris selon leurs
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
24
phnotypes et utilise la corrlation entre ces mesures et les pools de phnotypes pour
dterminer une position probable sur une carte gntique.
L'analyse thorique de la BSA pour les expriences impliquant des descendances de
backcross, F2 et des familles de demi-frres montre que la puissance de la mise en commun
slective de l'ADN pour la dtection des gnes effet important peut tre la mme que celle
obtenue par le gnotypage slectif individuel. Toutefois, la BSA n'est gnralement pas
considre comme une approche utile pour soit la dtection de QTLs qui peut tre
conditionne par plusieurs gnes avec un petit effet, ou lorsque le QTL est faiblement li au
marqueur. Cela sexplique par le fait que les deux pools sont souvent contamins par des
allles alternatifs si les individus sont mal phnotyps ou si une recombinaison se produit.
Figure 7. Principe du gnotypage slectif et de l'analyse de pools en sgrgation.
La mthode de gnotypage slectif implique la slection d'individus prsentant des valeurs phnotypiques trs
hautes et basses (dans la zone hachure) de la distribution continue d'un caractre quantitatif d'intrt. Les
individus slectionns sont gnotyps et l'association est teste. La Bulk Segregant Analysis BSA accentue un
peu plus l'approche de gnotypage slectif en regroupant les individus slectionns dans chacune des deux
queues de la courbe de distribution des phnotypiques, chaque queue tant reprsente que par un seul
chantillon de mlange.
La fiabilit de la BSA pour la cartographie des QTLs peut tre affecte par :
1 une densit insuffisante de marqueur,
2 la petite taille des populations, ce qui entrane des diffrences phnotypiques entre
pools qui sont suffisantes seulement pour identifier les gnes ou QTLs effet majeur,
3 lestimation errone de la frquence des allles dans les pools et,
4 un taux lev de faux positifs.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
25
Ces problmes peuvent tre rsolus en augmentant la taille de population et le nombre
dindividus slectionns dans chaque queue de distribution et la densit de marqueurs sur la
carte gntique.
III.4 Construction de carte gntique
L'tablissement d'une carte gntique utilise les proprits de la recombinaison la miose. Il
ncessite :
1 La cration d'une descendance en sgrgation issue d'un croisement par reproduction sexue
2 La caractrisation molculaire (gnotypage) des individus de la descendance
3 L'utilisation d'outils d'analyse statistique et de mthodes de calculs mathmatiques
pour estimer les distances gntiques entre les marqueurs molculaires d'un mme groupe de
liaison, puis les ordonner l'intrieur de chaque groupe.
Une fois la descendance obtenue, on procde au criblage des marqueurs informatifs,
c'est--dire qui rvlent diffrents allles entre les lignes parentales. Chaque individu de la
population en sgrgation est ensuite typ pour les diffrents marqueurs polymorphes.
III.4.1 Analyse statistique des marqueurs molculaires
Un premier test statistique, 2 , est appliqu au niveau de chaque marqueur pour tester
l'hypothse nulle d'une sgrgation de type mendlienne (par exemple, 1:1 pour les marqueurs
codominants ou dominants dans des familles issues de backcross, d'haplodes doubls et dans
des lignes recombinantes; 1:2:1 pour les marqueurs codominants dans des familles F2; 3:1
pour les marqueurs dominants dans des familles F2).
Un 2 significatif (gnralement P > 0.05) indique une distorsion de sgrgation qui
peut avoir une origine soit biologique comme la liaison du marqueur avec un locus
d'incompatibilit, soit statistique et dans ce cas rsultant d'un chantillonnage trop faible ou
derreurs de gnotypage.
Les marqueurs sont alors soumis un test d'indpendance de sgrgation c'est--dire
un test de liaison. L'hypothse nulle H0: " = 0.5" ( est le taux de recombinaison entre
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
26
couples de marqueurs) permet de tester s'il existe ou non une liaison significative entre les
marqueurs. Le test de liaison peut tre ralis en utilisant la valeur du 2 ou le rapport des
vraisemblances appel LOD score (Log of the odds ratio) :
0
10
log
L
L
e
eLOD ou Le
reprsente la vraisemblance maximale value et 0Le la vraisemblance maximale
value 21log2
110 d qui suppose que les crossingovers sont indpendants (pas
d'interfrence) ou celle de Kosambi (1944)
21
21log
4
110d qui tient compte des
phnomnes d'interfrence. Lorsque l'interfrence est complte, et d sont identiques.
Des logiciels, plus ou moins interactifs et souples en termes de nombre de populations
et de mlange de ratios de sgrgation qu'ils peuvent prendre en compte, permettent d'obtenir
une carte ordonne de faon automatique. Les logiciels les plus couramment utiliss pour la
construction des cartes gntiques sont MAPMAKER et JOINMAP.
III.4.2 Taille et structure du gnome
Des cartes de liaison partielles permettent d'estimer la taille totale du gnome d'une
espce. Cette estimation peut ensuite tre utilise pour dterminer le nombre de marqueurs
ncessaires pour saturer un gnome avec une densit donne. A titre d'exemple, environ 250
marqueurs sont thoriquement requis pour obtenir une couverture de 95% d'un gnome de
1500 cM avec un espacement moyen entre les marqueurs infrieur 20 cM. Cependant dans
la pratique, plus de marqueurs sont ncessaires et bien que les marqueurs soient rpartis
alatoirement sur le gnome, certaines rgions en comportent plus (marqueurs regroups en
cluster), d'autres au contraire en possdent moins.
En effet, la relation entre distance physique sur le chromosome et frquence de
recombinaison entre 2 marqueurs n'est pas immdiate. Il existe des rgions qui recombinent
beaucoup (points chauds de recombinaison) alors que les distances physiques sont petites.
Inversement, il existe de trs longues portions d'ADN dans des rgions centromriques et
tlomriques o le phnomne de recombinaison est rprim par la prsence
d'htrochromatine ou d'ADN hautement rpt. Ces zones montrent par consquent des
distances gntiques plus faibles entre les marqueurs qui tendent tre regroups en cluster.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
27
Si le rapport entre distance physique et distance gntique varie au niveau intra-
chromosomique, il varie plus gnralement lorsque l'on compare des espces contenu
d'ADN diffrents. A titre d'exemple, 1 cM quivaut en moyenne 13, 3.5, 2.5 et 0.23 millions
de paires de bases respectivement chez le pin maritime, le bl, le mas et Arabidopsis. Ainsi,
des distances qui peuvent sembler faibles en terme de distance gntique s'avrent parfois
importantes en terme de distance physique.
Le taux de recombinaison entre marqueurs identiques est galement variable selon
l'environnement. Des croisements inter spcifiques donnent galement des longueurs de
carte plus faibles que des croisements intra-spcifiques. Un mauvais appariement des
chromosomes homologues la miose plus ou moins important en fonction du degr de
divergence des espces parentales entranerait une baisse de la frquence des chiasmas et se
traduirait par un taux de recombinaison plus faible entre les marqueurs.
III.4.3 Saturation des cartes gntiques et assignation des groupes de
liaisons aux chromosomes
Lorsquune carte de liaisons gntiques est sature tout point du gnome est
gntiquement li au moins un marqueur. Il faut cependant vrifier les vnements de
recombinaisons trop proches car laccumulation de marqueurs augmente les risques derreur
et la longueur de carte. Lajout de marqueurs supplmentaires ne doit pas donc faire
augmenter la taille de la carte, et le nombre de groupes de liaison doit correspondre aux
nombres de chromosomes dans les cellules haplodes (gamtes) de lespce tudie. On doit
par ailleurs sassurer que des marqueurs spcifiques des rgions subtlomriques des
chromosomes se lient aux marqueurs les plus distaux des groupes de liaisons.
La cartographie gntique ne permet pas par elle-mme une assignation directe des
groupes de liaison gntique aux chromosomes. Deux approches ont t dveloppes pour
rsoudre ce problme:
Lune fait appel une combinaison de mthodes cytogntiques (observation du
caryotype/mtaphase en microscopie) et molculaire (hybridation in situ laide de sondes
molculaires correspondants aux marqueurs RFLP localiss sur les groupes de liaison).
Lautre est une combinaison entre une approche gntique (utilisation danormalits
chromosomiques: jeux de lignes monosomiques, lignes aneuplodes, lignes dadditions ou
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
28
de substitution) et une approche molculaire (hybridations de type ADN/ADN en utilisant
comme sondes molculaires les marqueurs RFLP cartographis sur chaque groupe de liaison
et comme ADN cible des digestions dADN de lignes anormalit chromosomique pour
chacun des chromosomes identifis dans lespce considre).
IV. EFFET DE LA TAILLE DE LA POPULATION ET DE LENVIRONNEMENT
SUR LA PUISSANCE DE DTECTION DES QTLs
Le gnotypage (gnration de donnes de marqueurs molculaires) et le phnotypage
(valuation des individus pour leurs performances phnotypiques), de populations de grandes
tailles ont gnralement des cots levs, en particulier pour les caractres ncessitant de
vastes essais au champ ou des analyses complexes. Par consquent, la taille de la population
de cartographie et le nombre de rptitions et de sites (environnements) pour le
phnotypage sont souvent limits.
En gnral si on peut :
1 Dvelopper une population de cartographie de 100 200 descendants F2 ou dune
population backcross, partir dun croisement de dpart entre deux lignes,
2 Obtenir d'assez bonnes donnes phnotypiques pour les caractres d'intrt,
3 Faire le gnotype de la population avec des marqueurs espacs de 10 15 cM,
alors lanalyse des donnes phnotypiques et gnotypiques avec une mthode statistique
approprie, conduit presque toujours l'identification d'au moins quelques marqueurs associs
chaque caractre d'intrt. Cependant, la petite taille de la population aboutit souvent la
dtection de quelques QTL avec de grands effets phnotypiques. Cela ne signifie pas
ncessairement que les positions des QTL seront inexactes bien que cela puisse tre le cas.
L'ampleur des effets des QTL peut galement tre biaise par la petite taille de
l'chantillon. En effet, plus la taille de la population de cartographie est petite, plus levs
sont les effets des QTLs plus forts effets identifis. En outre, les QTL effet
phnotypique fort peuvent aussi tre un artefact de la slection directionnelle forte souvent
utilise pour crer les lignes parentales phnotypiquement divergentes qui sont utilises pour
la cartographie.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
29
La part de variance qui reste explique peut tre due :
(a) l'environnement,
(b) lerreur de mesure,
(c) aux QTLs supplmentaires avec des effets trop petits pour tre dtects
dans une population de telle taille,
(d) aux interactions entre QTLs, trop petites pour tre dtectes, et
(e) linteraction gnotype-environnements (GxE)
Le nombre de QTLs dtects et la part de la variance gnotypique explique par les
QTLs dans une population de cartographie augmente gnralement plus avec l'augmentation
de la taille (N) de la population de cartographie quavec laugmentation du nombre
denvironnements (E). Pour la plupart des caractres, moins que lhritabilit soit trs
faible et/ou que les cots de gnotypage dindividus supplmentaires soient beaucoup
plus levs que ceux de phnotypages supplmentaires, il est conseill d'augmenter la
taille de la population de cartographie plutt que le nombre d'environnements ou de
rptitions.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
30
Chapitre III LA CARTOGRAPHIE DE QTLs PAR ANALYSE DE LIAISON
GNTIQUE
I GNRALITS
Ayant gnr et enregistr les donnes phnotypiques et gnotypiques, deux
hypothses sont testes dans la cartographie des QTLs:
1 L'hypothse nulle (H0): aucun QTL nest prsent ou un QTL est prsent mais il
n'est pas li au (x) marqueur (s) et
2 L'hypothse alternative (HA): un QTL est prsent et il est li au (x) marqueur (s).
Diverses mthodes statistiques existent pour tester les deux hypothses et peuvent
tre reparties en trois groupes en fonction du type de population (s ) de cartographie:
1 - Les mthodes qui ncessitent le dveloppement de population (s) de cartographie
approprie (s) partir de croisements raliss entre deux parents choisis :
Lanalyse de la variance (Analysis of variance ANOVA),
La cartographie dintervalle simple (Simple Intervalle Mapping SIM ou
Intervalle Mapping IM),
Lla cartographie dintervalle composite (Composite Intervalle Mapping
CIM),
La cartographie dintervalle multiple (Multiple Intervalle Mapping);
2 Les mthodes qui utilisent des populations naturelles ou amliores (Cartographie
par analyse de dsquilibre de liaison ou linkage desequilibrum-based mapping) et
3 Les mthodes qui utilisent soit des populations de cartographie appropries cres
partir de croisements raliss entre deux parents choisis soit des populations naturelles ou
slectionnes.
Les mthodes statistiques pour la cartographie des QTL peuvent galement tre
reparties en deux groupes selon quelles ncessitent ou non la construction de cartes
gntiques:
1 Les mthodes qui ne ncessitent pas la construction pralable de carte de liaison
gntique (analyse de la variance, Cartographie par analyse de dsquilibre de liaison, la
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
31
cartographie base sur l'analyse en composante principale et la rgression des moindres carrs
partiels)
2 les mthodes qui ncessitent la disponibilit de la carte gntique de la population
(la cartographie dintervalle simple, la cartographie dintervalle composite, la cartographie
dintervalle multiple). Pour ce dernier groupe de mthodes, il est ncessaire deffectuer des
analyses de liaison sur les donnes gnotypiques et construire une carte de liaison gntique
pour la population avant la recherche des QTLs.
Les mthodes statistiques peuvent galement tre reparties eu deux groupes sur la
base de la distribution des caractres phnotypiques:
1 - Les mthodes paramtriques (celles qui supposent une distribution normale des
donnes phnotypiques) ou ncessitent une transformation mathmatique des donnes
phnotypiques pour obtenir une distribution normale approximative.
2 Les mthodes non paramtriques (distribution libre).
II. MTHODES DE CARTOGRAPHIE DE QTLs PAR ANALYSE DE LIAISON
II.1 Cartographie de QTL par Analyse de variance (ANOVA).
II.1.1 Principe de la Cartographie de QTL par analyse de variance.
L'analyse de variance (ANOVA) est la mthode la plus simple pour la cartographie
des QTL. Une fois les donnes gnotypiques (marqueurs molculaires) et phnotypique
(symptmes de maladies, caractres morphologiques et caractres agronomiques etc.) sont
disponibles pour la population de cartographie, lANOVA teste l'association statistique des
marqueurs molculaires aux caractres phnotypiques d'intrt. A chaque marqueur
molculaire utilis pour le gnotypage, les individus de la population de cartographie
sont spars en deux groupes, selon leurs gnotypes, et les distributions phnotypiques
des deux groupes sont compares. Le locus marqueur test sur une analyse donne est
appel le locus cible.
Lanalyse dun locus marqueur peut impliquer des locus marqueurs additionnels,
appels marqueurs de fond gntique, qui sont associs au caractre dintrt et par
consquent se situent proximit d'autres QTLs affectant le caractre (QTLs de fond
gntique). Dans ce cas, lassociation de chaque locus cible au caractre est teste par
rgressions multiples, en combinaison avec un ensemble de marqueurs de fond gntique. A
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
32
chaque locus marqueur, l'valuation de la solidit des preuves de la prsence d'un QTL est
base sur les statistiques t de Student ou F de Fischer. Dans un rtrocroisement, on peut
calculer un t-statistique pour comparer les moyennes phnotypiques des deux groupes de
gnotypes au marqueur. Pour les autres types de descendances (comme les F2), o il y a plus
de deux gnotypes possibles, on utilise une forme plus gnrale de lanalyse de la variance,
qui fournit des statistiques F.
II.1.2 Avantages et limites de la Cartographie de QTL par analyse de
variance.
Les principaux avantages de la cartographie par analyse de variance sont sa simplicit
et elle ne ncessite pas une carte de liaison gntique des marqueurs car elle considre chaque
locus marqueur sparment.
Cependant, l'approche ANOVA pour la cartographie des QTL a quatre limites:
1 Il est difficile de procder des estimations spares de la position et de l'effet de
chaque QTL (proportion de la variance phnotypique explique par le QTL).
2 Les individus ayant des gnotypes manquants doivent souvent tre limins, sauf
si un modle mixte qui peut traiter les donnes dsquilibres et d'autres traitements
statistiques sont utiliss.
3 Lorsque les marqueurs sont trs espacs et/ou irrgulirement rpartis, le QTL peut
tre assez loign des marqueurs voisins, et donc la puissance de dtection de QTL diminue.
Enfin, il y a beaucoup de variations phnotypiques entre individus de chaque classe
gnotypique et une partie de ces variation peut tre due d'autres QTLs affectant caractre.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
33
Figure 8. Principes de la cartographie des loci effet quantitatif (Quantitative Trait Loci - QTL).
En (a), les parents homozygotes qui diffrent par la densit des trichomes les trichomes sont de fines
excroissances ou appendices chez les plantes et certains protistes. Leurs fonctions et leur structure diffrent. On
peut citer comme exemple les poils, les poils glandulaires et les cailles - (parent 1: forte densit de trichomes;
Parent 2: faible densit des trichomes) sont croises pour former une population de F1 avec une densit de
trichomes intermdiaire. En (b), un individu F1 est autofcond pour former une population d'individus F2. En
(c), chaque F2 est autofcond sur six gnrations supplmentaires, formant finalement un ensemble de lignes
recombinantes (Recombinant Inbred Line -RIL). Chaque RIL est homozygote pour une section d'un
chromosome parental. Les gnotypes des RILs aux marqueurs gntiques, ainsi que leurs phnotypes (la densit
des trichomes) sont dtermins. la flche indique une section du chromosome qui drive de Parent 2 (le parent
avec la faible densit de trichomes). Les feuilles de tous les individus qui ont hrit de cette section du
chromosome du parent avec la densit de trichomes faible ont aussi la densit de trichomes faible, ce qui indique
que cette rgion chromosomique contient probablement un QTL pour ce caractre (Mauricio, 2001).
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
34
II.2 Cartographie de QTL par analyse dintervalle simple
(Simple Interval Mapping SIM).
II.2.1 Principe de la SIM
La cartographie dintervalle simple (Simple Intervalle Mapping - SIM). est souvent
appel cartographie dintervalle (Intervalle Mapping - IM). Lorsquune carte de liaison
gntique et les donnes phnotypiques sont disponibles pour une population, la SIM utilise
un intervalle entre deux marqueurs pour rechercher un QTL hypothtique (le QTL cible) en
effectuant un test de rapport de probabilit (Likelihoods of odds score - LOD score) chaque
position l'intrieur de l'intervalle. Dans cette approche, le QTL est situ l'intrieur d'un
intervalle chromosomique, dfini par les marqueurs adjacents. Le LOD score est le
logarithme base 10 du rapport de deux vraisemblances (probabilits) : la probabilit
des donnes phnotypiques observes en supposant un QTL la position en question et
la probabilit en supposant qu'aucun QTL nest prsent cette position. Les rsultats de
l'analyse sont reprsents sous forme dune courbe dvolution du LOD score en fonction de
la position en centimorgan (cM) sur la carte chromosomique. La localisation chromosomique
du LOD score maximum est prise comme position du QTL (Figure 9).
La procdure SIM est base sur le maximum de vraisemblance ou la rgression et
maximise la probabilit d'un modle gntique un gne en calculant la moyenne des
donnes phnotypiques pour les tats possibles du gnotype au QTL chaque position
possible sur lintervalle cible.
II.2.2 Avantages et limites de la SIM
La SIM a plus de puissance et ncessite des populations de cartographie moins
grande que lanalyse de variance, mais elle a ses propres limites.
1 La SIM considre un seul QTL dans le modle (modle un QTL) en ignorant les
effets d'autres QTLs (cartographis ou pas encore cartographis). Par consquent, la SIM peut
fournir une identification et une estimation de l'effet et de la position des QTLs qui sont
biaises lorsque plusieurs QTLs sont situs dans le mme groupe de liaison.
2 Les QTLs en dehors de l'intervalle considr peuvent affecter la capacit de
trouver un QTL dans cet intervalle cible.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
35
3 Une fausse identification d'un QTL (faux positif ou pic fantme) peut survenir si
d'autres QTL sont lis l'intervalle d'intrt.
La cartographie d'intervalle par rgression multiple, peut faire gagner du temps
dans les calculs et produire des rsultats similaires ceux obtenus par maximum de
vraisemblance, mais l'estimation de la variance rsiduelle est biaise et la puissance de
dtection des QTLs peut tre affecte.
Figure 9. Cartographie d'intervalle par analyse de rapports de vraisemblances.
Les rsultats de la cartographie des QTL sont reprsents sous forme dune courbe dvolution du LOD score en fonction de la position mesure en units de recombinaison (centimorgan - cM) sur la carte chromosomique. La
ligne verticale en pointill reprsente une valeur seuil au-dessus de laquelle le test de rapport de vraisemblance
est significatif. La meilleure estimation de l'emplacement du QTL est donne par la localisation chromosomique
qui correspond au LOD score le plus lev. Dans cet exemple, le LOD score maximum est 44 cM et l'intervalle
de confiance est compris entre 36 et 54 cM. Le marqueur 10 est le marqueur le plus proche du QTL alors que le
marqueur 13 et le marqueur 18 sont les deux marqueurs adjacents.
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
36
II.3 Cartographie dintervalle composite (Composite Interval
Mapping CIM)
II.3.1 Principe de la CIM
Comme la cartographie dintervalle simple, la cartographie dintervalle composite
value la probabilit de prsence d'un QTL cible plusieurs points d'analyse dans
chaque intervalle entre marqueurs. Cependant, en chaque point, la cartographie
dintervalle composite prend galement en compte l'effet d'un ou plusieurs marqueurs
de fond gntique qui sont souvent appels des cofacteurs. Le but de l'utilisation des
cofacteurs est de minimiser les effets des QTL dans le reste du gnome en essayant
d'identifier un QTL dans une rgion particulire.
Les modles plusieurs QTLs sont une amlioration par rapport aux modles un
QTL en raison de leur capacit sparer les QTL lis sur le mme chromosome et dtecter
les QTLs qui interagissent et qui, autrement, ne pourraient pas tre dtects.
II.3.2 Avantages et limites de la CIM.
L'inclusion de cofacteurs dans l'analyse confre deux avantages possibles, selon
que les marqueurs de fond gntique et l'intervalle cible sont lis ou non.
Sils ne sont pas lis, l'inclusion de marqueurs de fond rend l'analyse plus sensible
la prsence d'un QTL dans l'intervalle cible.
Sils sont lis, l'inclusion des marqueurs de fond peut aider sparer le QTL cible
d'autres QTL lis, du ct oppos du marqueur de fond.
La CIM prsente quatre grandes limites :
1 La CIM peut tre affecte par une rpartition ingale des marqueurs dans le
gnome. Les statistiques dans une rgion riche en marqueurs peuvent ne pas tre comparables
celles d'une rgion pauvre en marqueurs
2 Il est difficile d'estimer la contribution conjointe de plusieurs QTL lis la
variance gntique;
3 La CIM n'est pas directement extensible pour analyser lpistasie,
Master 2 - UE Gntique Quantitative ECUE 2 : Dissection Gntique des Caractres Quantitatifs
37
4 L'utilisation de marqueurs troitement lis lintervalle cible comme cofacteurs
peut rduire la puissance statistique pour dtecter un QTL.
II.4 Cartographie de QTL par analyse de plusieurs intervalles
(Multiple Interval Mapping MIM)
L'ide de la MIM est dinclure les effets de plusieurs QTL putatifs et les effets
pistatiques associs, directement dans un modle, pour faciliter la recherche de QTLs,
tester et estimer les positions, les effets et les interactions de plusieurs QTLs.
La cartographie dintervalles multiples comprend quatre lments :
1 Une procdure d'valuation conu pour analyser la vraisemblance des donnes par
rapport un modle gntique donn (nombre, positions et les interactions pistatiques des
QTLs),
2 Une stratgie de recherche optimise pour slectionner le meilleur modle
gntique (entre ceux identifis) dans l'espace des paramtres,
3 Une procdure d'estimation de tous les paramtres de l'architecture gntique des
caractres quantitatifs (nombre, positions, effets et epistasis des QTLs; variances et
covariances gntiques expliques par les effets des QTL),
4 Une procdure de prvision pour estimer ou prdire les valeurs gnotypiques des