View
150
Download
0
Category
Preview:
Citation preview
010011010101010101010100101010101000101101010010101011100011
Structuration des génomes par sélection indirectede la variabilité mutationnelle
Une approche de modélisation
et de simulation
Carole Knibbe
Laboratoire PRISMa
Laboratoire BF2I (UMR INRA-INSA 203)
0100110101010101010101001010101010001011010111110110
2
Des génomes structurellement très différents
Homo sapiens
~3 milliards de paires de bases (pb)~25 000 gènes
Neisseria meningitidis (bactérie)
~2 millions de pb~2 000 gènes
Herpes HSV-1 (virus)
~150 000 pb~100 gènes
0 kb 150 kb50 kb 100 kb
0 kb 150 kb50 kb 100 kb
0 kb 150 kb50 kb 100 kb
Zoom sur un segment de 150 000 pb...
Homo sapiens
~3 milliards de pb~25 000 gènes
3
Quels sont les mécanismes évolutifs qui ont façonné ces génomes ?
Génotype :variation(mutations)
Phénotype :sélection
Sélection (indirecte) d’un certain niveau de variation
Biais mutationnels :
« Chez l’Homme, il se produit spontanément plus d’insertions que de délétions, ce qui fait croître le génome »
Coûts sélectifs directs :
« Pour un virus ou une bactérie, un grand génome est désavantageux, donc le génome tend à devenir plus compact »
Influence sur l’organisation du génome ?
4
Problématique biologique
La sélection du niveau de variation peut-elle favoriser un certain type d’organisation du génome ?
Ce mécanisme peut-il réguler la quantité d’ADN non-codant ?
Difficultés expérimentales– Effet à long terme– Effet difficile à isoler
Recours à la modélisation…
5
Enjeu méthodologique
Génotype :variation(mutations)
Phénotype :sélection
Sélection (indirecte) d’un certain niveau
de variation
Algorithmes évolutionnaires (problèmes d’optimisation)
population, sélection
structure du génome, mutations
Modèles neutralistes (évolution de séquences réelles)
structure du génome, mutations
phénotype, sélection
Le modèle aevol
7
Le modèle aevol
fonction biologique
degré de possibilité
Protéome PhénotypeGénome
fonction biologique
degré de possibilité
transcription traduction
interactions protéiques
Optimum environnemental
Capacités fonctionnelles globales
distribution de possibilité de la protéine
m w
H = e.h
Mutations SélectionReproduction
degré de possibilité
fonction biologique
8
Évolution de la population
- mutations ponctuelles- petites insertions- petites délétions
- translocations- inversions- duplications- grandes délétions
W ≈ N . prob(reproduction)
≈ N . f (écart phén.-envir.)
N individus
Initialisation aléatoire
Calcul des phénotypes
Comparaison à l’environnement :
nombres de reproductions
Reproductionsavec mutationsen moyenne,
uL par reproduction
9
Film de l’évolution le long de la lignée « gagnante »
Quelques générations
plus tard…
Acquisition de fonction
par duplication-divergence
10
Atouts de l’approche
Met en jeu simultanément :– une organisation génomique biologiquement interprétable
et libre d’évoluer– l’action de la sélection au niveau du phénotype
Connaissance exhaustive :– des relations de parenté – des séquences ancestrales– des mutations fixées
Code source libre d’accès (C++)
11
Limites
Temps de calcul, taille mémoire
contraintes sur les valeurs des paramètres
Gestion simple de la population
Modélisation abstraite des aspects fonctionnels
Pas d’échelle de temps individuelle– Pas de processus de développement– Pas de régulation– Pas de plasticité phénotypique
Expériences… in silico
13
Perturber la variabilité, observer l’évolution structurelle du génome
Taux de mutationpar paire de bases (u)
Structure du génome(nombre de gènes, quantité de non-codant…)
Poids du gène muté dans le phénotype(aire du triangle)
Nombre de mutations « efficaces » (touchant les gènes)
Impact des mutations « efficaces »
Variabilité globaledu phénotype
?
14
Plan d’expérience
Taux de mutation u : – 6 valeurs testées, entre 5.10-6 et 2.10-4 par paire de bases
Intensité de la sélection c :– 4 valeurs de c testées
3 répétitions pour chaque couple (u, c)
W = nb de reproductions
rang dans la populationmeilleurmoins bon
c = 0,9900 : sélection intense
c = 0,9995 : sélection faible
15
Taux de mutation élevé : 2.10-4 / pb Taux de mutation faible : 5.10-6 / pb
Peu de gènes
Peu de non codant
Beaucoup de gènes
Beaucoup de non codant
16
Taux de mutation (échelle log.)
No
mb
re d
e g
ènes
(éc
hel
le lo
g.)
Taux de mutation (échelle log.)
Qu
anti
té d
e n
on
co
dan
t (é
chel
le lo
g.)
La taille du génome dépend du taux de mutation
bactérie
levure
champignon
3 virus
Données biologiques(Drake, 1991)
17
Sélection indirecte d’un niveau de variabilité constant
Taux de mutation (échelle log.)
Grands génomes
Petits génomes
Prob. de se reproduire à l’identique (Fν)
18
La quantité de non-codant comme levier d’ajustement de la variabilité mutationnelle
Le niveau de variabilité dépend effectivement de la quantité de non-codant
Probabilité que le descendant soit « neutre »
(soit pas de mutation, soit uniquement des mutations neutres)
Probabilité qu’une mutation soit neutre
19
La quantité de non-codant comme levier d’ajustement de la variabilité mutationnelle
Probabilité que le descendant soit « neutre »
Probabilité qu’une mutation soit neutre
Mutations ponctuelles
Inversions
Translocations
Duplications, délétions
Quantité de non-codant (échelle log.) Quantité de non-codant (échelle log.)
A taux de mutation égal,
lorsque l’effet des grandes délétions et duplications est pris en compte,
plus de non-codant = plus de variabilité mutationnelle
20
Intensité de sélection et niveau de variation optimal
Taux de mutation (échelle log.)
Pro
b. d
e se
rep
rod
uir
e à
l’id
enti
qu
e (F
ν)
Sélection intense,W ≈ 10 descendants :
Fν W ≈ 1 desc. identique
Sélection moyenne,W ≈ 2 descendants :
FνW ≈ 1 desc. identique
Taux de mutation (échelle log.)
No
mb
re d
e d
esce
nd
ants
iden
tiq
ues
(F
νW)
Fν est telle que
FνW ≈ 1 descendant neutre
21
Conclusions de l’expérience
La quantité de non-codant…
– augmente la variabilité du phénotype– n’évolue pas « au hasard »– évolue vers une valeur qui permet de produire ~1 descendant neutre
Cela reflète la persistance des lignées qui, simultanément …– sont bien adaptées à l’environnement– transmettent fidèlement leur information génétique (robustesse)– explorent d’autres phénotypes par mutation (« evolvabilité »)
22
Robustesse des conclusions
Autres formes d’environnement
Autres méthodes de sélection
Découplage des taux de mutation
Autre façon de choisir les bornes des réarrangements
Les principes mis en évidence restent valides
W = f (écart phénotype –envir.)
uloc ≠ urearr
23
Perturber la variabilité mutationnelle, observer l’évolution structurelle du génome
Taux de mutationpar paire de bases
Structure du génome(nombre de gènes, quantité de non-codant…)
Poids du gène muté dans le phénotype(aire du triangle)
Nombre de mutations « efficaces »
Impact des mutations « efficaces »
Variabilité globaledu phénotype
24
Perturber la variabilité mutationnelle, observer l’évolution structurelle du génome
La quantité de non-codant dépend aussi de l’organisation du protéome
Taux de mutationpar paire de bases
Structure du génome(nombre de gènes, quantité de non-codant…)
Poids du gène muté dans le phénotype(aire du triangle)
Nombre de mutations « efficaces »
Impact des mutations « efficaces »
Variabilité globaledu phénotype
Conclusions et perspectives
26
Conclusions
Un nouveau modèle qui combine… – réarrangements génomiques– sélection au niveau du phénotype
Trois leçons : ne pas raisonner uniquement en termes…– de valeur sélective : la variabilité comme autre clé du succès évolutif– de biais mutationnels et de coûts sélectifs directs : pressions indirectes – de mutations locales : rôle majeur des grands réarrangements
Une explication pour les données de Drake (1991)– rôle du nombre de gènes et du non-codant dans la
variabilité du phénotype– sélection (indirecte) d’un niveau constant de variabilité
27
Perspectives
Utiliser aevol tel quel pour des problématiques connexes :– Variabilité de l’environnement– Influence de la recombinaison– Influence des « bottlenecks »
Étendre le modèle– Affiner les mécanismes de réarrangement– Laisser les génomes coder leurs taux de mutation– Modéliser les phénomènes de régulation de l’expression des gènes
Validation expérimentale
28
Du protéome au phénotype
protéines activatrices
protéines inhibitrices
OU OU
fonctions réalisables
fonctions réprimées
fonctions réalisables et non réprimées=
capacités fonctionnelles
ET
NON
29
Du protéome au phénotype
30
taille du génome
Proportion de bases touchées
0,5
0
1
31
Évolution du nombre de gènes et de la quantité de non-codant
32
Mutations fixées
33
Influence de la forme de l’environnement
34
Influence respective des différents taux de mutation
35
Expériences réalisées avec une sélection « fitness proportionate » (1)
36
Expériences réalisées avec une sélection « fitness proportionate » (2)
On retrouve bien la « règle »
FνW ≈ 1
37
Le non-codant s’ajuste aussi en fonction de l’effet des mutations dans les gènes
38
Le non-codant s’ajuste aussi en fonction de l’effet des mutations dans les gènes
Invariant = perte moyenne de fitness par réplication
39
environnement
Quels sont les mécanismes évolutifs qui ont façonné ces génomes ?
Génotypes = informations génétiques reçues par les embryons
Phénotypes
Développement
Reproduction
« Chez telle espèce, il se produit spontanément plus de délétions que d’insertions »
« Chez telle espèce, un génome plus compact apporte un avantage sélectif »
Mutation ponctuelleInsertionDélétion
Mutations Sélection
40
Simuler l’évolution de la population…
temps
ind
ivid
us
41
… puis retrouver la lignée « gagnante »
temps
ind
ivid
us
42
Fν sélectionnée = 1/W
Intensité de la sélection
Nombre max. de reproductions (W)
Nombre de gènes et quantité de non codant sélectionnés
Produire 1 descendant neutre
Taux de mutation par base
43
Sélection indirecte d’un certain niveau de variation
mutations trop fréquentes : extinction de la lignée
mutation favorable
pas de mutation :impasse évolutive
générations
Variabilité élevée(reproduction à l’identique peu probable)
Variabilité moyenne
Variabilité très faible(reproduction à l’identique très probable)
3b
44
Transcription
...110...010...011011101000101110011100111011010001...10110010010..
.
...001...101...100100010111010001100011000100101110...01001101101..
.
Séquence promotrice
Séquence terminatriceRégion transcrite
Comparaison
100...010
Séquence consensus
Niveau d’expression e
7b
45
Traduction
Signal de « start »
Signal de « stop »Séquence codante (gène)
...110...010...011011101000101110011100111011010001...10110010010..
.
...001...101...100100010111010001100011000100101110...01001101101..
.
Code génétique
000 START
001 STOP
100 M0
101 M1
010 W0
011 W1
110 H0
111 H1
STARTM1 H0 W1 M0 H1 W1 M0 STOP
m :
w :
h :
100
11
01
Code « Gray »
Valeur réelle
0.86
0.02
0.33
Conversion en entier puis
normalisation
fonction biologique
degré de possibilité
m = 0,86 w = 0,02
H = 0,33e
fonction biologique
degré de possibilité
m w
H = e.h
7c
Recommended