Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
p. 1Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Design d’une étude métabolomique
Binta Diémé, IR biologiste en analyse de données, PFEM
p. 2Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
I. Généralités: historique, définitions
II. Les différents types d’études métabolomiques
III. Les outils analytiques
IV. Le prétraitement des données analytiques
V. Les analyses statistiques
VI. Interprétation des résultats
Plan
p. 3Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Roger Williams
Concept de « profil
métabolique » 1940
Linus Pauling
Utilisation de « profil métabolique »
(GC/MS) 1971
Jeremy K Nicholson
Utilisation de « profil métabolique » (RMN)
1984
Profil métabolique urinaire sur papier chromatographique
Profil métabolique urinaire par GC/MS
Profil métabolique du sérum par 1H-RMN
Utilisation du terme « métabolome »
1988Stephen G. Oliver
Généralités: historique
p. 4Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Métabolome
Ensemble des petites molécules (< 1500 Da) présentes dans un échantillon biologique.
Métabolomique
Définition (Fiehn et al. Nat. Biotechnol.,
2000) :
Identification et quantificationexhaustive et non sélective detous les métabolites d’unsystème biologique.
Généralités: définition
p. 5Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Tiré thèse Aurélie Roux (Roux 2011)
Généralités: domaines d’application de la métabolomique
p. 6Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Sadras & Richards Journal of Experimental Botany, 2014
p. 7Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Zacharias et al.,Electrophoresis (2013), 34, 2762–2775
Untargeted Analysis Targeted Analysis
Les différents types d’études métabolomiques
p. 8Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Protocole biologique
Méthode Analytique
Extraction et alignement
Analyse statistique Identification Interprétation
m/z80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500
%
0
100
T1_220909_101109AFAMM 375 (11.814) Cm (280:402) 1: TOF MS ES+ 3.34e4289.2036
33362
79.02475850
271.19415124
255.16894556
253.18213009
181.11312203
159.07241498111.0227
1052 230.0992;787
465.229532595
363.201123490
301.204921124
317.208017148
335.219213449
393.22615939
394.2391807
431.2523493
466.24654619
467.2661773 492.3099
9
m/z80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500
%
0
100
T1_220909_101109AFAMM 375 (11.814) Cm (280:402) 1: TOF MS ES+ 3.34e4289.2036
33362
79.02475850
271.19415124
255.16894556
253.18213009
181.11312203
159.07241498111.0227
1052 230.0992;787
465.229532595
363.201123490
301.204921124
317.208017148
335.219213449
393.22615939
394.2391807
431.2523493
466.24654619
467.2661773 492.3099
9
m/z80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500
%
0
100
T1_220909_101109AFAMM 375 (11.814) Cm (280:402) 1: TOF MS ES+ 3.34e4289.2036
33362
79.02475850
271.19415124
255.16894556
253.18213009
181.11312203
159.07241498111.0227
1052 230.0992;787
465.229532595
363.201123490
301.204921124
317.208017148
335.219213449
393.22615939
394.2391807
431.2523493
466.24654619
467.2661773 492.3099
9
Sélection des ions VIP
Voie métaboliquemodifiée:
Interprétation biologique
Matrice de données
RT Masse Echantillon1 Echantillon2
Echantillons Biologiques
Empreintes métaboliques
XCMS, Mz line, Markerlynx…
Kegg, HMDB, Metlin
Objectif(s) scientifique(s)
BIOLOGISTES ANALYSTES BIOINFORMATICIENS STATISTICIENS
ANALYSTES BIOLOGISTES
Valorisation(s)
Workflow d’une étude métabolomique
p. 9Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 1: questions biologiques
Etape 2: design de l’étude
Mise au point du modèle expérimental:
• Modèle in vitro: cultures cellulaires, microorganismes
• Modèle animal
Fluides biologiques: urine, plasma, sang, salive, LCR etc.
biopsies
Plantes
p. 10Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 2: design de l’étudeFluides et tissus biologiques humains: urine, plasma, LCR etc.
• Sexe
• Age
• Alimentation
• Prise médicamenteuse
• Exercice physique
• Heure du prélèvement
Plantes• Saison de prélèvement
• Lieu de prélèvement
• Conditions climatiques
Etape 1: questions biologiques
p. 11Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Prélèvement d’échantillons biologiques:
• Dépend de la nature de l’échantillon
• Doit être le plus court possible
• Puis l’aliquotage des échantillons (si fluides biologiques) permet de limiter les cycles congélations/décongélations
Stockage
• Congélateurs -80°C
Etape 3: recueil et stockage des échantillons
p. 12Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 1: question biologique
Randomisation de la préparation et de l’analyse des échantillons
Garder au maximum la chaine de froid
Etape 2 : design de l’étude
Etape 3 : préparation des échantillons
p. 13Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
La préparation des échantillons dépend:
du type de matrice à analyser• Solide: cellules, tissus, microorganismes
• liquide
du type de composés à analyser• Polaire, apolaire…
de la plateforme analytique• RMN
• MS (dérivation chimique pour la GC/MS par exemple)
• Les deux?
Etape 3 : préparation des échantillons
p. 14Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Renseigner au maximum les métadonnées:
• caractéristiques de l’échantillon,
• conditions de prélèvement ou de récolte
• Conditions de stockage et d’analyses
Extraire de manière répétable les métabolites
Pas de protocole universel d’extraction des métabolites
Outils analytiques complémentaires
Points clés
p. 15Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Les outils d’analyse: la spectrométrie de masse
p. 16Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
C’est une méthode de mesure des rapports masse sur charge de molécules ionisées
Source d’ions Analyseur Détecteur
Permet la production d’ions en phase gazeuse
Sépare des ions en fonction de leur
rapport m/z
Convertit d’un courant ionique en courant
électrique
Sous vide
A pression atmosphérique
Basse résolution
Haute résolution
Ultra haute résolution
La spectrométrie de masse
p. 17Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Source d’ions
Permet la production d’ions en phase gazeuse
Sous vide• Ionisation par impact électronique (EI): ionisation dure• Ionisation chimique(CI): ionisation douce
A pression atmosphérique• L’ionisation chimique à pression atmosphérique (APCI): composés
apolaires• Ionisation par électrospray (ESI): composés polaires
Objectif: ioniser et vaporiser les molécules
La spectrométrie de masse : la source d’ions
p. 18Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Analyseur
Séparation des ions en fonction de leur
rapport m/z
Basse résolution
Haute résolution
Ultra haute résolution
Objectif: séparer les ions selon leur rapport masse/charge
Principales caractéristiques d’un analyseur:• La résolution R• La gamme de masse (m/z) qu’il peut analyser• La rapidité de balayage en m/z• La sensibilité
La spectrométrie de masse : les analyseurs
p. 19Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Analyseur Résolution (m/Δm, FWHM) Exactitude en masse (ppm)
Quadripôle 3 000 200
Piège à ions (2D/3D) 5 000 200
Temps de vol 8 000-80 000 1-10
Orbitrap® Jusqu’à 280 000 <2
FT-ICR Jusqu’à 10 000 000 <1
Les analyseurs: résolution
Tiré du MOOC de métabolomique
p. 20Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Lokhov et al., PLoS ONE (2014), 9 (9), e105343
Complexité d’un spectre de masse: sans séparation chromatographique
p. 21Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
RT: 0.00 - 23.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Time (min)
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Re
lative
Ab
un
da
nce
15.02
14.49
1.25 1.30
17.93 19.1519.501.55 11.06 17.90 20.7619.6515.39
21.3816.587.500.99 22.7317.41
15.5111.20
15.7514.286.5011.376.41 10.87 13.66
2.04 13.5811.732.1310.673.61 8.056.893.65 10.152.29 8.28
4.28 5.000.30
NL:7.51E7
TIC F: FTMS + p ESI Full ms MS ScanPoolobj1_pos
ScanPoolobj1_pos #1353 RT: 7.47 AV: 1 NL: 4.57E6F: FTMS + p ESI Full ms
50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000
m/z
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Re
lativ
e A
bu
nd
an
ce
188.07057
205.09715
118.06516
146.05995
100.07567
60.04455
224.12796 271.26294 409.18683342.15585 527.05463447.13623 694.91998 923.13580889.93677
Complexité d’un spectre de masse: avec séparation chromatographique
p. 22Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Chromatographie liquide
Chromatographie gazeuse
Phases inverses
Phases normales
Phases hydrophiles
Colonnes capillaires
Basse résolution
• quadripôles
Haute résolution
• ToF
• Orbitrap
Ultra haute résolution
• FT-ICR
Les couplages chromatographiques
p. 23Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Chromatographie liquideAvantages de la LC-MS
• Analyse de composés polaires, thermolabiles et ioniques
• Accès à l’ion moléculaire• Préparation de l’échantillon réduite
(dans certains cas)
Inconvénients de la LC-MS• Ionisation douce• Spectres de fragmentation peu
reproductibles
Chromatographie gazeuseAvantages de la GC-MS
• Analyse de composés apolaires et volatiles• Spectres de fragmentation reproductibles
Inconvénients de la GC-MS• Préparation de l’échantillon plus longue• Fragmentation intensive (EI), pas d’accès à
l’ion moléculaire
Inconvénients communs• Encrassement des sources• Vieillissement des colonnes chromatographiques• Phénomène de suppression d’ions
Les couplages chromatographiques
p. 24Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Tiré du MOOC de métabolomique
Avantages de la spectrométrie de masse
p. 25Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 4 : analyse des échantillons
Etape 5 : Extraction des données
CAMERAAnnotation of
AdductFragments and
isotopes
Logiciels commerciaux:Progenesis®MS-Processor®Markerlynx®MassHunter®MassProfiler®Compound Discoverer®
Logiciels gratuits:MZmineOpenMSMetAlignMSFACTSMSClust
RT1-MS1 RT2-MS2 … RTX-MSx
Patient 1 Int11 Int12 Int1X
Patient Y IntY1 IntY2 IntYX….
Echantillon
Extraction des données en SM
p. 26Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 5 : Extraction des données
Etape 6 : Correction dérive du signal
Dunn et al., (2011). nature protocols. 6, 1061-1083
Table de données
Filtres• CV échantillons > CV CQ• CV CQ <30 %• Ratio signal Echantillon/Blanc >3
Correction de la dérive du signal analytique en SM
p. 27Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
RT: 0.00 - 31.01
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Time (min)
0
10
20
30
40
50
60
70
80
90
100
0
10
20
30
40
50
60
70
80
90
100
Rel
ativ
e A
bund
ance
1.57
1.67
12.22 16.601.31
12.111.88 9.56
23.0022.882.98 8.80 23.1410.0129.2720.2820.02 20.403.15 11.36 23.5014.65 29.528.01 10.27 16.113.55 19.1714.08 28.897.383.89 23.965.04 17.66 24.78 25.64 28.671.01
1.68
10.982.39 10.84 14.742.45
2.54
2.62
2.69
3.17
12.961.50
12.33 23.2014.07 23.349.07 9.698.05 15.847.003.48 22.916.79 24.28 29.0124.8922.2716.713.97 21.20 25.9317.20 28.78 29.9420.065.260.13
NL:3.10E9
TIC F: FTMS + p ESI Full ms [66.70-1000.00] MS Pool5
NL:2.29E9
TIC F: FTMS - p ESI Full ms [66.70-1000.00] MS pool5
Echantillons biologiques
Extraction des données
Filtres
Table de données
m/z , TR , et intensités
Table de données
m/z , TR , et intensités
identification métabolites
discriminants: fragmentation
MS2
Randomisation
Analyses statistiques
CQ: mélange des échantillons
Echantillons analytiques
Extraction des métabolites
Interprétation biologique
Workflow en spectrométrie de masse (SM)
p. 28Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
TP conversion de fichiers
p. 29Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Les outils d’analyse: la résonance magnétique nucléaire
p. 30Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Le spin est une des propriétés des particules, au même titre que la charge et la masse
Le spin caractérise le magnétisme du noyau
Le spin total dépend du nombre de particules dans le noyau (protons et neutrons) de l’isotope
Concepts Physiques: spin
p. 31Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
s Masse atomique Numéro atomique
Demi-entier impaire Pair/impair 1H, 13C
Entier paire impair 2D, 14N
Nul paire pair 12C, 16O
Noyau Spin
1H 1/2
2H 1
14N 1
15N -1/2
13C 1/2
17O -5/2
Concepts Physiques: spin
p. 32Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Le rapport gyromagnétique (𝛾) est une caractéristique de chaque noyau atomique
Au moment cinétique de spin 𝑆 est associé un moment magnétique dipolaire µ
µ
µ = 𝛾 Ԧ𝑆
Concepts Physiques: moment magnétique
p. 33Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
𝐵0
𝛼
𝛽
Absence champ magnétique présence champ magnétique
Concepts Physiques: moment magnétique vs champ magnétique
p. 34Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
z
x
y
z
x
y
𝐵0 𝐵0 Moment magnétique résultant𝑴0
Moments magnétiques µ parallèles à 𝐵0
Moments magnétiques µ anti-parallèles à 𝐵0
𝑀 =
𝑁
µ = 𝑀0
Concepts Physiques: magnétisation
p. 35Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
𝐵0
Moment magnétique résultant𝑴0
Relaxation longitudinale T1
M0𝐵0
M0
𝐵0
x
y
z
x
y
Relaxation transversale T2
RF
Principe d’une expérience de RMN standard
p. 36Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Claridge, 2009
Le signal RMN
p. 37Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Pr. W. Reusch
Représentation schématique de l’appareillage RMN
p. 38Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Ethanol: CH3 CH2 OH
Structure d’un spectre 1D 1H
p. 39Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Nature du noyau• Fréquence de résonance
• Déplacement chimique
Nombre de noyaux résonant à la même fréquence• Concentration de la molécule
Nombre de noyaux des groupements voisins• Multiplicité des signaux
Les informations contenues dans un spectre RMN
p. 40Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Les plus utilisés sont les spectromètres à haut champ
Caractéristiques d’un spectromètre:• La sensibilité et la résolution augmentent avec le champ magnétique
• Grand nombre de noyaux observables
• Expériences en 2D
Ils permettent d’analyser:• Des biofluides
• Des extraits solubilisés
• Tissues ou des biopsies
La RMN: les spectromètres
p. 41Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
RMN SM
• Robuste• Pas de préparation de l’échantillon• Quantitative
• Moins robuste• préparation de l’échantillon ++• Semi-quantitative
Sensibilité faible Sensibilité élevée
RMN SM
Les techniques analytiques
p. 42Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Echantillons biologiques
Analyses par RMN
1.01.52.02.53.03.54.04.5 ppm
1.01.52.02.53.03.54.04.5 ppm6.57.07.58.08.5 ppm
6.57.07.58.08.5 ppm
Control
ASD
• Calibration• Phasage
• Alignement• Normalisation• Bucketing
Table de données
Euceda and al., Scandinavian Journal of Clinical and Laboratory Investigation 2015, 75, 193-203.
identification métabolites: RMN
2D
Analyses statistiques
Workflow en RMN
9.495 9.485 … 0.5
Echantillon 1 Int11 Int12 Int1X
Echantillon Y IntY1 IntY2 IntYX
Echantillon…
.
p. 43Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 1: question biologique
Etape 2 : design de l’étude
Etape 3 : préparation des échantillons
Ajout de solvant deutéré à l’échantillon solide (tissus, cellules) ou liquide (urines)
Utilisation de solutions tampons
Ajout d’un standard externe (TSP, DSS…)
Préparation d’échantillons biologiques en RMN
p. 44Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etape 4 : analyse des échantillons
Etape 5 : Extraction des données
Solutions commerciales:AMIX®Icoshift® sous MatlabMestRenova®
Solutions gratuites:NMRProcFlowW4M
Extraction des données en RMN
p. 45Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Analyse par 1H-RMN de 77 liquides céphalo-rachidiens (LCR) de différents patients (collaboration du Dr Pariente Jérémie et Christian Vincent; et hôpitaux de Toulouse)
Cruz, T. et al.(2014). Metabolites. 4, 115-128.
Etude de LCR de patients d’Alzheimer par 1H-RMN
p. 46Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Le pH du LCR évolue naturellement dès son prélèvement• Au moment du prélèvement il est entre 7.4 et 7.6
• Après 2h à 4°C il peut atteindre 9.6
Des variations de pH entrainent des déplacements chimiques de certaines molécules
Cruz, T. et al.(2014). Metabolites. 4, 115-128.
Etude de LCR de patients d’Alzheimer par 1H-RMN
p. 47Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etude de LCR de patients d’Alzheimer par 1H-RMN
Cruz, T. et al.(2014). Metabolites. 4, 115-128.
p. 48Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etude de LCR de patients d’Alzheimer par 1H-RMN
Cruz, T. et al.(2014). Metabolites. 4, 115-128.
p. 49Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Etude de LCR de patients d’Alzheimer par 1H-RMN
Cruz, T. et al.(2014). Metabolites. 4, 115-128.
p. 50Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Cruz, T. et al.(2014). Metabolites. 4, 115-128.
Etude de LCR de patients d’Alzheimer par 1H-RMN
p. 51Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Le contrôle du pH est primordial dans le LCR
Mauvaises interprétations des résultats biologiques
Importance d’éviter tout biais analytique
Etude de LCR de patients d’Alzheimer par 1H-RMN
p. 52Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Les analyses statistiques
p. 53Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Tableaux d’informations
p. 54Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Analyses univariées
Analyses multivariées:• Modèles descriptifs (ou modèles non supervisés)• Modèles supervisés
Sélection p-value <0,05
Sélection par métabolites discriminants
Table de données
Identification variables discriminantes
Interprétation biologique des résultats
Analyses statistiques
p. 55Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Statistiques descriptives: décrire, résumer, synthétiser l’information contenue dans les données
• Univariées
• Multivariées (modèles non supervisés)
Statistiques inférentielles ou décisionnelles: extrapoler à la population entière les propriétés mises en évidence sur l'échantillon
• Univariées
• Multivariées (modèles supervisés)
Analyses statistiques
p. 56Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Statistiques univariées
p. 57Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Population Statistiques: - Moyenne - Médiane- Ecart-type- Coefficient de
variation- Etc.
Statistiques univariées : statistiques descriptives
p. 58Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Statistiques univariées : statistiques descriptives
Tiré du MOOC de métabolomique
p. 59Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Statistiques univariées : statistiques descriptives
p. 60Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Population
Statistiques inférentielles
Echantillon
Statistiques univariées
p. 61Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Objectifs: extrapoler à la population entière les propriétés mises en évidence sur l'échantillon
• Tests d’hypothèses• La loi de distribution
• Méthodes d’échantillonnage: cruciales pour éviter tout biais
Statistiques inférentielles ou décisionnelles
p. 62Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé © Marie-Tremblay-Franco
Statistiques inférentielles ou décisionnelles
p. 63Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Statistiques multivariées
p. 64Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Tableau de données métabolomiques
p. 65Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Objectifs:
résumer et visualiser l’information pertinente contenue dans un grand tableau de données
Mettre en évidences des liens potentiels entre les variables
Identifier de regroupements d’individus similaires
Mettre en évidence des individus atypiques
Statistiques multivariées descriptives ou non supervisées
p. 66Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Méthodes descriptives Variables quantitatives Variables qualitatives/mixtes
Les méthodes factorielles: Visualiser les corrélations multiples entre les variables et/ou les individus
Analyses en composantes principales (ACP)
Analyses factorielles des correspondances (AFC, AFCM)
Les méthodes de classification: réduire le nombre d’individus en groupes homogènes
Classification hiérarchiqueascendante
AFC ou AFCM et classification
Statistiques multivariées descriptives ou non supervisées
p. 67Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
L’analyse en composante principale (ACP):
réduire la dimensionnalité en perdant le moins d’information possible
• les composantes principales sont des combinaisons linéaires des variables d’origines centrées
• Projection du nuage de points sur une surface plane
Statistiques multivariées descriptives
p. 68Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
I1
I2
I3
X1
X2
X3
I1
I2
I3
X1
X2
X3
X =
Espace des individusEspace des variables
Statistiques multivariées descriptives : ACP
p. 69Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Composante principale = somme pondérée des variables d’origine centrée
Un poids est associé à chaque variable, ce poids peut être positif ou négatif
X1
X2
X3
Espace des individus
I1*I2*
I3*T2
T1
Ti= wi1X1+ wi2X2 + wi3X3 …… + wikXk
I1
I2
I3
Analyse en Composantes Principales
p. 70Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
D’un point de vue géométrique : construction d’une série d’axes orthogonaux permettant de projeter le maximum de variabilité des données sur un plan à 2 dimensions. (techniquement : maximise la variance projetée sur les axes)
Statistiques multivariées descriptives: ACP
p. 71Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
t31
t32
t21
t22
t12
t11
W2
W1
I1*I2*
I3*T2
T1
X1*
X3*X2*
w21
w11
w23
w13
w22
w12
Scores plot Loadings plot
Analyse en Composantes Principales
p. 72Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Discrimination des trois aliments (97 % de la variabilité totale) Mise en évidence des métabolites majeurs discriminants les aliments Effet spécifique de chaque aliment sur le métabolisme des truites?
45 variables ( Concentrations des métabolites), 36 échantillons, Normalisation centrée réduite
Jour de fabricationDébut de l’essaiFin de l’essai
PC2 = 24%
PC1= 69%
Végétal
Marin
Commercial
Scores plot Loadings plot
Stage Master 2 Blandine Madji Hounoum
ACP sur les concentrations des métabolites d’extraits polaires d’aliments
p. 73Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé 73
Classification hiérarchique ascendante• Mesure de distance ou dissimilarité entre les individus
Objectifs: regrouper les individus en groupes homogènes
Kristian Hovde Liland, Trends in Analytical Chemistry, Vol. 30, No. 6, 2011
Statistiques multivariées descriptives: classification ascendante hiérarchique
p. 74Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Variables explicatives
Objectif: expliquer la variable Y à partir des variables explicatives X
X =
Y11
Y21
Y31
Y =
𝑓 𝑋 = 𝑌
Statistiques multivariées supervisées
p. 75Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Statistiques multivariées supervisées
Partial Least Squares (PLS):
réduire la multidimensionnalité en perdant le moins d’information possible (comme pour l’ACP)
• Variables latentes: maximisent la covariance entre X et Y
• Projection des nuages de points sur une surface plane
p. 76Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Études méthodologiques: • Optimisation du protocole de préparation des échantillons
• Optimisation de(s) méthodes statistique(s)
Études non ciblées• Détection du maximum de composés afin de :
• Rechercher un ou plusieurs biomarqueurs (modèles prédictifs)
• Rechercher des voies métaboliques perturbées (modèles explicatifs)
Études ciblées:• Recherche spécifique de composés appartenant à une ou plusieurs voies métaboliques
• Quantification de composés biomarqueurs
Différents types d’études métabolomiques
p. 77Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Jan van der Greef et al., Current Opinion in Chemical Biology, (2004), 5, 559-565
Différents types de biomarqueurs
p. 78Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
PLS-DA
Sélection de variables
Identification des variables
Validation sur cohorte externe
Modèles prédictifs: recherche de biomarqueurs
p. 79Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Boiterie chez les vaches:
• Forte prévalence chez les vaches laitières
• Souffrance animale
• Pas de symptômes avant l’apparition de la maladie
Objectifs: mettre en évidence des biomarqueurs précoces avant l’apparition de la boiterie chez les vaches
Protocole d’expérience:• Prélèvement d’échantillons de sang de la vache à différents temps pendant la gestation et
après la mise bas. Zhang et al., Animals (2015), 5, 717-747.
Exemple : recherche de biomarqueurs précoces de la boiterie chez les vaches
p. 80Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Construction d’une série d’axes (composantes principales) permettant de maximiser la variance entre les individus
Zhang et al., Animals, (2015), 5, 717-747.
ACP
PLS-DA
Visualisation du lien entre les variables quantitatives X et les variables qualitatives (groupes).
Classification des variables (score VIP) par ordre décroissant
Exemple : recherche de biomarqueurs précoces de la boiterie chez les vaches
p. 81Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Études méthodologiques: • Optimisation du protocole de préparation des échantillons• Optimisation de(s) méthodes statistique(s)
Études non ciblées• Détection du maximum de composés afin de :
• Rechercher un ou plusieurs biomarqueurs (modèles prédictifs)• Rechercher des voies métaboliques perturbées (modèles explicatifs)
Études ciblées:• Recherche spécifique de composés appartenant à une ou plusieurs voies métaboliques• Quantification de composés biomarqueurs
Différents types d’études métabolomiques
p. 82Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Wirgot et al.,Scientific Reports (2019), 9, 12799
Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage
p. 83Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Wirgot et al.,Scientific Reports (2019), 9, 12799
a) RMN b) LC-MS mode +
Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage
p. 84Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Wirgot et al.,Scientific Reports (2019), 9, 12799
Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage
p. 85Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Wirgot et al.,Scientific Reports (2019), 9, 12799
Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage
p. 86Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Plusieurs logiciels de mis en réseaux des métabolites
• MetExplore: plusieurs organismes dans BDD
• MetaboAnalyst: comparaison de différence de profil d’expression mais peu d’organismes disponibles pour mapper
• KEGG
• iPath 3 …..
Modèles explicatifs: réseaux métaboliques
p. 87Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Études méthodologiques: • Optimisation du protocole de préparation des échantillons
• Optimisation de(s) méthodes statistique(s)
Études non ciblées• Détection du maximum de composés afin de :
• Rechercher un ou plusieurs biomarqueurs (modèles prédictifs)
• Rechercher des voies métaboliques perturbées (modèles explicatifs)
Études ciblées:• Recherche spécifique de composés appartenant à une ou plusieurs voies métaboliques
• Quantification de composés biomarqueurs
Différents types d’études métabolomiques
p. 88Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Ahonen et al., Metabolites, (2019), 9, 184.
Etude clinique ciblée de métabolites pour la stratification de patients diabétiques
p. 89Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Ahonen et al., Metabolites, (2019), 9, 184.
Etude clinique ciblée de métabolites pour la stratification de patients diabétiques
p. 90Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Omiques intégratives
p. 91Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Réseaux métabolites-enzymes-gènes
p. 92Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Métabolisme de la glycine, sérine, thréonine, alanine
p. 93Design d’une étude métabolomique
04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé
Métabolomique:
• Technologie multidisciplinaires
• Applicable a des nombreux domaines de recherche
Cependant
• Précautions à prendre à toutes les étapes du workflow pour éviter les biais
Conclusions générales