Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Next-Generation Sequencingin der Immungenetik
1
Blutzentrale Linz
Martin Danzer, Susanne Süssner, Johannes Weinberger, Christian Gabriel
Sequenzierung (sequencing-based typing)
B*1801,5601
vs.B*1801,5502
163.2=Y
Exon 2 Exon 3Exon 1 Exon 4
Mutationen liegen außerhalb der sequenzierten Bereiche
– man kann den Polymorphismus nicht erkennen
Ambiguities
Polymorphic positions
Core heterozygous sequence data
Beispiel: HLA-B
B*0702, 4402
B*0702, 4419N
Beispiel: HLA-B
B*0702, 4402
B*0720, 4416
B*0724, 4421
AmbiguitiesStrangrekonstruktion durch Polymorphismen
an der gleichen Position nicht möglich
A+B=D+E
B*0724, 4421
TGGAGGGCSMGTGCGTGGA
TGGAGGGCSMGTGCGTGGA
S = G und C
M = A und T
-------------SM-------------
cis/trans Problematik
TGGAGGGCSMGTGCGTGGA -------------SM-------------
-------------GA--------------
-------------CT--------------
-------------GT--------------
-------------CA--------------
Anzahl der möglichen Kombinationen= 2n
n=2; 4 Kombinationen
n=4; 16 Kombinationen IUB Code K S W M Y R
Bases G,T G,C A,T A,C C,T A,G
BESSER TYPISIEREN
#
Ohne Ambiguities?
BESSER TYPISIEREN
Wie können wir schneller und
sicherer typisieren?
Pacific Biosciences
9
Johannes Weinberger
Genia
11
Johannes Weinberger
Oxford Nanopore
12
Johannes Weinberger
� Affymetrix� Agencourt Bioscience� Avantome� BioNanomatrix� Genizon Biosciences� Halcyon Molecular
� 454 (Roche)� Complete Genomics� Illumina� Intelligent BioSystems - Qiagen� Life Technologies - SOLiD
� Halcyon Molecular� Intelligent Biosystems� Lynx� Manteia� Nanofluidics� Pyrosequencing� Sequenom� Solexa� VisiGen
� Life Technologies - SOLiD� Life Technologies – Ion Torrent� Pacific Biosciences� Genia - Roche
StrategienB
LOO
D C
EN
TE
R F
OR
UP
PE
R A
US
TR
IA
Exon-based typing flexibility: highcapacity: gentlefull allele drop out: rareDNA quality: not criticalScabillity: medium/ high/ ultra highlibrary prep: complexautomation: yes
flexibility: highcapacity: gentlefull allele drop out: rareDNA quality: not criticalScabillity: medium/ high/ ultra highlibrary prep: complexautomation: yes ? Ambiguities
library prep
1
Gabriel C et al: Rapid high-throughput human leukocyte antigen typin g by massively parallel pyrosequencingfor high-resolution allele identification . Hum Immunol 2009, 70:960-964.
Bentley G et al: High-resolution, high-throughput HLA genotyping by next-generation sequencing .Tissue Antigens 2009, 74:393-403.
Shorter amplicons allow the complete coverage in reverse and forward direction !
BLO
OD
CE
NT
ER
FO
R U
PP
ER
AU
ST
RIA
Erlich RL et al: Next-generation sequencing for HLA typing of class I loci . BMC Genomics 2011, 12:42.
Moonsamy PV et al: High throughput HLA genotyping using 454 sequencing and the Fluidigm Access Array™System for simplified amplicon library preparation. TissueAntigens 2013 Mar;81(3):141-9.
Danzer M et al: Rapid, scalable and highly automated HLA genotyping using next-generation sequencing:A transition from research to diagnostics. BMC Genomics 2013, 14:221
Grumbt B et al: Diagnostic applications of next generation sequencing in immunogenetics and molecular oncology.Transfus Med Hemother. 2013 Jun
Trachtenberg EA et al: Next-generation HLA sequencing using the 454 GS FLX sys tem. Methods Mol Biol. 2013
Holcomb CL et al: Multi-site study using high-resolution HLA genotypi ng by next generation sequencing .Tissue Antigens 2011, 77:206-217.
Amplifikate
� HLA -A, -B, -C, -DP, -DQ, -DR� Klasse I:
- A: exons 2,3,4- B: exons 1,2,3,4 - C: exons 1,2,3,4,6,7
� Klasse II: - DP: exon 2- DQ: exons 2,3- DR: exons 2,3
LimitationenAmbiguities zwischen Exons B
LOO
D C
EN
TE
R F
OR
UP
PE
R A
US
TR
IA
B*15:01:01:01 Exon 2 Exon 3
Intron ~250bp
BLO
OD
CE
NT
ER
FO
R U
PP
ER
AU
ST
RIA
B*40:01:01 Exon 2 Exon 3
B*15:212
B*40:21
Exon 2
Exon 2
Exon 3
Exon 3
oder
StrategienB
LOO
D C
EN
TE
R F
OR
UP
PE
R A
US
TR
IA
cDNA-based typingflexibility: mediumcapacity: ideal full allele drop out: possibleRNA quality: very criticalScabillity: : medium/ highlibrary prep: reduced complexityautomation: yes
flexibility: mediumcapacity: ideal full allele drop out: possibleRNA quality: very criticalScabillity: : medium/ highlibrary prep: reduced complexityautomation: yes ? N- alleles
RNA quality
2
Lank SM et al: A novel single cDNA amplicon pyrosequencing method for high -throughput, cost -effective
BLO
OD
CE
NT
ER
FO
R U
PP
ER
AU
ST
RIA
Lank SM et al: A novel single cDNA amplicon pyrosequencing method for high -throughput, cost -effectivesequence-based HLA class I genotyping . Hum Immunol 2010, 71:1011-1017.
Lank SM et al: Ultra-high resolution HLA genotyping and allele dis covery by highly multiplexed cDNAamplicon pyrosequencing . BMC Genomics 2012, 13:378.
StrategienB
LOO
D C
EN
TE
R F
OR
UP
PE
R A
US
TR
IA
Full genomic typing
flexibility: lowcapacity: maxfull allele drop out: possibleDNA quality: criticalScabillity: ultra highlibrary prep: complex
flexibility: lowcapacity: maxfull allele drop out: possibleDNA quality: criticalScabillity: ultra highlibrary prep: complex
? DRB1,Software issues (phasing)cinical relevance
3
BLO
OD
CE
NT
ER
FO
R U
PP
ER
AU
ST
RIA
Lind C et al: Next-generation sequencing: the solution for high-r esolution, unambiguous human leukocyteantigen typing . Hum Immunol 2010, 71:1033-1042.
Wang C et al: High-throughput, high-fidelity HLA genotyping with deep sequencing . Proc Natl Acad Sci U S A 2012, 109:8676-8681.
Shiina T et al: Super high resolution for single molecule-sequence- based typing of classical HLA loci at the8-digit level using next generation sequencers . Tissue Antigens 2012, 80:305-316.
Hosomichi K et al: Phase-defined complete sequencing of the HLA genes by nex t-generation sequencing.BMC Genomics 2013, 28;14:355.
Ozaki Y. et al: HLA-DRB1, -DRB3, -DRB4 and -DRB5 genotyping at a sup er-high resolution level by long range PCR and high-throughput sequencing. Tissue Antigens 2014
ZusammenfassungZusammenfassungZusammenfassungZusammenfassung der der der der
TypisierungsergebnisseTypisierungsergebnisseTypisierungsergebnisseTypisierungsergebnisse
60.000
70.000
80.000
90.000
HQ HQ HQ HQ ReadsReadsReadsReads
GS Junior Performance
0
10.000
20.000
30.000
40.000
50.000
60.000
tiGS
j008
-201
1
tiGS
j009
-201
1
tiGS
j010
-201
1
tiGS
j011
-201
1
tiGS
j012
-201
1
tiGS
j013
-201
1
tiGS
j014
-201
1
tiGS
j016
-201
1
tiGS
j017
-201
1
tiGS
j018
-201
1
tiGS
j019
-201
1
tiGS
j020
-201
1
tiGS
j021
-201
1
tiGS
j022
-201
1
tiGS
j023
-201
1
tiGS
j024
-201
1
tiGS
j025
-201
1
tiGS
j026
-201
1
tiGS
j027
-201
1
tiGS
j028
-201
1
tiGS
j029
-201
1
tiGS
j030
-201
1
tiGS
j031
-201
1
tiGS
j032
-201
1
tiGS
j033
-201
1
tiGS
j034
-201
1
tiGS
j035
-201
1
tiGS
j036
-201
1
tiGS
j037
-201
1
tiGS
j038
-201
1
tiGS
j039
-201
1
tiGS
j040
-201
1
tiGS
j041
-201
1
BE4
BE3
BE2
BE1
AE4
AE3
AE2
Raw Amplicon Reads
Raw 454 reads – Validierungsstudie
DRBE3
DRBE2*1/5
DQB1E3
DQB1E2
DPB1E22
CE7
CE4
CE3
CE2
CE1
BE4
0 200 400 600 800
[reads]
olomouc 6th ewic / 02.03.2012
BE4
BE3
BE2
BE1
AE4
AE3
AE2 ATFraw
39.51%
61.80%
64.57%
81.38%
48.65%
59.73%
53.26%
Raw 454 reads vs used ATF reads –Validierungsstudie
Ursachen:ErkannteSequenzierfehler
median
DRBE3
DRBE2*1/5
DQB1E3
DQB1E2
DPB1E2
CE7
CE4
CE3
CE2
CE1
Am
plic
ons
0 20000 40000 60000 80000
58.08%
49.78%
52.63%
57.07%
46.60%
67.06%
59.99%
51.25%
68.41%
60.46%
79.37% SequenzierfehlerFilter settings,Coverage
olomouc 6th ewic / 02.03.2012
Anz
ahl d
er P
robe
n di
e m
it de
m
Mis
eq ty
pisi
ert w
urde
n
kein
Mis
eq E
rgeb
nis
mög
lich
Anz
ahl d
er in
itial
erf
olgr
eich
en
Mis
eq T
ypis
ieru
ngen
Anz
ahl d
er P
robe
n oh
ne
Ref
eren
z Ty
pisi
erun
g
Initi
al e
rfol
grei
che
Mis
eq
Typi
sier
ung
verg
liche
n m
it de
r R
efer
enz
Typi
sier
ung
Mis
eq T
ypis
ieru
ngsf
ehle
r ve
rglic
hen
mit
der
Ref
eren
z Ty
pisi
erun
g
Übe
rein
stim
mun
gsra
te M
iseq
vs
. Ref
eren
z
23
Locu
s
Anz
ahl d
er P
robe
n di
e m
it de
m
Mis
eq ty
pisi
ert w
urde
n
kein
Mis
eq E
rgeb
nis
mög
lich
Anz
ahl d
er in
itial
erf
olgr
eich
en
Mis
eq T
ypis
ieru
ngen
Anz
ahl d
er P
robe
n oh
ne
Ref
eren
z Ty
pisi
erun
g
Initi
al e
rfol
grei
che
Mis
eq
Typi
sier
ung
verg
liche
n m
it de
r R
efer
enz
Typi
sier
ung
Mis
eq T
ypis
ieru
ngsf
ehle
r ve
rglic
hen
mit
der
Ref
eren
z Ty
pisi
erun
g
Übe
rein
stim
mun
gsra
te M
iseq
vs
. Ref
eren
z
A 130 1 129 (99,2%) 4 125 0 100.0%B 130 1 129 (99,2%) 0 129 0 100.0%C 130 1 129 (99,2%) 9 120 0 100.0%DRB1 130 2 128 (98,5%) 6 122 0 100.0%DQB1 130 1 129 (99,2%) 11 118 0 100.0%DPB1 130 1 129 (99,2%) 36 93 0 100.0%DQA1 130 1 129 (99%) 111 19 0 100.0%all 910 8 902 (99,1%) 177 726 0 100.0%
Probleme der NGSHLA Typisierung
� Homopolymere� MID Interferenz beim Primer annealing� Genaue Quantifizierung und Normalisierung � Genaue Quantifizierung und Normalisierung
notwendig� Verlust von Sequenzen wegen der Effekte
der Qualitätsparameter der Software� HLA-edits immer noch (bis zu 80% der Loci)
notwendig� Repeats: notwendig in 3% (loci)
NGS HLA Typisierung
� Die Selektion der Exons und Primer kann variieren – es gibt noch keinen Standard
� NGS ist nur dann anwendbar, wenn:� NGS ist nur dann anwendbar, wenn:- Automation vor der Sequenzierung - hochwertige Bioinformatik vorhanden- Durchsatz hoch
Status der HLA Typisierung
� Anwendbar für Spender/Empfänger Typisierung
� Hochgradig zuverlässig� Hochgradig zuverlässig� Hohe Qualität der Ergebnisse in kürzerer Zeit
mit mehr Proben� Ideal für Nabelschnurblutbanken und
Registertypisierungen
TCR UND IGHSEQUENZIERUNG
27
Blutzentrale Linz
Struktur
28
Blutzentrale Linz
BCR TCR
Rezeptor-Rekombination
ca. 1012
Rezeptorvarianten
29
Blutzentrale Linz
EineRezeptorspezifitätpro Zelle
Klon Selektion und Proliferation
Zellen mit hoherAffinität zu Epitop
30
Blutzentrale Linz
Affinität zu Epitop� Proliferation
Klonalisierung des Repertoires
31
Blutzentrale Linz
Klonalisierung des BCR/TCR Repertoires durch gerichteteoder ungerichtete Proliferation
Workflow
DNA-
32
Blutzentrale Linz
B- und T-Zell IsolationDNA-Extraktion
NGS
Datenanalyse
NGS Sample Preparation
Materialgewinnung
� Blut
� Harn
� Nierengewebe� Nierengewebe
33
Library Preparation der rekombinierten IGH und TRB Loci
34
Amplifizieren der rekombinierten IGH und
TCRB Loci
35
ERGEBNISSE
36
Blutzentrale Linz
Anzahl unterschiedlicher VDJ Kombinationen und CDR3
Sequenzen
� 3527 unterschiedliche, auswertbare VDJ Kombinationen in 85763
Reads
�
Reads
� ca.19400 unterschiedliche, auswertbare CDR3 Sequenzen 85763 Reads
37
V Element Verteilung
38
D Element Verteilung
39
J Element Verteilung
40
CDR3 Verteilung bei gesundenProbanden
Sequence Count Percentage
ARVFRY 311 0,140360695
ARGIDY 261 0,117794667
AR 213 0,09613128
ARCYGMDV 203 0,091618074
Sequence Count Percentage
ACWSSDTLNSTGP 325 1,55405728
ASS*GEQSAPA 275 1,31497155
ASSETVDYGYT 182 0,87027208
ATEGYGYT 120 0,57380577
41
Blutzentrale Linz
ARCYGMDV 203 0,091618074
ARGGNSDY 196 0,088458831
ARWHDNIPADY 175 0,078981099
ARDVGTLERWYYFDY 164 0,074016572
ASTYYGMDV 155 0,069954687
AASSG 155 0,069954687
ARGYYGMDV 147 0,066344123
ARALDVDY 140 0,063184879
IGH
ATEGYGYT 120 0,57380577
ASSFLRGGYGYT 109 0,5212069
ASNQNTGAPYEQY 101 0,48295319
ASSHRDRGRSLKL 85 0,40644575
ASSYGRQAISPS 78 0,37297375
ASSPGLTVRSYEQY 78 0,37297375
ASRQSYGYT 77 0,36819203
TSS 74 0,35384689
TRB
Beispiel 1
� Nephrektomie rechts bei hydronephrotischerSackniere
� Histo: Nierenbiopsie mit dem Bild einer chronischen interstitiellen Nephritis, mit Tubulitis und interstitiellen Nephritis, mit Tubulitis und Tubulusatrophie, am ehesten sprechend für eine chronische Pyelonephritis
� Größe des Gewebeteils: 2x3cm
42
Blutzentrale Linz
CDR3 9N TCRB vs 9B TCRB
9NSequence Count Percentage
ASSPYTTGRKLF 12299 18,6249716
ASSKEYRGAGGYT 9588 14,519573
ASSPDRGGNQPQH 6352 9,61914136
ASSYSPTMNTEAF 3527 5,34110699
ASSYGGDGYT 1904 2,88331945
ASSATLEGAGYGYT 835 1,26448096
ATLNYGYT 599 0,90709472
43
Blutzentrale Linz
9B
ATLNYGYT 599 0,90709472
ASSSTA*GHNQPQH 595 0,90103733
ASSSILLRTLLRAV 486 0,73597335
Sequence Count Percentage
ASSKEYRGAGGYT 6170 4,79562254
ASSYSPTMNTEAF 5997 4,66115857
ASSPYTTGRKLF 5753 4,47150996
ASSYGGDGYT 5510 4,2826386
ASSATLEGAGYGYT 3311 2,5734694
ASSPDRGGNQPQH 847 0,65832938
ASSPRDS*TLKL 670 0,52075642
ASS*GC*QGMAT 622 0,4834485
ASSEGVGTFSAPLH 552 0,42904111
CDR3 9N IGH vs 9B IGH
9N
Sequence Count PercentageASVMGPLLWFGKSQHRYYFDY 22536 35,4256072MKRC*RSSD*SSYGP*L 382 0,60048731AREVGRRPPEAWEVWT 337 0,52974927ASVMGPLLWFGKSQHRYYFDS 257 0,40399277ASVMGPLLWFGKSQHTYYFDY 253 0,39770494ATSLI 174 0,2735204AKRVGAYSPFEY 169 0,26566061
44
Blutzentrale Linz
9B
Sequence Count PercentageASVMGPLLWFGKSQHRYYFDY 2164 6,69948299AKRVGAYSPFEY 1587 4,91316058IAVVTAFRLDVSDI 1168 3,61598712FYYDSGCLAGST 1018 3,15160521AKRVGASSPFEY 227 0,70276462GRDSVETGGLT 138 0,42723136ARV*TTMRVVGRFGGLT 108 0,33435497ASVMGPLLWFGESQRRYYFDF 102 0,3157797ARDWGIQLWLLGGMDV 101 0,31268382
AKRVGAYSPFEY 169 0,26566061TKTFSRLVKYFCRD*L 161 0,25308496F*LAAGAY*FDC 136 0,21378606
Beispiel 2: Proband 1
Sequence Count Relative Quantities
ASSVSGEGSDEQF 8437 8,96618419
ASSMGQNNEQF 4697 4,9916045
ASSGFGEVAPTMSS 2267 2,40919042
FNPASGNIQY 1273 1,35284491
Sequence Count Relative Quantities
ASSVSGEGSDEQF 10095 11,44739528
ASSMGQNNEQF 7747 8,784841131
ASSLRYNEQF 728 0,825527862
AWSALAGDYNEQF 608 0,68945184
45
Blutzentrale Linz
FNPASGNIQY 1273 1,35284491
ASLPGKLVRDPV 1264 1,34328041
AWSALAGDYNEQF 1081 1,14880231
ASSLSSGFASYNEQF 691 0,73434079
SVGFLAGSTDTQY 528 0,56111713
ASSISWVTDTQY 483 0,51329465
Proband 1 TRB Februar 2014
Proband 1 TRB November 2013
AWSALAGDYNEQF 608 0,68945184
ASSGFGEVAPTMSS 556 0,630485565
ASSLGGREQF 474 0,537500283
ASSLSSGFASYNEQF 448 0,508017146
ASSLGQNNEQF 438 0,496677477
ASSLAWLSSYNEQF 364 0,412763931
Beispiel 3: CLL Patient
Sequence Count Percentage
ARAGINWGPYFDC 17701 95,5158645
ARAGINWAHTLT 79 0,42628966
AKGLTTTGTTPDY 65 0,35074466
ARAGINWGPYFD 48 0,25901144
Sequence Count Percentage
ASSRGRGYEQY 2124 3,54035404
ASSIIGNQPQH 1496 2,49358269
ASVQVTMAT 942 1,57015702
ASSRGQSYGYT 584 0,97343068
46
Blutzentrale Linz
ARAGINWGPYFD 48 0,25901144
VKGLTTTGTTPDY 41 0,22123894
ARAGINWGPYLDC 24 0,12950572
ARAGINWGSYFDC 20 0,10792143
ARAGINWSPYFDC 17 0,09173322
ARVGINWGPYFDC 16 0,08633715
IGH
ASSRGQSYGYT 584 0,97343068
ASSRGQNYGYT 578 0,96342968
ASREDGRLRAV 472 0,78674534
ASSRGQGYEQY 444 0,74007401
ASSRGLSYEQY 438 0,73007301
ASSRGGSYEQY 381 0,63506351
TRB
V(D)J Kombination: Spectra IgH
2 V(D)J spectra desselben Patienten zu
verschiedenen Zeiten
DankeDanke
49
Blutzentrale Linz