いまさら聞けない
NGS超!入門
株式会社ジナリス
竹田 綾
目的
• NGSについて「少し会話ができるレベル」になる
• 知りたい情報を効率よく入手するためのヒント
OUTLINE
• NGS:なにができるの?
• 「次世代」シーケンサー
– 活躍中のシーケンサー
– 第n世代シーケンサーたち
• 基本の「き」 用語集
– ライブラリー作製
– シーケンシング
– データ解析
• 情報源のまとめ
NGSで何ができるの?
(どんなふうに使われているのか)
http://cell-innovation.nig.ac.jp/public/contents/sra_stat.html
42%
NCBI Short Read Archive DDBJ = DRA
アプリケーション
• 新規ゲノム解析 • リシーケンス(変異) • RNA-seq(発現) • 新規トランスクリプトーム • miRNA • ChIP-seq • メチル化 • 16S rRNAメタゲノム • メタゲノム(ショットガン) などなど
NGS = 実験ツール
“一方、シークエンサーはマイクロアレイと違い、DNA 多型から、転写、DNAタンパク質相互作用、エピゲノムまで、あらゆる現象を捉える「多目的顕微鏡」になっている。先日、“何々-Seq”がどのぐらいあるかを、数人で思
い出してみたところ、60手法ぐらいはすらすらと出てきた。”
(大会長挨拶より)
http://flxlexblog.wordpress.com/2012/12/03/developments-in-next-generation-sequencing-a-visualisation/
Dec 3rd, 2012
41%
8%
1% 0% 0% 0%
50%
シーケンサー別統計
Illumina
Roche454
SOLiD
IonTorrent
PacBio
Helicos
Others
Next“次世代”シーケンサー
• Qiagen GeneReader
– Intelligent Bio-System “Max-Seq Genome Sequencer”
– 20-400M reads/flowcell, 20 flowcell (independent)
– Early access starts 2013
• GnuBIO
– Beta version start shipping in April
– Sequence by Hybridization
– Read length ~1000bp, 1.2Gb/run, $50,000
• Oxford Nanopore GridION & MinION
(ほぼ)共通のながれ
ライブラリー作製
シーケンシング
データ解析
①
ライブラリー作製
• DNA断片化→シーケンシングアダプター付与
• フラグメントサイズ:断片化したDNAの長さ
• RNA:PolyA濃縮/ rRNA除去後、cDNA作製
• Target capture
• Amplicon
など
ライブラリー
フラグメント/シングルエンド ペアエンド
アダプター DNAフラグメント
シーケンスリード
メイトペアライブラリー
http://wako-chem.co.jp/siyaku/jutaku/dna_sequence/img/figure_03_01.jpg
マルチプレックス
http://www.illuminakk.co.jp/technology/multiplexing_sequencing_assay.ilmn
(ほぼ)共通のながれ
ライブラリー作製
シーケンシング
データ解析
②
“生データ”
• 生データ: ベースコールと最低限のフィルタリング後、シーケンサーから出力されるリード配列とそのクオリティー情報
(Fastq, SFF, etc)
• 出力データ量 = リード数 x リード長
• リード長
• クオリティー Phred Score
Phred Score
http://en.wikipedia.org/wiki/Phred_quality_score
http://en.wikipedia.org/wiki/Phred_quality_score
トリミング・フィルタリング
生データのQual. Valueの分布
1 51 bp
トリミング後のデータの
Qual. Valueの分布
1 51 bp
(株)ジナリス
(ほぼ)共通のながれ
ライブラリー作製
シーケンシング
データ解析
③
アセンブリー vs マッピング
コンセンサス配列
参照配列/リファレンス
リード
アダプター DNAフラグメント
シーケンスリード
http://www.slideshare.net/kbradnam/assemblathon-2-talk
ペアリード
アダプター DNAフラグメント
スキャフォールド/スーパーコンティグ
コンティグ1 コンティグ2
スキャフォールド/スーパーコンティグ
コンティグ1 コンティグ2
NNNNNNNNNNNN
スキャフォールド
ギャップ
アセンブリー結果の評価
• アセンブリーサイズ:総コンティグ/スキャフォールド長
• コンティグ・スキャフォールド数
• N50
• ギャップ数・ギャップ長
N50
12個のスキャフォールド/コンティグ、総塩基長200Mb
http://www.slideshare.net/kbradnam/assemblathon-2-talk
N50
12個のスキャフォールド/コンティグ、総塩基長200Mb
http://www.slideshare.net/kbradnam/assemblathon-2-talk
マッピングの評価
参照配列/リファレンス
A A A A A
Depth=リードの厚み
%Coverage = 参照配列の全長に対して、リードがマップされている領域の割合
SNP・一塩基置換
A A A A A
G A A A A A
G A A G G
InDel Deletion
Insertion
リピート配列
ATTGGCTATGGTTACAGAACGCGCGCGCGCGCGCGCGCGCGCGCGCGCATTGCACTT
GTTACA
GTTACA
GCACTT
GCACTT
CGCGCG
CGCGCG
??
高次解析
• 遺伝子アノテーション
• SNP解析
• 発現量解析
• コピー数
• 菌叢推定
などなど
First Option
https://www.google.com/?tbm=pts
Google 特許
メーカーサイト
http://www.illuminakk.co.jp/events/webinar_japan.ilmn
http://454.com/publications/index.asp
http://cell-innovation.nig.ac.jp/wiki/tiki-index.php
http://togotv.dbcls.jp/index.rb?category=NGS
http://seqanswers.com/
http://qa.lifesciencedb.jp/
http://www.genome.gov/27552682
個人ブログ
http://pacbiobrothers.blogspot.jp/
http://shortreadbrothers.blogspot.jp/
http://genaport.genaris.com/GOC_topics.php
http://genaport.genaris.com/GOC_topics.php
GOクラブ会員募集中! 次世代シーケンシング関連の最新ニュースを定期的にお届けします。 会員登録、メールマガジン購読をご希望の方はこちら。 http://genaport.genaris.com/GOC_top.htm
ご清聴ありがとうございました
宿題: せっかくですので、本会期中に「匠」印の人を見つけて、一つ質問してみましょう!