Ion Torrent - Thermo Fisher Scientific‚¢プリケーション ノート アンプリコン...

Preview:

Citation preview

アプリケーション ノートアンプリコン シーケンシング

Ion Torrentアンプリコン シーケンシング

はじめにゲノムまたはその一部の配列を解析することにより、遺伝情報がどのように細胞機能を調節するかが徐々に解明され始めました。配列データはまた、ヒトの健康を分子レベルで解明するためにもますます利用されつつあります。多くの場合、ゲノムのわずかな一部、すなわちゲノムの「ターゲット」領域をシーケンシングするだけで特定の仮説に取り組むために必要なデータを得ることが可能です。ゲノムの特定領域は、PCR を使用して全ゲノムから容易に増幅できます。そのためこの手法をターゲット シーケンシングに利用することを「アンプリコン シーケンシング」と呼ぶことも少なくありません。

ターゲットとなるゲノム領域の数が複数のサンプル

で数か所から数百か所にのぼる場

合、アンプリコン シーケンシングを使用するのが一般的です。アンプリコン シーケンシングは、特にヒトの健康の解明を目的とする臨床アプリケーションに便利です。従来のサンガー シーケンシングは、ターゲット領域やサンプル数の増加に対応することが困難です。次世代シーケンシング(NGS)技術は、過去 5 年間で飛躍的にスループットを向上させました。しかし現在の NGS 技術は、ゲノムのごくわずかな領域の配列解析に使用するには複雑で高価となる傾向があります。Ion Torrent は、シンプルかつ高速で拡張性と費用効果の高い革新技術を採用しているため、特にアンプリコン シーケンシングに適しています。

このアプリケーション ノートでは、Ion Torrent 技術を利用したアンプリコン シーケンシングについて説明します。また構造遺伝子変異または体細胞変異の検出実験についても、実験デザインのガイダンスを提供します。

Ion Torrent 技術Ion Torrent は、化学信号を直接デジタル情報に変換できる新しい半導体チップとして、初めて製品化された装置です。この技術は、DNA のシーケンシングに初めて利用されました。この装置は、数十年にわたる半導体技術の進化の恩恵を受けて開発され、わずか数年で半導体の設計、製造、サプライチェーン全体をシーケンシングに利用するようになりました。その成果が光源を必要とせず製品化された初のシーケンシング技術、イオン半導体シーケンシングです。高速性と拡張性に優れた低コストの製品が実現しました。第一世代の Ion 314™ Chip はセンサーの数が最高 100 万個ですが、わずか数ヶ月間の技術進歩によって生まれた第二世代の Ion 316 ™ Chip はセンサーの数が最高 700 万個に達します。その上、ランの所要時間は 1 ~ 2 時間のままです(図 1)。

シーケンシング原理も驚くほどシンプルです。ポリメラーゼによってヌクレオチドが DNA に取り込まれる過程で水素イオンが放出されるため、検出可能な pH変化を示します。Ion Torrent の半導体シーケンシング チップ上のマイクロウェルには、DNA 分子が 1 ウェルあたりおよそ 100 万コピー入っています。このチップに新しいヌクレオチドが Ion Personal Genome Machine(PGM ™)シーケンサによって次々と加えられます。添加されたヌクレオチドがマイクロウェルに中の DNAテンプレート配列と相補的配列になっている場合、このヌクレオチドが DNA に取り込まれ、水素イオンが放出されます。その結果、ウェル内の pH が変化し、イオン センサーがこれを検出します。この様に化学情報が直接デジタル情報に変換されます(図 2)。DNA 鎖に同じ塩基が 2 つ連続して存在すると、電荷は倍になり、チップは 2塩基として検出します。次に加えられたヌクレオチドがテンプレートに一致しない場合は、電荷の変化が記録されず、塩基も読み取られません。このように、PGM ™システムは、

図 1. Ion 314 ™ Chip。中心の楕円型の部分(灰色)に搭載された 140 万個のウェルがシーケンシング反応を検出し、記録する。

図 2. Ion Torrent シーケンシング チップ上の単一ウェルの断面図。ウェルには DNA テンプレートを結合した Ion Sphere ™ 粒子が入っている。ヌクレオチドが取り込まれると水素イオンが放出され、ウェルの pH が変化する。イオン感受性レイヤーが pH の変化を検出し、化学信号をデジタル信号に変換する。

イオン感受性レイヤー

センサー プレート

シリコン基板

バルク ドレイン ソース カラム レシーバーへ

塩基を直接検出するためスキャナやカメラ、光源などを必要とせず、各塩基の取り込みを数秒で記録するためランの所要時間が大幅に短縮されます。

ワークフローIon Personal Genome Machine ™ のワークフローは、きわめてシンプルです (図 3)。最初に、Ion Torrent アダプタを両端に結合させた DNA フラグメントのライブラリを作成します。アダプタは、PCR 増幅産物にライゲーションするか、または 5' 末端にイオン アダプタの配列を持つプライマーを設計し(図 4)、PCR の際にこの配列を追加することで結合できます。

次にライブラリ フラグメントを弊社独自の Ion Sphere ™ 粒子上にクローン増幅します。クローン増幅は、エマルジョンPCR(emPCR)で実行します。その後、テンプレートでコーティングされた Ion Sphere ™ 粒子をイオンチップに載せます。短時間の遠心で、Ion Sphere ™ 粒子をチップのウェルに収めます。チップを PGM にセットし、PGM のタッチスクリーンの指示に従ってシーケンシング ランをセットアップします。

手順の詳細は、『Ion Fragment Library Kit User Guide』または『Ion Xpress Template

Kit User Guide』もしくは『Ion Sequencing Kit User Guide』をご参照ください。

Ion PGM ™ シーケンサがデータを収集すると、データは自動的に所定の Torrent サーバに転送されます。ここで データをシグナル処理アルゴリズムとベース コーリング アルゴリズムを使用して解析し、個々の読み取り結果から DNA 配列を作成します。Torrent サーバは、データの解析結果をまとめて表示できるウェブ ページを備えています。またデータを業界標準の SFF や FASTQ、SAM/BAM といったフォーマットでダウンロードすることもできます。Ion Torrent のデータはその後、任意の NGS データ解析ツールにインポートすることができます。本書の最後のセクションでは、この解析ツールのひとつである Partek® Genomics Suite ™ について説明します。

実験デザインの検討 アンプリコン シーケンシングの結果を最適化するためには、次のような検討すべきポイントがあります。

• 双方向 /一方向シーケンシング

• ターゲット領域の長さ

• カバレッジの読み取り深度

最適の結果を得るためには、双方向シーケンシングを推奨します。双方向シーケンシングでは、両端からアンプリコンの配列全域にわたって高品質の読み取りが可能です。双方向シーケンシングには、ターゲット領域ごとに 4 本のフュージョン プライマーが必要です。2 つのアダプタの配列は、それぞれ 2 種類のターゲット特異的配列に結合しなければなりません。2 組のフュージョン プライマーのうち、1 組ではターゲット配列の近位端に A アダプタ領域が続き、ターゲット領域の末端に P1 アダプタ領域が続きます。他の 1 組では、この A と P1 のアダプタ配列を交換して結合します(図 5)。一方向シーケンシングでは、アンプリコンの片方の末端だけから読み取りが行なわれますので、必要なフュージョン プライマーは 1 組のみ です。

ターゲット領域の長さは、最適の結果を得るための重要な鍵となりますので、慎重に検討する必要があります。現在の標準的なリード長は、100 塩基です。しかし最初の 20 ~ 25 塩基の配列は、PCR プライマーのターゲット特異的配列に合致するため、意味のあるデータとはなりません。そのため、現在はターゲット領域(意味のある配列情報を収集するアンプリコンの領域)を 75 塩

フォワード プライマー(Primer A-key):

5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-template-specific-sequence-3’

<--------- 30 塩基 --------->

リバース プライマー(Primer P1):

5’-CCTATCCCCTGTGTGCCTTGGCAGTCTCAG-template-specific-sequence-3’

図 4. アンプリコン シーケンシングのライブラリを作成するために必要な PCR プライマーの配列構造。テンプレート特異的な配列を選択する場合は、Primer3(http://frodo.wi.mit.edu/primer3/)などの標準的な PCR プライマー設計ソフトウェアの使用を推奨。

図 3. Ion Torrent シーケンシング ワークフローの概略図。 Ion Torrent シーケンシング アダプタを両端に結合させた DNA フラグメントによってシーケンシング ライブラリを作成。これらのフラグメントをエマルジョン PCR で Ion Sphere ™ 粒子上にクローン増幅。増幅したテンプレートで覆われた Ion Sphere ™ 粒子を Ion Torrent チップに載せ、Ion PGM ™ にセット。 Ion PGM ™ のシーケンシング ランをセットアップ。シーケンシングの結果は、標準的なファイル フォーマットで表示される。Partek® Genomics Suite ™ の DNA-Seq ワークフローを使用したダウンストリームのデータ解析が可能。

テンプレートの調製ライブラリの調製

イオン半導体 シーケンシング チップ

Ion PGM ™ シーケンサ Torrent ブラウザ ダウンストリームのデータ解析ツール

シーケンシング 個別のランのデータ解析

複数のランのデータ解析

基程度とするよう推奨します。今後は急速に解析技術が進化してリード長が向上し、より大型のアンプリコンが解析できると予測されます。これよりも長いアンプリコン(150 塩基程度)の解析も可能です。しかし両方向からの読み取り(前述の双方向シーケンシングを参照)がオーバーラップすることはありません。

突然変異を正確に読み取るための十分な統計的信頼性を確保できるカバレッジの読み取り深度は、サンプルに含まれると予測される変異の出現頻度によって異なります。実験に必要なカバレッジの読み取り深度と、チップごとのスループットに応じてアンプリコンの数が決定します。必要なカバレッジの読み取り深度、および 1 回のシーケンシング ランで配列解析できるアンプリコンの数を指定するには、次の 2 つのケースを考慮しなければなりません。

1. 標準的なメンデルの法則に従う構造遺伝子変異の解析の場合、読み取りデータの 100% または 50% に所定の配列のバリアントが含まれると予測されます。これは嚢胞性線維症(CF)や家族性癌、精神遅滞、発達障害などの遺伝性疾患に見られる現象です。均一細胞系でも、すべてまたは半数の読み取り塩基に所定の配列バリアントが含まれます。この場合、平均的なカバレッジの読み取り深度を 100 ~ 200X と設定すると、統計的信頼性の高い十分なリード数のバリアントが検出できます。Ion 314 ™ Chip は、このカバレッジの読み取り深度で 500 アンプリコンまでの配列を双方向で十分に読み取ります。また Ion 316 ™ Chip は、Ion 314 ™ Chip に比べ 10 倍のスループットでより多くのアンプリコンのシーケンシングができる上、1 枚のチップに複数のサンプルを搭載できます。サンプルのマルチプレックス

化は、分子バーコードの採用によって実現しました。分子バーコードは、各読み取り領域の一部を形成する固有の配列(通常は 6 ~ 10 塩基長)の集合体であり、特定のサンプルのすべての読み取りデータを同定することができます。Ion Torrent は現在、Ion Torrent シーケンシング プラットフォーム向けの分子バーコードを開発中です。

2. 異種性癌サンプルに含まれる体細胞変異は、ばらつきが多く出現頻度も低いのが普通です。このような変異をより確実に検出するためには、1,000 ~ 2,000X 程度のより深いカバレッジの読み取りが必要です。Ion 314 ™ Chip は、このカバレッジの読み取り深度で 50 アンプリコンまでの配列を双方向で十分に読み取ります(図 6)。また Ion 316 ™ Chip は、スループットが向上した結果、より多くのアンプリコンをシーケンシン

グするか、またはカバレッジの読み取り深度を上げることでさらに低い出現頻度のバリアントを検出することができます。

DNA バリアントの同定 ベース コールのデータを収集し、これを Torrent サーバ上でリファレンス DNA の配列にアライメントした後は、SAM(sequence alignment format) フ ァ イ ルを直接 Partek® Genomics Suite™(GS)にインポートできます。Partek® GS には、多様な解析を実行するためのあらかじめ定められたワークフローがあります。また DNA-seq ワークフローには、Ion Torrent のアンプリコン シーケンシング データをマルチサンプル解析するための段階的なプロセスがあります。このプロセスは、ユーザが SAM ファイルを Partek® GS にインポートするたびに(PGM のランごとに 1 回)自動的

‘B/P1’ アダプタ

‘A’ アダプタ

ターゲット特異的配列

ターゲット特異的配列‘P1’ アダプタ

ターゲット配列

‘P1’ アダプタ

‘A’ アダプタ

ターゲット配列

ターゲット特異的配列

ターゲット特異的配列‘A’ アダプタ

ターゲット配列

ターゲット配列

‘A’ アダプタ

‘B/P1’ アダプタ

TTGCAACTGATACGGAC................GCAGCTAGGTTAACAGG

CCTGTTAACCTAGCTGC................GTCCGTATCAGTTGCAA

3’

5’

TTGCAACTGATACGGAC................GCAGCTAGGTTAACAGG

ATCCAATTGTCC

TTGCAACTGATA

AACGTTGACTATGCCTG................CGTCGATCCAATTGTCC

TTGCAACTGATACGGACTGTGAATCAGCATATTGCAGCTAGGTTAACAGG

3’

5’TTGCAACTGATACGGAC................GCAGCTAGGTTAACAGG

ATCCAATTGTCC

TTGCAACTGATA

AACGTTGACTATGCCTG................CGTCGATCCAATTGTCC

図 5. 双方向 /一方向シーケンシング用アンプリコン ライブラリとこれを使用したテンプレートの作成方法の概略図。プライマーの適切な選択とエマルジョン PCR に先立つゲノム DNA のターゲット特異的増幅が必要となる。双方向シーケンシングには 2 種類のテンプレートが必要。一方向シーケンシングには 1 種類のテンプレートのみ必要。

316

314

50

1000x

100x

500

体細胞変異:カバレッジの読み取り深度が高く解析するアンプリコンの数が少ない

構造遺伝子変異:カバレッジの読み取り深度が低く解析するアンプリコンの数が多い

アンプリコンの数

カバレッジの読み取り深度

図 6. アンプリコン シーケンシングの 2 種類の用途に見られるカバレッジの読み取り深度とアンプリコンの数の相関関係。構造遺伝子変異の検出に必要なカバレッジの読み取り深度は中程度。体細胞変異の検出にはより高いカバレッジの読み取り深度が必要となるため、1 回のランで配列を解析できるアンプリコンの数が少なくなる。Ion 316 ™ Chipは、1 枚のチップに複数のサンプルを搭載するか、または 1 回の実験で解析するアンプリコンの数を増やすことができる。

に始まります。データは、レプリケートの構造、および複製方法が生物的かまたは技術的かに基づいて分類されます。短いアンプリコンでもカバレッジに違いが発生する可能性があるため、実験サンプルと平行に正常な野生型のサンプルをランし、解析するよう推奨します。Partek® GS は、実験サンプルの塩基対の組成を野生型 /正常サンプルの塩基組成と比較し、各塩基の統計的検査を実施します。アンプリコンの配列に沿って各塩基の P 値を算出します。この P 値によって変異が存在するかどうか、また同定したバリアントが偶然である確率がどの程度かを評価します。この結果は、エクスポート可能なデータ表として作成され、グラフでも表示されます(図 7)。このグラフによって、(P 値に基づく)ゲノム上の変異の発見された場所や、各位置の配列カバレッジ /読み取り深度を確認することができます。各ゲノム位置で統計的検査を実施することで、有意な変異を発見する上での曖昧性をいくぶん回避することができます。

まとめアンプリコン シーケンシングは、最も進化の激しい NGS のアプリケーションのひとつです。臨床研究分野における重要性は特に顕著です。またアンプリコン シーケンシングは、全ゲノム関連解析で同定された対象領域のフォローアップや伝達経路に特化した研究などの基礎研究にも幅広く利用されています。このアプリケーション ノートでは、Ion Personal Genome Machine ™ を使用してゲノムの生化学関連領域における構造遺伝子変異や体細胞変異を検出する方法について説明しました。

さらにここでは、アンプリコンの配列解析のための包括的なワークフローと実験デザインのガイドラインも提供しています。Partek® Genomics Suite ™ は DNA-Seq 解析ワークフローを拡張し、アンプリコン シー

ケンシング向けの統計的検査を開発しました。このソフトウェアは、バリアント コールの信頼性を高めるために必要なすべての統計的計算を行なうだけでなく、バリアント スコアやカバレッジの読み取り深度、ゲノム上の位置などを直感的でわかりやすいグラフィックで表示します。この視覚表示はカスタマイズ可能な上、印刷のため多様な高品質フォーマットでエクスポートすることもできます。

使いやすい Ion Torrent 技術によって、他の NGS 装置では数日から数週間かかるシーケンシングランも、2 時間以内に完了します。この Ion Torrent の簡便性は、基礎的な試薬と半導体技術を用いた検出法の融合の結果です。画像化や蛍光検出、カメラ、スキャナなどは必要ありません。

この技術が卓越した拡張性を備えているのは、半導体チップをシーケンシング装置として使用しているためです。Ion 316 ™ Chip

は、Ion 314™ Chip に比べ 10 倍のスループット性能を誇ります。スループットが向上すると、1 枚のチップで複数のバーコード サンプルを解析するか、または異種サンプルに含まれる出現頻度のきわめて低いバリアントを測定するか、もしくは 1 回のシーケンシング ランでより多くのアンプリコンを解析することが可能です。わずか 1 回の設備投資で実験の必要性に合わせたさまざまなレベルのスループットが実現します。さらに近い将来、リード長が向上し、より長いアンプリコンの配列を解析できるようになると予測されます。Ion Torrent は、社内では 200 塩基を大きく上回る品質の高い読み取りに成功しています。

Ion Torrent は、アンプリコン シーケンシングに最適の革新技術です。この低価格、シンプル、高速、高拡張性で光源を必要としないシーケンシング装置は、ハイ スループット シーケンシングを求めるあらゆる規模のラボに最適です。

図 7. BRAF 遺伝子全般に見られる均一細胞系の DNA バリアントの同定。上 - BRAF 遺伝子上の 22 塩基対のウィンドウを表示するグラフ。26 番の塩基に表示された紫の縦線が高い変異スコア(P 値の -log)を示す。灰色のエリアは、ターゲット領域における Ion Torrent のシーケンシングのカバレッジ(約 140X)を表わす。T から A への変異は、BRAF 遺伝子のヌクレオチド 1799 における置換変異である。サンプルのほぼ 100% でこの変異を読み取ったことから、均一サンプルのホモ接合変異が示唆される。下 - 4 色に色分けされた縦線が各位置における Ion Torrent の読み取り深度全域にわたるベース コールの分布を示す。4 種類のヌクレオチドが凡例に従いそれぞれの色で表示されている。

取扱店

研究用にのみ使用できます。診断目的およびその手続き上での使用は出来ません。価格、包装および仕様等は予告なしに改定される場合があります。The trademarks mentioned herein are the property of Life Technologies Corporation or their respective owners.© 2011, Life Technologies Japan Ltd. All rights reserved. Printed in Japan, 5/2011, ION006-A1105OB

〒108-0023 東京都港区芝浦 4-2-8TEL.03(6832)9300 FAX. 03(6832)9580

本社: 〒564-0052 大阪府吹田市広芝町 10-28TEL.06(6389)1201 FAX. 06(6389)1206

大阪:

ライフテクノロジーズジャパン株式会社

http://www.lifetechnologies.co.jp