4
clcbio.com 機能とメリット CLC Genomics Workbench 1 / 4 次世代シーケンシングのデータ解析 における課題を解決 次世代シーケンシング装置によって、多くの研究者がハイ スループットなシーケンシングを利用できるようになりま した。しかしながら、多くのR&D部門では、次世代シーケ ンシングのパイプラインとなるデータ解析が深刻なボトル ネックとなっており、次世代シーケンシングの費用効率を 著しく低下させる要因となっています。 CLC Genomics Workbench では、この問題を解決し、次 世代シーケンサーによって生成された膨大な量のデータ を迅速に解析してビジュアル化できるようになっていま す。ユーザーフレンドリーでわかりやすいインターフェイス によって、コマンドラインスクリプトを使える熟練したバイ オインフォマティクスプログラマではなく、生物学的結果 を解析する科学者でも、簡単にハイスループット解析を行 うことができます。さらに、 CLC Genomics Workbench汎用性が高く、既存のシーケンシング解析ワークフローに もシームレスに統合でき、処理を簡易化して費用効率を最 大化できます。 マルチテクノロジ―マルチプラット フォーム CLC Genomics Workbenchには、ハイパフォーマンス コンピューティングにより強化された次世代シーケン シングデータのアセンブリ機能と、ダウンストリーム 解析ツールが多数搭載されています。 CLC Genomics Workbenchは、Life Technologies社の SOLiD、Roche Applied Science社の454 GS-FLX、 Illumina 社のGenome Analyzer、Helicos社のHeliScopeといっ た、主要なすべてのNGSプラットフォームのデータを解析、 ビジュアル化できる、初めての総合的解析パッケージ です。 CLC bio にとって、機器メーカーとの連携は、開発 プロセスの重要な要素です。 Genomics Workbench CLC bioの他のすべてのWorkbench と同様、MacOS X、 Windows、Linuxのプラットフォームで実行できます。 ソフトウェアを実行するコンピュータは、お客様ご自 身が選択できます。 バージョン 4.0(Windows、 Mac OS X、Linux対応版) © 2011 CLC bio Japan CLC bio のツールによっ て、本 学 の 分 子 生 物 学 者が高度な解析を行え るようになり、生 成され る超並列(次世代)シーケ ンシングデータの研究技 術が大きく向上するでしょ う。また、データや 仮 説 の検証が可能になるこ とで、これまでこのよう なハイスループットなエ ピゲノム解 析を行ってい なかった科学者にとって は 、研 究 に 対 する 障 壁 が低下する効果がある と考えています。 アルバートアインシュタイン 医科大学 エピゲノミクス アインシュタインセンター 部長 John Greally博士より CLC Genomics Workbench

CLC Genomics Workbench - CLCバイオジャパン - ホームjp.clcbio.com/fileadmin/template/clcbiojapan/pamphlets/...CLC Genomics Workbenchは、CLC Genomics Serverと簡単に統合すること

Embed Size (px)

Citation preview

Page 1: CLC Genomics Workbench - CLCバイオジャパン - ホームjp.clcbio.com/fileadmin/template/clcbiojapan/pamphlets/...CLC Genomics Workbenchは、CLC Genomics Serverと簡単に統合すること

clcbio.com

機能とメリット

CLC Genomics Workbench 1 / 4

次世代シーケンシングのデータ解析における課題を解決

次世代シーケンシング装置によって、多くの研究者がハイ

スループットなシーケンシングを利用できるようになりま

した。しかしながら、多くのR&D部門では、次世代シーケ

ンシングのパイプラインとなるデータ解析が深刻なボトル

ネックとなっており、次世代シーケンシングの費用効率を

著しく低下させる要因となっています。

CLC Genomics Workbenchでは、この問題を解決し、次

世代シーケンサーによって生成された膨大な量のデータ

を迅速に解析してビジュアル化できるようになっていま

す。ユーザーフレンドリーでわかりやすいインターフェイス

によって、コマンドラインスクリプトを使える熟練したバイ

オインフォマティクスプログラマではなく、生物学的結果

を解析する科学者でも、簡単にハイスループット解析を行

うことができます。さらに、CLC Genomics Workbenchは

汎用性が高く、既存のシーケンシング解析ワークフローに

もシームレスに統合でき、処理を簡易化して費用効率を最

大化できます。

マルチテクノロジ―マルチプラットフォーム

CLC Genomics Workbenchには、ハイパフォーマンス

コンピューティングにより強化された次世代シーケン

シングデータのアセンブリ機能と、ダウンストリーム

解析ツールが多数搭載されています。

CLC Genomics Workbenchは、Life Technologies社の

SOLiD、Roche Applied Science社の454 GS-FLX、Illumina

社のGenome Analyzer、Helicos社のHeliScopeといっ

た、主要なすべてのNGSプラットフォームのデータを解析、

ビジュアル化できる、初めての総合的解析パッケージ

です。CLC bioにとって、機器メーカーとの連携は、開発

プロセスの重要な要素です。 Genomics Workbench は

CLC bioの他のすべてのWorkbenchと同様、Mac OS X、

Windows、Linuxのプラットフォームで実行できます。

ソフトウェアを実行するコンピュータは、お客様ご自

身が選択できます。

バージョン 4.0(Windows、 Mac OS X、Linux対応版) © 2011 CLC bio Japan

CLC bio のツールによっ

て、本 学 の 分 子 生物 学

者が高度な解 析を行え

るようになり、生成され

る超並列(次世代)シーケ

ンシングデータの研究技

術が大きく向上するでしょ

う。また、データや 仮 説

の検 証が可 能になるこ

とで、これまでこのよう

なハイスループットなエ

ピゲノム解析を行ってい

なかった科学者にとって

は 、研 究 に 対 する障 壁

が 低下する効果 がある

と考えています。

アルバートアインシュタイン医科大学 エピゲノミクスアインシュタインセンター 部長 John Greally博士より

CLC Genomics Workbench

Page 2: CLC Genomics Workbench - CLCバイオジャパン - ホームjp.clcbio.com/fileadmin/template/clcbiojapan/pamphlets/...CLC Genomics Workbenchは、CLC Genomics Serverと簡単に統合すること

2 / 4 CLC Genomics Workbench

ゲノミクス解析CLC Genomics Workbenchは、CLC bioの世界的に知られた科学者たちが考

案したまったく新しい革新的アルゴリズムにより、その機能が強化されていま

す。これらの極めて高度かつ最先端のアルゴリズムには、SIMDプロセッサの

加速技術も包含されており、レファレンスアセンブリやde novoアセンブリの

処理速度を大幅に高めています。

ゲノミクス解析

CLC Genomics Workbenchのレファレンスアセンブリ機能は、ロングリード、

ショートリードの両方に対応しており、ペアエンドリードやギャップ付き/

ギャップなしアラインメントもサポートしています。また、Sanger、454、

Illumina Genome Analyzer、Helicos、SOLiDのシーケンシングデータにも

対応しています。コンピュータに必要なRAMが装備されていれば、CLC Genomics Workbenchではあらゆるサイズのゲノムをアセンブルすることが

できます。10倍のヒトゲノムのレファレンスアセンブリの場合は、16 GB RAM

の標準的なコンピュータであれば処理することができます。

SOLiDデータのレファレンスアセンブリ/マッピングは、ハイパフォーマンスコ

ンピューティングに基づくアルゴリズムを使用して、SOLiD独自のカラースペー

スデータで実行されます。カラースペースで35merのSOLiDデータをアセンブ

ルすると、ベーススペース(通常形式のデータ)で同じデータをアセンブルした

場合と比べて、検出されるヒット数が最大80%増加します。

De novo アセンブリCLC Genomics Workbench の de novo アセンブリは、ロングリード、ショート

リードに対応しており、ペアエンドリードもサポートしています。また、

Sanger、454、Illumina Genome Analyzer、Helicos、SOLiDのシーケンシン

グデータにも対応しています。

de novoアッセンブリは2段階のプロセスで行われます。はじめにすべてのリー

ドをアッセンブリし、コンティグ配列を作成します。次にそのコンティグ配列

を参照配列とし、すべてのリードをマップします。

CLC Genomics Workbenchの de novo アセンブリでは、データのカバー率や

データの種類、生物種に応じて、最大50~100Mbのサイズのゲノムを処理す

ることができます。

ハイブリッドデータの解析に対応

レファレンスアセンブリおよびde novo アセンブリでは、異なる種類のデータ

を同時に解析することができます。たとえばde novoアセンブリでは、Sanger

データ、454シングルリードデータ、Illuminaペアエンドデータを同時に解析

することが可能です。

この機能により、手作業が大幅に軽減され、科学者は単調なデータ処理

でなく、データから生物学的結果を得ることに集中できるようになります。

SNP検出 CLC Genomics Workbench には、SNP自動検出機能が搭載されています

(SNPについては、http://www.clcbio.com/BEの記事「Bioinformatics

explained」をご覧ください)。CLC Genomics WorkbenchのSNP検出には、

Neighborhood Quality Standard(NQS)アルゴリズム([Altshuler et al., 2000])が使用されています(詳細については [Brockman et al., 2008] もご

覧ください)。

コンティグのレファレンス配列にORFまたはCDSのアノテーションが付いてい

る場合は、SNPによるアミノ酸配列の変化の有無が検出され、アミノ酸置換

が生じた場合は、新しいアミノ酸が示されます。

ユーザーは、グラフィカルユーザーインターフェイスを使用して簡単にSNPを

同定したり、大小のゲノム領域内のSNPを概略図で確認することができます。

ゲノム変異の同定 CLC Genomics Workbenchの高度なグラフィカルユーザーインターフェイスを

使用して、挿入、欠失、重複、逆位などのさまざまなゲノムの変異を同定する

ことができます。

トランスクリプトーム解析CLC Genomics Workbenchにはさまざまなツールが搭載されており、単色

マイクロアレイ遺伝子発現データの解析に完全対応しています。これには、主

成分分析による主成分のプロットやボックスプロットを使った視覚的なアレイ

の品質管理ツール、ログ変換とノーマライゼーションツール、統計検定とFDR

コントロールのための各種ツール、様々なクラスタリングアルゴリズムとヒー

トマップによる視覚化、さらに超幾何分布を使ったアノテーションの検定や

Gene Set Enrichment 解析といったツールも搭載されています。

縮小表示したアセンブリビューと、コンティグ配列の詳細を示したシーケンスビュー。アセンブリビューにカバー率の低い領域があると、これに対応するコンティグ配列の領域がシーケンスビュー上で自動的にハイライト表示されています。

ヒートマップにより遺伝子発現値を視覚的に表現することができます。

ベンチマーク ‒ E.Coli ‒ 分

2

3

454: 439,000リードをE.Coli(5メガベース)へマッピング(ギャップなし)と視覚化。1,500USD,2GB,dual core,2.13GHz 32bitのノートPC使用。

Illumina Genome Analyzer: 2 x 2.7 百万=5.4百万リード(1レーン)をE.Coli(5メガベース) へマッピング(ギャップあり)と視覚化。32GB,8 core,2.5 GHz 64 bit のデスクトップコンピュータ使用。

Page 3: CLC Genomics Workbench - CLCバイオジャパン - ホームjp.clcbio.com/fileadmin/template/clcbiojapan/pamphlets/...CLC Genomics Workbenchは、CLC Genomics Serverと簡単に統合すること

CLC Genomics Workbench 3 / 4

双方向型の各種ビューを使用すると、簡単に画面を移動したり、データや解

析結果を確認できます。また、発現解析を完全統合することにより、ユーザー

が、CLC Genomics Workbenchで提供されている包括的な一連の配列解析

ツールを使用して、面倒なソフトウェアの切り替えを行うことなく直ちに対象

となる遺伝子のダウンストリーム解析を行えるようになっています。

Digital Gene ExpressionCLC Genomics Workbenchでは、Mortazavi A, et.al,「Mapping and quan-

tifying mammalian transcriptomes by RNA-Seq」(Nat Methods. 2008

Jul;5(7):585-7)に基づくmRNA-seq解析機能を搭載しています。このモデル

では、RPKM(Reads Per Kilobase exon Model per million mapped reads)に

基づき統計情報が算出されるため、Digital Gene発現解析を行った場合に、

遺伝子発現量の値の正規化を効果的かつ簡単に行うことができます。

新規転写変異体の同定

上記のメリットに加えて、mRNA-seq機能は、推定エクソン(相対的にマッ

チ数の多いイントロン領域)の検出にも使用できます。検出された領域は、

新たな転写変異体に含まれている可能性があります。CLC Genomics Work-benchの既存のプライマーデザインツールを使用して、推定エクソンの転写産

物を確認できるようプライマーをデザインすることができます。

Small RNA AnalysisSmall RNA 配列はSOLiD,Illumina,または454とCLC Genomics Workbench

を使い解析を行うことが可能です。アダプターの除去、任意によりdemul-

tiplexingを行うことが最初のステップとなります。そしてタグのカウントと

miRBase を使ったsmall RNA へのアノテーションづけが可能です。その他の

micRNAによるアノテーションも利用可能です。アノテーションは前駆体や成

熟度のレベルに応じてグループ化可能です。最終的な結果は遺伝子発現に使

われたツールを使って視覚化することが可能です。

タグによる発現プロファイリングCLC Genomics Workbenchには、次世代シーケンス技術を使用した、SAGE

法を拡張した強力なタグプロファイリング機能が搭載されています。タグ集計

の配列リードからの全ワークフロー抽出タグ、仮想タグリストの作成、遺伝子

名を持ったタグの数とアノテーション付けがサポートされています。

エピゲノミクス解析CLC Genomics Workbenchには完全統合されたChIP-seq解析ソリューション

が搭載されており、研究者が生データから、レファレンスアラインメントを

行って、ChIP-seqの結果を高度にビジュアル化された表形式で簡単に出力す

ることができます。免疫沈降反応(ChIP-サンプル)を行った単一サンプルのみ

の場合と、ChIP-サンプルと免疫沈降反応を行わなかった対照(コントロール)

サンプルを比較した場合の、両方の解析が行えます。

従来の配列解析CLC Genomics Workbench には、次世代シーケンシングの各種解析ツール

だけでなく、CLC Main Workbench の100を超える機能がすべて搭載されて

おり、ダウンストリーム解析を行ったり、フォローアップの実験計画を策定

することができます。たとえば、プライマーデザイン、分子クローニング、

BLAST、HMMER、5種類のアラインメント、系統発生解析などがあります。

サーバーとの統合CLC Genomics Workbenchは、CLC Genomics Serverと簡単に統合すること

ができます。これにより、CLC Genomics Workbenchのユーザーは、ゲノム全

体をアセンブルするなどの高負荷の処理を、ホストコンピュータまたは複数

台の高性能コンピュータ上で実行しながら、同時にその他のデータのダウン

ストリーム解析をローカルコンピュータ上で行えるようになります。高いデー

タ処理能力に加えて、CLC Genomics Server では、柔軟なジョブキューイング

システムが搭載されており、他のアプリケーションとの統合やデータ共有も簡

単に行うことができます。その他にもさまざまな機能が提供されており、柔軟

かつ安全な高速IT環境で次世代シーケンシング解析を行うことができます。次世代シーケンスmRNAリードの配列ファイルから作成した発現サンプルの一覧表

CLC Genomics Server を使った3階層型ソリューション。ノートPCからサーバーへアクセスすることで大量な解析結果を容易に容易にアクセス可能です。

ベンチマーク ‒ Human ‒ 時間

4

7

Illumina Genome Analyzer: 2 x 4300万=8600万リード(Pair-end)をHuman(30億ベース)へマッピング(ギャップなし)と視覚化。32GB,8 core,2.5GHz 64bitのデスクトップコンピュータ使用。

Illumina Genome Analyzer: 2 x 4300万=8600万リード(Pair-end)をHuman(30億ベース)へマッピング(ギャップあり)と視覚化。32GB,8 core,2.5GHz 64bitのデスクトップコンピュータ使用。

Page 4: CLC Genomics Workbench - CLCバイオジャパン - ホームjp.clcbio.com/fileadmin/template/clcbiojapan/pamphlets/...CLC Genomics Workbenchは、CLC Genomics Serverと簡単に統合すること

GWB2

0111

004

CLC Genomics Workbench に関するお問い合わせ、 ご質問は販売代理店またはメールにて

[email protected]までお問い合わせください。

4 / 4 CLC Genomics Workbench

データベースとの統合CLC Genomics Workbenchは、CLC Bioinformatics

Databaseと完全に統合することができ、また、

Oracle、MySQL、PostgreSQL、H2、Microsoft SQL

Serverもサポートしています。

これにより、すべてのユーザーが、柔軟で安全かつ

ユーザーフレンドリーな環境でデータを共有したり

検索することができます。

カスタマイズ次世代シーケンシングは、急速に進化している新技

術であり、研究者に、新たな科学的機会と大量デー

タの新しい解析方法を提供し続けています。

問題は、発想の欠如やデータの不足ではなく、解析

を実行したり、ワークフローでの手作業によって生じ

るボトルネックを解消するための有効なソフトウェ

アが不足していることです。これらの課題を解消す

るため、CLC bioでは、CLC Genomics WorkbenchおよびCLC Genomics Server向けにJavaベースの

SDK(ソフトウェアディベロッパーキット)を無償で提

供しています。このSDKを使用して、お客様独自のア

ルゴリズムを当社の製品に統合していただけます。

さらに CLC bio では、お客様のご希望に応じて、個別

にCLC Genomics WorkbenchおよびCLC Genomics Server 向けのカスタムアドオンモジュールを設計、

開発しています。費用効率よく簡単に研究の迅速化

と品質の向上を実現していただけます。

Worldwide SupportCLC bio HeadquartersFinlandsgade 10-12Denmarkwww.clcbio.com · [email protected]

株式会社CLCバイオジャパン〒550-0002 大阪市西区江戸堀1-10-27肥後橋三宮ビル5FTel: 06-6225-8087 · Fax: 050-5830-7922www.clcbio.co.jp · [email protected]