Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
生物学者のための
マイクロアレイと次世代シークエンス
データ解析の実際
2011年11月15日 帝京大学
東京医科歯科大学大学院疾患生命科学研究部ゲノム構造制御田中裕二郎
chromatinstructure.wordpress.com
なぜ次世代シークエンス(NGS)か
1. ヒストンメチル基転移酵素ASH1
2. ストレス応答の転写制御因子ネットワーク
マイクロアレイとNGSのデータ解析
1. 遺伝子発現プロファイリング
a. マイクロアレイ・データから興味ある遺伝子を探索する
b. RNA‐seq
2. ChIP解析
a. ChIP‐on‐chip
b. ChIP‐seq
trxGに属するASH1の分子機能
SET Bromo PHD BAHhistone chaperone homology region2958
ASH1: discs absent, small, or homeotic‐1
Shearn, A. et al. Imaginal disc abnormalities in lethal mutants of Drosophila. PNAS 68, 2594, 1971.
Beisel, C. et al. Histone methylation by the Drosophila epigenetic transcriptional regulator Ash1. Nature 419, 857, 2002.
Methylation of H3 K4, K9, H4 K20
Byrd, K.N. and Shearn, A. ASH1, a Drosophila trithorax group protein, is required for methylation of lysine 4 residues on histone H3. PNAS 100, 11535, 2003.
Methylation of H3 K4Global reduction of methyl‐K4 in ash1‐/‐ embryos
哺乳類の31のSETドメインメチル基転移酵素
pre‐SET domain
post‐SETdomain
Target
SETD7SETD8
‐‐
‐‐
H3K4H4K20
EZH1EZH2
++
‐‐
H3K27H3K27
SETDB1 + + H3K9
SUV39H1SUV39H2SETMARG9aGLP
+++++
+++++
H3K9H3K9NDH3K9H3K9
ASH1NSD1NSD2NSD3SET2
++++‐
+++++
H3K36H3K36H3K36H3K36H3K36
MLL1MLL4MLL2MLL3SET1ASET1B
‐‐‐‐‐‐
++++++
H3K4H3K4H3K4H3K4H3K4H3K4
MLL5KIAA1757
‐‐
++
NDND
Smyd1Smyd2Smyd3Smyd4Smyd5
+++‐‐
+++++
NDH3K36H3K4NDND
1. Dual function of histone H3 lysine 36 methyltransferase ASH1 in regulation of Hox gene expression. Tanaka Y, Kawahashi K, Katagiri Z, Nakayama Y, Mahajan M, Kioussis D. PLoS ONE, 2011 (in press)
2. Regulation of early T cell development by the PHD finger of histone lysine methyltransferase ASH1. Tanaka Y, Nakayama Y, Taniguchi M, Kioussis D. Biochem Biophys Res Commun 18:588‐594, 2008.
3. Trithorax‐group protein ASH1 methylates histone H3 lysine 36. Tanaka Y, Katagiri Z, Kawahashi K, Kioussis D, Kitajima S. Gene 397:161‐168, 2007.
ASH1
K4me3
K27me3
K36me3
Control
ASH1のゲノム標的を知りたい
ChIP‐seq解析
ストレス反応に於けるゲノムスケールでの転写応答
マイクロアレイ + ChIP‐on‐chip解析
モチーフ・スキャン
http://chromatinstructure.wordpress.com/protocol/
プラットフォーム
マイクロアレイ NGS
• ChIP‐on‐chip• エクソンアレイ
• ChIP‐seq• RNA‐seq
蛍光画像解析 配列情報解析
発現レベルまたはピークの一覧
パスウェイ解析、GO、GSEA、モチーフ解析
データ処理
遺伝子リスト
パターンの相似性または違いで分類
基本はデータの整形
ほとんどExcelでやってしまいます
ばらつきを補正する
使えるデータを選別する
各種解析ツールが読み込める形式に変換する
マイクロアレイによる遺伝子発現プロファイリング
マイクロアレイの種類
GeneChip (Affymetrix) Agilent ArrayHuman Genome U133 Plus 2.0 Array(約47,000の転写産物/約54,000のプローブセット)Mouse Genome 430 2.0 Array(約34,000の確認されたマウス遺伝子を含む)
SurePrint G3 Human Gene Expression 8x60K(27,958のEntrez Gene RNAを含む、34,127の転写産物および7,419のlincRNA)Whole Human Genome 4x44K v2(27,958のEntrez Gene RNAを含む、34,127の転写産物)SurePrint G3 Mouse Gene Expression 8x60K(39,430 Entrez Gene RNAおよび16,251のlincRNA)Whole Mouse Genome 4x44K v2(39,430 Entrez Gene RNA)
新試薬「Low Input Quick Amp Labeling Kit(LIQA)」により、少ないtotal RNA(数十ng)からの解析が可能
アレイ間の差が小さいことが特長 設計、ハイブリ条件を 適化することで、5ケタのダイナミックレンジ
1種類の遺伝子に対して11~20種類の25merのプローブを設計することで信頼性の高いデータ
SurePrintテクノロジーで印刷された60 merの高品質カスタムオリゴアレイプローブ
total RNA 2 μg以上(100~500 ng/μl) total RNA 1 μg以上(100~500 ng/μl)
Agilent Array
Low Input Quick Amp Labeling Kit (1カラー用)24反応分 ¥198,000
8x15Kアレイフォーマット用消耗品(ガスケットスライド) ¥20,000
RNA Spike In Kit(1カラー用) ¥67,000
SurePrint G3 Human/Mouse GEマイクロアレイキット 8x60K x 3枚 ¥513,000
Gene Expression Hybridization Kit ¥22,400
Gene Expression Wash Pack ¥32,000
アレイ間の補正
1. 遺伝子名の順に並び替える Excel>データ>並べ替え
2. House Keeping遺伝子のデータを集める
3. House Keeping遺伝子の倍率の平均で割る
4. 補正したシグナル値の順に並び替える Excel>データ>並べ替え
5. 度数分布を描く Excel>データ>データ分析>ヒストグラム
6. 発現していない遺伝子を分ける (ratioの分母にしない)
ばらつきの原因はプローブの作成効率ハイブリ条件
GeneSpringの補正法はpercentilemedianhousekeeping genes
de Jonge HJ et al. PLoS One. 2007 Sep 19;2(9):e898.
Evidence based selection of housekeeping genes
Log2(normalized signals)
Freq
uenc
yLog2(normalized signals)
Freq
uenc
y
発現データから興味ある遺伝子を見つける
発現パターンの違いに着目
Fold Change
p値の評価によっていろいろ(多重比較の補正)
発現パターンの類似性に着目
クラスター分析
階層的クラスター vs. 非階層的クラスター
遺伝子間の(非類似度)の尺度
クラスター同士を結合する基準
これからは、RNA-seq
RNA-seqのメリット
ダイナミックレンジが広い高感度正確
• 相似配列や変異の識別• マイクロアレイではバイアスが避けられない• alleleの識別
1bp単位の解像度事前の知識や仮説が必要ないこと生物学的に意味のある情報(splicing, editing, UTR)ハイスループット安い(?)
Ribominus (Invitrogen) Oligo(dT) beads (Dynabeads)
RNAの品質チェック
RNA-seqデータ解析ツール
Broad Institute GenePattern
• TopHat (Bowtie)参照ゲノムへのアラインメント
• Cufflinks発現量の計算
遺伝子リストから機能を見つける
Gene Ontology GO
パスウェイ解析 (KEGG, BioCarta) DAVID
遺伝子セット発現解析 GSEA
転写因子モチーフ・スキャン TRANSFAC ProJASPARMAPPER
GenePatternとDAVIDによるパスウェイ解析
ChIP‐on‐chip解析
ChIP‐seq解析
ChIP-seq実験
1. Covaris 超音波破砕 2. ChIP‐seq Sample Prep Kitライブラリー作成
3. クラスター形成 (cBot)
GA‐L 22 8 83 16482 16048 0 1TGCATAAAGTGCTTCCACCCACATCTCACTGGTCCAAATCTAGTCATGTGGCCACAATTAACTACAAGGAAGGTgghhfhhhgfhhhhhhehghbgdfefgchdba`dc_]a_eabaad^^aa_aad_a¥¥a_^acaaa_G¥_[U¥[Uchr8.fa 118054696R 74 346
Y
BWA
MACS
画像処理 (Base Calling)
ChIP-seqデータ解析ツール
• BWA (Burrow‐Wheeler Transform Aligner)• Bowtie
参照ゲノムへのアラインメント
• MACS (Model‐Based Analysis of ChIP‐Seq)ピーク検出
Evaluation of Algorithm Performance in ChIP‐Seq Peak Detection. PLoS ONE, 2010
UCSCゲノムブラウザーの使い方
SEQAnsweres
A reasonably thorough table of next‐gen‐seq software available in the commercial and public domain
http://seqanswers.com/forums/showthread.php?t=43
次世代シークエンス解析ソフト