Upload
emi-hattori
View
121
Download
4
Embed Size (px)
Citation preview
#16Quantifying the regulatory
effect size of cis-acting genetic variation using
allelic fold change
20180124
@emi_2sheds
1
/7
要約
2
新しい点
活用方法
• cis-eQTLの指標を考えた
• eQTLの指標は今まで無かった
• 発現データは生でもlog変換してもOK
• 指標を計算するソフトウェアも提供
• cis-eQTLの影響を計ることができる
/7
eQTLの指標を考えた
• eQTLは長年研究されているが
eQTLの影響度を示す指標が無かった
• cis-eQTLの指標→ log aFC(allelic fold change)
– eVariantがrefとaltの場合のeGeneの発現量の比
– Fold changeのアリル版
eGene
eVariant
変異
Ref
Alt ↑この比が
↓aFC
3
/7
log aFC
eVariantのアリルがref (→0) の時のeGeneの発現への影響度をk0、eVariantのアリルがalt (→1) の時のeGeneの発現への影響度をk1とするとeGeneの各アリルの発現量は
eGeneの総発現量は
eBはベースの発現量
k1/k0のlogをとったものをlog aFCと定義しcis-eQTLの指標とする
log aFC
4
(altのアリル発現量)÷(refのアリル発現量)のlog
/7
log aFCの計算方法
1. アリル単位の発現量から実際に計算
– eGene上のヘテロのSNPやフェージングを利用
– ちょうどいいSNPが無いと計測できない
2. eQTLから計算(発現量生データ)
– ヘテロの発現量がrefホモとaltホモの発現量の中間値になることを用いて線形モデルで計算
3. eQTLから計算(発現量log変換)
– RNA-Seqやマイクロアレイはlog変換することが多い
– 非線形モデルを用いて計算
5
→正確なのは1、実用的なのは2・3
/7
log aFCをGTExデータで評価した
• eQTLから計算したlog aFC(線形、非線形×2の3モデル)は
アリル発現量から計算したlog aFCと高い相関
→aFCは堅牢な指標
6
/7
log aFC計算ソフト
https://github.com/secastel/aFC
VCF, BED, QTLなどを入力する
7
補足
8
/7
eQTL
• expression quantitative trait loci
= 遺伝子の発現量に影響を与える変異
– 影響を与える側の変異 = eVariant
– 影響を受ける側の遺伝子 = eGene
eVariant
eGene
変異
発現量が変わる
Ref
Alt
発現
9
/7
距離によるeQTLの分類
• cis-eQTL
– eVariantがeGeneの1Mb以内
• trans-eQTL
– eVariantがeGeneから1Mb以上離れている・または別の染色体にある
→今回の対象
10
/7
aFC計算方法
• アリルごとの発現量がわかる場合– eGeneのヘテロSNPとフェージングを用いる
→(altのアリル発現量)/(refのアリル発現量)を
個人ごとに計算し、その中央値をとる
11
/7
aFC計算方法
• eQTLのみわかる場合(発現量生データ)– 生データではref/ref, het, alt/altの発現量が線形になる
→線形モデルで計算
緑破線はref/refとalt/altの中央値
12
/7
aFC計算方法
• eQTLのみわかる場合(発現量logデータ)– RNA-Seqやマイクロアレイでは発現量をlog変換することが多い
– logデータではref/ref, het, alt/altの発現量が線形にならない
緑破線はref/refとalt/altの中央値
13
/7
aFC計算方法
• eQTLのみわかる場合(発現量logデータ)– RNA-Seqやマイクロアレイでは発現量をlog変換することが多い
– logデータではref/ref, het, alt/altの発現量が線形にならない
→非線形モデルで計算
14