14
#16 Quantifying the regulatory effect size of cis-acting genetic variation using allelic fold change 20180124 @emi_2sheds 1

allelic fold change (Mohammadi P, Genome Research, 2017)

Embed Size (px)

Citation preview

Page 1: allelic fold change (Mohammadi P, Genome Research, 2017)

#16Quantifying the regulatory

effect size of cis-acting genetic variation using

allelic fold change

20180124

@emi_2sheds

1

Page 2: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

要約

2

新しい点

活用方法

• cis-eQTLの指標を考えた

• eQTLの指標は今まで無かった

• 発現データは生でもlog変換してもOK

• 指標を計算するソフトウェアも提供

• cis-eQTLの影響を計ることができる

Page 3: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

eQTLの指標を考えた

• eQTLは長年研究されているが

eQTLの影響度を示す指標が無かった

• cis-eQTLの指標→ log aFC(allelic fold change)

– eVariantがrefとaltの場合のeGeneの発現量の比

– Fold changeのアリル版

eGene

eVariant

変異

Ref

Alt ↑この比が

↓aFC

3

Page 4: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

log aFC

eVariantのアリルがref (→0) の時のeGeneの発現への影響度をk0、eVariantのアリルがalt (→1) の時のeGeneの発現への影響度をk1とするとeGeneの各アリルの発現量は

eGeneの総発現量は

eBはベースの発現量

k1/k0のlogをとったものをlog aFCと定義しcis-eQTLの指標とする

log aFC

4

(altのアリル発現量)÷(refのアリル発現量)のlog

Page 5: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

log aFCの計算方法

1. アリル単位の発現量から実際に計算

– eGene上のヘテロのSNPやフェージングを利用

– ちょうどいいSNPが無いと計測できない

2. eQTLから計算(発現量生データ)

– ヘテロの発現量がrefホモとaltホモの発現量の中間値になることを用いて線形モデルで計算

3. eQTLから計算(発現量log変換)

– RNA-Seqやマイクロアレイはlog変換することが多い

– 非線形モデルを用いて計算

5

→正確なのは1、実用的なのは2・3

Page 6: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

log aFCをGTExデータで評価した

• eQTLから計算したlog aFC(線形、非線形×2の3モデル)は

アリル発現量から計算したlog aFCと高い相関

→aFCは堅牢な指標

6

Page 7: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

log aFC計算ソフト

https://github.com/secastel/aFC

VCF, BED, QTLなどを入力する

7

Page 8: allelic fold change (Mohammadi P, Genome Research, 2017)

補足

8

Page 9: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

eQTL

• expression quantitative trait loci

= 遺伝子の発現量に影響を与える変異

– 影響を与える側の変異 = eVariant

– 影響を受ける側の遺伝子 = eGene

eVariant

eGene

変異

発現量が変わる

Ref

Alt

発現

9

Page 10: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

距離によるeQTLの分類

• cis-eQTL

– eVariantがeGeneの1Mb以内

• trans-eQTL

– eVariantがeGeneから1Mb以上離れている・または別の染色体にある

→今回の対象

10

Page 11: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

aFC計算方法

• アリルごとの発現量がわかる場合– eGeneのヘテロSNPとフェージングを用いる

→(altのアリル発現量)/(refのアリル発現量)を

個人ごとに計算し、その中央値をとる

11

Page 12: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

aFC計算方法

• eQTLのみわかる場合(発現量生データ)– 生データではref/ref, het, alt/altの発現量が線形になる

→線形モデルで計算

緑破線はref/refとalt/altの中央値

12

Page 13: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

aFC計算方法

• eQTLのみわかる場合(発現量logデータ)– RNA-Seqやマイクロアレイでは発現量をlog変換することが多い

– logデータではref/ref, het, alt/altの発現量が線形にならない

緑破線はref/refとalt/altの中央値

13

Page 14: allelic fold change (Mohammadi P, Genome Research, 2017)

/7

aFC計算方法

• eQTLのみわかる場合(発現量logデータ)– RNA-Seqやマイクロアレイでは発現量をlog変換することが多い

– logデータではref/ref, het, alt/altの発現量が線形にならない

→非線形モデルで計算

14