Click here to load reader
Upload
edan-odonnell
View
61
Download
4
Embed Size (px)
DESCRIPTION
数量性状的 TDT 检验功效. 华南农业大学动物科学学院 张豪 博士. 方差分析的缺陷. 优点 简单 : 标准统计软件 灵活 : 可以分析各种已知的效应 缺点 假阳性,检验功效低 受群体分层的影响 解决办法 提高阈值 : Bonferroni t test 换用其它的分析方法 : TDT. 原理 Xu(1995). 混杂的概念. HLA 座位的 A1 等位基因与用筷子吃饭能力 用筷子吃饭 : A1 等位基因频率 95%, 中国人 不用筷子吃饭 : A1 等位基因频率 5%, 白人 人种为混杂因素 家畜 非随机交配 , 引种等. - PowerPoint PPT Presentation
Citation preview
数量性状的 TDT 检验功效
华南农业大学动物科学学院张豪 博士
23/4/19 2009信息学会 2
方差分析的缺陷 优点
简单 : 标准统计软件 灵活 : 可以分析各种已知的效应
缺点 假阳性,检验功效低 受群体分层的影响
解决办法 提高阈值 : Bonferroni t test 换用其它的分析方法 : TDT
k)1(1
)()( 212121 eexxyy
23/4/19 2009信息学会 3
原理 Xu(1995)
jji xy 0
jji pxyE 00 markermarker
222
22
1
markermarker
n
pp
xVaryVar
jj
ji
23/4/19 2009信息学会 4
混杂的概念 HLA 座位的 A1 等位基因与用筷子吃饭能力
用筷子吃饭 : A1 等位基因频率 95%, 中国人 不用筷子吃饭 : A1 等位基因频率 5%, 白人 人种为混杂因素
家畜 非随机交配 , 引种等
23/4/19 2009信息学会 5
TDT TDT
Transmission disequilibrium test 当存在连锁时 , 检验是否存在关联 不受群体分层等的影响
风险因素 (risk factor) 影响疾病的座位
23/4/19 2009信息学会 6
TDT
原理 比较传递了某个等位基因的个体和没有传递某个等
位基因的个体 可用于只有两个等位基因的座位和多个等位基因的
座位
23/4/19 2009信息学会 7
病例 -对照设计
病例对照
+ -
+ a b
- c d
“+” 表示风险因素存在 , “-” 表示风险因素不存在 . a 和 d 不提供任何信息 . 已知 b + c 的总数 , 如果病症和风险因素无关 , b 和
c 有相同的概率 0.5, b|b+c 服从二项分布 B(b+c, ½)
李照海 , 覃红 , 张红 , 2006
23/4/19 2009信息学会 8
病例 -对照设计
此时有 cbcbbE 2
1| cbcbbVar
4
1|
根据中心极限定理 cbbVar
cbbEb
|
| 服从标准正态分布
cb
cb
cb
cbb
2
2
4
2于是 服从 2(1)
McNemar Test
23/4/19 2009信息学会 9
数量性状 : 统计数
J
j
K
kjkjkjk TDDTDSYYS
1 1
Yjk = 第 jth 个家系第 k 个后裔的性状值Ybar = 所有家系性状的均值TDSjk = 第 jth 个家系第 k 个后裔从父亲继承的某个等位基因的指示变量TDDjk = 第 jth 个家系第 k 个后裔从母亲继承的某个等位基因的指示变量
J
j
K
kjkjkjk TDDTDSYY
1 1
22̂
1,0~ˆ
NS
Z
Z 服从自由度等于 njk – 1 的 t 分布
Kolbehdari et al. 2006
23/4/19 2009信息学会 10
评价 实际上是传递了某个等位基因的个体与总体平
均数的比较 统计数绝对值下降 , 降低检验功效
23/4/19 2009信息学会 11
TDT的变体
2
1 1
22
2
mM
K
k
J
jmmjkMMkj
nn
YYYY
S
K
k
J
jMkj
MM Y
nY
1 1
1
K
k
J
jmkj
mm Y
nY
1 1
1
21
2
2
~11
S
nn
YYTDT
mM
mM
Xiong et al. 1998
23/4/19 2009信息学会 12
符号意义及评价 YMK = M 等位基因后裔的表型值 Ymk = m 等位基因后裔的表型值 nM = 传递给后裔 M 等位基因的杂合亲本数量 nm = 传递给后裔 m 等位基因的杂合亲本数量 k = 第 k 个亲本 j = 第 k 个亲本第 j 个后裔 实际上为独立样本的 t 检验 检验功效比较高 , 因为统计数增大
23/4/19 2009信息学会 13
TDT: 回归法 : 检验回归系数 Gs Gd Gp TDT
11 11 11 0
11 12 11 ½
12 - ½
11 22 12 0
12 12 11 1
12 0
22 -1
12 22 12 ½
22 - ½
22 22 22 0
Hernandez-Sanchea et al. 2003
23/4/19 2009信息学会 14
原理 把自变量分为 5 类: -1 , -1/2 , 0 , 1/2 , 1
TD = Hf(Tf – ½) + Hm(Tm – ½)
如果亲本为“ 12” ,则 Hf(m)=1 ,否则等于 0 如果后裔从基因型为“ 12” 的亲本遗传了等位基因
“ 1” ,则 Tf(m) = 1 ,否则为 0
统计数:回归系数
23/4/19 2009信息学会 15
群体分层的影响
D: 连锁不平衡
S: 分层
C: 重组率
Hernandez-Sanchea et al. 2003
23/4/19 2009信息学会 16
纵轴 : P值 , 横轴 : 等位基因频率
Solid line = sires are heterozygous, and dams are randomly selected; broken line = both sires and dams are randomly selected
10 sires are typed; the ratio of dam to sire and the number of full sibs are 10 and 7 respectively
23/4/19 2009信息学会 17
样本含量和检验功效 0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 2 4 6 8 10 12
Number of full sibs
The
pow
er o
f th
e te
st
♦=both parents are heterozygous; =sires are heterozygous, and the frequency of trait-increasing allele equals 0.5; ○= sires are heterozygous, and the frequency of trait-increasing allele equals 0.1; ∆=both parents are randomly selected, and the frequency of trait-increasing allele equals 0.5; = both parents are ✳
randomly selected, and the frequency of trait-increasing allele equals 0.1. In all the 5 cases, there are 10 sires and 100 dams.
23/4/19 2009信息学会 18
样本含量固定
Cases Average P valuesAverage power of the
test
1 0.00520.0230 0.9770
2 0.00630.0296 0.9695
3 0.00590.0257 0.9685
Case 1: 10 sires are typed, the ratio of dam to sire is 10, and the number of full sibs is 10. Case 2: 10 sires are typed, the ratio of dam to sire is 20, and the number of full sibs is 5. Case 3: 20 sires are typed, the ratio of dam to sire is 10, and the number of full sibs is 5