Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
- 1 -
確率分布Ⅳ確率分布Ⅳ確率分布Ⅳ確率分布Ⅳ
0.目次0.目次0.目次0.目次
4.同時分布
4.1 確率変数の独立
4.2 確率変数の和の平均と分散
4.3 分布の再生性
4.4 中心極限定理
確率分布Ⅳ
- 2 -
4.同時分布4.同時分布4.同時分布4.同時分布
2つの確率変数X,Yの組(X,Y)の確率分布を考察する。
●離散分布の場合●離散分布の場合●離散分布の場合●離散分布の場合
確率変数Xの値が、x1,x2,…,xm 確率変数Yの値が、y1,y2,…,yn のとき、
X=xi かつ Y=yj となる確率をP(X=xi,Y=yj)=pij と書く。
(xi,yj)とpijとの対応をXとYの同時分布XとYの同時分布XとYの同時分布XとYの同時分布という。
X Y y1 y2 yn
x1 p11 p12 ・・・ p1n p1
x2 p21 p22 ・・・ p2n p2
xm pm1 pm2 ・・・ pmn pm
q1 q2 qn 1
なお、
とおくと、
p1 + p2 + … + pm = 1
q1 + q2 + … + qn = 1
が成り立つ。
p1,p2,…,pm を確率変数Xの周辺分布Xの周辺分布Xの周辺分布Xの周辺分布、
q1,q2,…,qn を確率変数Yの周辺分布Yの周辺分布Yの周辺分布Yの周辺分布という。
同時分布から周辺分布を求めることはできるが、周辺分布から同時分布を求め
ることはできない。すなわち、同時分布の方が与える情報は多い。
m
i=1
(
n
j=1
p ij ) = 1
n
j=1
pij = pi (1≦i≦m)
m
i=1
pij = qj (1≦j≦n)
確率分布Ⅳ
- 3 -
確率分布Ⅳ
●連続分布の場合●連続分布の場合●連続分布の場合●連続分布の場合
(参考)(参考)(参考)(参考)累次積分について
累次積分とは、2変数関数f(x,y)を、まずxで積分してからyで積分する操作を
いう。このとき、まずyで積分してからxで積分しても値が同じことが知られてい
る。
となる f(x,y)が存在するとき、 f(x ,y)をX,Yの同時確率密度関数という。
X,Yの周辺確率密度関数g(x),h(y)はつぎのように表される。
確率変数X,Y、任意のa<b,c<dに対して、
P(a≦X≦b,c≦Y≦d)=
f(x,y)≧0,
g(x)=
∞
-∞
f(x ,y)dy,
∞
-∞
∞
-∞
fx,y)dxdy=1
h(y)=
b
a
d
c
∞
-∞
f(x,y)dxdy
f(x,y)dx
たとえば、
2
0
1
0
{
{
1
0
2
0
xydx}dy=
xydy}dx=
1
0
2
0
2
0
1
0
xydxdy
[
[
yx 2
2
xy 2
2
]
]
1
0
2
0
dy=
dx=
(0≦ x≦ 1,0≦ y≦ 2)
2
0
1
0
2
y
2x
dy=[
dx=[
y 2
4
x 2
]
]
2
0
1
0
=1
=1
において、
- 4 -
確率分布Ⅳ
問題4.1問題4.1問題4.1問題4.1
(1)つぎの関数f(x,y)が確率変数X,Yの同時確率密度関数であることを示し、
Xの周辺確率密度関数g(x)、Yの周辺確率密度関数h(y)を求めよ。
(2)つぎの関数f(x,y)が確率変数X,Yの同時確率密度関数であることを示し、
Xの周辺確率密度関数g(x)、Yの周辺確率密度関数h(y)を求めよ。
∞
-∞
f(x,y)=
g(x)=
h(y)=
∞
-∞
∞
-∞
∞
-∞
f(x,y)dxdy=
{ -
f (x ,y)dy=
f (x ,y)dx=
0x+y (0≦ x≦ 1,
(その他 )
=
1
0
2
1
2
1
1
0
2
1
[
(
(
-
-
-
(
x 2
2
x+
x+
- x+
+xy]
y)dy=
y)dx=(
1≦ y≦ 2)
y)dxdy=
1
0
dy=
3
2
y-
2
1
1
2
2
1
(
)
{
-
1
0
1
2
(
+y)dy=[
- x+y)dx}dy
-2
y+y2
2]2
1
=1
∞
-∞
f(x,y)=
g(x)=
h(y)=
∞
-∞
∞
-∞
∞
-∞
f(x,y)dxdy=
{ 18x
f(x ,y)dy=
f(x ,y)dx=
0
2(y-(その他 )
=
y
1
0
1
0
1
0
1
0
2)
1
0
[6x
18x
18x
(0≦ x≦ 1,
18x
2
2
2
(y
(y
(y
2
-
(y
-
-
y
y
y
-
2
2
2
)
)dy=3x
)dx=6(y
y
]1
0
2
0≦ y≦ 1)
)dxdy=
dy=
1
0
2
-
6(y
1
0
y2
{
)
-
1
0
y 2
18x
)dy=[6(
2(y- y
y 2
2
2)dx}dy
-y3
3)]1
0
=1
- 5 -
確率分布Ⅳ
4.1 確率変数の独立4.1 確率変数の独立4.1 確率変数の独立4.1 確率変数の独立
事象の独立性を基に、確率変数の独立性を定義する。
●離散分布の場合●離散分布の場合●離散分布の場合●離散分布の場合
確率変数X,Yにおいて、すべてのi,jについて、事象{X=xi},{Y=yj}が独立のと
き、すなわち、
P(X=xi|Y=yj) = P(X=xi) (1≦i≦m, 1≦j≦n)
が成り立つとき、確率変数X,Yは独立という。
このとき、条件付き確率の定義
P(X=xi,Y=yj)P(X=xi|Y=yj) =
P(Y=yj)
から、
P(X=xi,Y=yj) = P(X=xi)×P(Y=yj) = pi×pj (1≦i≦m, 1≦j≦n)
と同値である。すなわち、pij = pi×qj
X Y y1 y2 yn
x1 p1q1 p1q2 ・・・ p1qn p1
x2 p2q1 p2q2 ・・・ p2qn p2
xm pmq1 pmq2 ・・・ pmqn pm
q1 q2 qn 1
つまり、確率変数X,Yが独立であるということは、Yの値が何であっても、
Xの分布は変わらないことと解釈できる。
X Y y1 y2 yn
x1 pppp1111q1 pppp1111q2 ・・・ p1qn p1
x2 pppp2222q1 pppp2222q2 ・・・ p2qn p2
xm ppppmmmmq1 ppppmmmmq2 ・・・ pmqn pm
q1 q2 qn 1
また、Xの値が何であっても、Yの分布は変わらないことと解釈できる。
X Y y1 y2 yn
x1 p1qqqq1111 p1qqqq2222 ・・・ p1qqqqnnnn p1
x2 p2qqqq1111 p2qqqq2222 ・・・ p2qqqqnnnn p2
xm pmq1 pmq2 ・・・ pmqn pm
q1 q2 qn 1
- 6 -
確率分布Ⅳ
確率変数X,Y,Z において、Xのとる値がxi(1≦i≦p)、Yのとる値がyj(1≦j≦q)、Zのとる値がzk(1≦k≦r)であるとする。
すべてのi,j,kについて、
P(X=xi,Y=yj,Z=zk) = P(X=xi)×P(Y=yj)×P(Z=zk)
が成り立つとき、確率変数X,Y,Z は、独立であるという。
4つ以上の確率変数についても同様に定義される。
問題4.1.1 独立である例問題4.1.1 独立である例問題4.1.1 独立である例問題4.1.1 独立である例
(1)1,2,3の番号のついたカードが箱の中にある。取り出したカードを箱に戻す場合、1番目に取り出されたカードの番号をX、2番目に取り出されたカードの番号をYとする。確率変数X,Yの同時分布はつぎのようになる。
X Y 1 2 31 1/9 1/9 1/9 1/3 1 2 32 1/9 1/9 1/9 1/3 1/3 1/3 1/3
3 1/9 1/9 1/9 1/31/3 1/3 1/3 1 1 2 3 1 2 3 1 2 3
確率変数XとYは互いに独立である。 1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3
(2)5本のくじの中に1本の当たりくじがある。1番目にくじを引くとき、当たりくじの枚数をXとする。2番目にくじを引くとき、当たりくじの枚数をYとする。引いたくじを戻すとき、X,Yの同時分布はつぎのようになる。
X Y 0 10 (4/5)(4/5) (4/5)(1/5) 4/5 0 11 (1/5)(4/5) (1/5)(1/5) 1/5 4/5 1/5
4/5 1/5 10 1 0 1
確率変数XとYは互いに独立である。4/5 1/5 4/5 1/5
- 7 -
確率分布Ⅳ
問題4.1.2 独立でない例問題4.1.2 独立でない例問題4.1.2 独立でない例問題4.1.2 独立でない例
(1)1,2,3の番号のついたカードが箱の中にある。取り出したカードを箱に戻さない場合、1番目に取り出されたカードの番号をX、2番目に取り出されたカードの番号をYとする。確率変数X,Yの同時分布はつぎのようになる。
X Y 1 2 31 0/6 1/6 1/6 1/3 1 2 32 1/6 0/6 1/6 1/3 1/3 1/3 1/3
3 1/6 1/6 0/6 1/31/3 1/3 1/3 1 1 2 3 1 2 3 1 2 3
確率変数XとYは互いに独立でない。 0/2 1/2 1/2 1/2 0/2 1/2 1/2 1/2 0/2
(2)5本のくじの中に1本の当たりくじがある。1番目にくじを引くとき、当たりくじの枚数をXとする。2番目にくじを引くとき、当たりくじの枚数をYとする。引いたくじを戻さないとき、X,Yの同時分布はつぎのようになる。
X Y 0 10 (4/5)(3/4) (4/5)(1/4) 4/5 0 11 (1/5)(4/4) (1/5)(0/4) 1/5 4/5 1/5
4/5 1/5 10 1 0 1
確率変数XとYは互いに独立でない。3/4 1/4 4/4 0/4
問題4.1.3問題4.1.3問題4.1.3問題4.1.3
確率変数X,Yの同時分布がつぎのように与えられるとき、確率変数X,Yは独立である。(1),(2),(3)を示せ。
X Y -1 0 10 1/6 1/6 1/6 1/21 1/6 1/6 1/6 1/2
1/3 1/3 1/3 1
(1)確率変数X,Yが独立であるとき、確率変数2X+1,Y2は独立である。
(2)確率変数X,Yが独立であるとき、確率変数X+Y、X-Yは独立でない。
(1)の証明:2X+1とY2の同時分布より、確率変数2X+1,Y2は独立である。
2X+1 Y2 0 10 1/6 2/6 1/23 1/6 2/6 1/2
1/3 2/3 1
(2)の証明:X+YとX-Yの同時分布より、確率変数X+Y、X-Yは独立でない。
X+Y X-Y -1 0 1 2-1 0 0 1/6 0 1/60 0 1/6 0 1/6 2/61 1/6 0 1/6 0 2/62 0 1/6 0 0 1/6
1/6 2/6 2/6 1/6
- 8 -
確率分布Ⅳ
●連続分布の場合●連続分布の場合●連続分布の場合●連続分布の場合
問題4.1.4問題4.1.4問題4.1.4問題4.1.4
確率変数X,Yの同時確率密度関数がf(x,y)のとき(ab=2)、X,Yの独立性を考察せよ。
f(x,y) = xy (0≦x≦a, 0≦y≦b)
0 (その他)
独立であることをいう。
すなわち、 a≦ b ,c≦ dであるすべての a ,b ,c ,dに対して、
P(a≦X≦ b |c≦Y≦ d)=P(a≦X≦ b)
が成り立つことをいう。
これは、条件付確率の定義から
と同値である。
確率変数X,Yが独立とは、事象 {a≦X≦ b},{c≦Y≦ d}が
P(a≦X≦ b ,c≦Y≦ d)=P(a≦X≦ b)・P(c≦Y≦ d)
ま た 、 任 意 の x ,yに 対 し て 、
が 成 り 立 つ こ と と 同 値 と な る 。
f ( x ,y ) =g ( x )h (y )
し た が っ て 、 f ( x , y ) = x y ,
よ っ て 、
確 率 変 数 Xの 周 辺 確 率 密 度 関 数 は 、
g ( x ) =
h ( y ) =
a 2b 2= 4
= 0
= 0
∞
-∞
∞
-∞
よ り 、 X , Yは 独 立 と な る 。
f ( x , y ) d y =
f ( x , y ) d x =
(そ の 他 )
(そ の 他 )
b
0
a
0
x y d y =
x y d x =
g ( x ) h ( y ) =
b 2
2
a 2
2
x
y
( 0≦ x≦ a )
( 0≦ y≦ b )
a 2b 2
4x y
3つの確率変数X,Y,Zの同時確率密度関数を f(x ,y ,z) ,
X,Y,Zの周辺確率密度関数を g (x) ,h (y) ,k(z )とおくと、任意の x ,y ,zに対して、
が成り立つとき、X,Y,Zは独立である。
4つ以上の確率変数についても同様に定義される。
f(x,y,z)=g(x)h(y)k(z)
- 9 -
確率分布Ⅳ
問題4.1.5問題4.1.5問題4.1.5問題4.1.5
と定義される。
確率変数X,Yの同時分布関数 F(x,y)は、任意の実数 x ,yに対して、
F(x ,y)=P(X< x ,Y< y)
=P(-∞<X< x ,-∞<Y< y)
=
x
-∞
y
-∞
f(x ,y)dxdy
と定義される。
確率変数Xの周辺分布関数G(x)は、任意の実数 xに対して、
G(x)=P(-∞<X< x ,-∞<Y<∞ )
=
x
-∞
∞
-∞
f (x ,y)dxdy
と定義される。
確率変数Yの周辺分布関数H(y)は、任意の実数 yに対して、
H(y)=P(-∞<X<∞ ,-∞<Y< y)
=
∞
-∞
y
-∞
f (x ,y)dxdy
すなわち、
が成り立つ。
確率変数X,Yが独立であると、任意の実数 x ,yに対
P(X< x ,Y< y)=P(X< x)・ P(Y< y)
F(x ,y)=G(x)・H(y)
して、
(1)Z=min{X,Y}の分布関数R(z)を求めよ。
確率変数X,Yが独立で同じ分布関数G(z)に従うとする。
最大値が zを超えないことと、X,Yが zを超えないことは同じ事象であることから、
XとYは独立であることから、
R(z)=P(X≦ z ,Y≦ z)
R(Z)=P(X≦ z)・ P(Y≦ z)
R(z)=P(Z≦ z)=P(max{X,Y}≦ z)
=G(z)・G(z)=G(z) 2
- 10 -
確率分布Ⅳ
問題4.1.6問題4.1.6問題4.1.6問題4.1.6
(2)Z=min{X,Y}の分布関数 S(z)を求めよ。
最小値が z以上であることと、X,Yが z以上であることは同じ事象であることから、
XとYは独立であることから、
S(z)=1
S(z)=1
S(z)=P(Z≦ z)=P(min{X,Y}≦ z)=1
=1
=1
-
-
-
-
P(X≧
P(X≧ z)・ P(Y≧ z)
{1
{1
-
-
P(X≦ z)}・ {1
G(z)}
z ,Y≧ z)
2
- P(Y≦ z)}
- P(min{X,Y}≧ z)
(1)この電球を 2個つけたとき、最初に切れる電球の
(2) 3個の場合、最初に切れる電球の平均寿命は
ある電球の寿命は平均 100時間の指数分布に従う。
したがって、
Zは、平均 50の指数分布に従う。
したがって、平均寿命は 50時間となる。
G(
S(z)=1
s(z)=
x
100/3時間となることを示せ。
)=1
=(
=
確率密度関数と平均寿命を求めよ。
dz
d
50
1
-
-
-
2)exp(
S(z)=(
{1
exp(
exp(
- G(z)}
-
-
-
-
50
x
100
x
100
x
2)(1
)
2
)
-
)(
(x> 0)
-
G(z))・
100
1)exp(
となる。
dz
d(1
-
-
100
x
G(z))
)
- 11 -
確率分布Ⅳ
4.2 確率変数の和の平均と分散4.2 確率変数の和の平均と分散4.2 確率変数の和の平均と分散4.2 確率変数の和の平均と分散
●離散分布の場合●離散分布の場合●離散分布の場合●離散分布の場合
○確率変数の和の平均○確率変数の和の平均○確率変数の和の平均○確率変数の和の平均
2つの確率変数X,Yの和をX+Yとすると、X+Yも確率変数である。
確率変数Xの取る値が、x1,x2,x3 、その周辺分布が、p1,p2,p3,
確率変数Yの取る値が、y1,y2,y3,y4、その周辺分布が、q1,q2,q3,q4 のとき、
X Y y1 y2 y3 y4
x1 p11 p12 p13 p14 p1
x2 p21 p22 p23 p24 p2
x3 p31 p32 p33 p34 p3
q1 q2 q3 q4 1
平均E(X+Y)は、
E(X+Y) = (x1+y1)p11 + (x1+y2)p12 + (x1+y3)p13 + (x1+y4)p14
+ (x2+y1)p21 + (x2+y2)p22 + (x2+y3)p23 + (x2+y4)p24
+ (x3+y1)p31 + (x3+y2)p32 + (x3+y3)p33 + (x3+y4)p34
= x1(p11+p12+p13+p14) + x2(p21+p22+p23+p24) + x3(p31+p32+p33+p34)
+ y1(p11+p21+p31)+y2(p12+p22+p32)+y3(p13+p23+p33)+y4(p14+p24+p34)
= x1p1 +x2p2 + x3p3 + y1q1 + y2q2 + y3q3 + y4q4
= E(X) + E(Y)
確率変数Xのとる値が、x1,x2,…,xm、その周辺分布が、p1,p2,…,pm,
確率変数Yのとる値が、y1,y2,…,yn、その周辺分布が、q1,q2,…,qn のとき、
X Y y1 y2 yn
x1 p11 p12 ・・・ p1n p1
x2 p21 p22 ・・・ p2n p2
xm pm1 pm2 ・・・ pmn pm
q1 q2 qn 1
平均E(X+Y)は、
E(X+Y) =
=
m
i=1
n
j=1
(xi + yj)・pij
m
i=1
n
j=1
xi・pij +
m
i=1
n
j=1
yj・pij
- 12 -
確率分布Ⅳ
=
=
= E(X) + E(Y)
一般に、3つ以上の確率変数X一般に、3つ以上の確率変数X一般に、3つ以上の確率変数X一般に、3つ以上の確率変数X 1111,X,X,X,X 2222,…,X,…,X,…,X,…,X nnnnの和Xの和Xの和Xの和X 1111+X+X+X+X 2222+…+X+…+X+…+X+…+Xnnnnについても同様の結についても同様の結についても同様の結についても同様の結
果が得られる。果が得られる。果が得られる。果が得られる。
E(XE(XE(XE(X1111 + X+ X+ X+ X2222 + … + X+ … + X+ … + X+ … + Xnnnn) = E(X) = E(X) = E(X) = E(X1111) + E(X) + E(X) + E(X) + E(X2222) + … + E(X) + … + E(X) + … + E(X) + … + E(Xnnnn))))
○確率変数の積の平均○確率変数の積の平均○確率変数の積の平均○確率変数の積の平均
独立な確率変数X,Yの積をXYとすると、XYも確率変数である。
確率変数Xの取る値が、x1,x2,x3 、その周辺分布が、p1,p2,p3,
確率変数Yの取る値が、y1,y2,y3,y4、その周辺分布が、q1,q2,q3,q4 のとき、
X Y y1 y2 y3 y4
x1 p1q1 p1q2 p1q3 p1q4 p1
x2 p2q1 p2q2 p2q3 p2q4 p2
x3 p3q1 p3q2 p3q3 p3q4 p3
q1 q2 q3 q4 1
平均E(XY)は、
E(XY) = (x1y1)(p1q1) + (x1y2)(p1q2) + (x1y3)(p1q3) + (x1y4)(p1q4)
+ (x2y1)(p2q1) + (x2y2)(p2q2) + (x2y3)(p2q3) + (x2y4)(p2q4)
+ (x3y1)(p3q1) + (x3y2)(p3q2) + (x3y3)(p3q3) + (x3y4)(p3q4)
= (x1p1 + x2p2 + x3p3)(y1q1 + y2q2 + y3q3 + y4q4)
= E(X)E(Y)
すなわち、確率変数X,Yが独立のとき、
E(XY) = E(X)E(Y)
が成り立つ。
m
i=1
xi・(
n
j=1
pij ) +
n
j=1
yj・(
m
i=1
pij )
m
i=1
xi・pi +
n
j=1
yj・qj
- 13 -
確率分布Ⅳ
互いに独立な確率変数X,Yの積をXYとすると、XYも確率変数である。
確率変数Xのとる値が、x1,x2,…,xm、その周辺分布が、p1,p2,…,pm,
確率変数Yのとる値が、y1,y2,…,yn、その周辺分布が、q1,q2,…,qn のとき、
X Y y1 y2 yn
x1 p1q1 p1q2 ・・・ p1qn p1
x2 p2q1 p2q2 ・・・ p2qn p2
xm pmq1 pmq2 ・・・ pmqn pm
q1 q2 qn 1
○確率変数の和の分散○確率変数の和の分散○確率変数の和の分散○確率変数の和の分散
互いに独立な確率変数X,Yの和、X+Yの分散を考える。
V(X+Y) = E((X+Y)2) - E(X+Y)2
= E(X2 + 2XY + Y2) - E(X+Y)2
= E(X2) + 2E(XY) + E(Y2) - {E(X)+E(Y)}2
= E(X2) + 2E(XY) + E(Y2) - E(X)2 - 2E(X)E(Y) - E(Y)2
= E(X2) - E(X)2 + E(Y2) - E(Y)2 + 2{E(XY) - E(X)E(Y)}
= V(X) + V(Y)
すなわち、確率変数X,Yが互いに独立のとき、
V(X+Y) = V(X) + V(Y)
が成り立つ。
一般に、3つ以上の互いに独立な確率変数X一般に、3つ以上の互いに独立な確率変数X一般に、3つ以上の互いに独立な確率変数X一般に、3つ以上の互いに独立な確率変数X 1111,X,X,X,X 2222,…,X,…,X,…,X,…,X nnnnのののの和X和X和X和X 1111+X+X+X+X 2222+…+X+…+X+…+X+…+X nnnnについても同様の結果が得られる。についても同様の結果が得られる。についても同様の結果が得られる。についても同様の結果が得られる。
V(XV(XV(XV(X1111 + X+ X+ X+ X2222 + … + X+ … + X+ … + X+ … + Xnnnn) = V(X) = V(X) = V(X) = V(X1111) + V(X) + V(X) + V(X) + V(X2222) + … + V(X) + … + V(X) + … + V(X) + … + V(Xnnnn))))
平 均 E ( X Y )は 、
E ( X Y ) =
=
=
= E ( X ) E ( Y )
m
i= 1
x i p i
m
i = 1
m
i = 1
n
j= 1
n
j= 1
x
x
i
i
y
y
n
j = 1
y j q j
j
j
p
p
i
i j
q j
- 14 -
確率分布Ⅳ
問題4.2.1問題4.2.1問題4.2.1問題4.2.1
確率変数X,Yの同時分布が以下のようなときについて考察する。
X Y 1 2 3 41 0.04 0.06 0.02 0.082 0.06 0.09 0.03 0.123 0.1 0.15 0.05 0.2
(1)XとYの周辺分布はつぎのようになる。
X Y 1 2 3 41 0.04 0.06 0.02 0.08 0.20.20.20.2 0.2=0.04+0.06+0.02+0.082 0.06 0.09 0.03 0.12 0.30.30.30.3 0.3=0.06+0.09+0.03+0.123 0.1 0.15 0.05 0.2 0.50.50.50.5 0.5=0.1+0.15+0.05+0.2
0.2 0.3 0.1 0.40.2 0.3 0.1 0.40.2 0.3 0.1 0.40.2 0.3 0.1 0.4
(2)XとYは独立である。
pij=pipj (1≦i≦3,1≦j≦4) を調べればよい。この場合、等号がすべてについて成り立つことから、確率変数XとYは独立である。
(3)X,Yそれぞれの平均、分散はつぎのようになる。
E(X) = 1×0.2+2×0.3+3×0.5=2.3E(Y) = 1×0.2+2×0.3+3×0.1+4×0.4=2.7
V(X) = E(X2)-E(X)2
= (12×0.2+22×0.3+32×0.5)-(2.3)2
= 0.61V(Y) = E(Y2)-E(Y)2
= (12×0.2+22×0.3+32×0.1+42×0.4)-(2.7)2
= 1.41
(4)X+Yの確率分布はつぎのようになる。
X+Y 2 3 4 5 6 7確率 0.04 0.12 0.21 0.26 0.17 0.2
X Y 1 2 3 4 P(X+Y=4) = P(X=1,Y=3)1 0.04 0.06 0.02 0.08 + P(X=2,Y=2)2 0.06 0.09 0.03 0.12 + P(X=3,Y=1)3 0.1 0.15 0.05 0.2 = 0.02+0.09+0.1
=0.21
(5)X+Yの平均、分散はつぎのようになる。
E(X+Y) = 5 = E(X)+E(Y)V(X+Y) = 2.02 = V(X)+V(Y)
- 15 -
確率分布Ⅳ
問題4.2.2問題4.2.2問題4.2.2問題4.2.2
確率変数X,Yの同時分布が以下のようなとき、次の問いに答えよ。
(1)XとYは独立か。(2)X,Yそれぞれの平均、分散を求めよ。(3)X+Yの確率分布を求めよ。(4)X+Yの平均、分散を求めよ。
X Y 1 2 3 41 0.04 0.24 0.04 0.09 0.412 0.09 0.01 0.03 0.22 0.353 0.11 0.01 0.05 0.07 0.24
0.24 0.26 0.12 0.38
X+Y 2 3 4 5 6 7確率
E(X) =E(Y) =V(X) =V(Y) =E(X+Y) =V(X+Y) =
- 16 -
確率分布Ⅳ
●連続分布の場合●連続分布の場合●連続分布の場合●連続分布の場合
平均や分散はつぎのように定義される。
E(X)=
E(Y)=
V(X)=
V(Y)=
∞
-∞
∞
-∞
∞
-∞
∞
-∞
xg(x)dx
yh(y)dy
∞
-∞
∞
-∞
{x
{y-E(Y)}
- E(x)}
2
2
f(x ,y)dxdy
f (x ,y)dxdy
E(aX+bY)=
=
=
=a
=aE(X)+bE(Y)
∞
-∞
∞
-∞
∞
-∞
∞
-∞
∞
-∞
ax{
∞
-∞
xg(x)dx+b
(ax)f(x,y)dxdy+
(ax+by)f(x,y)dxdy
∞
-∞
f(x,y)dy}dx+
∞
-∞
yh(y)dy
∞
-∞
∞
-∞
∞
-∞
by{
(by)f(x,y)dxdy
∞
-∞
f(x,y)dx}dy
・XとYが独立のとき、
E(XY)=
V(aX+bY)=a
=
=E(X)E(Y)
∞
-∞
∞
-∞
∞
-∞
xg(x)dx・
2
xyf(x ,y)dxdy=
V(X)+b
∞
-∞
2V(Y)も成り立つ(証明略)
yh(y)dy
∞
-∞
∞
-∞
xyg(x)h(y)dxdy
- 17 -
確率分布Ⅳ
4.3 分布の再生性4.3 分布の再生性4.3 分布の再生性4.3 分布の再生性
まず、確率変数X,Yが独立のとき、和Z=X+Y の積率母関数を求める。
●離散分布の場合●離散分布の場合●離散分布の場合●離散分布の場合
確率変数Xの周辺分布をp1,p2,…,pm 確率変数Yの周辺分布をq1,q2,…,qn とする。
確率変数Zの積率母関数 MZ(t) は、
MZ(t) = E(exp(t(X+Y)))
=
=
=
= MX(t)・MY(t)
となる。
つぎに、
「2つの確率分布の積率母関数が一致すれば、「2つの確率分布の積率母関数が一致すれば、「2つの確率分布の積率母関数が一致すれば、「2つの確率分布の積率母関数が一致すれば、
2つの確率分布は等しい」2つの確率分布は等しい」2つの確率分布は等しい」2つの確率分布は等しい」
ことが知られているので、積率母関数の形から分布を判定できる。
m
i= 1
n
j=1
e x p ( t ( x i+ y j ) ) ・ p i j
m
i=1
n
j=1
e xp ( t x i )・exp ( t y j )・p i・q j
m
i=1
( e x p ( t x i )・p i )
n
j=1
(e x p ( t y j )・q j )
- 18 -
確率分布Ⅳ
○2項分布の再生性○2項分布の再生性○2項分布の再生性○2項分布の再生性
確率変数X,Yが独立で、確率変数Xが2項分布B(m,p)、確率変数Yが2項分布
B(n,p)にしたがうとき、和Z=X+Yは、2項分布B(m+n,p)に従う。
q=1-pとする。
確率変数 X の積率母関数は、MX(t) = (p・exp(t) +q)m
確率変数 Y の積率母関数は、MY(t) = (p・exp(t) +q)n
確率変数 Z の積率母関数は、MZ(t) = MX(t)・MY(t)
= (p・exp(t)+q)m・(p・exp(t)+q)n
= (p・exp(t)+q)m+n
これは、確率変数 Z が B(m+n,p) にしたがうことを意味する。
一般に、互いに独立な確率変数X1,X2,…,Xnに対して、
X1がB(n1,p)、X2がB(n2,p),…,XnがB(nn,p)に従うならば、
X1+X2+…+Xn は、B(n1+n2+…+nn,p)に従う。
○ポアソン分布の再生性○ポアソン分布の再生性○ポアソン分布の再生性○ポアソン分布の再生性
確率変数X,Yが独立で、確率変数Xがポアソン分布Po(λ 1)、確率変数Yがポアソ
ン分布Po(λ 2)にしたがうとき、和Z=X+Yは、ポアソン分布Po(λ 1+λ 2)に従う。
確率変数 X の積率母関数は、MX(t) = exp(λ 1(exp(t)-1))
確率変数 Y の積率母関数は、MY(t) = exp(λ 2(exp(t)-1))
確率変数 Z の積率母関数は、
MZ(t) = MX(t)・MY(t)
= exp(λ 1(exp(t)-1))・exp(λ 2(exp(t)-1))
= exp((λ 1+λ 2)(exp(t)-1))
これは、確率変数 Z が Po(λ 1+λ 2) にしたがうことを意味する。
一般に、互いに独立な確率変数X1,X2,…,Xnに対して、
X1がPo(λ 1)、X2がPo(λ 2),…,XnがPo(λ n)に従うならば、
X1+X2+…+Xn は、Po(λ 1+λ 2+…+λ n)に従う。
- 19 -
確率分布Ⅳ
●連続分布の場合連続分布の場合連続分布の場合連続分布の場合
○正規分布の再生性○正規分布の再生性○正規分布の再生性○正規分布の再生性
確率変数X,Yが独立で、確率変数Xが正規分布N(μ 1,σ 12)、確率変数Yが正規分
布N(μ 2,σ 22)にしたがうとき、和Z=X+Yは、正規分布N(μ 1+μ 2,σ 12+σ 22)に従う。
確率変数 X の積率母関数は、MX(t) = exp(μ 1t+σ 12t2/2)
確率変数 Y の積率母関数は、MY(t) = exp(μ 2t+σ 22t2/2)
確率変数 Z の積率母関数は、
MZ(t) = MX(t)・MY(t)
= exp(μ 1t+σ 12t2/2)・exp(μ 2t+σ 22t2/2)
= exp{(μ 1+μ 2)t+(σ 12+σ 22)t2/2}
これは、確率変数 Z が 正規分布N(μ 1+μ 2,σ 12+σ 22)にしたがうことを意味
する。
一般に、互いに独立な確率変数X1,X2,…,Xnに対して、
X1がN(μ 1,σ 12)、X2がN(μ 2,σ 22),…,XnがN(μ n,σ n2)に従うならば、
X1+X2+…+Xn は、N(μ 1+μ 2+…+μ n,σ 12+σ 22+…+σ n2)に従う。
となる。
X,Yが独立なら、 Z=X+Yの積率母関数M
M
M
Z
Z
( t)=M
( t)=E{exp(t(X+Y))}=E(exp(tX)・ exp( tY))
=
=
=
=M
∞
-∞
∞
-∞
∞
-∞
X
X
∞
-∞
∞
-∞
exp( tx)g(x)dx・
( t)M
(t )M
exp(tx)・ exp(ty)・ f(x ,y)dxdy
exp(tx)・ exp(ty)・ g(x)h(y)dxdy
Y
Y
( t)
( t)
∞
-∞
exp( ty)h(y)dy
Z(t )は、
- 20 -
確率分布Ⅳ
4.4 中心極限定理4.4 中心極限定理4.4 中心極限定理4.4 中心極限定理
互いに独立で同じ確率分布を持つ確率変数 X1,X2,…,Xnを考える。
その平均μ、分散σ 2とし、 Sn = X1 + X2 + … + Xn とする。
このとき、 の確率分布は、n→∞で、標準正規分布N(0,12)に
収束する。すなわち、
P(α≦Zn≦β) →
●応用1応用1応用1応用1
ある事象Aの起こる確率をpとし、i回目の独立試行において、確率変数Yiをつ
ぎのように定義する。
1 事象Aが起こる場合。
Yi =
0 事象Aが起こらない場合。
平均 E(Yi)=p、分散 V(Yi)=p(1-p) となる。
ここで、Tn = Y1 + Y2 + … + Yn とすると、Tnはn回の内、事象Aの起こる回数を
表す。したがって、Tnは二項分布B(n,p)に従う。
中心極限定理を適用すると、
は、n→∞で、N(0,12)に収束する。
Zn =
Sn
n-μ
n
σ
β
α 2π
1exp(-
x2
2)dx
Zn =
T n
n-μ
n
σ=
np(1- p)
Tn- np
- 21 -
確率分布Ⅳ
すなわち、Tnがa回以上b回以下の確率は、
P(a≦Tn≦b) = P( ≦Zn≦ )
を利用して、P(a≦Tn≦b)の近似値を求めることができる。
いま、p=1/2, n=100, a=40, b=60 とすると、
-0.4≦Z100≦0.4 となる。
求める確率は、P(40≦T100≦60)=P(-0.4≦Z100≦0.4)
=
正規布表を使って
= 0.1554×2 = 0.3108
となる。
●応用2応用2応用2応用2
あるテレビ番組の視聴率を95%の信頼度で誤差を5%以内に押さえたい。調査対
象者を何名にすればよいか考察せよ。ただし、調査対象者は無作為に選ばれ、調
査対象は独立で、同一分布に従うものとする。
視聴率をpとし、i番目の調査対象者において、確率変数Yiをつぎのように定義
する。
1 テレビ番組を視聴した場合。
Yi =
0 テレビ番組を視聴しなかった場合。
平均 E(Yi)=p、分散 V(Yi)=p(1-p) となる。
ここで、Tn = Y1 + Y2 + … + Yn とすると、Tnはn人の内、視聴した人数を表す。
したがって、Tnは二項分布B(n,p)に従う。
すなわち、誤差(=Tn/n-p)が5%以下の確率は、
P(|Tn/n-p|<0.05) = P{n(p-0.05)<Tn<n(p+0.05)}
で表され、この値がほぼ95%であればよいことになる。
P{n(p-0.05)<Tn<n(p+0.05)}≒0.95
np(1-p)
a-np
np(1-p)
b-np
0.4
-0.4 2π
1exp(-
x2
2)dx
- 22 -
確率分布Ⅳ
ここで、Tnに対して中心極限定理を適用し、
とおくと、
P(n(p-0.05)≦Tn≦n(p+0.05)) = P( ≦Zn≦ )
を得る。ところで、
P( ≦Zn≦ )≒0.95
であるから、正規分布表より、
したがって、
となり、調査対象者は384名程度となる。
誤差を1%以内、信頼度を95%にする場合、調査対象者は、9604名程度となる。
np(1-p)
- 0.05n
np(1-p)
0.05n
Zn =np(1- p)
Tn- np
np(1-p)
- 0.05n
np(1-p)
0.05n
np(1-p)
0.05n≒ 1 .96
1.96
-1.96 2π
1exp(-
x2
2)dx≒0.95
n≒ (1.96
0.05) 2p(1- p)≦ (
1.96
0.05) 21
4≒ 384