View
4
Download
0
Category
Preview:
Citation preview
1
확률분포 (Probability Distribution)
15
결합확률분포(Joint Distributions)
• 결합확률분포는 서로 다른 두 확률변수의 조합에 대한 확률을 나타낸다
•결합확률: P(x,y)로 표기
P(x,y) = P(X=x and Y=y)
16
결합확률 분포표:예시
• 두 확률변수 (X,Y)에 대해 아래와 같은 결합확률분포표이 주어져을때,
- P(0,1) = P(X=0, Y=1) = 0.21
- P(2,2) = P(X=2, Y=2) = 0.01
17
한계확률(Marginal Probabilities)
- 이전과 같이 확률변수(X)와 (Y)에 대한 한계확률은 결합확률의 열과 행을 합하여 산출할 수 있다
18
결합확률분포의 응용
• 결합확률분포표의 한계확률을 이용하여 각 변수의 평균과 분산, 표준편차를 산출 할 수 있다
19
결합확률과 공분산
• 서로다른 두 이산형 변수의 공분산은 다음과 같이 산출 한다:
- 다른 산출방법:
20
결합확률과 상관계수
• 두 이산형 확률변수의 상관계수:
21
예시: 공분산과 상관계수
X Y Probability X - µ(x) Y - µ(y) [X - µ(x)][Y-µ(y)]
0 0 0.12 -0.7 -0.5 0.042
0 1 0.21 -0.7 0.5 -0.074
0 2 0.07 -0.7 1.5 -0.074
1 0 0.42 0.3 -0.5 -0.063
1 1 0.06 0.3 0.5 0.009
1 2 0.02 0.3 1.5 0.009
2 0 0.06 1.3 -0.5 -0.039
2 1 0.03 1.3 0.5 0.020
2 2 0.01 1.3 1.5 0.020
0.7 0.5 -0.150
22
예시: 공분산과 상관계수 - 공분산값 과 상관계수의 산출:
COV(X,Y) = (0 – .7)(0 – .5)(.12) + (1 – .7)(0 – .5)(.42) + …
… + (2 – .7)(2 – .5)(.01) = –.15
= –0.15 ÷ [(.64)(.67)] = –.35
따라서 두 변수사이에 약한 음의 상관관계가 있음을 알 수 있다
23
결합확률과 조건부 확률함수
• 조건부 확률함수: 확률변수X가 특정값(x)을 갖는 조건하에서 확률변수Y가 특정값(y)를 가지는 조건부 확률을 나타내는 함수
- P(Y=y|X=x) = f(y|x) =P(x,y)/P(x)
- Ex)
P(Y=0|X=1) = f(0|1) = 0.42/0.5 = 0.84
• 만일 P(Y=y|X=x) = P(x)*P(y)이면, 두 확률변수 X,Y는 서로 독립적이다
24
확률변수의 합 • 결합확률을 이용하여 두 확률변수의 합에 대한 확률분포를 파악 할 수 있다
P(X+Y=2) = P(0,2) + P(1,1) + P(2,0)
= .07 + .06 + .06 = .19
25
확률변수 합의 평균과 분산, 표준편차
• 단일 확률변수의 평균, 분사, 표준편차을 구하는 방법과 같은 방법을 이용한다…
-E(X + Y) = 0(.12)+1(.63)+2(.19)+3(.05)+4(.01)
= 1.2
-V(X + Y) = (0 – 1.2)2(.12) + … + (4 – 1.2)2(.01)
= .56
75.56.)YX(Varyx
26
확률변수 합의 법칙
• 확률변수 합의 평균(기대값)과 분산에 대한 일반적인 법칙
1) E(X + Y) = E(X) + E(Y)
2) V(X + Y) = V(X) + V(Y) + 2COV(X, Y)
3) 만일 두변수, X 와 Y 가 서로 독립적이면, COV(X, Y) = 0 이므로, V(X + Y) = V(X) + V(Y)
27
확률변수 합의 법칙 : 예시
- E(X + Y) = E(X) + E(Y) = .7 + .5 = 1.2
- V(X + Y) = V(X) + V(Y) + 2COV(X, Y)
= .41 + .45 + 2(-.15) = .56
28
이항분포(Binomial or Bernoulli Distribution)
• 이항분포는 이항실험(binomial experiment) 에 의해 나타나는 이산형 확률분포이다.
• 이항실험의 특성: - 고정된 실험 수 (n) - 각 실험은 오직 두 가지 결과, 성공(success)과
실패(failure)만이 가능 - 모든 실험에서 성공확률 P(s)=p, 실패확률
P(f)=1–p - 실험들은 서로 독립적으로 한 실험의 결과가 다
른 실험의 결과에 영향을 미치지 못한다
29
이항확률분포(Binomial Probability Distribution)
• 이항분포 : 확률변수 X를 이항실험에서 성공의 횟수라 하면 X의 확률분포는 이항분포를 따른다: X~B(n,p)
- 이항분포의 확률함수:
for x=0, 1, 2, …, n
30
이항확률변수의 평균과 분산, 표준편차
• 이항확률변수 X 는 기본적인 특성은 다음과 같다:
31
이항분포의 예
• 두 프로야구팀A,B가 시즌 중에 6번의 시합을 한다. 매 시합에서 A팀이 이길 확률이 0.6이라고 한다.(단, 무승부는 없다고 가정)
- A팀의 이긴 회수를 확률변수X라 할때, X는 어떤 분포를 따르는가? 또한 확률변수X의 기대값과 분산값은?
X~B(6, 0.6)
기대값: E(x) = n*p = 6*0.6 =3.6
분산값: var(X) = n*p*(1-p) = 6*0.6*0.4= 1.44
32
포아송 분포(Poisson Distribution)
• 포아송 확률분포는 통계학자 Simeon Poisson이름을 딴 이산형 확률분포로 포아송 실험(Poisson experiment ) 에 의해 특정시간, 지역 또는 거리 내에서 특정사건의 성공 회수에 대한 확률분포를 나타낸다
• 포아송 실험은 특성
1) 특정 구간(시간, 지역, 거리)에서 발생한 성공회수는 다른구간에서 발생한 성공회수와 독립적이다
2) 한 구간내에서의 성공의 확률은 같은 크기의 구간내에서 같다
3) 성공확률은 구간의크기에 비례한다
4) 구간이 작을수록 한번 이상 성공할 확률은 0에 근접한다
33
포아송 분포(Poisson Distribution)
• 포아송 분포의 확률함수:
• 포아송 분포의 평균과 분산, 표준편차:
μ = np (n:실험수 , p: 성공확률)
34
포아송 분포의 예
• 어떤 지역에서 교통사고가 하루에 평균적으로 0.5회 발생한다고 한다
- 하루에 발생하는 교통사고 발생회수를 확률변수 X라 한다면,X의 확률 분포는? 또한 X의 기대값과 분산값은?
X~P(0.5)
E(X) = Var(X) = 0.5
35
연습문제(1)
• X는 이산형 확률변수이며 다음과 같은 확률분포를 갖는다
1) P(X<8)?
2) P(X>4)?
3) P(2<X<5)?
4) X의 기대값?
5) X의 분산값?
6) X의 표준편차값?
X 2 3 4
P(x) 0.3 0.3 0.4
연습문제(2)
• 두개의 이산확률변수 X와Y의 결합확률분포P(x,y)가 다음과 같다
1) P(1,-1)?
2) P(X=0)의 주변확률?
3) 두 확률변수의 상관계수는?
4) 두 확률변수는 독립인가?
36
X Y -1 0 1
-1 0 1/3 0
0 0 0 1/3
1 1/3 0 0
Recommended