23
1 확률분포 (Probability Distribution)

확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

1

확률분포 (Probability Distribution)

Page 2: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

15

결합확률분포(Joint Distributions)

• 결합확률분포는 서로 다른 두 확률변수의 조합에 대한 확률을 나타낸다

•결합확률: P(x,y)로 표기

P(x,y) = P(X=x and Y=y)

Page 3: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

16

결합확률 분포표:예시

• 두 확률변수 (X,Y)에 대해 아래와 같은 결합확률분포표이 주어져을때,

- P(0,1) = P(X=0, Y=1) = 0.21

- P(2,2) = P(X=2, Y=2) = 0.01

Page 4: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

17

한계확률(Marginal Probabilities)

- 이전과 같이 확률변수(X)와 (Y)에 대한 한계확률은 결합확률의 열과 행을 합하여 산출할 수 있다

Page 5: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

18

결합확률분포의 응용

• 결합확률분포표의 한계확률을 이용하여 각 변수의 평균과 분산, 표준편차를 산출 할 수 있다

Page 6: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

19

결합확률과 공분산

• 서로다른 두 이산형 변수의 공분산은 다음과 같이 산출 한다:

- 다른 산출방법:

Page 7: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

20

결합확률과 상관계수

• 두 이산형 확률변수의 상관계수:

Page 8: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

21

예시: 공분산과 상관계수

X Y Probability X - µ(x) Y - µ(y) [X - µ(x)][Y-µ(y)]

0 0 0.12 -0.7 -0.5 0.042

0 1 0.21 -0.7 0.5 -0.074

0 2 0.07 -0.7 1.5 -0.074

1 0 0.42 0.3 -0.5 -0.063

1 1 0.06 0.3 0.5 0.009

1 2 0.02 0.3 1.5 0.009

2 0 0.06 1.3 -0.5 -0.039

2 1 0.03 1.3 0.5 0.020

2 2 0.01 1.3 1.5 0.020

0.7 0.5 -0.150

Page 9: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

22

예시: 공분산과 상관계수 - 공분산값 과 상관계수의 산출:

COV(X,Y) = (0 – .7)(0 – .5)(.12) + (1 – .7)(0 – .5)(.42) + …

… + (2 – .7)(2 – .5)(.01) = –.15

= –0.15 ÷ [(.64)(.67)] = –.35

따라서 두 변수사이에 약한 음의 상관관계가 있음을 알 수 있다

Page 10: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

23

결합확률과 조건부 확률함수

• 조건부 확률함수: 확률변수X가 특정값(x)을 갖는 조건하에서 확률변수Y가 특정값(y)를 가지는 조건부 확률을 나타내는 함수

- P(Y=y|X=x) = f(y|x) =P(x,y)/P(x)

- Ex)

P(Y=0|X=1) = f(0|1) = 0.42/0.5 = 0.84

• 만일 P(Y=y|X=x) = P(x)*P(y)이면, 두 확률변수 X,Y는 서로 독립적이다

Page 11: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

24

확률변수의 합 • 결합확률을 이용하여 두 확률변수의 합에 대한 확률분포를 파악 할 수 있다

P(X+Y=2) = P(0,2) + P(1,1) + P(2,0)

= .07 + .06 + .06 = .19

Page 12: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

25

확률변수 합의 평균과 분산, 표준편차

• 단일 확률변수의 평균, 분사, 표준편차을 구하는 방법과 같은 방법을 이용한다…

-E(X + Y) = 0(.12)+1(.63)+2(.19)+3(.05)+4(.01)

= 1.2

-V(X + Y) = (0 – 1.2)2(.12) + … + (4 – 1.2)2(.01)

= .56

75.56.)YX(Varyx

Page 13: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

26

확률변수 합의 법칙

• 확률변수 합의 평균(기대값)과 분산에 대한 일반적인 법칙

1) E(X + Y) = E(X) + E(Y)

2) V(X + Y) = V(X) + V(Y) + 2COV(X, Y)

3) 만일 두변수, X 와 Y 가 서로 독립적이면, COV(X, Y) = 0 이므로, V(X + Y) = V(X) + V(Y)

Page 14: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

27

확률변수 합의 법칙 : 예시

- E(X + Y) = E(X) + E(Y) = .7 + .5 = 1.2

- V(X + Y) = V(X) + V(Y) + 2COV(X, Y)

= .41 + .45 + 2(-.15) = .56

Page 15: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

28

이항분포(Binomial or Bernoulli Distribution)

• 이항분포는 이항실험(binomial experiment) 에 의해 나타나는 이산형 확률분포이다.

• 이항실험의 특성: - 고정된 실험 수 (n) - 각 실험은 오직 두 가지 결과, 성공(success)과

실패(failure)만이 가능 - 모든 실험에서 성공확률 P(s)=p, 실패확률

P(f)=1–p - 실험들은 서로 독립적으로 한 실험의 결과가 다

른 실험의 결과에 영향을 미치지 못한다

Page 16: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

29

이항확률분포(Binomial Probability Distribution)

• 이항분포 : 확률변수 X를 이항실험에서 성공의 횟수라 하면 X의 확률분포는 이항분포를 따른다: X~B(n,p)

- 이항분포의 확률함수:

for x=0, 1, 2, …, n

Page 17: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

30

이항확률변수의 평균과 분산, 표준편차

• 이항확률변수 X 는 기본적인 특성은 다음과 같다:

Page 18: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

31

이항분포의 예

• 두 프로야구팀A,B가 시즌 중에 6번의 시합을 한다. 매 시합에서 A팀이 이길 확률이 0.6이라고 한다.(단, 무승부는 없다고 가정)

- A팀의 이긴 회수를 확률변수X라 할때, X는 어떤 분포를 따르는가? 또한 확률변수X의 기대값과 분산값은?

X~B(6, 0.6)

기대값: E(x) = n*p = 6*0.6 =3.6

분산값: var(X) = n*p*(1-p) = 6*0.6*0.4= 1.44

Page 19: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

32

포아송 분포(Poisson Distribution)

• 포아송 확률분포는 통계학자 Simeon Poisson이름을 딴 이산형 확률분포로 포아송 실험(Poisson experiment ) 에 의해 특정시간, 지역 또는 거리 내에서 특정사건의 성공 회수에 대한 확률분포를 나타낸다

• 포아송 실험은 특성

1) 특정 구간(시간, 지역, 거리)에서 발생한 성공회수는 다른구간에서 발생한 성공회수와 독립적이다

2) 한 구간내에서의 성공의 확률은 같은 크기의 구간내에서 같다

3) 성공확률은 구간의크기에 비례한다

4) 구간이 작을수록 한번 이상 성공할 확률은 0에 근접한다

Page 20: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

33

포아송 분포(Poisson Distribution)

• 포아송 분포의 확률함수:

• 포아송 분포의 평균과 분산, 표준편차:

μ = np (n:실험수 , p: 성공확률)

Page 21: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

34

포아송 분포의 예

• 어떤 지역에서 교통사고가 하루에 평균적으로 0.5회 발생한다고 한다

- 하루에 발생하는 교통사고 발생회수를 확률변수 X라 한다면,X의 확률 분포는? 또한 X의 기대값과 분산값은?

X~P(0.5)

E(X) = Var(X) = 0.5

Page 22: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

35

연습문제(1)

• X는 이산형 확률변수이며 다음과 같은 확률분포를 갖는다

1) P(X<8)?

2) P(X>4)?

3) P(2<X<5)?

4) X의 기대값?

5) X의 분산값?

6) X의 표준편차값?

X 2 3 4

P(x) 0.3 0.3 0.4

Page 23: 확률분포 (Probability Distribution)contents.kocw.net/KOCW/document/2014/Hallym/hanyoungwook/... · 2016-09-09 · 28 이항분포(Binomial or Bernoulli Distribution) • 이항분포는

연습문제(2)

• 두개의 이산확률변수 X와Y의 결합확률분포P(x,y)가 다음과 같다

1) P(1,-1)?

2) P(X=0)의 주변확률?

3) 두 확률변수의 상관계수는?

4) 두 확률변수는 독립인가?

36

X Y -1 0 1

-1 0 1/3 0

0 0 0 1/3

1 1/3 0 0