13주차 확률elearning.kocw.net/contents4/document/lec/2013/Hufs/... · 2013-10-11 · 확률...

Preview:

Citation preview

수의 세계

13주차. 확률

1. 확률의 정의 및 성질

2. 확률의 응용 -- 통계

• 확률의 정의와 성질

• 실생활에서 확률의 이용 -- 통계

학습내용

학습목표

수의 세계

13주차. 확률

1 확률 1

1654년에 블레즈 파스칼이 피에르 드 페르마에게 보낸 몇 차례 서신이 확률론의 기원. 편지의 내용은 그 해 초에 셰발리에르 드 메레에게서 들었던 운에 따르는 게임들(games of chance)과 관련된 두 가지 문제에 대한 것이었음.

파스칼과 페르마는 확률에 대해 명확한 개념을 가지고 있지 못했음. 확률에 대한 명확한 정의가 필요하다는 생각을 처음으로 했던 사람은 라플라스였음

1) 기원

1 확률 1

무작위 현상을 분석하는 수학의 한 분야 :

무작위 사건의 가능한 모든 결과를 모아놓은 집합을 표본공간(標本空間 sample space)이라 하고, 이공간의 각 결과에 그 결과가 단일 경우에 일어날 가능성을 나타내는 수인 확률을 할당.

확률은 음(陰)이 아니고 총합은 1.

2) 정의

1 확률 1

Determinism : 과거의 일이 미래의 원인이 되며, 이 세상의 모든 사건은 이미 정해진 곳에서 정해진 때에 이루어지게 되어 있다는 이론.

결정론에 따르면 우주에서 일어나는 모든 사건과 운동은 이미 그 전부터 결정되어 있으며, 어떤 법칙에 따라 합리적으로 움직인다. 만유인력의 법칙을 발견한 뉴턴과 라플라스 등이 결정론을 지지.

라플라스는 "우주의 모든 입자의 위치와 속도를 안다면 우주의 미래를 예측할 수 있다"고 주장

3) 결정론과 확률

1 확률 1

Newton 고전역학, Laplace “천체 역학 MécaniqueCéleste, Celestial Mechanics” 결정론적세계관 확립의 계기

The system of the world is purely mechanical, with the future as determined as the past. probability is a measure of our ignorance of underlying causes.

3) 결정론과 확률

1 확률 1

예] 동전을 던졌을 때, 앞면이나 뒷면으로 떨어지는 것도 물리적 조건에 의해 결정된다.

어느 면이 나올지 모르는 이유는 우리가 조건을 모두 알지 못하기 때문이고, 그래서 이를 확률 사건으로 다룬다.

3) 결정론과 확률

1 확률 1

Laplace “Théorie analytique des probabilités”

“어떤 사건의 발생 확률은 그것이 일어날 수 있는 경우의 수 대 가

능한 모든 경우의 수(표본공간)의 비이다. 단, 이는 어떠한 사건

도 다른 사건들보다 더 많이 일어날 수 있다고 기대할 근거가 없

을 때, 그러니까 모든 사건이 동일하게 일어날 수 있다고 할 때에

성립된다.”로 시작 ) 무차별의 원칙

4) 고전적 확률 (수학적 확률)

1 확률 1

고전적 확률은 근원사건이 유한개인 경우만 적용 가능하며 실제로 일어나는 문제에는 도입하기가 어려움.

예] 임의로 선택한 자연수가 짝수일 확률은?

(고전적확률) 각 자연수가 선택될 확률은 0.

4) 고전적 확률 (수학적 확률)

1 확률 1

5) 확률의 기본원리

1 확률 1

5) 확률의 기본원리

조건부 확률 (conditional probability)

두 사건 A와 B에 대하여 사건 B가 일어났다는 조건하에서 사건 A가 발생할 조건부 확률은 P(A|B)로 표현하고 다음과 같이 정의

P(A |B) =P(AÇB)

P(B)

P(A |B) =P(AÇB)

P(B)=

| AB | / | W |

|B | / | W |=

| AB |

|B |

1 확률 1

5) 확률의 기본원리

예] 주사위 하나를 두 번 던지는 실험에서 눈금의 합이 5일 때, 첫 번째 주사위가 3일 확률

A: 첫 번째 주사위가 3인 사건 B: 눈금의 합이 5인 사건 B={(1,4), (2,3), (3,2), (4,1)} AB={(3,2)} 따라서 구하고자 하는 확률은

P(A |B) =| AB |

|B |=

1

1 확률 1

6) Birthday Problem

n명의 그룹에서 두 사람이 생일이 같을 확률 (n≥2)

23명만 모여도 생일이 같은 두 사람이 있을 확률이 50%를 넘고, 57명이 모이면 99%를 넘음

생일의 가능한 가지수는 365개(2월 29일을 고려할 경우 366개)이므로 366명 이상의 사람이 모인다면 비둘기집 원리에 따라 생일이 같은 두 명이 반드시 존재

1 확률 1

6) Birthday Problem

어느 두 사람도 생일이 다를 확률을 q(n)이라하면

q(n) =364

365´

363

365´

362

365´ ´

365- n +1

365×

구하고자 하는 생일이 같은 사람이 둘 이상 있을 확률 p(n)은

p(n) =1- q(n)

=1-364

365´

363

365´

362

365´ ´

365- n +1

365×

1 확률 1

6) Birthday Problem

확률 p(n)

1 확률 1

7) 상트페테르부르크의 역설

동전을 던져 뒷면이 나오면 계속 던지고, n번째 처음 앞면이 나오면 게임이 종료되고 2n-1루블의 상금을 지급. 도박의 참가비는 10,000루블

확률 변수의 기대값(Expected value)은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값

1 확률 1

7) 상트페테르부르크의 역설

동전을 던져 뒷면이 나오면 계속 던지고, n번째 처음 앞면이 나오면 게임이 종료되고 2n-1루블의 상금을 지급. 도박의 참가비는 10,000루블

E =1

2×1+

1

4×2 +

1

8×4 +

1

16×8+

=1

2+

1

2+

1

2+

1

2+ = ¥

기대값이 무한대지만 누구도(??, 많은 사람이)이 게임에 참가하지 않는 역설이 발생

1 확률 1

7) 상트페테르부르크의 역설 해결책들

‘한계효용 체감의 원리’

다니엘 베르누이는 게임의 참가자가 얻게 될 기대값은 단

순한 액수의 합이 아니라 그것의 총 효용이어야 한다고 주

“부의 증가로 발생하는 효용의 증가는 그가 이미 소유하고

있는 재화의 양에 반비례한다.

그리고 같은 기대값을 갖는다 하더라도 발생 확률이 적은

사건이 주는 효용은 그 확률에 비례해서 작아진다.”

1 확률 1

7) 상트페테르부르크의 역설 해결책들

확률 가중치 Probability weighting :

Daniel Bernoulli는 참가자들이 불가능해 보이는 사건은

무시할 것으로 예상

(Daniel Bernoulli conjectured that people will

neglect unlikely events)

1 확률 1

8) 유한 상트페테르부르크의 역설

Casino의 자본 = W

지불 가능한 최대 상금 = min(2k, W)

E =1

2k+1×min(2k,W )

k=0

¥

å

=1

2k+1×2k

k=0

L-1

å +1

2k+1×W

k=L

¥

å

=L

2+W

2L.

1 확률 1

8) 유한 상트페테르부르크의 역설

수의 세계

13주차. 확률

1 2

1) 정의

통계

연구 목적에 필요한 자료 및 정보를 최적한 방법으로

수집하고, 수집한 자료를 과학적이고 논리적인 이론

에 의하여 정리 분석하는 학문

1 통계 2

확률 변수의 기대값(Expected value)은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값

중앙값(median)은 어떤 주어진 값들을 크기순으로 정렬했을 때 가장 중앙에 위치하는 값

홀수개 ) 중간값 하나 짝수개 ) 중간 둘의 평균값

1 통계 2

편차 (deviation) 관측값과 평균의 차이

예] 전구 8개의 수명이 1200, 1100, 900, 870, 720, 200, 2500, 990 시간이면 평균은

x =1200 +1100 + 900 + 870 + 720 + 200 + 2500 + 990

8

편차는 140,40,-160,-190,-340,-860,1440,-70

1 통계 2

분산(variance) σ2은 확률변수가 기대값으로부터 얼

마나 떨어진 곳에 분포하는지를 가늠하는 숫자로 다음

공식으로 정의

s 2 = E((X -E(X))2 ) = E(X2 )- (E(X))2

1 통계 2

표준편차(standard deviation, 標準偏差) σ는 분산의 음

이 아닌 제곱근.

s = E((X -E(X))2 ) = E(X2 )- (E(X))2

표준 편차는 (혹은 분산 ) 자료의 산포도를 나타내는

수치로 작을수록 평균값에서 변량들의 거리가 가까움.

1 통계 2

2) 큰 수의 법칙

많은 시행을 했을 때 그 평균은 실제 평균에 가깝고,

더 많은 시행을 하면 더욱 가까워진다는 법칙.

1 통계 2

2) 큰 수의 법칙

μ : 확률뷴포의 평균

σ : 표준편차

σ 2 : 분산.

정규확률분포 N(μ,σ2)는 공식

에 의해 정의되는 연속확률분포

f (x) =1

s 2pe

-(x-m )2

2s 2

1 2 통계

3) 정규분포

f (x) =1

s 2pe

-(x-m )2

2s 2

1 2 통계

3) 정규분포

확률변수(X)의 평균이 μ 이고 분산이 σ² 일때, 모집단으

로 부터 무작위로 n개를 뽑아서 구한 표본의 평균(Xn)은

표본크기(n)가 클수록 평균이 μ이고 분산이 σ² /n인 정

규분포를 따른다.

즉, Xn ~ N(μ,σ² /n).

1 2 통계

4) 중심극한정리

1 2 통계

4) 중심극한정리

1 2 통계

남·여 학생의 실제 수학 성적 분포

정규분포라고 가정

4) 중심극한정리

5) 통계적 추론(statistical inference)

1 2 통계

모수(parameter)에 대한 어떤 판단을 내리기 위하여, 모집단에서 표본을 추출하여 데이터를 얻고 이 데이터를 기초로 하여 통계이론에 의한 결론을 내리는 과정

• 추정(estimation) - 모수를 예측 - 점추정(point estimation) : 모수를 한 개의 값으로 추정 - 구간추정(interval estimation) : 모수가 포함되리라 기대되는 구간으로 추정

1 2 통계

• 가설검정(hypothesis testing) - 모수에 대한 구체적인 결론을 내리는 과정 예] 한국외대 학생들의 하루 평균 공부시간은 얼마나 되나? 모집단과 표본 8시간 한국외대 학생들의 공부시간이 하버드 학생보다 많은가? 많다 (적다)

5) 통계적 추론(statistical inference)

6) 통계학의 분야

1 2 통계

(1) 기술통계학 (descriptive statistics)

: 수집된 자료의 특성을 표나 그림 또는 대표값으로 정리

하는 분야

(2) 추측통계학 (inferential statistics)

: 수집된 자료의 분석을 통해서 모집단에 대해 구체적인

추론을 하는 분야

- 추정(estimation) :

- 검정(hypothesis testing)

수의 세계

13주차. 확률

[문제1] 주사위 하나를 두 번 던지는 실험에서 눈금

의 합이 6일 때, 첫 번째 주사위가 3일 확률을 구하

라.

평가하기

[문제2] n명의 그룹에서 같은 달에 태어난 사람이

있을 확률이 50%이상이라 하자. n의 최소값을

구하라.

평가하기

[문제3] 전구 6개의 수명이 1200, 1100, 900, 870,

720, 990 시간일 때 평균과 표준편차를 구하라.

평가하기

[문제4] 다음 중 통계학의 영역이라고 볼 수 없는 것은?

① 프로야구 선수의 타율

② 버스회사의 일년 연료소비량

③ 여론 조사를 통한 선거 당선자 예측

④ 카지노 게임의 승률 계산

평가하기

수의 세계

13주차. 확률

정리하기

확률의 정의

성질

1강 . 확률의 정의 및 성질

정리하기

실생활에서 확률의 이용

통계

2강. 확률의 응용

Recommended