Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
수의 세계
13주차. 확률
1. 확률의 정의 및 성질
2. 확률의 응용 -- 통계
• 확률의 정의와 성질
• 실생활에서 확률의 이용 -- 통계
학습내용
학습목표
수의 세계
13주차. 확률
1 확률 1
1654년에 블레즈 파스칼이 피에르 드 페르마에게 보낸 몇 차례 서신이 확률론의 기원. 편지의 내용은 그 해 초에 셰발리에르 드 메레에게서 들었던 운에 따르는 게임들(games of chance)과 관련된 두 가지 문제에 대한 것이었음.
파스칼과 페르마는 확률에 대해 명확한 개념을 가지고 있지 못했음. 확률에 대한 명확한 정의가 필요하다는 생각을 처음으로 했던 사람은 라플라스였음
1) 기원
1 확률 1
무작위 현상을 분석하는 수학의 한 분야 :
무작위 사건의 가능한 모든 결과를 모아놓은 집합을 표본공간(標本空間 sample space)이라 하고, 이공간의 각 결과에 그 결과가 단일 경우에 일어날 가능성을 나타내는 수인 확률을 할당.
확률은 음(陰)이 아니고 총합은 1.
2) 정의
1 확률 1
Determinism : 과거의 일이 미래의 원인이 되며, 이 세상의 모든 사건은 이미 정해진 곳에서 정해진 때에 이루어지게 되어 있다는 이론.
결정론에 따르면 우주에서 일어나는 모든 사건과 운동은 이미 그 전부터 결정되어 있으며, 어떤 법칙에 따라 합리적으로 움직인다. 만유인력의 법칙을 발견한 뉴턴과 라플라스 등이 결정론을 지지.
라플라스는 "우주의 모든 입자의 위치와 속도를 안다면 우주의 미래를 예측할 수 있다"고 주장
3) 결정론과 확률
1 확률 1
Newton 고전역학, Laplace “천체 역학 MécaniqueCéleste, Celestial Mechanics” 결정론적세계관 확립의 계기
The system of the world is purely mechanical, with the future as determined as the past. probability is a measure of our ignorance of underlying causes.
3) 결정론과 확률
1 확률 1
예] 동전을 던졌을 때, 앞면이나 뒷면으로 떨어지는 것도 물리적 조건에 의해 결정된다.
어느 면이 나올지 모르는 이유는 우리가 조건을 모두 알지 못하기 때문이고, 그래서 이를 확률 사건으로 다룬다.
3) 결정론과 확률
1 확률 1
Laplace “Théorie analytique des probabilités”
“어떤 사건의 발생 확률은 그것이 일어날 수 있는 경우의 수 대 가
능한 모든 경우의 수(표본공간)의 비이다. 단, 이는 어떠한 사건
도 다른 사건들보다 더 많이 일어날 수 있다고 기대할 근거가 없
을 때, 그러니까 모든 사건이 동일하게 일어날 수 있다고 할 때에
성립된다.”로 시작 ) 무차별의 원칙
4) 고전적 확률 (수학적 확률)
1 확률 1
고전적 확률은 근원사건이 유한개인 경우만 적용 가능하며 실제로 일어나는 문제에는 도입하기가 어려움.
예] 임의로 선택한 자연수가 짝수일 확률은?
(고전적확률) 각 자연수가 선택될 확률은 0.
4) 고전적 확률 (수학적 확률)
1 확률 1
5) 확률의 기본원리
1 확률 1
5) 확률의 기본원리
조건부 확률 (conditional probability)
두 사건 A와 B에 대하여 사건 B가 일어났다는 조건하에서 사건 A가 발생할 조건부 확률은 P(A|B)로 표현하고 다음과 같이 정의
P(A |B) =P(AÇB)
P(B)
P(A |B) =P(AÇB)
P(B)=
| AB | / | W |
|B | / | W |=
| AB |
|B |
1 확률 1
5) 확률의 기본원리
예] 주사위 하나를 두 번 던지는 실험에서 눈금의 합이 5일 때, 첫 번째 주사위가 3일 확률
A: 첫 번째 주사위가 3인 사건 B: 눈금의 합이 5인 사건 B={(1,4), (2,3), (3,2), (4,1)} AB={(3,2)} 따라서 구하고자 하는 확률은
P(A |B) =| AB |
|B |=
1
4×
1 확률 1
6) Birthday Problem
n명의 그룹에서 두 사람이 생일이 같을 확률 (n≥2)
23명만 모여도 생일이 같은 두 사람이 있을 확률이 50%를 넘고, 57명이 모이면 99%를 넘음
생일의 가능한 가지수는 365개(2월 29일을 고려할 경우 366개)이므로 366명 이상의 사람이 모인다면 비둘기집 원리에 따라 생일이 같은 두 명이 반드시 존재
1 확률 1
6) Birthday Problem
어느 두 사람도 생일이 다를 확률을 q(n)이라하면
q(n) =364
365´
363
365´
362
365´ ´
365- n +1
365×
구하고자 하는 생일이 같은 사람이 둘 이상 있을 확률 p(n)은
p(n) =1- q(n)
=1-364
365´
363
365´
362
365´ ´
365- n +1
365×
1 확률 1
6) Birthday Problem
확률 p(n)
1 확률 1
7) 상트페테르부르크의 역설
동전을 던져 뒷면이 나오면 계속 던지고, n번째 처음 앞면이 나오면 게임이 종료되고 2n-1루블의 상금을 지급. 도박의 참가비는 10,000루블
확률 변수의 기대값(Expected value)은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값
1 확률 1
7) 상트페테르부르크의 역설
동전을 던져 뒷면이 나오면 계속 던지고, n번째 처음 앞면이 나오면 게임이 종료되고 2n-1루블의 상금을 지급. 도박의 참가비는 10,000루블
E =1
2×1+
1
4×2 +
1
8×4 +
1
16×8+
=1
2+
1
2+
1
2+
1
2+ = ¥
기대값이 무한대지만 누구도(??, 많은 사람이)이 게임에 참가하지 않는 역설이 발생
1 확률 1
7) 상트페테르부르크의 역설 해결책들
‘한계효용 체감의 원리’
다니엘 베르누이는 게임의 참가자가 얻게 될 기대값은 단
순한 액수의 합이 아니라 그것의 총 효용이어야 한다고 주
장
“부의 증가로 발생하는 효용의 증가는 그가 이미 소유하고
있는 재화의 양에 반비례한다.
그리고 같은 기대값을 갖는다 하더라도 발생 확률이 적은
사건이 주는 효용은 그 확률에 비례해서 작아진다.”
1 확률 1
7) 상트페테르부르크의 역설 해결책들
확률 가중치 Probability weighting :
Daniel Bernoulli는 참가자들이 불가능해 보이는 사건은
무시할 것으로 예상
(Daniel Bernoulli conjectured that people will
neglect unlikely events)
1 확률 1
8) 유한 상트페테르부르크의 역설
Casino의 자본 = W
지불 가능한 최대 상금 = min(2k, W)
E =1
2k+1×min(2k,W )
k=0
¥
å
=1
2k+1×2k
k=0
L-1
å +1
2k+1×W
k=L
¥
å
=L
2+W
2L.
1 확률 1
8) 유한 상트페테르부르크의 역설
수의 세계
13주차. 확률
1 2
1) 정의
통계
연구 목적에 필요한 자료 및 정보를 최적한 방법으로
수집하고, 수집한 자료를 과학적이고 논리적인 이론
에 의하여 정리 분석하는 학문
1 통계 2
확률 변수의 기대값(Expected value)은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값
중앙값(median)은 어떤 주어진 값들을 크기순으로 정렬했을 때 가장 중앙에 위치하는 값
홀수개 ) 중간값 하나 짝수개 ) 중간 둘의 평균값
1 통계 2
편차 (deviation) 관측값과 평균의 차이
예] 전구 8개의 수명이 1200, 1100, 900, 870, 720, 200, 2500, 990 시간이면 평균은
x =1200 +1100 + 900 + 870 + 720 + 200 + 2500 + 990
8
편차는 140,40,-160,-190,-340,-860,1440,-70
1 통계 2
분산(variance) σ2은 확률변수가 기대값으로부터 얼
마나 떨어진 곳에 분포하는지를 가늠하는 숫자로 다음
공식으로 정의
s 2 = E((X -E(X))2 ) = E(X2 )- (E(X))2
1 통계 2
표준편차(standard deviation, 標準偏差) σ는 분산의 음
이 아닌 제곱근.
s = E((X -E(X))2 ) = E(X2 )- (E(X))2
표준 편차는 (혹은 분산 ) 자료의 산포도를 나타내는
수치로 작을수록 평균값에서 변량들의 거리가 가까움.
1 통계 2
2) 큰 수의 법칙
많은 시행을 했을 때 그 평균은 실제 평균에 가깝고,
더 많은 시행을 하면 더욱 가까워진다는 법칙.
1 통계 2
2) 큰 수의 법칙
μ : 확률뷴포의 평균
σ : 표준편차
σ 2 : 분산.
정규확률분포 N(μ,σ2)는 공식
에 의해 정의되는 연속확률분포
f (x) =1
s 2pe
-(x-m )2
2s 2
1 2 통계
3) 정규분포
f (x) =1
s 2pe
-(x-m )2
2s 2
1 2 통계
3) 정규분포
확률변수(X)의 평균이 μ 이고 분산이 σ² 일때, 모집단으
로 부터 무작위로 n개를 뽑아서 구한 표본의 평균(Xn)은
표본크기(n)가 클수록 평균이 μ이고 분산이 σ² /n인 정
규분포를 따른다.
즉, Xn ~ N(μ,σ² /n).
1 2 통계
4) 중심극한정리
1 2 통계
4) 중심극한정리
1 2 통계
남·여 학생의 실제 수학 성적 분포
정규분포라고 가정
4) 중심극한정리
5) 통계적 추론(statistical inference)
1 2 통계
모수(parameter)에 대한 어떤 판단을 내리기 위하여, 모집단에서 표본을 추출하여 데이터를 얻고 이 데이터를 기초로 하여 통계이론에 의한 결론을 내리는 과정
• 추정(estimation) - 모수를 예측 - 점추정(point estimation) : 모수를 한 개의 값으로 추정 - 구간추정(interval estimation) : 모수가 포함되리라 기대되는 구간으로 추정
1 2 통계
• 가설검정(hypothesis testing) - 모수에 대한 구체적인 결론을 내리는 과정 예] 한국외대 학생들의 하루 평균 공부시간은 얼마나 되나? 모집단과 표본 8시간 한국외대 학생들의 공부시간이 하버드 학생보다 많은가? 많다 (적다)
5) 통계적 추론(statistical inference)
6) 통계학의 분야
1 2 통계
(1) 기술통계학 (descriptive statistics)
: 수집된 자료의 특성을 표나 그림 또는 대표값으로 정리
하는 분야
(2) 추측통계학 (inferential statistics)
: 수집된 자료의 분석을 통해서 모집단에 대해 구체적인
추론을 하는 분야
- 추정(estimation) :
- 검정(hypothesis testing)
수의 세계
13주차. 확률
[문제1] 주사위 하나를 두 번 던지는 실험에서 눈금
의 합이 6일 때, 첫 번째 주사위가 3일 확률을 구하
라.
평가하기
[문제2] n명의 그룹에서 같은 달에 태어난 사람이
있을 확률이 50%이상이라 하자. n의 최소값을
구하라.
평가하기
[문제3] 전구 6개의 수명이 1200, 1100, 900, 870,
720, 990 시간일 때 평균과 표준편차를 구하라.
평가하기
[문제4] 다음 중 통계학의 영역이라고 볼 수 없는 것은?
① 프로야구 선수의 타율
② 버스회사의 일년 연료소비량
③ 여론 조사를 통한 선거 당선자 예측
④ 카지노 게임의 승률 계산
평가하기
수의 세계
13주차. 확률
정리하기
확률의 정의
성질
1강 . 확률의 정의 및 성질
정리하기
실생활에서 확률의 이용
통계
2강. 확률의 응용