5
경경경경경 경경경경 2018 경 경경경경 경경경경경경 경경경 경경__________________ 경경 _______________ 경경 ________ _________ 1. (20 경) 경경 경경경 경경경경 경) (10 경) 경경경(Free Throw) 경경 경경경 70%경 경경경경경 10 경 경경경경 경경 8 경 경경경경 2 경 경경경 경경경? p <- 0.7 ((10*9*8*7*6*5*4*3)/(8*7*6*5*4*3*2*1))*p^8*(1-p)^2 =0.2334 경) (10 경) 1 경경 30 경경경 경경 경경경 4 경경 경경 경경 경경경 경경 경경 4 경경 경경경 경경 경경경(경경경 경경 경경) 1 경경경 경경 경경경 경경경 경경 경경 1,4,17,22 경 1 경경 경 경 경경 경경경? 1/((30*29*28*27)/(4*3*2*1)) =0.0000365

mis.mju.ac.krmis.mju.ac.kr/.../stat/2018fall_stat_final_sol.docx · Web view2.(20점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: mis.mju.ac.krmis.mju.ac.kr/.../stat/2018fall_stat_final_sol.docx · Web view2.(20점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다

경상통계학 기말고사 2018 년 가을학기 경영정보학과 박성헌

학과__________________ 학번 _______________ 이름 _________________

1. (20 점) 다음 물음에 답하시오

가) (10 점) 자유투(Free Throw) 성공 확률이 70%인 농구선수가 10 번 자유투를 던져 8번 성공하고 2 번 실패할 확률은?

p <- 0.7((10*9*8*7*6*5*4*3)/(8*7*6*5*4*3*2*1))*p^8*(1-p)^2

=0.2334

나) (10 점) 1 에서 30 까지의 숫자 중에서 4 개의 서로 다른 숫자를 뽑아 이들 4 개의 숫자가 모두 맞으면(순서에 상관 없이) 1 등하는 로또 게임을 한다면 특정 번호 1,4,17,22 가 1 등이 될 수 있는 확률은?

1/((30*29*28*27)/(4*3*2*1))=0.0000365

2.(20 점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다 크다라는 가설을 검정(유의 수준 5%로)하기 위하여 임의의 200 개 가구를 샘플링 하여 조사해 본 결과 200 가구 중에서 초고속인터넷이 설치되어 있는 가구가 117 곳이였다.

Page 2: mis.mju.ac.krmis.mju.ac.kr/.../stat/2018fall_stat_final_sol.docx · Web view2.(20점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다

적절한 귀무가설과 대립가설을 설정하고 유의수준에 맞는 가설 검정을 R 을 이용하여 진행하시오

HO : p(초고속 인터넷이 설치된 가구의 비율) <= 0.50H1 : p > 0.50

117/200 = 0.585

샘플평균은 정규분포를 따르고 평균 0.50 이고 표준 편차 sqrt(p*(1-p)/n)이므로sqrt(0.5*0.5/200) = 0.03535534

Z = (0.585 – 0.5)/ 0.03535534 = 2.404163

유의수준 95%의 critical value 는

> qnorm(0.95)[1] 1.644854

계산된 Z 값이 critical value 보다 커 램덤 효과로 볼 수 없으므로

H0 를 거부하고 H1 를 인정한다.

그러므로 초고속 인터넷이 설치된 가구의 비율이 0.5(50%) 보다 커다고 본다.

3.(20 점) 홍길동은 고등학교 재학생들 중에서 지난주 매일 아침밥을 먹고 등교하는 학생들의 비율의 신뢰구간을 구하고자 한다. 전체 1000 명 재학생들 중에서 임의의 80명 샘플을 정해 조사한 결과 80 명중에서 20 명이 지난주 매일 아침식사를 하고 등교 한 걸로 확인되었다. 이와 같은 조사결과를 이용하여 전체 학생들중에서 지난주 매일 아침 식사를 하고 등교하는 학생들의 비율의 95 프로 유의 수준의 신뢰구간을 계산 하시오. 신뢰구간 계산 과정을 R 수식으로 표시하시오!

n <- 80phat<- 20/nphatsd <- sqrt(phat*(1-phat)/n)sdleft <- phat - qnorm(0.975)*sdleftright <- phat + qnorm(0.975)*sdright

Page 3: mis.mju.ac.krmis.mju.ac.kr/.../stat/2018fall_stat_final_sol.docx · Web view2.(20점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다

4. (20 점) 다음 데이터를 dot plot, box and whisker plot, stem and leaf plot, histogram 을 그리시오

데이터는 1,2, 5, 8, 8, 7, 12, 14, 12

가) dot plot

library(ggplot2)ggdata <- data.frame(data)ggplot(ggdata,aes(data))+geom_dotplot()

나) box and whisker plot

boxplot(data, horizontal=TRUE)

Page 4: mis.mju.ac.krmis.mju.ac.kr/.../stat/2018fall_stat_final_sol.docx · Web view2.(20점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다

다) stem and leaf plot

stem(data)

The decimal point is 1 digit(s) to the right of the |

0 | 12 0 | 5788 1 | 224

라) histogram

hist(data)

5. (20 점) 다음 R Script 문제에 답하시오

Page 5: mis.mju.ac.krmis.mju.ac.kr/.../stat/2018fall_stat_final_sol.docx · Web view2.(20점) 미국 전체 가구 중에서 초고속인터넷이 설치된 가구의 비율이 50% 보다

가) (10 점) 다음은 6 면 주사위 2 개를 던졌을 때 윗면 숫자들의 합을 구하는 모의실험(Simulation)하고 그 결과를 도표로 표시하는 Script 이다. 이를 참고하여 정상 6 면 주사위 2 개를 던져 윗면의 합과 정상 4 면 주사위 2 개를 던져 아랫면의 합의 차이를(큰 값에서 작은 값을 뺀) 구하는 모의실험하고 그 결과를 도표로 표시하는 스크립트로 변경 하시오. R 절대값 함수 abs(..), 올림 함수 ceiling(..), 내림 함수 floor()..등을 적절하게 이용 하시오

나) (10 점) 다음 값을 구하는데 필요한 수식 R 확률변수 수식을 작성하시오

#uniform distribution simulation of throwing two die # p = 1/n 6 of die roll <- 1000000 n <- 6 die <- ceiling(runif(roll)*n) + ceiling(runif(roll)*n) b <- table(die) barplot(b)

# 표준정규분표(normal distribution) 평균 (mean)= 0 표준편차(sd)=1 임# 정규분포함수로는 dnorm(..), pnorm(…), qnorm(…), rnorm(…) 이 있다# Student t 분포함수로는 dt(…), pt(…), qt(…), rt(…)이 있다. 자유도 df= 값을# 꼭 필요로 한다

# a) 표준정규분포 X 가 -1 와 2 사이의 확률을 구하려면? 필요한 수식은??

pnorm(2)-pnorm(-1)# b) 자유도 5 인 Student t 분포 Y 값이 4 보다 클 확률을 구하려면? # 필요한 수식은??

1-pt(4,df=5)#c) 누적 확률이 0.75 에 해당되는 표준정규분포 X 값을 구하려면 필요한 수식은??#이 X 값과 같은 자유도 30 의 Student t 확률변수의 누적 확률은?x<- qnorm(0.75)xpt(x, df=30)

roll <- 1000000 n1 <- 6n2 <- 4die1 <- ceiling(runif(roll)*n1) + ceiling(runif(roll)*n1) die2 <- ceiling(runif(roll)*n2) + ceiling(runif(roll)*n2)result <- abs(die1-die2)b <- table(result) barplot(b)