6
(42) Linear Model | Spring 2013 예제 데이터 SMSA.xls 사망률에 영향을 주는 변인 Chapter 4. Multiple Regression 연구모형도 변수 변수명 변수내용 종속변수 Mortality 사망률 기후 JanTemp 1월기온 JulyTemp 7월기온 RelHum 상대습도 Rain 강우량 사회경제 Education 교육수준 PopDensity 인구밀도 NonWhite 비백인비율 WC 화이트칼라 비율 pop/house 가구당 가족수 income 소득 환경 HCPot 오염물질1 NOxPot 오염물질2 S02Pot 오염물질3 city Mortality JanTemp JulyTemp RelHum Rain Education PopDensity NonWhite WC pop/house income HCPot NOxPot S02Pot Akron, OH 921.87 27 71 59 36 11.4 3243 8.8 42.6 3.34 29560 21 15 59 Albany-Schenectady-Troy, NY 997.87 23 72 57 35 11 4281 3.5 50.7 3.14 31458 8 10 39 사망률 (기후) 1월기온(-) 7월기온(+) 상대습도(+) 강우량(+) (사회경제) 교육수준(-) 인구밀도(+) 비백인비율(+) WC 비율(+) 가족수 (+?) 소득(-) (환경) HCPot(+) NOcPot(+) SO2Pot(+)

Linear Model | Spring 2013 Chapter 4. Multiple Regression …wolfpack.hnu.ac.kr/Spring_2013/LM13/LM_chapter4(다중... · 2013. 5. 17. · Chapter 4. Multiple Regression 순서1

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • (42)

    Linear Model | Spring 2013

    예제 데이터SMSA.xls사망률에 영향을 주는 변인

    Chapter 4. Multiple Regression 연구모형도

    변수 변수명 변수내용

    종속변수 Mortality 사망률

    기후

    JanTemp 1월기온

    JulyTemp 7월기온

    RelHum 상대습도

    Rain 강우량

    사회경제

    Education 교육수준

    PopDensity 인구밀도

    NonWhite 비백인비율

    WC 화이트칼라 비율

    pop/house 가구당 가족수

    income 소득

    환경

    HCPot 오염물질1

    NOxPot 오염물질2

    S02Pot 오염물질3

    city Mortality JanTemp JulyTemp RelHum Rain Education PopDensity NonWhite WC pop/house income HCPot NOxPot S02PotAkron, OH 921.87 27 71 59 36 11.4 3243 8.8 42.6 3.34 29560 21 15 59

    Albany-Schenectady-Troy, NY 997.87 23 72 57 35 11 4281 3.5 50.7 3.14 31458 8 10 39

    사망률

    (기후)

    1월기온(-)7월기온(+)상대습도(+)강우량(+)

    (사회경제)

    교육수준(-)인구밀도(+)비백인비율(+)WC 비율(+)가족수 (+?)소득(-)

    (환경)

    HCPot(+)NOcPot(+)SO2Pot(+)

  • (43)

    Linear Model | Spring 2013

    종속변수와 설명변수 분포가능하다면 좌우대칭 분포변수변환•우로 치우침 : x < ln(x) 설명변수 변환이상치/영향치 진단•잔차분석에서 가능

    설명변수간 산점도다중공선성 사전 진단

    상관계수•변수간 선형관계 정도 숫자값

    Chapter 4. Multiple Regression 순서1. 산점도행렬&분포함수

  • (44)

    Linear Model | Spring 2013

    Chapter 4. Multiple Regression 순서1. 산점도행렬&분포함수 (그리기)

    car 패키지 활용“|city”는 범주형 변수의 구별

    변수변환우로 치우침 : 비백인비율, 소득좌로 치우침 : 교육수준

    각 측정형변수가 정규분포 변환이필요하면 변환 후 이를 설명변수로사용한다.

  • (45)

    Linear Model | Spring 2013

    Chapter 4. Multiple Regression 순서1. 상관계수 분석

    정규분포 변환 후 사용•회귀분석 내 모든 변수는 좌우대칭 필요

    변수간 Pearson 상관계수•종속변수에 유의한 영향을 미치는설명변인 사전 검색, 물론 개별적 영향을준다고 전체 모형에서 유의한 것은아니다. (유의수준 20%, 다소 충분하게)

    •유의한 설명변수 부호 연구모형도 부호와비교함. 상이하면 데이터 수집 및 이론재검증

    •설명변수 간 유의한 상관 : 다중공선성사전 진단

  • (46)

    Linear Model | Spring 2013

    Chapter 4. Multiple Regression 순서1. 상관계수 결과

    유의한 설명변수 상관계수 부호 구성도와 일치

  • (47)

    Linear Model | Spring 2013

    Chapter 4. Multiple Regression 순서1. 선형관계 진단

    선형성이 위반되는설명변수가 보이지 않음

    46-1