Upload
fast-campus
View
243
Download
6
Embed Size (px)
Citation preview
2016 데이터 사이언스 스쿨
NBA 경기 결과 데이터로 선수 연봉 예측 연봉 상위 10% 선수 예측 모델
김 기 표
주제 선정 이유
김 기 표 김 기 표
주제 선정 이유
무엇을 기준으로 연봉이 결정?
예측도 가능할까?
김 기 표 김 기 표
추롞, 기술통계
개요
선수들이 받는 연봉에 경기 결과 데이터가 영향을 미칠 것이라고 가정
어떤 요소가 연봉에 영향을 미치는지 파악
김 기 표
예측, 탐구
목표:
연봉 순위 상위 10%인
30위권 선수 예측
3가지 모델로 나누어
성능 평가
개요
선수들이 받는 연봉에 경기 결과 데이터가 영향을 미칠 것이라고 가정
어떤 요소가 연봉에 영향을 미치는지 파악
추롞, 기술통계
김 기 표
데이터 출처 김 기 표
Training
데이터 출처 김 기 표
변수 제거법으로 3가지 경우를 나누어서 모델링
How to solve the problem?
1 모듞 Feature를 사용한 모델로 예측
2 PTS(평균 득점)만 사용한 모델로 예측
3 중요한 Feature로만 선택한 모델로 예측
김 기 표
1. 모듞 Feature를 사용한 모델로 예측 (독립변수 12개)
How to solve the problem? 김 기 표
1. 모듞 Feature를 사용한 모델로 예측 (독립변수 12개)
How to solve the problem?
18
김 기 표
2. PTS (경기당 평균 득점)만 사용한 모델로 예측 (독립변수 1개)
김 기 표 How to solve the problem?
15
김 기 표
2. PTS (경기당 평균 득점)만 사용한 모델로 예측 (독립변수 1개)
How to solve the problem?
3. 중요한 Feature로만 선택한 모델로 예측 (독립변수 6개)
How to solve the problem?
중요한 feature는?
PTS: 경기당 평균 득점
AGE: 나이
REB: 리바운드
W_PCT: 승률
AST: 어시스트
FG3_PCT: 3점슛 성공률
김 기 표
How to solve the problem?
18
3. 중요한 Feature로만 선택한 모델로 예측 (독립변수 6개)
김 기 표
분석 결과
활용가치?
저평가 되어 있는 선수들을 한눈에 볼 수 있다.
김 기 표
분석 결과
활용가치?
저평가 되어 있는 선수들을 한눈에 볼 수 있다.
36
3.7
5.6
16.3
33.3
3.3
11.5
26.9
34.8
4.1
11
16.5
45.4
6.7
5.4
30.1
3점슛 성공률(%)
어시스트(개)
리바운드(개)
경기당 득점률(점) Stephen CurryPau GasolDeMarcus CousinsTop3 Player
김 기 표
36
3.7
5.6
16.3
33.3
3.3
11.5
26.9
34.8
4.1
11
16.5
45.4
6.7
5.4
30.1
3점슛 성공률(%)
어시스트(개)
리바운드(개)
경기당 득점률(점) Stephen CurryPau GasolDeMarcus CousinsTop_3
PLAYER_NAME 예측 연봉 순위 실제 연봉 순위 실제 연봉(원)
Stephen Curry 1 71 135억
DeMarcus Cousins 2 36 189억
Pau Gasol 5 44 173억
Al Horford 33 1 295억
어려웠던 점
더 많은 feature들이 있었다면 성능 향상 예상
: 선수들 부상 여부, 중요 순간 활약도, 기록되지 않은 공헌도
전처리 과정
: 물가 상승의 영향 줄이기 위한 과정 => 매년 평균값 이용
: 어떤 변수들을 사용해야 하는지 찾는 과정
개선점
김 기 표
경청해주셔서 감 사 합 니 다
김 기 표