63
Drvier Telematics Analysis kaggle competition All rights reserved by BOAZ 3 rd HYM. 텔레마틱스 데이터를 이용한 운전자 프로필 생성

[분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

Embed Size (px)

Citation preview

Page 1: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

Drvier Telematics Analysis

kaggle competition

All rights reserved by BOAZ 3rd HYM.

텔레마틱스데이터를이용한운전자프로필생성

Page 2: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

All rights reserved by BOAZ 3rd HYM.

Page 3: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

3.1. 분석 목적 3.3. 분석 기획

3.2. 데이터 설명 3.4. 분석

Driver Telematics

Analysis

Conclusion

All rights reserved by BOAZ 3rd HYM.

Page 4: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM 대회 소개

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Page 5: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

“Use Telematics Data to Identify a Driver Signature”

+

대회 주제

Page 6: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM 텔레마틱스

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Page 7: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

텔레마틱스

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

GPS데이터 생성 / 전송 데이터 저장

데이터정규화 & 분석 분

석결과

전송

고객화서비스 제공

상용화

BOAZ HYM

Page 8: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Usage-Based Insurance (운전습관연계보험)

운전자의나이, 성별, 운전경력등이아닌

운전자의운전성향을텔레마틱스를활용하여측정

UBI

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Page 9: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

2736명 운전자와 그들의 각각 200개의 경로

운전자 개개인의 특성을 반영시킬 수 있는 프로필 생성

Prob=1Prob=0

분석 목적

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Page 10: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM 제공 데이터

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1

2

3

.

.

10

20

.

180

189

X

0

-12.4

-25.9

.

.

-118.7

-255.5

.

-960.8

-962.0

Y

0

-4.2

-8.8

.

.

-48.3

-53.1

.

-308.4

-308.8

(0,0)

Page 11: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1

2

3

.

.

10

20

.

180

189

X

0

-12.4

-25.9

.

.

-118.7

-255.5

.

-960.8

-962.0

Y

0

-4.2

-8.8

.

.

-48.3

-53.1

.

-308.4

-308.8

제공 데이터

Page 12: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1

2

3

.

.

10

20

.

180

189

X

0

-12.4

-25.9

.

.

-118.7

-255.5

.

-960.8

-962.0

Y

0

-4.2

-8.8

.

.

-48.3

-53.1

.

-308.4

-308.8

제공 데이터

Page 13: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1

2

3

.

.

10

20

.

180

189

X

0

-12.4

-25.9

.

.

-118.7

-255.5

.

-960.8

-962.0

Y

0

-4.2

-8.8

.

.

-48.3

-53.1

.

-308.4

-308.8

제공 데이터

Page 14: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1

2

3

.

.

10

20

.

180

189

X

0

-12.4

-25.9

.

.

-118.7

-255.5

.

-960.8

-962.0

Y

0

-4.2

-8.8

.

.

-48.3

-53.1

.

-308.4

-308.8

제공 데이터

Page 15: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1

2

3

.

.

10

20

.

180

189

X

0

-12.4

-25.9

.

.

-118.7

-255.5

.

-960.8

-962.0

Y

0

-4.2

-8.8

.

.

-48.3

-53.1

.

-308.4

-308.8

제공 데이터

Page 16: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

1개 경로 1명 운전자 = 200개 경로

200 경로 X 2736 운전자= 총 547,200 개 data frame 존재

제공 데이터

Page 17: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Prob=1Prob=0

제공 데이터

1명 운전자 = 200개 경로

Page 18: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

분석 기획

기존과는 다른 형태의 데이터(2차원 좌표 데이터)

Page 19: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

분석 기획

기존과는 다른 형태의 데이터(2차원 좌표 데이터)

지도를 활용하여 같은 운전자를 찾아보자!

Geometry Matching

Page 20: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

분석 기획

운전자의 운전 성향을 더 구체적으로 파악할 수 있을까?

기존과는 다른 형태의 데이터(2차원 좌표 데이터)

지도를 활용하여 같은 운전자를 찾아보자!

Geometry Matching

Page 21: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

분석 기획

기존과는 다른 형태의 데이터(2차원 좌표 데이터)

지도를 활용하여 같은 운전자를 찾아보자!

파생변수를 생성하여 모델링을 해보자!

Driver Modelling

Geometry Matching

운전자의 운전 성향을 더 구체적으로 파악할 수 있을까?

Page 22: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching

분석 기획

Driver Modelling

여행 경로회전

데이터분할

경로 비교

파생변수생성

모델링

Page 23: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

Original trips

Page 24: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

Original trips

출발점

출발점과 도착점이x축에 위치하도록 회전

Page 25: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

Original trips Rotated trips

출발점과 도착점이x축에 위치하도록 회전

Page 26: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

Original trips Rotated trips

Page 27: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

Original trips Rotated trips

Page 28: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

최대 X축 길이

최대

길이

Y

Page 29: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

유사점수

기준선으로부터 가까워질수록유사점수가 낮다

즉, 경로패턴이 유사하다

X 1.2

X 0.8

유사경로 구간

Page 30: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

유사점수 0.0경로 154 & 171

Page 31: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

유사점수 0.1경로 31 & 58

Page 32: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

유사점수 0.2경로 31 & 152

Page 33: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

유사점수 0.3경로 96 & 165

Page 34: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

유사 점수가0.1 이하일 때유사 경로패턴

Page 35: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

Page 36: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

이상치유사경로로 분류되지 않은 그룹에서

유사패턴 발견

경로 비교만으로 운전자 지문을 판단할 수 없다 모델학습

Page 37: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Geometry Matching 여행 경로 회전 경로 비교

이상치유사경로로 분류되지 않은 그룹에서

유사패턴 발견

경로 비교만으로 운전자 지문을 판단할 수 없다 모델학습

Page 38: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

다른 운전자운전자 데이터

Page 39: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

다른 운전자운전자 데이터

경로매칭으로유사경로 선별

유사경로만큼샘플링

Page 40: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

TRAIN data

다른 운전자운전자 데이터

Prob=0Prob=1

경로매칭으로유사경로 선별

유사경로만큼샘플링

Page 41: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

TRAIN dataTEST data

다른 운전자운전자 데이터

Prob=0Prob=1

경로매칭으로유사경로 선별

유사경로만큼샘플링

Page 42: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

운전자의 특징을어떻게 나타낼 수 있을까?

Driver Modeling파생 변수 생성데이터 분할 모델링

1. 장거리인가? 단거리인가?

2. 고속도로인가? 국도인가?

3. 정지 또는 출발할 때 평균속력?급정지하는가? 급출발 하는가?

4. 커브를 돌 때 빠르게 도는가?

Page 43: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

운전자의 특징을어떻게 나타낼 수 있을까?

운전자의 특징을 나타내는파생변수 생성

이동시간 & 이동거리

구간 속력평균속력 & 최고속력

정지횟수총 정지시간 & 평균 정지시간

출발 평균 속력정지 평균 속력

커브 구간 평균속력커브 구간 평균가속도

Driver Modeling파생 변수 생성데이터 분할 모델링

1. 장거리인가? 단거리인가?

2. 고속도로인가? 국도인가?

3. 정지 또는 출발할 때 평균속력?급정지하는가? 급출발 하는가?

4. 커브를 돌 때 빠르게 도는가?

Page 44: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

총 이동 시간

1. 장거리인가? 단거리인가?

총 이동 거리

Driver Modeling파생 변수 생성데이터 분할 모델링

두 점 사이의 거리 = (𝑥𝑖−1 − 𝑥𝑖)2+ (𝑦𝑖−1 − 𝑦𝑖)

2

Page 45: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

평균 속력=1

(1𝑠1

+1𝑠2

+⋯+1𝑠𝑛

)

𝑛

JUMP?

조화평균을 통해 해결!

Driver Modeling파생 변수 생성데이터 분할 모델링

평균속력

2. 고속도로인가? 국도인가?

Page 46: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

각 구간별 평균속력

1 2 3 4

Driver Modeling파생 변수 생성데이터 분할 모델링

최고속력

2. 고속도로인가? 국도인가?

평균속력

Page 47: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

4초 이상정지한 경우

정지횟수

3. 정지 또는 출발할 때 속력? 급정지하는가? 급출발하는가?

총 정지시간평균 정지시간

출발평균속력정지평균속력

Page 48: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

커브 구간 평균 속력

커브 구간 평균 가속도

기울기가 변하는 구간

4. 커브를 돌 때 빠르게 도는가?

Page 49: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

이동시간 이동거리

구간 속력평균속력 최고속력

정지횟수총 정지시간

평균 정지시간

출발 평균 속력정지 평균 속력

커브 구간 평균속력커브 구간 평균가속도

지도학습 기법

앙상블 기법

X, Y 좌표

Raw data Variables Modeling

Page 50: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

변수선택 지도학습 기법 앙상블 기법

보루타

랜덤포레스트 분류기의반복학습으로

변수들 중 영향력 있는변수를 찾아내는

알고리즘.

Page 51: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

변수선택 지도학습 기법 앙상블 기법

로지스틱 회귀분석

나이브 베이즈

신경망

Page 52: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

변수선택 지도학습 기법 앙상블 기법

랜덤 포레스트

LASSO

GBM

Page 53: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

모델명Accuracy (train data -> valid data 예측)

driver1 driver2 driver3

로지스틱 0.661 0.9032 0.7647

나이브 베이즈 0.6271 0.8871 0.7647

신경망 0.7119 0.8548 0.7451

랜덤포레스트 0.8136 0.9355 0.8431

Lasso 0.661 0.9194 0.8325

GBM 0.7458 0.9355 .0.7255

모델평가

Page 54: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

Logit 72 125

NB 111 89

NNET 91 109

RF 70 130

Lasso 70 130

GBM 57 143

Page 55: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

Driver Modeling파생 변수 생성데이터 분할 모델링

Logit 0.70363

NB 0.69957

NNET 0.70547

RF 0.72897

Lasso 0.71301

GBM 0.71300

Page 56: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

지도매칭에서 유사경로로 분류되지 않은 경로가

최종 모델학습 결과 동일한 운전자의 경로로 분류되었다

Driver Modeling파생 변수 생성데이터 분할 모델링

Page 57: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

활용방안1 타입별 운전자 보험

Page 58: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

장거리 운전자

운전시간

속력

운전거리

정지시간

활용방안1 타입별 운전자 보험

Page 59: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

초보운전자

운전시간

속력

급출발

정지시간

활용방안1 타입별 운전자 보험

Page 60: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

속력

가속운전

급출발

급제동

위험운전자

활용방안1 타입별 운전자 보험

Page 61: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

운전시간

속력

운전거리

정지시간

안전운전자

활용방안1 타입별 운전자 보험

Page 62: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

BOAZ HYM

Driver Telematics

Analysis

Conclusion

분석기획

분석목적

데이터 설명

분석

GPS

계절적 조건

운전자 특성

타이어 특징

활용방안2 타이어 교체시기 알리미

GPS DATA

Page 63: [분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성

v

Thank You