32
해외여행객의 발길을 ‘국내여행’으로 돌리기 위한 마케팅 전략 제시 SA241

해외여행객의 발길을 ‘국내여행’으로 돌리기 위한 마케팅 전략 제시 · Ⅰ.주제 선정 및 기획 분석 프로세스 분석주제 해외여행객의

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

해외여행객의 발길을 ‘국내여행’으로 돌리기 위한 마케팅 전략 제시

SA241

Contents 주제 선정 및 기획 데이터 전처리

타겟설정 타겟분석

Ⅰ Ⅱ

Ⅲ Ⅳ Ⅴ

추가분석 Ⅶ

결론 및 제언 본 분석의 결론을 내리고

제언을 하며 마무리 요약한다

분석 데이터를 생성한 후 데이터 탐색 단계를 거쳐

최적모형 구축을 위한 변환을 실시한다

최근 국내의 여행 현황을 살피고 본 분석의 주제 및

필요성과 방향성을 제시한다

타겟에 대해 로지스틱 회귀분석을 실시한다

여행객들을 비슷한 특성을가진 그룹으로 묶어

타겟을 설정한다

마케팅 전략

스코어 모형, 연관성 분석, 기대 수익 모형을

이용하여 마케팅 전략을 제시한다

기대효과

마케팅 전략을 실시했을 때 기대효과를 알아본다

여행한 지역에 대한 만족도를 히트맵(heatmap)을 이용하여 시각화한다

2

3

Ⅰ.주제 선정 및 기획 국내 여행 현황과 분석의 필요성

내국인의 해외여행으로의 발길을 국내여행으로 돌리는 노력 필요함

∙ 유가 하락 및 원화 강세로 인한 내국인의 해외여행 증가 ∙ 저가항공 프로모션으로 인한 내국인의 해외여행 증가 ∙ 메르스(중동호흡기증후군)로 인한 외국인 관광객의 국내여행 감소

국내 여행 현황

분석의 필요성

∙ 해외여행을 국내여행으로 돌릴 시 상당한 경제적 효과가 발생할 것으로 예상됨

∙ 9월에 실시될 유류할증료의 무료화와 함께 저가항공사들의 지속적 프로모션으로 인해 내국인의 해외여행이 크게 증가할 것으로 전망됨

Ⅰ.주제 선정 및 기획 분석 프로세스

분석주제 해외여행객의 발길을 ‘국내여행’으로 돌리기 위한 마케팅 전략 제시

분석목표 개인여행, 가구여행을 각 응답자의 특성에 따라 세분화하여

해외여행객을 국내여행으로 유치할 마케팅 전략 제시

분석전략 · 분석목표에 맞는 데이터 구축 및 파생변수 생성

→ 개인/가구여행을 각 응답자의 특성에 따라 세분화

→ 세분화 그룹 중 타겟 선정 후 타겟별 여행 특성 파악을 위한 모형 구축

→ 타겟에 맞는 마케팅 전략 제시

1. 스코어링을 기반으로 한 지역 추천 모형

2. 연관성 분석을 기반으로 한 경로 추천 모형

· 히트맵을 이용한 지역별 만족도 시각화

4

Ⅱ.데이터 전처리 분석데이터 생성

최근 여행 트렌드의 급격한 변화와 외부요인(유가 상승 등) 발생 해외/국내여행객의 특성 파악 및 국내여행으로 유치하는 마케팅 전략 구축을 위해서는 가장 최근 데이터(2014년)를

분석하는 것이 옳다고 판단 2014년 응답자(개인/가구) 특성 데이터와 2014년 통합 데이터(개인/가구)의 병합

5

(개인) 응답자 특성 데이터

2014년 설문지 조사 내용 6,537 건

(개인) 통합 데이터

2014년 응답자 개인 특성 기록 6,537 건

(가구) 응답자 특성 데이터

2014년 설문지 조사 내용 2,506 건

(가구) 통합 데이터

2014년 응답 가구 특성 기록 2,506 건

PID_14 = PID_14

HID_14 = HID_14

(개인) 병합 데이터

각각의 레코드 = 한 가구의 1년 동안의 총 여행 정보

총 2,506 가구에 대한 1년 간의 여행 정보 데이터

(가구) 병합 데이터

YEAR HID_14 TYPE1_1 TYPE1_2 … TYPE1_78 TYPE2_1 TYPE2_2 …

2014 10001 1 1 … . 1 2 …

2014 10002 1 5 … . 2 . …

각각의 레코드 = 한 가구원의 1년 동안의 총 여행 정보

총 6,537명 가구원에 대한 1년 간의 여행 정보 데이터

YEAR PID_14 GUBUN_1 GUBUN_2 … GUBUN_117 TYPE1_1 TYPE1_2 …

2014 1000101 1 1 … . 1 1 …

2014 1000102 1 1 … . 1 1 …

전 치

(개인) 전치 데이터

각각의 레코드 = 개인여행 정보 한 건

총 764,829 건의 개인여행 정보

YEAR PID_14 GUBUN TYPE1 MONTH …

2014 1000101 1 1 1 …

2014 1000101 1 1 8 …

… … … … …

2014 1000102 1 1 1 …

(가구) 전치 데이터

각각의 레코드 = 가구여행 정보 한 건

총 195,468 건의 가구여행 정보

YEAR HID_14 TYPE1 TYPE2 MONTH …

2014 10001 1 1 1 …

2014 10001 1 2 8 …

… … … … …

2014 10002 1 2 8 …

Ⅱ.데이터 전처리 최적 모형 구축을 위한 변환

6

① 국내 및 해외 개인여행객의 특성 차이에 대한 올바른 파악 위해 2010년~2013년의 응답자 특성 변수 제거

② 국내여행 및 해외여행 파악할 수 없는 여행 정보는 제거 (Q6_1 = . 그리고 TYPE1 = . )

③ 여행 주 목적이 가족/친지 방문, 교육, 사업인 경우는 분석에서 제외 (Q3 = 4 또는 7 또는 8)

④ 파생 변수 “ OUTBOUND ” 생성 (1 : 해외여행, 0 : 국내여행)

◈ 생성 방법

· 해외여행으로 기입되어있음에도 불구하고 국가 코드가 국내인 경우 → 분석에서 제외 (TYPE1 = 2 그리고 Q6_1 > 900)

· 국내여행으로 기입되어있음에도 불구하고 국가 코드가 해외인 경우 → 분석에서 제외 (TYPE1 ^= 2 그리고 Q6_1 < 900)

· 나머지 중 해외여행으로 기입되어있거나 국가 코드가 해외인 경우 → 해외여행으로 간주 (TYPE 1 = 2 또는 Q6_1 < 900 → OUTBOUND = 1)

· 그 외 → 국내여행으로 간주 (ELSE OUTBOUND = 0)

개인

GUBUN = 1 인 경우 가구여행 GUBUN = 2 인 경우 개인여행

(개인) ④에서 생성된 데이터

개인여행 정보 & 가구여행 정보

6,770 건

(개인) 개인여행 정보

11,420 건

(개인) 가구여행 정보

가구

11,420 건

(개인) 가구여행 정보 (가구) ④에서 생성된 데이터

5,244 건

HID_14 = HID_14 MONTH = MONTH COUNT = COUNT TYPE1 = TYPE1

(가구) ④에서 생성된 데이터

5,244 건

Ⅱ.데이터 전처리 최적 모형 구축을 위한 변환

7

가구

한번의 가구여행마다 최대 6명의 동거 가구원 동행

현재 데이터에는 가구 특성 정보만 있을 뿐 동행 가구원의 개인 특성 정보는 존재 하지 않음

개인 특성 정보 병합 시 보다 체계적인 가구여행 특징 파악 가능 예) 50대 남성 & 80대 남성 함께 여행 → 부자(父子)

(가구) ④에서 생성된 데이터

YEAR HID_14 PSID_1 PSID_2 … PSID_6 …

2014 10001 1000101 1000102 … . …

2014 10001 1000101 1000102 … . …

… … … … . …

2014 10002 1000202 1000201 … . …

(개인) 응답자 특성 데이터

응답자 개인 특성 기록 중 2014년 정보

개인 특성 정보 중 성별, 나이, 결혼 정보에 대한 내용만 병합

총 18개의 개인 특성 정보를 나타내는 변수가 생김 즉, 각 가구여행별로 동행한 가구원들의 정보를 의미하는 변수가 생김

SEX14_PSID1 (PSID1의 성별) … SEX14_PSID6 (PSID6의 성별) AGE14_PSID1 (PSID1의 나이) … AGE14_PSID6 (PSID6의 나이)

MARRY14_PSID1 (PSID1의 결혼 정보) … MARRY14_PSID6 (PSID6의 결혼 정보)

하지만 이 18개의 변수는 분석을 하는데 용이한 변수 형태는 아님

개인 응답자 특성 병합 데이터

YEAR HID_14 PSID_1 … PSID_6 SEX14_

PSID1 …

SEX14_

PSID6

AGE14_

PSID1 …

AGE14_

PSID6

MARRY14_

PSID1 …

MARRY14_

PSID6

2014 10001 1000101 … . 1 … . 37 … . 2 … .

2014 10001 1000101 … . 1 … . 37 … . 2 … .

… … … … … … … … … … … … … …

HID_14 PID_14 SEX_14 AGE_14 MARRY_14 …

10001 1000101 1 37 2 ….

10001 1000102 2 37 2 …

… … … … … …

PSID_1 = PID_14 PSID_2 = PID_14

… PSID_6 = PID_14

병 합

Ⅱ.데이터 전처리 최적 모형 구축을 위한 변환

8

가구

현재 변수의 형태는 분석에 용이한 형태가 아님 가변수를 이용해 카테고리별 포함 여부를 나타냄

개인 응답자 특성 병합 데이터

... PSID_1 … PSID_6 SEX14_

PSID1 …

SEX14_

PSID6

AGE14_

PSID1 …

AGE14_

PSID6

MARRY14_

PSID1 …

MARRY14_

PSID6

… 1000101 … . 1 … . 37 … . 2 … .

… 1000101 … . 1 … . 37 … . 2 … .

… … … … … … … … … … … … …

총 84개의 개인 특성 정보에 대한 가변수가 생성

SEXM_1 (1 : PSID1 남성, 0 : 여성) … SEXM_6 (1 : PSID6 남성, 0 : 여성) AGE10_1 (1 : PSID1 10대, 0 : 10대 아님) … AGE90_6 (1 : PSID6 90대, 0 : 90대 아님)

MARRY1_1 (1 : PSID1 미혼, 0 : 미혼 아님) … MARRY4_6 (1 : PSID6 이혼, 0 : 이혼 아님)

개인 응답자 특성 가변수화 데이터

... PSID_1 … PSID_6 SEXM_1 … SEXM_6 AGE10_1 … AGE90_6 MARRY1_1 … MARRY4_6

… 1000101 … . 1 … . 0 … . 0 … .

… 1000101 … . 1 … . 0 … . 0 … .

… … … … … … … … … … … … …

가 변 수 화

총 30개의 개인 특성 정보 각 범주별 빈도 및 비율을 나타내는 변수가 생성

MALE_COUNT (동행 가구원 중 남성의 수) … MALE_RATIO (남성의 비율) FEMALE_COUNT (동행 가구원 중 여성의 수) … FEMALE_RATIO (여성의 비율)

AGE10_COUNT (동행 가구원 중 10대의 수) … AGE90_COUNT (90대의 수) AGE10_RATIO (동행 가구원 중 10대의 비율) … AGE90_RATIO (90대의 비율)

MARRY1_COUNT (동행 가구원 중 미혼자의 수) … MARRY4_COUNT (이혼자의 수) MARRY1_RATIO (동행 가구원 중 미혼자의 비율) … MARRY4_RATIO (이혼자의 비율)

개인 응답자 특성 최종 데이터

.. PSID_1 … MALE_

COUNT

MALE_

RATIO …

AGE10_

COUNT

AGE10_

RATIO …

MARRY1_

COUNT

MARRY1_

RATIO …

… 1000101 … 1 0.5 … 0 0 … 0 0 …

… 1000101 … 1 0.5 … 0 0 … 0 0 …

… … … … … … … … … … … … 범주별

빈도 &

비율

Ⅲ.타겟설정 군집분석

∙ 각각의 개인여행을 응답자 특성 변수인 성별(SEX_14), 연령대(AGEGROUP), 결혼 정보(MARRY_14)를 이용해 k-means 군집분석 실시

※ k-means : 비계층적 군집분석으로 초기 군집형성 이후에도 이합집산과정 되풀이 함

∙ R 패키지 ‘fpc’를 이용하여 구한 최적 군집개수는 8개이며, 8개의 개인여행 군집으로 세분화 함

∙ 군집분석 : 데이터 간의 유사성에 근거하여 유사한 집단으로 그룹화하는 다변량 분석 기법

군집분석을 통해 유사한 개인여행객들로 세분화시킨 뒤 타겟 설정 후 타겟별 맞춤 마케팅 전략을 제시

∙ 가구여행의 경우, 가구 특성 변수의 부족으로 군집분석을 실시하기에 적합하지 않다고 판단

→ 가구여행 중 해외여행 빈도가 높은 여행의 특징을 해당 가구여행에 동참한 가구원들의 특성 변수인 나이, 성별, 결혼 정보, 동참한 가구원 수로 역추적

∙ 역추적 결과 부부 가구여행이 타겟이 됨

※ 부부 가구여행 : 가구여행에 동참한 가구원들의 특성 파생변수인 여성 비율(FEMALE_RATIO) 값이 0.5, 기혼자 비율(MARRY2_RATIO) 값이 1, 동참한 세 번째 가구원의

고유번호(PSID_3) 값이 결측값으로 가구여행에 동참한 가구원 수가 2명, 가구여행에 동참한 두 가구원의 나이차의 절댓값(ABS(AGEDIFF))이

10 이하의 값을 가지는 여행으로 정의

가구

개인

9

Ⅲ.타겟설정 개인군집분석

1번 군집 (95) 2번 군집 (84) 3번 군집 (405)

여성

남성

30대 40대 80대 90대

미혼 배우자 있음

사별 이혼

•여성 99% •30대 100% •배우자 있음 95% 이혼 5%

•남성 44% 여성 56% •80대 94% 90대 6% •배우자 있음 42% 사별 58%

•남성 39% 여성 61% •40대 100% •미혼 5% 배우자 있음 88% 사별 2% 이혼 5%

8번 군집 (192)

•남성 70% 여성 30% •30대 100% •미혼 78% 배우자 있음 22%

10

Ⅳ.타겟분석 모형 적합 변수 설명

해외여행객과 국내여행객의 특성 파악을 위한 로지스틱 모형을 적합시키기 이전에 보다 효과적인 모형 구축을 위해서는 변수를 선택하는 것이 필요함

때문에 변수들 사이에 상관 관계가 높거나 개인에게 부여된 고유 번호(예 : HID_14, PID_14), 특정 시간을 나타내는 변수(예 : YEAR)와 설명력이 겹치는 변수(예 : 여행 날짜 및 일 수와 관련 Q2_A, Q2_A_1,

Q2_A_2, Q2_B, Q2_B_1, Q2_B_2 등), 국내와 해외의 특성을 구분 짓는 변수(예 : 국내 지역 코드 및 해외 국가 코드, 이동 수단 등 Q6_1, Q6_1_1 – Q6_1_8, Q6_3), 마지막으로 여행을 가기 이전에는 파악할 수

없는 변수(예 : 전반적 만족도, 항목별 만족도, 총 지출액, 항목별 지출액, 재방문 의향 등 Q6_6, Q6_7 등)를 제거

변수명 변수 역할 변수 형태 변수 설명 비고 구분

OUTBOUND TARGET BINARY 해외여행 여부 (1 : 해외여행객 0 : 국내여행객) 개인 & 가구

CLU_1 – CLU_7 INPUT BINARY 해당 군집 (1 : 해당 군집에 포함 0 : 해당 군집 비포함) CLU를 가변수화 (8번 군집 베이스) 개인

MONTH_1 – MONTH_11 INPUT BINARY 여행 월 (1 : 해당 범주에 포함 0 : 해당 범주 비포함) MONTH를 가변수화 (12월 베이스) 개인 & 가구

Q2_C_2 INPUT INTERVAL 여행 일 개인 & 가구

Q2_1_1 – Q2_1_4 INPUT BINARY 여행 시기 (1 : 해당 범주에 포함 0 : 해당 범주 비포함) 코딩만 1, 0으로 바꿔줌(Q2_1_5 제거 베이스) 개인 & 가구

Q3_1 – Q3_3 / Q3_6 INPUT BINARY 여행 주 목적 (1 : 해당 범주에 포함 0 : 해당 범주 비포함) Q3의 (1, 2, 3, 6) 범주 가변수화 개인 & 가구

Q5_1 INPUT INTERVAL 동행 일행 수 개인 & 가구

Q5_2_1 – Q5_2_5 INPUT BINARY 동행 일행 유형 (1 : 해당 범주에 포함 0 : 해당 범주 비포함) 코딩만 1, 0으로 바꿔줌 (Q5_2_6 제거 베이스) 개인

SEX14_M INPUT BINARY 남성 여부 (1 : 남성 0 : 여성) SEX_14 코딩 바꿈 개인

AGEGROUP_10 – AGEGROUP_80 INPUT BINARY 연령대 (1 : 해당 범주에 포함 0 : 해당 범주에 비포함) AGEGROUP을 가변수화 (90대 베이스) 개인

Q10_1_1 - Q10_1_5 INPUT BINARY 전체패키지 및 부분패키지 종류 (1 : 해당 범주에 포함 0 : 해당 범주 비포함) Q10_1과 Q10_1_1 합침 (패키지 미사용자 베이스)

Q10_1_5 =1 전체패키지 이용 개인 & 가구

Q5_A INPUT INTERVAL 동거 가족 및 친척 중 동행자 수 가구

Q5_B INPUT INTERVAL 비동거 가족 및 친척 중 동행자 수 가구

Q5_C INPUT INTERVAL 그 외의 동행자 수 가구

로지스틱 모형

11

Ⅳ.타겟분석 개인 로지스틱 회귀분석 ①

∙ 대상 : 전체 개인여행 데이터

∙ 종속변수 : 해외여행(1)/국내여행(0) 여부를 나타내는 파생변수(OUTBOUND)

∙ 독립변수 : 군집변수 8개

∙ 목적 : 8개의 군집들 중 개인의 해외여행 가능성이 높은 군집 파악

Parameter Label Estimate Standard Error

Intercept -2.5649 0.1961

CLU_1 1 : 1번 군집 -0.7309 0.4320 .

CLU_2 1 : 2번 군집 -1.5568 0.6142 .

CLU_3 1 : 3번 군집 -0.2721 0.2479

CLU_4 1 : 4번 군집 -0.1774 0.2342

CLU_5 1 : 5번 군집 -1.6604 0.3741 ***

CLU_6 1 : 6번 군집 -0.0674 0.2297

CLU_7 1 : 7번 군집 -0.4274 0.2497

BASE : 8

∙ 8번 군집에 속했을 때, 그렇지 않은 경우보다 해외여행을 갈 오즈비가 대체적으로 높다

∙ 8번 군집에 속했을 때, 2번 군집에 속한 경우보다 해외여행을 갈 오즈비가 1

0.211= 4.74 배이다

∙ 8번 군집에 속했을 때, 5번 군집에 속한 경우보다 해외여행을 갈 오즈비가 1

0.190= 5.26 배이다

결과 해석

12

significance code : 0 '***' 0.001 '**' 0.01 '*' 0.05 '.'

Ⅳ.타겟분석 개인 로지스틱 회귀분석 ②

∙ 대상 : ①의 결과, 해외여행을 많이 가는 8번 군집의 개인여행 데이터

∙ 종속변수 : 해외여행(1)/국내여행(0) 여부를 나타내는 파생변수(OUTBOUND)

∙ 독립변수 : 앞서 설명한 독립변수(구분 : 개인)로 로지스틱 회귀분석 실시

∙ 목적 : 앞서 설명한 독립변수(구분 : 개인) 중 8번 군집에 속한 개인의 해외여행과 국내여행에 유의한 차이를 주는 변수들 파악

※ 단계별 선택법에 의해 변수 선택

Parameter Label Estimate Standard Error

Intercept 3.6268 2.0718

Q10_1_1 1 : 부분 패키지 상품 _ 교통 -4.2139 1.4930 *

Q10_1_5 1 : 전체패키지 상품 -5.155 1.4764 **

Q2_C_2 여행 일 0.5208 0.2080 .

◼ 의사결정 트리 ◼ 회귀 ◼ 기준선

∙ 부분 패키지 상품_교통을 이용할 때, 그렇지 않은 경우보다 해외여행을 갈 오즈비가 1

0.015= 66.67 배이다

∙ 전체 패키지 상품을 이용할 때, 그렇지 않은 경우보다 해외여행을 갈 오즈비가 1

0.006= 166.67 배이다

로지스틱 회귀모형의 곡선 아래 면적이 넓어 모형이 잘 적합하였다고 판단

BASE : 1

결과 해석

13

∙ ROC 곡선

significance code : 0 '***' 0.001 '**' 0.01 '*' 0.05 '.'

Ⅳ.타겟분석 가구 로지스틱 회귀분석

∙ 대상 : 부부 가구여행 데이터

∙ 종속변수 : 해외여행(1)/국내여행(0) 여부를 나타내는 파생변수(OUTBOUND)

∙ 독립변수 : 앞서 설명한 독립변수(구분 : 가구)

∙ 목적 : 앞서 설명한 독립변수(구분 : 가구) 중 부부의 해외여행과 국내여행에 유의한 차이를 주는 변수들 파악

※ 단계별 선택법에 의해 변수 선택

Parameter Label Estimate Standard Error

Intercept -0.4822 0.5245

Q2_1_2 1 : 여행시기 _ 주말 -3.2320 1.0340 *

Q5_A 동반자 수 _ 동거 가족이나 친척 -0.9614 0.3491 *

∙ 주말에 여행할 때, 그렇지 않은 경우보다 해외여행을 갈 오즈비가 1

0.039= 25.64 배이다

∙ 동반자 수_동거 가족이나 친척이 한명 증가할 때마다, 해외여행을 갈 오즈비가 0.382 배이다

결과 해석

◼ 회귀 ◼ 기준선

BASE : 1

14

∙ ROC 곡선

significance code : 0 '***' 0.001 '**' 0.01 '*' 0.05 '.'

Ⅴ.마케팅 전략 마케팅 전략

30대 싱글 남/녀를 위한 마케팅 전략

∙ 개인여행의 타겟인 8번 군집을 대상으로 로지스틱 회귀분석 결과,

① 전체패키지를 이용할수록 해외여행 많이 가는 경향이 있음

② 부분패키지_교통을 이용할수록 해외여행 많이 가는 경향이 있음

∙ 개인여행의 타겟인 8번 군집을 대상으로 역추적 분석 결과,

① 여행 목적이 여가/위락/휴가인 비율이 85.7%를 차지

② 주 국내여행지는 강원, 경기, 경북, 경남으로 나타남

③ 구성원 모두 고등학교 이상의 학력을 보유하고 있으며, 대학교 이상의

학력을 보유한 비율이 90.5%를 차지

④ 12월 여행을 가장 많이 갔으며, 주로 하반기 여행이 많음

1. 일주일에 하루쯤은 쉬어도 괜찮아

∙ 바쁘고 힘든 직장생활에 지쳐 여행 한 번 제대로 갈 수 없는

30대 싱글 남/녀를 대상으로 한 힐링 여행 패키지

∙ 여가/위락/휴가를 주목적으로 하여 도심 속을 벗어나 매주

다른 지역을 방문

∙ 스트레스 해소를 위한 심리상담 및 결혼 적령기인 미혼

남/녀를 위한 커플매칭 이벤트 제공

2. 교통 한번에 페이지

∙ 교통에 민감한 30대 싱글 남/녀를 잡기 위해서는 체계적인

교통 서비스를 제공하는 것이 중요

∙ 특히 장기 여행이 적은 이 타겟의 경우 짧은 시간 안에

이들이 만족할 만한 신호를 보내야 함

∙ 그 중 하나의 방법으로 다 구간 여행을 갈 때에 본인에게 편한

교통을 이용할 수 있도록 해 주는 “교통 한번에 페이지”를

제공 (날짜/휴일 특성에 따라 예상되는 교통량 제공 및

기차 시간표, 차 렌트 업체 가격비교 서비스 등을 제공)

15

Ⅴ.마케팅 전략 마케팅 전략

부부를 위한 국내여행 마케팅 전략

∙ 가구여행의 타겟인 부부여행을 대상으로 로지스틱 회귀분석 결과,

① 주말에 여행을 갈수록 해외여행 많이 가는 경향이 있음

② 동거 가족 및 친척 동행자 수가 적을수록 해외여행 많이 가는 경향이 있음

∙ 가구여행의 타겟인 부부여행을 대상으로 역추적 분석 결과,

① 가구내 가구원 수가 3명 이상인 가구여행 건수가 71.8%를 차지

→ 자녀가 있는 부부

② 여행 달이 주로 7월(12.3%), 9월(14.1%), 10월(10.4%)에 분포

→ 9월, 10월이 비성수기임을 감안했을 때 9월 10월 계절 특성에 민감히 반응

③ 타겟 약 87.12%의 나이가 50세 이상 & 서울시 평균 은퇴 나이는 52.6세

→ 은퇴한 부부의 여행

④ 국내여행을 한 경우

경기(15.46%), 강원(12.78%), 경남(11.21%), 충남(10.61%)

1. 리마인드 웨딩 & 허니문

∙ 비성수기(9월, 10월)에 주로 여행을 가는 것으로

미루어 볼 때 숙박비 및 기타 활동비가 저렴할 것으로 예상

∙ 부부가 자녀에게서 벗어나 오롯이 둘만의 시간을

보낼 수 있도록 교통과 럭셔리 숙박을 제공하는

전체 패키지 또는 부분 패키지 상품을 개발 및 제공

2. 추남(秋男)&추녀(秋女)의 낭만을 찾아서

∙ 주로 여행한 지역이 경기, 강원, 경남, 충남이라는 것과

2014년 단풍 시작 시기와 절정 시기를 조사한 결과(아래 표)를 참고하면

이 타겟의 경우 부부가 함께 단풍 절정기에 맞추어 여행을 다닐 가능성이

높을 것이라 예상

∙ 단풍 절정기에 맞추어 중/장년 부부를 타겟으로 한

“단풍 낭만 패키지 여행”을 계획

∙ 인기 높은 경기, 강원, 경남, 충남 지역 뿐 아니라 단풍 시기가 다소 늦은

전남(두륜산), 제주(한라산)를 인기 지역과 함께 패키지 상품으로 제공

산 시/도 첫단풍 절정기

금강산 강원도 09.26 10.16

설악산 강원도 09.28 10.18

오대산 강원도 10.03 10.19

북한산 경기도 10.15 10.28

치악산 강원도 10.08 10.25

… … … …

두륜산 전남 10.27 11.11

2014년 단풍 정보 – 기상청 출처

16

Ⅴ.마케팅 전략 스코어 모형

• 본 팀은 각 타겟의 해외여행 니즈를 대체할 만한 국내여행지를 추천해주기 위해 기존 여행 특성 변수 중 여행 선택 순위에 해당하는 1순위(Q6_2_A), 2순위(Q6_2_B), 3순위(Q6_2_C)와 항목별 만족도 점수의

각 범주를 만족도(Q_12_1 - Q_12_12)와 매칭시켜 각 지역별로 항목별 점수화를 시키고자 했지만 여행 선택 순위(Q6_2_A - Q6_2_C)의 모든 항목이 “항목별 만족도(Q12_1-Q12_12)”와 100% 일치하는

것이 아니므로 아래 표에 있는 1:1 매칭되는 항목들에 대해서만 점수화 하기로 함

개인 & 가구

17

(Q6_2-3) 저렴한 여행경비 •

(Q6_2-6) 숙박시설 •

(Q6_2-8) 쇼핑 •

(Q6_2-9) 음식 •

(Q6_2-10) 교통편 •

(Q6_2-11) 체험프로그램 유무 •

(Q6_2-13) 관광지 편의시설 •

(Q6_2-1) 여행지 지명도 •

(Q6_2-2) 다양한 볼거리 •

(Q6_2-4) 이동거리 •

(Q6_2-5) 여행할 수 있는 시간 •

(Q6_2-7) 여행동반자 유형 •

(Q6_2-12) 경험자의 추천 •

(Q6_2-14) 교육성 •

(Q6_2-15) 기타 •

• 관광지 물가 (Q_12_11)

• 숙박시설 (Q_12_4)

• 쇼핑 (Q_12_6)

• 식당 및 음식 (Q_12_5)

• 교통 (Q_12_3)

• 체험프로그램 (Q_12_10)

• 관광지 편의시설 (Q_12_8)

• 자연경관 (Q_12_1)

• 문화유산 (Q_12_2)

• 관광정보 및 안내시설 (Q_12_7)

• 지역 관광종사자의 친절성 (Q_12_9)

•관광지 혼잡도 (Q_12_12)

Ⅴ.마케팅 전략 스코어 모형

• 예를 들어 임의의 개인의 한 여행 정보가 다음과 같다면

• 또한 본 팀이 스코어링 모형을 기반으로 각 군집에 속하는 타겟들에게 올바른 여행지를 추천해주는 것에 그치지 않고, 이에 만족한 타겟이 그 지역을 실제로 방문할 경우 발생하는 기대 수익을 산출하기 위해

17개의 지역별로 여행 총 지출 비용(Q7_C)의 합을 여행 일(Q2_C_2)의 합으로 나누어 하루 당 총 지출 비용을 나타내는 “EXPECVALUE”라는 변수를 만듦

Q6_2_A Q6_2_B Q6_2_C

3 (관광물가) 5 10 (교통)

REASON1 REASON2 REASON3

3 . 10

Q12_1 Q12_2 Q12_3 Q12_4 Q12_5 Q12_6 Q12_7 Q12_8 Q12_9 Q12_10 Q12_11 Q12_12

3 3 3 5 4 2 1 2 3 3 4 5

SCORE1 SCORE2 SCORE3

4 (3번 항목) . 3 (10번 항목)

R_3 R_6 R_8 R_9 R_10 R_11 R_13

1 0 0 0 1 0 0

S_3 S_6 S_8 S_9 S_10 S_11 S_13

4 . . . 3 . .

Q6_2_B = 5 이기 때문에 이에 대응하는 REASON2는 결측(=.)

“관광지물가 만족도” “교통 만족도”

개인 & 가구

18

물가 (S_CHEAP)

숙박 (S_SLEEP)

쇼핑 (S_SHOP)

음식 (S_FOOD)

교통(S_TRAFFIC)

체험프로그램(S_EXP)

관광지편의시설(S_CONV)

4.24 4 3.2 2.99 3 3.1 3.8

Ⅴ.마케팅 전략 지역 추천 모형 _ 스코어 결과

교통 숙박시설 식당 및 음식 쇼핑 관광지 편의시설 체험프로그램 관광지 물가

서울 3.57 _ 4 3.5 3 _ 3.6

부산 4.5 5 4 5 4 3 3.5

대구 4.33 _ 4 _ _ 3

인천 4 5 4 _ _ 4 3.33

광주 4 _ _ _ _ _ _

대전 _ _ _ _ _ _ 4

울산 _ _ _ _ _ _ _

세종 _ _ _ _ _ 4 _

경기 4 4.33 4 4 3 4 3.43

강원 3.8 4.25 3.43 _ 4.57 4 3

충북 4 _ 4 _ _ 4 3.33

충남 4 _ 3 _ _ 4 4

전북 _ 4.5 4.5 _ 4.67 4 4

전남 3 4 4.25 _ _ _ 3.67

경북 4 5 3.8 _ 3 _ 3.63

경남 4.5 _ 4.25 5 4 3.67 4

제주 _ 4 4 _ 4.5 _ 4

교통 숙박시설 식당 및 음식 쇼핑 관광지 편의시설 체험프로그램 관광지 물가

서울 3.83 4 4.25 3.97 4 4.10 3.48

부산 4.07 4.46 3.97 3.86 4 3.75 3.30

대구 3.93 4 4.07 3.67 4 _ 3.43

인천 4.17 4.33 3.88 4 3 3.83 3.28

광주 4.13 4 3.6 _ 4 4.25 3.75

대전 3.73 4 3.71 4.5 4.25 4 3.75

울산 3.5 _ 4 _ 4 4 3.41

세종 4.5 _ _ _ 4 4 4

경기 4.04 3.83 4.15 4.08 4 4.24 3.46

강원 4.09 4.33 3.98 3.83 4.15 4.04 3.44

충북 4 4.14 3.8 _ 3.75 3.89 3.54

충남 3.85 4.11 4.04 4.83 3.73 3.79 3.65

전북 4.18 4.29 4.12 3.33 4.2 4.10 3.66

전남 3.96 3.83 4.39 4.17 3.94 4.09 3.72

경북 4.05 4.21 3.96 4.25 4 4.11 3.70

경남 4.24 4.1 3.97 4.2 3.89 3.92 3.72

제주 4.4 4 4.15 _ 4.38 3.75 3.46

∙ 8번 군집 ∙ 전체 (단위 : 만족도 점수) (단위 : 만족도 점수)

※ 해당지역의 만족도 점수를 평가한 여행객이 없을 시 결측값으로 처리

19

Ⅴ.마케팅 전략 지역 추천 모형 _ 스코어 예시

33살 미혼 남성 김여행씨 8번 군집

여행지 선택이유 3가지 : 관광지 편의시설

음식

숙박시설

관광지 편의시설 음식 숙박시설 관광지 물가 … 이유 3가지 평균

부산 4 3.43 5 3.5 … 4.33

경기 3 4 4.33 3.43 … 3.78

강원 4.57 3.43 4.25 3 … 4.08

전북 4.67 4.5 4.5 4 … 4.56

경북 3 3.8 5 3.63 … 3.93

제주 4.5 4 4 4 … 4.17

… … … … … … …

관광지 편의시설 추천 여행지 : 전북

음식 추천 여행지 : 전북

숙박시설 추천 여행지 : 부산, 경북

전반적 추천 여행지 : 전북

(단위 : 만족도 점수)

20

Ⅴ.마케팅 전략

지역 추천 모형 _ 서비스 페이지 구축

N 포털사이트 – N 여행 N 포털 사이트 – N 여행 – 지역 추천 N 포털 사이트 – N여행 – 여행 중요 항목 추천 N 포털사이트 – N여행 – 교통 한번에 페이지

성별

나이

결혼정보

등록 취소

남 여

여행 중요 항목

미혼

33

음식 편의 숙박

스코어 모형을 기반으로 한 지역 추천

“ 고객님과 비슷한 분들께서는 전라북도를 선호하시네요 ”

전라북도 #음식 #편의 #숙박 별점순

숙박

대한 민박 민국 민박 나라사랑 민박

별점순

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★

음식 별점순

맛 좋아 백반 전북 제일면

★ ★ ★ ★ ★ ★ ★ ★ ★ ★

편의 별점순

교통

기차 시간표 링크 이동 국내선 시간표 링크 이동 시외 버스 시간표 링크 이동 렌터카 가격비교사이트 링크 이동

∙ 국내 여행지를 추천해 주는 서비스 페이지를 개설 ∙ 성별, 나이, 결혼 정보, 여행 시 중요하게 생각하는 항목 3가지를 입력하게 함

∙ 성별, 나이, 결혼 정보를 이용해 해당 고객이 포함되는 군집 파악 ∙ 입력한 여행 중요 항목에 대해 스코어 모형을 기반으로 한 지역을 추천

∙ 해당 고객이 입력한 여행 중요 항목별로 다른 사람들이 평가한 업체, 사이트 등을 추천 ∙ 단순한 관심을 실제 여행으로 이어지게 함

∙ 해당 고객이 입력한 여행 중요 항목 외에도 본인이 원한다면 정보를 제공 예)교통 항목에 대해서는 전라북도로 가는 기차의 시간표를 확인할 수 있는 사이트의 링크를 소개

21

Ⅴ.마케팅 전략 지역 추천 모형 성공 시 지역별 기대 수익

33살 미혼 남성 김여행씨 8번 군집

관광지 편의시설 음식 숙박시설 관광지 물가 … 이유 3가지 평균 하루 예상 지출 비용

부산 4 3.43 5 3.5 … 4.33 158,628

경기 3 4 4.33 3.43 … 3.78 112,846

강원 4.57 3.43 4.25 3 … 4.08 104,969

전북 4.67 4.5 4.5 4 … 4.56 69,052

경북 3 3.8 5 3.63 … 3.93 79,185

제주 4.5 4 4 4 … 4.17 360,047

… … … … … … …

관광지 편의시설 추천 여행지 : 전북

음식 추천 여행지 : 전북

숙박시설 추천 여행지 : 부산, 경북

전반적 추천 여행지 : 전북

(단위 : 원)

실제 추천한 지역을 김여행 씨가 여행한다면

부산의 경우 하루 158,628원,

전북의 경우 69,052원의 지출 비용이 예상됨

이는 지역 경제 발전에 이바지할 것이라 기대되는 수익임

22

Ⅴ.마케팅 전략 경로 추천 모형 _ 시차 연관성 분석

∙ 지속적으로 타겟의 국내여행을 유인하기 위해서 적절한 시기에 타인이 갈 것 같은 장소를

타겟보다 앞서 사전에 제시하고자 함

∙ “시차 연관성 분석”을 통해 동일 여행객이 시간이 지남에 따라 어떤 지역 방문을 하는지

파악하고 이를 기반으로 동일군에 속하는 사람의 과거 방문 지역을 기반으로 지역/경로를

추천

∙ 개인여행을 예로 들면,

① 같은 달에 여행한 지역은 동일 시점 여행으로 정의

② “Ⅳ.타겟분석”에서의 로지스틱 결과를 기반으로, 해외여행을 갈 오즈비가 상대적으로

높은 8번 군집에 시차 연관성 분석을 시행

⒜ 전체 데이터 중 8번 군집에 해당하는 subset을 데이터로 지정

⒝ 시차 연관성 분석 시행

⒞ 규칙테이블과 연결그래프를 통한 결과 해석

개인 & 가구

23

제주

대구

서울

충북

부산

경남

경북

전북

강원

인천

경기

전남

충남

∙연결그래프

원의 크기가 클수록 해당 지역 여행객 빈도 수가 높음을 의미

선의 굵기가 굵을수록 두 지역간의 왕래가 잦음을 의미

예시) ‘강원(932)’으로 여행한 여행객 빈도가 가장 높으며 ‘서울(911)↔경북(937)’의 왕래가 가장 잦은 여행경로임

Ⅴ.마케팅 전략 경로 추천 모형 _ 시차 연관성 분석 예시

33살 미혼 남성 김여행씨 8번 군집

여행지 선택 조건 3가지 : 관광지 편의시설

식당 및 음식

숙박시설

경로 추천 모형

관광지 편의시설 추천 여행지 : 전북

식당 및 음식 추천 여행지 : 전북

숙박시설 추천 여행지 : 부산, 경북

전반적 추천 여행지 : 전북

전북

경로 추천 : 전북 여행을 먼저 가는 경우

전북

전북

충남

전남

: 신뢰도 21.05%

: 신뢰도 21.05%

경로 추천 : 전북 여행을 나중에 가는 경우

인천

전북

충남

: 신뢰도 58.33%

: 신뢰도 40.00%

24

※ 신뢰도 : 첫 여행지 여행 후 다음 여행지로 여행하는 비율

Ⅴ.마케팅 전략 모바일 활용 여행 _ 네이버 해시태그 사례

최근 네이버는 ‘#태그’ 베타 버전을 오픈함

- 태그 기능은 검색과 SNS의 강점을 결합해 새로운 검색 기술을 적용한 서비스로, ‘i-Rank(Interest Rank)’라는 알고리즘을 적용하여 사용자와 정보 간의 관심사의 일치 정도, ‘좋아요’ 표시나 댓글을 통한

관심사 그룹 내 정보의 추천 정도, 정보의 최신성 등의 변수를 통해 맞춤형 관심사를 추천해주는 컨셉으로 설계되어있음

예 ) 강원도로 여행간 부부가 모바일을 활용하여 맛집 검색하는 과정

원하는 검색어 ‘강원도맛집’에 ‘#’을 붙여 검색

#강원도맛집 키워드를 검색하면 상단에 #초당두부, #평창한우마을 등의 연관 태그들이 보여짐 추가로 키워드를 검색하지 않아도 연관 키워드가 추천되므로 정보 획득이 편리함

현재 주목받고 있거나 ‘좋아요’가 많은 포스팅 위주로 노출됨

· 네이버의 지도앱 등의 로컬 서비스를 활용하여 위치 기반한 해시태그 키워드를 추천 예) 계획없이 떠난 여행객들에게 현재 위치한 지역에서 주로 검색되는 맛집, 활동, 사람들의 감정 등을 하나로 모아 추천해주게 되면 다양한 경험을 하게 될 수 있으므로 해당 지역에 대해 재방문 의도, 타인추천의향이 높아질 가능성이 있음 · 태그하는 위치(블로그, 카페, 타 어플 등)는 사용자의 관심사나 주로 검색, 활용하는 서비스에 따라 달라짐 이에 대한 정보가 축적되게 되면 검색어와 주 서비스의 연관성을 분석하여, 광고나 캠페인에 이용할 수 있음 · 성별, 연령 등의 인구통계학적인 정보가 추가되면 현재 포털사이트에서 특정 유형 그룹의 인기검색어를 추천해주는 것과 같이 인기해시태그 키워드를 추천, 트렌드를 쉽게 읽어낼 수 있음 예) 성별, 특정 연령대에 대하여 특정 시간대에 가장 많이 유입되는 해시태그 키워드를 상단에 노출, 순위를 매기게 되면 포털사이트의 인기 검색어와는 별개로 모바일을 사용하는 사람들의 현재 관심사를 파악할 수 있음

마케팅 전략 예시

25

관광지 넘버원 대한민국

Ⅵ.기대효과 국내관광활성 기대효과

향후 국민여행 관련 정책 수립

국민여행 실태조사

빅데이터의 활용

∙ 공개용 국민여행 실태조사 데이터를 통계학적 지식으로 접근을 함으로써 보다 과학적이고 체계적으로 데이터를 정리 및 활용 ∙ 자세한 설명과 도표, 시각화를 이용해 데이터 이해를 도움 ∙ 궁극적으로 국민여행실태를 파악함

∙ 본 분석에서 제시한 마케팅 전략을 활용하여 국민여행 관련 정책 수립에 도움이 될 수 있음 ∙ 데이터를 기반으로 하였으므로, 보다 객관적인 정책 수립에 기초자료로 활용할 수 있음

국내관광활성화 및

국가 관광 브랜딩

∙ 관광산업의 활성화가 경제적, 사회적, 문화적 측면에서 효과가 있다는 것은 검증된 사실임 ∙ 더 나아가 국가 관광 브랜드를 구축, 국내외 여행객의 발걸음을 모두 국내로 돌릴 수 있음

26

Ⅶ.추가분석 히트맵을 이용한 데이터의 시각화 및 마케팅 전략 예시

∙ 응답자들은 하나의 여행기록부에서 총 12개의 세부 항목에 만족도를 응답하도록 되어있음

∙ 개인 응답자가 응답한 12개 항목의 만족도 점수를 종합하여 여행한 지역별로 나타내게 되면

여행지로서 지역에 대한 만족도 정도를 파악할 수 있음

BUT 관심 변수의 범주 수가 많거나, 응답자가 많아 데이터의 양이 크게 축적될 경우 이를 한 눈에 파악하기 어렵다는 문제가 발생하게 됨 데이터의 시각화(Visualization) 방안 고려가 필요함

국민여행실태조사 Big data를 히트맵으로 시각화하는 방안을 제안하여 효율적인 정보 처리를 가능하게 하고 많은 사람들이 쉽게 이해할 수 있도록 하며,

이를 이용한 마케팅 전략을 제시함으로써 궁극적으로는 지역사회, 여행업체의 이윤 창출과 관광산업의 발전을 이끌 수 있음

∙ 일자별 지역을 찾는 여행객의 수를 히트맵으로 파악하여,

혼잡이 예상되는 경우 각 지역으로 향하는 관광버스나 열차를 증편하여

여행객의 이동을 편리하게 하는데 사용할 수 있음

∙ 일정 기간 동안 여행객들의 여행지에서의 지출액을 히트맵으로 나타내어

지출패턴을 파악하고 관련 여행상품, 이벤트, 캠페인 등을 기획하여

지역 혹은 여행업체의 매출을 높일 수 있음

∙ 데이터를 지속적으로 축적하여 관심 변수에 대하여 하나의 달력을 구성하면

시간의 흐름에 따른 관심 변수의 변화를 쉽게 볼 수 있어

유의미한 정보를 생성해낼 수 있음

∙ 히트맵(Heatmap)을 이용하여 데이터를 시각화하면

한 눈에 종합적인 정보를 파악 가능하며, 직관적으로 이해할 수 있는 편리함이 있음

∙ 방대한 양의 데이터에 대하여 쉽게 인사이트를 얻을 수 있도록 함

히트맵 관련 마케팅 전략 예시

27

Ⅶ.추가분석 히트맵을 이용한 데이터의 시각화 예시

PERINBOUND14.csv

· 총 6421 레코드의 데이터포맷을 77052개의 행을 가진 열벡터로 변환 · ‘⑨ 경험해보지 못함’과 ‘결측(NA)’인 행 삭제 ⇨ 51705개의 행을 가짐 · 피벗테이블을 이용하여 각 지역별, 항목별 만족도 평균 계산

지역코드(Q6_1), 만족도 12항목(Q12_1, … , Q12_12) 구성된 csv 파일 생성

prepare_heatmap.csv

R 패키지 ‘quantmod’, ‘ggplot2’, ‘reshape2’, ‘plyr’, ‘scales’ 패키지 사용

· 지역 X 만족도(12항목) 매트릭스에 만족도 점수가 높을수록 농도가 짙은 색이 채워지도록 함

· 만족도 문항(행)을 기준으로 한 경우 - Q12-1 자연경관에 대한 만족도는 다른 항목보다 대체적으로 높은 점수를 기록하고 있으며, 특히 강원, 제주 지역을 여행한 여행객에서 높음

· 지역(열)을 기준으로 한 경우 - 제주 지역을 여행한 여행객의 경우 대체로 만족도가 높으며 Q12-11 관광지

물가에 대한 만족도는 다른 항목보다 현저히 낮게 기록됨

히트맵의 해석 예시

28

Ⅷ.결론 및 제언

분석의 마무리

국내여행 현황을 살펴보고 내국인의 해외여행으로의 발길을

국내여행으로 돌리는 노력이 필요하다고 생각,

국민여행실태조사 데이터를 기반으로 하여 분석을 기획함

R, SPSS, SAS Enterprise Guide, SAS Enterprise miner 등의

통계패키지 프로그램의 사용을 보다 편리하게 하기 위해, 또한 조사 결과를 가지고분석목적에 부합하는 정보를 얻어내기 위하여

분석데이터와 파생변수를 생성하는 등의 전처리 과정을 거침

타겟을 설정하고, 설정한 타겟을 대상으로 다양한 통계기법을 활용하여

의미있는 결과 도출

마케팅전략을 제시하기 위하여

여러 모형을 구축하고 예시를 들어 설명함

추가적으로, 빅데이터를 효율적으로 활용하기 위한 방안으로 히트맵을 이용한 시각화를 제시함

본 분석결과를 이용하여 얻을 수 있는 기대효과를 살펴보고

최종적으로는 국내관광활성화를 하고 국가 브랜드를 구축하여 해외여행객의

발걸음을 국내여행으로 돌릴 수 있음을 시사

본 분석은 데이터를 기반으로 한 분석과 마케팅 전략의

제시라는 것에 의의가 있음

패널의 유지율이 향후 몇 년 간에도 꾸준히 높게 유지될 경우, 방대한 양의 시계열 자료를 활용한

다양한 분석을 기대할 수 있음

결측값이 많고, 설문항목에서 얻을 수 있는 정보의 양이 크게 많지 않아 다른 조사와의 통계적 매칭 방안도

고려해보는 것이 필요할 듯함

조사통계 품질의 지속적 제고가 요구됨

29

Reference & Software

∙ 관광지식정보시스템 http://know.tour.go.kr ∙ 문화체육관광부 http://www.mcst.go.kr ∙ 네이버 포스트 http://post.naver.com ∙ 폴라 http://www.pholar.co ∙ 머니투데이 http://www.mt.co.kr ∙ 연합뉴스 http://www.yonhapnews.co.kr ∙ 재경일보 http://www.jkn.co.kr ∙ 헤럴드경제 http://biz.heraldcorp.com

Website

∙ R ∙ SPSS ∙ SAS Enterprise Guide ∙ SAS Enterprise miner

Software

∙ 한국의 관광자원(제 2판) – 최기종 ∙ 문화관광축제 이벤트론 – 최영수 ∙ R Graphics Cookbook – Winston Chang ∙ R을 이용한 데이터마이닝 – 박창이, 김용대, 김진석, 송종우, 최호식

Reference

30

Q&A

감사합니다