32
8. 고객관계관리(CRM) 2015.10.30 서울시립대학교 전자전기컴퓨터공학부 인공지능연구실 김유상

8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

Embed Size (px)

Citation preview

Page 1: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

8.고객관계관리(CRM)2015.10.30

서울시립대학교 전자전기컴퓨터공학부인공지능연구실 김유상

Page 2: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

8장 설명 주제

l 고객 성명,주소 파싱

l 고객 디멘션에 구성되는 날짜 속성,집계 팩트,세그먼테이션 행동 속성 및 점수

l 카디널리티가 낮은 속성에 대한 아웃리거 테이블 구성

l 빈도가 희소한 속성에 대한 브리지 테이블 구성

l 브리지 테이블과 포지셔널 설계 간의 트레이드 오프 관계

l 복수 고객 접촉에 대한 브리지 테이블

l 동일 고객군을 찾을 때 활용되는 고객 행동 학습 그룹

l 순차적인 고객 행동을 분석하는데 활용되는 진행 단계 디멘션

l 유효기간을 효과적으로 관리하는 타임스팬 팩트 테이블

l 고객만족 또는 이상 시나리오가 포함된 임벨리싱 팩트 테이블

l 마스터 데이터 관리나 부분적인 ETL처리를 통한 고객 데이터 통합

l 실시간 응답 요구 사항을 위한 실질적인 체크리스트

Page 3: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

1. 고객관계관리 개요

l고객관계관리는 고객중심관점으로 전환을 의미

• 비용절감을 통한 영업 생산성 향상

• 고객 수익성 향상

• 고객 만족도 향상

• 고객 유지율 향상을 통한 매출 상승

• 운영 효율성 향상

Page 4: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

1.1 운영CRM과 분석CRM

l운영CRM에서 통합 관점의 고객 정보가 생성됨

l분석CRM은 고객관계관리 기반의 고객 관리 활동이 얼마나효과적인 의사결정인지 평가할 수 있게 한다

l분석CRM이 운영CRM을 개선시키는과정을 클로즈드 루프 분석CRM이라고 한다.

Page 5: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2. 고객 디멘션 속성

l표준 고객 디멘션은 성공적인 고객관계관리 구축의 핵심요인이다

l고객 디멘션은 DW/BI시스템 구축에 있어 가장 어려운과제이다

• 수백만 데이터,수백개 칼럼,고빈도갱신,다수의 이종시스템통합

l다음은 고객 디멘션 설계 시 고려사항이다

Page 6: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.1 고객명과 주소 파싱

l주소가 Address1,Address2칼럼으로 관리되는 경우 용도가 여러 가지목적으로 활용되므로 데이터 품질 이슈가 발생하게 된다

l Name칼럼은 FirstName,MiddleName,FamilyName등을 구별할 수가없어서 이러한 형태면 동일고객이면서 여러 형태의 고객명 데이터를받게 된다

l특정 목적을 가진 칼럼과 다르게 주소나 성명 같은 칼럼은 될 수 있는 한잘게 쪼개야 한다.이를 Parsing이라고 한다

Page 7: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.2 비영어권 성명과 주소 고려사항

l표준영어는 ASCII를 사용하지만 비영어권 언어를 표현하기위해서는 유니코드를 사용한다

lOS레벨 위 모든 SW는 유니코드와호환되어야한다

lETL작업 수행중에 이슈가 발생할 수 있는 특이문자가 있는지확인해야한다

l다국어 환경에서 고객의 지리적 위치정보를 다루는것은더복잡할 수 있다.국가별로 주소체계가 다르기 때문이다.(주:우리나라 도로명주소,신우편번호문제)• 우편번호데이터가 정확하게 잘 관리된다면국가별로 제각각인

주소체계의번거로움을 해결할 수 있다

Page 8: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.2.1 다국적 데이터 처리 목표

l범용성과 일관성

• 데이터 정렬이 언어별로 다를 수 있다

• 두단어가번역될때 같은단어로번역되면 디멘션 카디널리티가달라지므로 리포트를 실행후에 디멘션을번역해야한다

• 메시지나 프롬프트도번역되어야한다

lEnd-to-End데이터 품질보장과 하위호환

l문화적 오류보정

l실시간 고객 대응

l다른종류의 주소들

Page 9: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.3 고객 지향 일자 데이터

l일자 속성은 데이터는 동일하나 팩트테이블에서 사용되는의미가 다를 수 있으므로뷰로 표현한다

l첫구매일자디멘션은 팩트테이블과직접 관계를맺지않고고객 디멘션과 일대다 관계를 가지는데 이를 아웃리거디멘션이라고 한다

Page 10: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.4 집계된 팩트를 디멘션 속성으로 이용하기

l연간 사용금액,평생누적 사용금액같은 속성은 고객평가에자주 사용되는 데이터로 고객 디멘션 테이블의 속성으로관리하여 고객 속성의 일부처럼 표현할 수 있다

l고객평가기준의 여러측정값들은 고객 디멘션에서 파생된별도의 디멘션으로 생성되어 반영되기도 한다

Page 11: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.5 세그먼테이션 속성과 스코어

l다음 속성은 마케팅관점에서 고객을 여러 유형으로 구분할수 있는 기준이 되는 속성이며고객디멘션에서 활용도가높다• 성별

• 민족(주:미국기준.한국에서는불필요)• 나이 및 나이와 관련된 생애단계 구분(유년기,청소년기…)• 소득및 소득과 관련된 생활유형(패션지향,자기주장,실리추구…)• 고객상태(신규,활동,휴면,탈퇴등)• 고객신용평가기관

• 산업특성에따른시장 분류(선호고객기준)

l고객을 특성별로 그룹화하기 위해 스코어링을 하기도 한다

Page 12: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.5.1 고객 행동 시계열 꼬리표

l 고객 스코어링과 프로파일링의대표적방법중 하나는 RFI또는 RFM이다.• R:Recency,얼마나최근에 구매한 고객인가?

• F:Frequency,얼마나 자주 구매한 고객인가?

• I:Intensity,같은 기간 동안 얼마나많이 구매한 고객인가?• I는M(Monetary,구매금액규모)으로불리기도 한다

l 고객 기반의 RFI데이터를그림8-5와같은큐브형태로 표현할 수 있다

l RFI큐브의세그먼테이션셀을다음과같이 분류한다.아래제시한A~H고객 구분은 데이터마이닝을 통해 도출하는전형적 고객 유형이다

• A:대량주문반복고객,고신용,저반품율

• B:대량주문반복고객,고신용,고반품율

• C:신규가입고객,신용패턴없음

• D:가끔들르는고객,고신용

• E:가끔들르는고객,저신용

• F:공식우량고객,최근미방문

• G:자주들르는돈안되는고객

• H:기타

l 존도우씨가 CCCDDAAABB이면 신규가입한 이후에가끔들르다가물건을 한두개씩사게 되었다.그러다가대량주문을 자주 하고있는데 반품율이올라가고 있음을알수 있다.

Page 13: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.5.2 데이터마이닝과 DW/BI와의 관계

l데이터마이닝은 DW시스템의 우량고객이다

l데이터마이닝팀은 주기적으로 DW데이터를추출해서데이터마이닝서버에옮겨놓고 분석한다

l데이터마이닝분석방법

• 의사결정나무(DecisionTree)

• 신경망분석(NeuralNetwork)

• 사례기반추론(Case-BasedReasoning)

• …

Page 14: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.6 타입2 디멘션 관리에서의 고객 카운트

l타입 2는 고객 디멘션의 일부 속성값이변경된 경우 이전값을 가지는원본레코드는 유지한채신규레코드를추가하는방식이다

l이경우 고객 디멘션의 PK를 가지고 중복 제거를 하지않으면고객 데이터는 중복 집계될 수 있다

l최종 레코드를식별할 수 있도록식별자 칼럼을추가하여관리한다

Page 15: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.7 소수 카디널리티 속성의 아웃리거

l그림8-6의국가인구통계학 아웃리거디멘션은 고객디멘션에넣기에부적당하므로 스노우플레이크 스키마를 사용하는것이낫다

l소수 카디널리티인지확인하고 아웃리거 디멘션으로 분리한 경우와통합한 경우를 비교해서 어느것이 유리한지판단해야 한다

Page 16: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

2.8 고객 계층 고려사항

l조직계층같은경우 고정된 계층레벨로 설계 할 수 있다

l하지만 대부분의 고객 디멘션의 계층구조는 고정적이지않고가변레벨 계층이다.• 전력회사에서 전력을 사용하는 기업고객에 대한 요율을

산정한다면..• 그 기업고객은 자회사,지역영업본부,생산사업장 등이 있다

• 지역별로 인구,경제규모가 달라 전력판매량도 다르고영업조직레벨도 다르다

Page 17: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

3. 다중값 디멘션을 위한 브리지테이블

l 대표적인 다중값디멘션의예• 인구통계학적 속성

• 고객 주소

• 이직을 위한 전문적 기술

• 취미

• 병의증상이나 처방

• 자동차옵션 사항

• 은행계좌복수 명의자

• 부동산 임차인

l 다중값디멘션을 대처하는방안• 고정칼럼설계 : 칼럼의 이름을 다르게 설계하면서 한 테이블안에 여러 칼럼으로

설계하여 가독성이뛰어나다

• 브리지 테이블 :고정칼럼설계의 단점이 없지만쿼리가 복잡하다.사용자에게는뷰를 만들어서 제공한다

Page 18: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

3.1 희박한 속성을 위한 브리지 테이블

l고정칼럼속성에서 속성이몇백개 이상되고 속성이 자주추가된다면 브리지 테이블방식을추천한다

l그림 8-7을 그림 8-8같이 공시디멘션,공시브리지,공시내역디멘션의 세 개의 테이블로 구성하였다

Page 19: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

3.2 복수 고객 접촉에 대한 브리지 테이블

l대형 기업 고객의 경우 고객 접촉 정보를 칼럼화하면양이매우 크기 때문에 이런경우에도 그림 8-9같이브리지테이블화하는것이좋다.

l접촉 정보 브리지 테이블은 고객관리용도로만 제한할필요가있다.

Page 20: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4. 복잡한 고객행동 분석

l고객집단관리

l순차적인 고객 행동 포착

l정밀한 타임스팬 팩트 테이블

l고객만족지표 태깅

l비정규적 이벤트 태깅

Page 21: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4.1 고객집단에대한 행동 스터디그룹

l 전년도에 1000달러이상 구매한 Top100고객을 대상으로 연구를 한다고 하자.기존방식은쿼리가 복잡하므로 행동연구그룹을 생성하기 위해 아래그림8-10으로 구성한다.단일 키로 고객을식별해낼수 있는 영속성보장키를 찾아낸다.

l 고객행동연구그룹디멘션은 고객디멘션과 일대일 관계를 가진다.이두테이블은뷰로 만들수 있고 팩트테이블과조인뷰로 해도 스타스키마구조를유지한다

l 고객행동변화를 분석하기 위한 데이터를확보하기 위해서는 사용자애플리케이션에서 고객의 행동이 전과 다른것을캡처하는 기능이 개발돼야한다

Page 22: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4.2 순차적 고객행동에대한 스텝디멘션

l 여기서는웹 로그를 활용해 분석하기 위해 아래 그림8-11과같은 스텝디멘션을사용하였다

l 세션은 상품을 살펴보고 구매나 반품을 하는 과정을 하나의 세션으로 정의하며 스텝은 이세션을 여려 과정으로 나눈것이다

l 첫번째줄은웹페이지에왔다가 바로 다른웹페이지로 빠져나간 경우다

l 두,세번째줄은 하나의 세션으로첫웹페이지에서 다른페이지를 보고빠져나간 경우다

l 스텝디멘션으로 고객이탐색하는 정보를담아 분석을 하면 고객이 구매결정을하는유인책과 다른페이지로빠져나간 마지막페이지를판단할 수 있다

Page 23: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4.3 타임스팬 팩트테이블

l그림 8-12와 같이 고객 트랜잭션 팩트테이블에유효시작일시와 유효종료일시 칼럼을추가하여 관리하면정확한 고객의 신용도분석이 가능해진다

l그리고 인구통계학 디멘션과 상태 디멘션에도 그 유효기간이적용된다

Page 24: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4.3.1 듀얼 타임스탬프 관리

l고객정보변경 이력을추적할 때 마지막변경시점과직전변경시점사이 발생하는갭이 있으므로 시작일시와 종료일시를 관리하도록한다

l듀얼 타임스탬프방식에서새로운 데이터 발생시

• STEP1:종료유효 일시에 시작유효 일시보다큰임의의 일시데이터를입력한다

• STEP2:신규데이터 처리가 이뤄진 다음에 ETL프로세스는반드시 종료유효 일시에방금전입력된 신규데이터의입력일시를삽입해야 한다.

Page 25: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4.4 만족도 지표에대한 태깅 팩트 테이블

l수익성 지표 다음으로 중요한것이 고객만족도 지표이다

l공공기관 같은조직은 고객만족도가최고의 지표이다

l판매,반품,고객지원,청구,웹사이트,탈퇴,소셜미디어 등에서만족도 데이터를얻어 만족도 디멘션을 만들수 있다

Page 26: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

4.5 비정형 지표를 위한 태깅 팩트 테이블

l일반적인 팩트 테이블은 트랜잭션 데이터를 스냅샷형태로쌓는다

l고객이 주문하여 트럭을 통해배송중인데 타이어바람이빠졌다.그래서 다른트럭에옮겨싣는데 비가와서배송물품이젖어 고객이인수를 거부한다면..

• 주문팩트테이블은배송단계 스냅샷데이터가쌓인 상태로만 있다

l예외상황에서도 사용자가 전체상황을 분석할 수 있게 설계하려면..

• 주문 팩트 테이블의 PK를 주문번호,주문아이템번호레벨로설정한다.

• 주문상태뿐만 아니라 주문단계별 상세 사항을 포함한다

Page 27: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

5. 고객 데이터 통합 방안

l복수의 여러버전의 고객 데이터를 단일 고객 디멘션으로 통합

l표준 속성으로 구성된 복수의 고객 디멘션으로 설계

Page 28: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

5.1 단일 고객 디멘션을 만드는 MDM

lMasterDataManagement는 고객 데이터를 정제 통합하며일관된 고객 정보를 전사적으로 공유하여 사용하게 된다

l그림8-14는두형태의 MDM아키텍처를 보여준다.위는 전사적인 MDM을 통해모든 운영 시스템의 고객 정보가통합 관리되는 형태이고 아래후처리MDM은 운영시스템에서발생한 서로 다른고객 정보를정제하고 EDW는 이 데이터를사용하는 구조이다.

Page 29: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

5.2 복수 고객 디멘션의 부분 통합

l모든 고객 정보 속성을 하나의 단일 데이터로 통합하는것이가장좋은 해결방안이지만 현실적으로 거의불가능하다

l그래서 일부 속성을 공통 속성화하는것이 현실적인 대안이다

l예를들어 고객 카테고리가 있다면 고객 관련디멘션을 이고객 카테고리 칼럼으로조인하여 분석할 수 있다

Page 30: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

5.3 팩트테이블간 조인 피하기

l 그림8-15와 같이 고객요청팩트와 고객응대 팩트에 고객 디멘션을 연결하여다대다 관계를 다대일과 일대다 관계로 나눠서 분석할 수 있다

l 고객 요청과 고객 대응이각각의 카디널리티가 다를 수밖에 없는것은 고객요청이 있어도 고객 대응이 없을 수도 있고 그 반대도 가능하기 때문이다

l 고객 디멘션을 통해쿼리하게 되면 드릴어크로스 기법으로 데이터를조회한다• 드릴어크로스는 고객 요청팩트를 고객별로조회하고 그 고객에 대한 대응

팩트를조회하는방식으로 성능면에서도 유리하다

Page 31: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

6. 실시간 분석 고려사항

l 일반적인 ETL아키텍처는 일배치기준이며사용자의 실시간 요구사항을충족하기 위해 여러번 ETL을 수행하면 데이터 품질보장이떨어진다

l 즉,실시간성으로 데이터를 제공하는 가치와 그만큼부정확한 데이터가 제공될수 있는확률이올라가게 되는 트레이드오프 관계가 있다

l 이를 보완하는방법중 하나가혼합형 ETL아키텍처로서 주간에 여러번 ETL을수행하고 야간에 일배치를 한번더수행하면 익일에 제공되는 데이터는 품질이보완된다

Page 32: 8. 고객관계관리(CRM) - datamining.uos.ac.krdatamining.uos.ac.kr/wp-content/uploads/2015/09/%E1%84%80%E1… · l이경우 고객 디멘션의 PK를 가지고 중복 제거를

7. 요약

l 고객관계관리 개요로 시작하여 고객 디멘션 테이블 설계방법에 대해 다루었다

l 고객 성명과 주소를 파싱하고 DW모델에 반영하는방안을검토하였다

l 공통적인 고객 디멘션 속성을살펴보았다

l 아웃리거 디멘션을 활용하여변화가 적고 그룹핑할 수 있는 속성을 분리하는방법을검토하였다

l 브리지테이블을 적용하여 일부 디멘션에 스노우플레이크기법을 적용하는방안에 대해살펴보았다

l 복잡한 고객 행동 데이터를 다루는방안을살펴보았다

l 분산 관리되는 고객 데이터를 어떻게 통합 관리할것인지에 대해검토하였다

l 실시간 요건을 반영하는방안과 여러 가지 제약점을살펴보았다