32
카페 추천 기술 기획 2014-02-10 민병국

Survey - 카페 추천 기술기획 (2014-02-10)

  • Upload
    -

  • View
    32

  • Download
    1

Embed Size (px)

Citation preview

카페 추천 기술 기획

2014-02-10

민 병 국

Daum 카페 리뷰

- 운영자 추천

- 카페명 검색

- 모바일 실시간 카페랭킹

Daum 카페 Top

Daum 카페 카테고리

• 대분류 카테고리• 문화/엔터테인먼트

• 팬카페• 생활/취미• 지식/정보• 친목

• 문제점• 취업&자격증, 재테크, 육아, 중고장터는 어디?• 정치인 후원은?• 취미=문화=생활• 대규모 vs 중소규모

• 카테고리가 최신 트렌드를 따르지 못함

Daum 카페 프로필

카페명 검색

Daum 카페명 검색

노출이 안되면회원이 안들어온다=> 중소카페살리기 필요(?)

Daum 카페 추천 Project

모바일 실시간 카페 랭킹

• http://m.cafe.daum.net/_ranking

• 대분류• 연예/라이프/정보/친목

• 추천카페 Pool• 식물/동물 랭킹 카페인 경우

• 개설된지 1개월 이내인 카페• 최근 7일간 신규 게시글(한줄

메모장 포함) 30개 이상인 카페

• 음식랭킹 이상 카페인 경우• 전체 카페

• 추천 POOL 제외 조건• 휴면+블라인드+비공개

• 랭킹• 특정 시간 이내• 게시글수, 조회수, 가입자수, 방

문자수

카페 추천 첫회의 <2014-02-12>

• 누구를 대상으로 카페 추천을 할 것인가?• 서비스 사용 여부에 따른 구분

• 다음 검색 사용 & 카페 미사용하는 유저

• 다음 검색 사용 & 카페 사용하는 유저

• 다음 신규 사용자

• 무엇을 하는 사용자인가에 따른 구분• 검색, 뉴스, 쇼핑?

• 어떤식으로, 얼마나 자주 추천을 제공할 것인가?• 우연한 만남 (쓰다보니 이런 카페가 있네?)• 스마트한 만남 (내가 쓰던걸 더 잘 쓰게 만들 수 있는)

• 추천 기초 데이터• 카페 성격 규정 : 게시판 선별

• 고려사항• 카페 활동성 기반 프로필 정보(CF 방식) 및 검색키워드를 포함한다.• 이유 기반 선택을 함께 고려한다.• 개인에 특화된 추천인 경우 오히려 거부감을 줄 수 있는 반작용이 있음을 고려해야 한다.• 현 다음카페는 특정 카테고리 쏠림현상이 있어 다양한 선호를 대응하기 위한 카페 모수 자체가 약

점임을 고려해야한다.• 추천의 다양성을 주지 못하는 이슈 해결은 어떤 방법으로 해야할까?• 검색의 도움을 받지 않고 신규 생성되는 카페들이 성장할 수 있는 새로운 채널로 포지션 해야한다.• 현재 카페 특성상 게시판 단위로 카페를 규정하는 것이 더 명확할 수 있다.

※ 출처: http://play.daumcorp.com/pages/viewpage.action?pageId=163422258

추천 기술별 비교

- 기술별 장단점

추천 방식 개요

• 운영 중심의 추천• 전문가 그룹 : ex) 증권*주식투자• Policy 기반 : ex) 결혼정보회사

• 기술 중심의 추천• CF 알고리즘 기반의 프로파일 중심의 추천• 카테고리 기반의 랭킹 추천

• 디자인 중심의 추천• Social Network : ex) Facebook• Tag : ex) Vingle, Style-tag• Rule base (질의응답)

Paradiams of Recommendation Systems

Recommend-ation

component

item score

i1 0.9

i2 0.72

… …

User profile &contexture parameters

Community data

Product features

Knowledge models

Recommendation List

Knowledge-based

Hybrid

Collaborative

Content-based

#출처: http://ijcai13.org/files/tutorial_slides/td3.pdf

Personalized Recommendations

Recommendation systems- Basic Techniques

Pros Cons

Collaborative No knowledge-engineering effort, serendipity of results, learns market segments

Requires some form of rating feedback, cold start for new users and new items

Content-based No community required, comparison between items possible

Content descriptions necessary, cold start for new users, no surprises

Knowledge-based Deterministic recommendations, assured quality, no cold-start, can resemble sales dialogue

Knowledge engineering effort to bootstrap, basically static, does not react to short-term trends

#출처: http://ijcai13.org/files/tutorial_slides/td3.pdfPro : reason in favorCon : reason against

Daum 카페 - 데이터

• Collaborative• User CF

• 즐겨찾기 카페/게시판• Item CF

• 최근 6개월 글쓴이, 방문자

• Content-based• 카페 등록정보 : 키워드, 설명문• 인기글 유입쿼리, 인기글 내 키워드 TF-IDF

• Knowledge-based• 카페 카테고리

• 시나리오 기반, Q&A 기반 (Tree)• 사용자 세그먼테이션

• 클러스터링 모델, 성향 모델, 협업적 필터링

추천 기술별 전략 비교

전략

Collaborative 내가 가입한 카페의 사용자들이 주로 가입한 카페는?- 카페 관점에서 사용자를, 사용자 관점에서 카페를같은 카테고리내에 유사가입성향 카페는?

Content-based 내가 관심있는 카테고리 or 키워드와 가까운 카페는?20대 여성회원이 많은 카페는?오프라인 모임이 활성화 되어 있는 카페는?이 카페와 유사한 다른 큰 카페는?

Knowledge-based 내가 있는 지역에서 등산모임을 할 수 있는 젊은층 카페는?여자친구를 사귈 수 있는 카페는?재테크 관련 상담을 할 수 있는 카페는?노총각이라면? 애기아빠라면? 맛집정보를 얻으려면?

추천 아이템 유형별 추천 Needs

고객 Needs 제공자 Needs

상품(쇼핑)

- 옥션- 쿠팡

몰랐던 유용한 상품 정보동종의 인기 상품 (비교대상)

Long-tail 판매주력상품으로의 판매유도

뉴스(컨텐츠)

- 페이스북 페이퍼- 야후 다이제스트

나와 같은 그룹이 많이 보는정보(내가 봐야할)비관심 정보의 필터링

지속적인 클릭, PV 증대

커뮤니티(온/오프라인)

공통 관심사의 정보와 활동이 있는 곳좋아할만한 사람들이 있는곳

회원 가입, Lock-in

Collaborative Filtering

• User-based nearest-neighbor collaborative filtering• How do we measure similarity?

• Pearson correlation

• How many neighbors should we consider?

• How do we generate a prediction from the neighbors' ratings?

• Making Recommendations• Not all neighbor ratings might be equally "valuable"

• Value of number of co-rated items

• Case amplification : close to 1.0

• Neighborhood selection

Collaborative Filtering 사례

• 옥션• 마이스타일

• 관심사 설정, 구매&클릭 이력, 카테고리내 연관상품• 8월 런칭 후 3개월간 CTR 2배 증가

• 남들은 뭘 살까?• 유사구매성향 고객의 구매&클릭 상품• 3개월간 PV 5배 증가

• 11번가• 푸시 알리미

• 개인별 구매 패턴 분석, 관심상품의 할인&상품 출시 정보

• 쿠팡• 당신을 위한 추천

• 최근 페이지&구매이력&클릭이력&동일관심사고객 반영, 유사 카테고리 제품 추천

• 티몬• 내 주변 보기

• 위메프• 개인화 추천 서비스

• 사용자 클릭&구매 이력으로 실시간 맞춤 상품 소개

※ 출처: http://www.yonhapnews.co.kr/bulletin/2013/11/05/0200000000AKR20131105189600030.HTML

Knowledge‐based recommendation

• Knowledge-based 추천이란?• Explicit domain knowledge

• Conversational interaction strategy

• 왜 KB추천이 필요한가?• 사용가능한 평가가 적은 상품들은 방법이 없다

• 기간은 중요한 역활을 한다 : 5년 주기 PC 교체, 사용자 라이프 스타일

• 고객은 그들의 요구사항을 분명하게 정의한다 : 반드시 검정색이어야해!

• Constraint‐based 추천

• 대화형 전략• 다양한 응답분기에 따라

추천 제공• 다양한 방식의 성향 도출

• Free text query interface• Asking technical/generic

properties• Images / inspiration• Proposing and Critiquing

• 좋다!!

• KB 추천의 한계점• 지식 수집의 비용• 참고모델의 정확성

Knowledge‐based recommendation

추천 전략

- Old fashion vs New fashion

Old fashioned 추천 전략

• 추천 목록을 리스트 형태로 제공• 사용자 전체 또는 세그먼테이션

• 사용자 세그먼테이션 : 연령대, 성별, 지역

• 동일 구매자, 유사 그룹

• 아이템 전체 또는 카테고리• 아이템 카테고리 : 쇼핑 카테고리

• 동일 구매품목, 상위 기종

• ex) 추천 대상자 - 민병국• 40대 초반, 남, 미혼, 제주도

• 가입카페 : 애견, 부동산, 살사, 등산

그래서 뭐?

New fashioned 추천 전략

• Social Network 기반• 친구

New fashioned Recommendation

• Category 기반 추천• 사람에 의한 카테고리 지정

• ex) Pinterest

New fashioned Recommendation

• Tag 기반 추천• 기계에 의한 자동 태깅

• 사람에 의한 소셜 태깅• ex) http://www.style-tag.com

• ex) 관심사를 공유하는 INS 계열인 Vingle • 최초 등록시 관심사를 태그

형식으로 사진과 나열해 선택하게 한 후 해당하는 컬렉션(콘텐츠공급자)을 선택하는 2단계 형식으로 진행

• 관심사만 공유할 뿐이기 때문에 딱 관심사에 관련된 내용으로만 추천됨

Reason-based Choice

• <심리학> 이유기반 선택• 사람들은 이유를 쉽게 말 할 수 있는 것을 선택한다

• ex) 데스크탑과 노트북의 차이점 vs 데스크탑과 고양이의 차이점

• 말로 표현하기 쉬운 선택 vs 어렵지만 마음이 끌리는 선택• ex) 브랜드 화장품, 디카겸용 스마트폰

• 다른 사람들의 시선을 의식해 상대비교에 집착하고, 따라서 상대비교에서 우위에 있는 대상을 선택하는 경향이 강하다

• 나의 선택이 다른 사람들에게 어떻게 평가 받을까 하는 염려가적은 경우에는 질적인 차이점을 고려한다. 즉, 상대비교가 쉬운것을 선택한다

• 개인보다 집단일 때 더 강하게 나타난다 (구성원간 갈등 감소)

• 참고• http://navercast.naver.com/contents.nhn?rid=133&contents_

id=28056

카페 추천에 대한 단상

• Content-based RS• 카페명 검색과 추천 영역을 피할 것

• 카페 키워드 10개, 카페 설명글, 카페 품질 지수신뢰성?

• Collaborative Filtering• Long-tail 카페를 추천해 주는 것이 옳은가?

• 카페는 상품이 아니다 : Up-sell? Cross-sell? Next-sell?

• 대형 카페에 대한 추천 쏠림 현상 해결 방법은?• 사용자의 카페선택에는 확실한 조건이 있다

• 지역, 카페규모, 온/오프라인 활동여부, 사람들

• 목록형 추천• 카페 제목과 랭킹만 가지고 무엇을 판단할 수 있나?• 카페를 스토킹? (살펴볼 수 있는 무엇)

• 인기글 같은 것을 임시적으로 살펴볼 수 있는 권한

추천 시스템 만들기

- 개발 프로세스

추천시스템 개발 프로세스

1. 추천아이템의 제공 방법 결정• 누구에게?• 어떤 식으로 얼마나 많이, 얼마나 자주?• 추천 아이템의 갱신 주기는?

2. 매칭 feature 결정• 사용자의 매칭 feature는?• 카페의 매칭 feature는?

3. Black Box 결정• 자동으로 생성되는 데이터의 단계 구분• 단계별 운영 요소 배치• 데이터 입출력 포맷 결정

4. 작업 분담 및 개발방법 결정• 데이터 가공 단계별 알고리즘 및 개발도구 결정• 갱신주기 및 데이터 담당부서 결정

5. 기간산정과 테스트계획 수립• 단계별 개발비용 추정, 우선순위 설정

추천시스템 개발전 체크사항• 데이터범위

• 추천 대상자 : 로그인 사용자? 비로그인 사용자 포함??• 추천 카페 후보군 : 몇만개나? 갱신주기는?

• 카페품질등급 + 최신성 + ( 무엇? )

• 사용자 프로파일(성별/ 연령대/ 지역) 사용 여부• 보안이슈로 정보사용동의, 접근통제 및 암복호화, 마스킹 등의 부가 요건으로 배보다 배꼽이 클 수 있음

• 개발도구및데이터• 카페팀 보유 시스템은? 입출력 방식은?• 사용할 수 있는 데이터는 어떤 종류? 방법은?

• 추천방법• 정말 개인마다 각각 다르게 추천할 것인가?

• 중복인지가 안될정도의 수량(대략 10~20개 그룹)으로 추천하는게 좋지 않을까?

• 추천 주기와 노출 방법은?

• 운영이슈• 운영이 필요한 요소는?

• 사용자 그룹별로 추천의 품질을 관찰하거나 조정할 필요가 있는가? • CF 방식은 잠재적 규칙을 반영하므로 설명하기 어렵다

• 카페 태깅이나 또는 그룹, 사용자 그룹을 조회&수정하고 싶은가? • 밑데이터를 만들고 그것을 바탕으로 규칙기반 추천으로 만들어야 가능

- 끝 -

발표후 토의 내용

• 새로운 카테고리 랭킹 개발• 정보성

• 검색으로도 잘 나온다. 굳이 추천할 필요 없다

• 친목성• 오프라인 중심(폐쇄형), 검색으로 안나온다.

• 상업성• 장터카페, 카테고리로 나눠 중첩 안되게 설명해주면

• 외부와 연계된 추천 feature 개발• 내부에서 돌지 말고 타 서비스와의 연관경로를 찾자

• 극소수이겠지만 연관점이 분명히 있을 것이다

• 대표카페 연결점에서 중소카페로 확산 유도• 재테크&펀드 뉴스 10in10 카페재테크 관련 중소카페