48
URL에남겨진DB의흔적 웹 기반 시스템 분석의 새로운 패러다임 연구소장 & CTO 공학박사 이동하 ㈜넷스루 2004년 4월 2일 www.nethru.co.kr

URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

URL에 남겨진 DB의 흔적웹 기반 시스템 분석의 새로운 패러다임

연구소장 & CTO

공학박사 이동하㈜넷스루

2004년 4월 2일www.nethru.co.kr

Page 2: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

2

목차

웹로그 분석

URL과 운영계 DB

WiseLog Premium의 URL 코드 추출

운영계 연동 분석

WiseLog Premium 세부 기능 내역

Page 3: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

I. 웹로그 분석

1. 웹로그 분석을 왜 하는가?

2. 시스템 구성

3. 웹로그 분석의 범위

4. 기본 보고서

5. 고급 보고서

Page 4: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

4

웹로그 분석을 왜 하는가?

Web Log

파일에 기록요청 / 응답

Web Server

203.251.189.47 - - [03/Aug/2000:21:57:25 +0900]

"GET /doc/mod/directives.html HTTP/1.1" 200 11339

언제언제

누가누가

무엇을무엇을

어떻게어떻게

: 방문 시간

: IP, ID

: 방문한 페이지

: 응답 상태

어디로부터어디로부터 : 참조한 페이지

Web Log를 분석하면…

− 페이지 뷰, 방문수, 머문 시간과 같은 표준

통계 지표를 얻을 수 있습니다.

− 시스템 사용 현황을 알 수 있습니다.

· 서버별 트래픽, 에러, 많이 사용되는 시간대

− 방문자의 상세한 행동을 분석할 수 있습니다.

· 사용자들의 이동경로, 관심사 등을 파악합니다.

웹 방문자들의 행동을 파악하고, 의도를 유

추할 수 있습니다.

Page 5: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

5

시스템 구성

최고 의사 결정자

사용자 인증

운영 및 관리

운영계DB

웹서버웹서버

회원 속성 테이블

관리자

웹로그 수집 및 전송

현업 담당자

분석용 서버분석용 서버

시스템 관리자웹시스템

데이터베이스데이터베이스

보고서 생성

개인별 활동 이력 데이터의 DB Export

패러미터 코드 테이블

Page 6: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

6

웹로그 분석의 범위

카테고리

이벤트

검색

상품 설명

쇼핑 Top

이벤트

베스트 상품

상품 소개

기획전

상품평 보기

www.abc.comSessionSession

· 웹사이트 방문자의 방문 직전의 경로에서 시작하여, 방문을 종료 하기까지의 모든 행동을 추적합니다.

시작 페이지

상품 소개

이벤트

상품 검색

도움말

장바구니 보기

특정 페이지 위치별 서핑 경로 Conversion

회원등록

구매

결제

상품 취소

쿠폰받기

방문 경로

유입 호스트

관계사/제휴사

외부 경로 분석URL ForwardingURL Forwarding

제휴업체 – 여행, 자동차 보험, 도서, 음반, …

제휴사 코드제휴사 코드경쟁사

검색엔진/포털

내부 Host

프로모션 채널

검색어검색어

광고ID광고ID

이메일ID이메일ID

ISP별

관계사/제휴사

내부 Host

그 외 외부Link

Page 7: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

7

기본 보고서 - 리스트와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의 3

가지 대주제 아래 15개의 소주제로 분류된 57종의 보고서를 보실 수 있습니다.

와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의 3

가지 대주제 아래 15개의 소주제로 분류된 57종의 보고서를 보실 수 있습니다.

로그 파일 추이

동시 접속자 추이

유입 추이

전송량 최대값 추이

동시 접속자 최대값 추이

이용 추이

일반 – 일반 추이

회원 첫/재 방문 추이

이용 추이방문자- 이용/접속 추이

국가 방문자 순위

시도 방문자 순위

ISP 방문자 순위

회원 방문자 순위

IP 방문자 순위

방문자- 방문자순위

첫/재 방문 회원 추이

익명 방문자 추이

회원 방문자 추이

IP 방문자 추이

방문 추이 요약

순 방문자 추이 요약

방문자- 순 방문자

이용 요약

순 방문자 요약종합

이름카테고리

이용 현황

일반 – 시간별현황

등록 페이지 순위

단일 페이지 순위

종료 페이지 순위

시작 페이지 순위

페이지 순위

일반 - 페이지순위

상세 현황

검색어 현황

검색 엔진 현황

일반 - 검색 엔진

유입 사이트 현황

유입 도메인 현황일반 - 유입 외부 도메인/사이

트 순위

회원 첫/재 방문 현황

동시 접속자 현황

유입 현황

이용 현황

일반 – 요일별현황

회원 첫/재 방문 현황

동시 접속자 현황

유입 현황

이름카테고리

파일 순위

일반 – 파일 순위

발견안됨 에러 상세 현황

발견안됨 에러참조 페이지 현황

발견안됨 에러 현황

에러 종류 현황

에러 추이

일반 – 에러

운영체제 현황

브라우저 상세 현황

익스플로러 현황

검색 로봇 현황

브라우저 현황

일반 – 에이전트

서버 현황

서버 추이일반 – 서버

도메인 현황

도메인 추이일반 – 도메인

확장자 순위

파일 그룹 순위

다운로드 파일 순위

이름카테고리

Page 8: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

8

기본 보고서 - 예(1)

방문자들은방문자들은 웹사이트를웹사이트를 얼마나얼마나 사용하고사용하고 있습니까있습니까? ? 그그 추이는추이는 어떻게어떻게 변화하고변화하고 있습니까있습니까? ?

방문자 추이 분석방문자 이용 요약

Page 9: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

9

기본 보고서 - 예(2)

방문자들이방문자들이 어떤어떤 경로로경로로 우리우리 사이트에사이트에 들어오는지들어오는지 궁금합니다궁금합니다..

유입도메인 분석

유입 그룹별 분석

Page 10: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

10

고급 보고서 - 메뉴

컨텐츠별 이용 현황

Page 11: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

11

고급 보고서 – 광고

광고 CTR 추이

광고 클릭 현황

Page 12: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

12

고급 보고서 – 시나리오(1)

방문자들이 웹사이트에서 경험하기 바라는 단계를

사전에 정의한 다음, 각 단계에 대한 접근을 분석

합니다.

− 이메일을 통한 상품 구매 효과는?

− 광고를 통한 상품 구매 효과는?

− 이벤트를 통한 상품 구매 효과는?

− 회원가입(또는 세미나 등록)을 하기 전에 얼

마나 많은 방문자들이 떠나는가?

한번의 방문(세션)에서 시나리오로 정의된 단계를

거친 모든 경우를 분석합니다.

특정 외부 호스트나 외부 페이지로부터 방문한 경

우를 포함하여 시나리오를 작성할 수 있습니다.

시나리오의 각 단계에서 사용자가 접근한 패러미

터 값에 따라 상세하게 분석할 수 있습니다.

시나리오의 각 단계를 접근한 사용자 ID를 수 있

습니다.

방문자들이 웹사이트에서 경험하기 바라는 단계를

사전에 정의한 다음, 각 단계에 대한 접근을 분석

합니다.

− 이메일을 통한 상품 구매 효과는?

− 광고를 통한 상품 구매 효과는?

− 이벤트를 통한 상품 구매 효과는?

− 회원가입(또는 세미나 등록)을 하기 전에 얼

마나 많은 방문자들이 떠나는가?

한번의 방문(세션)에서 시나리오로 정의된 단계를

거친 모든 경우를 분석합니다.

특정 외부 호스트나 외부 페이지로부터 방문한 경

우를 포함하여 시나리오를 작성할 수 있습니다.

시나리오의 각 단계에서 사용자가 접근한 패러미

터 값에 따라 상세하게 분석할 수 있습니다.

시나리오의 각 단계를 접근한 사용자 ID를 수 있

습니다.

이메일을 받고 방문한 고객10,000명 (100%)

전체 사이트 방문객1,000,000명

장바구니 담기1,000명(10%)

구매100명(1%)

방문 직전외부 페이지

총 100명이 시나리오 완료. 전체 방문객 대비 0.01%가 시나리오 완성

Page 13: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

13

고급 보고서 – 시나리오(2)

Page 14: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

II. URL과 운영계 DB

1. 웹로그와 운영계 DB에 남는 정보

2. 첫 페이지 분석

3. 동적으로 생성된 URL

4. URL에는 운영계 DB와 관련된 정보가 있다

5. 분석 관점의 변화

Page 15: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

15

웹로그와 운영계 DB에 남는 정보

?

www.abc.com회원 가입을 했다.

25,000원을 카드로 결제했다.

상품평을 썼다.

상품을 검색했다.

주문을 취소했다.

장바구니에 A 물건을 담았다

쿠폰을 사용했다.

결과방문

WEB Log

DB에 남는 정보들...

일반적으로 웹고객과 관련되어 데이터베이스에 남는 정보는 다양한고객 행동 중, 특정 “결과”에 한정됩니다. (구매, 회원가입...)

Web Log에 남는 고객의 행동 데이터를 분석하여− 방문자들이 어떤 과정을 거쳐 해당 결과에 이르게 되었는지의 과정을 이

해할 수 있습니다.

− 의도하는 결과로 전환될 가능성이 높은 잠재 고객들은 누구인지, 그들의관심사는 무엇인지를 파악할 수 있습니다.

− E-Business의 경쟁우위를 달성하기 위해 적절한 실행 방법을 도출하고, 그 효과를 검증할 수 있습니다.

이 정보들은 관련이 있습니다.

Page 16: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

16

첫 페이지 분석(1)

http://kr.yahoo.com/r/i/ga

http://kr.rd.yahoo.com/shop_mantle/*http://kr.shopping.yahoo.com/

/이동/위치/어디로

/이동/어디에서/*어디로

위치 및 이동 경로 분석

Page 17: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

17

첫 페이지 분석(2)로긴 이전 http://mv.daum.net/?_top_G=onair=t1

세밀한 위치 및 경로 분석 남자 로긴 http://mv.daum.net/?_top_26m=onair=t1

http://mv.daum.net/?_top_26f=onair=t1여자 로긴http://mv.daum.net/event/sol_flower/?mode=main&_top_G=onair=Aimg1

http://mv.daum.net/event/sol_flower/?mode=main&_top_G=onair=A1

http://mv.daum.net/main.asp?mode=main&no=761&_top_G=onair=A4

http://dnshop.daum.net/html/event/eventAppliances_040115_1.html?Sid=0001_52010000_03_07&_top_G=shop=Gimg3

0001_52010000_03_07

채널 …

순서

구좌

Page 18: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

18

동적으로 생성된 URL

홈> 스포츠> 스포츠 일반

http://news.joins.com/sports/200403/25/200403251904559271600060106011.html

Page 19: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

19

URL에는 운영계 DB와 관련된 정보가 있다.

http://www.abc.com/CartAdd.jsp?CategoryID=00001&ProductID= aaaa234

http://www.abc.com/MoveCart.cgi?CID=00002&PID= bbbb456

코드 : 카테고리코드 : 상품

상품 50만개

카테고리 5만개

URL에는 운영계 DB와 관련된 정보가 담겨 있습니다.

이 “정보”를 담은 URL 전체를 문자열 상태로 분석하면, 분석의 자유도가 떨어지고 처리 속도가 심각하게느려집니다.

이 “정보”를 URL에서 분리하여 분석해야만 유연한

분석이 가능하고 높은 성능이 보장됩니다.

URL에는 운영계 DB와 관련된 정보가 담겨 있습니다.

이 “정보”를 담은 URL 전체를 문자열 상태로 분석하면, 분석의 자유도가 떨어지고 처리 속도가 심각하게느려집니다.

이 “정보”를 URL에서 분리하여 분석해야만 유연한

분석이 가능하고 높은 성능이 보장됩니다.

Page 20: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

20

분석 관점의 변화

시스템 부하를 측정히트, 페이지뷰, 방문, 방문자수, 전송량

시스템 부하를 측정히트, 페이지뷰, 방문, 방문자수, 전송량시스템 관점

서비스 관점대고객 서비스를 측정

가장 인기있는 페이지, 에러 페이지, 가장 많이 다운로드한 파일, 유입되는 사이트

대고객 서비스를 측정가장 인기있는 페이지, 에러 페이지,

가장 많이 다운로드한 파일, 유입되는 사이트

마케팅 관점고객 서비스를 측정

고객의 관심 카테고리, 네비게이션 패턴, 배너광고의 효과

고객 서비스를 측정고객의 관심 카테고리,

네비게이션 패턴, 배너광고의 효과

수익성 있는 고객을 측정장바구니에 물건을 담은 고객,상품을 자세히 본 고객, 결재고객

수익성 있는 고객을 측정장바구니에 물건을 담은 고객,상품을 자세히 본 고객, 결재고객

세일즈 관점

Page 21: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

III. WiseLog Premium 과URL 코드 추출

1. URL 코드

2. WiseLog Premium의 URL 코드 추출 기능

3. URL 표현식

4. URL 표현식의 활용

Page 22: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

22

URL 코드

웹사이트의 크기가 커지고 지능화 되면서

많은 페이지들이 일정한 의미를 가지는 체

계로 이루어집니다.

이 체계의 중심에는 운영계 DB와 관련있는

코드 정보가 있습니다.

이를 URL 코드라고 명명합니다.

URL 코드를 중심으로 분석을 하면,

− 분석 설정을 위한 반복되는 URL 입력을

획기적으로 줄일 수 있습니다.

− 해당 코드와 운영계 데이터베이스의 정

보를 조인하여 보다 의미 있는 분석 결

과로 가공될 수 있습니다.

− 한번 등록한 패턴에 대해서는 URL의 변

동이 자동으로 반영됩니다.

− 페이지의 표현과는 독립적으로 분석의

도를 반영한 분석을 할 수 있습니다.

웹사이트의 크기가 커지고 지능화 되면서

많은 페이지들이 일정한 의미를 가지는 체

계로 이루어집니다.

이 체계의 중심에는 운영계 DB와 관련있는

코드 정보가 있습니다.

이를 URL 코드라고 명명합니다.

URL 코드를 중심으로 분석을 하면,

− 분석 설정을 위한 반복되는 URL 입력을

획기적으로 줄일 수 있습니다.

− 해당 코드와 운영계 데이터베이스의 정

보를 조인하여 보다 의미 있는 분석 결

과로 가공될 수 있습니다.

− 한번 등록한 패턴에 대해서는 URL의 변

동이 자동으로 반영됩니다.

− 페이지의 표현과는 독립적으로 분석의

도를 반영한 분석을 할 수 있습니다.

운영계DB

http://www.abc.com/CartAdd.jsp?CategoryID=00001&ProductID= aaaa234

http://www.abc.com/MoveCart.cgi?CID=00002&PID= bbbb456

코드 : 카테고리

URL 형태도 다르고 패러미터 이름도 다르지만, 각각카테고리와 상품 이라는 동일한 Namespace를 가집니다. 동일한 Namespace를 ‘코드’ 라 명명합니다.

코드 : 상품

상품 테이블카테고리 테이블

카테고리 ID 카테고리00001 가전/컴퓨터00002 의류 속옷00003 패션잡화00004 …

‘카테고리’ 코드 사전

http://mv.daum.net/main.asp?mode=main&no=761&_top_G=onair=A4

페이지를 표현하기 위한 부분 분석을 위해 코드가 반영된 부분

Page 23: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

23

코드 분석(1)

분석하고자 하는 코드의 의미를 기준으로 페이지의 URL을 그룹핑 하여 분석합니다.

분석 대상인 코드는 다음과 같은 형식을 포함합니다.

분석하고자 하는 코드의 의미를 기준으로 페이지의 URL을 그룹핑 하여 분석합니다.

분석 대상인 코드는 다음과 같은 형식을 포함합니다.

일반적인 동적 페이지 Query 부분의 패러미터

페이지 URL String 내부의 의미 있는 패턴

분석을 위해 URL에 포함시킨 분석용 태그 (페이지 URL과 무관함)

- URL 코드 분석 예 -사이트에서 사용자들이 관심을 가지는 카테고리와 상품을 분석합니다.

관심이 있다 : 상세 상품 페이지, 상품평 보기, 이미지 확대 등을 접근한 경우

분석 하고자 하는 코드의 의미분석 하고자 하는 코드의 의미

카테고리 상품

- URL 코드 분석 예 -사이트에서 사용자들이 관심을 가지는 카테고리와 상품을 분석합니다.

관심이 있다 : 상세 상품 페이지, 상품평 보기, 이미지 확대 등을 접근한 경우

상품 상세 페이지 상품평 보기 이미지 확대

/productDetail.jsp?CID=12&PID=34/productDetail.jsp?CID={*}&PID={*}

/prodeval/c12p34.html/prodeve/c{*}p{*}.html

/product/image.html?_Target=0012_0034_01_02/product/image2.html?_Target=0012_0034_01_02

_Target={$$$$}_{$$$$}_$$_$$;{카테고리}, {상품}

분석 대상 페이지분석 대상 페이지

URL 코드 기준 분석URL 코드 기준 분석

유연하다 !

Page 24: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

24

코드 분석(2)

카테고리 – 상품 별 관심도 분석

상품 검색어 분석

Page 25: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

25

기존의 패러미터 분석(참고)

분석하고자 하는 동적 페이지의 URL을 기준으로 하여 URL에 포함되는 Query 부분의 값들을 분석 하는

작업입니다.

분석하고자 하는 동적 페이지의 URL을 기준으로 하여 URL에 포함되는 Query 부분의 값들을 분석 하는

작업입니다.

패러미터 분석 예패러미터 분석 예

N 쇼핑몰에 대한 상품 URL 체계실제 URL - /Mall/DispList.jsp?CategoryID=01&ProductID=01

패러미터 분석 제목 : 카테고리 및 상품 분석

등록할 페이지 : /Mall/DispList.jsp등록할 패러미터 1 : CategoryID 패러미터 2 : ProductID

등록할 Alias : CategoryID 카테고리 이름01 가전02 의류

같은 의미인데, 동적 페이지가 다른 경우는?

페이지 URL String 내부에 패러미터가 포함되어 있는 경우는?

URL에 상관없이 분석을 위해서 붙여진 태그를 분석하고 싶은 경우는?

서로 다른 페이지를 동일한 관점에서 분석하고 싶은 경우는?

해결할 수없다 !

Page 26: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

26

WiseLog Premium 의 URL 코드 추출 기능

WiseLog Premium은 강력하고 유연한URL 코드 추출 방법을 제공합니다!

복잡하고 비정형적인 페이지들을 유연하게 처리− 수시로 업데이트되는 데이터를 분석에 자동으로 반영할 수 있습니

다.

− 특히, URL 코드는 데이터베이스와 연동하여 보다 의미 있는 분석을하기 위한 연결고리가 됩니다.

WLP 에서는 다음과 같은 URL 코드와 관련된 기능을 제공합니다.− URL 표현식을 사용한 다양한 패턴 지정

− 공통 코드를 기준으로 한 분석 지원

− 외부 페이지 패러미터 분석 지원

− 최대 3개의 코드 그룹별 Drill Down 보고서

− 코드를 통한 외부 데이터베이스 정보 연동

Page 27: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

27

URL 표현식(1)복잡한 URL들

/jsp/front/product/ProductDetail.jsp?CID=C12780&PID=A025_170201100724 Exact URL : 쇼핑몰 취급 상품이 50만개면, 상품에 대한 URL만 50만개URL 패턴 : /jsp/front/product/ProductDetail.jsp?CID={*}&PID={*} 하나만 등록하면 됨.

정확한 분석을 위한 구분http://www.wiselog.com/product /product , /product/ ,

/product/default_page만 포함http://www.wiselog.com/product/ /product/ 는 제외한 모든 자손들

/product/ 로 시작하는 모든 패턴 (예를 들면, /product/wiselog/index.html 도 포함)http://www.wiselog.com/product/* /product/ 의 바로 아래 파일만 포함

유연한 표현특수 문자 ( / , ? , & , = , {} , \ , (패턴1 | 패턴 2 | … | 패턴 N) ) 와와일드 카드 ( $, * , **, [s-e]) 를 사용한 유연한 표현

URL에 대한 표현력(Expressive Power)은 로그 분석기가 얼마나 유연한가를 판단할수 있는 척도입니다.

복잡하고 비정형적인 URL을 일반적인 형식으로 표현할 수 있도록 “URL 표현식”을제공합니다.

URL 표현식은 다음과 같은 이점을 제공합니다.− 정확한 분석을 가능하게 합니다.

− 유연한 분석을 가능하게 합니다.

− 반복적인 URL 입력 필요성 제거합니다.

− 수시로 변하는 URL이 가지는 의미를 자동으로 반영합니다.

− 코드 분석을 가능하게 합니다.

Page 28: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

28

URL 표현식(2)

1. 일반 동적페이지

Home > 생활·계절·소형가전 > 냉장고/냉동고 > 일반냉장고 > 삼성 > 삼성 냉장고 [SRD150IN][145리터] http://www.interpark.com/malls/sitemap/MallDisplay.jsp?COMM_001=0000100000&COMM_002=0&GOODS_NO=1210365&dispNo=001001601001001

위의 URL을 WiseLog Premium에서 등록하는 형태로 표현하면,

http://www.interpark.com/malls/sitemap/MallDisplay.jsp?GOODS_NO={*}&dispNo={$$$}{$$$$$$}{$$$$$$}

GOODS_NO= 상품번호, dispNo 1~3:대분류, dispNo 4~9:중분류, dispNo 10~15:소분류

2. URL 내부에 패러미터가 포함된 경우

Home > 생활·계절·소형가전http://www.interpark.com/malls/main/electronics/electronics_b.html

위의 URL을 WiseLog Premium에서 등록하는 형태로 표현하면,

http://www.interpark.com/malls/main/{*}/{*}.html

내부패턴 1 : electronics, 내부패턴 2 : electronics_b

3. 글로벌 페러미터의 처리http://dnshop.daum.net/?Sid=0001_51030000_00_00 Sid={$$$$}_{$$}{$$}{$$}{$$}_$$_$$

도메인이나 페이지 URL에 상관없이 동일한 이름의 패러미터를 같은 의미로 처리

Page 29: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

29

URL 표현식의 활용 - 설정 화면

Page 30: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

30

URL 표현식의 활용 - 방문자 관심 분석

인기 카테고리

상품평이 많이 조회된 상품

접근 경로별 인기 카테고리/상품

인기 이벤트

Page 31: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

31

URL 표현식의 활용 - 외부 페이지 분석(1)

외부 페이지 분석에 대한 질문들

− 어떤 외부 Host로부터 방문하는가? (관계사,

제휴사, 경쟁사, ISP별, 지역별)

− 많이 방문하는 알려진 사이트들은? (검색엔

진, 포털, 방문할 때의 검색어)

− 어떤 프로모션 채널을 통해서 많이 들어오는

가? (이메일 광고, 외부 광고 등)

− 특정 Host를 통해서 방문한 사용자들은 누구

인가?

미리 등록된 외부페이지 그룹에 따라 알기 쉽게

구분하여 집계 합니다.

외부페이지에 있는 패러미터를 분석하여

유입되는 검색어, 외부 광고 ID, 이메일

ID 등을 추적하여 어떤 검색어, 어떤 광고,

어떤 이메일을 통해서 방문하였는지 분석

합니다.

등록된 외부 페이지에 대해서 사용자 ID를 추적

하여 특정 페이지를 통해 방문한 사용자를 구별

합니다.

외부 페이지 분석에 대한 질문들

− 어떤 외부 Host로부터 방문하는가? (관계사,

제휴사, 경쟁사, ISP별, 지역별)

− 많이 방문하는 알려진 사이트들은? (검색엔

진, 포털, 방문할 때의 검색어)

− 어떤 프로모션 채널을 통해서 많이 들어오는

가? (이메일 광고, 외부 광고 등)

− 특정 Host를 통해서 방문한 사용자들은 누구

인가?

미리 등록된 외부페이지 그룹에 따라 알기 쉽게

구분하여 집계 합니다.

외부페이지에 있는 패러미터를 분석하여

유입되는 검색어, 외부 광고 ID, 이메일

ID 등을 추적하여 어떤 검색어, 어떤 광고,

어떤 이메일을 통해서 방문하였는지 분석

합니다.

등록된 외부 페이지에 대해서 사용자 ID를 추적

하여 특정 페이지를 통해 방문한 사용자를 구별

합니다.

외부 Host

EMS, AMS, MDS, …

많이 알려진 사이트

검색엔진, 포털, …

관계사/제휴사/경쟁사

ISP 별/지역별

커뮤니티, 메일, 채팅…

내부 Host

프로모션 채널

메일 아이디, 광고아이디, …

검색어검색어

Page 32: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

32

URL 표현식의 활용 - 외부 페이지 분석(2)

캠페인별 상세 현황

관계사/게열사 사이트에서의 유입

Page 33: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

33

획기적인 성능 향상

WiseLog Premium은대용량의 로그 파일을 빠르고 정확하게 분석합니다.

Daum, 엠파스, 벅스뮤직, 엔씨소프트, Nate.com, 넥슨, 하나로 통신 등국내 100여 개의 대형 사이트에 설치되어 현재 안정적으로 운영중입니다.

− E 검색 사이트의 하루 2GB 로그를 약 13분내에 분석· 2월 12 ~ 13일 평균

− 테스트 장비· Server :Intel SR2300· CPU: Intel Xeon 2.4G Hz * 2EA· MEM: 2Gbyte· SCSI controller : Adaptec I2O RAID-5 * 2EA (/home/log, /home/report)· OS: RedHat 7.2 · kernel: 2.4.24-stable· gcc-2.95.4-stable

Page 34: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

IV. 운영계 연동 분석

1. 웹-운영계 연동 분석 방법

2. 운영계 정보 Import

3. DB Export를 통한 연동

4. 웹-운영계 통합 분석 시스템

Page 35: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

35

웹-운영계 연동 분석 방법

웹로그를웹로그를 단순히단순히 DBDB에에 저장저장

WeblogWeblog 자체를자체를 DBDB에에 그대로그대로저장하거나저장하거나,,

단순한단순한 변환만을변환만을 거쳐서거쳐서 DBDB에에 저장저장

소형소형 웹사이트나웹사이트나,,

단순한단순한 분석인분석인 경우에경우에 적합적합

운영계운영계 정보를정보를 웹분석에웹분석에 활용활용

운영계운영계 정보를정보를 로그로그 분석기로분석기로 ImportImport

사용자속성사용자속성, , 카테고리정보카테고리정보, , 코드정보코드정보 등등

웹분석의웹분석의 결과를결과를 운영계로운영계로가져가서가져가서 분석함분석함

웹분석의웹분석의 결과를결과를 DB Export DB Export 를를 통해통해분석분석 시스템으로시스템으로 전송전송

웹분석과웹분석과 연동연동 분석분석 부분이부분이LooselyLoosely--Coupled Coupled 됨됨

웹웹--운영계운영계 통합통합 분석분석 시스템시스템

웹웹 데이터마트를데이터마트를 구축하고구축하고, , 운영계운영계 통합통합시스템을시스템을 구축구축

웹분석의웹분석의 결과에서결과에서 웹웹 데이터마트를데이터마트를갱신하는갱신하는 과정이과정이 일관되게일관되게 관리됨관리됨

WiseLog BI SuiteWiseLog BI Suite

Page 36: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

36

운영계 정보 Import

인구통계학 정보 반영한 이용 통계

신규, 기존 가입자들의 이용 통계

상품 정보 반영 통계

Page 37: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

37

운영계 정보 Import - 방문자 속성 조합 보고서

Page 38: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

38

운영계 정보 Import - 인트라넷 보고서

Page 39: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

39

운영계 정보 Import - 회원 타겟팅

최근 한달간 사이트를 방문해서 제품과 관련된 상품평, 상품 이미지 확대, 상품 상세 보기, 상품 추천, 보관 바구니 담기 등의 행위를 한 고객 중 실제로 구매를 하지 않은 고객이 잠재고객입니다.

Excel로 명단 추출

고객 명단 추출

ID 추출 / 회원 속성별 다차원 분석잠재 고객 정의

Page 40: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

40

DB Export를 통한 연동

웹로그 1,2,…,n

RefPageIDRefPage NameRefPage URLDescription…….

UserIDRefPageIDAccessTimeDescription…….

UserIDPageViewDurationVisitDate ….

유입 페이지 속성테이블

유입 페이지 속성테이블

회원별 유입 페이지 이력테이블

회원별 유입 페이지 이력테이블

회원별 요약 테이블회원별 요약 테이블

로그 분석 서버

외부데이터베이스

웹로그로부터 회원ID별 행동 이력 데이터를추출, 데이터베이스에 테이블 형태로 적재하여 다양하게 활용합니다.

웹로그로부터 회원ID별 행동 이력 데이터를추출, 데이터베이스에 테이블 형태로 적재하여 다양하게 활용합니다.

DW/OLAP데이터마이닝개인화/추천고객 세그멘테이션캠페인 관리이메일 마케팅…..

페이지속성 테이블페이지속성 테이블PageIDPage NamePage URLDescription… UserID

PageIDAccessTimeStatus……

회원별 페이지 접근 이력테이블

회원별 페이지 접근 이력테이블

WiseLog Premium

Page 41: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

41

웹-운영계 통합 분석 시스템

웹서버

검색 서버

웹로그

검색 서버 로그

캐쉬 서버 로그

캐쉬 서버

로그 수집로그 수집

스케줄링스케줄링

전송 관리전송 관리

통합 로그 분석통합 로그 분석

Configuration ManagerConfiguration Manager

RecoveryRecovery

Data MartData Mart

고객분석 Template고객분석 Template

통합 분석 Template통합 분석 Template

비즈니스 분석 Template비즈니스 분석 Template

ETLETL

통합 분석 Data Mart통합 분석 Data Mart

Reporting ServerReporting Server

통합 분석 서버

운영계 DB 서버

고객, 컨텐츠, 매출

트래픽 분석 보고서

Customized 보고서

Web Data MartWeb Data Mart

WiseLog BI Suite

백업 및 후처리백업 및 후처리

OLAP Server, Marketing Automation

비즈니스 분석 보고서

EMS, AMS, 캠페인

마케팅 서버

Page 42: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

42

웹-운영계 통합 분석 - 구매 의사 분석

사용자 별 접근 회수를 추적하여 구매 의사 분석 모델에따라 스코어링 하고, 잠재 고객을 파악하여 타겟 마케팅을 펼칠 수 있습니다.

구매 의사 분석(잠재 고객 분석)

경매 도우미경매 도우미

구매 의사 결정 페이지구매 의사 결정 페이지

관심 물품 등록관심 물품 등록

상품 검색상품 검색

문의 게시판문의 게시판

경매 참가 (입찰)경매 참가 (입찰)

Page 43: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

43

웹-운영계 통합 분석 - 고객 이력 관리

고객

ID 나이 성별 직업 최초방문 최근방문 최근구매횟수 최근구매경로 최근구매일자 최근2주간방문 관심카테고리 구매의사스코어김성민 31 남 회사원 네이버 드림위즈 5 기획전 2003-12-01 3 카메라/캠코더 B

방문 및 구매 이력 관리 관심 카테고리, 상품 분석방문 Active 분석 구매 의사 분석

Page 44: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

V. WiseLog Premium 세부 기능 내역

Page 45: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

45

WiseLog Premium 세부 기능 내역 (1)

회원 프로파일을 연동하여 회원성향별 다차원 방문자 분석회원 프로파일 연동

임의의 기간에 대해 and/or/not 등 다양한 조건으로 타겟팅 대상 회원리스트를 추출

다양한 조건의 방문자 ID 추출

등록 페이지/시나리오/외부페이지에 접근한 방문자 ID 추출등록 페이지별/시나리오/외부페이지별 ID 추적

ID별 방문 History 일별 요약 (ID별 페이지뷰, 머문시간 등)ID별 방문 Summary

로긴 회원의 로긴 이전 활동을 추적하여 동일인의 활동으로 파악로긴 이전 세션통합

로그파일의 쿠키 기준의 ID 및 세션 추출쿠키분석

회원분석(Customer ID)

동일 페이지를 Referrer 페이지에 따라 별도 페이지로 구분Referrer 기준 페이지 구분

브라우저로 웹사이트를 직접 탐색하여 Drag&Drop으로 페이지 등록페이지 추적 지원툴 (Page Tracer)

일반 URL(Stem)에 남겨지는 코드 정보를 추출Stem Parameter 인식

표현식을 통한 다양한 페이지 패턴 인식URL 표현식 지원

페이지 인식(Page Recognition)

Physical Name 데이터를 Logical Name/Group으로 매핑하여 통합 관리(외부페이지/페이지/코드/IP/ID/사용자 속성 정보/ 브라우저 관리/파일 그룹) 분석에 선택적 반영

메타데이터의 통합 관리메타데이터 관리

(Meta Data Manager)

지원복수도메인 통합분석

지원서버 클러스터 분석

지원대용량 로그처리

분석 성능(Analysis)

자체 개발 웹서버 탑재로 설치 및 관리 용이자체 웹서버 탑재

JAVA/XML/C++개발 언어

Windows/Linux/Unix지원플랫폼

일반(General)

DescriptionFunctionGroup

Page 46: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

46

WiseLog Premium 세부 기능 내역 (2)

광고/이미지의 CTR(Click Thru Rate) 측정광고 효과 분석광고분석

(Ad Analysis)

메뉴 그룹별 Drill Down 보고서 (대분류>중분류>소분류….)그룹별 Drill Down Report

복수개의 콘텐츠 그룹 보고서 (전체/콘텐츠별/채널별…) 복수 메뉴 분석메뉴분석(Contents Group

Analysis)

사용자 정의 ID 그룹별 방문자 현황ID별 방문자 그룹 분석

사용자 정의 IP 대역 그룹별 방문자 현황IP대역별 방문자 그룹 분석인트라넷분석(Intranet Analysis)

시나리오 단계별 방문자 참여 현황을 코드 단위로 상세히 분석시나리오별 코드별 분석

외부 페이지를 시나리오 분석 단계에 포함 (이메일 마케팅 효과 등 파악)

외부 페이지 포함 시나리오분석

방문자 세션을 추적하여 선 정의된 시나리오 단계별 방문자 참여 현황분석

세션 기준의 시나리오분석

시나리오분석(Scenario Analysis)

외부 페이지 그룹별 유입효과를 코드 단위로 상세히 분석외부 페이지 패러미터 분석

사용자 정의 외부 페이지 그룹별 유입 효과 분석외부 페이지 그룹별 분석외부페이지 분석(Foreign Page Analysis)

코드 기준으로 복수 페이지의 그룹화/전역 코드 지정공통 코드 기준의 복수 페이지 그룹화

최대 3 단계의 그룹별 Drill-Down 보고서 지원코드 그룹별 Drill Down 보고서코드분석(Code Analysis)

동시 접속 사용자의 현황 및 추이동시 접속 사용자 분석

방문자 PC의 운영체제/브라우저 종류 및 버전 현황클라이언트 운영체제/브라우저 분석

서버별 트래픽/전송량/에러 현황 (404 에러 포함) 및 추이서버별 트래픽/에러 분석

방문자의 지역별/ISP별/국가별 분포시도별/ISP별/국가별 방문자분석

사이트 방문 유도 외부 검색엔진/검색어 현황외부 검색엔진/검색어별 분석

사이트 방문 유도 페이지를 도메인, 사이트, URL 단위로 리포팅참조도메인/사이트/페이지 분석

페이지별/파일별/다운로드 파일별 이용 현황 및 추이페이지/파일/다운로드파일 분석

전체 분석 결과의 요약 보고서요약 보고서

트래픽분석(Traffic Analysis)

DescriptionFunctionGroup

Page 47: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

47

WiseLog Premium 세부 기능 내역(3)

회원ID별 접근 이력(등록페이지/외부페이지/요약히스토리/페이지속성)테이블의 DB 적재

회원별 활동 이력의 DB ExportDB Export

보고서별 설정 및 조회 권한 관리사용자 권한 부여

분석결과를 특정 디렉토리에 백업/복구분석결과 백업 및 복구

시스템 접근 IP 통제 (자체 웹서버로 설치시)시스템 접근 IP 제어

분석 결과를 등록된 사용자의 메일로 통지분석결과 메일 알림

관리(Admin)

리포트에서 측정값을 동적으로 선택측정값 선택

리포팅 결과 중 특정값 검색 및 필터Search & index

상위 80%에 해당하는 값들만 표현, 나머지는 기타로 처리80/20분석

지원Excel/Word 보고서 포맷 지원

보고서 테이블의 측정값 기준 정렬Table Column별 sorting

보고서 이름/위치/그룹핑을 사용자가 정의사용자 정의 보고서

두 기간의 통계를 하나의 보고서에서 비교비교 보고서

보고서상에서 임의 기간을 선택하여 분석결과 조회일/주/월/분기/특정기간별 통계

Web Browser를 통한 원격 관리 및 보고서 조회Web Browser를 통한 원격 접근

리포팅(Reporting)

특정 URL(패턴)을 전체 집계에서 제외/페이지뷰 집계에서만 제외/분석 리포트에서만 제외

집계 제외/페이지뷰 집계 제외/결과에서제외

방문자 IP/URL/File Type/레퍼러 URL을 집계에서 include/excludeIP, File TYPE, Referrer 필터링필터링

(Filtering)

레퍼러 페이지 기준의 직전/직후 페이지 모두 추적레퍼러기준 경로분석

특정 페이지 기준의 이전N단계, 이후 N단계 경로 추적 (등록 페이지만대상)

등록페이지간의 경로분석경로분석(Path Analysis)

DescriptionFunctionGroup

Page 48: URL에남겨진DB의흔적 · 기본 보고서 - 리스트 와이즈로그 프리미엄은 별도의 설정 없이 기본적인 로그 분석을 통하여 종합, 방문자, 일반의

48

Q & A

[email protected]

www.wiselog.com