38
工學碩士學位論文 위치정보와 의사결정 트리 기법을 이용한 개인화된 추천 시스템 A Personalized Recommender System using Decision Tree based on Location 2006年 2月 仁荷大學校 大學院 컴퓨터 情報工學科

위치정보와 의사결정 트리 기법을 이용한 개인화된 추천 시스템 · 구하는 방식이다. 둘째는 gps의 3분~10분에 이르는 긴 워밍업 시간을 없

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • 工學碩士學位論文

    위치정보와 의사결정 트리 기법을

    이용한 개인화된 추천 시스템

    A Personalized Recommender System

    using Decision Tree based on Location

    2006年 2月

    仁荷大學校 大學院

    컴퓨터 情報工學科

    李 培 熙

  • 工學碩士學位論文

    위치정보와 의사결정 트리 기법을

    이용한 개인화된 추천 시스템

    A Personalized Recommender System

    using Decision Tree based on Location

    2006年 2月

    指導敎授 趙 根 植

    이 論文을 工學碩士學位論文으로 提出함

    仁荷大學校 大學院

    컴퓨터 情報工學科

    李 培 熙

  • 이 論文을 李培熙의 碩士學位 論文으로 認定함.

    2006年 2月

    主審 (印)

    副審 (印)

    委員 (印)

  • - i -

    요 약

    인터넷의 급속한 성장에 부흥하여 무선 인터넷에 대한 관심과 연구가

    활발히 이루어지고 있다. 무선 인터넷과 모바일 디바이스를 이용한

    m-commerce는 e-commerce에 이은 새로운 비즈니스 분야로 자리 잡아

    가고 있다. 이러한 무선 인터넷을 이용한 m-commerce의 가장 큰 특징은

    기존의 인터넷보다 더욱 개인화된 서비스와 사용자의 이동성에 기반을 둔

    고유의 정보를 제공할 수 있는 것이다. 현재 상용화 되고 있는 네비게이션

    시스템은 사용자의 위치 정보를 이용한 대표적인 서비스이며 위치에 기반

    을 둔 레스토랑, 호텔, 상점 등의 검색 기능도 갖추고 있다. 하지만 단순히

    위치에 기반을 둔 검색 기능은 사용자의 개인적, 공간적 특성을 고려하지

    않음으로써 서비스로서의 제 기능을 발휘하지 못하고 있다. 이를 개선하기

    위해 본 논문에서는 사용자의 위치에 기반을 둠과 더불어 개인화된 추천

    서비스도 가능한 시스템을 제안한다. 개인화를 위해 기존의 데이터 마이닝

    기법 중의 하나인 의사결정 트리를 사용하여 사용자들의 데이터를 분석하

    여 사용자의 관심사를 파악하고 레스토랑과의 거리를 측정하여 위치 정보

    에 기반을 둔 추천 목록을 생성한다. 위치 기반의 추천과 개인화 기반의

    추천에 각각 가중치를 부여하여 보다 효과적인 추천 목록을 제공한다. 본

    논문에서는 실험을 통하여 제안된 시스템의 성능 평가를 위해 위치를 고려

    하지 않은 추천 시스템과 비교를 하고 위치와 사용자의 관심사를 동시에

    고려한 시스템과 가중치까지 부여한 시스템과의 비교를 하였다. 그 결과,

    사용자의 관심사와 위치를 기반으로 가중치까지 부여된 추천 시스템이 기

    존의 추천 시스템보다 높은 성능을 보임을 확인할 수 있었다.

  • - ii -

    ABSTRACT

    Since Internet has been rapidly developed, studies and interests

    show for wireless Internet are actively achieving. M-commerce

    which using wireless Internet and mobile device has settled in new

    business field followed by e-commerce. The most significant feature

    of m-commerce using those wireless Internet is that it has more

    personalized and provide characteristic informations based on user's

    moving capacity.

    The common uses of in-car satellite navigation systems is a

    typical service of using information of one's location that also has

    search function to find restaurants, hotels and stores etc. But that

    search capacity wouldn't be a proper service since it's simply based

    on the location doesn't consider of user's individual, area-wise

    peculiarities.

    To improve those service, in this paper is proposing a system

    using user's location with personalized recommender service. For

    personalizing, it uses decision tree which is one of data mining

    technique to analyze user's data for finding one's interests then

    measure the distance to certain restaurants and creates

    recommender list based on the locational information.

    By giving weight to each of location-basis recommender and

    personalize-basis provides more efficient recommender list. Made a

    comparative study with recommender system of non-locational

    basis, recommender system of location and individual interests

    counted in and recommender system of all above with given weight

    for a performance testing of the suggested system.

    As a result, user's interests and location-basis recommender

    system with given weight was more highly efficient than previous

    recommender system.

  • - iii -

    목 차

    요 약 ································································································· ⅰ

    ABSTRACT ······················································································ ⅱ

    제 1 장 서 론 ···················································································· 1

    제 2 장 관련 연구 ·········································································· 3

    2.1 위치 기반 서비스 ························································································· 3

    2.2 개인화된 추천 시스템 ················································································· 5

    2.3 데이터 마이닝을 이용한 예측 ··································································· 7

    제 3 장 위치 기반의 개인화된 추천 시스템 ···························· 12

    3.1 시스템 구조 ································································································· 12

    3.2 위치 기반의 추천 ······················································································· 13

    3.3 개인화된 추천 ····························································································· 14

    3.4 가중치를 적용한 통합 추천 ····································································· 19

    제 4 장 실험 및 결과 ···································································· 21

    4.1 실험 환경 및 데이터 집합 ······································································· 21

    4.2 실험 평가 방법 ··························································································· 23

    4.3 실험 결과 및 분석 ····················································································· 24

    제 5 장 결론 및 향후 연구 ·························································· 28

    참고 문헌 ·························································································· 30

  • - 1 -

    제 1 장 서 론

    인터넷의 급속한 성장에 부흥하여 무선 인터넷에 대한 관심과 연구가 활

    발히 이루어지고 있다. 무선 인터넷과 모바일 디바이스를 이용한

    m-commerce는 기존의 유선 기반의 e-commerce에서 해결하지 못하는

    이동성과 개인화를 충분히 제공할 수 있어 m-commerce만의 영역을 확대

    해 가고 있다. 이렇듯 무선 인터넷을 이용한 m-commerce의 가장 큰 특

    징은 기존의 인터넷보다 더욱 개인화된 서비스와 사용자의 이동성에 기반

    을 둔 고유의 정보를 제공할 수 있는 것이다.

    개별 고객의 특수한 요구(needs)를 개별적으로 파악하고 각각의 고객에

    게 차별화 된 서비스를 제공하는 것이 그 핵심이다. 이를 이용하여 기업은

    개별 고객과의 관계증진을 통해 고객 유지율을 상승시키고 차별화 된 서비

    스의 제공하여 신규 고객의 유치에 나선다. 개별 고객과의 일대일 마케팅

    은 차별화 된 서비스를 제공하기 위한 효율적인 수단이 되며, 이를 가능하

    게 하기 위해서는 고객 데이터베이스, 상호 작용성, 맞춤화의 세 가지의 요

    소가 요구된다 [9][17].

    기존의 e-CRM, e-Business 등에서는 개인화된 서비스를 위해 고객의

    프로파일 정보, 구매 이력 데이터, 제품 정보 등과 같은 요소만을 이용하여

    개별 고객의 취향을 파악하고 해당 서비스를 제공했다 [12][14]. 하지만

    이러한 서비스는 이용자의 개인적, 공간적 특성을 고려되지 않은 정보가

    제공됨으로써 사용자에게 적절한 정보 및 서비스임에도 불구하고 제 기능

    을 발휘하지 못하는 경우가 발생한다. 하지만 여기에 최근의 GPS(Global

    Positioning System)와 무선 데이터 전송 능력이 있는 휴대용 단말기의

  • - 2 -

    출현 및 이동/무선 컴퓨팅 기술의 발전은 모바일 컴퓨팅의 진보를 이끌었

    으며 이로 인하여 공간상의 위치 식별 기술 및 GIS 기술과 결합되어 이동

    중인 클라이언트에게 다양한 생활 정보 서비스를 제공할 수 있는 모바일

    정보 액세스와 같은 영역을 창출하였다 [21].

    현재 상용화 되고 있는 네비게이션 시스템은 사용자의 위치 정보를 이용

    한 대표적인 서비스이며 위치에 기반을 둔 레스토랑, 호텔, 상점 등의 검색

    기능도 갖추고 있다. 하지만 단순히 위치에 기반을 둔 검색 기능은 사용자

    의 개인적, 시간적 특성을 고려하지 않음으로써 서비스로의 제 기능을 발

    휘하지 못하고 있다. 이를 개선하기 위해 본 논문에서는 사용자의 위치에

    기반을 둠과 더불어 개인화된 추천 서비스도 가능한 시스템을 제안한다.

    개인화를 위해 기존의 데이터 마이닝 기법 중의 하나인 의사결정 트리를

    사용하여 사용자의 데이터를 분석하여 사용자의 관심사를 파악하고 레스토

    랑과의 거리를 측정하여 위치 정보를 기반으로 둔 목록을 생성한다. 위치

    기반의 추천과 개인화 기반의 추천에 각각 가중치를 부여하여 보다 효과적

    인 추천 목록을 제공한다. 제안된 시스템의 성능 평가를 위해 위치를 고려

    하지 않은 추천 시스템과 비교를 하고 위치와 사용자의 관심사를 동시에

    고려한 시스템과 가중치까지 부여한 시스템과의 비교하였다. 그 결과, 사용

    자의 관심사와 위치를 기반으로 가중치까지 부여된 추천 시스템이

    기존의 추천 시스템보다 높은 성능을 보였다.

  • - 3 -

    제 2 장 관련 연구

    2.1 위치 기반 무선 인터넷 서비스

    무선 인터넷의 특징은 각 개인의 단말기 사용에 따른 더욱더 개인화된 서비

    스를 활용할 수 있고, 이동하며 사용할 수 있는 이동성을 지닌다는 것이다. 이

    에 따라 많은 연구 기관들은 사용자 위치 기반의 서비스를 제공하는 위치 기

    반 무선 인터넷을 핵심적인 서비스로 보고 있다. 이런 위치 기반의 무선 인터

    넷의 배경으로는 2001년 10월까지 사용자의 위치에 대하여 100m 이내의 정

    확도로 구조 요청 기능을 각 이동 통신사가 제공해야 된다는 미국 통신위원회

    의 1996년 규정, E-911에서 비롯되었고, 이 후, 무선 통신을 이용하여 위치

    를 결정하는 두 가지 위치 결정 시스템, 즉 GPS(Global Positioning System)

    칩셋을 휴대폰에 내장하는 방법과 통신망으로부터의 파일럿 신호를 이용하여

    통화자의 위치를 얻는 방법의 발전에 기인한다 [8].

    위치 기반 서비스의 핵심적인 무선 측위 기술인 GPS 기반 무선 측위 기술과

    네트워크 통신망 기반 무선 측위 기술 그리고 위치 기반 응용 서비스에 대하

    여 좀더 알아보도록 한다.

    2.1.1 GPS 기반 무선 측위

    GPS는 24개의 인공위성을 이용하여 위성신호를 해석함으로써 사용자의

    3차원 위치를 장소와 시간에 관계없이 얻을 수 있도록 고안된 군사적 장

    치이다. 현재 GPS를 단말기에 사용하는 방법은 두 가지로 나누어진다. 첫

    째는 저전력의 GPS 칩셋을 단말기에 내장하거나 PDA(Personal Digital

  • - 4 -

    Assistant)에 GPS모듈을 부착하는 방식에 의해서 단말기 자체에서 위치를

    구하는 방식이다. 둘째는 GPS의 3분~10분에 이르는 긴 워밍업 시간을 없

    애기 위해 기지국에서 위성궤도 정보를 단말기에 전달하고, 단말기는 위성

    으로부터의 의사거리 데이터를 기지국에 전송함으로써, 기지국에서 위치를

    짧은 시간 안에 구하는 방식이다 [10].

    2.1.2 네트워크 통신망 기반 무선 측위

    이동통신에서 기지국의 위치는 고정되어 있기 때문에 기지국(BS)에서 이동

    국(MS)까지의 거리를 정확히 알면, 이동국의 위치를 얻을 수 있다 [7]. 기지

    국과 이동국 사이의 거리를 알기 위해서 신호의 전달시간을 상관기와

    DLL(Delay-Lock-Loop)에 의해 계산하게 된다. 이와 같이 하여 동시에 3개

    이상의 기지국에서의 거리를 계산하게 되면 삼각 측량법에 의하여 이동국의 2

    차원 위치를 결정하게 된다.

    2.1.3 위치 기반 서비스 실례

    위치 기반 응용 서비스는 앞으로 큰 효용가치만큼 다양하다. [표 1]과 같이

    위치 기반의 서비스는 위치 기반 정보 서비스, 항법/추적 서비스, 위치 기반

    상거래, 공익 서비스, 기타와 같이 5가지의 종류로 나누어 분류할 수 있다. 인

    접 지역 정보 제공 등의 무선 GIS, 위치 기반의 광고 서비스, 사용자 지역을

    기반으로 한 비교 쇼핑 등은 인터넷 전자상거래(E-Commerce)와 더불어 무

    선 인터넷에서의 전자상거래(M-Commerce) 중의 핵심 부문이라고 볼 수 있

    다. 위치 기반 광고 서비스는 등록된 사용자가 특정 지역에 위치하여 있을 때,

    단말기를 통하여 정보를 제공 받는 것이다. 인접 상점의 광고, 그 지역에서 일

  • - 5 -

    분류 서비스

    위치 기반 정보 서비스 지도 서비스, 교통 정보 서비스, 여행 가이드

    항법/추적 서비스 최적 경로 계산, 차량 항법 및 물류 관제

    위치 기반 상거래 Mobile 전자상거래, 광고 서비스, 비교 쇼핑

    공익 서비스 구조 요청, 범죄 신고, 기상 예보

    기타 게임

    어나는 이벤트를 알려줌에 의해서, 다른 인터넷 서비스에 비해 타겟화된 서비

    스를 하게 된다.

    [표 1] 위치 기반 응용 서비스의 분류

    2.2 개인화된 추천 시스템

    현재 개인화는 최근에 많이 거론되고 있는 e-CRM, e-Business의 중

    요한 부분을 차지하고 있는 요소로서 이에 대한 논의는 개인화가 주는 영

    향력과 효과 분석 측면에서 주로 진행되고 있다. 이러한 개인화 기술 및

    개념은 이미 상당한 영향력을 보이며 인터넷에 적용될 핵심 기술로 떠오른

    지 오래다. Amazon.com[5]이나 CDnow.com[6]등의 좋은 선례를 통해

    개인화가 매출 증대 및 고객 확보뿐만 아니라 여러 가지 다양한 혜택을 제

    공하고 있다는 것을 알게 되었다. 현재 국내에서도 대형 온라인 쇼핑몰,

    Portal을 중심으로 이에 대한 적용을 다각도로 적용되고 있다 [18][22].

    사용자들의 측면에서 추천 시스템을 이용하여 개인화를 원하는 첫 번째

    이유는 시간의 절약이다 [15]. 자신의 주변에 존재하는 다양하고 많은 레

    스토랑 중에서 자신이 원하는 레스토랑을 찾기 위해서 많은 시간을 들여야

    하는 경우가 많아진다. 만일 사용자가 자신이 원하는 레스토랑을 복잡한

  • - 6 -

    과정을 거치지 않고 얻을 수 있는 시스템이 있다면 당연히 사용하려고 할

    것이다. 두 번째 이유는 개인화가 사용자들에게 자신만의 선택을 가능하게

    해 주는 데 있다 [2]. 다수의 사용자가 선택하는 레스토랑이 아닌 자신의

    취향에 맞는 레스토랑을 선택하는 것이다. 개인화의 세 번째 장점은 개인

    들이 관심을 갖고 있는 레스토랑의 광고, 이벤트, 할인 정보 등의 개인화된

    서비스를 받을 수 있다는 점이다 [19]. 다음은 개인화를 실현하기 위하여

    사용하는 방법들이다.

    2.2.1 규칙 기반 필터링(Rule-based filtering) 방식

    개인화의 방법 중 가장 기초적이고 일반적인 것은 규칙 기반 필터링

    (Rule-based filtering)이다. 이 방법은 사용자에게 개인 신상, 관심 분야,

    선호도 등에 대한 몇 가지 질문을 하는 것이 일반적이다. 예를 들어 나이,

    성별, 직업, 지출액, 특정한 사항에 대한 선호도 등을 묻는다. 시스템은 질

    문을 통해 얻어진 그 사람에 대한 정보들로 사용자 프로파일(Profile)을 생

    성하게 된다. 추천 시스템은 이렇게 수집된 사용자의 인구통계학적/심리적

    정보와 사용자의 선호도 정보에 알맞은 레스토랑 정보 및 추천을 제공하는

    것이다.

    2.2.2 협력적 필터링(Collaborative filtering) 방식

    협력적 필터링(Collaborative filtering)은 사용자들의 기초 정보와 고객

    들의 선호도/관심 표현을 바탕으로 선호도/관심에서 비슷한 패턴을 보이는

    고객들을 묶는 것을 통해 고객 서비스의 방향을 결정한다. 즉 비슷한 취향

    을 가진 고객들에게 아직 구매하지 않은 상품들을 교차 추천하거나 분류된

  • - 7 -

    고객의 취향이나 생활 형태에 따라 관련 상품을 추천하는 형태로 서비스를

    제공하게 된다. Ringo[16], GroupLens[4]와 같은 시스템이 협력적 필터

    링 방식에 기반을 둔 개인화 추천 시스템이다.

    2.3 데이터 마이닝을 이용한 예측

    데이터 웨어하우스(data warehouse)와 데이터베이스(database)가 정보기

    술의 도움으로 급속히 발달하면서 고객과 상품, 그리고 거래에 관한 정보

    가 증가하고 있다. 데이터 마이닝은 대용량의 데이터베이스로부터 정보를

    추출하는 과정이라 볼 수 있다. 구체적으로는 데이터베이스에 존재하는 자

    료에 내재하고 있는 변수들 간의 숨겨진 관계를 패턴 인식기술, 통계기법,

    수학적 알고리즘 등을 이용하여 찾아내는 것을 의미한다 [13].

    일반적으로 데이터 마이닝을 위해 사용되고 있는 기법들을 살펴보면 분류

    (classification), 연관 규칙(Association Rule), 군집화(clustering) 등을 들

    수 있다. 이러한 마이닝 기법 중에서 분류 기법중의 하나인 의사결정 트리

    와 연관 규칙(Association Rule) 기법의 내용을 기술한다.

    2.3.1 의사결정 트리 (Decision Tree)

    의사결정 트리는 데이터 마이닝의 분류 작업에 주로 사용되는 기법으로,

    과거에 수집된 데이터의 레코드들을 분석하여 이들 사이에 존재하는 패턴,

    즉 부류별 특성을 속성의 조합으로 나타내는 분류모형을 나무의 형태로 만

    드는 것이다. 이렇게 만들어진 분류모형은 새로운 레코드를 분류하고 해당

    부류의 값을 예측하는데 사용된다 [3]. 의사결정 트리를 만드는 가장 보편

    적인 알고리즘으로는 [그림 1]과 같은 C4.5 Algorithm이 이용된다. 그리

  • - 8 -

    [그림 1] C4.5 알고리즘

    Function decision_tree(example_set, Properties(Attribute))begin if all entries in example_set are in the same class then return a leaf node labeled with that class else if Properties is empty then return leaf node labeled with disjunction of all classes else begin select a property, P, to text on and make it root of current tree; delete P from properties; for each value, V, of P, begin create a branch of the tree labeled with V let partition be elements of example_set with V for property P; call induce_tree(partition, Properties), attach result to branch V end; end;end

    고, C4.5 Algorithm의 기본적인 전략은 다음과 같다.

    트리는 훈련 샘플들을 나타내는 단일 노드로 시작한다.

    샘플들이 모두 같은 클래스라면 노드는 잎이 된다.

    그렇지 않으면 정보 이득(information gain)이라는 엔트로피(entropy)

    기반 척도를 사용하여 샘플들을 가각의 클래스로 가장 잘 분리하는 속

    성을 선택한다.

    속성 비교를 통해 분할된 샘플들은 의사결정 트리를 형성하기 위해서

    동일한 과정을 재귀적으로 수행한다.

    노드의 모든 샘플들이 같은 클래스에 속하거나 남아있는 속성이 없는

    경우 재귀적 분할을 정지한다.

    정보 이득(information gain) 척도는 트리의 각 노드에서 검사 속성을 선

    택하는데 사용된다. 가장 큰 정보이득을 가지는 속성이 현재 노드에 대한

  • - 9 -

    I (s1, ..., sm ) = − Σi= 1

    m

    pi log2 (pi ) (1)

    E (A ) = Σj= 1

    v s1j + ... + smjs

    I (s1j, ..., smj ) (2)

    I (s1j, ..., smj ) = − Σi= 1

    m

    pij log2 (pij ) (3)

    검사 속성으로 선택되며 다음과 같은 과정으로 계산한다.

    S를 s개의 샘플 데이터를 가자는 집합, 클래스 레이블 속성은 m개의 상

    이한 클래스 Ci(i=1, ...., m)을 정의 하는 m개의 상이한 값을 갖는다고 가

    정하자. 샘플 S에 있는 클래스 Ci의 샘플 개수를 si라고 하자. 주어진 샘플

    을 분류하는데 요구되는 기대 정보량(expected information)은 식(1)과 같

    다.

    여기서 pi는 임의의 샘플이 클래스 Ci에 속할 확률이며 si/s으로 계산된다.

    속성 A는 v개의 상이한 값 {a1, ..., av}을 갖는다고 하자. 속성 A는 S를 v

    개의 부분집합 {S1, ..., Sv}를 분할하는데 사용될 수 있다. 여기에서 Sj는

    A의 값 aij를 갖는 S의 샘플들을 포함한다. 부분 집합 Sj에 있는 클래스 Ci

    의 샘플 수를 sij라고 하자. A에 의해 부분집합으로 분할하는 경우의 엔트

    로피(entroy), 기대 정보량(expected information)은 식(2) 와 같다.

    엔트로피 값이 작으면 작을수록 분할된 부분집합의 순수도는 증가한다.

    주어진 부분집합 Sj에 대해서,

    이 되고, 여기서 pij = sij|Sj | 으로, Sj의 샘플이 클래스 Ci에 속하는 확률

    이다. A에 대한 분기로 얻게 되는 부호 정보량(encoding information)은

  • - 10 -

    Gain(A) = I (s1, ..., sm) − E(A) (4)

    다음과 같다.

    즉, Gain(A)는 속석 A의 값을 알고 있음으로 인해서 비롯되는 엔트로피

    의 기대 감소량이다.

    2.3.2 연관 규칙 (Association Rules)

    연관 규칙(Association Rule)은 한 항목 그룹과 다른 항목 그룹 사이에

    존재하는 연관성을 규칙의 형태로 표현한 것이다 [1][11]. 즉, A → B 의

    형태를 갖는 패턴으로서 이러한 규칙이 갖는 의미는 A 항목집합이 나타날

    때는 B 항목집합도 동반하여 나타나는 경향이 있다는 뜻이다. 연관 규칙을

    탐사하는 문제는 기본적으로 다음의 두 단계로 구성된다. 미리 결정된 최

    소 지지도 이상의 트랜잭션 지지도를 가지는 항목집합들의 모슨 집합들인

    빈발 항목집합들을 찾아내는 단계와 빈발 항목집합의 부분집합 A에 대하

    여, 만약 Support(A)에 대한 Support(L)의 비율이 적어도 최소 신뢰도 이

    상이면 (support(L)/support(A)≥min confidence), A → (L-A)의 형태의

    규칙을 출력하는 단계이다. 이때, 이 규칙의 지지도는 Support(L)이고 신

    뢰도는 Support(L)/Support(A)이다.

    연관 규칙은 주로 장바구니 분석(Market Basket Analysis)에 주로 사용

    되며 구체적인 예는 다음과 같다. “분유를 구매하는 사람의 30%는 기저귀

    를 구매하며 전체 트랜잭션의 2%는 분유와 기저귀를 포함하고 있다.” 여

    기서 30%는 이 규칙의 신뢰도(confidence)라고 불리며 2%는 이 규칙의

    지지도(support)라고 불린다. 이와 같이 생성된 연관 규칙은 개인 구매도

  • - 11 -

    분석, 상품의 교차 매매(Cross-Marketing), 카탈로그 디자인, 염가 매출품

    (Loss Leader) 분석, 상품 진열, 구매 성향에 따른 고객 분류 등등 다양하

    게 사용된다 [3].

  • - 12 -

    제 3 장 위치 기반의 개인화된 추천 시스템

    3.1 시스템 구조

    이동 중인 모바일 디바이스 사용자에게 레스토랑을 추천하기 위해서 기존의

    개인화 추천 시스템과 위치 기반의 서비스를 결합시킨다. 이러한 시스템은 사

    용자 개인의 취향에 따라 레스토랑을 선택할 수 있는 기능을 가지고 있으며

    레스토랑까지의 거리도 고려하여 사용자의 시간적, 공간적 욕구도 충족시키

    게 된다. 위치 기반의 개인화된 추천을 위해서 [그림 2]에서 보는 바와 같이

    세 단계의 작업이 이루어진다.

    [그림 2] 위치 기반의 개인화된 추천 시스템

  • - 13 -

    첫 번째 단계는 기존 사용자들의 개인 정보와 상황 정보를 바탕으로 레스토

    랑 추천 목록을 작성하는 것이다. 두 번째 단계는 사용자의 현재 위치를 기반

    으로 레스토랑 추천 목록을 작성하고 마지막으로 두 추천 목록에 각각 가중치

    를 적용하여 최종 추천 목록을 완성하여 사용자에게 제공한다.

    우선 기존 사용자들의 개인 정보를 이용한 추천 목록은 개인화 추천 시스템

    중 규칙 기반 필터링 방식을 참고하여 작성하게 된다. 이러한 규칙은 예측 데

    이터 마이닝 기법 중 의사결정 트리를 이용하여 얻어진다. 다음으로 위치를

    기반으로 한 추천 목록은 무선 인터넷 서비스 중 GPS 기반 무선 측위 기술을

    이용하여 현재 사용자의 위치와 레스토랑 사이의 거리를 얻게 된다. 이렇게

    생성된 추천 목록에 실험을 통해 얻어진 최적의 가중치 값을 적용하여 최종

    레스토랑 추천 목록을 생성하게 된다. 위의 [그림 2]에 나타난 추천 시스템의

    각 단계에 대하여 더욱 자세히 알아보도록 하자.

    3.2 위치 기반의 추천

    사용자에게 레스토랑을 추천하기 위해서 사용자와 레스토랑과의 거리나 걸

    리는 시간을 고려한다. 사용자의 위치를 파악하기 위해서는 인공위성을 이용

    한 GPS 기반 무선 측위법이나 네트워크 통신망 기반의 무선 측위 방법을 사

    용한다. 본 논문에서는 사용자의 위치가 이미 파악되었다는 가정 하에 사용자

    의 위치를 좌표 평면 상에서 원점으로 놓고 주변의 레스토랑들과의 거리를 측

    정한다. 현재 상용화되고 있는 GPS 기반의 서비스를 이용하여 각각 다른 종

    류의 레스토랑을 검색하여 목록으로 만들었다. 사용자의 개인 정보와 레스토

    랑까지의 거리가 레스토랑을 선택함에 있어서 어떤 작용을 하는지를 알아보

    기 위해서 다섯 개의 레스토랑만을 고려하였다. 아래의 [표 2]에서 사용자의

  • - 14 -

    번호 성별 나이 지출 결혼 직업 날씨 온도 기분 레스토랑

    1 1 20 30 1 1 2 7 9 3

    167 2 28 50 1 2 1 7 8 3

    325 2 25 50 2 2 3 6 4 1

    480 1 37 70 1 1 1 9 6 2

    종류 이름 거리&시간 추천 목록 포인트

    한식 농가마을 5Km, 7분 인하각 50

    일식 참치사냥 2Km, 4분 참치사냥 40

    중식 인하각 1Km, 1분 농가마을 30

    양식 아웃백 12Km, 13분 롯데리아 20

    카페 롯데리아 10Km, 11분 아웃백 10

    위치에서 레스토랑까지의 거리와 시간을 기반으로 추천 목록을 나타내었다.

    [표 2]위치 기반의 추천 목록

    3.3 개인화된 추천

    개인화된 레스토랑 추천 목록을 작성하기 위해서 본 논문에서는 인구 통계

    적 변수인 성별, 나이, 지출액, 결혼 여부, 직업의 개인 정보와 날씨, 온도, 기

    분 같은 상황 정보를 분석을 위한 속성으로 고려한다. 사전에 조사된 사용자

    들의 개인 정보와 상황 정보에 따른 레스토랑 선택의 자료를 추천 목록을 작

    성하기 위해 분석한다. 분석에 사용된 데이터 셋의 예는 아래의 [표 3]와 같

    다. 분석 작업의 편의성을 위해 조사되어진 데이터는 모두 숫자로 변환하여

    저장하였다.

    [표 3] 사용자별 레스토랑 선택의 예

    위의 [표 3]에서 번호는 데이터의 순서일 뿐 분석과는 관련이 없으며, 성별

    (sex)은 남자는 1, 여자는 2로 나타내었으며, 나이(age)는 만으로, 지출

    (expenditure)은 한달에 지출하는 금액을 만원 단위로 표현하였다. 결혼 유무

  • - 15 -

    (marriage)는 미혼일 경우 1, 기혼일 경우 2로 나타내었고, 직업(job)은 학생

    은 1, 직장인은 2로 표현하였다. 개인 정보에 속하는 앞의 다섯 가지 속성은

    객관적인 자료이지만 상황 정보에 속하는 뒤의 세 가지 속성은 정보의 성격

    면에서나 개인의 판단에 따른 조사임을 감안할 때 다소 주관적임을 밝힌다.

    날씨(weather)는 맑음은 1로 흐림은 2로 표현하였고, 온도(temperature)와

    기분(feeling)은 개인이 판단하여 최상일 경우는 9로 최하일 경우는 0으로 나

    타내었다. 끝으로 레스토랑(Ci, i =1, ...,5)의 경우는 한식, 일식, 중식, 양식,

    카페테리아(이하 카페) 순으로 값을 부여하였다.

    이렇게 조사된 데이터들의 분석을 위해서 데이터 마이닝 기법 중에 의사결

    정 트리를 이용하였다. 의사결정 트리는 이미 분석 과정에서 자주 이용되고

    있는 기법이며 속성 간의 연관 규칙과 레스토랑 선택과는 관련이 적으므로 분

    석의 도구로 의사결정 트리를 이용하게 되었다. 우선 의사결정 트리를 구성하

    기 위해서는 최상위의 노드가 되는 속성을 찾아내야 한다. 최상위 노드는 정

    보이득(information gain) 값이 가장 큰 속성이 선택되어 진다. [그림 3]는 정

    보이득을 계산하기 위한 알고리즘이다.

  • - 16 -

    I (s1, ..., s5 ) = I (141, 104, 109, 88, 58 ) = 2.27

    [그림 3] 정보이득 알고리즘

    #define ATTRNUM 7 CString attr[ATTRNUM] = {"Sex", "Age", ..., "Feeling"};

    void C4_5View::Entropy(double Entro_Acc){ double entropy[] = {0, 0, 0, 0, 0, 0, 0}; // 속성의 엔트로피 저장 double eSex, eAge, ..., eFeeling; int NUM, valNum; // 엔트로피 구하기 for(int j=0; j

  • - 17 -

    E (sex ) = 275500

    I (s11, ..., s51 ) + 225500

    I (s12, ..., s52 ) = 0.694

    Gain (sex ) = I (s11, ..., s51 ) − E (sex ) = 0.316

    I (s12, s52) = 2.25

    (식2)를 사용하여, 만약 샘플들이 성별(sex)에 따라 분할되는 경우 주어진 샘

    플을 분류하는데 요구되는 기대 정보량은 다음과 같다.

    따라서 분할로 인한 정보 이득은 다음과 같다.

    같은 방법으로 나머지 속성들의 정보 이득을 계산하여 가장 높은 정보 이득

    을 가진 속성을 검사 속성으로 선택한다. 본 논문에서는 날씨(weather)가 첫

    번째 검사 속성으로 선택되었다. 새 노드가 생성되고 날씨(weather)라는 레이

    블을 갖게 되며 가지들이 속성의 각 값들에 대해서 생성된다. 그리고 샘플들

    은 [그림 4]에서 보이는 것과 같이 분할된다.

    [그림 4] 개인화된 추천을 위한 의사결정 트리

  • - 18 -

    성별 나이 지출 결혼 직업 날씨 온도 기분 레스토랑

    1 32 60 1 1 2 7 9 ?

    레스토랑 분석 결과 추천 목록 포인트

    한식 11.7% 일식 50

    일식 35.3% 중식 40

    중식 29.4% 양식 30

    양식 17.7% 한식 20

    카페 5.9% 카페 10

    이렇게 의사결정 트리를 생성하게 되면 어떤 사용자의 요청에 대하여 개인화

    된 추천 목록을 작성 할 수 있게 된다. 예를 들어, [표 4]과 같은 개인 정보와

    상황 정보를 가진 사용자에게 레스토랑 추천을 한다고 가정하자. 사용자의 데

    이터로부터 추천 목록을 작성하기 위해서는 [그림 4]의 트리를 따라 내려간

    다.

    [표 4] 사용자의 개인정보와 상황 정보

    첫 번째 노드에서 고려된 날씨에 대한 속성이 사용자의 경우 흐림이므로 오른

    쪽으로 내려간다. 두 번째 노드에서 고려된 직업에 대한 속성이 사용자의 경

    우 학생이므로 왼쪽으로 내려가게 된다. 이러한 방식으로 트리의 마지막 노드

    까지 다다르게 되면 (마지막 레벨의 6번째 노드) 레스토랑의 비율을 참고하여

    추천 목록을 생성하게 된다. 가장 높은 비율을 차지하는 레스토랑이 일식, 중

    식, 양식, 한식, 카페의 순서이므로 추천 목록을 이에 따라 생성하게 되고 가중

    치 적용 단계에서 사용하기 위해 각각의 레스토랑에 포인트를 부여한다. 분석

    결과와 추천 목록, 그리고 포인트 적용에 대한 내용을 [표 5]에 나타내었다.

    [표 5] 개인화된 추천 목록

  • - 19 -

    Si = Pi * Wp + Li * Wl (5)

    3.4 가중치를 적용한 통합 추천

    개인화된 추천 목록과 위치 기반의 추천 목록을 가중치를 적용하여 통합하

    는 단계이다. [표 2]와 [표 5]에서 나타난 추천 목록 각각의 포인트에 가중치

    값을 적용한다. 이 단계에서 가중치의 정도는 개인화 추천 목록과 위치 기반

    추천 목록에 0.3과 0.7의 값을 부여하였다. 최적의 가중치 값을 찾기 위해 0.1

    단위로 증감시켜 각각에 0.7과 0.3의 값이 부여될 때까지 실험한다. 가장 적절

    한 가중치의 값은 추천에 대한 정확도를 평가하여 가장 높은 정확성을 나타낼

    때의 값이다. 가중치를 적용하여 레스토랑에 대한 포인트를 부여하는 계산은

    (식 5)과 같다.

    Si 는 i번째 레스토랑에 부여되는 점수이고 Pi는 개인화 추천 목록에서 얻은

    포인트이고 Wp는 개인화 추천 목록에 적용될 가중치 값이다. 또한 Li는 위치

    기반 추천 목록에서 얻은 포인트이고 W1은 위치 기반 추천 목록에 적용될 가

    중치 값이다. 적용되는 가중치 값이 각각 0.3과 0.7일 때, [표 2]와 [표 5]로

    부터 한식 레스토랑인 농가마을의 최종 포인트는 다음과 같이 계산된다.

    S1 = 20 * 0.3 + 30 * 0.7 = 27

    개인화 추천 목록으로부터 포인트 20을 가져오고, 위치 기반 추천 목록으

    로부터 포인트 30을 가져온다. 가중치와의 곱을 통해서 최종 포인트 36을 얻

    게 되고 다른 레스토랑들도 이와 같은 방식으로 최종 포인트를 계산한다. 아

    래의 [표 6]에서는 최적의 가중치 값을 설정하기 위해 개인화 추천 목록에 대

    해서는 가중치를 0.1씩 감소시키고, 위치 기반 추천 목록에 대해서는 0.1씩 증

    가시키면서 최종 포인트를 계산하였다.

  • - 20 -

    추천순위가중치 및 최종 추천 목록

    0.3/0.7 0.4/0.6 0.5/0.5 0.6/0.4 0.7/0.3

    1 인하각 인하각 참치사냥 참치사냥 참치사냥

    2 참치사냥 참치사냥 인하각 인하각 인하각

    3 농가마을 농가마을 농가마을 농가마을 농가마을

    4 롯데리아 아웃백 아웃백 아웃백 아웃백

    5 아웃백 롯데리아 롯데리아 롯데리아 롯데리아

    레스토랑

    종류

    추천 목록 가중치 및 최종 포인트

    개인화 위치 0.3/0.7 0.4/0.6 0.5/0.5 0.6/0.4 0.7/0.3

    한식 20 30 27 26 25 24 23

    일식 50 40 43 44 45 46 47

    중식 40 50 47 46 45 44 43

    양식 30 10 16 18 20 22 24

    카페 10 20 17 16 15 14 13

    [표 6] 가중치에 따른 최종 포인트

    가중치를 적용하여 최종 포인트가 산출되면 포인트가 높은 순서대로 레스

    토랑을 추천하게 된다. [표 7]에서는 가중치 변화에 따른 추천 목록의 차이를

    나타내고 있다. 본 논문의 제 4장의 실험에서 각각의 가중치에 대한 사용자의

    만족도를 평가하였다. 그 결과 개인화 추천 목록에 0.4의 가중치를 그리고 위

    치 기반 추천 목록에는 0.6의 가중치를 적용하였을 때 가장 좋은 평가를 얻었

    다. 즉, 사용자에게는 최종 추천 목록 중 두 번째의 추천 목록을 제공하게 된

    다.

    [표 7] 가중치에 따른 최종 추천 목록

  • - 21 -

    레스토랑 위치를 고려하지 않았을 때

    성별 나이 지출 결혼 직업 날씨 온도 기분 레스토랑

    1 20 30 1 1 2 7 9 4

    레스토랑 위치를 고려하였을 때

    성별 나이 지출 결혼 직업 날씨 온도 기분 레스토랑

    1 20 30 1 1 2 7 9 1

    제 4 장 실험 및 결과

    4.1 실험 환경 및 데이터 집합

    본 논문의 실험은 JBuilder 9.0과 Microsoft Windows XP를 사용하여 이

    루어졌으며 실험 환경은 펜티엄Ⅳ 2.8GHz, 512MB RAM의 시스템이었다.

    훈련 및 테스트에 사용된 데이터들은 2005년 5월 20일부터 6월 20일까지

    설문 조사를 통해 수집되었다. 설문 조사는 인하대학교 부근의 레스토랑에 관

    한 지식이 있는 학생 및 일반인을 대상으로 하였으며 총 500부의 설문을 실시

    하여 데이터화 하였다. 개인화된 추천을 위해서 사용자의 개인 정보와 상황

    정보를 조사하였고 위치 기반의 추천을 위해서 사용자 주변의 알려진 레스토

    랑을 선정하여 조사였다. 위치 정보를 포함하지 않은 설문과 포함한 설문을

    동시에 실시함으로써 제안하는 시스템의 효율성을 실험을 통해 증명한다. [표

    8]에서는 위치를 고려하지 않은 데이터와 고려한 데이터를 나타내고 있다.

    [그림 5]은 설문에 사용된 현재 사용자의 위치와 레스토랑의 위치를 나타낸

    지도이다. 그리고 실험에 사용된 추천 시스템 인터페이스는 [그림 6]와 같다.

    [표 8] 위치 정보 고려에 따른 레스토랑 선택의 변화

  • - 22 -

    [그림 5] 현재 위치 및 레스토랑 위치

    [ 그림 6] JAVA로 구현된 추천 시스템의 인터페이스

  • - 23 -

    R = overall number of correct recommendation

    total number of samples (6)

    E = Σi= 1

    N |ei |N

    (7)

    4.2 실험 평가 방법

    개인화와 위치 정보를 동시에 고려한 추천 시스템의 정확성을 증명하기 위

    해서 K-중첩 교차조사(k-fold cross-validation) 방법을 이용하여 수집된 데

    이터 셋을 학습 데이터와 테스트 데이터로 분류하고 실험한다. K-중첩 교차

    조사 방법에서는 초기 데이터를 크기가 대략적으로 같은 S1, ..., Sk 인 k 개의

    상호 배반 부분집합으로 임의 분할한다. 학습과 테스트는 k 번 반복 수행한다.

    반복 i 번째에서 부분집합 Si는 테스트 집합으로 사용하고 나머지 부분집합들

    은 학습 데이터로 사용한다. 정확도 추정은 k 번의 반복으로부터 정확하게 분

    류가 된 전체 수를 초기 데이터의 샘플 수로 나눈 것(재현율, Recall)이 된다

    [3]. 재현율 R은 식(6)과 같다 [20].

    또한 k 번의 실험에서 평균절대오차율(Mean Absolute Error)을 측정해서

    성능을 평가한다. 평균절대오차율은 예측된 평가 값이 최소화되어야 정확도

    가 높다고 할 수 있다. 대상 집합의 실제 포인트 값을 {r1, ..., rn}이라 한다면,

    예측 포인트 값은 {p1, ..., pn}으로 표현하고, 오차 E = {e1, ..., en} = {p1 - r1,

    ..., pn - rn}이라면, 평균절대오차율은 아래의 식(7)과 같다.

    4.3 실험 결과 및 평가

    실험은 우선, 기존의 개인 정보와 상황 정보만을 고려한 개인화된 추천 시스

  • - 24 -

    템과 본 논문에서 제안한 위치 기반의 개인화된 추천 시스템 사이의 성능 비

    교를 하였다. 그리고 가중치를 고려한 추천 시스템과 단순 추천 시스템과의

    정확성 비교를 위해 최적의 가중치를 얻기 위한 실험도 시행하였다. 끝으로

    기존 추천 시스템과 제안한 추천 시스템, 그리고 가중치를 적용한 추천 시스

    템의 성능 비교를 통해 본 논문에서 제안한 시스템의 우수성을 증명한다.

    4.3.1 추천 시스템 비교

    전통적인 레스토랑 추천 시스템은 기존의 샘플 데이터로부터 유사한 사용자

    들을 분류해 내는 단계를 첫 단계로 한다. 사용자의 개인 정보나 상황 정보를

    바탕으로 의사결정 트리 같은 분류 도구를 이용하여 추천 목록을 생성함으로

    써 개인화된 추천의 역할을 한다. 하지만 최근에는 무선 인터넷을 통한 사용

    자의 위치와 레스토랑의 위치를 파악할 수 있게 됨으로써 시간적, 공간적 요

    소를 추천에 이용하게 된다. 즉 레스토랑까지의 위치와 거리가 사용자의 레스

    토랑 선택에 영향을 미치므로 위치 기반의 추천 또한 필요하게 되었다. 본 실

    험에서는 단순 개인화된 추천 시스템과 위치 기반의 개인화된 추천 시스템을

    비교함으로써 위치 정보의 중요성과 함께 제안하는 시스템의 우수성을 증명

    하고자 한다.

    실험 과정에서 K-중첩 교차 조사를 방법을 이용하였으며 K=10으로 설정하

    였다. 개인 정보와 상황 정보만을 이용한 개인화된 추천 시스템

    (Recommendation based on Personalization, RP)과 위치 기반의 개인화된

    추천 시스템(Recommendation based on Personalization and Location,

    RPL)을 정확성과 오차율을 통해 비교하였다. 두 시스템의 성능의 차이를 [표

    9]과 [그림 7]에 나타내었다.

  • - 25 -

    시행

    횟수

    개인화된 추천 위치 기반의 개인화된 추천

    재현율 MAE 재현율 MAE

    1 76 34 80 32

    2 78 36 80 32

    3 78 38 82 34

    4 76 36 80 32

    5 76 36 82 34

    6 80 40 84 36

    7 76 34 80 32

    8 78 36 82 30

    9 76 36 82 32

    10 78 38 84 32

    평균 77.2 36.4 81.6 32.6

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    1 2 3 4 5 6 7 8 9 10

    시행 횟수 (k=10)

    재현

    율 &

    MAE(%

    )

    [재현율] 개인화된 추천 시스템

    [재현율] 위치 기반의 개인화된 추천 시스템

    [MAE] 개인화된 추천 시스템

    [MAE] 위치 기반의 개인화된 추천 시스템

    [표 9] 재현율과 MAE를 통한 RP와 RPL 시스템 비교

    실험 결과 제안된 추천 시스템이 재현율에서 약 4.4%의 높은 정확도와 평

    균절대오차율에서 약 7.4%의 낮은 오차율을 나타낸다. 즉 사용자와 레스토랑

    의 위치를 고려했을 때 더욱 정확한 추천의 결과를 가져옴을 알 수 있다. 이번

    실험에서 가중치는 고려하지 않았다.

    [그림 7] 재현율과 MAE를 통한 추천 시스템 비교

  • - 26 -

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    0.3/0.7 0.4/0.6 0.5/0.5 0.6/0.4 0.7/0.3

    가중치(개인화/위치 기반)

    재현율(%) 평균절대오차율(%)

    4.3.2 가중치 결정

    레스토랑 선택에 있어서 개인 정보와 상황 정보 등의 개인화 요소가 미치는

    영향과 사용자나 레스토랑의 위치가 미치는 영향을 알아내기 위해 가중치를

    설정한다. [그림 8]에서는 개인화된 추천 목록에 0.3의 가중치를 위치 기반

    추천 목록에는 0.7의 가중치를 적용한 후에 재현율과 평균절대오차율을 구한

    다. 가중치 값을 0.1씩 증감시켜서 최적의 가중치 값을 찾아낸다.

    [그림 8] 가중치에 따른 재현율과 평균절대오차율

    실험 결과 개인화된 추천 목록에 0.4, 위치 기반 추천 목록에 0.6의 가중치

    를 적용하였을 때, 83%의 재현율과 28%의 오차율을 기록하였다. 즉, 사용자

    들의 레스토랑 선택시의 관심사가 위치에 좀더 치우쳐 있음을 알게 되었다.

    4.3.3 성능 비교 평가

    위의 두 실험을 통해 위치 기반의 개인화된 추천 시스템의 우수성과 개인 정

    보나 상황 정보보다 위치 정보가 레스토랑 선택에 많은 영향을 미친다는 것을

  • - 27 -

    시행

    횟수

    RP RPL RPLW

    재현율 MAE 재현율 MAE 재현율 MAE

    1 76 34 80 32 84 26

    2 78 36 80 32 86 28

    3 78 38 82 34 86 30

    4 76 36 80 32 82 26

    5 76 36 82 34 86 28

    6 80 40 84 36 88 32

    7 76 34 80 32 82 26

    8 78 36 82 30 82 28

    9 76 36 82 32 84 28

    10 78 38 84 32 86 30

    평균 77.2 36.4 81.6 32.6 84.6 28.2

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    1 2 3 4 5 6 7 8 9 10 11

    시행 횟수 (k=10)

    재현

    율 &

    MAE (

    %)

    [재현율] RP [재현율] RPL [재현율] RPLW

    [MAE] RP [MAE] RPL [MAE] RPLW

    증명하였다. [표 10]과 [그림 9]에서는 가중치가 적용된 위치 기반의 개인화

    추천 시스템(Recommendation based on Personalization and Location

    with Weightiness, RPLW)과 기존 추천 시스템을 비교한다. 가중치를 0.4와

    0.6으로 부여한 제안된 시스템이 재현율은 가장 높고 오차율은 가장 낮게 나

    타남을 알 수 있다.

    [표 10] 재현율과 MAE를 통한 RP, RPL, RPLW 추천 시스템 비교

    [그림 9] RP, RPL, RPLW 추천 시스템 비교

  • - 28 -

    제 5 장 결론 및 향후 연구

    본 논문에서는 사용자의 이동성을 고려하여 위치를 기반으로 한 개인화된

    레스토랑 추천 시스템을 제안하고 실험을 통하여 성능을 평가하였다. 기존의

    사용자의 개인 정보 분석을 통한 단순한 추천 시스템은 사용자의 시간적, 공

    간적 사항을 고려하지 않음으로써 사용자에게 적절한 정보 및 서비스임에도

    불구하고 제 기능을 발휘하지 못하였다. 최근 무선 인터넷의 발전에 힘입어

    GPS와 무선 데이터 전송 능력이 있는 휴대용 기기 및 무선 컴퓨팅 기술의 발

    전은 사용자와 레스토랑의 위치 정보를 서비스에 이용할 수 있도록 하였다.

    따라서 개인의 취향에 따른 레스토랑 추천과 함께 위치 정보를 바탕으로 한

    거리와 시간에 따른 추천을 시도하게 되었다. 개인화된 추천을 위해서 사용자

    의 성별, 나이, 직업 같은 개인 정보와 날씨, 온도 등의 상황 정보를 분석하여

    레스토랑 선택과의 관계를 찾아내었다. 분석 과정에서 가장 널리 알려진 데이

    터 마이닝 기법 중의 하나인 의사결정 트리 기법을 이용하였다. 또한 위치 정

    보를 기반으로 한 레스토랑 추천 목록을 생성함으로써 사용자의 이동성을 고

    려하게 되었다. 이에 더불어 개인화와 위치 기반의 추천을 결합한 최적의 추

    천 서비스 제공을 위하여 각각의 추천 목록에 가중치를 도입하였다. [그림 7]

    의 실험을 통해서 레스토랑 선택에 있어서 개인 정보보다 위치 정보가 미치는

    영향이 컸음을 알 수 있었고 기존의 개인화를 바탕으로 한 추천보다 위치까지

    고려한 추천 시스템이 향상된 성능을 나타내었다. [그림 9]에서와 같이 본 논

    문에서 제안한 시스템이 단순 개인화 바탕의 추천 시스템과 가중치가 고려 안

    된 시스템보다 재현율에서 7.2%, 7.8% 높은 정확성을 나타내었고, 오차율에

    서는 3.0%, 4.4% 낮게 평가되었다.

  • - 29 -

    이러한 실험 결과를 바탕으로 제안하는 시스템의 장점을 정리하면 다음과

    같다. 첫째, 사용자의 개인적인 관심사뿐만 아니라 위치까지 고려함으로써 추

    천의 정확성을 높이고 오차율을 낮추게 되었다. 둘째, 개인 정보와 위치 정보

    에 가중치를 적용하여 최적의 추천 서비스를 제공하게 되었다.

    향후 연구로는, 첫째, 본 논문에서 개인화 과정에서 고려하였던 상황 정보에

    대한 폭넓은 이해와 연구가 필요하며, 둘째, 의사결정 기법에서 변수의 증가가

    정확도의 상승을 가져오는 것은 사실이나 수없이 많은 변수들을 고려하기엔

    한계가 있다. 그리하여 레스토랑 선택과 더욱 밀접한 변수를 찾아내는 과정이

    요구된다. 마지막으로, 실제 모바일 기기 사용자들이 사용할 수 있는 시스템을

    개발하여 실제 이용 과정에서 발생하는 문제점의 파악과 개선을 통해 시스템

    의 성능을 향상시킬 수 있을 것이다.

  • - 30 -

    참고 문헌

    [1] Agrawal, R., Srikant, R., "Fast Algorithms for Mining Association

    Rules," In Proceedings of the 20th International Conference on

    Very Large Data Bases, pp.487-499, 1994.

    [2] Goren, D., Kuflik, T., "Recommending restaurants through an

    adaptive mobile system," In Proceedings of the 9th international

    conference on Intelligent User Interface, 2004.

    [3] Han, J., Kamber, M., "Data Mining: Concepts and Techniques,"

    Morgan Kaufman, 2001.

    [4] Herlicker, J.L., Konstan, J.A., Borchers, A., Riedl, J., "An

    Algorithmic framework for performing collaborative filtering," In

    Proceedings of the Twenty Second Annual International ACM

    SIGIR Conference, ACM Press, pp.230-237, 1999.

    [5] http://www.amazon.com

    [6] http://www.cdnow.com

    [7] James, C., Gordon, L., "Subscriber Location in CDMA Cellular

    Networks," IEEE Transactions on Vehicular Technology, 1998.

    [8] Jeffrey, H., Kevin, J., Brian, D., and Theodore, S., "An Overview

    of the Challenges and Progress in Meeting the E-911

    Requirement for Location Service," IEEE Communication

    Magazine, 1998.

    [9] Kasanoff, B., "Are You Ready for Mass Customization?,"

  • - 31 -

    Training Vol.35, No.23, pp.23-34, 1998.

    [10] Mark, M., Norman, K., "An Introduction to Snaptrack

    Server-Aided GPS Technology," ION-GPS98, 1998.

    [11] Mobasher, B., Dai, H., "Effective Personalization Based on

    Association Rule Discovery from Web Usage Data," In

    Proccedings Web Information and Data Management, pp.9-15,

    2001.

    [12] Park, K., Lee, H., "Study on Family Restaurant Recommendation

    for Customers based on Benefit Sought and Demographical

    Variables," In Proceedings on The Korea Academic Society of

    Tourism and Leisure, 2003.

    [13] Sachin, S., Pravin, V., Yugyung, L., "Context-aware Data Mining

    using Ontologies," LNCS 2813, 2003.

    [14] Schafer, J.B., Konstan, J.A., Riedl, J., "Recommender Systems

    in E-Commerce," In ACM Conference on Electronic Commerce,

    pp.158-166, 1999.

    [15] Seneff, S., Polifroni, J., "A New Restaurant Guide Conversational

    System: Issue In Rapid Prototyping For Specialized Domains," In

    Proceedings of Fourth International Conference on ICSLP, Vol.2,

    1996.

    [16] Shardanand, U., Maes, "Social Information filtering: Algorithms

    for automating word of mouth," In Conference on Human

    Factors in Computing System, 1995.

    [17] Shih, G., Shim, S., "A service management framework for

  • - 32 -

    M-commerce applications," In Proceedings of Mobile Networks

    and Applications, Vol.7, 2002.

    [18] Srivastava, J., Cooley, R., Deshpande, M., Tan, P.N.,

    "Web-Usage Mining: Discovery and Application of Usage

    Patterns for Web data," In ACM SIGKDD Exploration, Vol.1,

    pp.12-23, 2000.

    [19] Tung, H., Soo, V., "A personalized restaurant recommender agent

    for mobile e-service," e-Commerce and e-Service, 2004. IEEE

    International Conference on 28-31, 2004.

    [20] Yang, Y., Liu, X., "A re-examination of text categorization

    methods," In Proceedings of SIGIR-99, 1999.

    [21] 김욱, 지규인, 이장규, "위치 기반 무선 인터넷 서비스,"

    Telecommunications Review 제 10권 6호, pp.1260-1269, 2000.

    [22] 윤현준, "개인화의 전개와 지형점," Web Leader Magazine, 2001년

    6월 특집기사, 2001.

    목차제 1 장 서 론제 2 장 관련 연구2.1 위치 기반 서비스2.2 개인화된 추천 시스템2.3 데이터 마이닝을 이용한 예측

    제 3 장 위치 기반의 개인화된 추천 시스템3.1 시스템 구조3.2 위치 기반의 추천3.3 개인화된 추천3.4 가중치를 적용한 통합 추천

    제 4 장 실험 및 결과4.1 실험 환경 및 데이터 집합4.2 실험 평가 방법4.3 실험 결과 및 분석

    제 5 장 결론 및 향후 연구참고 문헌

    표목차[표 1] 위치 기반 응용 서비스의 분류[표 2]위치 기반의 추천 목록[표 3] 사용자별 레스토랑 선택의 예[표 4] 사용자의 개인정보와 상황 정보[표 5] 개인화된 추천 목록[표 6] 가중치에 따른 최종 포인트[표 7] 가중치에 따른 최종 추천 목록[표 8] 위치 정보 고려에 따른 레스토랑 선택의 변화[표 9] 재현율과 MAE를 통한 RP와 RPL 시스템 비교[표 10] 재현율과 MAE를 통한 RP, RPL, RPLW 추천 시스템 비교

    그림목차[그림 1] C4.5 알고리즘[그림 2] 위치 기반의 개인화된 추천 시스템[그림 3] 정보이득 알고리즘[그림 4] 개인화된 추천을 위한 의사결정 트리[그림 5] 현재 위치 및 레스토랑 위치[그림 6] JAVA로 구현된 추천 시스템의 인터페이스[그림 7] 재현율과 MAE를 통한 추천 시스템 비교[그림 8] 가중치에 따른 재현율과 평균절대오차율

    목차

    제 1 장 서 론1

    제 2 장 관련 연구 3 2.1 위치 기반 서비스3 2.2 개인화된 추천 시스템5 2.3 데이터 마이닝을 이용한 예측7 제 3 장 위치 기반의 개인화된 추천 시스템12 3.1 시스템 구조12 3.2 위치 기반의 추천13 3.3 개인화된 추천14 3.4 가중치를 적용한 통합 추천19

    제 4 장 실험 및 결과21 4.1 실험 환경 및 데이터 집합21 4.2 실험 평가 방법23 4.3 실험 결과 및 분석24

    제 5 장 결론 및 향후 연구28

    참고 문헌30

    표목차[표 1] 위치 기반 응용 서비스의 분류 5[표 2]위치 기반의 추천 목록 14[표 3] 사용자별 레스토랑 선택의 예 14[표 4] 사용자의 개인정보와 상황 정보 18[표 5] 개인화된 추천 목록 18[표 6] 가중치에 따른 최종 포인트 20[표 7] 가중치에 따른 최종 추천 목록 20[표 8] 위치 정보 고려에 따른 레스토랑 선택의 변화 21[표 9] 재현율과 MAE를 통한 RP와 RPL 시스템 비교 25[표 10] 재현율과 MAE를 통한 RP, RPL, RPLW 추천 시스템 비교 27

    그림목차[그림 1] C4.5 알고리즘 8[그림 2] 위치 기반의 개인화된 추천 시스템 12[그림 3] 정보이득 알고리즘 16[그림 4] 개인화된 추천을 위한 의사결정 트리 17[그림 5] 현재 위치 및 레스토랑 위치 22[그림 6] JAVA로 구현된 추천 시스템의 인터페이스 22[그림 7] 재현율과 MAE를 통한 추천 시스템 비교 25[그림 8] 가중치에 따른 재현율과 평균절대오차율 26