13
A Random Walk Around the City: New Venue Recommendation in Location- Based Social Networks Anastasios Noulas, ASE/IEEE International Conference on Social Computing, 2012 2016.07.25 KAIST iDBLab 윤윤윤 이 이이이 이이이이이 이이이이이이이 . 이이이이

[논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

Embed Size (px)

Citation preview

Page 1: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

A Random Walk Around the City: New Venue Recommen-dation in Location-Based So-cial NetworksAnastasios Noulas, ASE/IEEE International Conference on Social Computing, 20122016.07.25

KAIST iDBLab

윤상훈

이 문서는 나눔글꼴로 작성되었습니다 . 설치하기

Page 2: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1. Abstract

2. Introduction

3. Data Analysis

4. New Venue Recommendation

5. Evaluation

목차

Page 3: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Abstract3 / 14

•장소를 찾는 행동 방식이 어떻게 대규모의 체크인 데이터를 characterize 하는지 검토한다 .•User mobility 에 대한 가정을 기반으로 한 다양한 추천 알고리즘들은 좋은 성능을 내지

못한다 .•소셜 네트워크와 체크인 데이터를 이용한 user-place 그래프 위에서의 random walk

를 이용한 새로운 모델을 제시한다 .

Page 4: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Introduction4 / 14

The most prominent problem•체크인 , 소셜 , 장소 데이터 간의 관계가 모호하다 .

–기존의 추천 시스템들은 사용자의 rating 에 기반하지만 체크인 데이터는 그것을 담고 있지 않다 .–기존의 추천 시스템들은 like-mindedness 라는 가정을 기반하지만 사람들이 장소를 방문하는 이유에는

여러가지가 있다 .

다음 질문에 답하고자 한다 .•사람들이 어느 정도로 새로운 장소에 방문하려고 하는가 ?•Human mobility 에 대해 어떤 가정을 세울 수 있을까 ?•다양한 데이터를 어떻게 조합해야 추천 성능을 향상시킬 수 있을까 ?

Page 5: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Data Analysis5 / 14

•전세계의 11 개의 도시에서 체크인 데이터를 수집했다 .

Foursquare•925,000 명의 사용자가 만들어낸 35M 개의 체크인•2010 년 5 월 27 일 ~ 11 월 2 일까지의 데이터•Twitter 에서 맞팔하면 social link 가 있는 것으로 가정

Gowalla•216,734 명의 active 사용자가 1,421,262 개의 장소에 걸쳐 만들어낸 12,846,151

개의 체크인•18 개월 이상•사용자 간의 736,778 개의 social link

발견한 사실•대부분의 체크인 데이터 (60% ~ 80%) 가 새로운 장소에 대한 것이었다 .•이는 새로운 장소에 대한 추천의 중요함을 말한다 .

Page 6: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

New Venue Recommenda-tion

6 / 14

•Visiting Popular Venues–총 체크인 개수 순서대로 추천 .( 개인화 x)

•Attending Venues by Category–사용자의 카테고리 별 체크인 데이터를 바탕으로 카테고리 순위를 매긴 다음 , 그 순위를 바탕으로 추천 .

•Following Friends–User-venue pair 의 점수를 친구들의 그 장소에 대한 총 체크인 수로 계산하여 그 순서대로 추천 .

•Staying Close to Home–사용자가 가장 자주 가는 장소를 ‘ home’ 이라고 설정하고 그곳과 가까운 장소를 추천한다 .

•Like-Mindedness and Similarity–사용자는 각 장소에 대한 체크인의 벡터로 나타내고 장소는 각 사용자의 체크인 벡터로 나타낸 뒤 다음과 같은

방법들을 사용한다 .•사용자 기반 k-nearest neighbor•Item-based approach•Matrix factorization

–다른 추천 시스템에 비해 굉장히 sparse 하다 .

Page 7: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

A Random Walk Ap-proach

7 / 14

•앞선 알고리즘들의 기능들을 조합하는 방법•Random Walk Models•Recommending with Random Walks•Weighted Version

Page 8: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Random Walk Models8 / 14

•사용자와 장소간의 connection 을 그래프로 구축•Random walker 가 transition probability 에 따라 그래프의 node 간을 이동한다 .•Random walk 는 steady-state 에 도달한다 .•Random walk with restart

–모든 step 에서 처음의 node 로 가는 일정한 확률이 존재한다 .–가까운 node 가 멀리 있는 node 보다 높게 rank 될 확률이 높다 .

•Transition probability 는 로 나타낸다 .– 그래프 구조에 따라 결정

– 다른 어떤 node 로든 jump 할 수 있다 .•Node 의 steady-state probability 는 다음 식의 해로 정의된다 .

Page 9: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Recommending with Random Walks

9 / 14

•Graph building–Undirected–Nodes represent users and venues–user i is linked to venue j if user checked-in venue–user is linked to another user if the pair are friends–It’s used to define transition matrix W

•Random walk with restart–matrix R encodes the probability of randomly jumping back from every node to the node of ther

user•Steady-state probability 를 내림차순으로 정렬해서 추천•Weighted version

–A link between users is weighted equaly–A link from user to place is weighted as (the # of check-ins) / (the total # of check-ins of user)–A link from place to user is weighted as (the # of check-ins) / (the total # of check-ins of place)–All weights are normalized

Page 10: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Evaluation10 / 14

•Methodology and Metrics–Multiple training/test splits ( 연속 30 일 단위 )–Precision at 10 results–Recall at 10 results–Average Percentile Ranking(APR)

•Results–Tables at right

Page 11: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

1.1 페이지 제목

Comments11 / 14

•Random walks 에 앞서 제시한 다섯개의 알고리즘을 합친 알고리즘을 제시할 수 있지 않을까 ?•알파값에 따른 성능 변화를 제시하지 않음•popularity 에 의한 추천의 성능이 매우 높은 것

–사람들이 장소를 방문할 때 유행 , 인기도에 민감 ?–Foursquare, Gowalla 에서 장소를 제시할 때 인기도에 의해 정렬해서 보여주었나 ?

•만약 그렇다면 사용자에게 항목들을 보이는 방식이 사용자의 행동양식에 굉장히 큰 영향을 미친다는 것을 말한다

•알고리즘 activity 에 대한 설명 부족–카테고리 별로 번갈아 정렬했는지 특정 카테고리를 먼저 나열하고 그 다음 카테고리를

나열했는지 ( 아마 전자 )•장소 자체의 semantic 을 고려하는 방법

–태그–카테고리–위치 ( 동네 , 도시 )

Page 12: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

Q&A

이 문서는 나눔글꼴로 작성되었습니다 . 설치하기

Page 13: [논문발표] 20160725 A Random Walk Around the City: New Venue Recommendation in Location-Based Social Networks

감사합니다

이 문서는 나눔글꼴로 작성되었습니다 . 설치하기