27
Matrix factorization Nicol´ as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad Cat´ olica de Chile 24 de septiembre de 2015 Nicol´ as Torres Matrix factorization 24 de septiembre de 2015 1 / 27

Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Matrix factorization

Nicolas Torres

IIC 3633 - Sistemas RecomendadoresPontificia Universidad Catolica de Chile

24 de septiembre de 2015

Nicolas Torres Matrix factorization 24 de septiembre de 2015 1 / 27

Page 2: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Bibliografıa

Esta presentacion se basa en las siguientes publicaciones

Xia Ning and George Karypis.Sparse linear methods with side information for top-nrecommendations.In Proceedings of the Sixth ACM Conference on RecommenderSystems, RecSys ’12, pages 155–162. ACM, 2012.

S. Zhang, W. Wang, J. Ford, and F. Makedon.Learning from incomplete ratings using non-negative matrixfactorization.In Proceedings of the 6TH SIAM Conference on Data Mining, pages549–553, 2006.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 2 / 27

Page 3: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Tabla de Contenidos

1 NMFModeloRatings IncompletosExperimentosEjemplo

2 SLIMModeloExperimentos

Nicolas Torres Matrix factorization 24 de septiembre de 2015 3 / 27

Page 4: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

NMF

La matriz de ratings V : m× n, se descompone en dos matrices de menorrango, no negativas de la forma

V ≈WH, (1)

donde W : n× k y H : k ×m. En la practica, el rango de factorizacion esescogido, tal que, k � mın(m,n).

Nicolas Torres Matrix factorization 24 de septiembre de 2015 4 / 27

Page 5: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

NMF

La matriz V se obtiene encontrando las matrices no-negativas W (n× k) yH(k ×m) que optimizan

mın ||A−WH||2F (2)

∼ max logPr(A|V ) (3)

Este problema puede ser resuelto utilizando el metodo de losmultiplicadores de Lagrange.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 5 / 27

Page 6: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Learning From Incomplete Ratings

Cuando la matriz de ratings esta incompleta se debe optimizar el problema

max logPr(A◦|V ), (4)

donde A◦ son los datos observados.Se proponen dos algoritmos para maximizar esta funcion objetivo

EM procedureWeighted NMF

Nicolas Torres Matrix factorization 24 de septiembre de 2015 6 / 27

Page 7: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Expectation-Maximization (EM)

El algoritmo EM se usa para encontrar estimadores de maximaverosimilitud de parametros en modelos donde los datos estanincompletos.

ExpectationMaximization

Nicolas Torres Matrix factorization 24 de septiembre de 2015 7 / 27

Page 8: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Expectation

Calcula la expresion esperada para la maxima verosimilitud de V conrespecto a datos desconocidos (Au) dado un conjunto de datos observados(A◦) y un parametro estimado V (t−1), esto es

Q(V, V (t−1)) = E[logPr(A◦, Au|V )|A◦, V (t−1)] (5)

Nicolas Torres Matrix factorization 24 de septiembre de 2015 8 / 27

Page 9: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Maximization

Encuentra el parametro V (t) que maximiza la esperanza calculadaanteriormente Q(V, V (t−1)), esto es

V (t) = argv maxQ(V, V (t−1)) (6)

Nicolas Torres Matrix factorization 24 de septiembre de 2015 9 / 27

Page 10: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

WNMF

Es una variacion del anterior

mın∑ij

Pij(Aij − (WH)ij)2, (7)

donde Pij es igual a 1 si Aij es un dato observado y 0 en otro caso.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 10 / 27

Page 11: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

EM procedure vs. WNMF

EM procedure converge bien empiricamente y es menos susceptible alas condiciones iniciales.WNMF es mucho mas eficiente computacionalmente.Hybrid NMF puede ser mas efectivo.

a EM b WNMF

Figura 1: NMAE of the EM and WNMF approaches on MovieLens.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 11 / 27

Page 12: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Experimentos

La Tabla 1 muestra los resultados de los algoritmos basados en NMF sobreel data set de MovieLens.

Pearson SVD EM NMF EM Hybrid NMFNMAE 0.1707 0.1629 0.1623 0.1634ROC-4 0.7471 0.7682 0.7723 0.7691

Tabla 1: Desempeno de los algoritmos en MovieLens

Nicolas Torres Matrix factorization 24 de septiembre de 2015 12 / 27

Page 13: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Experimentos

La Tabla 2 muestra los resultados de los algoritmos basados en NMF sobreel data set de Jester.

Pearson SVD EM NMF EM Hybrid NMFNMAE 0.1634 0.1605 0.1599 0.1599ROC-4 0.7539 0.7588 0.7612 0.7608

Tabla 2: Desempeno de los algoritmos en Jester

Nicolas Torres Matrix factorization 24 de septiembre de 2015 13 / 27

Page 14: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Ejemplo

Demostracion de la factorizacion NMF en R.

install.packages("NMF")library(NMF)data(MovieLense)NMF <- nmf(MovieLense, 10)W <- basis(NMF)H <- coef(NMF)basismap(NMF)coefmap(NMF)

Nicolas Torres Matrix factorization 24 de septiembre de 2015 14 / 27

Page 15: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Ejemplo

La Figura 2 exhibe las matrices W y H originadas de la descomposicionNMF de rango 10, sobre el data set de MovieLens 100k.

8 1 6 7 9 10 5 2 3 4

0

0.2

0.4

0.6

0.8

1

a Matriz W

4

3

2

9

5

8

10

7

1

6

0

0.2

0.4

0.6

0.8

1

b Matriz H

Figura 2: Matrices W y H de la descomposicion NMF (rango 10)

Nicolas Torres Matrix factorization 24 de septiembre de 2015 15 / 27

Page 16: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Ejemplo

Interview w

ith the Vam

pire (1994)

Nightm

are on Elm

Street, A

(1984)

Carrie (1976)

Shining, T

he (1980)

Psycho (1960)

True Lies (1994)

Die H

ard 2 (1990)

Under S

iege (1992)

Die H

ard: With a V

engeance (1995)

Fantasia (1940)

Pinocchio (1940)

Cinderella (1950)

Beauty and the B

east (1991)

Aladdin (1992)

5

7

1

9

3

4

2

10

8

6

0

0.2

0.4

0.6

0.8

Figura 3: Items mas representativos de las comunidades 1, 5 y 7

Nicolas Torres Matrix factorization 24 de septiembre de 2015 16 / 27

Page 17: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

SLIM

Sparse LInear Method (SLIM) [Ning and Karypis(2012)].SLIM se centra en recomendacion top N.Capaz de realizar recomendaciones de alta calidad y con gran rapidez.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 17 / 27

Page 18: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

SLIM

El modelo utilizado por SLIM puede ser presentado como

A = AW, (8)

donde A : m× n es la matriz de ratings y W : n× n es una matriz sparsede coeficientes.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 18 / 27

Page 19: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

SLIM

La matriz W se obtiene minimizando el siguiente problema deoptimizacion regularizado:

mınW

12 ||A−AW ||

2F + β

2 ||W ||2F + λ||W ||1 (9)

sujeto a W ≥ 0, diag(W ) = 0.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 19 / 27

Page 20: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Computing W

Como las columnas de W son independientes, el problema de optimizacionse puede descomponer en el conjunto

mınwj

12 ||aj −Awj ||22 + β

2 ||wj ||22 + λ||wj ||1 (10)

sujeto a wj ≥ 0, wj,j = 0.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 20 / 27

Page 21: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

SLIM with Feature Selection

fsSLIM Antes de calcular wj se pueden usar metodos de seleccion decaracterısticas para reducir el numero de variables independientes. Estodisminuye sustancialmente el tiempo de construccion del modelo.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 21 / 27

Page 22: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

EXPERIMENTOS

Figura 4: The Datasets Used in Evaluation.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 22 / 27

Page 23: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Metodologıa de Evaluacion y Metricas

Hit Rate (HR) y Average Reciprocal Hit-Rank (ARHR)

HR = #hits#users

(11)

ARHR = 1#users

#hits∑i=1

1pi

(12)

donde #hits: TP

Nicolas Torres Matrix factorization 24 de septiembre de 2015 23 / 27

Page 24: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Top-N Recommendation Performance

Figura 5: Comparison of Top-N Recommendation Algorithms.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 24 / 27

Page 25: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Top-N Recommendation Performance

Figura 6: Comparison of Top-N Recommendation Algorithms.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 25 / 27

Page 26: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

SLIM for the Long-Tail Distribution

Figura 7: Performance on the Long Tail of ML10M. 1 % most popular items areeliminated from ML10M. Params have same meanings as those in Figura 6.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 26 / 27

Page 27: Nicol´as Torres - Pontificia Universidad Católica de Chiledparra.sitios.ing.uc.cl/classes/recsys-2015-2/... · Nicol´as Torres IIC 3633 - Sistemas Recomendadores Pontificia Universidad

Recommendation for Different Top-N

Figura 8: Performance Difference on Top-N Recommendations. Columnscorresponding to N shows the performance (in terms of HR) difference betweenSLIM and the best of the rest methods on corresponding top-N recommendatons.

Nicolas Torres Matrix factorization 24 de septiembre de 2015 27 / 27