26
Minería de datos Minería de datos Dr. Francisco J. Mata Dr. Francisco J. Mata Análisis de Análisis de encadenamiento encadenamiento Teoría Teoría Tema 11 Tema 11

Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Embed Size (px)

Citation preview

Page 1: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosMinería de datosDr. Francisco J. MataDr. Francisco J. Mata

Análisis de Análisis de encadenamientoencadenamiento

TeoríaTeoría

Tema 11Tema 11

Page 2: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

►Puede considerarse como un Puede considerarse como un complemento al análisis de asociacióncomplemento al análisis de asociación Análisis de canasta de supermercadoAnálisis de canasta de supermercado Análisis de secuenciaAnálisis de secuencia

►Representa las asociaciones en la Representa las asociaciones en la forma de un grafoforma de un grafo

Page 3: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

Page 4: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

Page 5: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

Page 6: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

►Basado en teoría de grafosBasado en teoría de grafos

Page 7: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

Page 8: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

►Paso Euleriano: contiene cada vértice Paso Euleriano: contiene cada vértice exactamente una vezexactamente una vez

►Paso Hamiltoniano: contiene cada Paso Hamiltoniano: contiene cada nodonodo

Page 9: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación del análisis de Aplicación del análisis de encadenamiento: encontrar máquinas encadenamiento: encontrar máquinas

faxfax►¿Cómo se pueden encontrar máquinas ¿Cómo se pueden encontrar máquinas

de fax?de fax?

Page 10: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación del análisis de Aplicación del análisis de encadenamiento: encontrar máquinas encadenamiento: encontrar máquinas

faxfax

Page 11: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación del análisis de Aplicación del análisis de encadenamiento: encontrar máquinas encadenamiento: encontrar máquinas

faxfax

Page 12: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación del análisis de Aplicación del análisis de encadenamiento: encontrar máquinas encadenamiento: encontrar máquinas

faxfax

Page 13: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación del análisis de Aplicación del análisis de encadenamiento: encontrar máquinas encadenamiento: encontrar máquinas

faxfax

Page 14: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento en minería de encadenamiento en minería de

webweb►Minería de webMinería de web

ContenidoContenido EstructuraEstructura

Page 15: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: contenido webencadenamiento: contenido web► Búsqueda en Internet antes de Google

Basada completamente en el texto de estas páginas

►Las página se indizaban para que las máquinas de búsqueda recuerden las palabras en ellas

►Cualquier página conteniendo las palabras en una consulta de un usuario se devolvían

► Problema Esta estrategia de búsqueda ignora la riqueza de

la información contenida en el gráfico de cuáles sitios tienen vínculos a otros

Un número de variables útiles se puede derivar de estas conexiones:

►La cuenta de páginas ligadas a una página determinada es una medida de su popularidad

Page 16: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: contenido webencadenamiento: contenido web► La idea que tuvieron Joel Kleinberg de

Cornell y Sergey Brin y Lawrence Page de Stanford fue que la selección de a que páginas ligar reflejan la opinión personal del valor de estas páginas La opinión de algunas páginas es más valiosa

para unos que para otros Algunos sitios llamados “hubs” contienen

enlaces a muchas páginas autoritarias Otros sitios llamados autoritarios están ligados a

muchos sitios importantes “hubs”

Page 17: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: contenido webencadenamiento: contenido web

Page 18: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: contenido webencadenamiento: contenido web►Un buen “hub” apunta a muchos sitios

autoritarios►Un buen sitio autoritario está ligado a

muchos “hubs” Cada uno es definido en términos del otro

►El algoritmo de Kleinberg para calificar sitios “hub” y autoritarios va y viene entre cada uno de ellos

Page 19: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: contenido webencadenamiento: contenido web

Page 20: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: contenido webencadenamiento: contenido web

Page 21: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: estructura encadenamiento: estructura

webweb►Un sitio web es diseñando con una Un sitio web es diseñando con una

estructura en menteestructura en mente►El acceso de los usuarios al sitio puede El acceso de los usuarios al sitio puede

mostrar que la estructura planeada mostrar que la estructura planeada puede ser mejoradapuede ser mejorada

Page 22: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: estructura encadenamiento: estructura

webweb►Un sitio web es diseñando con una Un sitio web es diseñando con una

estructura en menteestructura en mente►El acceso de los usuarios al sitio puede El acceso de los usuarios al sitio puede

mostrar que la estructura planeada mostrar que la estructura planeada puede ser mejoradapuede ser mejorada

Page 23: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: estructura web sin encadenamiento: estructura web sin

secuenciasecuencia

Page 24: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: estructura web sin encadenamiento: estructura web sin

secuenciasecuencia

Page 25: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Aplicación de análisis de Aplicación de análisis de encadenamiento: estructura web con encadenamiento: estructura web con

secuenciasecuencia

Page 26: Minería de datos Dr. Francisco J. Mata Análisis de encadenamiento Teoría Tema 11

Minería de datosDr. Francisco J. Mata

Análisis de encadenamientoAnálisis de encadenamiento

► Muchos problemas de interés en minería de datos involucran relaciones y conexiones

► Conexiones pueden ser representadas como grafos utilizando análisis de encadenamiento

► Resultados del análisis de encadenamiento puede ser utilizados directamente en la minería de datos: Colorear mapas (encontrar máquinas fax) Encontrar sitios “hub” y autoritarios Minería del web

► En otros casos resultados del análisis de encadenamiento puede ser utilizados con otras técnicas de minería de datos: Segmentación