21
Almacenes, minería y análisis de datos Unidad 3. Tecnologías de la información Equipo 3 Calderón Juárez Edgar Jareth, Camacho Castro Carina, Fuentes Cruz Laura Josefina González Arredondo Rosa Giovanna Mancilla Ríos Omar

Almacenes, mineria y análisis de datos

Embed Size (px)

DESCRIPTION

OLAP ALMACÉN DE DATOS DATAWAREHOUSE MINERÍA DE DATOS ANÁLISIS DE DATOS

Citation preview

Page 1: Almacenes, mineria y análisis de datos

Almacenes, minería y análisis de datosUnidad 3. Tecnologías de la información

Equipo 3Calderón Juárez Edgar Jareth,

Camacho Castro Carina, Fuentes Cruz Laura Josefina

González Arredondo Rosa GiovannaMancilla Ríos Omar

Page 2: Almacenes, mineria y análisis de datos

¿Qué es?

que se utiliza como ayuda al proceso de toma de decisiones por parte de quienes dirigen una organización.

Los almacenes Web de datos son almacenes de datos distribuidos que se implementan sobre la Web, no existiendo ningún repositorio centralizado.

almacén de datos Tecnología

de gestión y análisis de los datos.

Almacén (Data warehousing)

Puede definirse como:

Colección de datos clasificados

por temas, integrada, variable en el tiempo y no volátil

Se utiliza como ayuda al proceso de toma de decisiones por parte de quienes dirigen una organización.

BD Transaccionales

INSERTUPDATEDELETE

READREAD

Page 3: Almacenes, mineria y análisis de datos

Carácteristicas Integrado

No volátil

Variable en el tiempo

Temático

Mismos tipos de datos en todos los Depto. de la empresa

Diferentes fuentes

Los datos no se eliminan

Datos actualizados para fines de consulta

Organizado por temas

Metadatos

Page 4: Almacenes, mineria y análisis de datos

Funciones que cumple:

Integración Separación

Integración de datos recolectados de diferentes sistemas operacionales de la organización y o fuentes externas

Separación de datos según su uso con propósitos de análisis y toma de decisiones

Page 5: Almacenes, mineria y análisis de datos

VentajasMejorías notables al trabajar dentro de un proyecto:

Alto retorno de inversión

Ventajas competitivas derivadas de su utilización

Mayor productividad de los responsables de la toma de decisiones

Page 6: Almacenes, mineria y análisis de datos

ProblemasProblemas de los almacenes de datos

Subestimación de los recursos necesarios para la carga de datos.

Privacidad de los datos.

Altos costes de mantenimiento.

Proyectos de larga duración.

Complejidad de la integración.

Page 7: Almacenes, mineria y análisis de datos

Componentes1. Fuentes de Datos operacionales

2. Repositorio de datos operacionales (ODS)

3. Gestor de carga (ó componente de interfaz)

4. Gestor del almacén de datos:

5. Gestor de consultas (ó componente de servicio)

6. Datos detallados

7. Datos poco resumidos y muy resumidos

8. Datos de archivo / copia de seguridad

9. Metadatos

10. Herramientas de acceso para usuarios finales

BD *Estaciones de trabajo*Internet

Datos actuales e integrados que se utilizan para el análisis.

Operaciones asociadas con la extracción y carga de los datos en el almacén.

Análisis de los datos para garantizar su coherencia, transformación y combinación de datos de origen, creación de índices y vistas.

Dirigir consultas hacia tablas apropiadas y planificar su ejecución.

Consulta y generación de informesDesarrollo de aplicacionesProcesamiento analítico en línea (OLAP) Minería de Datos

Page 8: Almacenes, mineria y análisis de datos

Arquitectura almacen de datos

Page 9: Almacenes, mineria y análisis de datos

Herramientas y tecnologías de almacén de datos

1. Herramientas de extracción, limpieza y transformación

2. Sistemas de Gestión de Bases de Datos para almacenes de datos

3. Metadatos de un almacén de datos

4. Herramientas de administración y gestión

Page 10: Almacenes, mineria y análisis de datos

Almacenes de datosMercados de datos (Data Marts)

Un subconjunto de un almacén de datos que soporta los requisitos de un departamento ó área de negocios concreto.

Las principales características que diferencian a los mercados de datos de los almacenes de datos son:

un mercado de datos se centra únicamente en los requisitos de los usuarios asociados con un departamento ó área de negocio concreto;

los mercados de datos no contienen normalmente datos operacionales detallados, a diferencia de lo que sucede con los almacenes de datos;

como los mercados de datos contienen menos información que un almacén de datos, son más fáciles de comprender y de utilizar.

Page 11: Almacenes, mineria y análisis de datos

Almacenes de datosOLAP

Page 12: Almacenes, mineria y análisis de datos

Almacenes de datosCubos multidimensionales

Page 13: Almacenes, mineria y análisis de datos

Minería de datos La Minería de Datos es la extracción automática de información predictiva escondida desde bases de datos.

La Minería de Datos estudia métodos y algoritmos que permiten la extracción automática de información sintetizada que permite caracterizar las relaciones escondidas.

¿Qué es?

Page 14: Almacenes, mineria y análisis de datos

Mineria de datos como una tecnología

La Minería de Datos y las Bases de Datos comerciales están disponibles para resolver problemas de decisión de negocios.

La Minería de Datos es una tecnología que ayuda a enfocarse en la información más importante en los almacenes de datos.

Page 15: Almacenes, mineria y análisis de datos

Técnicas de mineria de datos

1. Modelado predictivo

2. Segmentación de la Base de Datos

3. Análisis de enlaces

4. Detección de desviaciones

Page 16: Almacenes, mineria y análisis de datos

Proceso de mineria de datos

Comprensión del negocio: Se centra en comprender los requisitos y objetivos del proyecto desde la perspectiva del negocio.

Comprensión de los datos: Incluye la recopilación inicial de datos y se preocupa por establecer sus principales características.

Preparación de los datos: Actividades para construir el conjunto final de datos al que pueden aplicársele las herramientas de modelado.

Modelado: Propiamente Minería. Implica seleccionar las técnicas de modelado, los parámetros y evaluar el modelo.

Evaluación: Valida el modelo desde el punto de vista del análisis de datos.

Implantación: El conocimiento obtenido y reflejado en el modelo tiene que organizarse y presentarse de una manera comprensible por parte de los usuarios.

Page 17: Almacenes, mineria y análisis de datos

Proceso de mineria de datos

BD Datos

Selección PreprocesadoSelección de

característicasExtracción de conocimiento Evaluación

Modeloclasificador

Conocimiento

Page 18: Almacenes, mineria y análisis de datos

Herramientas de mineria de datos

1. Preparación de los datos:

2. Selección de las operaciones (algoritmos) de minería de datos:

3. Escalabilidad y prestaciones del producto:

4. Funcionalidades para comprender los resultados, proporcionadas mediante medidas que describan la precisión y lo significativo de los datos

Page 19: Almacenes, mineria y análisis de datos

¿Qué es? Análisis de datos

Page 20: Almacenes, mineria y análisis de datos

Ejemplos APLICACIÓN:VISUAL DATA MINING O MINERÍA DE DATOS VISUAL

Oracle o Microsoft (con SQLServer) tienen herramientas para hacerminería de datos. También hay herramientas para la minería de datos en el ámbito del software libre.

Page 21: Almacenes, mineria y análisis de datos