31
Inteligencia de negocios Introducción a Business Intelligence

Minería de datos Presentación

  • Upload
    edmaga

  • View
    27.700

  • Download
    0

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Minería de datos Presentación

Inteligencia de negocios

Introducción a Business Intelligence

Page 2: Minería de datos Presentación

INTELIGENCIA DE NEGOCIOS

¿Qué es la Inteligencia de Negocios?

Page 3: Minería de datos Presentación

¿Qué es la Inteligencia de Negocios?

La Inteligencia de Negocio (IN) o Business Intelligence (BI) es el conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.

Page 4: Minería de datos Presentación

Objetivos de la Inteligencia de Negocios

Accesibilidad a la información Las herramientas y técnicas de BI permiten a los usuarios un acceso a los datos apropiado.

Apoyo en la toma de decisiones

Los usuarios tienen acceso a herramientas de análisis y de presentación de la información que facilitan la importante tarea de decidir ciertas situaciones.

Orientación al usuario final Se busca independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.

Page 5: Minería de datos Presentación

Ventajas que aporta la Inteligencia de Negocios en su empresa.

Controlar los gastos de TI Posee un único entorno para administrar.

Mejorar la colaboración y la calidad de las decisiones

La información queda a disposición del personal de la empresa en todos los niveles.

Reducir el número de sesiones de aprendizaje para los empleados

Interfaz sencilla e intuitiva.

Proporcionar al personal una visión detallada de las operaciones empresariales

Posee un conjunto de aplicaciones analíticas, cálculos, escritorios digitales, informes, análisis, minería de almacenamiento de datos y otras tecnologías.

Asistir a los directivos en la organización y previsión del trabajo

Proporciona una visión general única y común de todos los procesos empresariales en los distintos departamentos.

Page 6: Minería de datos Presentación

Herramientas para la Inteligencia de Negocios

Page 7: Minería de datos Presentación

Conceptos básicos Business Intelligence

UDM (Modelo unidimensional unificado)

Estandarización de los orígenes de datos.

Almacén de datosColección de orígenes de datos orientados a la ayuda de toma de decisiones empresariales.

Cubo

Un cubo OLAP es una vista lógica de los datos y representan un conjunto de datos relacionados con un tema en particular como Ventas, Operaciones, Recursos Humanos, etc., y están a disposición de los "clientes" a quienes les pueden interesar.

Dimensión

Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios. Descripciones, Nombres, Zonas, Rangos de tiempo, etc.

MedidasAspectos cuantificables o medibles de los objetos o eventos a analizar. Importes ventas, recuento empleados, etc.

Page 8: Minería de datos Presentación

Almacén de datos frente a ERP o base de datos convencional.

• Los orígenes de datos están diseñados por desarrolladores. Un almacén de datos tiene la finalidad de facilitar la comprensión de usuarios finales.

• La información interesante para el usuario se distribuye generalmente en varios orígenes de datos heterogéneos. En almacenes de datos se pueden unificar.

• Aunque muchos orígenes de datos están concebidos para contener una gran cantidad de detalles de los niveles de transacción, con frecuencia las consultas necesarias para tomar las decisiones corporativas precisan información agregada y de resumen. Al aumentar el volumen de datos, el tiempo necesario para recuperar los valores de resumen para un análisis de un usuario final interactivo es a menudo prohibitivo.

• Por lo general, las reglas de negocios no están encapsuladas en los orígenes de datos. Los usuarios deben realizar su propia interpretación de los datos.

Page 9: Minería de datos Presentación

Almacén de datos

• Es posible un análisis de datos en cualquier base de datos o ERP, con cubos, informes, etc.

• El objetivo de un almacén de datos es preparar la información existente en la base de datos o ERP, para el análisis y toma de decisiones.

• Un almacén de datos se prepara para admitir:– Procesamiento analítico en línea – Minería de datos

Page 10: Minería de datos Presentación

Elementos de un almacén de datos

• Tablas de hecho

• Tablas de dimensión

Page 11: Minería de datos Presentación

Tablas de hecho

• Las tablas de hecho son colecciones de tablas que contienen columnas para cada expresión medible.

• Almacenan sucesos medibles:– Transacciones de Ventas, – Compras – Balances de inventarios, y otros hechos – (ingresos en la clínica, importes, etc.)

Page 12: Minería de datos Presentación

Tablas de dimensión

• Las tablas de dimensiones almacenan los valores que se utilizan en las tablas de hechos.

• Almacenan información de – Clientes– Proveedores– Empleados– Geográfica– Tiempos

Page 13: Minería de datos Presentación

Dimensión de Tiempo.

• La dimensión de tiempo permite a los usuarios resumir información de las tablas de hecho en períodos de tiempo.

• Permite conocer:– Totales de calendarios anuales, – Comparar porcentajes respectos de periodos fiscales anteriores,– Conocer información en calendarios de fabricación.– Organizar la información según jerarquías de tiempo específicas.

• Sus atributos son horas, semestres, trimestres, meses y días. Las jerarquías permiten analizar los datos con mayor granularidad, por ejemplo, año – semestre – trimestres – meses.

Page 14: Minería de datos Presentación

Microsoft SQL Server (Motor de base de datos)

Entornos que proporciona Microsoft SQL Server para trabajar con almacén de datos:

• SQL Server Management Studio. Administrar y configurar objetos existentes en Almacén de datos.(Definición de tablas de dimensión y tablas de hecho, índices,

restricciones, usuarios, inicios de sesión, etc.)

Page 15: Minería de datos Presentación

Estructura del almacén de datos

Page 16: Minería de datos Presentación

Microsoft SQL Server Análysis Services (SSAS)

Entornos que proporciona Microsoft SQL Server para trabajar con SSAS:

• SQL Server Management Studio. Administrar y configurar objetos existentes Analysis Services.

(Acceso de usuarios a datos de clínica)

• Business Intelligence Development Studio. Desarrollar soluciones de Business Intelligence que incluyen funciones de Analysis Services, Integration Services y Reporting Services.

(Realizar consultas sobre enfermedades, tiempo, etc)

Page 17: Minería de datos Presentación

Elementos de Analysis Services

Orígenes de datos

Vistas de orígenes de datos

Cubos

Dimensiones

Estructuras de minería

Funciones

Ensamblados

Page 18: Minería de datos Presentación

Origen de datos

Es una conexión a un origen de datos y contiene la cadena de conexión que define el modo en que Analysis Services conectará con un almacén de datos físico mediante un proveedor Microsoft .NET Framework o un proveedor OLE DB nativo.

(Tenemos que conectarnos a los datos que nos proporciona en el almacén de datos)

Page 19: Minería de datos Presentación

Vista de origen de datos

Es la definición de los metadatos (información de los datos). Contiene el modelo lógico del esquema que utilizan los objetos de bases de datos: cubos, dimensiones y estructuras de minería de datos.

(DimEnfermedades, DimEspecialidad, DimMedicos, DimPacientes, Tablahecho, cubo, etc )

Page 20: Minería de datos Presentación

Cubos

Es un conjunto de medidas (hechos) y dimensiones (áreas de interés tales como tiempo, producto y cliente).

Las consultas que realizaremos en los datosFilas y columnas: enfermedades por trimestre

Área de datos: Número pacientes

Page 21: Minería de datos Presentación

Dimensiones

• Las dimensiones organizan los datos en función de un área de interés para los usuarios: Clientes, almacenes o empleados. Contienen atributos que corresponden a las columnas de las tablas de dimensiones.

• Los atributos se pueden organizar en estructuras jerárquicas o jerarquías.

Page 22: Minería de datos Presentación

Inteligencia de negocios

Data Mining

Page 23: Minería de datos Presentación

Minería de Datos

• La minería de datos trabaja con los datos con el objetivo de encontrar patrones de comportamiento ocultos en los mismos con el fin de crear nuevas asociaciones, predecir resultados futuros, etc.

• Las organizaciones se han convertido en entidades sumamente ricas en datos pero pobre en conocimiento. De modo que el objetivo principal de la minería de datos es generar patrones de comportamiento en los datos y a partir de ellos generar conocimiento útil.

Page 24: Minería de datos Presentación

Importancia de la Minería de Datos• Disponemos de una cantidad inmensa de datos en nuestra

organizaciones: Gracias a los programas de gestión empresarial, y al descenso del hardware, especialmente de los sistemas de almacenamiento ha llevado a las empresas a disponer de bases de datos con gigas de datos.

• Incremento de la competitividad. El incremento de la competitividad es en gran medida resultado de marketing actual, de los nuevos canales de distribución que dispone como Internet y de las telecomunicaciones y la aplicación de las TIC a la actividad empresarial. Las empresas se enfrentan a una economía globalizada, y el éxito empresarial depende de la capacidad de mantener a los clientes actuales y conseguir nuevos. La minería de datos contiene tecnologías que permiten a las empresas analizar los factures que influyen decisivamente en estos temas.

Page 25: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 1. RECOLECCIÓN DE DATOS

• El primer paso en un proyecto de minería de datos es la recolección de datos. Los datos de una organización habitualmente están almacenados en muchos sitios: base de datos de un ERP, de un CRM, hojas de cálculo de los comerciales y/o de los contables, una pequeña aplicación para controlar el stock en el almacén, etc. Por este motivo, la primera tarea que debemos emprender es determinar cuáles son los datos más relevantes y almacenarlos de modo adecuado en un almacén de datos o datawarehouse

Page 26: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS

• Este es el paso más importante en un proyecto de minería de datos. La depuración y transformación de los datos tiene como objetivo eliminar el ruido y la información irrelevante. El proceso de transformación consiste en modificar los datos originales en diferentes formatos en términos de tipos de datos y valores.

Page 27: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS

• Técnicas.– Transformación tipos de datos. Convertir valores continuos en

discretos.– Suprimir casos atípicos. Eliminar aquellos datos que pueden

falsear los datos, por ejemplo, un cliente que haga un pedido excepcional que supera en 10 veces el importe habitual.

Utilizando el modelo de clustering incluido en Microsoft SQL 2005 podemos generar un modelo que agrupe los casos atípicos para posteriormente eliminarlos a través de la combinación de Data Mining e Integration Services.

Page 28: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 3. GENEAR EL MODELO DE MINERIA DE DATOS.• Una vez que hemos limpiado y transformado los datos,

podemos comenzar la tarea de crear los modelos de minería de datos. Antes de generar cualquier tipo de modelo, es fundamental entender cuál es la meta del proyecto de minería de datos. ¿Vamos a crear un proyecto para clasificar, para generar una asociación, para establecer una segmentación, o para pronosticar y planificar las ventas del próximo año?El modelo es el corazón de cualquier proyecto de minería de datos. No obstante, una vez que uno tiene claro cual es el objetivo del proyecto, seleccionar el algoritmo que genere el modelo es una tarea relativamente sencilla.

Page 29: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 4. EVALUACIÓN DEL MODELO• Existen unas pocas herramientas para evaluar la calidad

de un modelo de minería de datos. La más conocida es el gráfico de rendimiento Esta herramienta utiliza los datos de un modelo entrenado para predecir los valores de una conjunto de datos de evaluación.

• No sólo se evalúa la precisión del modelo sino que se trata de comprender el significado de los patrones de comportamiento que los algoritmos han generado.En ocasiones, los patrones hallados no contienen información útil. Esto se pude deber a diferentes factores: a) los datos utilizados son totalmente aleatorios; b) que las variables utilizadas en el modelo no son las más precisas; c) la limpieza de datos no ha sido suficiente, y se ha de volver a la fase anterior.

Page 30: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 5. REPORTING

• Reporting es una de las tareas claves en la minería de datos. En muchas organizaciones, la meta final de la minería de datos es generar informes para los responsables de los diferentes departamentos.

Page 31: Minería de datos Presentación

Ciclo de un Proyecto de Minería de Datos

PASO 6. PREDICCIÓN

• Muchos de los proyectos de minería de datos, la búsqueda de patrones ocultos entre los datos responde a la necesidad de generar predicciones, por ejemplo de las ventas del próximo trimestre. La predicción se convierte por tanto en una de las tareas claves de la minería de datos.