14
Minería de textos Minería textual Text Mining Integrantes: - Samuel Silva Abuhadba - Marcelo Valdivia Paredes

Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Embed Size (px)

Citation preview

Minería de textos Minería textual

Text Mining

Integrantes:- Samuel Silva Abuhadba - Marcelo Valdivia Paredes

¿ Qué es ?O «La Minería de Textos es una tecnología

emergente cuyo objetivo es la búsqueda de conocimiento en grandes colecciones de documentos no estructurados.»

O El 80% de la informacion de las organizaciones esta almacenada en forma textual no estructurada como : informes , e-mail , actas de reuniones, etc.

Aplicaciones y UsosO Categorización de la información existente ,

filtrado y enrutado ; e-mails , detección de información similar o duplicada

O Utilizados en empresas para identificar el contenido de los e-mails enviados por los clientes y redirigirlos a los departamentos correspondientes

O Usos mas avanzados el sistema identifica el contenido de una consulta frecuente hecha por e-mail y envía una respuesta estándar sin necesidad de intervención humana.

O Vigilancia Tecnológica

O Inteligencia de negocios

Tres pasos fundamentales de la

minera de textos:1.-Recuperación de información, es decir, seleccionar los textos pertinentes.2.-Extracción de la información incluida en esos textos: hechos, acontecimientos, datos clave, relaciones entre ellos, etc.3.-Por ultimo se realizaría lo que antes definíamos como minería de datos para encontrar asociaciones entre esos datos claves previamente extraídos de entre los textos

¿Como hacer la minera de textos?

O Es una técnica relativamente nueva, cambiante y que puede adaptarse a diferentes situaciones y casos, por lo que no existe un método estricto a seguir siempre. Sin embargo, en términos generales se podría decir que estas son las cuatro etapas principales

Primera

Determinación de los objetivos. Aclarar que es lo que se esta buscando con esta investigación, acotando hasta que punto se quiere profundizar en la misma y definiendo claramente los limites.

Segunda

Preprocesamiento de los datos, que seria la selección, análisis y reducción de los textos o documentos de los que se extraerá la información. Esta etapa consume la mayor parte del tiempo.

TerceraDeterminación del modelo. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse unas técnicas u otras.

Cuarta

Análisis de los resultados. A partir de los datos extraidos se tratara de ver su coherencia y se buscaran evidencias, similitudes, excepciones, etc, que puedan servir al especialista o al usuario que haya encargado el estudio para extraer conclusiones que pueda utilizar para mejorar algún aspecto de su empresa, compañía, administración u organización en general.

“Data mining: torturando a los datos hasta que confiesen”

Luis Carlos Molina Félix

Ejemplo: Migraña

O Se pudieron extraer evidencias a partir de varios artículos de literatura biomédica y algunas de las claves fueron: 

O El estrés está asociado con la migraña.O El estrés puede conducir a la pérdida de magnesio.O Los bloqueadores de canales de calcio previenen algunas

migrañas.O El magnesio es un bloqueador natural del canal de calcio.O La depresión cortical diseminada (DCD) está implicada en

algunas migrañas.O Los niveles altos de magnesio inhiben la DCD.O Los pacientes con migraña tienen una alta agregación

plaquetaria.O El magnesio puede suprimir la agregación plaquetaria

O Estas evidencias permitieron crear una hipótesis que no existía en la literatura científica como tal pero que se pudo encontrar de manera indirecta haciendo un análisis diferente de los textos. Estudios posteriores probaron experimentalmente esta hipótesis obtenida por text mining con buenos resultados.

O Ejemplo: Las fichas de entrada en una fabrica.O Departamento donde salen mas tarde.O Incidencia de faltas

O Retrasos en función de las fechas.

ResumenO En resumen, la minería de textos pueden ayudar a

que la información implícita en los documentos más explícitos se puede hallar de manera rápida. Esto hace que ahorremos tiempo y dinero.. El text mining se apoya en otras técnicas como: 

O extracción y recuperación de la informaciónO aprendizaje automáticoO procesamiento de lenguaje naturalO categorización de texto

Conclusiones:O La minería de textos es una tecnología recuperación y

organización de la información que aunque todavía es emergente y necesita ser mejor desarrollada, nos sirve para obtener un tipo de información muy útil en cualquier tipo de organización publica o privada. 

O Económicamente es una técnica que puede utilizarse para ahorrar dinero y abrir oportunidades de negocio a las empresas.

O En cualquier organización, las conclusiones a las que se puede llegar a través del text mining pueden ser utilizadas para la toma de decisiones