Upload
meaningcloud
View
348
Download
0
Embed Size (px)
Citation preview
La analítica de textos más precisa con MeaningCloud
Multiplica la exactitud de tu analítica de texto con nuestras herramientas de personalización
Webinar Daedalus / MeaningCloud, 12 de mayo de 2015
Introducción
Presentador
Logística
Enviar preguntas de texto
“Levantar la mano” para hablar
Publicaremos enlace a webinar grabado
Antonio Matarranz
Director Comercial
Agenda
Analítica de texto. Exactitud, precisión y cobertura
Recursos lingüísticos personalizados para mejorar la exactitud
Herramientas de personalización de MeaningCloud
Conclusiones y preguntas
Analítica de texto
Extraer significado “actuable” de contenido no estructurado Automatización de tareas típicamente manuales
OpinionesTemasHechos
Conceptos
Organizaciones
Personas
Análisis
Semántico
Relaciones
¿Qué precisión tiene todo esto?
La precisión es “relativa”
Las personas no tenemos una precisión del 100%
Tests con analistas humanos: acuerdo 85-95%
Además de precisión, cobertura (recall)
Alta precisión Alta cobertura
Alta precisión Baja cobertura
Baja precisión Alta cobertura
Identificado por algoritmo
Exactitud: precisión y cobertura
Precisión y cobertura están inversamente relacionadas
Buscar compromiso
Los requisitos dependen de la aplicación
Monitorización de marca en medios sociales: alta precisión, baja cobertura
Lucha antiterrorista: alta cobertura, baja precisión
Estado del arte en analítica de texto
Medidas de precisión
Extracción de topics (ej.: entidades): 70-85%
Clasificación: 70-80%
Análisis de sentimiento: 60-70%
La mejora de calidad depende de la adaptación de las herramientas y recursos a la aplicación/tarea
MeaningCloud: API semánticas en la nube
Regístrate y úsalo GRATIS en http://www.meaningcloud.com
APIs MeaningCloud Análisis de sentimiento Global A nivel de aspecto
Clasificación Modelos estándar
Extracción de topics Entidades Conceptos Fechas Direcciones Cantidades económicas Expresiones temporales …
https://www.meaningcloud.com/es/demos/analisis-de-medios/
MeaningCloud: recursos estándar
Ontodaedalus (ontología) 437 tipos de entrada
78 temáticos
250.000+ lemas/idioma
https://www.meaningcloud.com/developer/documentation/ontodaedalus
MeaningCloud: recursos estándar
Modelos de clasificación estándar
IPTC: noticias
Business Reputation: reputación corporativa
EuroVoc: administración pública
IAB (pronto): publicidad
https://www.meaningcloud.com/developer/resources/models
Un ejemplo práctico
Recorrido por las herramientas de personalización de MeaningCloud
Escenario VoC / Customer Insights
Redes sociales, foros
Verbatims encuestas
Interacciones Contact Center: voz, email…
Estructurar y extraer significado
¿Qué empresas/ marcas mencionan?
¿De qué están hablando?
¿Cuál es su opinión?
Análisis
Insights
Opiniones
La frase “¡Tiene el tipo de interés más alto del mercado!” es…
Positiva, si habla de depósitos
Negativa, si habla de hipotecas
Recursos lingüísticos específicos mejoran la exactitud
Menciones
Nombres de bancos y entidades financieras, p. ej.: Santander, BBVA
Nombres de productos, p. ej.: Cuenta Naranja, Libreta Estrella…
Temas
Ejemplo: análisis de las opiniones de clientes de un banco
Productos
Pasivo
Cuenta
Depósito
Activo
Crédito
Hipoteca
Canal
Oficina
Teléfono
Internet
Qué vamos a hacer
Diccionario Banca
Nombres de bancos, nombres de productos (entidades)
Nombres de productos genéricos, p.ej.: hipoteca (conceptos)
Modelos de clasificación
Modelo Canales: teléfono, web…
Modelos de sentimiento (avance)
Herramientas de personalización MeaningCloud
Diccionarios personales
Creando un nuevo diccionario
Posibilidad de importar diccionario desde fichero
Creando una nueva entidad
Alias: NO es necesario introducir explícitamente alias “inmediatos”( ej.: tildes), motor genera variantes
Usa tu propia ontología
Posible incorporar información semántica adicional
Diccionario resultante
Entidades
Conceptos
La ontología que se deriva del diccionario
Importación de diccionarios
La mejor manera de incorporar a MeaningCloud un diccionario preexistente
Forma Alias ID Atributos de Información semántica
Resultado: las APIs identifican topics del diccionario
Identifica información semántica Producto: Cuenta Nómina Tipo: Cuenta corriente Banco: ING
Modelos de clasificación personales
Creando un nuevo modelo
Posibilidad de importar modelo desde fichero
Definiendo una categoría: enfoque híbrido
Basado en Reglas
Basado en Entrenamiento
Se puede optar por uno de los enfoques o combinarlos,
según la aplicación
Definiendo una categoría: entrenamiento
Se alimenta con textos de entrenamiento precodificados
Basado en tecnología machine learning
Definiendo una categoría: reglas
Términos que
Aumentan la relevancia
Disminuyen la relevancia
Son imprescindibles
Están prohibidos
Cómo mejorar precisión y cobertura aplicando reglas + entrenamiento
Estadístico Basado en reglas Híbrido
Ventajas Muy rápido si ya tienes
textos etiquetados
Buenos resultados para
textos largos
No hay falsos positivos
Muy buenos
resultados para
casuísticas limitadas
Se puede poner en marcha
fácilmente a partir de textos
de ejemplo
No necesita definición
exhaustiva de reglas
Desventajas “Caja negra”
Falsos positivos difíciles
de corregir
Sesgo en resultados
según entrenamiento
Costoso partiendo
desde cero
Falsos negativos según
la calidad de las reglas
Escala con dificultades
Requiere conocimiento
exhaustivo de dominio
Modelo resultante
Importación de modelos
La mejor manera de incorporar a MeaningCloud un modelo
preexistente
Resultado: las APIs clasifican según el modelo
Justifica la relevancia de la clasificación en función de los términos que parecen
Aplicación al Análisis de Sentimiento
Sentimiento: uso de diccionarios personales de entidades y conceptos
Polaridad asociada a la entidad Cuenta Nómina
Diccionarios personalizados de Sentimiento (PRONTO)
No todos los términos tienen la misma polaridad en todos los dominios
Ej.: en el dominio de artículos de lujo “barato” no tiene necesariamente una polaridad positiva (como en otros dominios)
En modelo de Sentimiento para dominio Lujo: “barato” N
Un mismo término puede tener distintas polaridades, según el contexto
Tenemos esta funcionalidad en pruebas. Si quieres participar en la beta privada envía un email a [email protected]
Término Contexto Polaridad
cerrar Bolsa, marcador NEUTRO
cerrar Contrato, compraventa P
cerrar Empresa N
Conclusiones
¿Cómo mejorar la exactitud?
Herramientas gráficas
Posibilidad de incorporar tus diccionarios y modelos
Amplia cobertura: menciones, temas, opiniones…
Usuarios autónomos
La mayor exactitud al alcance de tu mano
Democratizando la extracción de significado
Análisis semántico de alta calidad
Combinación optimizada de tecnologías
Recursos semánticos actualizados continuamente
APIs de alto nivel, ej.: reputación corporativa…
Personalización al dominio del cliente: clasificación, diccionarios, sentimiento
Asequible y sin riesgos
Tecnología madura y probada
Posible probar y usar Gratis (40.000 peticiones/mes)
Pago por uso
Sin compromisos ni permanencias
Planes comerciales a partir de 99 $/mes
Para desarrolladores y
usuarios no técnicos
Add-in para Excel
APIs servicios web estándar
Plug-ins y SDKs para diversos entornos y lenguajes
Plug-and-play
OpinionesTemasHechos
Conceptos
Organizaciones
Personas
Relaciones
¡Muchas gracias por vuestra atención!
Preguntas, sugerencias, etc.
Antonio Matarranz
Director Comercial
Daedalus, S.A.
Tel: +34 913324301
http://www.meaningcloud.com
http://www.daedalus.es