Big Data & AI Business - Congreso Big Data Alcoy

Preview:

Citation preview

1

Mario Romero

mario.romerojunquera@telefonica.com

Big Data & AI Business

Casos de uso

2

Big Data en Telefónica

https://www.elindependiente.com/economia/2019/01/13/asi-ayuda-telefonica-a-otras-empresas-a-seguirte-con-big-data/

3

Bussiness Insights: los datos de Telefónica

Nuestras fuentes de información

Navegación

Trafico fijo

Contrato/Facturación

Trafico móvil

TelevisiónGeolocalización

Datos en tiempo real

4

Bussiness Insights: los datos de Telefónica

Cómo aplicamos nuestras fuentes de información

Geolocalización

Código postal Sección censal

12

millones

de móviles

2-3 mil.

Roamers(extranjeros

+

nacionales)

En

gru

po

s n

o m

en

ore

s d

e 1

5 p

ers

on

as.

Resolución espacialmínima

Resolución temporal 365 días x 24 horas

• Cuantos móviles hay en un área.

• Donde viven.• Donde trabajan.• Cuantos km recorren.• Recurrencia de los

visitantes a una zona

Universo

Agregación

35% del market share móvil

Dependiendo de las zonas

KPI generado

Navegación

Navegación móvil

categorías del IAB.

URL1 -> Categoría 1

URL2 -> Categoría 1

.

.

.

URL1 -> Categoría 1

Ca

teg

orí

as

con

no

me

no

res

de

15

UR

Ls.

Agregación KPI generado

• Tipologías de clientes de una zona

Trafico móvilTráfico fijo

• Volumen de llamadas recibidas en una zona

• Volumen de llamadas emitidas en una zona

• Grafo de relación

KPI generado

Ag

reg

ad

o p

or

áre

a,

NO

PO

R T

ELE

FON

O

Agregación

Llamadas

Modelos

de

scoring

Ag

rega

do

po

r á

rea

, N

O P

OR

TE

LEFO

NO

Contrato/Facturación

• Scoring de riesgo

KPI generado

Creando Valor e Insights con Privacidad

Anonimizado Agregado Extrapolado

Activos

Pasivos

Femto

Miles de millones de

6

Casos de uso

Turismo

7

Alcoy.Impacto turístico Semana del Modernismo 2018

Analizar el efecto / impacto económico de distintos actos (mascletá, plantá, cremá, etc.)

Moros y Cristianos Calpe

Oktoberfest Calpe

Ayuntamiento BenidormActividad por rango horario y tipo de día

El mayor numero de visitas se concentra en el

distrito 3.

Puede apreciarse los siguientes patrones en las

visitas al municipio, independiente del periodo

(laboral/festivo):

El distrito 0 y 2 mantienen el mismo número de

visitas a lo largo del día

El distrito 1 pierde visitas conforme sucede el día

El distrito 3 gana visitas conforme sucede el día

11

0%

10%

20%

30%

40%

50%

9:00 a 15:00 15:00 a 21:00 21:00 a 9:00 9:00 a 15:00 15:00 a 21:00 21:00 a 9:00

Lunes-Jueves Viernes-Domingo

0 1 2 3

1

03

2

Cultura

Caracterización de Visitantes | Museo Reina Sofía

● Evolutivo de las visitas: análisis

exploratorio alrededor de los siguientes

conceptos entre otros: visitas recibidas,

canal de venta, tipo de reserva, fecha y

hora de la visita, venta en tienda, etc.

● Segmentación de los visitantes:clusterización no supervisadaincorporando las variables como:procedencia, edad, género, formación,actividad laboral, intereses, satisfacción,etc. para segmentar a los visitantes endistintos clusters con característicassimilares.

● Correlación entre visitas y factores

externos: movilidad, actividad económica,

festividades y meteorología.

● Análisis del Impacto Social Generado en

Redes Sociales.

Solución

● Aumento del número de visitantes.

● Mejora de la imagen del museo y de la ciudad

y reconocimiento mediático.

● Generación de riqueza y motor de desarrollo.

● Fomento de la cultura, conservación e

interpretación del arte y el patrimonio.

● Generación de una experiencia, más allá de un

mero espacio de entretenimiento.

Beneficios

Conocer y analizar el

comportamiento del público que

acude al Museo para optimizar y

enriquecer la toma de decisiones y

para que la experiencia de las futuras

visitas mejore y el impacto de la

institución aumente de manera

positiva.

Reto

Cultura

Caracterización de Visitantes | Museo Reina Sofía

14

Casos de uso

Movilidad

Movilidad

Consorcio de Transporte de Zaragoza | Previsión de la demanda

El consorcio de transporte de Zaragoza necesitaba entender la demanda de transporte entre zonas dentro del área metropolitana de Zaragoza. Para ello se realizó una matriz Origen – Destino (OD) con segmentación del tiempo del viaje, el modo (tipo de transporte), el motivo del viaje, dónde residen, edad, género, nacionalidad, etc.

Objetivo

Diagrama de cuerdas entre zonas Visualización en mapa de la relación entre zonas

16

Casos de uso

Consultoría

Predicción de la calidad del aireMovilidad – Ayuntamiento de Madrid

ENFOQUE TÉCNICO

IMPACTO

En este proyecto se cruzan los datos de la red móvil en la ciudad de Madrid con los datoscapturados por los sensores de contaminación repartidos por la ciudad, con el objetivo deanticipar los días y zonas con mayor probabilidad de tener niveles de NO2 elevados.De esta manera el Ayuntamiento puede gestionar el tráfico con el apoyo de datos, y evitar laexposición de los ciudadanos a niveles de contaminación elevados.

Análisis de la movilidad mediante el seguimiento de eventos de la red móvil

Visualización dinámica e interactiva de rutas más probables.

Análisis predictivo de los niveles de contaminación

Toma de decisionesbasada en datos

Gestión inteligente y preventiva del tráfico

Mejor conocimiento de la situación

Menor incidencia de enfermedadesrespiratorias

El objetivo del proyecto era múltiple;• Entender el distinto rendimiento de tiendas aparentemente parecidas, usando variables

internas y externas (Smart Steps)• Predecir la venta potencial de clientes y no clientes

IMPACTO

Clusterizar, y ordenar por venta potencial y perfildel comprador todos los puntos de venta clientesde PepsiCo en la cataegoría de interés

Identificar nuevas zonas geográficas de oportunidad

Clusterizar, y ordenar por venta potencial y perfil del comprador todos los puntos de venta no clientes de PepsiCo en la cataegoría de interés

Predecir el potencial de venta decada tiendo mediante un modeloRandom Forest con más de 800variables, tanto internas comoexternas

Clusterizar todos los puntos de ventacon respecto a su perfil decomprador, usando un modeloExpectation Maximization

ENFOQUE TÉCNICO CAPACIDADES Analíticas

• Regresión mediante RandomForest

• Clusterización mediante Expectation Maximization

• Integración con datos externos a la organización (plataforma Smart Steps)

Segmentación avanzada y venta potencialGran empresa FMCG – Proyecto Analítico

LÍN

EA

S D

E T

RA

BA

JO C

UB

IER

TA

S:

MA

TR

IZ D

E A

UT

OS

UF

ICIE

NC

IA

IMPACTOVisión 360 del clienteGran empresa Oil&Gas – Assessment Estratégico

Un porblema habitual en las grandes empresas es que cada departamento define el cliente de maneradistinta y que, además, la información se guarda en silos no conectados. El objetivo de este proyectogenerar el Golden Record del cliente, es decir, un repositorio común desde el que se pueda acceder atoda la información que la empresa dispone de ese cliente.

ENFOQUE TÉCNICO

CAPACIDADES Analíticas

• Definición de modelo de datos

• Gobierno del Dato

Definición funcional del modelo de datos para la visión 360 del cliente

Generación de un modelotécnicamente y funcionalmenteescalable (Gobierno del Dato)

Diseño y construcción de un primer MVP

Definición del Roadmap de próximosproyectos

Impulsar la consistenciaen las interacciones y contactos con el cliente

Llevar a cabo campañas con un alto grado de personalización

Facilitar la detección de nuevas oportunidades multi-departamentales a través de una visión total del cliente

LÍN

EA

S D

E T

RA

BA

JO C

UB

IER

TA

S:

FIC

HA

360

HOSPITAL PUERTA DE HIERRO | BALANCED SCORECARD GESTIÓN HOSPITALARIA

RETOSoporte a la toma de decisionesbasada en datos a partir de lamonitorización de la actividadhospitalaria.

SOLUCIÓNDespliegue de plataforma BigData y recogida de datos del HIS.Desarrollo de cuadros de mandode actualización diaria, semanal ymensual para el seguimiento dela actividad asistencial global, laactividad quirúrgica, las consultasexternas y urgencias.Implementación de alertas porobjetivos en función de losumbrales definidos para losdistintos KPIs.

BENEFICIOSSeguimiento de la actividad diariadel hospital y toma de decisionesbasada en datos.Monitorización de los objetivosfijados a través de los KPIsdefinidos para cada uno de ellos.Mejora de la eficiencia operativa.

UNIVERSIDAD INTERNACIONAL DE VALENCIA| CURSOS ON-LINE DATACADEMY

RETOContenido online paraasignaturas específicas (ETL conHadoop, Spark y SparkStreaming) para su Master en BigData y Data Science.Han renovado en 2019 añadiendola tutoría de un Trabajo de Finalde Máster.

SOLUCIÓNDespliegue de la plataformaDatAcademy de LUCA.Soporte de un Senior DataScientist durante 3 meses para ladirección del TFM.

BENEFICIOSVIU no tiene que desarrollarcontenidos, si no que compracursos cerrados con el contenidode interés. Entrega inmediata ycostes ajustados.

22

Casos de uso

Sport Analytics

Análisis de impacto Maratón Valencia 2018

• En general se produce un aumento del 32% de población en la zona. Por orígenes se produce un incremento de 12% de usuarios de Valencia (provincia), un 124% de usuarios del resto de España y un 67% de usuarios extranjeros.

Analizando el impacto de “La Vuelta”

Worldwide. Twitter

3

Midiendo el impacto de “La Vuelta 2017”

< 3000 km. TV Audience

2

< 300km. Mobility

1

Movilidad

Chrono stage: Mobility at

starting location

Hourly peak of

mobility (compared

to 2016)

Number of journeys

that day

Origin locations on map

Top 5 origin municipalities

1

Audiencias TV: Movistar +2

Audience per

day.

Audience per

channel.

Stages crossing a province boost

audience in that province.

Household of TV

watchers.

Twitter: Impacto & Sentiment Analysis

Volume reach and mentions

over the days.

Per minute international vs

national activity.

Top

influencers.Sentiment analysis.

3

Improving

performance in

eSports with Big

Data

Riot Games Server

(Massive Data)

Data ScienceCompetitions and

training sessions Riders Skills

tool

We built a tool to gain insights from thousands of matches

Machine Learning to design a winning strategy and scouting thebest players.

Monitoring of physical activity and

sleep patterns.

Monitoring of stress and focus with

Electro Encephalogram (EEG)

Machine Learning

A/B TestingInsights about how

physiology is affecting

performance

We use wearable devices to monitor their physical and mental

response during the game, to detect contextual factors that influence

performance.

Understanding gamer’s physiology vs performance.

Relax

Getting Ready

Game

EEG: Complexity and Potential.

33

Casos de uso

Big Data for Social Good

Modelling Zika’s spread with mobility data in Colombia

https://data-speaks.luca-d3.com/2018/04/mobile-data-mapping-Zika.html

Análisis de migraciones y movilidadMovilidad – Proyecto con FAO (Naciones Unidas)

El análisis de datos agregados generados por la red móvil permite entender las dinámicas de las poblaciones en undeterminado contexto geográfico. En particular, una aplicación en auge consiste en la detección y cuantificación defenómenos migratorios a escala nacional y/o urbana.

Hemos realizado un análisis de las poblaciones rurales desplazadas en Colombia debido a fenómenos climáticosextremos como son la sequia (https://www.youtube.com/watch?v=uZ5_B4B3fJE) . De modo análogo, la técnicaempleada serviría para cuantificar fenómenos de gentrificación en grandes ciudades, que suelen implicar el cambiode residencia de la población residente en barrios céntricos y tradicionales a la periferia

Toma de decisionesbasada en datos

Información de utilidad para AAPP y ONGs

Mejor conocimiento de la situación

Cuantificación de un fenómeno complejo

IMPACTO

ENFOQUE TÉCNICO

Análisis de la movilidad mediante el seguimiento de eventos de la red móvil

Visualización dinámica e interactiva de orígenes y destinos de los migrantes.

Detección de patrones de movilidadcorrespondientes a migrantes

ProFuturo: Educación DigitalFundación Telefónica y Fundación “la Caixa”

IMPACTOLa educación es el instrumento más poderoso para reducir la desigualdad y construir las basespara un crecimiento sostenible a nivel mundial. ProFuturo, la iniciativa impulsada por FundaciónTelefónica y Fundación Bancaria ”la Caixa” para llevar educación digital a niños y niñas deentornos vulnerables, ha beneficiado ya alrededor de 5,8 millones de niños y niñas de 23 paísesde Latinoamérica, África y Asia.

El objetivo de ProFuturo es promover la igualdad de oportunidades a través de una educaciónde calidad y equitativa utilizando las herramientas digitales. Para cada despliegue, ProFuturoalcanza acuerdos con agentes – privados, públicos y del tercer sector- más relevantes en elámbito del ámbito de la Educación y de la Cooperación Internacional.

Reducción de la desigualdad, ofreciendooportunidadeseducativas a niños y niñas de entornosvulnerables

luca-d3.com

Recommended