Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
4
Primera Biblioteca - Alejandría
“Biblioteca de Alejandría”, https://es.wikipedia.org/wiki/Biblioteca_de_Alejandr%C3%ADa 2015
5
Castillos – Edad Media
http://musicayocio.com/noticias/fin-de-semana-medieval-en-el-castillo-de-manzanares-el-real/, 2015
7
Computadora Thiane 2 (China)3,120,000 Cores – 54,902 Teraflops
“Top500”, http://top500.org/lists/2015/11/, 2015
8
“90% de la información existente a lo largo del planeta en toda su historia se ha generado en los últimos dos años”
Aitor MorenResponsable de
Inteligencia Artificial de Ibermática
Crecimiento de los 2 últimos años
“Big Data”, http://www.ibermatica.com/sala-de-prensa/opinion/big-data-el-termino-de-moda-en-el-mundo-de-la-informatica
9
Se estima un crecimiento del 4300% en la generación de datos anuales para 2020.
Crecimiento estimado
http://www.winshuttle.es/big-data-historia-cronologica/
11
“Big Data” es una cantidad de datos muy grande, que excede las capacidades convencionales de los sistemas de Base de Datos.
¿Qué es Big Data?
“Big Data Now”, O'Reilly Media 2012
12
Difícil de recolectar (distribuidos en toda la red)
Difícil de almacenar (zetabytes = 1 x 10 E21).
Difícil de analizar (gran cantidad de información).
Difícil de procesar (se buscan patrones)
Características del Big Data
“Big Data Now”, O'Reilly Media 2012
13
Procesamiento del Big Data
“Big Data Now”, O'Reilly Media 2012
DATOS MODELADO SIMULACION OPTIMIZACION INFORMACION
15
Cada cosa que se conecta a Internet Internet está lleno de datos. Por lo tanto, cada cosa que conectamos es parte
del Big Data.
Internet y Big Data
“Big Data Now”, O'Reilly Media 2012
16
Estructurados: como las bases de datos (fáciles de recolectar).
Datos sin estructura: Como la mayoría de las páginas Web (complejos de recolectar).
Datos SemiEstructurados: Como los documentos, que llevan un cierto formato (difíciles de recolectar).
Tipos de Datos
“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015
18“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015
”Cómo funciona La Web”, http://www.ciw.cl/libroweb, 2008
Anatomía de la Web
31
Se detectó un patrón de compra en la década de los 90s en las tiendas Walmart:
Hombres casados y con hijos pequeños compraban “cervezas y pañales”
Caso Walmart: Detección de Tendencias
34
1000 millones de líneas de código.
Cada motor genera 10 TB cada 30 minutos.
640 TB en un vuelo Londres Nueva York.
Avión Airbus A380
36
Competitividad Mundial
Ya no voy a ir Ya no voy a ir al antro…al antro…
Ya me dió el dolor Ya me dió el dolor de caballo…de caballo…
Si hubiera Si hubiera entrenado mas…entrenado mas…
Ahorita le Ahorita le meto un meto un
codazo…codazo…
No vuelvo a No vuelvo a cenar cenar
enchiladas…enchiladas…
¿cuánto quedó ¿cuánto quedó el Morelia?el Morelia?
By 2018, the United States will experiencea shortage of 190,000 skilled data
scientists, and 1.5 million managersand analysts capable of reaping
actionable insights from thebig data deluge.
—McKinsey Report
Rogelio Ferreira Escutia
Instituto Tecnológico de MoreliaDepartamento de Sistemas y Computación
Correo: [email protected] [email protected]
Página Web: http://dsc.itmorelia.edu.mx/~rogelio/http://www.xumarhu.net/
Twitter: http://twitter.com/rogeplusFacebook: http://www.facebook.com/groups/xumarhu.net/