Webinar InnovaChallenge MX Ricardo Alanís de Codeando México

Preview:

DESCRIPTION

Webinar de Ricardo Alanís de Codeando México en el marco del concurso InnovaChallenge MX

Citation preview

Ciencia y productos de Datos para el bien

18 de Noviembre del 2014

¿De qué platicaremos hoy? ● Introducción ¿Quién es Codeando México? ¿Quién es

Ricardo?● La Ciencia de Datos y su proceso: Un twist hacia el

hacking cívico● Herramientas útiles para trabajar con la información en

cada paso● Los siguientes pasos: Trascendiendo de los números

y de las visualizaciones.

¿Quién soy yo?

Definiciones

Hackaton:

1. Evento en el cual, desarrolladores y aquellos en la industria de software se reúnen para colaborar intensamente en proyectos de software.

Fuente: Wikipedia http://en.wikipedia.org/wiki/Hackathon

¿Qué hace Codeando México?

Definiciones

Hacking Cívico:

1. m. y f. Ingenieros, tecnólogos, ciudadanos, científicos, diseñadores, artistas, educadores, estudiantes, emprendedores. Cualquiera dispuesto a colaborar con otros para crear, construir e inventar soluciones públicas, código y tecnología para resolver retos relevantes a nuestras comunidades, ciudades, estados y país.

Fuente: Hack for Change http://hackforchange.org/

¡Tenemos mucha información!

"There was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every 2 days, and the pace is increasing."

Eric Schmidt, Google.

¡Tenemos mucha información!

“There were 5 exabytes of data online in 2002, which had risen to 281 exabytes in 2009. That's a growth rate of 56 times over seven years.”

Marissa Meyer, según readwrite.

Un segundo en el internet

http://onesecond.designly.com/

Una forma de Hacking Cívico

Usar la información que ya existe y recopilar nueva para atender un problema social:

¡Es hacking Cívico!

OpenData Monterrey (Febrero ‘14)

5 estudiantes de IT + Trabajador de Seguridad de una Ciudad de la ZMMRutas óptimas de Patrullaje3er Lugar, del ITESM

John Snow, Cólera (1854)

¿Cómo puedo usar los datos de la mejor manera?

Un ejemplo: Gandor Dataton Zapopan

Primer Paso: Plantearse la Pregunta

Segundo Paso: Obtener los datos

Tercer Paso: Explorar y Modelar datos

Quinto Paso: Visualizar los datos

Herramientas para el proceso

Dividir por pasos nos ayuda además a tener claro las herramientas adecuadas para cada uno de ellos.

A continuación, de atrás para delante, algunas herramientas útiles.

Herramientas de Visualización Visualizaciones Memorables

Visualizaciones Efectivas

http://www.easel.ly/infogr.amCarto DB (Mapas Interactivos) (Odyssey.js)Leflet+MapboxD3

Gráficas de Excel. (¡Modificadas para ser visualmente atractivas!) - http://bit.ly/ExcelTipsMTYhttps://datawrapper.de/Many EyesNVD3/D3plus.jsRaw

Herramientas Exploración/Modelación

R PythonEDA - Udacity Numpy/Scipy/Pandas

+Notebook

Herramientas para Obtener Datos

www.datamx.iowww.datos.gob.mxhttp://datosabiertos.df.gob.mx/http://www.inegifacil.comhttp://datahub.io/http://data.worldbank.org/ y http://data.un.org/http://www.dbpedia.org

¿Cómo hacemos la pregunta correcta?

¿Cómo hacernos la pregunta correcta?

¿Cómo podemos aterrizar la información a un problema social?

Cambio de paradigma: Planteamiento

● Definir los personajes que están descritos en el conjunto de datos. (Entidades)

● Definir las características de los personajes descritas en el conjunto de datos

● Explorar los datos para encontrar patrones● Complementar la información recabada

del conjunto de datos vs la realidad

Pies en la tierra

● Busca Noticias● Pregunta a los personajes (Están más cerca

de lo que crees)● Consulta a un Experto (¡Son expertos por

algo!)

Cambio de Paradigma: Comunicación

¿A quien vas a contarle la historia?¿Quién puede hacer un cambio a partir de lo que tú hagas? ¿Cómo invitarlo a participar?¿Qué datos puedo generar con mi producto que nos ayuden a entender el problema?

Comunica -> Construye

● Cuéntale tu historia a un periodista● Conoce a las personas que están

trabajando con el tema● Genera un ciclo de información: ¡Sigue

contando la historia aún y cuando ha cambiado!

Aterrizando

¿Qué datos tenemos en el challenge?¿Cuáles son los personajes que están descritos?¿Qué problemáticas podemos encontrar?¿Qué otros datos podemos usar?

¡Muchas gracias!ricardo@codeandomexico.org

Recursos educativos

Ciencia de datos: cs109.orgVisualización: cs171.orgExploratory Data Analysis con R: https://www.udacity.com/course/ud651

Páginas consultadashttp://qz.com/296941/interactive-graphic-every-active-satellite-orbiting-earth/

http://www.informationisbeautiful.net/2010/the-true-size-of-africa/

http://onesecond.designly.com/

http://nyctaxi.herokuapp.com/

http://ayotzinapa.desaparecidos.mx/

http://nbviewer.ipython.org/github/cs109/content/blob/master/lec_04_wrangling.ipynb

http://www.datamx.io/

http://catalogo.datos.gob.mx/dataset

http://inegifacil.com/indicadores/1002000002/000

http://www.traxi.mx/

http://dssg.io/

https://developers.bbva.com/web/bbva-open-platform/documentation

http://datasciencemasters.org/

Recommended