Upload
duongdiep
View
213
Download
0
Embed Size (px)
Citation preview
Maestrıa en Ciencia de Datos
Jose Luis Moraleshttp://mcienciadatos.itam.mx/
Seminario Internacional: BIG DATAPara la informacion oficial y la toma de decisiones.
INEGI 2014
¿solo datos?
Tablilla de Venus de AmmisaduqaObservaciones astronomicas del planeta Venus
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Agenda
• Demanda de recursos profesionales/metodologicos.• Oferta academica en Mexico.• Infraestructura en el ITAM.• =⇒ Objetivos:
• Perfil de los aspirantes.• Plan de estudios.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Demanda de recursos profesionales ymetodologicos
Problematica reciente (2000→)
http://www.nsf.gov/news/news_videos.jsp?cntn_id=
123607&media_id=72174&org=NSF
http://www.youtube.com/watch?v=-xR5erOhkXo
• Explotar conjuntos de datos en diversas escalas demagnitud.
• Sectores cientıfico y tecnologico: generadores de datos.• Sectores industrial y empresarial: propietarios de los
datos.• Formacion de recursos humanos. Desarrollo de
tecnologıa.
Unidades en informatica. La petaescala
(Sımbolo) Valor (bytes)kilobyte (kB) 103
megabyte (MB) 106
gigabyte (GB) 109
terabyte (TB) 1012
petabyte (PB) 1015
exabyte (EB) 1018
zettabyte (ZB) 1021
yottabyte (YB) 1024
1 byte = 8 bits ≈ 1 caracter
Actividades en la tera-peta escala
• Internet: Google procesa aproximadamente 24 petabytesde datos diariamente.
• Telecomunicaciones: AT&T transfiere diariamente casi 19petabytes de datos a traves de sus redes.
• Neurologıa: Se estima que el cerebro humano en su etapaadulta tiene un lımite de almacenamiento deaproximadamente 2.5 petabytes de datos binarios.
• Astrofısica: LSST (Large Synoptic Survey Telescope).Capacidad de generacion por noche: varios terabytes dedatos sin procesar.
• Negocios: Amazon tiene las 3 bases de datos masgrandes del mundo. (7.8 TB, 18.5 TB y 24.7 TB).
Actividades en la tera-peta escala
• Internet: Google procesa aproximadamente 24 petabytesde datos diariamente.
• Telecomunicaciones: AT&T transfiere diariamente casi 19petabytes de datos a traves de sus redes.
• Neurologıa: Se estima que el cerebro humano en su etapaadulta tiene un lımite de almacenamiento deaproximadamente 2.5 petabytes de datos binarios.
• Astrofısica: LSST (Large Synoptic Survey Telescope).Capacidad de generacion por noche: varios terabytes dedatos sin procesar.
• Negocios: Amazon tiene las 3 bases de datos masgrandes del mundo. (7.8 TB, 18.5 TB y 24.7 TB).
Actividades en la tera-peta escala
• Internet: Google procesa aproximadamente 24 petabytesde datos diariamente.
• Telecomunicaciones: AT&T transfiere diariamente casi 19petabytes de datos a traves de sus redes.
• Neurologıa: Se estima que el cerebro humano en su etapaadulta tiene un lımite de almacenamiento deaproximadamente 2.5 petabytes de datos binarios.
• Astrofısica: LSST (Large Synoptic Survey Telescope).Capacidad de generacion por noche: varios terabytes dedatos sin procesar.
• Negocios: Amazon tiene las 3 bases de datos masgrandes del mundo. (7.8 TB, 18.5 TB y 24.7 TB).
Actividades en la tera-peta escala
• Internet: Google procesa aproximadamente 24 petabytesde datos diariamente.
• Telecomunicaciones: AT&T transfiere diariamente casi 19petabytes de datos a traves de sus redes.
• Neurologıa: Se estima que el cerebro humano en su etapaadulta tiene un lımite de almacenamiento deaproximadamente 2.5 petabytes de datos binarios.
• Astrofısica: LSST (Large Synoptic Survey Telescope).Capacidad de generacion por noche: varios terabytes dedatos sin procesar.
• Negocios: Amazon tiene las 3 bases de datos masgrandes del mundo. (7.8 TB, 18.5 TB y 24.7 TB).
Actividades en la tera-peta escala
• Internet: Google procesa aproximadamente 24 petabytesde datos diariamente.
• Telecomunicaciones: AT&T transfiere diariamente casi 19petabytes de datos a traves de sus redes.
• Neurologıa: Se estima que el cerebro humano en su etapaadulta tiene un lımite de almacenamiento deaproximadamente 2.5 petabytes de datos binarios.
• Astrofısica: LSST (Large Synoptic Survey Telescope).Capacidad de generacion por noche: varios terabytes dedatos sin procesar.
• Negocios: Amazon tiene las 3 bases de datos masgrandes del mundo. (7.8 TB, 18.5 TB y 24.7 TB).
Actividades en la tera-peta escala
• Internet: Google procesa aproximadamente 24 petabytesde datos diariamente.
• Telecomunicaciones: AT&T transfiere diariamente casi 19petabytes de datos a traves de sus redes.
• Neurologıa: Se estima que el cerebro humano en su etapaadulta tiene un lımite de almacenamiento deaproximadamente 2.5 petabytes de datos binarios.
• Astrofısica: LSST (Large Synoptic Survey Telescope).Capacidad de generacion por noche: varios terabytes dedatos sin procesar.
• Negocios: Amazon tiene las 3 bases de datos masgrandes del mundo. (7.8 TB, 18.5 TB y 24.7 TB).
El caso mexicano
Demanda:
• Sectores financiero, publico, educacion, industrial, turismo,aseguradoras, comercio electronico, ...
• Institutos de investigacion: astronomıa, genomica,medicina preventiva, prospeccion de energeticos fosiles,bioquımica molecular, imagenologıa, cambio climatico, ...
Oferta academica en Mexico:
≤ 2012 no existıa ...
Infraestructura en el ITAM
Estadıstica
Matematicas
Computacion
• Recursos tecnicos. Laboratorios, software, ...• Recursos humanos. Facultad.
Infraestructura fuera del ITAM
Amazon Web Services (AWS) in Education
http://aws.amazon.com/education/
To assist educators around the world in providing cloudcomputing instruction, AWS offers Teaching Grants supportingfree usage of AWS for students in eligible courses.
The grants will provide educators up to $100 USD in free usagefor each student enrolled in courses with Amazon WebServices as part of the curriculum.
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Perfil de los aspirantes
Formacion y/o conocimientos solidos en:• estadıstica• matematicas• computacion
Egresados de Licenciaturas en:
• Matematicas y Matematicas aplicadas• Ciencias basicas e Ingenierıa• Actuarıa• Profesionales en el area
Plan de estudios
Otono Fundamentos deEstadıstica
Minerıa yAnalisis de Datos
EstadısticaComputacional
Aprendizajede Maquina
Modelos LinealesGeneralizados
Seminario: MetodosAnalıticos en la Empresa
PrimaveraEstadıstica Multivariaday Datos Categoricos
MetodosNumericos yOptimizacion OPTATIVA
Metodos deGran Escala
MetodosAnalıticos
Desarrollode Negocios deAlta Tecnologıa
Temas SelectosEstadıstica
Verano Estancia de Investigacion
Objetivos finales del posgrado
• Desarrollar habilidades computacionales en el diseno,analisis y uso de bases de datos en varias escalas demagnitud.
• Desarrollar conocimiento solido en tecnicas estadısticasmodernas asociadas con el analisis y uso productivo dedatos =⇒ modelos predictivos.
• Desarrollar habilidades para desarrollar software.• Desarrollar habilidades para trabajar en equipo en
problemas reales.
Objetivos finales del posgrado
• Desarrollar habilidades computacionales en el diseno,analisis y uso de bases de datos en varias escalas demagnitud.
• Desarrollar conocimiento solido en tecnicas estadısticasmodernas asociadas con el analisis y uso productivo dedatos =⇒ modelos predictivos.
• Desarrollar habilidades para desarrollar software.• Desarrollar habilidades para trabajar en equipo en
problemas reales.
Objetivos finales del posgrado
• Desarrollar habilidades computacionales en el diseno,analisis y uso de bases de datos en varias escalas demagnitud.
• Desarrollar conocimiento solido en tecnicas estadısticasmodernas asociadas con el analisis y uso productivo dedatos =⇒ modelos predictivos.
• Desarrollar habilidades para desarrollar software.• Desarrollar habilidades para trabajar en equipo en
problemas reales.
Objetivos finales del posgrado
• Desarrollar habilidades computacionales en el diseno,analisis y uso de bases de datos en varias escalas demagnitud.
• Desarrollar conocimiento solido en tecnicas estadısticasmodernas asociadas con el analisis y uso productivo dedatos =⇒ modelos predictivos.
• Desarrollar habilidades para desarrollar software.• Desarrollar habilidades para trabajar en equipo en
problemas reales.
Objetivos finales del posgrado
• Desarrollar habilidades computacionales en el diseno,analisis y uso de bases de datos en varias escalas demagnitud.
• Desarrollar conocimiento solido en tecnicas estadısticasmodernas asociadas con el analisis y uso productivo dedatos =⇒ modelos predictivos.
• Desarrollar habilidades para desarrollar software.• Desarrollar habilidades para trabajar en equipo en
problemas reales.
G R A C I A S !