24
Universidad de San Andrés Econometría Semestre Otoño 2014 Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes: María Edo M. Amelia Gibbons

Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes: María Edo M. Amelia Gibbons

Embed Size (px)

Citation preview

  • Diapositiva 1
  • Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes: Mara Edo M. Amelia Gibbons
  • Diapositiva 2
  • Organizacin de la parte prctica del curso Introduccin a Stata Interface Datos Comandos Grficos Do-file
  • Diapositiva 3
  • Pgina web del curso: http://faculty.udesa.edu.ar/WalterSosa/Econometria/ Trabajos Prcticos: Reglas: grupos de 3 personas Entrega: impresa (en casillero) y por correo electrnico, en PDF. Esperar acuse de recibo. Monografa. Entrega: con el final. Metodologa clases prcticas: Introduccin a Stata Desarrollo de ejemplos economtricos Desarrollo de ejercicios tericos y empricos Espacio de consulta para la realizacin de los trabajos prcticos y la monografa.
  • Diapositiva 4
  • Stata es un sistema que permite la gestin de base de datos y la realizacin de clculos estadsticos y economtricos. Fuentes de informacin: Hamilton, L., 2012, Statistics with Stata: Version 12, Duxbury Press, New York. Baum., C., 2006, An Introduction to Modern Econometrics with Stata, Stata Press. Ambos libros estn en reserva en la biblioteca. www.stata.com
  • Diapositiva 5
  • La interface de Stata comprende el entorno de trabajo. Las diferentes ventanas que conforman la interface son: Ventana Review: historial de comandos. Ventana Variables: expone las variables que comprenden el dataset actualmente en memoria. Ventana Stata Results: es la ventana ms grande color negro. Muestra los resultados obtenidos de la aplicacin de los comandos. Ventana Stata comand: en esta ventana el usuario introduce comandosmediante el teclado.
  • Diapositiva 6
  • Estructura: tabla, en donde cada columna representa a una variable y cada fila a una observacin. En cada celda se pueden guardar datos de diferentes tipos. El tipo de dato es el mismo para las observaciones de una misma variable A partir de ahora, utilizaremos una base de datos extrada de la EPH, correspondiente al tercer trimestre de 2011 para ejemplificar. Observaci n Variable 1Variable 2Variable K 1Dato 1, 1Dato 2, 1Dato K, 1 2Dato 1, 2Dato 2, 2Dato K, 2 NDato 1, NDato 2, NDato K, N
  • Diapositiva 7 Change Working Directory Lectura de Datos en Stata: dist"> Change Working Directory Lectura de Datos en Stata: distintas opciones Base de datos en formato Stata (.dta): podemos abrirlo directamente en Stata. use eph_2011_t3.dta. Base de datos en excel: tenemos un archivo excel con datos, llamado eph_2011_t3.xls. Cada columna representa una variable; la primera fila contiene los nombres de dichas variables. Dos mtodos:"> Change Working Directory Lectura de Datos en Stata: dist" title="Establecer un directorio: cd "C:\Users\DE\Dropbox\econometra 2014\x - Tutorial 1 Archivo -> Change Working Directory Lectura de Datos en Stata: dist">
  • Establecer un directorio: cd "C:\Users\DE\Dropbox\econometra 2014\x - Tutorial 1 Archivo -> Change Working Directory Lectura de Datos en Stata: distintas opciones Base de datos en formato Stata (.dta): podemos abrirlo directamente en Stata. use eph_2011_t3.dta. Base de datos en excel: tenemos un archivo excel con datos, llamado eph_2011_t3.xls. Cada columna representa una variable; la primera fila contiene los nombres de dichas variables. Dos mtodos:
  • Diapositiva 8
  • Mtodo 1 (Copy & Paste): Abrir el archivo eph_2011_t3.xls en Excel Abrir Stata. En Excel, pintar todo el rango de datos que se desea llevar a Stata (incluyendo los nombres de las variables]. Clickear Edicion/Copiar. Pasar a Stata, abrir el editor de Stata clickeando en el botn Editor. En esta ventana, clickear Edit/Paste, Los nombres de las variables aparecern en la ventana Variables. Nota: Este mtodo puede tener problemas si no se dispone de suficiente memoria RAM, por lo que es til chequear si todos los datos han sido importado correctamente. Nota II: Stata requiere criterios particulares para los nombres de las variables.
  • Diapositiva 9
  • Mtodo 2 (Insheet) Grabar el archivo conteniendo los datos en Excel como CSV (separa las columnas en comas]. Ir a Archivo, Guardar como, CSV (delimitado por comas], Guardar Ahora tenemos el archivo eph_2011_t3.csv El archivo est en la siguiente ruta: c: \Users\DE\Dropbox\econometra 2014\ x Tutorial 1\ eph_2011_t3.csv Para leer los datos desde Stata, ingresar el siguiente comando: insheet using "c:\Users\DE\Dropbox\Econometra 2014\x - Tutorial 1\eph_2011_t3.csv", comma Stata crear una nueva base de datos, y los nombres de las variables aparecern en la ventana Variables.
  • Diapositiva 10
  • Una vez que la base de datos ha sido abierta en Stata, puede grabarse en formato Stata: Archivo -> Guardar Como -> eph_2011_t3.dta Una vez grabada con la extensin.dta puede abrirse directamente desde Stata: Archivo -> Abrir use eph_2011_t3.dta, clear [clear limpia la base de datos, se usa si o si antes de abrir una nueva] A partir de ahora, abrir directamente desde Stata el archivo eph_2011_t3.dta original (contiene las etiquetas de las variables)
  • Diapositiva 11
  • Stata trabaja mediante la especificacin por parte del usuario de rdenes que se denominan comandos Existe una determinada sintaxis que debe ser respetada. Tiene la siguiente estructura general: [by varlist:] comando [varlist] [=exp] [if exp] [in range] [weight] [, opciones] Los corchetes indican elementos opcionales. Todos los elementos que acompaan a un comando son opciones, de hecho existen comandos que comprenden slo una palabra. Para conocer las opciones de los comandos: help comando
  • Diapositiva 12
  • display _N [cantidad de observaciones en la base de datos] describe [describe el dataset] describe ch04 [describe una variable en particular] list [muestra todas las variables y observaciones para interrumpir clickear break] list CODUSU ch04 [muestra observaciones para las variables seleccionadas] sort CODUSU [ordena las observaciones en forma ascendente de acuerdo a los valores de CODUSU]
  • Diapositiva 13
  • summarize [muestra resumen de todas las variables] summarize CODUSU ch04 [muestra resumen variables seleccionadas] summarize CODUSU, detail [muestra resumen ms detallado de variables seleccionadas] summ tabulate ch04 [tabula la variable seleccionada] tab ch04 ch07 [tabula las variables seleccionadas] tab ch04 ch07, row [tabula las variables seleccionadas incluyendo porcentajes adems de frecuencias]
  • Diapositiva 14
  • statnameDefinicin meanpromedio count Cuenta las observaciones que no son nulas nIgual que count sumSuma maxMximo minMnimo rangeRango = max min sdDesvo Estndar varianceVarianza cvCoeficiente de variacin (sd/mean) semean Desvi estndar del promedio (sd/sqrt(n)) p1Primer percentil medianMediana (p50) p99Percentil 99 iqrRango intercuartil= p75 - p25 tabstat ch04 [muestra la media de la variable seleccionada] tabstat ch04, statistics (mean sum count max) [genera una tabla que muestra los estadisticos descriptivos indicados entre parntesis] Posibles estadsticos:
  • Diapositiva 15
  • generate ingreso=tot_p12/7 [genero una variable nueva que contiene el ingreso medido en dlares] gen obs=_n [genera una nueva variable llamada obs que enumera las observaciones segn su orden] gen obs_total=_N [crea una variable cuyo valor siempre es el mismo y ese valor es la cantidad de observaciones] gen nulo=. gen x=uniform()[ genera una variable con nmeros aleatorios entre 0 y 1] gen edad2=ch06^2 [genera una variable que es el cuadrado de la edad] egen horas = rowtotal(pp3e_tot pp3f_tot) [genera una variable que es la suma horizontal de las variables seleccionadas]
  • Diapositiva 16
  • Preserve and restore ctrl+Z! En Stata no existe un comando Deshacer preserve [guarda provisionalmente la base de datos] restore [vuelve a la versin guardada provisionalmente] Modificar la base de datos como en Excel edit label var ingreso Ingreso total en Dlares [etiqueta la variable Ingreso] rename ingreso ingreso_dolares [cambia el nombre de la variable ingreso] replace ch04=0 if ch04==2 [ahora cuando la variable es igual a 0 significa que el individuo es mujer] drop horas [elimina la variable horas] keep if ch06
  • La expresin if sum horas if ch04==1 [ejecuta el comando summarize en la submuestra seleccionada: los hombres] tab horas if (ch04==1 & ch06>30) [tabula la variable horas en la submuestra seleccionada: hombres mayores de 30 aos] tab horas if (ch04==1 & ch06>30)| (ch04==2 & ch06
  • AritmticosLgicosRelacionados + adicin& y> mayor a - resta| o< menor a * multiplicacin! no>= mayor o igual a / divisin 30)|(ch04==2 & ch06 View".">
  • Antes de empezar: existe un comando que genera un archivo llamado log. Son tiles para llevar un registro de todo lo que aparece en la ventana "resultados. Los log-file graban tanto el historial de los comandos como los resultados. log using "c:\Users\DE\Dropbox\Econometra 2014\x - Tutorial 1\ eph_2011_t3.smcl" [options] replace append log close Se puede abrir el log file con el Bloc de notas o mediante la opcin File -> Log -> View".