Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes:
Mara Edo M. Amelia Gibbons
Diapositiva 2
Organizacin de la parte prctica del curso Introduccin a Stata
Interface Datos Comandos Grficos Do-file
Diapositiva 3
Pgina web del curso:
http://faculty.udesa.edu.ar/WalterSosa/Econometria/ Trabajos
Prcticos: Reglas: grupos de 3 personas Entrega: impresa (en
casillero) y por correo electrnico, en PDF. Esperar acuse de
recibo. Monografa. Entrega: con el final. Metodologa clases
prcticas: Introduccin a Stata Desarrollo de ejemplos economtricos
Desarrollo de ejercicios tericos y empricos Espacio de consulta
para la realizacin de los trabajos prcticos y la monografa.
Diapositiva 4
Stata es un sistema que permite la gestin de base de datos y la
realizacin de clculos estadsticos y economtricos. Fuentes de
informacin: Hamilton, L., 2012, Statistics with Stata: Version 12,
Duxbury Press, New York. Baum., C., 2006, An Introduction to Modern
Econometrics with Stata, Stata Press. Ambos libros estn en reserva
en la biblioteca. www.stata.com
Diapositiva 5
La interface de Stata comprende el entorno de trabajo. Las
diferentes ventanas que conforman la interface son: Ventana Review:
historial de comandos. Ventana Variables: expone las variables que
comprenden el dataset actualmente en memoria. Ventana Stata
Results: es la ventana ms grande color negro. Muestra los
resultados obtenidos de la aplicacin de los comandos. Ventana Stata
comand: en esta ventana el usuario introduce comandosmediante el
teclado.
Diapositiva 6
Estructura: tabla, en donde cada columna representa a una
variable y cada fila a una observacin. En cada celda se pueden
guardar datos de diferentes tipos. El tipo de dato es el mismo para
las observaciones de una misma variable A partir de ahora,
utilizaremos una base de datos extrada de la EPH, correspondiente
al tercer trimestre de 2011 para ejemplificar. Observaci n Variable
1Variable 2Variable K 1Dato 1, 1Dato 2, 1Dato K, 1 2Dato 1, 2Dato
2, 2Dato K, 2 NDato 1, NDato 2, NDato K, N
Diapositiva 7 Change Working Directory Lectura de Datos en
Stata: dist"> Change Working Directory Lectura de Datos en
Stata: distintas opciones Base de datos en formato Stata (.dta):
podemos abrirlo directamente en Stata. use eph_2011_t3.dta. Base de
datos en excel: tenemos un archivo excel con datos, llamado
eph_2011_t3.xls. Cada columna representa una variable; la primera
fila contiene los nombres de dichas variables. Dos mtodos:">
Change Working Directory Lectura de Datos en Stata: dist"
title="Establecer un directorio: cd "C:\Users\DE\Dropbox\econometra
2014\x - Tutorial 1 Archivo -> Change Working Directory Lectura
de Datos en Stata: dist">
Establecer un directorio: cd "C:\Users\DE\Dropbox\econometra
2014\x - Tutorial 1 Archivo -> Change Working Directory Lectura
de Datos en Stata: distintas opciones Base de datos en formato
Stata (.dta): podemos abrirlo directamente en Stata. use
eph_2011_t3.dta. Base de datos en excel: tenemos un archivo excel
con datos, llamado eph_2011_t3.xls. Cada columna representa una
variable; la primera fila contiene los nombres de dichas variables.
Dos mtodos:
Diapositiva 8
Mtodo 1 (Copy & Paste): Abrir el archivo eph_2011_t3.xls en
Excel Abrir Stata. En Excel, pintar todo el rango de datos que se
desea llevar a Stata (incluyendo los nombres de las variables].
Clickear Edicion/Copiar. Pasar a Stata, abrir el editor de Stata
clickeando en el botn Editor. En esta ventana, clickear Edit/Paste,
Los nombres de las variables aparecern en la ventana Variables.
Nota: Este mtodo puede tener problemas si no se dispone de
suficiente memoria RAM, por lo que es til chequear si todos los
datos han sido importado correctamente. Nota II: Stata requiere
criterios particulares para los nombres de las variables.
Diapositiva 9
Mtodo 2 (Insheet) Grabar el archivo conteniendo los datos en
Excel como CSV (separa las columnas en comas]. Ir a Archivo,
Guardar como, CSV (delimitado por comas], Guardar Ahora tenemos el
archivo eph_2011_t3.csv El archivo est en la siguiente ruta: c:
\Users\DE\Dropbox\econometra 2014\ x Tutorial 1\ eph_2011_t3.csv
Para leer los datos desde Stata, ingresar el siguiente comando:
insheet using "c:\Users\DE\Dropbox\Econometra 2014\x - Tutorial
1\eph_2011_t3.csv", comma Stata crear una nueva base de datos, y
los nombres de las variables aparecern en la ventana
Variables.
Diapositiva 10
Una vez que la base de datos ha sido abierta en Stata, puede
grabarse en formato Stata: Archivo -> Guardar Como ->
eph_2011_t3.dta Una vez grabada con la extensin.dta puede abrirse
directamente desde Stata: Archivo -> Abrir use eph_2011_t3.dta,
clear [clear limpia la base de datos, se usa si o si antes de abrir
una nueva] A partir de ahora, abrir directamente desde Stata el
archivo eph_2011_t3.dta original (contiene las etiquetas de las
variables)
Diapositiva 11
Stata trabaja mediante la especificacin por parte del usuario
de rdenes que se denominan comandos Existe una determinada sintaxis
que debe ser respetada. Tiene la siguiente estructura general: [by
varlist:] comando [varlist] [=exp] [if exp] [in range] [weight] [,
opciones] Los corchetes indican elementos opcionales. Todos los
elementos que acompaan a un comando son opciones, de hecho existen
comandos que comprenden slo una palabra. Para conocer las opciones
de los comandos: help comando
Diapositiva 12
display _N [cantidad de observaciones en la base de datos]
describe [describe el dataset] describe ch04 [describe una variable
en particular] list [muestra todas las variables y observaciones
para interrumpir clickear break] list CODUSU ch04 [muestra
observaciones para las variables seleccionadas] sort CODUSU [ordena
las observaciones en forma ascendente de acuerdo a los valores de
CODUSU]
Diapositiva 13
summarize [muestra resumen de todas las variables] summarize
CODUSU ch04 [muestra resumen variables seleccionadas] summarize
CODUSU, detail [muestra resumen ms detallado de variables
seleccionadas] summ tabulate ch04 [tabula la variable seleccionada]
tab ch04 ch07 [tabula las variables seleccionadas] tab ch04 ch07,
row [tabula las variables seleccionadas incluyendo porcentajes
adems de frecuencias]
Diapositiva 14
statnameDefinicin meanpromedio count Cuenta las observaciones
que no son nulas nIgual que count sumSuma maxMximo minMnimo
rangeRango = max min sdDesvo Estndar varianceVarianza cvCoeficiente
de variacin (sd/mean) semean Desvi estndar del promedio
(sd/sqrt(n)) p1Primer percentil medianMediana (p50) p99Percentil 99
iqrRango intercuartil= p75 - p25 tabstat ch04 [muestra la media de
la variable seleccionada] tabstat ch04, statistics (mean sum count
max) [genera una tabla que muestra los estadisticos descriptivos
indicados entre parntesis] Posibles estadsticos:
Diapositiva 15
generate ingreso=tot_p12/7 [genero una variable nueva que
contiene el ingreso medido en dlares] gen obs=_n [genera una nueva
variable llamada obs que enumera las observaciones segn su orden]
gen obs_total=_N [crea una variable cuyo valor siempre es el mismo
y ese valor es la cantidad de observaciones] gen nulo=. gen
x=uniform()[ genera una variable con nmeros aleatorios entre 0 y 1]
gen edad2=ch06^2 [genera una variable que es el cuadrado de la
edad] egen horas = rowtotal(pp3e_tot pp3f_tot) [genera una variable
que es la suma horizontal de las variables seleccionadas]
Diapositiva 16
Preserve and restore ctrl+Z! En Stata no existe un comando
Deshacer preserve [guarda provisionalmente la base de datos]
restore [vuelve a la versin guardada provisionalmente] Modificar la
base de datos como en Excel edit label var ingreso Ingreso total en
Dlares [etiqueta la variable Ingreso] rename ingreso
ingreso_dolares [cambia el nombre de la variable ingreso] replace
ch04=0 if ch04==2 [ahora cuando la variable es igual a 0 significa
que el individuo es mujer] drop horas [elimina la variable horas]
keep if ch06
La expresin if sum horas if ch04==1 [ejecuta el comando
summarize en la submuestra seleccionada: los hombres] tab horas if
(ch04==1 & ch06>30) [tabula la variable horas en la
submuestra seleccionada: hombres mayores de 30 aos] tab horas if
(ch04==1 & ch06>30)| (ch04==2 & ch06
AritmticosLgicosRelacionados + adicin& y> mayor a -
resta| o< menor a * multiplicacin! no>= mayor o igual a /
divisin 30)|(ch04==2 & ch06 View".">
Antes de empezar: existe un comando que genera un archivo
llamado log. Son tiles para llevar un registro de todo lo que
aparece en la ventana "resultados. Los log-file graban tanto el
historial de los comandos como los resultados. log using
"c:\Users\DE\Dropbox\Econometra 2014\x - Tutorial 1\
eph_2011_t3.smcl" [options] replace append log close Se puede abrir
el log file con el Bloc de notas o mediante la opcin File -> Log
-> View".