6
TIPOS DE ARCHIVOS EN STATA En STATA, distinguimos 4 tipos de archivos importantes: Archivo de extensión dta, para la generación de base de datos, en ella se almacenara información de las variables con su respectiva extensión. Archivo de extensión log, smcl, para la generación de bitácoras, en ella se guardaran los resultados de manera ordenada, sin tener que pasarlos a ningún tipo de archivo de texto. Archivo de extensión do, que es un archivo de ejecución, donde se elabora el programa. Archivo de extensión gph, para la generación de gráficos almacenados en la carpeta de trabajo ORDEN INFILE (LEYENDO UN ARCHIVO ASCII) 1) Cree un archivo en el notepad y guárdelo con extensión .dat 2) Clic en el menu File/Import/ASCII data created by speadsheet 3) Seleccione el archive en el escritorio COMANDOS EJEMPLOS Estos son ejemplos con el comando summarize (mean, minumum, máximum, etc.): Prefix (prefijo) Command (comando) Varlist (Lista de variables) Qualifiers (Calificadores) Options (Opciones) Comments (Comentarios) summarize No hay lista de variables. Todas las variables summarize _all _all: Todas las variables summarize make price Dos variables summarize mpg-turn Variables en secuencia summarize t* Variables que empiecen con t

Stata11 2

Embed Size (px)

DESCRIPTION

Introducción al stata

Citation preview

Page 1: Stata11 2

TIPOS DE ARCHIVOS EN STATA En STATA, distinguimos 4 tipos de archivos importantes:

Archivo de extensión dta, para la generación de base de datos, en ella se almacenara información de las variables con su respectiva extensión.

Archivo de extensión log, smcl, para la generación de bitácoras, en ella se guardaran los resultados de manera ordenada, sin tener que pasarlos a ningún tipo de archivo de texto.

Archivo de extensión do, que es un archivo de ejecución, donde se elabora el programa.

Archivo de extensión gph, para la generación de gráficos almacenados en la carpeta de trabajo

ORDEN INFILE (LEYENDO UN ARCHIVO ASCII)

1) Cree un archivo en el notepad y guárdelo con extensión .dat

2) Clic en el menu File/Import/ASCII data created by speadsheet

3) Seleccione el archive en el escritorio

COMANDOS EJEMPLOS

Estos son ejemplos con el comando summarize (mean, minumum, máximum, etc.):

Prefix

(prefijo)

Command

(comando)

Varlist (Lista

de variables)

Qualifiers

(Calificadores)

Options

(Opciones)

Comments

(Comentarios)

summarize No hay lista

de variables.

Todas las

variables

summarize _all _all: Todas las

variables

summarize make price Dos variables

summarize mpg-turn Variables en

secuencia

summarize t* Variables que

empiecen con

t

Page 2: Stata11 2

summarize price if foreign==0 Tipo de carro

domestico

solamente

summarize price in 1/10 Primeras 10

observaciones

sort foreign Separa la

tabla por cada

foraneo

by foreign:

summarize

price

Deben

ordenarse los

datos primero

summarize price , detail Opcion, detail

LISTA DE VARIABLES

Una lista de variables (varlist) llama a una o más variables para ser procesadas. Ejemplos:

(nada) a veces lo mismo que _all

rep78 weight displacement tres variables

price mpg-weight Price y las variables consecutivas mpg-weight

pro* todas las variables que empiecen con pro

En comandos que tienen una variable dependiente, esta es la primera en la lista de variables

(varlist):

oneway bmi sex bmi es la variable dependiente regression bmi sex age bmi es la variable dependiente scatter weight height scatterplot, weight es el eje y tabulate expos case La primera variable define las filas

COMANDO CONDICIONAL: EL CALIFICADOR IF

Este operador es usado en condiciones. Aquí hay ejemplos:

summarize mpg if price>10000 estadística para precios mallores a 10000

list make mpg if foreign==0 listar solamente si el tipo da carro es doméstico

replace price=. if foreign==0 Pone en nulo los precios para los carros foráneos

LISTA DE NÚMEROS. EL CALIFICADOR IN

Page 3: Stata11 2

Una lista del número (numlist) es un listado de números; hay algunas posibilidades:

1(3)11 promedia 1 4 7 10

1(1)4 4.5(0.5)6 promedia 1 2 3 4 4.5 5 5.5 6

4 3 2 7(-1)1 promedia 4 3 2 7 6 5 4 3 2 1

1/5 promedia 1 2 3 4 5

4/2 7/1 promedia 4 3 2 7 6 5 4 3 2 1

Ejemplo:

list sex age weight in 1/10 // observaciones 1 to 10

twoway line mort year , xlabel(1900(20)2000) // etiqueta del eje x

FREFIJO BY y BYSORT

Comando que hace que se muestren los resultados para subgrupos de datos. Deben pre-

ordenarse los datos:

sort foreign

by foreign: summarize price

o en una sola línea:

bysort foreign: summarize Price

CADENAS DE TEXTOS, CITAS (TEXT STRINGS, QUOTES)

Stata requiere las dobles comillas alrededor de las cadenas de texto, se puede omitir las

citas al menos que las cadenas se encuentren dentro con espacios en blanco o comas:

label define sex 1 male 2 female 9 "sex unknown"

Usted no necesita usar citas alrededor del nombres de archivos:

save c:\dokumenter\proj1\alfa1.dta

al menos que ellos incluyan el espacio en blanco:

save "c:\dokumenter\project 1\alfa1.dta"

LOS COMENTARIOS

Lo siguiente se interpreta como comentarios, incluyen cortas explicaciones en un

archivo do-file:

Líneas que empiezan con *

Page 4: Stata11 2

Texto rodeado por / * y * /

Texto que sigue / /

COMANDO KEEP/DROP

Drop elimina variables u observaciones de los datos en memoria. Keep trabaja igual a

drop, sólo que usted especifica las variables u observaciones a conservar en lugar de

las variables u observaciones a ser eliminadas1.

Advertencia: keep y drop no son reversibles.

Ejemplo:

drop price

keep make mpg trunk turn foreign length

drop _all (borra todas las variables y observaciones)

keep in 1/2 (borra todo pero mantiene las observaciones 1 y 2)

drop if price > 4000 (borra las observaciones cuyo precio es mayor a 4000)

drop in 1/2 (borra las 2 primeras observ)

drop pop* (borra las variables que comiencen con pop)

COMANDO SPLIT

Corta variables cadenas entre partes

split make

split make, gen(datos)

rename dato1 xyz

GRÁFICOS EN STATA

Ahora vamos a trabajar con los principales gráficos en Stata. Muchos de estos gráficos

son de bastante utilidad para observar los problemas inherentes al análisis de regresión

que observaremos en la próxima sección.

clear

1 Help Stata

Page 5: Stata11 2

use auto.dta

histogram price

graph box price

graph box price weight

Histrograma

Gráficos de caja

GRAPH TWOWAY

twoway scatter length turn

twoway lfit length turn

0

1.0

e-0

42

.0e-0

43

.0e-0

4

Den

sity

0 5,000 10,000 15,000Price

0

5,0

00

10,0

00

15,0

00

Pri

ce

0

5,0

00

10,0

00

15,0

00

Price Weight (lbs.)

Page 6: Stata11 2

scatter y ajuste lineal

graph matrix mpg weight price

Gráfico matricial

140

160

180

200

220

240

Len

gth

(in

.)

30 35 40 45 50Turn Circle (ft.)

140

160

180

200

220

240

Fitte

d v

alu

es

30 35 40 45 50Turn Circle (ft.)

Mileage(mpg)

Weight(lbs.)

Price

10

20

30

40

10 20 30 40

2,000

3,000

4,000

5,000

2,000 3,000 4,000 5,000

5,000

10,000

15,000

5,000 10,000 15,000