3
Para cargar un archivo .dbf en R: Instalar el paquete foreign: > install.packages(“foreign”) Se instalará en el directorio, si no se especifica lo contrario. (Users/Alx/Library/R/2.15/Library) Se manda llamar el paquete: > library(“foreign”) Se corre el comando read.dbf > Hogar<-read.dfb(“..../Hogares.dbf ”) Para ver el contenido de la base de datos: > str(Hogar) Despliega las variables de la BD junto con algunos valores, además menciona qué tipo de variable es. > ls(Hogar) > objects(Hogar) Ambas opciones despliegan las variables de la BD en orden alfabético (se puede modificar el orden). Para ver las categorías (valores) de una variable Z: > table(Z) Si por ejemplo ponemos: >Hogar$techos Nos desplegará todos los valores de esa variable > is.factor(Z) Nos dice si la variable Z es variable factor (que es distinto a variable de caractéres) >levels(Hogar$techo) Despliega los factores de la variable techo. Para asignar etiquetas a los valores de las variables (Factores): # variable v1 is coded 1, 2 or 3 # we want to attach value labels 1=red, 2=blue, 3=green > mydata$v1 <- factor(mydata$v1, levels = c(1,2,3), labels = c("red", "blue", "green")) # variable y is coded 1, 3 or 5 # we want to attach value labels 1=Low, 3=Medium, 5=High > mydata$v1 <- ordered(mydata$y, levels = c(1,3, 5), labels = c("Low", "Medium", "High")) OJO. Si no ponemos todos los valores de nuestra variable en levels=c( , , ,...) los valores que no estén etiquetados (que queden sin etiqueta) serán tratados como NA.

Resumen R

Embed Size (px)

Citation preview

Page 1: Resumen R

Para cargar un archivo .dbf en R:

Instalar el paquete foreign:

> install.packages(“foreign”)

Se instalará en el directorio, si no se especifica lo contrario. (Users/Alx/Library/R/2.15/Library)

Se manda llamar el paquete:

> library(“foreign”)

Se corre el comando read.dbf

> Hogar<-read.dfb(“..../Hogares.dbf ”)

Para ver el contenido de la base de datos:> str(Hogar) Despliega las variables de la BD junto con algunos valores, además menciona qué tipo de

variable es.> ls(Hogar)> objects(Hogar) Ambas opciones despliegan las variables de la BD en orden alfabético (se puede

modificar el orden).

Para ver las categorías (valores) de una variable Z:> table(Z)Si por ejemplo ponemos:>Hogar$techos Nos desplegará todos los valores de esa variable> is.factor(Z) Nos dice si la variable Z es variable factor (que es distinto a variable de caractéres)>levels(Hogar$techo) Despliega los factores de la variable techo.

Para asignar etiquetas a los valores de las variables (Factores):# variable v1 is coded 1, 2 or 3# we want to attach value labels 1=red, 2=blue, 3=green> mydata$v1 <- factor(mydata$v1, levels = c(1,2,3), labels = c("red", "blue", "green"))

# variable y is coded 1, 3 or 5 # we want to attach value labels 1=Low, 3=Medium, 5=High> mydata$v1 <- ordered(mydata$y, levels = c(1,3, 5), labels = c("Low", "Medium", "High"))

OJO. Si no ponemos todos los valores de nuestra variable en levels=c( , , ,...) los valores que no estén etiquetados (que queden sin etiqueta) serán tratados como NA.

Para etiquetar variables (no sus valores):Instalamos el paquete Hmisc> library(Hmisc)> label(mydata$myvar) <- "Variable label for variable myvar" > describe(mydata)Unfortunately the label is only in effect for functions provided by the Hmisc package, such as describe(). Your other option is to use the variable label as the variable name and then refer to the variable by position index.> names(mydata)[3] <- "This is the label for variable 3"> mydata[3] # list the variable

Page 2: Resumen R

Para cambiar una variable a variable factor:> a<-as.factor(Z)Para cambiar una variable a numérica:> Z<-as.numeric(a)Para cambiar una variable a caracteres:> W<-as.character(Z)

Para crear tablas de frecuencias y porcentajes (1 way, 2 way, 3way) :Un método es con los comandos para variables categóricas:> table(Q,P) Para frecuencias, dará una tabla 2-way con Q como renglones y P como columnas.# 2-Way Frequency Table > mytable <- table(A,B) # A will be rows, B will be columns > margin.table(mytable, 1) # A frequencies (summed over B) > margin.table(mytable, 2) # B frequencies (summed over A)

> prop.table(mytable) # cell percentages> prop.table(mytable, 1) # row percentages > prop.table(mytable, 2) # column percentages

table( ) can also generate multidimensional tables based on 3 or more categorical variables. In this case, use the ftable( ) function to print the results more attractively.# 3-Way Frequency Table > mytable <- table(A, B, C) > ftable(mytable)Table ignores missing values. To include NA as a category in counts, include the table option exclude=NULL if the variable is a vector. If the variable is a factor you have to create a new factor using newfactor <- factor(oldfactor, exclude=NULL).

xtabsThe xtabs( ) function allows you to create crosstabulations using formula style input.# 3-Way Frequency Table> mytable <- xtabs(~A+B+c, data=mydata)> ftable(mytable) # print table > summary(mytable) # chi-square test of indepedenceIf a variable is included on the left side of the formula, it is assumed to be a vector of frequencies (useful if the data have already been tabulated).

CrosstableThe CrossTable( ) function in the gmodels package produces crosstabulations modeled after PROC FREQ in SAS or CROSSTABS in SPSS. It has a wealth of options.# 2-Way Cross Tabulation> library(gmodels)> CrossTable(mydata$myrowvar, mydata$mycolvar)

Otro paquete para realizar tabulaciones es catspec1) Instalamos el paquete catspec2) Lo ponemos en librería3) Usamos el comando ctab de este paquete

Page 3: Resumen R

Otro paquete es útil es NCStats1) Instalamos NCStats2) Lo ponemos en librería3) Usamos el comando percTable el cual nos dará el porcentaje, en lugar de proporciones como lo hace

prop.table