Upload
lcoaguilap
View
61
Download
5
Embed Size (px)
DESCRIPTION
xx
Citation preview
Software de Anlisis Estadstico SAS
Jessica Paola Vargas Castro1
Luis Felipe Patio Oquendo2
Cindy Carolina Lugo Rozo3
Viviana Oquendo
julio de 2013
Resumen:
El uso de los software economtricos en la ltima dcada han trascendido para
los profesionales como una herramienta til para el anlisis estadstico y
econmico, as, tareas que tomaban horas se trabajan en segundos y el
profesional en su disciplina puede emitir un anlisis ms rpidamente y con
una clara visin de lo que ocurre con los datos que trabaja. Este documento
pretende guiar en el manejo del software SAS (Statistical Analysis Software)
tanto en la parte tcnica como en la parte aplicativa.
Palabras Clave:
Software, econometra, series de tiempo, anlisis grfico, pronstico, datos panel,
regresin.
JEL:
Statistical Analysis Software SAS
Abstract:
The use of econometric software in the last decade have transcended for
professionals as a useful tool for statistical analysis and economic, as well,
tasks that took hours are worked in seconds and the professional in their
1 Estudiante de economa de la Facultad de Ciencias Econmicas de la Universidad
Nacional de Colombia, y monitor junior del grupo capacitaciones de la Unidad de
Informtica y Comunicaciones de la Facultad de Ciencias Econmicas durante. Correo
Electrnico: [email protected] 2 Estudiante de ingeniera elctrica de la Facultad de Ingeniera de la Universidad
Nacional de Colombia, y monitor junior del grupo capacitaciones de la unidad de
informtica y comunicaciones de la Facultad de Ciencias Econmicas durante. Correo
Electrnico: [email protected] 3 Estudiante de economa de la Facultad de Ciencias Econmicas de la Universidad
Nacional de Colombia, y monitor junior del grupo mejor gestin de la Unidad de
Informtica y Comunicaciones de la Facultad de Ciencias Econmicas durante. Correo
Electrnico: [email protected]
INV- Software de Anlisis Estadstico SAS /2013-I
2
discipline can issue further analysis quickly and a clear vision of what happens
to the data that works. This document is intended to guide the management of
SAS software (Statistic Analysis Software) in both the technical and on the
applicative.
Keywords:
Software, econometrics, time series, graphic analysis, quality control, forecast
INV- Software de Anlisis Estadstico SAS /2013-I
3
Director Unidad Informtica:
Henry Martnez Sarmiento
Tutor Investigacin:
Viviana Mara Patio Oquendo
Coordinadores:
Jasmin Guerra Crdenas
Juan Carlos Tarapuez Roa
Coordinador Servicios Web:
John Jairo Vargas
Analista de Infraestructura y
Comunicaciones:
Diego Alejandro Jimnez Arvalo
Analista de Sistemas de Informacin:
Vctor Hugo Ramos Ramos
Estudiantes Auxiliares:
Ahumada Avendao Fredy Esteban
Alvarado Castillo Paola Alejandra
Alzate Gaitn Paola Andrea
Andrade Martnez David Ricardo
Caldern Espitia Walter Helberth
Cano Daz Alberto
vila Ibez Diego Fernando
Enciso Castao Julin David
Gonzlez Mayorga Cesar Felipe
Gisa Daz Carlos Eduardo
Hernndez Carvajal Miguel ngel
Hurtado Casas Andrs Felipe
Leyva Daz Daniel Felipe
Lugo Rozo Cindy Carolina
Malangn Carvajal Laura Juliana
Martnez Cortes Nicols
Miranda Hernndez Ncolas
Montes Parra Mayerli Andrea
Moreno Urin Germn Yesid
Oquendo Patio Viviana Mara
Patio Oquendo Luis Felipe
Pineda Estupian Andrs Javier
Rojas Martn Daniel Francisco
Rubiano Rojas Mario Andrs
Vargas Castro Jessica Paola
Este documento es resultado de un trabajo
conjunto y coordinado de los integrantes de
la Unidad de Informtica y Comunicaciones
de la Facultad de Ciencias Econmicas de la
Universidad Nacional de Colombia.
Esta obra est bajo una licencia reconocimiento no comercial 2.5
Colombia de CreativeCommons. Para ver una copia de esta licencia,
visite http://creativecommons.org/licenses/by/2.5/co/ o enve una carta a
CreativeCommons, 171second street, suite 30 San Francisco, California
94105, USA.
INV- Software de Anlisis Estadstico SAS /2013-I
4
Software de Anlisis Estadstico SAS
1. Contenido
2. Introduccin ............................................................................................................... 6
2.1. Caractersticas generales del software .............................................................. 6
2.1.1. Requerimientos del sistema para Linux(Official Page, Statistical Analysis
Software SAS, 2013) .................................................................................................. 6
2.1.2. Requerimientos del sistema para Windows(Official Page, Statistical
Analysis Software SAS, 2013) ................................................................................... 6
2.1.3. Comparacin del software con otros software estadsticos ........................ 7
2.1.4. Listado de funciones del programa SAS(Universidad Complutense de
Madrid, 2013) ............................................................................................................ 7
2.1.5. Aplicabilidad de SAS ................................................................................... 8
2.2. Lenguaje de programacin ................................................................................. 8
2.2.1. Acerca del lenguaje de programacin(N/A, 2013) ....................................... 8
2.2.2. Uso del software segn la pgina oficial de SAS(Official Page, Statistical
Analysis Software, 2013) ........................................................................................... 8
2.3. Manual SAS ....................................................................................................... 9
2.3.1. Crear una librera ....................................................................................... 9
2.3.2. Leer data sets de SAS ............................................................................... 13
2.3.3. Leer archivos de bases de datos para pc ................................................... 15
2.3.4. Presentar programas de sas para hosts remotos...................................... 18
2.3.5. Crear y definir variables ........................................................................... 21
2.3.6. Usar declaraciones condicionales ............................................................. 21
2.3.7. Subconjunto de datos ................................................................................ 22
2.3.8. Trabajo con Fechas y Horas de SAS ......................................................... 23
2.3.9. Impresin de Datos ................................................................................... 24
2.3.10. Conteo de datos ...................................................................................... 24
2.3.11. Tabular datos ......................................................................................... 25
2.3.12. Consulta de datos .................................................................................. 26
2.3.13. Unir tablas ............................................................................................. 27
2.3.14. Crear grficos......................................................................................... 28
2.3.15. Crear grficos (2) ................................................................................... 29
INV- Software de Anlisis Estadstico SAS /2013-I
5
2.3.16. Regresin simple y mltiple .................................................................. 31
2.3.17. ARIMA ................................................................................................... 36
2.3.18. Datos Panel ............................................................................................ 44
2.3.19. ODS Graphics Designer......................................................................... 65
2.4. Clases ............................................................................................................... 71
2.4.1. Primera Clase ............................................................................................ 71
2.4.2. Segunda clase Definiciones bsicas para la insercin de variables ...... 72
2.4.3. Tercera Clase Lgica condicional, fechas y horas, subconjuntos .......... 77
2.4.3.1. Lgica condicional .................................................................................. 77
2.4.3.2. Subconjuntos de datos ........................................................................... 81
2.4.3.3. Fechas y horas con SAS ......................................................................... 83
2.4.3.6. SAS DATATIME VALUE ...................................................................... 84
2.4.4. Cuarta clase Regresin simple ............................................................... 86
2.4.5. Quinta Clase Regresin multiple ........................................................... 90
2.4.6. Sexta clase - Modelos ARIMA ................................................................. 103
2.4.7. Sptima clase Datos Panel ................................................................... 119
2.4.8. Octava clase ODS Graphics Designer .................................................. 140
3. Conclusiones .......................................................................................................... 155
4. Referencias ............................................................................................................ 157
INV- Software de Anlisis Estadstico SAS /2013-I
6
2. Introduccin
La empresa SAS crea el Statistical Analysis Software (SAS) principalmente como un mtodo
para la organizacin y control de grandes bases de datos. SAS fue diseado de manera tal que
respondiera a una recoleccin, transformacin, anlisis y reporte de datos; de manera adecuada
y eficiente para la organizacin que disponga del software. Sin embargo, pronto el software
comenz a formarse como uno de los paquetes economtricos ms poderosos del mercado.
Adems, el software puede generar muchas soluciones de negocio que permiten soluciones de
software a gran escala para reas como administracin, gestin de recursos humanos, gestin
financiera, inteligencia de negocios y ms. La ltima versin de SAS fue SAS 9.3 y sali al
mercado en diciembre de 2011.
2.1. Caractersticas generales del software
2.1.1. Requerimientos del sistema para Linux(Official Page, Statistical
Analysis Software SAS, 2013)
Sistemas operativos de LINUX:
Red Hat Enterprise Linux 4 y 5
SuSE Linux Enterprise Server 9 y 10
Linux x 64 (siempre y cuando sea por la va de compatibilidad de 32 bits.
Para esta versin de SAS, los requerimientos del hardware son:
Intel Pentium 4 o superior o Procesadores XeonClass
64 Mb de memoria
Soporte de pantalla de mnimo 256 colores
2.1.2. Requerimientos del sistema para Windows(Official Page, Statistical
Analysis Software SAS, 2013)
SAS 9.1 se puede instalar en prcticamente cualquier sistema operativo de
Windows:
Windows 7, Windows Vista, Windows XP, Windows 2000, Windows NT Family.
Requerimientos mnimos del Hardware
INV- Software de Anlisis Estadstico SAS /2013-I
7
Intel Pentium II
Memoria de 256 Mb
Resolucin de pantalla de 800 * 600 o superior
Acceso a internet
2.1.3. Comparacin del software con otros software estadsticos
En la siguiente pgina se muestra unas amplias tablas de comparacin de gran
cantidad de Software de anlisis estadstico:
http://en.wikipedia.org/wiki/Comparison_of_statistical_packages
Las caractersticas de SAS muestran que el software no es Libre y es de
licencia propietaria, adems de usar una interfaz grfica CLI/GUI. El software
como ya se mencion trabaja en los sistemas operativos de Linux y Windows,
adems de UNIX. No trabaja en BSD y en Mac OS fue terminado.
En las diferentes tablas tambin aparecen los programas que utilizan varios
mtodos ANOVA (ANOVA son los diferentes modelos estadsticos que existen)
en el cual SAS maneja todos los mtodos:
One way, Two Way, MANOVA, GLM, Mixed Model, Post-host, Latin squares.
Tambin muestra los diferentes modelos de regresin que existen y los software
que los manejan. De nuevo SAS es capaz de aplicar todos los mtodos:
OLS, WLS, 2SLS, NLLS, Logistic, GLM, LAD, Stepwise, Quantitle, Probit, Cox,
Poisson, MLR.
La siguiente tabla en la pgina muestra los software que utilizan diferentes
anlisis de series temporales. SAS maneja todos:
ARIMA, GARCH, Unit root test, Cointegration test, VAR, Multivariable
GARCH
SAS emplea todos los grficos y diagramas que manejan los software
estadsticos. En estas diferentes tablas se puede concluir que SAS es uno de los
programas ms completos en el mercado.
2.1.4. Listado de funciones del programa SAS(Universidad Complutense de
Madrid, 2013)
SASAnalytics es la marca registrada que maneja la empresa para integrar
todo lo que involucra el modelado predictivo y analtico. Entre las funciones del
programa SAS encontramos:
Las utilidades de entorno grfico:
Creacin y manipulacin de libreras de datos SAS (llamados SAS-FILES)
Importacin/exportacin de datos externos en ficheros ASCII
Importacin/exportacin de datos externos en ficheros en otros formatos, por
ejemplo, EXCEL.
INV- Software de Anlisis Estadstico SAS /2013-I
8
Exportacin de grficos a otros formatos.
Para estadstica y econometra encontramos:
Estadstica descriptiva simple
Regresin y anlisis de varianza y covarianza
Anlisis de datos cualitativos
Anlisis discriminante
Anlisis cluster
Anlisis de supervivencia
Scoring (estandarizacin y construccin de variables)
Imputacin de datos perdidos
Anlisis de potencia
Clculo de medidas de distancia
2.1.5. Aplicabilidad de SAS
El programa SAS est pensado como un software para el anlisis y manejo de
datos que busca mejorar la gestin empresarial, por su capacidad de organizacin y
anlisis. SAS desea que los usuarios del software puedan facilitar su proceso de
toma de decisiones utilizando modelos predictivos, descriptivos, de simulacin y
optimizacin. Con ello se busca llegar a la solucin de los problemas cotidianos del
entorno econmico y fomentar el desarrollo interno de los agentes que usen el
software. En esa medida, en la Universidad Nacional, son las carreras afines al
entorno econmico y en general carreras que trabajan con bases de datos, las que
pueden aprovechar las opciones que ofrece SAS; especialmente las carreras de la
Facultad de Ciencias Econmicas.
2.2. Lenguaje de programacin
2.2.1. Acerca del lenguaje de programacin(N/A, 2013)
El lenguaje de programacin que utiliza SAS fue diseado por el mismo SAS. Su
sintaxis est inspirada en la de PL/I (lenguaje propuesto por IBM en 1970), este
opera en primera instancia sobre tablas de datos. Estas tablas de datos las puede
leer, transformarlas, combinarlas, resumirlas, crear informes, entre otras cosas. El
ncleo del lenguaje incluye Pasos data que permiten realizar operaciones sobre las
filas de un conjunto de datos, procedimientos de manipulacin de datos que
permiten ordenar tablas, enlazarlas, etc., un intrprete de SQL, un superlenguaje
de macros.
2.2.2. Uso del software segn la pgina oficial de SAS(Official Page, Statistical
Analysis Software, 2013)
INV- Software de Anlisis Estadstico SAS /2013-I
9
Cualquier software informtico que pueda descargarse o que de cualquier otra
forma est disponible en esta pgina Web se encuentra sujeto a una licencia que
puede ser la del contrato escrito de licencia suscrito entre usted y SAS o la licencia
click-on que usted acepta en el momento de descarga o uso. El software al que cualquiera de estas dos licencias le sea de aplicacin se encuentra, salvo pacto en
contrario, sujeto nicamente a los trminos de su contrato de licencia asociado.
En cualquier caso, si ni una licencia escrita o una click-on estn disponibles, el uso que usted haga del software se encontrar sujeto a las siguientes condiciones:
1) No podr usar, reproducir, grabar, modificar, publicar, comunicar pblicamente
o distribuir ningn software disponible a travs de esta pgina Web sin el previo
consentimiento expreso y por escrito de SAS
2) Se le reconoce una licencia personal, no exclusiva, para usar dicho software
sujeto a las restricciones indicadas ms arriba
3) Dicho software se encuentra sujeto a todas las Garantas y Limitaciones de
responsabilidad que se establecen a continuacin
4) Salvo expresamente garantizado en otro lugar, SAS Institute Inc. y sus
otorgantes de licencias se reservan todos los derechos, ttulos e intereses en
relacin a dicho software.
2.3. Manual SAS
Como mtodo de autoexploracin del software SAS se estableci que a partir del
software y su respectivo manual, se iran encontrando las diferentes funciones del
programa y con base en estas se realizara la estructura del curso de acuerdo a los
diferentes tems encontrados y a la experiencia en la unidad sobre estos tipos de
software y el mejor procedimiento para dictar un curso libre. A continuacin se
presenta la primera parte del manual de SAS con los siguientes tems:
o Crear una Librera
o Leer data sets de SAS
o Leer archives de bases de datos para PC
o Presentar programas de SAS para host remotos.
2.3.1. Crear una librera
Antes de iniciar con SAS file, generalmente se debe definir primero una librera de
SAS, esto con el fin de mostrarle a SAS donde se encuentra el archivo. Usted ha
creado ya una biblioteca SAS interactivamente mediante la ventana de la nueva
biblioteca. Otra forma de definir una biblioteca SAS es utilizando una instruccin
LIBNAME. Esta declaracin LIBNAME permite 4 cosas:
INV- Software de Anlisis Estadstico SAS /2013-I
10
Identifica una Librera SAS a SAS.
Asocia un motor con la librera
Permite asociar especificaciones con la librera
Asigna un libref (nombre de referencia de la librera) a ella misma.
A gran ventaja del comando LIBNAME es que puede almacenarla en un programa
de SAS, as, se puede referenciar la librera automticamente cuando se enve el
programa. Una vez que se asigna a la libref, usted puede leer, crear o actualizar
archivos en una biblioteca SAS:
libref.filename
En el nombre de dos niveles, libref es el nombre de la biblioteca SAS que contiene
el archivo y nombre_de_archivo es el nombre del mismo archivo. Un perodo separa
la libref y el nombre de archivo. En el nombre de dos niveles, libref es el nombre de
la biblioteca SAS que contiene el archivo y filename es el nombre del mismo
archivo. Un perodo separa la libref y el filename.
Si se tienen las licencias de 1 o ms productos de SAS diferentes, es posible crear una
librera SAS que referencie relaciones de DBMS database, schema, server, o grupos de
tablas y vistas.
Mtodo de Point and Click
Se puede crear una librera mediante:
1. Clic en View > Explorer.
2. Clic en File > New.
INV- Software de Anlisis Estadstico SAS /2013-I
11
3. En la ventana de New Library, especifique la informacin para la nueva
librera. Si usted quiere sea creada en el comienzo de cualquier sesin de SAS, haga
clic en Enable at startup.
4. Clic OK.
EJEMPLO 1
Asignacin de un libref a archivos de referencia SAS
Suponga que usted quiere definir una librera SAS para referenciar una carpeta en el
entorno operativo de Windows que contiene algunos SAS data sets. Luego usted
quiere crear un nuevo data set, imprimirlo e imprimir un data set existente en la
misma librera. El siguiente programa define la librera Sales y referencia los
archivos SAS con esta librera.
Usted puede copiar y enviar este programa en SAS. Sin embargo, es necesario
editar el directorio en el estado LIBNAME (est en rojo) para referenciar un directorio
existente en su entorno operativo.
/*************************************/
/* define SAS library */
/*************************************/
libname sales 'c:\salesdata\sas\2002';
/*************************************/
/* create new data set from raw data */
/*************************************/
data sales.quarter1;
length Department $ 7 Site $ 8;
input Department Site Quarter Sales;
datalines;
Parts Sydney 1 4043.97
Parts Atlanta 1 6225.26
Parts Paris 1 3543.97
Repairs Sydney 1 5592.82
Repairs Atlanta 1 9210.21
Repairs Paris 1 8591.98
Tools Sydney 1 1775.74
Tools Atlanta 1 2424.19
Tools Paris 1 5914.25
;
run;
/*************************************/
/* print new data set */
/*************************************/
proc print data=sales.quarter1;
run;
/*************************************/
/* print existing data set */
/*************************************/
proc print data=mylib.productsales;
run;
INV- Software de Anlisis Estadstico SAS /2013-I
12
EJEMPLO 2
Ahora suponga que usted quiere imprimir tambin una tabla Oracle y una tabla DB2.
El siguiente programa muestra cmo puede especificar declaraciones LIBNAME con
los motores de SAS/ACESS y opciones apropiadas. Despus de asignar un libref a
DBMS, es posible referenciar estas tablas y vistas como SAS data sets, usando los
nombres estndar two-level SAS.
Mientras usted pueda definir cualquier nmero de librefs in SAS, usted puede
procesar datos desde mltiples recursos DBMS en el mismo programa de SAS.
Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr
este programa como se muestra. Sin embargo es posible modificarlo para trabajar con
tablas DBMS que usted pueda acceder.
/*************************************/
/* define SAS library for Oracle */
/*************************************/
libname myorlib oracle user=scott password=tiger
path="blunzer:v7" schema=hrdept;
/*************************************/
/* define SAS library for DB2 */
/*************************************/
libname mydblib db2
noprompt="user=testuser;
password=testpass;database=testdb";
/*************************************/
/* print Oracle table */
/*************************************/
proc print data=myorlib.all_employees;
where state='CA';
run;
/*************************************/
/* print DB2 table */
/*************************************/
proc print data=mydblib.customers;
where state='CA';
run;
/*************************************/
/* clear librefs */
/*************************************/
libname myorlib clear;
libname mydblib clear;
INV- Software de Anlisis Estadstico SAS /2013-I
13
REFERENCIAS
Ac puede encontrar ms informacin acerca de crear libreras.
Documentacin en Help SAS:
1. En SAS, click Help SAS Help and Documentation.
2. Expanda SAS Products Base SAS.
3. Expanda SAS Language Concepts SAS Files Concepts SAS Data
Libraries y mire los tpicos de inters
4. Expand SAS Language Dictionary Dictionary of Language Elements
Statements y click LIBNAME statement y LIBNAME Statement,
SAS/ACCESS.
5. Expanda Using SAS Software in Your Operating Environment, luego en la
seccin de su entorno operativo. Expanda Using SAS Files y vea los tpicos
relacionados con las libreras de SAS
Preguntas en el soporte tcnico Frequently Asked Questions
Programas in SAS help:
1. En SAS, click Help SAS Help and Documentation.
2. Expand Learning to Use SAS y click Sample SAS Programs.
3. Clic Base SAS y mire los programas de inters
2.3.2. Leer data sets de SAS
Tal vez quiera crear un nuevo data set desde un data set existente. En Create an run
SAS programas, haya visto ejemplos de DATA step que lee existiendo data sets usando
una declaracin SET. Leyendo un data set en un DATA step es ms simple que leyendo
los datos en bruto debido a que el trabajo de describir y convertir los datos ya se han
hecho.
Ahora, cuando usted usa un data sets existente o subsets creados desde SAS data sets,
usted puede hacer ms eficiente el uso de los recursos del computador que si usara los
datos en bruto (raw data) o si est trabajando con data sets largos. Leer menos
variables significa que SAS crea un program data vector ms pequeo, y leyendo menos
observaciones significa que existen menos iteraciones para el DATA step que se crean.
Usted puede leer desde uno o ms data set, combinar y modificar datos en diferentes
maneras, por ejemplo usted puede:
Combinar 2 o ms input data sets para crear un output data ser
Fusionar datos desde 2 o ms data sets para crear un output data set
Actualizar un archivo master basado en las grabaciones de transaccin.
En el caso ms simple usted lee datos desde un solo SAS data set:
INV- Software de Anlisis Estadstico SAS /2013-I
14
Como las principales herramientas para leer, combinar y modificar data sets, usted
puede usar cuatro declaraciones: SET, MERGE, MODIFICY y UPDATE. Para procesar
los datos y crear un data set de salida, puede usar una programacin adicional de
declaraciones SAS en el paso DATA.
Esta tarea se centra en la lectura de un nico conjunto de datos SAS utilizando la
sentencia SET.
EJEMPLO
Cuando usted lee data sets de SAS, el gran poder del paso de programacin DATA est
disponible para usted. Los siguientes ejemplos muestran algunos caminos fciles para
usar la declaracin SET para leer una existente data set.
Usted puede copiar y enviar estos programas en SAS. En los datos de
Mylib.ProductSales fue creado por Work with SAS data sets. Si no se cre, vuelva
a la tarea definir la librera y crear un data set antes de cargar estos
programas que aparecen a continuacin
/*************************************/
/* read a data set and subset */
/*************************************/
data canada;
set mylib.productsales;
if country='CANADA';
run;
/*************************************/
/* read a data set, subset, and */
/* create new variables */
/*************************************/
INV- Software de Anlisis Estadstico SAS /2013-I
15
data canada2;
set mylib.productsales;
if country='CANADA';
Total_Variance=actual-predict;
Forecast=actual*1.15;
run;
/*************************************/
/* read a subset using direct access */
/*************************************/
data product_sample;
do obsnum=1 to 100 by 2;
set mylib.productsales point=obsnum;
if _error_ then abort;
output;
end;
stop;
run;
REFERENCIAS
Documentation, publications, and FAQs
Documentacin en SAS help:
1. En SAS, click Help< SAS Help and Documentation.
2. Expanda SAS Products< Base SAS< SAS Language Concepts.
3. Expand DATA Step Concepts< Reading, Combining, and Modifying SAS Data
Sets y mire los tpicos de interes
4. Expand SAS System Concepts< Rules for Words and Names in the SAS
Language y mire los tpicos de interes.
5. Expand SAS Products< Base SAS< SAS Language Dictionary< Dictionary of
Language Elements< SAS Data Set Options y mire los topicos de interes
Preguntas en working with SAS data sets en SAS Technical Support's Frequently
Asked Questions
Ejemplos de programas
programs in SAS help:
1. En SAS, click Help< SAS Help and Documentation.
2. Expand Learning to Use SAS y click Sample SAS Programs.
3. Click Base SAS y vea Starting with SAS Data Sets, Chapter 4.
2.3.3. Leer archivos de bases de datos para pc
INV- Software de Anlisis Estadstico SAS /2013-I
16
Si usted tiene un archivo de base de datos ya sea en hojas de clculo de Microsoft Excel,
Lotus o archivos de Microsoft Access, puede usar SAS para importar estos archivos y
crear data sets de SAS. Una vez haya obtenido el archivo en SAS, es posible procesarlos
como usted lo necesite en SAS. Tambin es posible exportar archivos de SAS a un
nmero de formatos diferentes para PC.
Para leer bases de datos de PC, puede usar el procedimiento IMPORT. PROC IMPORT
lee el archivo de entrada y los convierte a un data set de SAS, con las variables SAS
definidas en base a los registros de entrada. Usted puede controlar los resultados con
opciones y declaraciones que estn especificadas en el recurso de entrada de datos
(input data).
PROC IMPORT slo est disponible en Windows, OS/2, OpenVMS, and UNIX
Usted debe tener la interfaz SAS/ACCESS para archivos de PC licenciados para leer
archivos de datos de la PC. Sin embargo, an sin la interfaz SAS/ACCESS para
archivos de PC puede importar y exportar archivos externos limitados (archivos que
contienen columnas de valores de datos que estn separados por un delimitador como
un espacio en blanco o una coma).
Mtodo de Click and Point
Si usted tiene la interfaz SAS/ACCESS para archives de PC licensiados, puede
importar bases de datos usando Import Wizard:
1. En SAS, click File< Import Data.
2. Cuando el Import Wizard se abre, siga las instrucciones para importar datos.
Usted puede ver y salvar el cdigo PROC IMPORT que el Import Wizard genera
EJEMPLO
Suponga que usted quiere importar 2 archivos, a ua hoja de clculo de Microsoft Excel y
a una tabla de Access. El siguiente programa le muestra cmo leer datos usando
opciones especficas para el archivo dado, crea data sets e imprime el nuevo data sets.
Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr
este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con
bases de datos de PC a las que pueda acceder.
/*************************************/
/* import the Excel file */
/*************************************/
proc import datafile="c:\myfiles\Accounts.xls"
out=sasuser.accounts sheet="Prices";
getnames=no;
run;
/*************************************/
INV- Software de Anlisis Estadstico SAS /2013-I
17
/* print part of the new data set */
/*************************************/
proc print data=sasuser.accounts(obs=10);
run;
/*************************************/
/* import the Access file */
/*************************************/
proc import table="customers"
out=sasuser.cust dbms=access;
uid="userid";
pwd="mypassword";
database="c:\myfiles\east.mdb";
wgdb="c:\winnt\system32\security.mdb";
run;
/*************************************/
/* print part of the new data set */
/*************************************/
proc print data=sasuser.cust(obs=5);
run;
REFERENCIAS
Mire estos recursos online para aprender ms a cerca de como leer bases de datos de
PC.
Documentacin, publicaciones y FAQs
Documentacin en SAS help
1. En SAS, click Help< SAS Help and Documentation.
2. ExpandA SAS Products< Base SAS< SAS Procedures< Procedures.
3. Click The IMPORT Procedure y vea los tpicos de interes
4. Si usted est interesado en exporter datos a bases de datos de PC, click The
EXPORT Procedure.
PROC IMPORT documents desde SAS Technical Support Documents
product-specific documentacin para PC File Formats en SAS Online Product
Documentation
Otras publicaciones en SAS Documentation, incluyendo Your SAS Technology Report
Preguntas sobre on PROC IMPORT en SAS Technical Support's Frequently Asked
Questions
Ejemplos de programas
INV- Software de Anlisis Estadstico SAS /2013-I
18
programs in SAS help:
1. En SAS, click Help< SAS Help and Documentation.
2. Expanda SAS Products< Base SAS< SAS Procedures.
3. Clic The IMPORT Procedure.
4. Clic Examples: IMPORT Procedure.
2.3.4. Presentar programas de sas para hosts remotos
El servicio de cmputo de SAS le da un fcil acceso a muchas de los recursos remotos en
su red desde una sola sesin local de SAS. SAS/CONNECT ofrece acceso a recursos
remotos en 2 formas, sincrnicos y asincrnicos. Con el proceso sincrnico, usted espera
los resultados del proceso remoto antes de estar disponibles para continuar el proceso
local. Con el proceso asincrnico, usted inmediatamente recupera el control para
continuar el proceso local mientras el trabajo remoto se ejecuta, y usted puede obtener
los resultados despus.
El acceso remoto le ayuda eficazmente usando todos los recursos informticos de la
organizacin. Los servicios informticos tambin le permiten tener ventaja en el
Output Delivery System (ODS) en SAS para cambiar el formato y la apariencia en la
salida de SAS que es generada en un host remoto.
Las declaraciones de SAS/CONNECT GIGNON, SIGNOGG, RSUBMIT, y
ENDRSUBMIT lo conectan para presentar declaraciones a un host remoto desde una
sesin en un host local. Usted puede incluir estas declaraciones en un programa de SAS
y hacer al mismo tiempo los procesos locales y remotos en un solo programa de SAS.
Usted debe tener la licencia de SAS/CONNECT para presentar programas de SAS en
host remotos.
INV- Software de Anlisis Estadstico SAS /2013-I
19
EJEMPLO
Suponga que usted quiere llevar a cabo algn tipo de procesamiento en un host remoto,
descargue lo resultante del data set, cree un data set permanente en el host local, e
imprima un reporte sobre el host local. El siguiente ejemplo ilustra cmo poner todas
estas caractersticas en un solo programa.
Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr
este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con
archivos remotos a los cuales pueda acceder
/*************************************/
/* prepare to sign on */
/*************************************/
options comamid=netbios remote=netpc;
libname lhost 'c:\sales\reg1';
/*************************************/
/* sign on and download data set */
/*************************************/
signon;
rsubmit;
libname rhost 'd:\dept12';
proc sort data=rhost.master
out=rhost.sales;
where gross > 5000;
by lastname dept;
run;
proc download data=rhost.sales
out=lhost.sales;
run;
endrsubmit;
/*************************************/
/* print data set in local session */
/*************************************/
proc print data=lhost.sales;
run;
REFERENCIAS
Vea estor recursos online para aprender ms acerca de cmo presentar programas
remotos de SAS
Documentacin, publicaciones y FAQs
Documentacin en SAS help:
1. En SAS, click Help< SAS Help and Documentation.
2. Expand SAS Products< SAS/CONNECT< Communications Access Methods.
3. Expanda los tpicos de interes en SAS/CONNECT.
INV- Software de Anlisis Estadstico SAS /2013-I
20
SAS/CONNECT and SAS/SHARE documents desde SAS Technical Support
Documents
product-specific documentation SAS/CONNECT in SAS Online Product
Documentation
Otras publicaciones en SAS para Documentation, incluyendo Your SAS Technology
Report
Preguntas sobre SAS/CONNECT wn SAS Technical Support's Frequently Asked
Questions
Ejemplos de programas
programas en SAS help:
1. En SAS, click Help< SAS Help and Documentation.
2. Expand Learning to Use SAS< Sample SAS Programs.
3. Click SAS/CONNECT y mire los programas de interes
Programas en SAS Online Samples:
SAS/CONNECT Software: Usage and Reference, Version 6, Second Edition
Siguiendo lo estipulado, se continu con el mtodo de autoexploracin del software SAS. Se
estableci que a partir del software y su respectivo manual, se iran encontrando las diferentes
funciones del programa y con base en estas se realizara la estructura del curso de acuerdo a
los diferentes tems encontrados y a la experiencia en la unidad sobre estos tipos de software y
el mejor procedimiento para dictar un curso libre. A continuacin se encuentra la ltima parte
de este manual introductorio de SAS.
o Crear y Definir variables
o Usar declaraciones condicionales
o Subconjunto de Datos
o Trabajo con Fechas y Horas de SAS
o Impresin de datos
o Conteo de Datos
o Tabular Datos
o Consulta de Datos
o Unir Tablas
o Crear Grficos
o Crear Grficos (2)
Adjunto a este informe se encuentra el manual completo. No se archiva ac debido a que es
muy extenso, simplemente se pondr la explicacin de cada tema omitiendo los ejemplos y sus
respectivas referencias
INV- Software de Anlisis Estadstico SAS /2013-I
21
2.3.5. Crear y definir variables
A menudo, cuando usted trabaja con data sets, es muy til crear nuevas variables o
variables que estn basadas en los valores de otras variables existentes. Estas nuevas
variables pueden contener los resultados de las funciones de SAS, valores
condicionalmente asignados, o valores totales de valores de otra variable.
Usted puede crear variables en un paso DATA mediante las siguientes maneras:
Usando una declaracin asignada
Leyendo datos con la declaracin INPUT en un paso DATA
Especificando una nueva variable en una declaracin FORMAT o
ONFORMAT
Especificando una nueva variable en una declaracin LENGHT
Especificando una nueva variable en una declaracin ATTRIB
Cuando usted crea variables usando declaraciones asignada, usted puede tomar
ventaja de SAS functions y SAS expressions.
2.3.6. Usar declaraciones condicionales
En los pasos DATA de los programas, usted probablemente querr usar lgica
condicional para procesar algunas observaciones pero otras no.
INV- Software de Anlisis Estadstico SAS /2013-I
22
Para ejecutar una declaracin SAS para observaciones que cumplan condiciones
especificas, usted puede usar:
Declaraciones IF-THEN/ELSE para programas con algunas declaraciones
condicionales
Un grupo SELECT cuando usted tiene una serie larga de condiciones que son
mutuamente exclusivas
Subconjuntos de declaraciones IF, sin una clausula THEN, para continuar el
procesamiento solo de las observaciones o registros que cumplan la condicin
que es especificada en la clausula IF.
Para construir expresiones en declaraciones, usted puede utilizar los siguientes
operadores comparativos:
Tambin puede utilizar estos operadores lgicos
2.3.7. Subconjunto de datos
A menudo usted necesita trabajar slo con subconjuntos de un data set de SAS. Por lo
que necesita seleccionar observaciones, variables o inclusive ambas.
En el paso DATA, usted tiene un nmero de herramientas para subconjuntos de
datos. Usted puede usar:
INV- Software de Anlisis Estadstico SAS /2013-I
23
Subconjuntos de declaraciones IF para seleccionar slo aquellas observaciones
que cumplan una condicin especfica
Construcciones IF-THEN/ELSE con declaraciones DELETE y OUTPUT para
borrar o seleccionar observaciones que permitan una condicin,
respectivamente
DROP= y KEEP= opciones de data set y DROP y KEEp declaraciones para
bajar o mantener determinadas variables
Declaraciones WHERE para seleccionar slo las observaciones que cumplan
una condicin especfica (en determinadas condiciones).
EN los pasos PROC, las declaraciones WHERE son la herramienta ms comn para
seleccionar observaciones que cumplan una condicin especfica.
sta tarea se enfoca en la escritura de los pasos DATA usando subconjuntos de
declaraciones IF, las opciones DROP= y KEEP= de data set y las declaraciones DROP
y KEEP.
2.3.8. Trabajo con Fechas y Horas de SAS
SAS almacena las fechas y horas como nmeros nicos, exclusivos para que pueda
utilizarlas en programas como cualquier otra variable numrica:
Un SAS date value es un valor que representa el nmero de das entre enero 1 de
1960 y una fecha especificada. SAS puede realizar clculos con fechas que van desde
el ao 1582 a 19.900 AD. Fechas antes de Enero 1 de 1960, son nmeros negativos,
despus de las fechas son nmeros positivos.
Un SAS time value es un valor que representa el nmero de segundos transcurridos
desde la medianoche del da actual. Los valores SAS time value son entre 0 y 86400.
Un SAS datetime value es un valor que representa el nmero de segundos entre enero
1 de 1960 y una hora / minuto / segundo dentro de un plazo determinado.
INV- Software de Anlisis Estadstico SAS /2013-I
24
Para trabajar con valores date, time y datetime usted puede utilizar las siguientes
herramientas:
Informats lee un valor, tal como un reloj de tiempo o un calendaro, el cual
puede ser de varias longitudes, y luego convierte los datos o un valor data,
time datetime.
Formats presenta un valor reconocido por SAS, tal como un valor time o date,
como un dato del calendario o un tiempo de reloj de varias longitudes.
Functions realize operaciones sobre valores date, time, y datetime de SAS.
2.3.9. Impresin de Datos
Para listar la informacin en un data set, usted puede crear un reporte usando el
procedimiento PRINT. Luego, usted puede mejorar el reporte con declaraciones
adicionales y opciones para crear reportes como se muestra ms abajo. Usted puede
crear una variedad de reportes que van desde una simple lista a un gran reporte de
datos completamente personalizado adems de clculos totales y subtotales de una
variable numrica.
Metodo Point-and-Click
Si usted tiene licensia de SAS/STAT, usted puede crear listas de reportes usando una
interfaz point-and-click.
Usted puede ver y guardar el cdigo PROC PRINT que genera Analyst.
2.3.10. Conteo de datos
Cuando usted analiza sus datos, es posible que usted necesite determinar qu valores
de una variable estn distribuidos a travs de los datos. Para ello, usted puede crear
tablas de frecuencia, la cual muestra la distribucin de los valores de la variable,
tanto con los porcentajes de un total como el conteo de data.
INV- Software de Anlisis Estadstico SAS /2013-I
25
El procedimiento FREQ en Base SAS crea un solo sentido de la tabla de frecuencias,
dos sentidos y n sentidos de tablas de contingencia. Tambin puede calcular medidas
de asociacin y de acuerdo, organiza la salida por variables de estratificacin.
Esta tarea estar enfocada en usar PROC FREQ para realizar anlisis bsicos de
datos.
Mtodo de Point-and-Click
Si usted tiene licencia de SAS/STAT, usted puede crear tablas de frecuencias usando
una interfaz point-and-click.
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abra, click File< Open by SAS Name para agregar al
proyecto
3. Luego click Statistics< Descriptive< Frequency Counts para crear tablas de
frecuencias.
Usted puede ver y salvar el cdigo PROC FREQ que genera Analyst.
2.3.11. Tabular datos
El procedimiento TABULATE le da el poder y la flexibilidad para resumir los datos en
forma de tabla. Usted puede crear una variedad de tablas que van desde simples a
muy personalizados, incluyendo tablas de una, dos, y tres dimensiones que muestran
cualquier de los nmeros de una estadstica descriptiva. Usted puede:
INV- Software de Anlisis Estadstico SAS /2013-I
26
Modificar virtualmente cualquier caracterstica de una tabla
Calcular porcentajes
Producir reportes integrados sin clasificar datos
Resumir datos y producir un reporte en un paso
Generar tablas mltiples en un paso
PROC TABULATE calcula muchas de las mismas estadsticas que son calculadas por
otros procedimientos estadsticos descriptivos tales como MEANS, FREQ, y REPORT
Mtodo de Click-and-Point
Si usted tiene licencia de SAS/STAT, usted puede crear reportes tabulares usando una
interfaz point-and-click.
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abre, click File< Open by SAS Name para agregar datos al
proyecto.
3. Luego click Reports< Tables para crear un reporte tabular
Usted puede ver y salvar el cdigo PROC TABULATE que genera Analyst.
2.3.12. Consulta de datos
Structured Query Language (SQL) o Lenguaje de Consulta Estructurado es un
lenguaje estandarizado, ampliamente utilizado que recupera y actaliza datos en
tablas y grficas basadas en estas tablas. Si usted est familiarizado con SQL, usted
puede crear rpidamente consultas en SAS usando el procedimiento SQL en Base
SAS.
PROC SQL es la implementacin SAS de SQL. Cuando usted quiere examinar
relaciones entre valores de datos, un subconjunto de datos o calcular valores el
procedimiento SQL provee un camino fcil flexible para analizar sus datos. Usando
PROC SQL, usted puede:
Recuperar y manipular datos que estn almacenados en tablas o grficas.
Crear tablas, vistas e ndices en las columnas de las tablas.
Crear variables macro de SAS que contienen valores de las filas de los
resultados de una consulta
INV- Software de Anlisis Estadstico SAS /2013-I
27
Agregar o modificar los valores de datos en la columna de una tabla o
instertas y borrar filas. Usted tambin puede modificar la tabla misma
aadiendo, modificando o degradando columnas.
Mandar declaraciones DBMS-SQL a un sistema de administracin de base de
datos (DBMS) y recuperar datos DBMS
Usted puede usar elementos del lenguaje SAS como declaraciones globales, opciones
del data set, funciones, y formatos con PROC SQL slo si usted puede con otros
procedimientos SAS. De todas maneras, ya que PROC AQL implementa Lenguaje de
consulta estructurado, funciona de forma diferente a otros procedimientos BASE SAS.
Esta tarea se enfoca en recuperar datos desde una sola tabla (data set).
Mtodo de Point-and-Click
Usted puede unir tablas usando una interfaz point-and-click.
1. En SAS, click Tools< Query.
2. Use la ventana SQL Query para realizar uniones.
Usted puede ver y salvar el cdigo PROC SQL que la ventana de Consulta SQL
genera
Mtodo Point-and-Click
Usted puede crear consultas SQL usando una interfaz point-and-click
1. En SAS, click Tools< Query.
2. Use la ventana SQL Query para crear consultas.
Usted puede ver y salvar el cdigo PROC SQL que la ventana SQL Query genera
2.3.13. Unir tablas
Si usted ley CONSULTA DE DATOS, usted observ maneras para consultar una
sola tabla usando PROC SQL. Sin embargo, usted necesita datos a menudo desde
tablas separadas. Cuando usted especifica mltiples tablas, vistas, o expresiones de
consulta en la clausula FROM, PROC SQL, las procesa para formar una tabla. La
tabla resultante contiene datos de cada una de las tablas contribuyentes. Estas
consultas se les llaman como JOINS.
Conceptualmente, cuando usted especifica dos tablas, PROC SQL compara cada fila
de la tabla A con todas las filas de la tabla B para producir una tabla interna o
intermedia conocida como el CARTESIAN PRODUCT. El producto cartesiano
(CARTESIAN PRODUCT) de tablas largas puede ser enrome, por lo que usted quiere
enviar datos declarando el tipo de unin. A continuacin se muestran dos tipos de
uniones.
INV- Software de Anlisis Estadstico SAS /2013-I
28
Inner joins retorna una tabla resultante por todas las filas en una tabla que
tiene una o mas filas que coincidan en la otra tabla o las otras tablas.
Outer Joins son inner joins que son aumentadas con filas que no
coinciden con cualquier fila de la otra tabla en la unin. ExistenEst 3
tipos de outer joins: left, right, and full.
Esta tarea se enfoca principalmente en unir tablas.
2.3.14. Crear grficos
Una manera efectiva para examinar las relaciones entre variables es graficando sus
valores. Para producir grficos nicos o superpuestos, usted puede usar:
El procedimiento PLOT en Base SAS para visualizar datos rpidamente
El procedimiento GPLOT en el software SAS/GRAPH para producir con
calidad grficos de presentacin que incluyen colores y varias fuentes.
En adicin, usted puede crear una salida PROC GPLOT usando el SAS/GRAPH
Control for ActiveX, el cual que le permite incrustar grficos interactivos en pginas
web y documentos OLE.
La sintaxis para los dos procedimientos es muy similar, aunque PROC GPLOT ofrece
un nmero adicional de funciones de formato. Esta tarea le muestra ambos caminos
para crear varios tipos de grficos.
Usted debe tener la licencia de SAS/GRAPH para crear grficos usando PROC
GPLOT.
INV- Software de Anlisis Estadstico SAS /2013-I
29
Mtodo de Point-and-Click
a) Si usted tiene licenciado SAS/GRAPH, puede crear grficos con calidad de
presentacin usando una interfaz point-and-click
1. En SAS, click Solutions< Reporting< Graph-N-Go.
2. Click en el icono New SAS Data Set y seleccione datos para el grfico
3. Haga clic en el cono para escoger el grfico que desee y colquelo en el rea de
trabajo. Luego haga docle clic en el objeto del grfico, seleccione los datos y
especifique las variables y las opciones del grfico.
Usted puede ver y salvar el cdigo de PROC GPLOT que genera Graph-N-Go
b) Si usted tiene licenciado SAS/GRAPH y SAS/GRAPH, tambin puede crear
grficos usando Analyst Application
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abra, click File< Open by SAS Name para agregar los
datos al proyecto.
3. Luego haga clic en Graphs y escoja el tipo de grfico que quiere crear
Usted puede ver y salvar el cdigo PROC GPLOT que Analyst genera
2.3.15. Crear grficos (2)
Usted puede usar el procedimiento CHART en Base SAS para producir
Barras grficas horizontales y verticales
Grficos de bloques
Grficos circulares
Mapas estelares
Estos tipos de graficos muestran valores de una variable estadstica asociada con
sus valores. La variable graficada puede ser numerada o caracterizada.
INV- Software de Anlisis Estadstico SAS /2013-I
30
PROC CHART es una buena herramienta para visualizar datos rpidamente, pero si
usted necesita producir grficos de presentacin con calidad que incluyan varios
colores y fuentes, usted puede usar el software SAS/GRAPH. El procedimiento
GCHART en SAS/GRAPH produce los mismos tipos de grficos que PROC CHART
hace, As como un grfico de dona. En adicin, usted puede crear salidas PROC
GCHART usando el SAS/GRAPH Control for ActiveX, el cual lo conecta con grficos
interactivos en pginas web y documentos OLE.
Como usted puede ver, la sintaxis para PROC CHART y PROC GCHART es muy
similar. Esta tarea le muestra ambos caminos para crear varios tipos de grficos.
Usted debe tener la licencia de SAS/GRAPH para crear grficos usando PROC
GCHART.
Mtodo de Click-and-Point
Si usted tiene licenciado SAS/GRAPH, usted puede crear grficos de presentacin con
calidad usando una interfaz point-and-click.
1. En SAS, click Solutions< Reporting< Graph-N-Go.
2. Click en el cono New SAS Data Set o en New MDDB y seleccione los datos
para el grfico.
3. Haga clic en el cono del grfico que desee y colquelo en el rea de trabajo.
Luego haga clic en el objeto del grfico, seleccione los datos y especifique las
variables y las opciones del grfico..
Usted puede ver y salvar el cdigo PROC GCHART que genera Graph-N-Gos.
Si usted tiene licenciado SAS/GRAPH y SAS/STAT, tambien puede crear grficos
ustando Analys Application
INV- Software de Anlisis Estadstico SAS /2013-I
31
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abra, click File< Open by SAS Name para agregar datos al
proyecto
3. Luego haga clic en Graphs< Bar Chart o Graphs< Pie Chart para crear un
grfico
Usted puede ver y salvar el cdigo PROC GCHART que genera Analyst.
Siguiendo lo estipulado, se continu con el mtodo de autoexploracin del software SAS. Ya que
en este punto ya no era muy til seguir el manual de SAS (que es bastante extenso) se decidi
proseguir con regresiones simples, mltiples y series de tiempo. Con respecto a series de
tiempo, aun no se ha completado la revisin de literatura puesto que es muy extensa e inclusive
posee ms de un captulo dedicado a esto. A continuacin se encuentra lo referente a Regresin
(Declaracin REG) y lo encontrado de series de tiempo (Declaracin ARIMA
2.3.16. Regresin simple y mltiple
Considere una variable respuesta Y que puede ser predicha por una funcin polinomial
de una variable regresiva X. Usted puede estimarB0, el intercepto B1, la pendiente
debida a X y X2, la pendiente debida a X2 en:
Esto para las observaciones
Considere el siguiente ejemplo de las tendencias de crecimiento de la poblacin. La
poblacin de USA desde 1970 a 2000 se ajusta a funciones de tiempo lineales y
cuadrticas. Debe tener en cuenta que el trmino cuadrtico YearSq es creado en el
paso DATA, esto se debe hacer ya que los efectos polinmicos como Year*Year no
pueden ser especificados en la declaracin MODEL en PROC REG. Los datos son los
siguientes:
dataUSPopulation;
inputPopulation @@;
retainYear 1780;
Year = Year+10;
YearSq = Year*Year;
Population = Population/1000;
datalines;
3929 5308 7239 9638 12866 17069 23191 31443 39818 50155
62947 75994 91972 105710 122775 131669 151325 179323 203211
226542 248710 281422
;
ods graphics on;
procreg data=USPopulation plots=ResidualByPredicted;
varYearSq;
model Population=Year / r clm cli;
run;
INV- Software de Anlisis Estadstico SAS /2013-I
32
La opcin de datos garantiza que el procedimiento utiliza el conjunto de datos deseado.
Cualquier variable que se puede agregar al modelo pero que no est incluido en el
primer modelo de declaracin debe aparecer en la declaracin VAR.
A continuacin se muestra el anlisis de varianza y los parmetros estimados:
El modelo estadstico F es significante (F=228.92, p
INV- Software de Anlisis Estadstico SAS /2013-I
33
residuo se muestra en un grfico impreso. Los residuos estudentizados siguen una
distribucin T y pueden ser usados para identificar observaciones de salida o extremas.
Los asteriscos (*) que se extienden ms all de las lneas de trazos indican que el
residuo es ms de 3 errores estndar desde 0. Muchas observaciones tienen residuos
estudentizados que son absolutos y son ms que 2, podran indicar un modelo
inadecuado. Cooks D es una medida del cambio en los valores predichos a la supresin
de esa observacin desde el data set, por lo que se mide la influencia de la observacin
de los coeficientes de regresin estimados.
INV- Software de Anlisis Estadstico SAS /2013-I
34
La siguiente tabla muestra las estadsticas residuales. Un acuerdo bastante estrecho
entre la estadstica PRESS y la Suma de Cuadrados Residuales indica que el MSE es
una medida razonable de la exactitud predictiva del modelo ajustable (Neter,
Wasserman, and Kutner 1990).
Las representaciones grficas son de gran ayuda en la interpolar la informacin en la
tabla de Estadstica de Salida. Cuando usted habilita los grficos ODS, el
procedimiento REG produce un set por defecto de los grficos de diagnstico que son
apropiados para el anlisis solicitado.
INV- Software de Anlisis Estadstico SAS /2013-I
35
Estos son los grficos que se muestran:
Las graficas residual y studentized residual versus el valor predicho muestra
un patrn cuadrtico.
La grafica studentized versus leverage parece indicar que existen 2 puntos de
datos alejados. Sin embargo, el grfico de la distancia Cooks D versus el numero de observaciones revela que estos 2 puntos estn en los puntos finales
de los aos 1790 y 2000. Estos puntos se muestran con una aparente lejana
porque la salida del modelo lineal desde la lnea por debajo del comportamiento
cuadrtico en los datos se muestran ms fuertes en esos puntos finales.
El grfico del cuantil normal de los residuos y el histograma residual nos son
consistentes con la asuncin de los errores Gaussianos. Esto ocurre ya que
como los propios residuos todava contienen el comportamiento cuadrtico, este
no es capturado por el modelo lineal.
El grfico de la variable dependiente contra el valor predicho exhibe una forma
cuadrtica alrededor del grado 45 en la lnea que representa un ajuste perfecto
El grfico Residual-Fit (RF) consiste en un grfico de cuantiles lado-a-lado de los ajustes centrales y los residuos muestran que la dispersin en los residuales
no es mejor que la dispersin de los ajustes centrado. Para modelos
INV- Software de Anlisis Estadstico SAS /2013-I
36
inapropiados, la dispersin de los residuos es a menudo mejor que la dispersin
del ajuste centrado. En este caso, el grfico RF muestra que el modelo linear en
efecto, captura la tendencia creciente de los datos, y por lo tanto cuenta con
gran parte de la variacin en la respuesta.
2.3.17. ARIMA
Introduccin
ARIMA es referenciado normalmente como modelos BOX and Jenkins
La declaracin ARIMA provee un set de herramientas para la identificacin de modelos
de series de tiempo univariadas, estimacin de variables, pronsticos, por ultimo ofrece
una gran flexibilidad en los tipos de modelos ARIMA y ARIMAX que pueden ser
analizados.
El diseo de PROC ARIMA sigue muy de cerca la estrategia de Box-Jenkins para el
modelamiento de series de tiempo con caractersticas para la identificacin, estimacin
y chequeo de diagnsticos, y pasos de pronosticacin del mtodo Box-Jenkins
LAS 3 ETAPAS DEL MODELAMIENTO ARIMA
El anlisis realizado por PROC ARIMA est dividido en 3 etapas, que corresponden a
las etapas descritas en Box y Jenkins
1) En la etapa de Identificacin, se utiliza la declaracin IDENTIFY para
especificar la serie respuesta e identificar el modelo candidato ARIMA para
ello. La declaracin IDENTIFY lee series de tiempo que son usadas en
declaraciones despus, posiblemente diferencindolas y computando auto
correlaciones, auto correlaciones inversas, auto correlaciones parciales y
correlaciones cruzadas. Los test estacionarios pueden ser realizados para
determinar si es necesario diferenciar es necesario. El anlisis de la declaracin
de salida IDENTIFY usualmente sugiere uno o ms modelos ARIMA que
pueden ser ajustados. Las opciones le permiten activar test para la
identificacin estacionaria y tentativa de los ordenes ARIMA.
2) En la etapa de estimacin y chequeo de diagnsticos, se usa la declaracin
ESTIMATE para el modelo ARIMA para ajustar la variable especificada en la
declaracin IDENTIFY y estima los parmetros de ese modelo. La declaracin
ESTIMATE tambin produce estadsticas de diagnstico para ayudar a juzgar
el modelo adecuado. Los test de significancia para parmetros estimados estima
indica si algunos trminos en el modelo pueden ser innecesarios. ayudaen la
comparacin deeste modelo paralos dems. Estadsticas de Goodness-of-fit
ayuda en la comparando estos modelos con otros. Los tests de residuos de ruido
blanco indican si las series de residuos contiene informacin adicional que
puede ser usada por un modelo ms complejo. La declaracin OUTLIER provee
otra herramienta muy til para chequear si el modelo actualmente estimado
tiene en cuenta todas las variaciones en las series. Si los tests de diagnstico
indica problemas con el modelo, puede tratar de implementar otro modelo y
luego repetir las etapas de estimacin y de chequeo de diagnsticos.
INV- Software de Anlisis Estadstico SAS /2013-I
37
3) En la etapa de pronstico, se usa la declaracin FORECAST para pronosticar
valores futuros de las series de tiempo y tambin para generar intervalos de
confianza para estos pronsticos desde el modelo ARIMA producido por la
declaracin ESTIMATE.
Estas tres etapas son explicadas e ilustradas a travs de un ejemplo extendido en las
siguientes secciones.
ETAPA DE IDENTIFICACIN
Suponga que usted tiene una variable llamada SALES que quiere pronosticar. El
siguiente ejemplo ilustra el modelamiento ARIMA y su pronosticacin utilizando un
data set simulado TEST que contiene una serie de tiempo SALES generada por el
modelo ARIMA (1,1,1). La salida produce este ejemplo que est explicado en las
prximas secciones. A continuacin se muestra las series de SALES en la figura.
procsgplot data=test;
scatter y=sales x=date;
run;
USANDO LA DECLARACIN IDENTIFY
Primero debe especificar el data set de entrada en la declaracin PROC ARIMA. Luego
debe usar una declaracin IDENTIFY para leer y analizar en las series SALES las
propiedades de correlacin. Para hacer esto se utilizan las siguientes declaraciones.
INV- Software de Anlisis Estadstico SAS /2013-I
38
procarima data=test ;
identifyvar=sales nlag=24;
run;
Estadstica Descriptiva La declaracin IDENTIFY primero imprime estadsticas descriptivas para las series
SALES. Esta parte de la declaracin IDENTIFY muestra lo siguiente:
The ARIMA Procedure
Name of Variable = sales
Mean of Working Series 137.3662
Standard Deviation 17.36385
Number of Observations 100
Grficos de funciones de Autocorrelacin
La declaracin IDENTIFY despus produce un panel de grficos usados para el
anlisis de auto-correlacin y de tendencia. El panel contiene los siguientes grficos:
El grfico de series de tiempo de las series de SALES
El grfico de muestra de la funcin de auto-correlacin (ACF)
El grfico de muestra de la funcin inversa de autocorrelacin (IACF)
El grfico de la muestra de la funcin parcial de auto-correlacin (PACF)
Este anlisis de correlacin se muestra a continuacin.
Estos grficos de funciones de auto-correlacin muestra el grado de correlacin con los
valores pasados de las series como una funcin de nmeros de periodos en el pasado
(que es el lag) en el que se calcula la correlacin.
INV- Software de Anlisis Estadstico SAS /2013-I
39
La opcin NLAG= controla el numero de lags para los que se muestran las auto-
correlaciones. Por defecto, las funciones de auto-correlacin son graficadas para lag 24.
Existe otra seccin que habla de la funcin inversa de correlacin:
TheInverseAutocorrelationFunction en la pgina 234.
Para examinar estos grficos, usted puede determinar si las series son estacionarias o
no estacionarias. En este caso una inspeccin visual del grfico de la funcin de auto-
correlacin indica que las series SALES no es estacionaria, desde que ACF decae muy
despacio. Para un test ms formal, use la opcin STATIONARITY= (pgina 207).
Test White Noise (Ruido Blanco)
La ltima parte de la declaracin de salida IDENTIFY es el chequeo del ruido blanco.
Esto es un test estadstico aproximado de las hiptesis que no son auto-correlacionadas
en las series hasta un desfase dado y que son significativamente diferentes a 0. Si esto
es verdad para todos los lags, entonces no hay informacin en las series para el modelo,
y ningn modelo ARIMA se necesita para las series.
Las auto-correlaciones son chequeadas en grupos de 6, y el nmero de lagas chequeados
dependen de la opcin NLAG=. Esto se muestra en lo siguiente:
En este caso, la hiptesis de ruido blanco es rechazada de manera fuerte, donde se
espera que las series no sean estacionarias. El valor p para el test de las primeras seis
auto-correlaciones es impreso como
INV- Software de Anlisis Estadstico SAS /2013-I
40
La segunda declaracin produce la misma informacin que la primera, pero con el
cambio que en SALES va desde un periodo al otro, en lugar del total de SALES en cada
periodo. Las estadsticas sumatorias de salida de esta declaracin IDENTIFY se
muestra a continuacin. Note que el periodo de diferenciacin se da como 1. Y una
observacin se pierde a travs de la operacin de diferenciacin:
Los grficos de auto-correlacin se muestran a continuacin.
El grado de auto-correlacin decae rpidamente en este grfico, indicando que el cambio
en SALES es una serie de tiempo estacionaria.
INV- Software de Anlisis Estadstico SAS /2013-I
41
EJEMPLOS DE ARIMA
PRIMER EJEMPLO: Modelo IMA simulado
Este ejemplo ilustra los resultados de un procedimiento ARIMA para un caso donde los
modelos reales son conocidos. UN modelo de promedio mvil integrado se utiliza para
esta ilustracin.
Los siguientes DATA step generan una muestra pseudo-aleatoria de 100 periodos del
procedimiento ARIMA(0.1.1); :
title1 'Simulated IMA (1, 1) Series';
data a;
u1 = 0.9; a1 = 0;
do i = -50 to 100;
a = rannor( 32565 );
u = u1 + a - .8 * a1;
if i > 0 then output;
a1 = a;
u1 = u;
end;
run;
El siguiente procedimiento de declaraciones ARIMA identifica y estima el modelo:
/*-- Simulated IMA Model --*/
procarima data=a;
identifyvar=u;
run;
identifyvar=u(1);
run;
estimate q=1 ;
run;
quit;
El grfico de anlisis de correlacin de series de salida en la primera declaracin se
muestra a continuacin. La salida muestra el comportamiento de la muestra de la
funcin de auto-correlacin cuando el proceso no es estacionario. Note que en este caso
las auto-correlaciones estimadas no son muy altas, incluso en pequeos lags. La no
estacionalidad es reflejada en un patrn de auto-correlaciones significativas que no
declinan rpidamente con el lag creciente, no en el tamao de las auto-correlaciones.
INV- Software de Anlisis Estadstico SAS /2013-I
42
La segunda declaracin de IDENTIFY diferencia las series. Los resultados se muestran
a continuacin. Esta salida muestra la auto correlacin, su inversa y la funciones
parciales de auto-correlacin tpicas del proceso MA(1)
INV- Software de Anlisis Estadstico SAS /2013-I
43
La declaracin ESTIMATE ajusta un modelo ARIMA (0,1,1) a los datos simulados. Note
que en este caso, el parmetro estimado es razonablemente cercano a los valores usados
para generar la base de datos simulada.
. El grfico de anlisis de los residuos no muestra un modelo inadecuado (son los
correspondientes a lo seguido de lo que aparece a continuacin).
Los resultados de la declaracin ESTIMATE son:
Y los grficos son:
INV- Software de Anlisis Estadstico SAS /2013-I
44
2.3.18. Datos Panel
El procedimiento PANEL analiza una clase de modelos lineales economtricos que
comnmente surgen cuando se combinan series de tiempo y datos transversales. Este
tipo de datos agrupados en series de tiempo con datos transversales son normalmente
referidos como DATOS PANEL. Ejemplos tpicos de datos panel incluyen observaciones
a travs del tiempo en hogares, pases, empresas comercio entre otras. Por ejemplo, en
el caso del caso de los datos de las encuestas sobre los ingresos familiares, el panel se
crea mediante una encuesta en varias ocasiones a los mismos hogares en diferentes
perodos de tiempo (aos).
Los modelos de datos panel pueden ser agrupados en diferentes categoras dependiendo
de la estructura del trmino de error. El procedimiento PANEL utiliza las siguientes
estructuras de error y los mtodos correspondientes para analizar datos:
Modelos de un camino y de dos caminos (one-way y two-way)
Modelos de Efectos Fijos y Efectos Aleatorios
Modelos auto-regresivos
Modelos de media mvil
Un modelo de un-camino depende slo de la seccin transversal a la que pertenece la
observacin. El modelo de dos-caminos depende tanto de la seccin transversal como del
periodo de tiempo a la que pertenece la observacin.
Los modelos son referidos como Modelos de efectos fijos si los efectos no son aleatorios o
modelos de efectos aleatorios si son lo contrario.
Si los efectos son fijos, los modelos son esencialmente modelos de regresiones con
variables Dummy que corresponden a los efectos especficos. Para modelos de efectos
aleatorios, la estimacin por mnimos cuadrados ordinarios es el mejor estimador lineal
(OLS). Los modelos EA (efectos aleatorios) usan un enfoque de dos etapas. En la
primera etapa, los componentes de varianza son calculados usando mtodos descritos
por Fuller y Batteste (1974), Wansbeek and Kapteyn (1984), Wallace and Hussain
(1969), or Nerlove (1971). En la segunda etapa los componentes de varianza son usados
para estandarizar los datos, y se realiza una regresin de mnimos cuadrados ordinarios
(OLS).
Dos tipos de modelos en el procedimiento PANEL se acomodan en una estructura auto-
regresiva: El mtodo Parks estima un modelo auto-regresivo de primer orden con
correlaciones contemporneas, y el estimador panel dinmico estima un modelo auto-
regresivo con variables dependientes retrasadas.
El mtodo Da Silva estima un proceso de error de media mvil de la varianza del
componente mixto. Los parmetros de regresin son estimados usando un estimador de
ltimos cuadrados de dos pasos genralizados (GLS)
PRIMER EJEMPLO: Analizano la demanda para bienes liquidos
En este ejemplo, las ecuaciones para bienes lquidos son estimadas. La funcin de
demanda para los depsitos de demanda es estimada bajo tres estructuras de error
INV- Software de Anlisis Estadstico SAS /2013-I
45
mientras las ecuaciones de demanda para los depsitos de tiempo y acciones de ahorro y
prstamo (S&L) se calculan utilizando el mtodo de Parks. El data para siete estados
(CA, DC, FL, IL, NY, TX, Y WA) son seleccionados de 49 estados. Busque Feige (1964)
para la descripcin de los datos. Todas las variables son transformadas por un
logaritmo natural. El data set A se muestra acontinuacin:
data a;
length state $ 2;
input state $ year d t s y rd rt rs;
label d = 'Per Capita Demand Deposits'
t = 'Per Capita Time Deposits'
s = 'Per Capita S & L Association Shares'
y = 'Permanent Per Capita Personal Income'
rd = 'Service Charge on Demand Deposits'
rt = 'Interest on Time Deposits'
rs = 'Interest on S & L Association Shares';
datalines;
CA 1949 6.2785 6.1924 4.4998 7.2056 -1.0700 0.1080 1.0664
CA 1950 6.4019 6.2106 4.6821 7.2889 -1.0106 0.1501 1.0767
CA 1951 6.5058 6.2729 4.8598 7.3827 -1.0024 0.4008 1.1291
CA 1952 6.4785 6.2729 5.0039 7.4000 -0.9970 0.4492 1.1227
CA 1953 6.4118 6.2538 5.1761 7.4200 -0.8916 0.4662 1.2110
CA 1954 6.4520 6.2971 5.3613 7.4478 -0.6951 0.4756 1.1924
DC 1949 6.6587 6.1879 4.4893 7.1570 -0.9999 0.4545 1.1234
DC 1950 6.6666 6.5555 4.9999 7.2222 -1.0000 0.4897 1.0054
DC 1951 6.5058 6.2729 4.8598 7.3827 -1.0024 0.4008 1.1291
DC 1952 6.4785 6.2729 5.0039 7.4000 -0.9970 0.4492 1.1227
DC 1953 6.4118 6.2538 5.1761 7.4200 -0.8916 0.4662 1.2110
DC 1954 6.4520 6.2971 5.3613 7.4478 -0.6951 0.4756 1.1924
Los ltimos datos me los invent para qu la simulacin corriera
Como se muestra en las siguientes declaraciones, el Procedimiento SORT es usado para
ordenar los datos en el formato requerido para las series de tiempo cruzadas
transversalmente, luego el Procedimiento PANEL analiza los datos:
proc sort data=a;
by state year;
run;
proc panel data=a;
model d = y rd rt rs / fuller parks dasilva m=7;
model t = y rd rt rs / parks;
model s = y rd rt rs / parks;
id state year;
run;
Las elasticidades de ingreso de los activos liquidos son mejores que 1 excepto para el
depsito de la elasticidad de ingreso de la demanda (0,692757) estimada por el mtodo
Da Silva. En las tres primeras salidas, el coeficiente estimado (-0.29094, -0.43591 y -
0.27736) del depsito de demanda (RD) implica que los depsitos de demanda
aumentan significativamente a medida que se reduce el cargo de servicio es reducido.
INV- Software de Anlisis Estadstico SAS /2013-I
46
LA elasticidad del precio (0.227152 y 0.408066) para los depsitos de tiempo (RT) y las
acciones de asociacin S&L tienen el signo esperado Por lo tanto un aumento en la tasa
de inters de los depsitos a plazo o de acciones de S & L incrementar la demanda de
activos lquidos correspondientes. Los depsitos de demanda y las acciones S&L
aparece para ser sustitutos (observe las salidas 2, 3 y 5). Los depsitos a plazo son
tambin sustitutos de acciones S & L en la ecuacin de demanda de depsitos a plazo
(salida 4), mientras estos activos liquidos son independientes el uno al otro en la salida
5 (el coeficiente estimado en RT -0.02705). Los depsitos de demanda y los depsitos a
plazo parecen ser dbiles complementos en la salida 3 y 4, mientras las elasticidades
cruzadas entre depsitos a la vista y depsitos a plazo no son significativos en las
salidas 2 y 5
INV- Software de Anlisis Estadstico SAS /2013-I
47
SALIDA 1. La demanda de depsitos a la vista, Mtodo de Fuller-Battese
INV- Software de Anlisis Estadstico SAS /2013-I
48
SALIDA 2. La demanda de depsitos a la vista, el mtodo deParks
INV- Software de Anlisis Estadstico SAS /2013-I
49
SALIDA 3. La demanda de depsitos a la vista, el mtodo de DaSilva
INV- Software de Anlisis Estadstico SAS /2013-I
50
SALIDA 4. La demanda de depsitos a plazo, Mtodo de Parks
INV- Software de Anlisis Estadstico SAS /2013-I
51
SALIDA 5. La demanda de Ahorro y Prstamo Acciones, Mtodo de Parks
EJEMPLO 2. Datos de costos de una Aerolnea: Modelo
Esta base de datos es citada constantemente, ya que mide costos, precios de entrada y
las tasas de utilizacin de seis aerolneas por un periodo de 14 aos (1970-1984). Este
ejemplo analiza las transformaciones logartmicas del costo, precio y cantidad, y la
medida de utilizacin de la capacidad en bruto (sin ligaritmo). Se especula el siguiente
modelo:
Donde son los efectos transversales puros y son los efectos de tiempo. El modelo
actual especulado no es lineal en las variables originales. Se podra ver como la
siguiente forma:
INV- Software de Anlisis Estadstico SAS /2013-I
52
La data y las declaraciones preliminares de SAS son:
data airline;
input Obs I T C Q PF LF;
label obs = "Observation number";
label I = "Firm Number (CSID)";
label T = "Time period (TSID)";
label Q = "Output in revenue passenger miles (index)";
label C = "Total cost, in thousands";
label PF = "Fuel price";
label LF = "Load Factor (utilization index)";
datalines;
1 1 1 1140640 .952757 106650 .534487
2 1 2 1215690 .986757 110307 .532328
3 1 3 1309570 1.091980 110574 .547736
4 1 4 1511530 1.175780 121974 .540846
5 1 5 1676730 1.160170 196606 .591167
6 1 6 1823740 1.173760 265609 .575417
7 1 7 2022890 1.290510 263451 .594495
8 1 8 2314760 1.390670 316411 .597409
9 1 9 2639160 1.612730 384110 .638522
10 1 10 3247620 1.825440 569251 .676287
11 1 11 3787750 1.546040 871636 .605735
12 1 12 3867750 1.527900 997239 .614360
13 1 13 3996020 1.660200 938002 .633366
14 1 14 4282880 1.822310 859572 .650117
15 1 15 4748320 1.936460 823411 .625603
16 2 1 569292 .520635 103795 .490851
17 2 2 640614 .534627 111477 .473449
18 2 3 777655 .655192 118664 .503013
19 2 4 999294 .791575 114797 .512501
20 2 5 1203970 .842945 215322 .566782
21 2 6 1358100 .852892 281704 .558133
22 2 7 1501350 .922843 304818 .558799
23 2 8 1709270 1.000000 348609 .572070
24 2 9 2025400 1.198450 374579 .624763
25 2 10 2548370 1.340670 544109 .628706
26 2 11 3137740 1.326240 853356 .589150
27 2 12 3557700 1.248520 1003200 .532612
28 2 13 3717740 1.254320 941977 .526652
29 2 14 3962370 1.371770 856533 .540163
30 2 15 4209390 1.389740 821361 .528775
31 3 1 286298 .262424 118788 .524334
32 3 2 309290 .266433 123798 .537185
33 3 3 342056 .306043 122882 .582119
34 3 4 374595 .325586 131274 .579489
35 3 5 450037 .345706 222037 .606592
36 3 6 510412 .367517 278721 .607270
37 3 7 575347 .409937 306564 .582425
38 3 8 669331 .448023 356073 .573972
39 3 9 783799 .539595 378311 .654256
INV- Software de Anlisis Estadstico SAS /2013-I
53
40 3 10 913883 .539382 555267 .631055
41 3 11 1041520 .467967 850322 .569240
42 3 12 1125800 .450544 1015610 .589682
43 3 13 1096070 .468793 954508 .587953
44 3 14 1198930 .494397 886999 .565388
45 3 15 1170470 .493317 844079 .577078
46 4 1 145167 .086393 114987 .432066
47 4 2 170192 .096740 120501 .439669
48 4 3 247506 .141500 121908 .488932
49 4 4 309391 .169715 127220 .484181
50 4 5 354338 .173805 209405 .529925
51 4 6 373941 .164272 263148 .532723
52 4 7 420915 .170906 316724 .549067
53 4 8 474017 .177840 363598 .557140
54 4 9 532590 .192248 389436 .611377
55 4 10 676771 .242469 547376 .645319
56 4 11 880438 .256505 850418 .611734
57 4 12 1052020 .249657 1011170 .580884
58 4 13 1193680 .273923 951934 .572047
59 4 14 1303390 .371131 881323 .594570
60 4 15 1436970 .421411 831374 .585525
61 5 1 91361 .051028 118222 .442875
62 5 2 95428 .052646 116223 .462473
63 5 3 98187 .056348 115853 .519118
64 5 4 115967 .066953 129372 .529331
65 5 5 138382 .070308 243266 .557797
66 5 6 156228 .073961 277930 .556181
67 5 7 183169 .084946 317273 .569327
68 5 8 210212 .095474 358794 .583465
69 5 9 274024 .119814 397667 .631818
70 5 10 356915 .150046 566672 .604723
71 5 11 432344 .144014 848393 .587921
72 5 12 524294 .169300 1005740 .616159
73 5 13 530924 .172761 958231 .605868
74 5 14 581447 .186670 872924 .594688
75 5 15 610257 .213279 844622 .635545
76 6 1 68978 .037682 117112 .448539
77 6 2 74904 .039784 119420 .475889
78 6 3 83829 .044331 116087 .500562
79 6 4 98148 .050245 122997 .500344
80 6 5 118449 .055046 194309 .528897
81 6 6 133161 .052462 307923 .495361
82 6 7 145062 .056977 323595 .510342
83 6 8 170711 .061490 363081 .518296
84 6 9 199775 .069027 386422 .546723
85 6 10 276797 .092749 564867 .554276
86 6 11 381478 .112640 874818 .517766
87 6 12 506969 .154154 1013170 .580049
88 6 13 633388 .186461 930477 .556024
89 6 14 804388 .246847 851676 .537791
90 6 15 1009500 .304013 819476 .525775
;
INV- Software de Anlisis Estadstico SAS /2013-I
54
data airline;
set airline;
lC = log(C);
lQ = log(Q);
lPF = log(PF);
label lC = "Log transformation of costs";
label lQ = "Log transformation of quantity";
label lPF= "Log transformation of price of fuel";
run;
Las siguientes declaraciones ajustan el modelo
proc panel data=airline printfixed;
id i t;
model lC = lQ lPF LF / fixtwo;
run;
Primero, se puede ver la descripcin del modelo en la primera salida. Es un modelo de
efectos ajustados two-way. Ac existen 6 observaciones transversales y quince
observaciones de tiempo
Base de datos de costos de Aerolneas-Descripcin del Modelo
El R cuadrado y los grados de libertad se pueden ver en la siguiente tabla. En el hueco,
se ve un largo R cuadrado, por lo que es un ajuste razonable. Los grados de libertad
para la estimacin son 90 menos 14 variables dummy menos 5 variables dummy
transversales y 4 regresores:
Estadsticas Ajustadas de Los costos de la Aerolnea
El test F para efectos ajustados se muestra en la siguiente tabla. Evaluando la
hiptesis que dice que no hay efectos no ajustados, usted puede rechazar fcilmente la
INV- Software de Anlisis Estadstico SAS /2013-I
55
nulidad da las agrupaciones. Hay efectos de grupo, o efectos de tiempo, o ambas. El
test es altamente significativo. OLS no darn resultados razonables
Test para Efectos Ajustados
Observando los parmetros, se ve un patrn ms complicado. La mayora de los efectos
transversales son altamente significativos (con excepcin de CS2). Esto quiere decir que
las secciones transversales son significativamente diferentes de la sexta seccin
transversal. Muchos de los efectos de tiempo muestran significancia, pero este no es
uniforme. Se ve como que la significancia puede ser impulsada por un largo efecto en el
periodo 16, desde los primeros seis efectos de tiempo son negativos y de una magnitud
similar. Las variables dummy de tiempo disminuyen en tamano y pierden
significancia desde el periodo 12. Existen muchas causas a las cuales se le puede
atribuir esta decada de los efectos del tiempo. El perodo de tiempo de los datos se
extiende por los embargos de petrleo OPEP y la disolucin de la Junta de Aeronutica
Civil (CAB). Estas tos fuerzas son dos posibles razones para