Upload
joanny-ibarbia-pardo
View
720
Download
0
Embed Size (px)
Citation preview
Continuar
SPSS versión 22 para ingenieros
MSc. Joanny Ibarbia Pardo
El SPSS se inicia siempre ofreciendo la imagen, similar a una hoja de cálculo, del Editor de Datos. Este Editor dispondrá las variables en columnas y los casos en filas. Nuestro primer objetivo será definir el fichero de datos y almacenar esos datos en el editor.
El archivo de datos puede crearse directamente en SPSS o importarse ya creado de otro programa, normalmente de una hoja de cálculo. La definición de las variables será, sin embargo, una tarea a realizar obligatoriamente en el SPSS.
Los datos se observan en la pantalla "Vista de Datos" de SPSS en una presentación muy similar a una hoja de cálculo clásica: casos ocupan filas y variables ocupan columnas.
Obtención de datos e introducción directa en SPSS
Comenzando por la captura externa, para importar un archivo de hoja de cálculo debe seleccionarse el tipo xls en el cuadro “Abrir” del menú “Archivo”. Una vez elegido el archivo de datos debe indicarse al SPSS si la primera fila del archivo de excel contiene cabeceras de columnas (es decir, nombre de las variables) y el rango a leer en la misma si los datos que desea leer de la hoja de cálculo no comienzan en la primera fila ni en la primera columna.
Obtención de datos e introducción directa en SPSS
Para introducir directamente los datos en SPSS deberán completarse, para cada variable los siguientes pasos:
1. Asignar un nombre y una etiqueta a la variable
2. Identificar el tipo de variable
3. Definir sus posibles valores y las etiquetas de los mismos
4. Definir el o los valores perdidos
Crear un archivo de datos
Crear un archivo de datos
Crear una variable a partir de las ya existentes
Seleccionar un subconjunto de casos que verifiquen una condición
Seleccionar un subconjunto de casos que verifiquen una condición
Medidas descriptivas
Agrupación visual
Agrupación visual
Otras formas de obtener estadísticos y representaciones gráficas
Otras formas de obtener estadísticos y representaciones gráficas
Otras formas de obtener estadísticos y representaciones gráficas
Nro. Salario Nro. Salario Nro. Salario Nro. Salario Nro. Salario
1234567891011121314151617181920
156.23196.25205.45158.25185.40452.60350.75256.45444.25258.65357.25365.10365.80456.85290.45280.70260.50255.26235.62256.80
2122232425262728293031323334353637383940
255.40305.25325.65285.60450.15350.60358.50465.25199.20256.30128.12246.12150.36125.65145.60175.50185.60195.40201.30231.20
4142434445464748495051525354555657585960
235.60239.20245.60246.30256.50264.30268.90287.50265.25369.15321.50362.30351.20365.56365.20326.50410.50410.30415.20352.60
6162636465666768697071727374757677787980
256.30125.60128.35135.60450.00460.00480.52495.60485.60500.60580.60630.50630.00610.00575.00580.00620.00750.60740.00520.60
81828384858687888990919293949596979899100
546.20580.00250.60150.60240.30250.15256.30280.60260.50290.55295.55300.25315.60350.90125.30125.60230.00236.50245.30156.50
Ejemplo 1. Los siguientes datos representan los salarios mensuales de 100 trabajadores de un taller automotriz de Cochabamba.
Se pide, utilizando el SPSS 22.0:a) Seleccione una muestra de un 30 % de la Población.b) A partir de esta muestra aleatoria construya un intervalo para ,
con un 95 % de confiabilidad.
Definiendo la variable Salarios
Introducidos los datos, seleccione Datos, para obtener los salarios correspondientes a los números aleatorios generados por el SPSS.
En Datos click en Seleccionar casos …
Active el botón de Muestra aleatoria de casos
Presione la tecla Ejemplo, para indicar el porciento de la población que integrará la muestra aleatoria
Seleccionemos aproximadamente el 30 % de la población, escribiendo con el teclado, en la ventana que se indica , el por ciento deseado y dando click en Continuar posteriormente.
Click en Aceptar
Observa que algunos datos están tachados; esos no forman parte de la muestra aleatoria. Ya tenemos la muestra aleatoria, ahora comenzamos a construir el intervalo de confianza para la media población con un 95 % de seguridad.
Estimación puntual e intervalos de confianza
Estimación: Averiguar los valores de los parámetros poblacionales a partir de los valores de los estadísticos muestrales de dichas poblaciones. Se puede hacer:
· Puntual: un único valor.
· Por intervalo: Margen de valores dentro del cual se tiene la confianza de que se encuentre el parámetro estimado
A partir de la observación de un conjunto de datos obtenidos en condiciones independientes y tales que siguen una distribución con forma conocida, pero con parámetros desconocidos, la estimación puntual consiste es estimar dichos parámetros.La información proporcionada por la estimación puntual es, en general, insuficiente, por lo que una alternativa es proporcionar un intervalo tal que, con una probabilidad fijada a priori, contenga al verdadero valor del parámetro. El intervalo de confianza para un parámetro al nivel de confianza Ψ = 1 – α es el intervalo de longitud mínima tal que contiene al verdadero valor del parámetro con una probabilidad igual a Ψ. A Ψ se le conoce como nivel de confiabilidad de la estimación y a α como nivel de significación.
Las propiedades clásicas de los buenos estadísticos – estimadores son: · Estimadores insesgados.· Estimadores consistente.· Estimadores eficiente.· Estimadores suficientes.
nzx
nzx
21
21
;
nsntx
nsntx 1;)1(
21
21
nqpzp
nqpzpp
ˆˆˆ;ˆˆˆ
21
21
2
)1(2
2
2
)1(2
1
22 1;1
nn
snsn
Intervalos de confianza para 2,, pPara (Media poblacional)
Para P (Proporción poblacional)
Para la (Varianza poblacional) 2
Conocida 2
Desconocida 2
Ya tenemos la muestra aleatoria, ahora comenzamos a construir el intervalo de confianza para la media poblacional con un 95 % de seguridad. Activa Analizar.
Intervalos de Confianza de con el uso del SPSS 22.0
Active Estadísticos descriptivos y Explorar..., haciendo clic en esta última
Oprima el botón que se te indica para introducir la variable Salarios en la ventana Lista de dependientes:
Oprima el botón Estadísticos …
Observa que el nivel de confianza implícito es de un 95 %, si quiere puedes cambiarlo. Dejémoslo. Luego Continuar.
Active Gráficos...
Active Ninguna
Desmarque la opción que se te señala
Active Histogramas
Continuar
Aceptar
Observa que fueron seleccionado aleatoriamente 38 salarios y todos son válidos.
Expliquemos esta tabla en la próxima diapositiva
El límite inferior del intervalo = 280.1355, El límite inferior del intervalo = 381.6034. Por lo tanto: con un 95 % de confiabilidad. 6034.381;1355.280
Este es el histograma de frecuencias
Un estadígrafo muy importante y necesario para cualquier análisis estadístico es la descripción de frecuencia que permite: tener información acerca del rango de valores de la variable, número de casos válidos, número de casos sin información y las veces que se repite cada valor que tiene esa variable en la base de datos.
Nota: De ahora en adelante suponemos que estamos en el Editor de texto del SPSS y con la base de datos satisf .sav abierta.
La forma más directa de obtener una frecuencia de variables es la siguiente: Analizar / Estadísticos descriptivos / Frecuencias
Elegida esa secuencia de menús obtenemos la siguiente Pantalla:
En el cuadro de la izquierda de la pantalla aparece el listado de todas las variables que contiene la base de datos, es necesario seleccionar las variables de las cuales se desea obtener la distribución de frecuencia y luego se elige la opción de aceptar.
Obtengamos la distribución de frecuencias de la variable satisfacción con la variedad. Como resultado obtenemos la siguiente tabla:
Análisis de regresión en SPSS versión 22
El análisis de regresión está relacionado con el estudio de la dependencia de una variable, la variable dependiente , de una o más variables adicionales, las variables explicativas, con la perspectiva de estimar y/o predecir el valor (poblacional) medio o promedio de la primera en términos de valores conocidos o fijos ( en muestreos repetidos) de las segundas. Algunas situaciones en donde es recomendable aplicar el Análisis de Regresión son las siguientes: -Conocidas las edades y las estaturas de un grupo de estudiantes, se puede estimar la estatura promedio que corresponde a una edad determinada.
-Se puede estar interesado en estudiar la dependencia que existe entre los gastos personales de consumo y el ingreso personal real.
-Conocer la demanda de un producto ante los cambios en el precio.
-Se puede conocer la dependencia existente entre los niveles de producción de una fábrica y la productividad de sus trabajadores.
-Conocer la dependencia existente entre el rendimiento de un motor y el consumo de combustible del mismo.
.
Ejemplo 1.
En una fábrica de Lamborghini Aventador LP 700-4b se selecciona una muestra aleatoria de 15 trenes de potencia dentro de los que resultaron defectuosos luego de las pruebas de calidad realizadas, con el fin de estimar su velocidad de aceleración atendiendo al tiempo de cambio de su caja de velocidad.
Análisis de regresión en SPSS versión 22Velocidad de aceleración (km/h) (Y)
Tiempo de cambio (milisegundos) (X)
90 45,095 47,593 46,594 47,090 45,092 46,093 46,595 47,597 48,598 49,099 49,591 45,595 47,597 48,593 46,5
a)Ajuste los datos al modelo:b)Verifique el supuesto de Normalidad de
los residuos o errores.
xY 10
Diagrama de dispersión o nube de puntos
Antes de seleccionar el modelo matemático para ajustar las observaciones de los datos, es recomendable obtener la representación gráfica de los valores de Y ( estaturas) frente a los valores de x (edades) o sea, el diagrama de dispersión, el cual nos permite visualizar la tendencia de los datos y así poder seleccionar el modelo matemático que mejor puede ajustarse a la nube de puntos.
Veamos como se procede utilizando el SPSS versión 22 en la representación gráfica de la nube de puntos.
Active la opción Gráficos
Diagrama de dispersión o nube de puntos
Diagrama de dispersión o nube de puntos
Luego de ir a Gráficos , seleccionar Gráficos de variables de regresión
Diagrama de dispersión o nube de puntos
Se observa en el diagrama de dispersión, que a medida que aumenta el tiempo de cambio (x), aumenta también la Velocidad de aceleración (y). Se podría ajustar una línea recta a esa nube de puntos y la recta que se obtiene utilizando el método de los mínimos cuadrados es la que pasa justamente por el centro de la nube de puntos.
En el caso de una única variable independiente, X, se habla de regresión lineal simple. La correspondiente ecuación de regresión será del tipo: XY 10
Y, en particular, para cada observación:
iii xy 10 Ni ,....,2,1En nuestro caso, se trata de obtener una función lineal de la variable independiente tiempo de cambio (x) que permita estimar la velocidad de aceleración (y), para cualquier estudiante i:
iii tiempoVelocidad 10
Donde son parámetros desconocidos a estimar y los proceden de variables independientes, normales, de media 0 y la misma varianza.
10 ,
El criterio para obtener los coeficientes de regresión b0 y b1 estimaciones de los parámetros B0 y B1, respectivamente, es el de los mínimos cuadrados, que consiste en minimizar la suma de los cuadrados de los residuos. Si
ii xbby 10ˆ El residuo correspondiente ei será la desviación de cada observación al valor estimado:
iii yye ˆ¿Cómo procedemos utilizando el SPSS 22
Regresión lineal simple
i
iy
Regresión lineal simple
Después de introducidos los datos, active la opción Analizar haciendo click sobre ella.
Luego, Regresión y Lineales. De click sobre Lineales.
Se debe introducir la variable dependiente Y(Velocidad de aceleración) en el cuadro Dependiente x(Tiempo de cambio), activándola previamente ,haciendo clic sobre ella.
Se oprime el botón Estadísticos para activar el estadístico de Durbin-Watson, que se usará más adelante para la prueba de Autocorrelación de los errores.