SPSS versión 22 para ingenieros

Continuar

SPSS versión 22 para ingenieros

MSc. Joanny Ibarbia Pardo

El SPSS se inicia siempre ofreciendo la imagen, similar a una hoja de cálculo, del Editor de Datos. Este Editor dispondrá las variables en columnas y los casos en filas. Nuestro primer objetivo será definir el fichero de datos y almacenar esos datos en el editor.

El archivo de datos puede crearse directamente en SPSS o importarse ya creado de otro programa, normalmente de una hoja de cálculo. La definición de las variables será, sin embargo, una tarea a realizar obligatoriamente en el SPSS.

Los datos se observan en la pantalla "Vista de Datos" de SPSS en una presentación muy similar a una hoja de cálculo clásica: casos ocupan filas y variables ocupan columnas.

Obtención de datos e introducción directa en SPSS

Comenzando por la captura externa, para importar un archivo de hoja de cálculo debe seleccionarse el tipo xls en el cuadro “Abrir” del menú “Archivo”. Una vez elegido el archivo de datos debe indicarse al SPSS si la primera fila del archivo de excel contiene cabeceras de columnas (es decir, nombre de las variables) y el rango a leer en la misma si los datos que desea leer de la hoja de cálculo no comienzan en la primera fila ni en la primera columna.

Obtención de datos e introducción directa en SPSS

Para introducir directamente los datos en SPSS deberán completarse, para cada variable los siguientes pasos:

1. Asignar un nombre y una etiqueta a la variable

2. Identificar el tipo de variable

3. Definir sus posibles valores y las etiquetas de los mismos

4. Definir el o los valores perdidos

Crear un archivo de datos

Crear un archivo de datos

Crear una variable a partir de las ya existentes

Seleccionar un subconjunto de casos que verifiquen una condición

Seleccionar un subconjunto de casos que verifiquen una condición

Medidas descriptivas

Agrupación visual

Agrupación visual

Otras formas de obtener estadísticos y representaciones gráficas



Nro. Salario Nro. Salario Nro. Salario Nro. Salario Nro. Salario

1234567891011121314151617181920

156.23196.25205.45158.25185.40452.60350.75256.45444.25258.65357.25365.10365.80456.85290.45280.70260.50255.26235.62256.80

2122232425262728293031323334353637383940

255.40305.25325.65285.60450.15350.60358.50465.25199.20256.30128.12246.12150.36125.65145.60175.50185.60195.40201.30231.20

4142434445464748495051525354555657585960

235.60239.20245.60246.30256.50264.30268.90287.50265.25369.15321.50362.30351.20365.56365.20326.50410.50410.30415.20352.60

6162636465666768697071727374757677787980

256.30125.60128.35135.60450.00460.00480.52495.60485.60500.60580.60630.50630.00610.00575.00580.00620.00750.60740.00520.60

81828384858687888990919293949596979899100

546.20580.00250.60150.60240.30250.15256.30280.60260.50290.55295.55300.25315.60350.90125.30125.60230.00236.50245.30156.50

Ejemplo 1. Los siguientes datos representan los salarios mensuales de 100 trabajadores de un taller automotriz de Cochabamba.

Se pide, utilizando el SPSS 22.0:a) Seleccione una muestra de un 30 % de la Población.b) A partir de esta muestra aleatoria construya un intervalo para ,

con un 95 % de confiabilidad.

Definiendo la variable Salarios

Introducidos los datos, seleccione Datos, para obtener los salarios correspondientes a los números aleatorios generados por el SPSS.

En Datos click en Seleccionar casos …

Active el botón de Muestra aleatoria de casos

Presione la tecla Ejemplo, para indicar el porciento de la población que integrará la muestra aleatoria

Seleccionemos aproximadamente el 30 % de la población, escribiendo con el teclado, en la ventana que se indica , el por ciento deseado y dando click en Continuar posteriormente.

Click en Aceptar

Observa que algunos datos están tachados; esos no forman parte de la muestra aleatoria. Ya tenemos la muestra aleatoria, ahora comenzamos a construir el intervalo de confianza para la media población con un 95 % de seguridad.

Estimación puntual e intervalos de confianza

Estimación: Averiguar los valores de los parámetros poblacionales a partir de los valores de los estadísticos muestrales de dichas poblaciones. Se puede hacer:

· Puntual: un único valor.

· Por intervalo: Margen de valores dentro del cual se tiene la confianza de que se encuentre el parámetro estimado

A partir de la observación de un conjunto de datos obtenidos en condiciones independientes y tales que siguen una distribución con forma conocida, pero con parámetros desconocidos, la estimación puntual consiste es estimar dichos parámetros.La información proporcionada por la estimación puntual es, en general, insuficiente, por lo que una alternativa es proporcionar un intervalo tal que, con una probabilidad fijada a priori, contenga al verdadero valor del parámetro. El intervalo de confianza para un parámetro al nivel de confianza Ψ = 1 – α es el intervalo de longitud mínima tal que contiene al verdadero valor del parámetro con una probabilidad igual a Ψ. A Ψ se le conoce como nivel de confiabilidad de la estimación y a α como nivel de significación.

Las propiedades clásicas de los buenos estadísticos – estimadores son: · Estimadores insesgados.· Estimadores consistente.· Estimadores eficiente.· Estimadores suficientes.

nzx

nzx

21

21

;

nsntx

nsntx 1;)1(

21

21

nqpzp

nqpzpp

ˆˆˆ;ˆˆˆ

21

21

2

)1(2

2

2

)1(2

1

22 1;1

nn

snsn

Intervalos de confianza para 2,, pPara (Media poblacional)

Para P (Proporción poblacional)

Para la (Varianza poblacional) 2

Conocida 2

Desconocida 2

Ya tenemos la muestra aleatoria, ahora comenzamos a construir el intervalo de confianza para la media poblacional con un 95 % de seguridad. Activa Analizar.

Intervalos de Confianza de con el uso del SPSS 22.0

Active Estadísticos descriptivos y Explorar..., haciendo clic en esta última

Oprima el botón que se te indica para introducir la variable Salarios en la ventana Lista de dependientes:

Oprima el botón Estadísticos …

Observa que el nivel de confianza implícito es de un 95 %, si quiere puedes cambiarlo. Dejémoslo. Luego Continuar.

Active Gráficos...

Active Ninguna

Desmarque la opción que se te señala

Active Histogramas

Continuar

Aceptar

Observa que fueron seleccionado aleatoriamente 38 salarios y todos son válidos.

Expliquemos esta tabla en la próxima diapositiva

El límite inferior del intervalo = 280.1355, El límite inferior del intervalo = 381.6034. Por lo tanto: con un 95 % de confiabilidad. 6034.381;1355.280

Este es el histograma de frecuencias

Un estadígrafo muy importante y necesario para cualquier análisis estadístico es la descripción de frecuencia que permite: tener información acerca del rango de valores de la variable, número de casos válidos, número de casos sin información y las veces que se repite cada valor que tiene esa variable en la base de datos.

Nota: De ahora en adelante suponemos que estamos en el Editor de texto del SPSS y con la base de datos satisf .sav abierta.

La forma más directa de obtener una frecuencia de variables es la siguiente: Analizar / Estadísticos descriptivos / Frecuencias

Elegida esa secuencia de menús obtenemos la siguiente Pantalla:

En el cuadro de la izquierda de la pantalla aparece el listado de todas las variables que contiene la base de datos, es necesario seleccionar las variables de las cuales se desea obtener la distribución de frecuencia y luego se elige la opción de aceptar.

Obtengamos la distribución de frecuencias de la variable satisfacción con la variedad. Como resultado obtenemos la siguiente tabla:

Análisis de regresión en SPSS versión 22

El análisis de regresión está relacionado con el estudio de la dependencia de una variable, la variable dependiente , de una o más variables adicionales, las variables explicativas, con la perspectiva de estimar y/o predecir el valor (poblacional) medio o promedio de la primera en términos de valores conocidos o fijos ( en muestreos repetidos) de las segundas. Algunas situaciones en donde es recomendable aplicar el Análisis de Regresión son las siguientes: -Conocidas las edades y las estaturas de un grupo de estudiantes, se puede estimar la estatura promedio que corresponde a una edad determinada.

-Se puede estar interesado en estudiar la dependencia que existe entre los gastos personales de consumo y el ingreso personal real.

-Conocer la demanda de un producto ante los cambios en el precio.

-Se puede conocer la dependencia existente entre los niveles de producción de una fábrica y la productividad de sus trabajadores.

-Conocer la dependencia existente entre el rendimiento de un motor y el consumo de combustible del mismo.

.

Ejemplo 1.

En una fábrica de Lamborghini Aventador LP 700-4b se selecciona una muestra aleatoria de 15 trenes de potencia dentro de los que resultaron defectuosos luego de las pruebas de calidad realizadas, con el fin de estimar su velocidad de aceleración atendiendo al tiempo de cambio de su caja de velocidad.

Análisis de regresión en SPSS versión 22Velocidad de aceleración (km/h) (Y)

Tiempo de cambio (milisegundos) (X)

90 45,095 47,593 46,594 47,090 45,092 46,093 46,595 47,597 48,598 49,099 49,591 45,595 47,597 48,593 46,5

a)Ajuste los datos al modelo:b)Verifique el supuesto de Normalidad de

los residuos o errores.

xY 10

Diagrama de dispersión o nube de puntos

Antes de seleccionar el modelo matemático para ajustar las observaciones de los datos, es recomendable obtener la representación gráfica de los valores de Y ( estaturas) frente a los valores de x (edades) o sea, el diagrama de dispersión, el cual nos permite visualizar la tendencia de los datos y así poder seleccionar el modelo matemático que mejor puede ajustarse a la nube de puntos.

Veamos como se procede utilizando el SPSS versión 22 en la representación gráfica de la nube de puntos.

Active la opción Gráficos



Luego de ir a Gráficos , seleccionar Gráficos de variables de regresión


Se observa en el diagrama de dispersión, que a medida que aumenta el tiempo de cambio (x), aumenta también la Velocidad de aceleración (y). Se podría ajustar una línea recta a esa nube de puntos y la recta que se obtiene utilizando el método de los mínimos cuadrados es la que pasa justamente por el centro de la nube de puntos.

En el caso de una única variable independiente, X, se habla de regresión lineal simple. La correspondiente ecuación de regresión será del tipo: XY 10

Y, en particular, para cada observación:

iii xy 10 Ni ,....,2,1En nuestro caso, se trata de obtener una función lineal de la variable independiente tiempo de cambio (x) que permita estimar la velocidad de aceleración (y), para cualquier estudiante i:

iii tiempoVelocidad 10

Donde son parámetros desconocidos a estimar y los proceden de variables independientes, normales, de media 0 y la misma varianza.

10 ,

El criterio para obtener los coeficientes de regresión b0 y b1 estimaciones de los parámetros B0 y B1, respectivamente, es el de los mínimos cuadrados, que consiste en minimizar la suma de los cuadrados de los residuos. Si

ii xbby 10ˆ El residuo correspondiente ei será la desviación de cada observación al valor estimado:

iii yye ˆ¿Cómo procedemos utilizando el SPSS 22

Regresión lineal simple

i

iy

Regresión lineal simple

Después de introducidos los datos, active la opción Analizar haciendo click sobre ella.

Luego, Regresión y Lineales. De click sobre Lineales.

Se debe introducir la variable dependiente Y(Velocidad de aceleración) en el cuadro Dependiente x(Tiempo de cambio), activándola previamente ,haciendo clic sobre ella.

Se oprime el botón Estadísticos para activar el estadístico de Durbin-Watson, que se usará más adelante para la prueba de Autocorrelación de los errores.

Education

SPSS versión 22 para ingenieros