Upload
cesar-vallejo
View
6.282
Download
0
Embed Size (px)
Citation preview
Análisis Análisis de los datosde los datos
11
ANALISIS DE DATOS CUANTITATIVOSANALISIS DE DATOS CUANTITATIVOS
Programas Computacional
es
SPSS
MinitabSAS
Stats
Distribución de frecuencias
Medidas de tendencia central
Medidas de variabilidad
ANALISIS DE DATOS
CUANTITATIVOS
• Media.• Mediana .• Moda
• Rango.•Desviación estándar.• Varianza
Gráficas
Puntuaciones Z
La matriz de datos
Descriptiva
Estadística
Inferencial
Se efectúa mediante
Y la
22
ANALISIS DE DATOS CUANTITATIVOSANALISIS DE DATOS CUANTITATIVOS
Análisis paramétricos
Análisis no paramétricos
• Coeficientes de correlación.• Prueba t• Prueba de diferencias de proporciones.• Análisis de varianza
• Chi cuadrada.• Spearman y Kendall• Coeficientes para tabulaciones cruzadas
Estadística
Inferencial
Estimar parámetros
Probar hipótesis
Distribución muestral
ANALISIS DE DATOS
CUANTITATIVOS
33
ANALISIS DE DATOS CUANTITATIVOSANALISIS DE DATOS CUANTITATIVOS
REPORTAR RESULTADO
S
Análisis estadístico de variables e hipótesis
Explorar datos
Evaluar la confiabilidad y validez
Ejecutarlo
PASOS
Seleccionar el Programa
ANALISIS DE DATOS
CUANTITATIVOS
44
55
66
77
Estadísticos total-elemento
Media de la escala si se elimina el elemento
Varianza de la escala si se elimina el elemento
Correlación elemento-total corregida
Alfa de Cronbach si se eleimina el elemento
p1 34.1076923 82.34490161 0.51572306 0.919112855p2 33.7230769 79.48861061 0.52288378 0.920134007p3 33.6846154 78.83774597 0.66698428 0.914934288p4 34.2230769 81.7405486 0.5724501 0.917646698p5 33.7153846 76.59278473 0.72957994 0.912909884p6 33.4923077 77.49218843 0.73055437 0.912938363p7 33.9923077 79.99218843 0.59421838 0.917112935p8 33.5692308 78.21610018 0.718686 0.913392359p9 34.1384615 79.67060227 0.6206626 0.916319238p10 33.9461538 80.33041145 0.69171183 0.914638589p11 34.3615385 83.31788909 0.51620397 0.919064274p13 33.9230769 80.47465713 0.62045497 0.91633199p14 33.8076923 80.69916518 0.58154149 0.917416627p15 33.9461538 80.15986881 0.666663 0.915133921p16 34.2384615 84.64812165 0.44031547 0.920740118p17 33.4384615 75.82951699 0.76835231 0.911583916
88
Análisis de los datos en el Análisis de los datos en el proceso de Investigaciónproceso de Investigación
Se busca decidir que Se busca decidir que pruebas estadísticas son pruebas estadísticas son apropiadas para analizar apropiadas para analizar los datos dependiendo de los datos dependiendo de las hipótesis formuladas y las hipótesis formuladas y los niveles de medición de los niveles de medición de las variableslas variables
99
¿Qué análisis pueden efectuarse ¿Qué análisis pueden efectuarse en los datos?en los datos?
Los análisis de datos dependen de 3 Los análisis de datos dependen de 3 factores:factores:
a.a. El nivel de medición de las variablesEl nivel de medición de las variables
b.b. La manera que se hayan formulado las hipótesis.La manera que se hayan formulado las hipótesis.
Cada método tiene su razón de ser y un Cada método tiene su razón de ser y un propósito especifico.propósito especifico.
No se deben hacer mas análisis de los No se deben hacer mas análisis de los necesariosnecesarios
1010
Nom inal Ordinal
Categoricos(Cualitativo)
Discreto Continuo
Num erico(Cuantitativo)
D atos
1111
VariablesVariablesVariablesVariables
1212
Los principales análisis que pueden Los principales análisis que pueden efectuarse son:efectuarse son:
1.1. Estadística descriptiva para cada Estadística descriptiva para cada variablevariable
2.2. Puntuaciones “Z”Puntuaciones “Z”
3.3. Cálculos y Razones de estadísticos Cálculos y Razones de estadísticos inferencialinferencial
4.4. Análisis paramétricos Análisis paramétricos
5.5. Análisis no paramétricosAnálisis no paramétricos
6.6. Análisis multivariablesAnálisis multivariables
1313
1. 1. Estadísticas descriptivas para Estadísticas descriptivas para cada variablecada variable
““La primera tarea es describir los datos, La primera tarea es describir los datos, valores o puntaciones obtenidas para valores o puntaciones obtenidas para cada variable... ¿cómo pueden cada variable... ¿cómo pueden describirse estos datos ? Describiendo describirse estos datos ? Describiendo la la distribución de las puntuaciones o distribución de las puntuaciones o frecuenciasfrecuencias” ” (Fernadez- Collao, Baptista y (Fernadez- Collao, Baptista y Elkes) Elkes)
1414
Distribución de frecuencia:Distribución de frecuencia: Es un conjunto de puntuaciones Es un conjunto de puntuaciones
ordenadas en sus respectivas ordenadas en sus respectivas categorías.categorías.
Variable : conductor preferidoVariable : conductor preferido
Categorías Códigos FrecuenciasCategorías Códigos Frecuencias
AMT 1 50AMT 1 50
LEM 2 88LEM 2 88
FGI 3 12FGI 3 12
MML 4 MML 4 0303
TOTAL 153 TOTAL 153
1515
Distribución de frecuencia resumida:Distribución de frecuencia resumida:
Variable: calificación en la prueba de Variable: calificación en la prueba de motivaciónmotivación
CATEGORIAS FRECUENCIASCATEGORIAS FRECUENCIAS
55 o menos 0355 o menos 03
56-60 1656-60 16
61-65 0961-65 09
66-70 03 66-70 03
71-75 07 71-75 07
76-80 0976-80 09
81-85 0481-85 04
86-90 1186-90 11
91-96 91-96 0101
TOTAL 63 TOTAL 63
1616
HISTOGRAMA
CATEGORÍAS
P
O
R
C
E
N
T
A
J
E
S
1717
GRADO DE CONOCIMIENTOGRADO DE CONOCIMIENTO GRAFICO N° 05GRAFICO N° 05
26%
27%
23%
24%
20%
21%
22%
23%
24%
25%
26%
27%
28%
Muy alto Alto Bajo Muy bajo1818
Modelo de Gráfico Modelo de Gráfico
Gráfico 7.Gráfico 7. Cantidades deCantidades de sanciones por bimestre sanciones por bimestre recibidas por cada aula de la Escuela Militar de Chorrillos.recibidas por cada aula de la Escuela Militar de Chorrillos.
0
20
40
60
80
100
1er 2do 3er 4to
4° A
4° B
4° C
1919
RECURSOSRECURSOSGRAFICO N° 02GRAFICO N° 02
27%
23%
30%
20%
0% 5% 10% 15% 20% 25% 30% 35%
Definitivamente si
Probablemente si
Probablemente no
Definitivamente no
2020
30% 29%
22%
19%
0%
5%
10%
15%
20%
25%
30%
35%
Definitivamente si Probablemente si Probablemente no Definitivamente no
2121
Modelo de TablaModelo de Tabla
Tabla 5Tabla 5Tasas de error para grupos de menor y mayor edad.Tasas de error para grupos de menor y mayor edad.
Tasa mediaTasa media Desviacion Desviacion Tamaño de Tamaño de de errorde error Estándar Estándar la la
muestramuestra
Grado de Grado de Menor MayorMenor Mayor Menor Mayor Menor Menor Mayor Menor Mayor Mayor
DificultadDificultad edadedad edadedad edadedad edad edad edad edad edad edad
BajoBajo .05 .05 .14.14 .08 .08 .15 .15 12 12 18 18
ModeradoModerado .05 .05 .17.17 .07 .07 .15 .15 15 15 12 12
AltoAlto .11 .11 .26.26 .10 .10 .21 .21 16 16 14 14
2222
Frecuencias relativas y acumuladas Frecuencia relativasFrecuencia relativas: son los resultados (%) : son los resultados (%)
de casos de cada categoría.de casos de cada categoría. Frecuencias acumuladasFrecuencias acumuladas:: son los que se va son los que se va
acumulando en cada categoría.acumulando en cada categoría. Frecuencias absolutas: son los puntajes : son los puntajes
directos, sin tener trasformación alguna.directos, sin tener trasformación alguna.
Las distribución de frecuencias, Las distribución de frecuencias, generalmente las frecuencias relativa, generalmente las frecuencias relativa, pueden presentarse en forma de histograma pueden presentarse en forma de histograma o gráficas de otro tipo.o gráficas de otro tipo.
2323
Variable: cooperación del personal en el desarrollo de Variable: cooperación del personal en el desarrollo de
la empresa XXla empresa XX
Categorías códigos frecuencia Frecuencia Categorías códigos frecuencia Frecuencia frecuenciafrecuencia
(cooperación) absoluta relativas ( %) (cooperación) absoluta relativas ( %) acumuladaacumulada
- Si se ha - Si se ha
Obtenido 1 91 74.6% 91Obtenido 1 91 74.6% 91
- No se ha - No se ha
Obtenido 2 05 4.1% 96Obtenido 2 05 4.1% 96
- No - No
Respondieron 3 Respondieron 3 2626 21. 21.3% 122 3% 122
TOTAL 122 100%TOTAL 122 100%
2424
2. Puntuaciones “z”2. Puntuaciones “z”
“… “… Son las trasformaciones que se pueden hacer a los Son las trasformaciones que se pueden hacer a los valores o puntuaciones obtenidas, con el propósito de valores o puntuaciones obtenidas, con el propósito de analizar sus distancia respecto a la media, en unidades analizar sus distancia respecto a la media, en unidades de desviaciones estándar ….”(Sampieri,Collado,Lucio).de desviaciones estándar ….”(Sampieri,Collado,Lucio).
Siendo la formula : Siendo la formula : X = valor a trasformarX = valor a trasformar X = media de distribuciónX = media de distribución S= desviación estándar S= desviación estándar Z= trasformación en Z= trasformación en
unidades de unidades de Desviación estándar Desviación estándar
Z =Z = X - X X - X
SS
2525
3. Razones y tasas3. Razones y tasas
RazónRazón: es la relación entre dos categorías. : es la relación entre dos categorías. Ejm:Ejm: categorías frecuencias categorías frecuencias
absolutas absolutas Masculino Masculino 60 60
FemeninoFemenino 3030
La razón de H y M es La razón de H y M es 6060 =2 =2 3030
^ Por cada dos H hay una M.^ Por cada dos H hay una M.
2626
Tasa:Tasa: es la relación entre el número de casos, es la relación entre el número de casos, frecuencias y el número total de observaciones, frecuencias y el número total de observaciones, multiplicada por un múltiplo de 10. (100 ó 1000). multiplicada por un múltiplo de 10. (100 ó 1000).
Ejemplo:Ejemplo:
TasaTasa = Nº de nacidos vivos en ciudad Nº de nacidos vivos en ciudad X 1000 X 1000
Nª de habitantes en la ciudad Nª de habitantes en la ciudad
T. De nacidos vivos = T. De nacidos vivos = 10 00010 000 X 1000 = 33.33
300 000300 000
Hay 33.33 nacidos vivos por cada 1000 habitantes Hay 33.33 nacidos vivos por cada 1000 habitantes
Tasa=Tasa=Nª. de eventos durante un períodoNª. de eventos durante un período X 100 X 100 ó 1000ó 1000 Nª. total de eventos posibles
2727
4. Cálculos y Razones de estadísticos 4. Cálculos y Razones de estadísticos inferencialinferencial
La estadística inferencial puede ser utilizada La estadística inferencial puede ser utilizada para dos procedimientos.(Wiersma,1986).para dos procedimientos.(Wiersma,1986).
a) Probar hipotesis:a) Probar hipotesis:
b) Estimar paramétros (determinar las b) Estimar paramétros (determinar las estadísticas de la población).estadísticas de la población).
2828
5. Análisis Paramétricos5. Análisis ParamétricosPara realizar análisis paramétricos debe partirse de Para realizar análisis paramétricos debe partirse de
los siguientes supuestos:los siguientes supuestos:
1.1. La distribución poblacional de la La distribución poblacional de la variable dependiente es normal.variable dependiente es normal.
2.2. El nivel de medición de la variable El nivel de medición de la variable dependiente es por intervalos o dependiente es por intervalos o razón.razón.
3.3. Cuando dos o más poblaciones son Cuando dos o más poblaciones son estudiadas, tienen una varianza.estudiadas, tienen una varianza.
2929
Pruebas paramétricas mas usadas son :Pruebas paramétricas mas usadas son :
Coeficiente de correlación de Coeficiente de correlación de PearsonPearson
Prueba “T”Prueba “T”Prueba de contraste de la diferencia Prueba de contraste de la diferencia
de proporciones.de proporciones.Análisis de varianza unidireccional Análisis de varianza unidireccional
(ANOVA Oneway)(ANOVA Oneway)Análisis de varianza factorial (Análisis de varianza factorial (ANOVA)ANOVA)Análisis de covarianza (Análisis de covarianza (ANCOVA)ANCOVA)
3030
6. Análisis no Paramétricos6. Análisis no Paramétricos Las distribuciones pueden ser no normales.Las distribuciones pueden ser no normales. Las variables deben ser categóricas.Las variables deben ser categóricas.
Pruebas estadísticas mas utilizadas:Pruebas estadísticas mas utilizadas:1.1. La ji cuadrada o X2.La ji cuadrada o X2.2.2. Los coeficiente de correlación e Los coeficiente de correlación e
independencia para tabulaciones independencia para tabulaciones cruzadas.cruzadas.
3.3. Los coeficientes de correlación por Los coeficientes de correlación por rangos ordenados de Spearman y rangos ordenados de Spearman y kendall. kendall.
3131
7. ANÁLISIS MULTIVARIADO7. ANÁLISIS MULTIVARIADOSon aquellos en que se analiza la relación Son aquellos en que se analiza la relación
entre varias variables independiente y al entre varias variables independiente y al menos una dependiente. menos una dependiente.
XX1 1
XX22 VD VD XX33
XX4 4
3232
PROCESAMIENTO, ANÁLISIS EPROCESAMIENTO, ANÁLISIS EINTERPRETACIÓN DE LA INTERPRETACIÓN DE LA
INFORMACIÓNINFORMACIÓN
Al presentar la información a través de Al presentar la información a través de
cuadros, éstos deberán contener cuadros, éstos deberán contener
preferentemente una o dos variables (Tabla preferentemente una o dos variables (Tabla
de doble entrada), ya que la descripción e de doble entrada), ya que la descripción e
interpretación de cuadros de más de dos interpretación de cuadros de más de dos
variables pueden resultar inadecuadas.variables pueden resultar inadecuadas.
3333
PROCESAMIENTO, ANÁLISIS EPROCESAMIENTO, ANÁLISIS EINTERPRETACIÓN DE LA INTERPRETACIÓN DE LA
INFORMACIÓNINFORMACIÓN
Los métodos para el análisis Los métodos para el análisis
estadístico de los datos deberán estadístico de los datos deberán
elegirse según los objetivos elegirse según los objetivos
planteados y de acuerdo con las planteados y de acuerdo con las
hipótesis que se deseen hipótesis que se deseen
contrastar. contrastar. 3434
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
CASOS DE INTERES PRUEBAS PARAMETRICAS
PRUEBAS NO PARAMETRICAS
Estudios con una sola muestra Estimación de la media ( ) Estimación de la proporción ( ) Prueba de hipótesis para ( ) Prueba de hipótesis para ( ) Bondad de ajuste
“t” – Student “Z”
“t” – Student “Z”
Kolmogorov; 2
3535
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
CASOS DE INTERES PRUEBAS PARAMETRICAS
PRUEBAS NO PARAMETRICAS
Estudios con dos muestras Muestras Independientes Diferencia de promedios Independencia (2 x 2); n <20 Independencia (2 x 2) Independencia (r x c) Numérica y categórica Ambas numéricas Diferencias en tendencia central Experimental y control
“t” – Student
U de Mann Whitney
Fisher 2 Yates
2 sin corregir Mediana
Kolmogorov Wald Moses
3636
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
CASOS DE INTERES PRUEBAS PARAMETRICAS
PRUEBAS NO PARAMETRICAS
Estudios con dos muestras Muestras Relacionadas Diferencia pre pos test Antes después (dicotómica) Diferencia de dos muestras Hay relación en las variables Ambas nominales Ambas numéricas Ambas ordinales
“t” pareada
Regresión; r de Pearson
Wilcoxon
McNemar o Kappa De los signos
Riesgo relativo
Odds Ratio
R de Sperman
3737
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
CASOS DE INTERES PRUEBAS PARAMETRICAS
PRUEBAS NO PARAMETRICAS
Estudios con más de dos muestras
Muestras Independientes Diferencia de promedios Numérica y Ordinal Muestras Relacionadas Variables numéricas Homogeneidad (dicotómica) Concordancia
ANVA
ANVA Bloques aleat.
Kruskal Wallis
Mediana
Friedman Q de Cochran
Kendall
3838
PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO
METODOS DE ANALISIS MULTIVARIANTES
PRUEBAS MULTIVARIANTES
I. Métodos predictivos
Regresión lineal múltiple Análisis de la covarianza Análisis de la varianza Regresión logística múltiple Análisis discriminante
II. Métodos reductivos Componentes principales
Análisis factorial Correlación canónica Análisis cluster Análisis de correspondencias
3939
Coeficiente de Correlación de PearsonCoeficiente de Correlación de Pearson Interpretación: El coeficiente r de Pearson puede variar de – 1.00 a + 1.00, Interpretación: El coeficiente r de Pearson puede variar de – 1.00 a + 1.00,
donde:donde:- 1.00 Correlación negativa perfecta (“A mayor X, menos Y”, de manera proporcional. Es
decir, cada vez que X aumenta una unidad, Y disminuye siempre una cantidad constante). Esto también se aplica “a menor X, mayor Y”
- 0.90 Correlación negativa muy fuerte.
- 0.75 Correlación negativa considerable.
- 0.50 Correlación negativa media.
- 0.25 Correlación negativa débil.
- 0.10 Correlación negativa muy débil.
0.00 No existe correlación alguna entre las variables
+ 0.10 Correlación positiva muy débil
+ 0.25 Correlación positiva débil.
+ 0.50 Correlación positiva media.
+ 0.75 Correlación positiva considerable.
+ 0.90 Correlación positiva muy fuerte.
+ 1.00 Correlación positiva perfecta4040