27
M.E. Gandhy Ponce Gómez Unidad de Investigación ENEO-UNAM, México, D.F

M.E. Gandhy Ponce Gómez Unidad de Investigación ENEO -UNAM, … · El propósito de la estadística inferencial es estimar los atributos de una población a partir de una muestra

Embed Size (px)

Citation preview

M.E. Gandhy Ponce Gómez Unidad de Investigación ENEO-UNAM, México,

D.F

ESTADISTICA DESCRIPTIVA Y ESTADISTICA INFERENCIAL

Niveles de medición

Propiedades u operaciones

Tipo de medidas

Tendencia central

Dispersión

NOMINAL =, ≠ %, moda S

(proporción) ORDINAL =, ≠, >,< Md RIC (rango

intercuartil) (nivel)

INTERVALOS =, ≠, >,<, Ø relativo, ↔ X S (nivel)

RAZÓN =, ≠, >,<, Ø absoluto, ↔ X

S

2

El propósito de la estadística inferencial es estimar los

atributos de una población a partir de una muestra de casos.

Se pueden probar relaciones entre variables, comparar grupos respecto a cierta

característica y hacer inferencias.

3

Las preguntas que se realiza el investigador al llevar a cabo problemas de inferencia son:

¿Es realmente un valor (A) distinto

a otro (B) de actual medición

en el sentido inferencial?.

Muestras independientes (la v. dependiente se mide una sola vez en la unidad de análisis).

•Muestras relacionadas (la v. dependiente se mide más de una vez en la unidad de análisis).

Los prob. de comparación requieren de

probar la hipótesis, es

necesario distinguir entre

variables dependiente e independiente

4

Si X = ó ≠ X1

Las preguntas que se realiza el investigador

al llevar a cabo

problemas de inferencia son:

¿Crece o disminuye

realmente un valor (A) con respecto a otro (B) de

actual medición en el

sentido inferencial?.

Problemas de asociación

Los prob. de asociación

requieren de probar la hipótesis,

NO es necesario distinguir entre

variables dependiente e independiente

5

Si A ↔ ↮B

DIRECTA O INVERSAMENTE PROPORCIONAL

TIPOS DE VARIABLES

V. INDEPENDIENTE

Causa presuntiva o antecedente Identifica los tratamientos

empleados. Define los grupos que

han de ser comparados

•NACIONALIDAD AFECTA O INFLUYE EN LA OBEDIENCIA •LA OBEDIENCIA AFECTA O INFLUYE EN LA NACIONALIDAD. •V. INDEPENDIENTE afecta o influye V. DEPENDIENTE •CAUSA EFECTO

V. DEPENDIENTE

Resultante o efecto.

Fenómeno o proceso que se va a medir, sus variaciones dependen

de la variable independiente

6

1) ¿Se tienen grupos? ( sexos, grupos de estudio distintos, grupos de edades, estado civil, condición de fumar o no, etc).

Si la respuesta es SI, se trata de un problema de comparación.

Si la respuesta es NO, se trata de un problema de asociación.

7

Presencia de CA de pulmón en hombres y mujeres.

2) ¿Hay tratamientos, experimento o intervención sobre la unidad de análisis?.

Si la respuesta es SI, se trata de un problema de comparación.

Si la respuesta es NO, se trata de un problema de asociación.

8

Se mide el efecto de una intervención (actividad física) en escolares para disminución de sobrepeso

3. ¿Son muestras independientes o relacionadas?.

Son muestras independientes cuando la medición de la v. dependiente es evaluada o medida una sola vez.

Son muestras relacionadas cuando se mide más de una vez la v. dependiente en la unidad de análisis.

9

Presencia de CA de pulmón en hombres y mujeres. (UNA SOLA VEZ SE MIDE O EVALUA LA EXISTENCIA DE CANCER DE PULMÓN).

Medición de niveles de glucosa al principio, en medio y al final de un periodo de tx con cierto hipoglucemiante

4. Si son muestras independientes

¿cuántos grupos hay?:

2 grupos. : Usar pruebas

para dos muestras.

+ de 2 grupos: Usar pruebas para más de dos muestras.

5. Si son muestras relacionadas, cuántas

mediciones hay?

2 grupos. : Usar pruebas para dos

mediciones.

+ de 2 grupos: Usar pruebas

para más de dos mediciones.

10

6. ¿Cuál es el nivel de medición de la variable dependiente?.

Nominal. Ordinal. Intervalar. 7. Elegir la prueba según el cuadro de

pruebas de comparación.

11

12

PRUEBAS DE COMPARACIÓN

NIVEL DE MEDICION

MUESTRAS INDEPENDIENTES MUESTRAS RELACIONADAS

DOS MUESTRAS O MEDICIONES

MAS DE DOS MUESTRAS O MEDICIONES

DOS MUESTRAS MAS DE DOS MUESTRAS

INTERVALAR O DE RAZON

T de student Análisis de Varianza para muestras independientes (ANOVA)

T de Student para muestras relacionadas

Análisis de Varianza para medidas repetidas

ORDINAL U de Mann Whitney

Kruskall - Wallis

Wilcoxon Friedman

NOMINAL X2, Fisher (dicotómica)

X2 McNemar (dicotómica)

Q de Cochran (dicotómica)

VARIABLE 1 VARIABLE 2 PRUEBA

INTERVALAR INTERVALAR Pearson (rp )

INTERVALAR ORDINAL Spearman (rs)

ORDINAL ORDINAL Spearman (rs)

DICOTOMICA ORDINAL O INTERVALAR Correlación Biserial Puntual (Rbp)

Dicotómica (nominal)

Dicotómica (nominal) Phi

13

PRUEBAS DE ASOCIACIÓN

14

95% 2.5 2.5

INVESTIGACION SOCIAL: .05 NIVEL DE CONFIANZA

ZONA DE ACEPTACION DE LA HO

ZONA DE RECHAZO DE LA HIPÓTESIS NULA

PROB. < o = 0.05 =

XHO.

PROB. > 0.05 =

ACEPTA HO

¿En qué momento puedo

decir que dos grupos o

comparaciones son iguales, sin

importar la métrica o

distancia entre ellos?.

Cuando Caen en la REGION

BLANCA o región de

ACEPTACIÓN DE LA

HIPÓTESIS NULA.

¿En qué momento

puedo decir que

dos grupos o

comparaciones NO

SON IGUALES entre sí?.

Cuando sus

puntaciones caen en la REGION NEGRA o región de RECHAZO

DE LA HIPÓTESIS

NULA.

Esto quiere decir que:

Si la probabilid

ad obtenida

es mayor a 0.05 se

ACEPTA LA HIPÓTESIS

NULA.

Si la probabilid

ad obtenida

es menor o igual a

0.05 se RECHAZA

LA HIPÓTESIS

NULA.

15

En un contexto estricto de toma de decisiones, el resultado de la prueba de significancia es

“Rechazar la hipótesis nula” o “No rechazar la hipótesis nula”.

HO :La creatividad es igual entre niños de comunidades rurales, urbanas e indígenas

HI: La creatividad no es igual entre niños de comunidades rurales, urbanas o indígenas.

17

Variable dependiente: Creatividad Variable Independiente: Tipo de comunidad Objetivo del estudio: Estudiar el nivel de creatividad en niños de distintas comunidades. Tipo de problema: Comparativo ¿Existen bloques o grupos?: si (R,U,I) Mide una sola vez la creatividad (variable dependiente) en la unidad de análisis por lo que son muestras independientes. Número de grupos: tres Nivel de medición de Variable Dependiente: Intervalar Por lo tanto su prueba es: ANÁLISIS DE VARIANZA (ANOVA)

Variable dependiente: Causa de muerte Variable Independiente: Condición de

fumar o no fumar. Objetivo del estudio: Relación entre la

condición de fumar y el morir de cáncer o por otra causas.

Tipo de problema: Comparativo Existen bloques o grupos: Si (fumadores y

no fumadores, si dividimos sus expedientes).

Mide una sola vez la causa de muerte (variable dependiente) en la unidad de análisis por lo tanto son muestras independientes

Número de Grupos: dos Nivel de medición de Variable

Dependiente: Nominal Por lo tanto su prueba es: X2, FISHER (dicotómica)

H0 : La muerte por cáncer o por otra causa es igual entre sujetos que fuman o no fuman

HI:La muerte por cáncer o por otra causa no es igual entre sujetos que fuman o no fuman

18

Variable dependiente: No se distingue

Variable Independiente: No se distingue ni es necesario

Objetivo del estudio: Saber si el estrés cambia en relación a la depresión.

Tipo de problema: Asociación Nivel de medición de Variable 1:

Intervalar Nivel de medición de Variable 2:

Intervalar

Por lo tanto su prueba es: Pearson

H0: la relación entre la variable estrés y la variable depresión es igual a 0, es decir no existe relación.

HI: la relación entre la variable estrés y la variable depresión es no es igual a 0, es decir si existe relación.

19

Procedimiento X2 Analize Descriptive estatistics Crosstabs Columns (variable

independiente, es la que distingue a los grupos).

Rows : variable dependiente.

Statistics Chi square OK.

Estatus Laboral * Sexo del Sujeto Crosstabulation

Count

22 58 80397 312 709419 370 789

No TrabajaSi Trabaja

EstatusLaboral

Total

Femenino MasculinoSexo del Sujeto

Total

Chi-Square Tests

23.438b 1 .00022.307 1 .00023.966 1 .000

.000 .000789

Pearson Chi-SquareContinuity Correctiona

Likelihood RatioFisher's Exact TestN of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is37.52.

b.

20

N < 30

N > 30

Procedimiento KRUSKALL WALLIS

Analizar Pruebas no parametricas K muestras independientes: Kruskall Wallis Variable de agrupación

(independiente) : sexo Definir rangos(1: masc, 2:

fem). Var. Dependiente (nivel

socioeconómico). Options Statistics Descriptive

Test Statisticsa,b

1.6161

.204

Chi-SquaredfAsymp. Sig.

NivelSocioeconómico

Kruskal Wallis Testa.

Grouping Variable: SEXO NUEVOb.

21

ANOVA Analize Compare means One way ANOVA Depent list (v. dependiente). Factor (v. de agrupación) OK

ANOVA

Nivel de Estrés en la 1ª Medición

.207 4 .052 .567 .68767.667 741 .09167.874 745

Between GroupsWithin GroupsTotal

Sum ofSquares df Mean Square F Sig.

22

Dado que la probabilidad obtenida es p= .687 que es mayor a 0.05 ( F= .567, gl entre grupos= .207 y gl intragrupos= 67.667) por lo tanto se acepta la hipótesis nula. Esto quiere decir que el nivel de estrés ES IGUAL en los individuos con distinto número de síntomas de depresión.

A N O V A

Analize Correlate Bivariate Variables: señalar

las variables intervalares.

Pearson OK

Correlations

1 .563**. .000

755 719.563** 1.000 .719 752

Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N

Nivel de Estrésen la 2ª Medición

Nivel de Estrésen la 3ª Medición

Nivel deEstrés en la2ª Medición

Nivel deEstrés en la3ª Medición

Correlation is significant at the 0.01 level (2-tailed).**.

23

Dado que la probabilidad obtenida es p= .000 que es MENOR a 0.05 ( rP = .563) por lo tanto se rechaza la hipótesis nula. Esto quiere decir que el nivel de estrés de la segunda medición es de una fuerza media con el nivel de estress de una tercera medición.

- 0.90 = Correlación negativa muy fuerte - 0.75= Correlación negativa considerable - 0.50 = Correlación negativa media - 0.10 = Correlación negativa débil 0.00 = No existe correlación alguna 0.10 = Correlación positiva débil. 0.50 = Correlación positiva media. 0.75= Correlación positiva considerable 0.90 = Correlación positiva muy fuerte

24

Se realizan varias mediciones.

Son pruebas previo al estímulo o tratamiento, después de administra el tratamiento y finalmente se vuelve a medir el comportamiento de la variable dependiente.

Pruebas son llamadas de muestras relacionadas ( varias mediciones en launidad de análisis).

25

Si son dos muestras o mediciones a nivel nominal la prueba es McNemar (dicotómica). Si son más de dos muestras al mismo nivel Q de Cochran.

Si son dos muestras a nivel ordinal se usa Wilcoxon; si son más de dos muestras ordinales se usa Friedman.

Si son dos muestras a nivel intervalar, se usa T de Student para muestras relacionadas; si son más de dos muestras intervalares se usa ANOVA para muestras repetidas.

26