49
CURSO PROPEDÉUTICO ESTADÍSTICA BÁSICA Especialización en Métodos Estadísticos (EME) Enrique Rosales Ronzón, Patricia Díaz Gaspar, mayo 2015

Especialización en Métodos Estadísticos (EME) · Sean A y B dos conjuntos. Si todo elemento de A es también elemento de B, ... Los valores correspondientes a la media, mediana

  • Upload
    lebao

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

CURSO PROPEDÉUTICO ESTADÍSTICA BÁSICA

Especialización en

Métodos Estadísticos (EME)

Enrique Rosales Ronzón, Patricia Díaz Gaspar, mayo 2015

2

Estadística ???

• Ciencia, Técnica, Arte… Reunir, Organizar, presentar, analizar e

interpretar datos con el fin de obtener determinados resultados que

dan pauta a ciertas conclusiones para posteriormente determinar

decisiones.

3

Población

Muestra

4

La unidad de análisis es

el elemento del cual se

predica una propiedad y

característica

La variable es la

característica,

propiedad o atributo

que se predica de la

unidad de análisis

La categoría es cada

una de las posibles

variaciones de una

variable

5

Subconjunto de la

población que se

selecciona

aleatoriamente para su

respectivo análisis.

Muestra

Parámetro

Estadísticos

Población

Total de sujetos,

amínales, objetos,

plantas, etc., con

características similares

para su estudio.

Unidad de medida

desconocida de la

población

Unidad de medida de

la muestra y se

utiliza para realizar

inferencias acerca

de la población

6

Formulación del Problema Hipótesis, objetivos, alcance población

Diseño de Experimento Seleccionar técnica -mínimo costo y tiempo

Tamaño de muestra, Solución

Recolección de Datos Calidad de obtención

Proceso de Datos y su descripción Tablas de estadísticas

Gráficas

Inferencia Estadística Y Conclusiones Definición confianza y significancia

Toma de decisiones

Sugerencias

7

Descriptiva

Inferencial

Estadística

Describir la

muestra

Infiere

conclusiones a

partir de los datos

que describen la

muestra

La diferencia radica en que la estadística

descriptiva procede a resumir y organizar

esos datos para facilitar su análisis e

interpretación, y la estadística inferencial

procede a formular estimaciones y probar

hipótesis acerca de la población a partir de

esos datos resumidos y obtenidos de la

muestra.

Estadística univariada (estudia una sola

variable), bivariada (estudia la relación entre

dos variables), y multivariada (estudia tres o

más variables).

8

Variables

Cuantitativas Cualitativas

Ordinales Nominales Continuas Discretas

9

NIVEL DE

MEDICIÓN

NIVEL NOMINAL NIVEL ORDINAL NIVEL

CUANTITATIVO

DISCRETO

NIVEL

CUANTITATIVO

CONTINUO

DATO

UNIDAD DE

ANÁLISIS

VARIABLE

CATEGORÍA O

VALOR

10

Variable

Dependiente

Independiente

11

Un repaso…

12

• Estadística

• Población y Muestra

• Parámetro y Estadístico

• Unidad de Análisis, Variable y Categoría

• Proceso de investigación

• Estadística Descriptiva e inferencial

• Estadística uni, bi y multivariada

• Variable nominal, ordinal, discreta y continua

13

Estadística Descriptiva

Análisis Bivariado

Cajas y alambres Chi-chuadrado Regresión

14

Prueba chi-cuadrada

Fundamentalmente se pretende estudiar la dependencia y/o

independencia entre dos variables cualitativa.

Pretende determinar si existe una relación entre dos variables

No indica el grado o tipo de relación entre las variables.

15

Regresión Lineal Simple

16

Conceptos Básicos de Probabilidad

Conjunto: es una colección de objetos bien definida que tiene

algo en común

Elemento: Son los objetos comprendidos en un conjunto

Notación básica A = { 0, 2, 4, 6, 8}

Conjunto de números dígitos pares

17

Número Finito

A = {Domingo, Lunes, Martes, Miércoles, Jueves, sábado}

Infinito Numerable

B = {1, 3, 5, 7, 9, 11,…..}

Infinito no Numerable

C = { x | 0 ≤ x ≥ 1 }

Conceptos Básicos de Probabilidad

Método de Extensión

A = {0, 1, 2, 3, 4, ….}

Método de Comprensión

A = {X | x es un número dígito }

18

Conceptos Básicos de Probabilidad

Subconjuntos:

Sean A y B dos conjuntos. Si todo elemento de A es también elemento de B,

diremos que A es subconjunto de B. Simbólicamente se escribe A B

Dos conjuntos A y B son iguales (A=B) si y solo si A B y B A

El conjunto Vacío es aquel que no tiene elementos y se representa por φ

El conjunto vacio es un subconjunto del cualquier otro conjunto

19

A B

C

U

Diagramas de Venn

20

Operaciones con conjuntos

Unión

Intersección

Conjuntos mutuamente excluyentes

Complemento

Diferencia

21

Probabilidad de Eventos

22

Propiedades de la Definición

Clásica de Probabilidad

a) P(S) = 1

b) P(O)= 0

c) 0 ≤ P(A) ≤ 1

d) P (AUB) = P(A) + P(B) sí AB = O

e) P(AUB) =P(A) + P(B) – P(AB)

f) SI A ‹ B, P(A) ≤ P(B)

g) P (ABC) = P(A) – P(AB)

23

Variable Aleatoria

Experimento aleatorio Espacio Muestral

Variable Aleatoria: Una Variable Aleatoria (VA) es

una función en la que a cada

resultado posible de un

experimento aleatorio le

asocia un número real

24

Distribución de Probabilidad de

una Variable…

25

Representación gráfica…

26

Dos medidas

27

Distribución Normal

Fue desarrollada por Jakob Bernoulli (Suiza, 1654-1705)

es la principal distribución de probabilidad discreta

Algunos experimentos consisten en la observación de una serie de

pruebas idénticas e independientes, las cuales pueden generar uno de

dos resultados posibles, los cuales por conveniencia se denotan como

éxito (e) o fracaso (f).

ensayo Bernoulli

Un evento A relacionado con el experimento podría ser considerado

como éxito y su complemento como fracaso.

28

El experimento consta de n pruebas idénticas e independientes

(llamados ensayos de Bernoulli).

Cada prueba tiene dos resultados posibles. A uno de ellos se le llama

éxito y al otro fracaso.

La probabilidad de tener éxito en una sola prueba es igual a p y

permanece constante de prueba en prueba. La probabilidad de un

fracaso es igual a 1-p .

La variable aleatoria bajo estudio es X, que representa el número de

éxitos observados en las n pruebas.

Características de la Distribución

Binomial

29

Si repetidas pruebas idénticas e independientes pueden resultar en un

éxito con una probabilidad y en un fracaso con una probabilidad de ,

entonces la distribución de probabilidad de la variable aleatoria X, que

representa el número de éxitos observados en las n pruebas, está dada

por:

Los parámetros de la distribución son n y p.

nxqpx

npnxb xnx ,,1,0,,,

30

La media y la varianza de la distribución binomial están

dadas por:

pnxb ,,

npXE npqXVar 2

Media y varianza de la

distribución binomial

Ejemplos…

31

Distribución Normal

Fue reconocida por primera vez por el francés Abraham de Moivre (1667-

1754)

Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y

formuló la ecuación de la curva; de ahí que también se le conozca, más

comúnmente, como la "campana de Gauss“

La distribución de una variable normal está completamente determinada

por dos parámetros, su media y su desviación estándar

La distribución continua de probabilidad más importante de toda la

estadística es la distribución de probabilidad normal.

Es de vital importancia para la estadística debido a que existe un número

elevado de variables cuya distribución se parece o se aproxima a una

curva normal, sobre todo, variables de poblaciones relativamente

homogéneas

La curva normal es la representación gráfica de la distribución normal, que

es una distribución con mayor densidad en el centro de la distribución la

que luego disminuye gradual y simétricamente

32

Modelo teórico de la curva

normal

33

Las curvas normales varían entre sí con respecto a su media

y/o a la desviación estándar . La media determina la posición

de la curva sobre el eje de las abscisas y la desviación

estándar determina la variabilidad de los datos alrededor de la

media

Distribución Normal

La notación que usaremos para

identificar a una variable normal

X cualquiera es, X~N (µ, σ2).

34

Si X~N (µ, σ2), entonces:

La distribución es simétrica alrededor de la media.

Los valores correspondientes a la media, mediana y moda son

iguales y constituyen el punto central o de equilibrio de la

distribución.

La distancia horizontal entre la línea vertical erigida sobre la media

µ y el punto de inflexión de la curva es la desviación estándar σ de

la distribución.

El área total bajo la curva es igual a uno.

Propiedades de la

Distribución Normal

35

Distribución normal estándar

36

Propiedades…

La media de los valores z es igual a cero.

La varianza y consecuentemente la desviación estándar de los valores

z es igual a uno.

Nota!

La distribución de probabilidad normal asociada al valor de Z recibe el

nombre de distribución normal estándar

Ejemplos…

37

Aproximación de la distribución

normal a la binomial

Las probabilidades que se asocian con experimentos binomiales pueden

obtenerse fácilmente cuando n es pequeña, de la formula b(x, n, p) de la

distribución binomial. Si n es grande, resulta conveniente calcular las

probabilidades binomiales por procedimientos de aproximación a una

distribución discreta cuando esta última tiende a comportarse de manera

simétrica. Así, para utilizar áreas bajo la curva normal para aproximar

propiedades binomiales cuando n es suficientemente grande se tiene el

siguiente hecho:

38

Aproximación de la distribución

normal a la binomial

39

Teorema central de límite

x

x

40

Inferencia

Inferencia

Estimación

Puntual Intervalo

Prueba de Hipótesis

41

Estimación puntual

42

Propiedades deseables de los

estimadores puntuales

Estimador insesgado

Estimador consistente

Estimador eficiente

Estimador suficiente

43

Estimación por intervalo

44

45

La prueba de hipótesis comienza con una suposición, denominada

hipótesis, que hacemos en torno a un parámetro de la población.

Posteriormente se reúnen los datos muéstrales, se calculan las estadísticas

de la muestra y en base a estos valores, con cierto grado de probabilidad,

decidimos que el parámetro supuesto de la población sea razonablemente el

aproximado.

Prueba de Hipótesis

46

Prueba de Hipótesis

No podemos "aceptar" ni rechazar una hipótesis

referente a un parámetro de la población por

mera intuición. Por el contrario, necesitamos

aprender a decidir con objetividad, basándonos

en la información de la muestra.

47

Prueba de Hipótesis

¿Cuál es el valor de la estadística en este procedimiento de prueba de

hipótesis?

¿Cómo se decide si una muestra no concuerda con la hipótesis del

investigador?

¿Cuándo debe rechazarse la hipótesis, cuándo debe aceptarse y cuándo

no debe emitirse la decisión?

¿Cuál es la probabilidad de tomar una decisión equivocada y en

consecuencia sufrir una perdida?, y en particular, ¿qué función de las

mediciones muéstrales debe utilizarse para tomar una decisión

48

Elementos de una prueba

de hipótesis estadística

1. Hipótesis nula H0.- Es la hipótesis por probar. Generalmente es una

aseveración en el sentido de que un parámetro poblacional tiene un valor

específico. Esta hipótesis nula recibe tal nombre debido a que es el "punto de

partida" de la investigación. Comúnmente se utiliza en su interpretación la frase

"no existe diferencia significativa para rechazar H0".

2. Hipótesis alterna H1.- Es la hipótesis sobre la cual se enfoca la atención, es

una aseveración sobre el mismo parámetro poblacional que se utiliza en la

hipótesis nula. Generalmente se especifica que el parámetro poblacional tiene un

valor diferente de alguna manera, al establecido en la hipótesis nula. El rechazo

de la hipótesis nula implicará la "aceptación" de la hipótesis alterna.

3. Estadístico de prueba.- Variable aleatoria utilizada para tomar la decisión "no

se rechaza H0" o bien "se rechaza H0".

4. Región de rechazo.-Conjunto de valores de la estadística de prueba que

causan el rechazo de la hipótesis nula.

49

4.3 Prueba de hipótesis bilaterales y unilaterales

Si se plantea la hipótesis nula de la forma , donde es el

parámetro de interés y es el valor que se supone tiene el parámetro,

entonces la hipótesis alterna puede plantearse de acuerdo a alguna de las

tres opciones siguientes:

H1

H2

H3

ˆ

ˆ

ˆ ˆ