Inferencia Estadística y Distribuciones Muestrales

Preview:

DESCRIPTION

CLASES DE MAESTRIA UNDAC 2015

Citation preview

DOCENTE: Mg. Sc. Ing. EDGAR ALCÁNTARA TRUJILLO

Una de las actividades más típicas e importantes de la estadística es la de extraer conclusiones sobre el todomirando solo una parte.

Grima (2010)

Parámetros

Población

Variable

Resumir (idea global)

Bien definido (fórmula aritmética)

Medidas de posición:Media , mediana, moda

Medidas de dispersión:Desviación estándar, varianza

Medidas de forma:Asimetría, curtosis

Otros parámetros: Proporción, correlación

Es un número que

caracteriza los datos de

una población que se

derivan del estudio de

una variable estadística.

Dentro de la estadística inferencial se refiere al conjunto de

técnicas que permiten dar un valor aproximado de un parámetro a

partir de los datos proporcionados por una muestra.

¿Por qué se analizan

muestras y no poblaciones?

Aron, Aron y Coups (2013)

Muestreo aleatorio

¿Cómo debe ser la selección del muestreo para que los resultados se puedan generalizar a la población?

Estadísticos muestrales

Aron, Aron y Coups (2013)

Es un estadístico cuyo valor es usado como una aproximación al valor verdadero de un parámetro, una vez tomada la muestra aleatoria.

Toda estadística es una variable aleatoria (es variable porque cambia de muestra en muestra, y es aleatoria si la muestra se toma al azar).

Field (2009)

Grima (2010)

Es la diferencia entre el Estimador y el Parámetro.

Error de Estimación =

Calderón (2011)

Calderón (2011)

Calderón (2011)

Calderón (2011)

Ejemplo:

Calderón (2011)

De la población de alumnos de primer grado de un colegio estatal, se tomó una

muestra aleatoria simple de n = 30 alumnos, se registró sus puntajes es una

Prueba de Comprensión de Lectura y si habían tenido Aprestamiento previo a su

matrícula. Se deseaba estimar el parámetro µ en Comprensión de Lectura y el

parámetro P de Alumnos con Aprestamiento.

Calderón (2011)

En un estudio se tomó una muestra aleatoria (n= 164) de la población de trabajadores de una mina ABC y se les aplicó la Escala de Creencias Obsesivas (puntajes posibles entre 1 y 7). Como análisis previos de la investigación se quería saber lo siguiente (evaluar la calidad de las estimaciones halladas):

1. ¿Cuál sería el rango de estimación para la media del puntaje total de la prueba de creencias obsesivas?

2. b) ¿A nivel poblacional existirá alguna mina donde sus trabajadores tengan una media mayor en creencias obsesivas?

3. c) ¿Habrá diferencias a nivel poblacional entre hombres y mujeres en cuanto a sus creencias obsesivas?

La definición de probabilidad fue dada por Laplace ydesde entonces se ha repetido en casi todos los librossobre la teoría de probabilidades. En su forma primitivadice: “Probabilidad, es la razón del número de cosasfavorables al número total de cosas igualmente posibles”.

En la interpretación del concepto de probabilidad se hanseguido dos escuelas. La primera, clásica u objetivista,interpreta la probabilidad como la frecuencia relativa dela ocurrencia de algún evento o resultado(consecuencia).

La segunda escuela, es la subjetivista o Bayesiana, lacual utiliza los resultados a priori para calcular laprobabilidad de ocurrencia de varios estados deluniverso (también llamado espacio de eventos), en unaetapa particular del experimento de que se trata.

En los últimos anos se han incrementado el uso de losmodelos probabilísticos, debido a que presentan muchasventajas al aplicarse a situaciones reales. En los modelosprobabilísticos interviene un conjunto de variables aleatorias,las cuales se rigen por algún parámetro (poblacional) comotiempo o espacio. A los procesos aleatorios también se lesconoce como proceso estocásticos.

Las incertidumbres asociadas con el comportamientohumano, en diferentes situaciones, se adaptan de unamanera adecuada a los modelos probabilísticos y a losprocesos estocásticos.

Estos modelos podrían utilizarse para analizar: Movilidadindustrial de trabajadores o empleados, sistemas educativos,procesos de una enfermedad, teoría de colas e inventarios,modelos de transporte, probabilidad de ocurrencia de erroresen levantamientos topográficos, entre otros.

EXPERIMENTO:

Es cualquier actividad bien definida capaz de repetirse encondiciones esencialmente estables; una situación en la que estápresente la incertidumbre.

EXPERIMENTO ALEATORIOEs todo proceso que consiste de la ejecución de un acto (o prueba) una o más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede predecir con certeza. Es decir un experimento es aleatorio cuando se puede repetir indefinidamente y cuando los resultados en cada repetición no son predecibles.

Ejemplo:

Lanzamiento de un dado imparcial es un experimento aleatorio, puesto que antes de lanzar no tenemos la seguridad plena acerca de qué cara quedará hacia arriba.

ESPACIO MUESTRAL (Ω) :

Se denomina así al conjunto queconsiste de todos los resultadosposibles de un experimento aleatorio.

Cada resultado posible de unexperimento aleatorio es un elemento(punto muestral) del espacio muestral.

Ω = ω/ω es un punto muestralSi el espacio muestral tiene un númerofinito de elementos es posible enlistar atodos, y si el numero de elementos esinfinito se describen mediante unenunciado o regla.

El experimento de lanzar un dado y observar elresultado, el espacio muestral se puede escribircomo el conjunto de puntos muéstrales:

Ω1 = 1, 2, 3, 4, 5, 6 El experimento de lanzar una moneda 3 veces (o

lanzar tres monedas a la vez) y observar elresultado global, el espacio muestral se puedeescribir como el conjunto de ternas ordenadas:

Ω2 = CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS Si el experimento aleatorio es lanzar una moneda

y un dado a la vez, y observar ambos resultados,el espacio muestral es:

Ω3 = 1C, 2C, 3C, 4C, 5C, 6C, 1S, 2S, 3S, 4S, 5S, 6S

Si el experimento aleatorio es lanzar unamoneda tantas veces como sea necesariohasta que aparezca la primera cara, suespacio muestral es el conjunto:

Ω4 = C, SC, SSC, SSSC, … etc. Si el experimento aleatorio es medir la vida

útil (en años) de un componenteelectrónico, su espacio muestral es elconjunto:

Ω5 t Є R/ t ≥ 0 Si el experimento aleatorio consiste en

determinar la posición de caída de un dardoque es lanzado hacia un blanco circular deradio 5 cm., su espacio muestral es elconjunto:

Ω6 = (x, y) Є R/ x2 + y2 ≤ 25

Por el número de elementos o puntos muestralesse clasifican en:

1. DISCRETOS FINITOS: consisten de un numerofinito de elementos. Ejemplo los espacios: Ω1,Ω2, Ω3

2. DISCRETOS INFINITOS: consisten de unnumero infinito numerables de elementos.Ejemplo el espacio: Ω4

3. CONTINUOS: consisten de un numero infinitono numerables de elementos. Ejemplo losespacios: Ω5 y Ω6.

EVENTOS: Se denomina evento a cualquier subconjunto de un

espacio muestral.

Por ejemplo en el espacio muestral finito Ω = w1,w2, …, w3 de n elementos se puede definir 2n

eventos diferentes, también tenemos,

El evento imposible Ø que no tiene puntosmuestrales, en consecuencia no ocurre nunca.

Los eventos unitarios o elementales, wi quecontienen un solo punto muestral.

Los eventos compuestos que consisten de dos omás eventos elementales.

El evento seguro o cierto Ω que contiene a todoslos elementos posibles.

A priori significa aquello que se puede deducir usando la razón, sinla experiencia. Desde este punto de vista se define la probabilidadcomo:

Ejemplo:

Cuál es la probabilidad de que el dado se detenga con un 2 haciaarriba?

SOLUCIÓN:

Como existen 6 números posibles y sólo uno de ellos es un 2, laprobabilidad de dos 2 es una tirada de un dado es:

Resultados posibles: Ω = 1; 2; 3; 4; 5; 6 ...... n(Ω) = 6

Casos favorables: A = 2 …….. n(A) = 1

posiblescasosdetotalNúmero

AafavorablescasosdeNúmeroAP )(

1667.06

1)( AP

A posteriori significa “después del hecho”; en el contexto de laprobabilidad, significa después de reunir algunos datos. Desde elpunto de vista a posteriori se define como:

Ejemplo:

Cuál es la probabilidad de obtener un 2 después de lanzar el dado100 000 veces, y que un dos apareció en 16 000 ocasiones?

SOLUCIÓN:

Mientras más arrojemos el dado, será mejor.

Para este problema:

ocurenciasdetotalCantidad

ocurridohaAquevecesdeNúmeroAP )(

16.0100000

16000)2()2(

ocurenciasdetotalCantidad

ocurridoaquevecesdeNúmeroP

REGLA DE LA ADICIÓN:

La probabilidad de ocurrencia de A ó B es igual a la probabilidadde ocurrencia de A más la probabilidad que ocurra B menos laprobabilidad de que ocurra A y B:

De igual manera, dos eventos son mutuamente excluyentes si laocurrencia de uno impide la ocurrencia del otro. En este caso:

:

Ejemplo:

Cuál es la probabilidad de elegir un 2 ó un As al extraer una cartade la baraja ordinaria.

SOLUCIÓN:

Como queremos un 2 ó un As y como estos eventos sonmutuamente excluyentes, aplicamos la regla anterior:

)()()()( BAPBPAPBAP

%38.151538.052

4

52

4)()2()2( AsPPAsóP

)(:);()()( BASiBPAPBAP

REGLA DEL PRODUCTO:

La probabilidad de ocurrencia de A y B es igual a la probabilidad deocurrencia de A por la probabilidad de que B ocurra, dado que A haocurrido.

Observe que el símbolo (B/A) se lee como la “probabilidd de queocurra B dado que A ha ocurrido”

De igual manera, dos eventos son independientes si la ocurrenciade un evento no tiene efecto sobre la probabilidad de ocurrenciadel otro. :

Ejemplo:

Cuál es la probabilidad de que ambas cartas sean ases?

SOLUCIÓN:

Como el problema pide un As en la primera y segunda extracción,podemos aplicar la regla del producto. Sea A un As en la primeraextracción y B un As en la segunda.

A

BPAPByAP ).()(

0059.02704

16

52

4.

52

4)()2()2(

BAPPAsóP

)().()( BPAPBAP

Consideramos un espacio S igual a la unión de loseventos mutuamente excluyentes: E1; E2; E3; …..Ek, y un evento cualquiera R en S; entonces laprobabilidad de R, conocido como principio deexpansión o probabilidad marginal, es:

Ejemplo:

En un salón de clase, el 32% de los estudiantesson hombres. Asimismo, se sabe que el 10% delos estudiantes son de provincias, mientras que el60 % de las mujeres son de Lima. Si de la lista deestudiantes del salón se selecciona al asar uno deellos, Cuál es la probabilidad que sea de Lima?

k

i i

iE

RPEPRP

1

).()(

Evento M = Seleccionar estudiante mujer.

Evento H = Seleccionar estudiante hombre

696.0)60.0)(68.0()90.0)(32.0()(

)/().()/().()(:tan

60.0%60)/(

.Pr)/(

90.0%90%10%100)/(

.varPr)/(

68.0%68%32%100)(

32.0%32)(

LP

MLPMPHLPHPLPtoloPor

MLP

LimadeseamujerestudianteunaquedeobabilidadMLP

HLP

LimadeseaónestudianteunquedeobabilidadHLP

MP

HP

SOLUCIÓN:

A. VARIACIONES SIMPLES

Es cada uno de los arreglos u ordenes quese hagan con los k objetos, de maneraque, estos arreglos difieran en algúnelemento o en el orden de colocación.

Ejemplo: las variaciones de 2 elementosdel conjunto A = a, b, c, d son lossiguientes arreglos: ab, ac, ad, ba, bc, bd,ca, cb, cd, da, db, dc.

El numero de variaciones esta dado por:

. )!(

!

kn

nV n

k

2. VARIACIONES CON REPETICIONCada uno de los arreglos de los kobjetos, puede ser uno mismo de losn objetos.Ejemplo: las variaciones conrepetición de dos elementos tomadosde los elementos a, b, c, son: aa,ab,ac, ba, bb, bc, ca, cb, cc.

El numero de variaciones conrepetición esta dado por:

.kn

k nVR

De cuántas maneras diferentesse puede formar números de 5cifras con los dígitos 3, 4, 5, 6, 7,8, 9 de manera empiecen con 6 oterminen en 8, si los dígitos:

a) no se repitenb) se repiten

1. PERMUTACIONES SIMPLESSe denominan permutaciones de n objetos acada una de las variaciones de los n objetosdistintos.Ejemplo: son permutaciones de las letras a,b , c las siguientes variaciones sinrepetición de todas: abc, acb, bac, bca, cab,cbaEl numero de permutaciones esta dado por:

.

!nVP n

n

n

2. PERMUTACIONES CIRCULARES

Son las diferentes permutaciones quepueden formarse con n objetos distintos,donde no hay ni primero ni ultimo objeto,ya que todos forman un “circulo” (ocualquier otra figura plana cerrada)

El numero de permutaciones circulares estadado por:

)!1( nPC n

3. PERMUTACIONES CON OBJETOS REPETIDOS

El numero de permutaciones de n objetosde los cuales n1 son iguales entre si, n2 soniguales entre si, …, y nk son iguales entre si,esta dado por:

!!...!

!

21

,..,2,1

k

n

nknnnnn

nP

Ejemplo:

Las permutaciones de las 4 letras a, a, b, bson:

aabb, abab, abba, baba, baab, bbaa

El numero total es:

6!2!2

!44

2,2 x

P

¿De cuantas formas diferentes se pueden ordenartodos los elementos del conjunto:

A = 1, 2, 3, 4, 5, 6, 7, 8, 9

de manera que los elementos 1 y 9 no aparezcanjuntos?

Ejercicio 3: ¿De cuantas maneras diferentes pueden sentarse 9

personas alrededor de una mesa elipsoidal si dospersonas determinadas deben estar uno al lado delotro?

Ejercicio 4: El numero de formas diferentes de permutar 12

objetos iguales en todo (salvo el color), de loscuales 3 son negro, 4 son blanco y 5 son rojo es:

1. COMBINACIONES SIMPLES

Se denomina combinaciones a la selecciónque se puede hacer de k objetos de los ndados, sin tener en cuenta el orden de losmismos y de manera que no pueden haberdos combinaciones con los mismoselementos.

Ejemplo: las combinaciones de 3 de losnúmeros: 1, 2, 3, 4, 5 son:

123, 124,125, 134, 135, 145, 234, 235,245, 345

El número total de combinaciones esta dadopor:

Propiedades para las combinaciones:

)!(!

!

knk

nC n

k

nm

t

t

k

n

kt

m

k

n

k

nn

k

n

k

n

k

n

k

n

k

n

k

n

kn

n

k

n

n

n

CxCC

C

xCk

knC

CCC

CC

CC

0

0

1

1

1

0

)6

2)5

1)4

)3

)2

1)1

2. COMBINACIONES CON REPETICIONEl numero de combinaciones de k objetostomados de n objetos, de manera que doso k objetos pueden ser uno mismo(repetirse), esta dado por:

Ejemplo: las combinaciones con repeticiónde orden dos a partir de los cuatroelementos a, b, c, d son: aa, ab, ac, ad, bb,bc, bd, cc, cd, ddEl número de estas combinaciones es:

.

)!1(!

)!1(1

nk

kn

k

knCR n

k

10)!14(!2

)!124(4

2

CR

Si los eventos E1, E2, E3,….,Ek formanuna partición del espacio S; y R un eventocualquiera de S; entonces, considerandolas condiciones anteriores dadas en laprobabilidad total y además siendo P(R)diferente de cero:

)(

).(

RP

R

EPEP

R

EP

ii

i

EJEMPLO:

Considere 18 tiradores clasificados en 4 grupos. En el primer grupo hay

cinco tiradores con probabilidad de 0.8 de dar en el blanco, en el segundo

hay siete con probabilidad 0.7, en el tercero hay 4 con probabilidad de 0.6; y

en el último con probabilidad de 0.5 de dar en el blanco. Se elige al azar un

tirador, dispara y no da en el blanco. A qué grupo es más probable que

pertenezca?

SOLUCIÓN:

Evento E1: Tirador elegido pertenece al grupo E1 = 5

Evento E2: Tirador elegido pertenece al grupo E2 = 7 Σ=16 T=18

Evento E3: Tirador elegido pertenece al grupo E3 = 4

Evento E4: Tirador elegido pertenece al grupo E4 = 2 = 18-16

Las probabilidades de los eventos son:

Si ocurre E1, entonces la probabilidad P(R/E1) = 0.8

Si ocurre E2, entonces la probabilidad P(R/E2) = 0.7

Si ocurre E3, entonces la probabilidad P(R/E3) = 0.6

Si ocurre E4, entonces la probabilidad P(R/E4) = 0.5

18

4)(,

18

7)(,

18

5)( 321 EPEPEP

Luego, aplicando la fórmula de la probabilidad total, se tiene:

Calculemos ahora P(Ei/R), i = 1, 2, 3, 4

CONCLUSIÓN: El grupo 4 tiene baja probabilidad de dar en el blanco. Por

lo tanto es más probable que el tirador pertenezca a este

grupo.

683.0)5.0(18

2)6.0(

18

4)7.0(

18

7)8.0(

18

5)( RP

0813.0683.0

)8.0(18

2

)(

)/).(()(

1951.0683.0

)8.0(18

4

)(

)/).(()(

3984.0683.0

)7.0(18

7

)(

)/).(()(

3252.0683.0

)8.0(18

5

)(

)/).(()(

444

333

222

111

RP

EREP

R

EP

RP

EREP

R

EP

RP

EREP

R

EP

RP

EREP

R

EP

Estimación de Intervalo

Confiabilidad asociada a la probabilidad de que el intervalo dado cubra realmente al

parámetro

Intervalo de Confianza (IC)

Estudiar las distribuciones asociadas a los principales

estadísticos

+

=

Es una distribución hipotética.

Se presenta cuando se selecciona un infinito número de muestras de la población y se calcula una estadística en particular (la media) para cada una.

Cuando se grafica estos cálculos con un histograma se obtendrá una distribución muestral.

Dancey y Reidy (2011)

Field (2009)

Comportamiento de parámetros poblacionales

Predice la mayor o menor frecuencia relativa (probabilidad) con que se presentan los posibles

valores del estadístico

Muestras aleatorias

Estadístico (variable aleatoria)

Distribución de probabilidades

• Es la transformación de una observación que describe mejor el lugar que

esa observación ocupa en la distribución.

• Indica a qué cantidad de desviaciones estándar por encima (+) o por

debajo (-) de la media se encuentra dicha observación.

Aron, Aron y Coups (2013)

¿Cuál sería la

puntuación Z de

Jerome?

A un grupo de niños se le aplica una prueba de inteligencia (WISC); supóngase que las puntuacionesse distribuyen en forma normal y tienen los parámetros siguientes: σ = 15, μ = 100. Determinar:

a) Si la proporción normal de inteligencia entérminos del CI está entre 90 y 110, quéporcentaje de niños están en este intervaloP(90≤x≤110)?

b) Qué porcentaje de ninos obtuvieron un CI mayor que 110?, es decir P(x≥110)?.

c) Qué porcentaje de niños tienen menor que el término medio o menos de 90; P(x≤90)?.

Dancey y Reidy (2011)

SOLUCIÓN (a):

PASO 1:

Se calculan los valores de Z para 90 y 110, o sea x1 = 90 y x2 = 110.

Puntuación Z para 90:

Puntuación Z para 110:

PASO 2:

Se determina el porcentaje entre la media y cada una de las puntuaciones Z

obtenidas anteriormene, utilizando la table de distribución binomial Z. Se

obtiene que el área bajo la curva entre la media y la puntuación Z(-0.67) es

24.86%; y para Z(0.67) es 24.86%, lo que da un total de 49.72%. Por lo tanto,

éste es el resultado esperado de ninos que presentan un CI normal entre 90 y

110.

67.015

10

15

10090

iXZ

67.015

10

15

100110

iXZ

SOLUCIÓN (b):

PASO 1:

Se calculan los valores de Z para 110.

Puntuación Z para 110:

PASO 2:

Se ubica en una gráfica el valor de Z obtenido:

Como se localiza en la table de distribución binomial el valor del área del

extremo derecho y el valor anterior, 24.86% es el área de la media a 110, y

dado que dicha área es de 50%, se resta a 50% el valor de 24.86% y éste

será el porcentaje del área buscado: 50% - 24.86% = 25.14%.

Esta área en la gráfica equivale a 25.14% significa el porcentaje de ninos con

CI superiors al término medio.

67.015

10

15

100110

iXZ

SOLUCIÓN (c):

PASO 1:

Se calculan los valores de Z para 90.

Puntuación Z para 90:

PASO 2:

Se ubica en una gráfica el valor de Z obtenido:

Como se localiza en la tabla de distribución binomial Z, el valor del área hacia

el lado izquierdo es 24.86%. Por lo que, el área buscado se obtiene restando:

50% - 24.86% = 25.14% hacia el lado izquierdo.

Esta área en la gráfica, el 25.14%, significa el porcentaje de ninos con CI

inferiores al término medio.

67.015

10

15

10090

iXZ

• Seis meses después de divorciarse, cada uno de los ex esposos de una pareja realiza una prueba para medir su adaptación al divorcio. El registro de la esposa es 63 y el del esposo 59 (mientras mayor puntaje obtenga implica que su adaptación es mejor). Por lo general, la media para mujeres que realizan esta prueba es 60 (S=6); la media para hombres divorciados es 55 (S=4). ¿Cuál de los dos se ha adaptado mejor al divorcio en relación con otras personas divorciadas del mismo sexo?

• La puntuación de una persona en una prueba de aptitud verbal es de 81 y de 6.4 en una prueba de aptitud numérica. En el caso de la prueba de aptitud verbal, la media para las personas en general es 50 y la desviación estándar es 20. En el caso de la prueba de aptitud numérica, la media para las personas en general es 0 y la desviación estándar es 5. ¿Cuál es la mayor aptitud de esta persona, la verbal o la numérica?

Aron, Aron y Coups (2013)

Distribución normal estándar

Calderón (2011)

Ejemplo 2:

Si en las pruebas de CI las puntuaciones tienen una distribución

X ~ N (100, 256).

a) ¿Cuál es la probabilidad de que una persona obtenga un puntaje menor a

90 puntos?

b) ¿Cuál es la probabilidad de que una persona obtenga un puntaje mayor a

90 y menor a 110 puntos?

c) ¿Cuál es el mínimo CI que necesitaría una persona para estar dentro del

5% superior?

Ejemplo:Si en Apurímac el 22% de alumnos de secundaria tiene buen manejo del castellano y

se toma una muestra aleatoria de 50 escolares. ¿Con qué probabilidad menos de 1/5 de

la muestra mostrará este atributo?

Gonick y Smith (1993)

Gonick y Smith (1993)

Gonick y Smith (1993)

Gonick y Smith (1993)

Recommended