ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
1
TRABAJO COLABORATIVO 1
Presentado a:
JEAMMY JULIETH SIERRA HERNÁNDEZ
Por:
GRUPO No. 173
PLINIO NIBARDO GONZALEZ NEMOCON
FRANKLIN BLANDÓN GAMBOA
INFERENCIA ESTADÍSTICA
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
OCTUBRE 2013
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
2
CONTENIDO INTRODUCCIÓN..................................................................................................... 3 OBJETIVOS…………..……………………………………………………………………4 PUNTO 1…………………………………………………………………………………...5 PUNTO 2.................................................................................................................. 8 PUNTO 3……………………………………………………….………………………….11 PUNTO 4………………………………………..………..………………………………..16 PUNTO 5…………………………………………….…………………………………….17 CONCLUSION……………………………………..……………………………………...20 REFERENTES......................................................................................................... 21
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
3
INTRODUCCIÓN
En el presente trabajo se dará a conocer el conjunto de métodos estadísticos que
permiten deducir (inferir)como se distribuye la población en estudio o las
relaciones estadísticas entre varias variables de interés a partir de la información
que proporciona una muestra, es así como se estimara que estará cierto valor
desconocido con una determinada probabilidad de acierto. Formalmente, estos
números determinan un intervalo, que se calcula a partir de datos de una muestra,
y el valor desconocido es un parámetro poblacional.
Por esta razón es necesario conceptualizar, la estimación como una medida del
grado de confianza que se merece, la cual se consigue mediante un intervalo de
confianza que proporcione unos límites dentro de los cuales se confía esté el valor
desconocido del parámetro. Esta confianza de inclusión se mide mediante un
porcentaje. Se analizara en forma concreta también el muestreo estadístico pues
es un procedimiento por el que se ingresan los valores verdaderos de una
población a través de la experiencia obtenida con una muestra.
El muestreo como herramienta de la investigación científica arroja resultados que
se pueden utilizar para concluir un determinado estudio X de población, al igual las
técnicas selectivas que se requieren para dicho estudio de acuerdo a lo que se va
a evaluar.
En los principios de muestreo se analizara que estudiar la población no es
práctico, por tiempo y costos, lo que induce a seleccionar una muestra, cuya
importancia radica en el proceso de consecución de datos que proporcionan la
información suficiente y necesaria a cerca de la población, además que con la
muestra se están utilizando menos recursos, debido a que sólo una parte de la
población se encuentra bajo observación, lo que resulta significativamente
beneficioso sobre todo cuando se trata de poblaciones grandes y dispersa.
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
4
OBJETIVOS
Se hará el recorrido por el contenido temático para así tener la oportunidad
de avanzar en el aprendizaje autónomo, porque se crea un vínculo de
reconocimiento para no crear falsas expectativas en cuanto a la
metodología o las herramientas proporcionadas durante el proceso.
Se reconocerá la temática, analizando cuidadosamente la secuencia y se
entendió la estructura del curso, dominando el contexto de plataforma
virtual.
Se estudiaran el nivel de confianza y la amplitud del intervalo, donde de
denotara que un intervalo más amplio tendrá más posibilidades de acierto
(mayor nivel de confianza), mientras que para un intervalo más pequeño,
que ofrece una estimación más precisa, aumentan sus posibilidades de
error.
Se mostrara los diferentes métodos para calcular los intervalos de confianza, a partir de muestras grandes y pequeñas, para estimar los parámetros poblacionales de una media y proporción, así como para la diferencia de medias y proporciones.
Se identificaran los principios sobre población y muestra, métodos de muestreo, distribución de muestreo para medias, el teorema central del límite, aplicados al cálculo de tamaños de muestras pertinentes.
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
5
PUNTO 1
Dar doble clic sobre la imagen para que se abra la hoja de cálculo (esto si la
necesita, de lo contrario bórrela)
peso: xi 100 98 78 106 99 97 103 96
frecuencia:fi 5 4 1 10 5 2 4 2
La imagen a continuación les muestra donde se da clic acá en el Word para
insertar una hoja de cálculo de Excel (esto es sólo una guía borre la imagen
luego)
El peso de caja es de: X/N ( u; 6.25)
Para obtener el intervalo de confianza para la media (u) se utiliza la siguiente
fórmula:
P (X − Zoσ
√n< u < X + Zo
σ
√n) = 1 − α
n = representa las frecuencias de los pesos Xi
X =1
n∑ Xini =
603.729
33= 18.294
k
t=1
Para obtener el intervalo de confianza al 90%, según la tabla normal corresponde
al valor de: Zo = 1.654
Al usar la tabla normal acumulada se busca el valor correspondiente a 1 −α
2= 1 −
0.05 = 0.95 que se encuentra entre 1.64 y 1.65
Luego se sustituyen todos los valores encontrados en el intervalo de confianza:
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
6
18.294 − 1,6542,5
√33< u < 18.294 + 1.645
2,5
√33
17,574 < u < 19,322
Luego el peso medio de la caja está comprendido entre 18,294 y 19,322 gramos
con un nivel de confianza del 90%.
1 − α = 0.90
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
7
Para insertar ecuaciones use el editor de Word, en la barra de herramientas
busque el símbolo de (esto es sólo una guía borre la imagen luego)
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
8
PUNTO 2
Teniendo en cuenta que se quieren construir intervalos de confianza para la media. Complete la siguiente tabla por filas. Por ejemplo, para la primera fila: ¿qué valor debe colocar en Zo (valor crítico en la tabla normal) si el nivel de confianza es del 99%? ¿Cuál es el tamaño de la muestra? ¿Cuál es el límite superior? ¿Cuál es el límite inferior? Repite lo mismo para la segunda fila y sucesivamente. Finalmente, concluya la relación existente entre el tamaño de muestra, el nivel de
confianza y la amplitud de un intervalo de confianza.
Primera fila.
Desviación Muestral Nivel de confianza Zo Error de
Estimación B Tamaño de la muestra n Límite inferior Límite superior
1 186 8 99 2,576 1,46 199 186,54 187,46
2 186 8 95 1,96 1,46 115 186,54 187,46
3 186 8 90 1,645 1,46 81 186,54 187,46
4 186 8 90 1,645 0,93 200 185,07 186,93
5 186 8 95 1,96 1,1 200 184,04 187,1
6 186 8 99 2,576 1,45 200 184,55 187,45
99%
Nivel de significación; α = 0.01
Nivel de confianza: 1- α = 0.99
α/2 = 0.005
= 0.995
Según la tabla de Probabilidad distribución normal para un valor de 0.995 Z= 2.576
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
9
95%
Nivel de significación; α = 0.05
Nivel de confianza: 1- α = 0.95
α/2 = 0.025
= 0.975
Según la tabla de Probabilidad distribución normal para un valor de 0.975 Z= 1.96
90%
Nivel de significación; α = 0.1
Nivel de confianza: 1- α = 0.9
α/2 = 0.05
= 0.95
Según la tabla de Probabilidad distribución normal para un valor de 0.975 Z= 1.645
n= ((Zo*σ)/(error de estimación))^2
Limites superiores e inferiores
(X) ̅±Z (σ/√n)
Calculo del error de estimación
Error de estimación=Zo (σ/√n)
Se puede concluir si queremos mantener un intervalo de confianza constante, disminuyendo el nivel de confianza 99%, 95% 90% se debe disminuir el número de muestras, si se mantiene el número de muestras constantes se puede apreciar que los intervalos de confianza varían al modificar el nivel de confianza.
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
10
Media
muestral
Desviació
n
Nivel de
confianza
(1-a)
Zo
Error de
estimación
(B )
Tamaño
muestra
(n)
Límite
inferior
Límite
Superior
186 8 99% 2,576 1,46 199 184,54 187,46
186 8 95% 1,960 1,46 115 184,54 187,46
186 8 90% 1,645 1,46 81 184,54 187,46
186 8 90% 1,645 0,930 200 185,07 186,93
186 8 95% 1,960 1,109 200 184,89 187,11
186 8 99% 2,576 1,457 200 184,54 187,46
Conclusion: a medida que aumenta el nivel de confianza asimismo se
incrementa el tamaño de la muestra; para la amplitud del intervalo se
observa que aumenta cuando aumenta el nivel de confianza
PUNTO 3
3. Lea detenidamente las siguientes instrucciones, si es necesario realice de
nuevo la lectura.
Empresa1: Ecopetrol.
Empresa2: Banco de occidente.
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
11
Los datos recopilados de las bases son:
Promedio de las acciones, desviación estándar:
Empresa2
𝛍𝐱 =∑ 𝐱
𝐧=
𝟕𝟔𝟕𝟐𝟎
𝟏𝟒= 𝟓𝟒𝟖𝟎
𝛔𝟐 =∑ 𝐱𝐢
𝟐
𝐍− 𝛍𝟐
𝛔𝟐 =∑ 𝟒𝟐𝟎𝟒𝟓𝟓𝟒𝟎𝟎
𝟏𝟒− 𝟓𝟒𝟖𝟎𝟐 = 𝟐𝟐𝟗𝟐. 𝟑𝟎𝟕𝟔𝟗𝟐
EMPRESA2 EMPRESA1
ECOPETROL BANCO DE OCCIDENTE
Precio Cierre Precio Cierre
5.520,00 32.000,00
5.430,00 32.000,00
5.450,00 32.000,00
5.460,00 32.000,00
5.450,00 32.000,00
5.460,00 32.000,00
5.440,00 32.000,00
5.450,00 32.000,00
5.440,00 32.000,00
5.490,00 32.000,00
5.500,00 31.120,00
5.480,00 32.000,00
5.560,00 32.500,00
5.590,00 32.600,00
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403- Inferencia Estadística
Trabajo Colaborativo No. 1 Grupo No. 173
12
𝛔𝐱 = √𝟐𝟐𝟗𝟐. 𝟑𝟎𝟕𝟔𝟗𝟐 = 𝟒𝟕. 𝟖𝟕𝟖𝟎𝟓𝟎𝟐𝟏
Empresa1
𝛍𝐱 =∑ 𝐱
𝐧=
𝟒𝟒𝟖𝟐𝟐𝟎
𝟏𝟒= 𝟑𝟐𝟎𝟏𝟓. 𝟕𝟏𝟒𝟐𝟗
𝛔𝟐 =∑ 𝟏. 𝟒𝟑𝟓𝟏𝟒𝟔𝟒𝟒𝟏𝟎
𝟏𝟒− 𝟑𝟐𝟎𝟏𝟓. 𝟕𝟏𝟒𝟐𝟗𝟐 = 𝟏𝟎𝟔𝟐𝟐𝟔. 𝟑𝟕𝟒
𝛔𝐱 = √𝟏𝟐𝟔𝟐𝟔𝟔. 𝟑𝟕𝟒 = 𝟑𝟐𝟓. 𝟗𝟐𝟑𝟖𝟕𝟕
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
13
EMPRESA2 EMPRESA1
ECOPETROLBANCO DE OCCIDENTE
Precio Cierre Precio Cierre
5.520,00 32.000,00
5.430,00 32.000,00
5.450,00 32.000,00
5.460,00 32.000,00
5.450,00 32.000,00
5.460,00 32.000,00
5.440,00 32.000,00
5.450,00 32.000,00
5.440,00 32.000,00
5.490,00 32.000,00
5.500,00 31.120,00
5.480,00 32.000,00
5.560,00 32.500,00
5.590,00 32.600,00
PROMEDIO= 5.480,00 32.015,71
INTERVALOS DE CONFIAZA PARA LA DIFERENCIA DE MEDIAS.
Empresa x̅ n σ
Empresa2 5480 14 47.87805
Empresa1 32015.71 14 325.92387
Tenemos un nivel de significancia del 10%.
Z(1−α 2⁄ ) = Z0.90 = 1.645
1 − α = 0.90
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
14
P(Z ≤ Zα 2⁄ ) = 0.975
Zα 2⁄ = 1.645
𝐈𝐂 = (x1̅ − x2̅̅̅ ± Zα 2⁄ √σ1
2
n1+
σ22
n2)
𝐈𝐂 = (32015.71 − 5480 ± 1.645√325.922
14+
47.87812
14) = (26535.71 ± 144.82)
IC = (26680.53, 26390,89)
El precio promedio de cierre superior está en la empresa 1, dado que es mayor
que la empresa 2.
PUNTO 4 Complete la tabla indicando, de forma clara y precisa, las características de la población que deben analizarse y tenerse en cuenta a la hora de elegir entre los siguientes tipos de muestreo. Vea el ejemplo.
TIPO DE MUESTREO CARÁCTERÍSTICAS DE
LA POBLACIÓN
FÓRMULAS O
MÉTODOS USADOS
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
15
Muestreo Aleatorio
Simple
M.A.S
Población puede ser finita o infinita.
Cantidad de muestras posibles dependen del tipo y forma de tomar las muestras.
Cada observación tiene la misma probabilidad de ser elegida
La unidad de muestreo es igual a la unidad de observación.
Tabla de números aleatorios.
Programa de computador: usando fórmulas como:
Método de Fan
Muller. Coordinado
negativo.
Muestreo Aleatorio
Estratificado.
Se identifica la población objeto de estudio.
No siempre la variable de análisis es homogénea.
Los elementos de la población se separan en estratos o sub grupos.
Los elementos de los estratos son disyuntos, solo pertenecen a un solo estrato.
Solo se requieren muestras pequeñas.
Evita obtención de muestras erróneas.
Información precisa para hacer comparaciones.
Error de estimación pequeño.
Bajo costo para encuestas.
Tamaño poblacional:
N = N1 + N2 … . NL
Promedio de la muestra:
X̅ =1
Ni∑ Xij
Ni
j=1
Tamaño de la muestra.
ni = nNi
N
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
16
Estratos identificables.
Muestreo Sistemático.
Se selecciona los elementos uno a uno y en orden.
La muestra queda ordenada.
La estimación y tamaño de muestra es similar al M.A.S.
Especial para poblaciones grandes.
Fracción de muestreo:
f =N
n
Muestreo por
Conglomerados.
Los elementos de la población están naturalmente en sub grupos.
Se usa cuando no hay lista detallada de un universo.
Para seleccionar muestra se escoge el sub grupo o conjunto en vez de unidades.
Los subgrupos se encuentra en la vida real ya agrupados.
Media poblacional:
X̅c =∑ Xi
ni=1
∑ Mini=1
PUNTO 5
5. Suponga que cuenta con un lote de 9 piezas, el cual tiene 3 artículos
defectuosos. Se van a seleccionar 4 artículos al azar de este lote sin
reemplazo. Genere la distribución muestral de proporciones para el número de
piezas defectuosas. Incluya el gráfico de frecuencias para la proporciones de
las muestras.
Ayuda En el módulo ver lección 8: Distribución muestral de la proporción.
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
17
La proporción de artículos defectuosos es 3
9= 33%
El número posible de muestras de tamaño 4 a extraer de una población de
9 elementos es 9C4=126, las cuales se pueden desglosar de la siguiente
manera
ARTICULOS
BUENOS
ARTICULOS
M ALOS
PROPORCION DE
ARTICULOS
DEFECTUOSOS
NUM ERO DE
M ANERAS EN LAS
QUE SE PUEDE
OBTENER LA
M UESTRA
1 3 0,75 6 6 1 9 PIEZAS
2 2 0,5 45 15 3 3 DEFECTUOSOS
3 1 0,25 60 20 3 6 BUENAS (N)
4 0 0 15 15 1
126Total
Para calcular la media de la distribución muestral de proporciones se
tendría que hacer la sumatoria de la frecuencia por el valor de la proporción
muestral y dividirla entre el número total de muestras, esto es:
μᴘ =(0.75 ∗ 6) + (0.5 ∗ 45) + (0.25 ∗ 60) + (0 ∗ 15)
126=
1
3= 0.3333
Se observa que la media de la distribución muestral de proporciones es igual
a la Proporción de la población. 𝐄𝐩 = 𝟎. 𝟑𝟑𝟑𝟑 = 𝟑𝟑%
Se puede calcular la desviación estándar de la distribución muestral de
proporciones:
σ =√(0.75 −
1
3)
2
∗ 6 + (0.5 −1
3)
2
∗ 45 + (0.25 − 1.3)2 ∗ 60 + (0 −1
3)
2
∗ 15
126= 0.1863
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
18
La varianza de la distribución binomial es σ₂ = npq, por lo que la varianza de la
distribución muestral de proporciones es σ₂ᴘ = (pq)/n. Si se sustituyen los valores
en esta fórmula tenemos que:
σᴘ = √P(1 − P)
n
σᴘ = √1/3(1 − 1/3)
4
σᴘ = √1
3(
2
3)
4 = 0.2357
Como este valor n coincide con el de la desviación estándar: 0.1863; ya que nos
falta agregar el factor de corrección para una población finita y un muestreo sin
remplazo:
σᴘ = √P(1 − P)
n √
N − n
N − 1
σᴘ = √1
3(
2
3)
4 √
9 − 4
9 − 1= 0.1863
0 0.25 0.5 0.75
15
40
60
p
Grafica de frecuencia
para las proporciones de
las muestras
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
19
0
10
20
30
40
50
60
70
12
34
Fre
cu
en
cia
proporcion de art defectuosos
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
20
CONCLUSIÓN
Con este trabajo hemos podido comprender la importancia de temas muy influyentes en nuestra carrera, como son: el muestreo, las distribuciones muéstrales y los Intervalos de Confianza para una y dos poblaciones. Se logró conocer que la inferencia estadística es, realmente, la parte más interesante y con mayor cantidad de aplicaciones en problemas concretos. También hemos comprendido que el uso de los intervalos de confianza
esaltamente aconsejable, ya que se destacan por la aproximación alconocimiento
de la importancia real de un resultado, independientemente dela significación
estadística, y la valoración de equivalencia entre dosvariables.Como también el
muestreo es una técnica que utilizaremos para deducir algorespecto de una
población mediante la selección de una muestra de esamisma, en muchos casos,
el muestreo es la única manera de poder obtener alguna conclusión de una
población, entre otras causas, por el valor económico y el tiempo empleado que
supondría estudiar a todos losmiembros de una población.
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
100403-Inferencia Estadística
Trabajo Colaborativo No. 1
Grupo No. 100403_173
21
REFERENTES
http://web.udl.es/Biomath/Bioestadistica/Dossiers/Temas%20especiales/ANOVA/Modelos%20con%20efectos%20aleatorios.pd
http://vimeo.com/59756490
http://www.youtube.com/watch?v=pgcYJXXjHU4
https://vimeo.com/64237998