12
UNA ENCUESTA RELACIONADA CON LA SALUD La secretaría de Salud Pública de un municipio decide realizar un estudio acerca de las posible influencia del aumento de la contaminación ambienta en el crecimiento y en la saludo de la población infantil. Aunque el hospital municipal lleva un minucioso registro de los pacientes que atiende, la Secretaría considera que la población infantil que concurre no conforma una muestra representativa . Decide, entonces estudiar una muestra compuesta por 500 niños de 1 a 6 años de edad, pertenecientes a familias de distintos niveles socioeconómicos, que habitan los diferentes barrios del municipio. Como parte de este estudio, se recolectan datos referidos al número de varones y de mujeres, la distribución del peso y la altura por edades, y los trastornos de salud mas frecuentes. POBLACIÓN Y MUESTRA Población: En la situación anterior: la población es el total de niños entre 1 y 6 años que habitan el municipio. Muestra: . En la situación anterior: la muestra está constituida por 500 niños. Empresa automotriz -Una empresa automotriz desea hacer un estudio de mercado para determinar los diferentes tipos de autos que circulas en la ciudad de Rosario. Para ello, se instalan distintos puestos de observación en cada una de los barrios que componen esa ciudad. La observación se efectúa sobre 1000 automóviles y se analizan las siguientes características: marca, modelo, color, cantidad de puertas y velocidad alcanzada al pasar por dichos puestos. Determina si se analiza una  población o una muestra y clasifica cada variable que se estudia.  Anota en tu cuaderno la respuesta y la explicación de la misma. POBLACIÓN Y MUESTRA Muestra:  En este problema se hace el estudio de diferentes tipos de auto que circulan en la ciudad de Rosario. En este caso se toman 1000 automóviles. Y de cada se analizan las características como el color, modelo, marca, cantidad de puerta y velocidad alcanzado por dichos puestos. Variables: -Color -Marca -Modelo -Velocidad alcanzada -Numero de puertas

imprimir esto 2

Embed Size (px)

Citation preview

Page 1: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 1/12

 

UNA ENCUESTA RELACIONADA CON LA SALUD La secretaría de Salud Pública de un municipio decide realizar unestudio acerca de las posible influencia del aumento de lacontaminación ambienta en el crecimiento y en la saludo de lapoblación infantil. Aunque el hospital municipal lleva unminucioso registro de los pacientes que atiende, la Secretaríaconsidera que la población infantil que concurre no conformauna muestra representativa . Decide, entonces estudiar unamuestra compuesta por 500 niños de 1 a 6 años de edad,

pertenecientes a familias de distintos niveles socioeconómicos,que habitan los diferentes barrios del municipio.Como parte de este estudio, se recolectan datos referidos alnúmero de varones y de mujeres, la distribución del peso y laaltura por edades, y los trastornos de salud mas frecuentes.POBLACIÓN Y MUESTRAPoblación:En la situación anterior: la población es el total de niños entre 1 y 6años que habitan el municipio.Muestra: .En la situación anterior: la muestra está constituida por 500 niños.

Empresa automotriz-Una empresa automotriz desea hacer un estudio de mercado para

determinar los diferentes tipos de autos que circulas en la ciudad de

Rosario. Para ello, se instalan distintos puestos de observación en

cada una de los barrios que componen esa ciudad. La observación se

efectúa sobre 1000 automóviles y se analizan las siguientes

características: marca, modelo, color, cantidad de puertas y velocidad alcanzada al pasar por dichos puestos. Determina si se analiza una

 población o una muestra y clasifica cada variable que se estudia.

 Anota en tu cuaderno la respuesta y la explicación de la misma.

POBLACIÓN Y MUESTRA Muestra: En este problema se hace el estudio de diferentes tipos de auto quecirculan en la ciudad de Rosario. En este caso se toman 1000automóviles. Y de cada se analizan las características como el color,modelo, marca, cantidad de puerta y velocidad alcanzado por dichospuestos.

Variables:-Color-Marca-Modelo-Velocidad alcanzada

-Numero de puertas

Page 2: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 2/12

 

 Deber 2Planteamiento1. Clasificar si es muestra o población.a. Las edades de los alumnos de PEII (Muestra)b. Hacer una encuesta a los usuarios de un sistema informáticode EMETEL. (Población)c. Hacer una encuesta a 500 personas que desean hacer algunatransacción en un Banco. (Muestra)

d. Hacer un estudio de peso a los bananos de una hacienda.(Población)

2. Buscar la media, la mediana y la moda de los siguientesnúmeros:Media:5 1 2 2 5 2 3 45+1+2+2+5+2+3+4=24/8= 3 mediaMediana:1 2 2 2 3 4 5 5

X1 X2 X3  X4  X5 X6 X7 X8 X[8/2+1/2] = X[4+1/2] = X[4.5] 

La posición 4.5 está entre 4 y 5 quiere decir que:

2+3=5/2=2,5 medianaModa: Es 2 y 5 son los que más se repite

3. Buscar la media, la mediana y la moda de los siguientesnúmeros:

15 61 91 51 41 61 2 51 71Media:15+ 61+ 91+ 51+ 41+ 61+ 2+ 51+ 71= 380/9= 42,222= 42Mediana:2 15 41 51 51 61 61 71 91X1 X2 X3 X4  X5 X6 X7 X8 X9

X[9/2+1/2] = X[4.5+1/2] = X[5] 

La posición X5 está en 51/2= 25.5

Moda: Son los números 51 y 61 son los que se repiten

4. En un estudio que se realizó a los estudiantes de IngenieríaIndustrial se les tomó la edad en que se graduaron. Buscar lamedia, la mediana y la moda de las siguientes edades, e indicarsi es muestra o población. No utilice la fórmula.28 32 25 23 24 24 23 25 28 3028+ 32+ 25+ 23+ 24+ 24+ 23+ 25+ 28+ 30= 262/10=

26,2La media es 26,2. Quiere decir que la edad promedio de los

estudiantes en graduarse es de 26,223 23 24 24 25 25 28 28 30 32Elementos intermedios 25, 2525+25= 50/2= 25 por lo tanto la mediana es 25Hay 4 modas en este caso 23, 24, 25 28. Son los números quemas se repitenEste estudio es una muestra ya que se seleccionaron 10estudiantes de ingeniería industrial que se habían graduado.

5. Se escogió un salón de clases de cuarto grado, con un total de25 estudiantes, y se les pidió que calificaran del 1 al 5 unprograma televisivo.(5 = Excelente 4 = Bueno 3 = Regular 4 = No muy bueno 1 =Fatal)Estos fueron los resultados:3 3 5 4 53 5 2 4 53 5 4 5 53 5 4 4 51 2 2 4 5

1+ 2+ 2+ 3+ 3+ 3+ 3+ 3+ 4+ 4+ 4+ 4+ 4+ 4+ 5+ 5+ 5+ 5+ 5+ 5+ 5+5+ 5+ 5= 99/24= 4,12Mediana: 1 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 es 4 elnúmero intermedioModa: es 5( bueno) el número que más se repite.Es una muestra ya que se escogieron a 25 estudiantes paracalificar un programa televisivo.

2.- DISTRIBUCION NORMAL

Page 3: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 3/12

 

 D

E

B

E

R

 

4

V a r i a b l e a l e a t o r i a d e l a

d i s t r i b u c i ó n n o r m a lU n a v a r i a b l e a l e a t o r i ac o n t i n u a ,   X , s i g u e u n a

d i s t r i b u c i ó n n o r m a l d e

m e d i a   y d e s v i a c i ó n t í p i c a

, y s e d e s i g n a p o r N ( , ) , s i

s e c u m p l e n l a s s i g u i e n t e s

c o n d i c i o n e s :

1 . L a v a r i a b l e p u e d e t o m a r

c u a l q u i e r v a l o r : ( - , + )

2 . L a f u n c i ó n d e d e n s i d a d , e s

l a e x p r e s i ó n e n t é r m i n o s d e

e c u a c i ó n m a t e m á t i c a d e l a

c u r v a d e G a u s s :

C u r v a d e l a d i s t r i b u c i ó nn o r m a l

E l c a m p o d e e x i s t e n c i a e s

c u a l q u i e r v a l o r r e a l , e s d e c i r ,  

( - , + ) .

E s s i m é t r i c a r e s p e c t o a l a

m e d i a µ .

T i e n e u n m á x i m o e n l a m e d i a

µ .

C r e c e h a s t a l a m e d i a µ y

d e c r e c e a p a r t i r d e e l l a .

E n l o s p u n t o s µ y µ +

p r e s e n t a p u n t o s d e i n f l e x i ó n .

E l e j e d e a b s c i s a s e s u n a

a s í n t o t a d e l a c u r v a .

E l á r e a d e l r e c i n t o

d e t e r m i n a d o p o r l a f u n c i ó n y

e l e j e d e a b s c i s a s e s i g u a l al a u n i d a d .

A l s e r s i m é t r i c a r e s p e c t o a l

e j e q u e p a s a p o r x = µ , d e j a u n

á r e a i g u a l a 0 . 5 a l ai z q u i e r da y o t r a i g u a l a 0 . 5 a

l a d e r e c h a .L a p r o b a b i l i d a d e q u i v a l e a l

á r e a e n c e r r a d a b a j o l ac u r v a .  

p ( - < X + ) = 0 . 6 8 2 6

= 6 8 . 2 6 %

p ( - 2 < X + 2 ) =

0 . 9 5 4 = 9 5 . 4 %

p ( - 3 < X +

3 ) = 0 . 9 9 7 = 9 9 . 7

%

Page 4: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 4/12

 

 

Distribuciones muéstrales

Teorema central del límite

Distribución muestral de las proporciones

Vamos a obtener experimentalmente la

distribución de las proporciones muestrales.Para ello consideremos el conjunto de figuras:

La proporción poblacional de triángulos es 1/4. Consideremos todas las muestras de tamaño 2posibles, mediante muestreo aleatorio simple (conreemplazamiento). Hallamos la distribución deprobabilidad de la proporción muestral (nombrada

por 

)

Calculamos su esperanza matemática y la varianza:

El número de éxitos x de una muestra de tamaño n, sedistribuye de forma bionomía B(n, p); si la aproximamos a una

normal será . Como

, dividiendo x por n se tiene que:

Si la población es finita y la extracción simultánea o sinreposición, la desviación típica va multiplicada por la siguienteexpresión:

Donde N = tamaño de la población y n = tamaño de la muestra

Page 5: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 5/12

 

 Validación experimental (proporción) EJEMPLO.

De la población que consta de 4 circulos de color blanco, azul, rojo y verde, extrae todaslas muestra posible de tamaño 2 de dos formas distintas:a) Simultánea (sin reposición y sin que importe el orden)b) Sucesiva sin reposición (importa el orden).

Calcula la distribución de probabilidad de la proporción muestral y con ella la esperanza yla varianza. Comprueba el resultado anterior.

Distribución muestral de las medias

Vamos a obtener experimentalmente la distribución de las medias muéstrales. Para elloconsideremos la siguiente población:

Consideremos todas las muestras de tamaño 2 posibles, mediante muestreo aleatoriosimple (con reemplazamiento). Hallamos la distribución de probabilidad de la media

muestral

Como se puede observar:

Si la población es finita y la extracción simultánea o sin reposición, la desviación típica vamultiplicada por la siguiente expresión:

Donde N = tamaño de la población y n = tamaño de la muestraTeorema central del límiteLa distribución de medias muestrales tiende hacia unadistribución normal, aunque las muestras procedan de una distribución nonormal.Incrementando el número de muestras extraidas de la población, ladistribución de sus medias tiende a normalizarse. (n> 30) 

Page 6: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 6/12

 

 

-Función JI C uadrada 

También denominada Ji-cuadrado de Pearson, es una distribución deprobabilidad continua con un parámetro k que representa los grados de libertadde la variable aleatoria.

Propiedades de JI Cuadrado:-Función de densidad  donde es la funcióngamma.

-Función de distribución ac umulada: Su función de distribución es:

Aplicación de JI Cuadrado

La distribución ² tiene muchas aplicaciones en inferencia estadística. La másconocida es la de la denominada prueba ² utilizada como prueba deindependencia y como prueba de bondad de ajuste y en la estimación de varianzas. Perotambién está involucrada en el problema de estimar la media de una poblaciónnormalmente distribuida y en el problema de estimar la pendiente de una recta deregresión lineal, a través de su papel en la distribución t de Student.Distribución FEs una distribución de probabilidad continua. También se la conoce como distribución Fde Snedecor (por George Snedecor) o como distribución F de Fisher-Snedecor.

U1 y U2 siguen una distribución ji-cuadrado con d 1 y d 2 grados de libertadrespectivamente.U1 y U2 son estadísticamente independientes.

Tabla de La distribución F

Propiedades de F

En una distribución ji-cuadrada cuando

para:Aplicación de F

Page 7: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 7/12

 

La aplicación fundamental de la distribución F es la comparación de varianzas, es decir, elcontraste de hipótesis referentes a varianzas de poblaciones normales e independientes,y a la comparación de medias de varias poblaciones, que constituye precisamente elanálisis de la varianza.

Introducción-Notación necesariaEs la que nos permite representar sumas muy grandes de n, sumando o incluso sumasinfinitas y se expresa con la letra griega sigma.

Análisis de la VarianzaEs una colección de modelos estadísticos y sus procedimientos asociados, en el cual lavarianza está particionada en ciertos componentes debidos a diferentes variablesexplicativasModelos de análisis de la Varianza-Modelo 1El Modelo de efectos fijos asume que los datos provienen de poblaciones normales lascuales podrían diferir únicamente en sus medias.-Modelo 2El Modelo de efectos aleatorios asume que los datos describen una jerarquía dediferentes poblaciones cuyas diferencias quedan restringidas por la jerarquía. Ejemplo: Elexperimentador ha aprendido y ha considerado en el experimento sólo tres de muchosmás métodos posibles, el método de enseñanza es un factor aleatorio en el experimento.-Modelo 3El Modelo de efectos mixtos describen situaciones que éste puede tomar. Ejemplo: Si elmétodo de enseñanza es analizado como un factor que puede influir donde estánpresentes ambos tipos de factores: fijos y aleatorios.Prueba de hipótesis sobre la igualdad de medias

Formas del análisis de las VarianzasModelo de efectos fijosLas formas del análisis de la varianza se aplica a situaciones en las que el experimentadorha sometido al grupo o material analizado a varios factores, cada uno de los cuales leafecta sólo a la media, permaneciendo la "variable respuesta" con una distribuciónnormal.Modelo de efectos aleatorios Los modelos de efectos aleatorios se usan para describir situaciones en que ocurrendiferencias incomparables en el material o grupo experimental. El ejemplo más simple esel de estimar la media desconocida de una población compuesta de individuos diferentesy en el que esas diferencias se mezclan con los errores del instrumento de medición.POBLACIONES Y MUESTRASUn investigador social al tratar de sacar conclusiones acerca de grandes grupos deindividuos, se supone investiga el grupo en su totalidad, este grupo conocido como población ouniverso, que consiste en un grupo de individuos que comparten por lomenos una característica.Debido a que el investigador cuenta con limitaciones como tiempo, energía y recursoseconómicos, analiza sólo una muestra, que es un número pequeño de individuos tomadode alguna población. A través del proceso de muestreo el investigador social buscageneralizar de su muestra a la totalidad de la población de donde la obtuvo.

TIPOS DE POBLACIÓN

POBLACIÓN FINITA 

Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.

Es aquella que posee o incluye un número limitado de medidas y observaciones.POBLACIÓN INFINITA 

Es infinita si se incluye un gran conjunto de medidas y observaciones que no puedenalcanzarse en el conteo.

Son poblaciones infinitas porque hipotéticamente no existe límite en cuanto al númerode observaciones que cada uno de ellos puede generarMuestra estadísticaEn estadística una muestra estadística (también llamada muestra aleatoria osimplemente muestra) es un subconjunto de casos o individuos de una poblaciónestadística

Page 8: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 8/12

 

Las muestras se obtienen con la intención de inferir propiedades de la totalidad de lapoblación, para lo cual deben ser representativas de la misma. Para cumplir estacaracterística la inclusión de sujetos en la muestra debe seguir una técnica de muestreoMuestreo ProbabilísticoForman parte de este tipo de muestreo todos aquellos métodos para los que puedecalcularse la probabilidad de extracción de cualquiera de las muestras posibles. Esteconjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no esposible optar por él.En este caso se habla de muestras probabilísticas, pues no es en rigor correcto hablar de

muestras representativas dado que, al no conocer las características de la población, noes posible tener certeza de que tal característica se haya conseguido.Sin reposición de los elementos. Con reposición multiple. Con reposición los elementos 

UNIVERSIDAD POLITECNICA SALESIANAEXAMEN DE PROBABILIDAD Y ESTADÍSTICA II

De los datos siguientes, en dondeX=edad Y=peso Varianza xi2 

Yi2 CovarianzaXi.Yi

12 70 144 4900 840

13 80 169 6400 1040

15 100 225 10000 1500

25 129 625 16641 3225

30 140 900 19600 4200

40 140 1600 19600 5600

45 130 2025 16900 5850

50 160 2500 25600 8000

32 140 1024 19600 4480

45 180 2025 32400 8100

26 130 676 16900 3380

70 130 4900 16900 9100

X=33.58 Y=127.41 16813 205441 55315

Media Aritmética:

= 33.58 = 127.41Varianza y desviaciones típicas:

1307 36.15

15767.30 125.56

331.16

Page 9: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 9/12

 

0.07296 R= 0.27

Encontrar la ecuación de la recta de y = a + b x}

127.41+0.2533(x-33.58) = y= 118.90 0.253

b).-Si una persona tiene una edad de 33, ¿cuál sería su peso?Y= 86.79+1.21 (33)Y= 126.72

c).-Encontrar el coeficiente de correlación de los datos0.7501660025d).-Es buena la predicciónLa predicción es media ya que el coeficiente es 0.7501 y es tan aproximado a

1.http://www.vadenumeros.es/sociales/ejercicios-distribuciones-bidimemensionales.htm 

Obtenga el análisis de varianza de los tiempos en minutos en que un cajero de undeterminado banco se demora en atender a los clientes:

Observación Cajero 1 Cajero 2 Cajero 31 134 230 154

2 145 234 1433 135 400 1324 256 123 134

5 234 100 1546 340 129 1457 125 134 132

http://www.ugr.es/~jsalinas/weproble/T14res.PDF 

Page 10: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 10/12

 

 

Ejemplo 1Una compañía de seguros considera que el número de vehículos (y) que circulan por unadeterminada autopista a más de 120 km/h , puede ponerse en función del número deaccidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados:

Accidentes xi 5 7 2 1 9

Número de vehículos yi 15 18 10 8 20

Calcula el coeficiente de correlación lineal. Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer quecirculaban por la autopista a más de 120 km / h? ¿Es buena la predicción?Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno. Debemosconocer la media aritmética de las dos variables, las varianzas, las desviaciones típicas y lacovarianza.

Media aritmética Varianza Covarianza

fi xi yi xi2 yi2 xi . yi

1 5 15 25 225 75

1 7 18 49 324 126

1 2 10 4 100 201 1 8 1 64 8

1 9 20 81 400 180

5 24 71 160 1113 409

Page 11: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 11/12

 

 

Ejemplo 2Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las de latabla adjunta.

Psicología xi 3 4 5 6 6 7 7 8 10

Estadística yi  2 5 5 6 7 6 7 9 10

Nº de alumnos fi 4 6 12 4 5 4 2 1 2

a) Obtener la ecuación de la recta de regresión de calificaciones de estadística respectode las calificaciones de psicología.b) ¿Cuál será la nota esperada en estadística para un alumno que obtuvo un 4,5en psicología?

Media aritmética Varianza Covarianza

xi  yi  fi  fi . xi fi . yi  fi . xi2  fi . yi

2  fi . xi . yi 

3  2  4 12 8 36 16 244  5  6 24 30 96 150 120

5  5  12 60 60 300 300 300

6  6  4 24 24 144 144 144

6  7  5 30 35 180 245 210

7  6  4 28 24 196 144 168

7  7  2 14 14 98 98 98

8  9  1 8 9 64 81 72

9  10  2 20 20 200 200 200

Page 12: imprimir esto 2

5/8/2018 imprimir esto 2 - slidepdf.com

http://slidepdf.com/reader/full/imprimir-esto-2 12/12

 

 

40 220 224 1314 13781336

Ejemplo 3Las notas obtenidas por 10 alumnos en Matemáticas y en Música son:

Matemáticas 6 4 8 5 3,5 7 5 10 5 4

Música 6,5 4,5 7 5 4 8 7 10 6 5

Calcula la covarianza y el coeficiente de correlación. ¿Existe correlación entre las dos variables? ¿Cuál será la nota esperada en Música para un alumno que hubiese obtenido un 8,3 enMatemáticas?Solución:

a) Covarianza = 3,075. Coeficiente de correlación r = 0,92.

b) Existe una correlación positiva fuerte.

c) Recta de regresión: y = 1,6 + 0,817 x La nota esperada en Música = 8, 38

Ejemplo 4 Cinco niñas de 2, 3, 5, 7 y 8 años de edad pesan respectivamente 14, 20, 30, 42 y 44 Kg .Halla la ecuación de la recta de regresión de la edad sobre el peso. ¿Cuál sería el pesoaproximado de una niña de 6 años?Solución:

Ecuación de la recta de regresión: x = 0,192 y - 0,76

Peso aproximado de una niña de 6 años: 35,2 kg