13
1 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 SELECTIVIDAD A4, B4: DISTRIBUCIONES BINOMIAL Y NORMAL VARIABLE ALEATORIA Una variable aleatoria es toda función que asocia a cada posible resultado del experimento, un numero real. Supongamos el experimento ‘lanzar cuatro monedas al aire’ cuyo especio muestral es : = # , , , , , , , , , , , , , , , La variable = {ú } tomaría los valores = {0,1,2,3,4}. En el experimento ‘lanzar dos dados’ , la variable suma de los puntos obtenidos tomaría los valores = {2,3,4,5,6,7,8,9,10,11,12} Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria se dice discreta si toma un numero finito de valores aislados. Se representan mediante diagramas de barras. Y se dice continua si puede tomar, teóricamente, todos los valores posibles en un intervalo de números reales. En este caso, se representan mediante histogramas. Un ejemplo de variable continua seria el experimento de medir la altura de los alumnos de la clase y tomamos como variable la función que asocia a cada alumno su altura en metros. Dicha variable podría tomar cualquier valor del intervalo [1′55,1′92] siendo ambas las altura extremas ya que no se puede crecer de golpe de 1′65 1′66 sin pasar por valores intermedios. DISTRIBUCIÓN BINOMIAL Una variable aleatoria asociada a un experimento aleatorio, sigue una distribución binomial si se cumplen las siguientes condiciones: Consiste en ensayos idénticos. Cada ensayo tiene 2 posibles resultados: éxito o fracaso. Cada ensayo es independiente: el resultado de uno no te influye en el siguiente. La probabilidad de éxito se mantiene constante en todo el experimento. La variable X expresa el numero de éxitos obtenidos. Se dice entonces que X sigue una distribución binomial (, ) siendo el numero de repeticiones del experimento y la probabilidad de éxito. Se entiende que la probabilidad de fracaso es =1−. Son distribuciones binominales las encuestas a favor o en contra de alguna idea, los estudios médicos sobre la eficacia de algún medicamento, el control de piezas defectuosas en una fabrica etc. Supongamos que un jugador de baloncesto encesta 3 de cada 4 canastas y sea el experimento que consiste en hacer 3 lanzamientos. Consideramos la variable X que mide el numero de canastas. Si llamamos C a encestar y F a fallar el tiro, el espacio muestral es: = {, , , , , , }

SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

  • Upload
    others

  • View
    20

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

1

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

SELECTIVIDAD A4, B4: DISTRIBUCIONES BINOMIAL Y NORMAL VARIABLE ALEATORIA Una variable aleatoria es toda función que asocia a cada posible resultado del experimento, un numero real. Supongamos el experimento ‘lanzar cuatro monedas al aire’ cuyo especio muestral es :

𝐸 = #𝐶𝐶𝐶𝐶, 𝑋𝐶𝐶𝐶, 𝐶𝑋𝐶𝐶, 𝐶𝐶𝑋𝐶, 𝐶𝐶𝐶𝑋, 𝑋𝑋𝐶𝐶, 𝑋𝐶𝑋𝐶, 𝑋𝐶𝐶𝑋, 𝐶𝑋𝑋𝐶, 𝐶𝑋𝐶𝑋, 𝐶𝐶𝑋𝑋, 𝐶𝑋𝑋𝑋, 𝑋𝐶𝑋𝑋, 𝑋𝑋𝐶𝑋, 𝑋𝑋𝑋𝐶, 𝑋𝑋𝑋𝑋 ' La variable 𝑋 = {𝑛ú𝑚𝑒𝑟𝑜𝑑𝑒𝑐𝑎𝑟𝑎𝑠} tomaría los valores 𝑋 = {0,1,2,3,4}. En el experimento ‘lanzar dos dados’ , la variable suma de los puntos obtenidos tomaría los valores 𝑥 ={2,3,4,5,6,7,8,9,10,11,12} Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria se dice discreta si toma un numero finito de valores aislados. Se representan mediante diagramas de barras. Y se dice continua si puede tomar, teóricamente, todos los valores posibles en un intervalo de números reales. En este caso, se representan mediante histogramas. Un ejemplo de variable continua seria el experimento de medir la altura de los alumnos de la clase y tomamos como variable la función que asocia a cada alumno su altura en metros. Dicha variable podría tomar cualquier valor del intervalo [1′55,1′92] siendo ambas las altura extremas ya que no se puede crecer de golpe de 1′65𝑎1′66 sin pasar por valores intermedios.

DISTRIBUCIÓN BINOMIAL Una variable aleatoria asociada a un experimento aleatorio, sigue una distribución binomial si se cumplen las siguientes condiciones:

• Consiste en 𝑛 ensayos idénticos. • Cada ensayo tiene 2 posibles resultados: éxito o fracaso. • Cada ensayo es independiente: el resultado de uno no te influye en el siguiente. • La probabilidad de éxito se mantiene constante en todo el experimento. • La variable X expresa el numero de éxitos obtenidos.

Se dice entonces que X sigue una distribución binomial 𝐵(𝑛, 𝑝) siendo 𝑛 el numero de repeticiones del experimento y 𝑝 la probabilidad de éxito. Se entiende que la probabilidad de fracaso es 𝑞 = 1 − 𝑝. Son distribuciones binominales las encuestas a favor o en contra de alguna idea, los estudios médicos sobre la eficacia de algún medicamento, el control de piezas defectuosas en una fabrica etc. Supongamos que un jugador de baloncesto encesta 3 de cada 4 canastas y sea el experimento que consiste en hacer 3 lanzamientos. Consideramos la variable X que mide el numero de canastas. Si llamamos C a encestar y F a fallar el tiro, el espacio muestral es:

𝐸 = {𝐶𝐶𝐶, 𝐹𝐶𝐶, 𝐶𝐹𝐶, 𝐶𝐶𝐹, 𝐹𝐹𝐶, 𝐹𝐶𝐹, 𝐹𝐹𝐹}

Page 2: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

2

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Y la variable X estaría definida como 𝑋 = {0,1,2,3} Como podemos observar este experimento cumple las características que hablábamos al principio:

• Se repite 3 veces la misma prueba. • En cada prueba hay dos posibles resultados • El resultado obtenido en cada prueba es independiente de los resultados obtenidos en las

pruebas anteriores. • La probabilidad de éxito es la misma en todas las pruebas

Por cumplir estas cuatro condiciones, diremos que la variable X sigue una DISTRIBUCIÓN BINOMIAL. Función de probabilidad La función de probabilidad de una variable que sigue una distribución binomial 𝐵(𝑛, 𝑝) es :

𝑃(𝑟é𝑥𝑖𝑡𝑜𝑠) = 𝑃(𝑋 = 𝑟) = N𝑛𝑟O ∙ 𝑝! ∙ 𝑞"#!

Una moneda esta trucada de manera que la probabilidad de salir cara es de 0,4 se lanza seis veces. Halla la probabilidad de que :

• Salgan exactamente cuatro caras • Salgan seis cruces • Salga, al menos, 4 caras • Salgan, a lo sumo, dos caras • Halla la media y la desviación.

Llamamos X a la variable que indica el numero de caras y observamos que sigue una distribución binomial 𝐵(6,0′4), siendo 𝑛 = 6 lanzamientos 𝑝 = 0,4 la probabilidad de salir cara y 𝑞 = 1 − 𝑝 = 1 −0,4 = 0,6 la probabilidad de cruz.

𝑃(𝑋 = 4) = N64O ∙ 0,4$ ∙ 0,6% =

6!4! ∙ 2! ∙ 0,0256 ∙ 0,36 = 0,13824

𝑃(𝑋 = 0) = N60O ∙ 0,4& ∙ 0,6' = 1 ∙ 1 ∙ 0,046656 = 0,046656

𝑃(𝑋 ≥ 4) = 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) + 𝑃(𝑋 = 6)

=N64O ∙ 0,4$ ∙ 0,6% + N65O ∙ 0,4

( ∙ 0,6) + N66O ∙ 0,4' ∙ 0,6& = 0,1792

𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) =

N60O ∙ 0,4& ∙ 0,6' + N61O ∙ 0,4

) ∙ 0,6( + N62O ∙ 0,4% ∙ 0,6$ = 0,54432

Page 3: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

3

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Parámetros de una distribución binomial

𝑀𝑒𝑑𝑖𝑎𝑜𝑒𝑠𝑝𝑒𝑟𝑎𝑛𝑧𝑎; 𝜇 = 𝑛 ∙ 𝑝 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎;𝜎% = 𝑛 ∙ 𝑝 ∙ 𝑞

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛𝑡í𝑝𝑖𝑐𝑎; 𝜎 = _𝑛 ∙ 𝑝 ∙ 𝑞

DISTRIBUACIÓN NORMAL Una variable aleatoria continua X sigue una distribución normal de media 𝜇y desviación típica 𝜎 , y se escribe, 𝑁(𝜇, 𝜎)si se cumple:

• Toma valores en todo ℝ • Su función de densidad es (Representar la campana de Gauss)

Algunas propiedades de esta grafica son:

• En el intervalo (𝜇 − 𝜎, 𝜇 + 𝜎) el área encerrada es 0,6826. • En el intervalo (𝜇 − 2𝜎, 𝜇 + 2𝜎) el área encerrada es 0,9544. • En el intervalo (𝜇 − 3𝜎, 𝜇 + 3𝜎) el área encerrada es 0,9973.

La función depende de los valores de la media y de la desviación típica. El valor de la media desplaza la grafica a izquierda o derecha, mientras que el calor de la desviación , modifica la altura y anchura de la campana.

DISTRIBUCIÓN NORMAL ESTANDAR Dada la complejidad de la función de densidad de la distribución normal, y teniendo en cuneta la dificultad que ello provoca en el calculo de probabilidades, es lógico pensar en encontrar los valores de 𝜇𝑦𝜎 que faciliten al máximo la tarea. Se conoce como distribución normal estándar o tipificada a la distribución normal en la que 𝜇 = 0𝑦𝜎 =1, es decir, 𝑁(0,1) . la variable aleatoria 𝑁(0,1) se identifica con 𝑍. Lo bueno de esta distribución es que nos permite encontrar la solución y por tanto las probabilidades necesarias, sin tener que realizar cálculos integrales. A continuación, aprenderemos a utilizar la tabla:

Page 4: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

4

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Page 5: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

5

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

USO DE LA TABLA Como ya hemos dicho anteriormente , la tabla muestra la probabilidad de que la variable 𝑍 que sigue una distribución 𝑁(0,1) , tome valores menores o iguales que un cierta valor 𝑘:𝑃(𝑍 ≤ 𝑘). Veamos como calcular las probabilidades.

Page 6: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

6

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Observaciones

1. En caso de que se quiera calcular 𝑃(𝑍 ≤ 𝑘) siendo k un numero mayor que 3′59, se puede decir que dicha probabilidad es igual a 1aproximadamente, puesto que en la tabla se observa que 𝑃(𝑍 ≤ 3′59) = 0′9999 y para valores mayores tiene que aumentar por ser acumulativa, siendo uno el área total bajo la curva.

2. Observa que en todos los casos utilizamos indistintamente >, <, ≤, ≥ ya que en las distribuciones continuas 𝑃(𝑍 = 𝑎) = 0.Es por eso que al utilizar el suceso contrario, escribimos 𝑃(𝑍 ≤ 𝑎) = 1 − 𝑃(𝑍 > 𝑎) . Sin embargo, debemos ser cuidadosos si la distribución es binomial, pues lo cierto seria 𝑃(𝑍 ≤ 𝑎) = 1 − 𝑃(𝑍 > 𝑎).

3. Es posible que la búsqueda se realice de manera indirecta, es decir, conocida 𝑃(𝑍 ≤ 𝑎) = 𝑝, hallar el valor de 𝑎.

Una vez que hemos aprendido a trabajar con la tabla, nos planteamos como calcular probabilidades si la variable no es 𝑁(0,1), cosa prácticamente segura en un contexto real. Como seria tarea imposible tabular todas las posibles distribuciones normales, y para evitar el calculo integral, se ha buscado una estrategia que permite transformar una variable X de distribución 𝑁(𝜇, 𝜎) en otra variable Z de distribución 𝑁(0,1). Dicha estrategia se conoce como tipificación de la variable.

Page 7: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

7

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

TIPIFICACIÓN DE LA VARIABLE Tipificar una variable X que sigue una distribución normal 𝑁(𝜇, 𝜎), es ajustarla a otra variable Z normal 𝑁(0,1). Para ello, es necesario trasladar su centro desde 𝜇𝑎0 y reducir o ampliar su forma acampanada desde 𝜎𝑎1. Ambas cosas se consiguen sin mas que hacer el cambio de variable 𝑍 = *#+

,

De esta forma, si necesitamos calcula 𝑃(𝑍 ≤ 𝑎) solo tenemos que realizar dicho cambio de variable de la siguiente forma:

𝑃(𝑍 ≤ 𝑎) = 𝑃 i𝑋 − 𝜇𝜎 ≤

𝑎 − 𝜇𝜎 j = 𝑃 N𝑍 ≤

𝑎 − 𝜇𝜎 O

Con lo que con esta situación estaríamos en condiciones de hacer uso de la tabla. Las tallas de los alumnos de 17𝑎ñ𝑜𝑠 de un centro escolar siguen una distribución 𝑁(165,10).

• Eligiendo un alumno al azar, ¿Cuál es la probabilidad de que mida menos de 170 centiemtros? ¿Y entre155𝑦170𝑐𝑚?

• ¿Qué porcentaje de alumnos mide mas de 182𝑐𝑚? • ¿A partir de que talla se encuentra el 10% de los alumnos mas altos?

Sea X la variable normal 𝑁(165,10). Se pide:

• 𝑃(𝑋 < 170) = 𝑃(𝑋 ≤ 170) = 𝑃 N*#)'()&

≤ )-&#)'()&

O = 𝑃(𝑍 ≤ 0,5) = 0,6915

𝑃(155 ≤ 𝑋 ≤ 170) = 𝑃 i155 − 165

10 ≤𝑋 − 16510 ≤

170 − 16510 j = 𝑃(−1 ≤ 𝑍 ≤ 0,5) =

𝑃(𝑍 ≤ 0,5) − 𝑃(𝑍 ≤ −1) = 0,6915 − 𝑃(𝑍 ≥ 1) = 0,6915 − [1 − 𝑃(𝑍 ≤ 1)] =

0,6915 − 1 + 0,8413 = 0,5328

• 𝑃(𝑋 ≥ 182) = 𝑃 N𝑍 ≥ ).%#)'()&

O = 𝑃(𝑍 ≥ 1,7) = 1 − 𝑃(𝑍 ≤ 1,7) = 1 − 0,9554 =0,0446

Lo que significa que el 4,46% de los estudiantes miden mas de 182𝑐𝑚

• 𝑃(𝑋 ≥ 𝑎) = 𝑃 N*#)'()&

≥ /#)'()&

O = 0,1 → 𝑃 N𝑍 ≥ /#)'()&

O = 0,1 →

1 − 𝑃 i𝑍 ≤𝑎 − 16510 j = 0,1 → 1 − 0,1 = 𝑃 i𝑍 ≤

𝑎 − 16510 j → 𝑃 i𝑍 ≤

𝑎 − 16510 j = 0,9

y buscamos en la tabla el valor mas próximo al obtenido /#)'(

)&= 1,28 → 𝑎 = 177,8

Se deduce que el 10% de los alumnos mas altos miden mas de 177,8𝑐𝑚.

Page 8: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

8

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Normalizar

APROXIMACIÓN DE LA BINOMIAL POR LA NORMAL Se demostró que una variable X que sigue una distribución binomial 𝐵(𝑛, 𝑝) de media 𝜇 = 𝑛 ∙𝑝𝑦𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝜎 = _𝑛𝑝𝑞, puede aproximarse por una variable X’ normal 𝑁(𝜇, 𝜎) = 𝑁(𝑛𝑝, _𝑛𝑝𝑞), y que esta aproximación es buena siempre que 𝑛 ∙ 𝑝 ≥ 5𝑦𝑛 ∙ 𝑞 ≥ 5. El siguiente paso que tenemos que topar es tipificar la variable para poder trabajar con la tabla, tal y como lo hemos explicado anteriormente. De esta manera , podremos resolver problemas relacionados con distribuciones binomiales donde el numero de repeticiones es elevado. 𝑋𝑏𝑖𝑛𝑜𝑚𝑖𝑎𝑙𝐵(𝑛, 𝑝)𝑋′𝑛𝑜𝑟𝑚𝑎𝑙𝑁(𝑛𝑝,_𝑛𝑝𝑞) Es necesario, sin embargo, realizar algunas correcciones para salvar las diferencias entre discretas y continuas, dado que en las primeras existe la probabilidad de que la variable tome un valor concreto, y en las segundas, este siempre es cero. Por esta razón, en la distribución binomial no es lo mismo 𝑃(𝑋 <𝑎)𝑞𝑢𝑒𝑃(𝑋 ≤ 𝑎). Veamos con se compensan estas diferencias:

Tipificar

𝑍 =𝑋 − 𝑛𝑝_𝑛𝑝𝑞

𝑛𝑜𝑟𝑚𝑎𝑙𝑁(0,1)

Page 9: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

9

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Se observa que el hecho de sumar o restar 0′5 al valor de a, se produce dependiendo de si dicho valor a debe estar o no incluido en el calculo de la probabilidad. Se realiza un estudio sobre la calidad de un determinado producto, a través de una encuesta que responde al 32% de los encuestados. Si se realizan 1000 encuestas, ¿Qué probabilidad hay de que respondan, al menos, 300 personas?

𝑆𝑒𝑎𝑋 = {𝑛𝑢𝑚𝑒𝑟𝑜𝑑𝑒𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎𝑠𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑖𝑑𝑎𝑠}𝑢𝑛𝑎𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑏𝑖𝑛𝑜𝑚𝑖𝑎𝑙𝐵(1000,0,32).

𝑆𝑒𝑝𝑖𝑑𝑒𝑃(𝑋 ≥ 300).

𝐷𝑎𝑑𝑜𝑞𝑢𝑒𝑛 ∙ 𝑝 = 1000 ∙ 0,32 = 320 ≥ 5 𝑛 ∙ 𝑞 = 1000 ∙ 0,68 ≥ 5

Se puede aproximar la variable X: binomial, por la variable X’ normal, siendo 𝜇 = 𝑛 ∙ 𝑝 = 320𝑦

𝜎 = _𝑛𝑝𝑞 = 14,75.𝐸𝑠𝑑𝑒𝑐𝑖𝑟, 𝑋′𝑒𝑠𝑁(320,14′75).

𝐸𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝑃(𝑋 ≥ 300) = 𝑃(𝑋′ ≥ 299,5) = 𝑃 i𝑍 ≥299,5 − 320

14′75 j = 𝑃(𝑍 ≥ −1,39) =

𝑃(𝑍 ≤ 1,39) = 0,9177 𝐿𝑢𝑒𝑔𝑜𝑙𝑎𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑑𝑒𝑞𝑢𝑒𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑎𝑛𝑎𝑙𝑎𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎𝑎𝑙𝑚𝑒𝑛𝑜𝑠300𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠𝑒𝑠𝑑𝑒𝑙91,77%

Page 10: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

10

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

ESTADISTICA INFERENCIAL La estadística inferencial trata de estudiar características de una población a partir de las conclusiones obtenidas del estudio de una muestra, analizando también el grado de fiabilidad de dichas conclusiones. Supongamos que queremos realizar un estudio sobre el gasto de los alumnos de colegio durante los fines de semana. La población sería los 500 alumnos de 14𝑎18 años. Si su gasto medio fuera de diez euros, tendríamos 𝜇 = 10. Si elegimos una muestra al azar de 50 alumnos y su gasto medio fuera 12€, tendríamos �̅� = 12𝑦𝑛 =50.

DISTRIBUCIÖN MUESTRAL DE MEDIAS TEOREMA CENTRAL DEL LIMITE Dada una población de media 𝜇 y desviación 𝜎, consideramos todas las muestras aleatorias de tamaño n y la variable aleatoria 𝑋w que a cada muestra le hace corresponder su media, es decir , 𝑋w = {𝑥)www, 𝑥%www, … , 𝑥0www} entonces se cumple:

• la media de las medias de las muestras es la misma que la de la población. • La desviación típica de las medias es ,

√"

• La variable 𝑋w que sigue una distribución normal siempre que la distribución inicial lo sea o , si no es así, siempre que el tamaño de las muestras sea igual o superior a treinta. (𝑛 ≥ 30).

Por tanto si una población tiene media 𝜇 y desviación típica 𝜎, y consideramos todas las muestras aleatorias de tamaño n (n cualquiera si la población es ̀ `normal´´ y 𝑛 ≥ 30 si no lo es), entonces las medias de esas muestras siguen aproximadamente una distribución normal de media 𝜇 y desviación ,

√", es decir

𝑋wsigue una distribución normal 𝑁(𝜇, ,√").

Se deduce que cuento mayor sea el tamaño de las muestras mejor es la aproximación y mas pequela es la desviación. Los alumnos del colegio tienen una altura media de 168𝑐𝑚 y una desviación de 5𝑐𝑚. Si elegimos 40alumnos al azar, ¿Cuál es la probabilidad de que su media este entre 166𝑦169 cm ? ¿Y si aumentamos el tamaño de la muestra a 𝑛 = 60? Como el tamaño de la muestra es 𝑛 = 40 ≥ 30,sabemos por el teorema central de limite que las medias de las muestras siguen una distribución normal de media 𝜇 = 168𝑦𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛𝑡𝑖𝑝𝑖𝑐𝑎 ,

√"= (

√$&= 0,79,

es decir 𝑋w𝑒𝑠𝑁(168,0′79) Por tanto ,

𝑃(166 ≤ 𝑋w ≤ 169) = 𝑃 i166 − 1680´79 ≤ 𝑍 ≤

169 − 1680′79 j = 𝑃(−2,53 ≤ 𝑍 ≤ 1,26)

= 𝑃(𝑍 ≤ 1´26) − 𝑃(𝑍 ≤ −2,53) = 0,8962 − (1 − 0´9943) = 0,8905

Page 11: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

11

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

Por tanto, hay aproximadamente un 89% de probabilidad de que la media de esa muestra este entre 166𝑦169𝑐𝑚. Si aumentamos el tamaño a 𝑛 = 60, la variable 𝑋wseguirá una distribución 𝑁(168, (

√'&) = 𝑁(168,0′645)

y por tanto:

𝑃(166 ≤ 𝑋w ≤ 169) = 𝑃 i166 − 1680´645 ≤ 𝑍 ≤

169 − 1680′645 j = 𝑃(−3,1 ≤ 𝑍 ≤ 1,55)

= 𝑃(𝑍 ≤ 1´55) − 𝑃(𝑍 ≤ −3,1) = 0,9394 − (1 − 0´999) = 0,9384 La probabilidad ahora es 93,8% ya que al aumentar el tamaño de la muestra las medias muéstrales están mas concentradas alrededor de la media.

DISTRIBUCIONES MUESTRALES DE PROPORCIONES Supongamos que conocemos que el 40% de los alumnos de bachillerato del centro realiza alguna actividad solidaria en su tiempo libre. Si eligiéramos un alumno al azar, la probabilidad de que realizase actividades solidarias (éxito) Seria 𝑃 = 0,4 y estaríamos ante una prueba binomial. Seleccionamos una muestra de 50alumnos y nos preguntamos cual será la proporción (𝑝!) de alumnos solidarios en dicha muestra. Dado que hay 𝑛 = 50 alumnos , seguirá una distribución binomial 𝐵(50, 0´4). Teniendo en cuenta que :

𝑛𝑝 = 20 ≥ 5 𝑛𝑞 = 30 ≥ 5

podremos aproximar la variable por una distribución normal 𝑁(𝑛𝑝,_𝑛𝑝𝑞), 𝑒𝑠𝑑𝑒𝑐𝑖𝑟𝑁(20,3´46). Como la proporción de alumnos solidarios en la muestra es 𝑝! =

*(&

, la variable 𝑝! seguirá una distribución

𝑁N"2", √"23

"O = 𝑁 i𝑝,z23

"j en este caso 𝑁 N%&

(&, 4,$'(&O = 𝑁(0′4,0′069).

Podemos generalizar entonces: Si en una población aparece una característica binomial determinada (el individuo la tiene o no) con una proporción p, entonces la proporción de individuos con dicha característica (𝑝!) en las muestras de

tamaño 𝑛, 𝑠𝑖𝑒𝑛𝑑𝑜𝑛 ≥ 30, sigue una distribución 𝑁i𝑝,z23"j.

A esta distribución se le llama distribución muestral de proporciones. Una empresa produce gomas de borrar y se ha comprobado que el 7% son defectuosas. Se venden en bolsas de 100𝑔𝑜𝑚𝑎𝑠. Se pide:

• Probabilidad de que al comprar una bolsa encontremos menos del 4% de gomas defectuosas. • Probabilidad de que sean defectuosas entre 4𝑦8gomas.

La probabilidad de que una goma sea defectuosa es 𝑝 = 0′07 La variable 𝑋 = ′′𝑛ú𝑚𝑒𝑟𝑜𝑑𝑒𝑔𝑜𝑚𝑎𝑠𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠𝑒𝑛𝑙𝑎𝑠𝑏𝑜𝑙𝑠𝑎𝑠𝑑𝑒100′′ , sigue una distribución binomial 𝐵(100,0`07) La proporción 𝑃!de gomas defectuosas en las bolsas de tamaño 𝑛 = 100 se aproxima a una distribución

normal 𝑁i𝑝,z23"j, es decir, 𝑁}0`07, z&`&-∙&`84

)&&~ = 𝑁(0`07,0`025).

Luego 𝑃!𝑒𝑠𝑁(0`07,0`025). Ahora ya podemos responder a las preguntas.

• 𝑃(𝑃! < 0`04) = 𝑃 N9!#&`&-&`&%(

< &`&$#&`&-&`&%(

O = 𝑃(𝑍 < −1,2) = 𝑃(𝑍 > 1,2) = 1 − 𝑃(𝑍 ≤ 1,2) =

Page 12: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

12

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

1 − 0`8849 = 0`1151.

• 4𝑦8gomas suponen una proporción de 0`04𝑦0`08respectivamente, luego 𝑃(0`04 ≤ 𝑃! ≤0`08)

= 𝑃(−1,2 ≤ 𝑍 ≤ 0,4) = 𝑃(𝑍 ≤ 0`4) − 𝑃(𝑍 ≤ −1,2) = 0`6554 − 0`1151 = 0`5403

Podríamos haber empleado también la aproximación de la binomial a la normal.

INTERVALOS DE CONFIANZA Dada una variable 𝑋𝑐𝑜𝑛𝑚𝑒𝑑𝑖𝑎𝜇, llamamos intervalo característico correspondiente a una probabilidad p, al intervalo centrado en 𝜇(𝜇 − 𝑘, 𝜇 + 𝑘) tal que la probabilidad de p es la probabilidad de que X pertenezca a ese intervalo. Como ejemplo, supongamos que la variable es 𝑍𝑁(0,1). Queremos hallar el intervalo simétrico respecto a la media tal que la probabilidad de que 𝑍este dentro es 95%, es decir, 𝑝 = 0`95. Por simetría, si 0´95 es el área dentro del intervalo, el 0´05 restante se reparte idénticamente entre las dos colas : 0´025𝑐𝑎𝑑𝑎𝑢𝑛𝑎. 𝑃(−𝑘 < 𝑍 < 𝑘) = 0´95 → 𝑃(𝑍 < 𝑘) = 0´975 y buscando en las tablas el valor mas próximo obtendremos 𝑘 = 1´96. Luego 𝑃(−1´96 < 𝑍 < 1´96) = 0´95, es decir, hay un 95% de probabilidad de que 𝑍tome valores en ese intervalo. Realizando el mismo proceso obtendríamos para el 90%𝑘 = 1´645𝑦𝑝𝑎𝑟𝑎99%𝑘 = 2´575. Podemos afirmas que 𝑃 N−𝑧: %;

< 𝑍 < 𝑧:%; O = 1 − 𝛼

Los valores críticos mas utilizados son:

1 − 𝛼 0´9 0´95 0´99 𝑧:

%; 1´645 1,96 2´575

Page 13: SELECTIVIDAD A4, B4 - c2academia.files.wordpress.com › 2020 › 03 › ... · 2 MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4 N Y la variable X estaría definida

13

MATEMATICAS APLICADAS A LAS CIENCIAS SOCIALES. - SELECTIVIDAD A4, B4

INTERVALOS DE CONFIANZA PARA LA MEDIA DE LA POBLACIÓN Si deseamos estimar la media 𝜇 de una población de la que conocemos la desviación típica 𝜎, extraemos una muestra de tamaño 𝑛 de la que se obtiene una media muestral �̅�. Si la población de una partida sigue una distribución normal o bien 𝑛 ≥ 30, entonces el intervalo de confianza de 𝜇 con un nivel de confianza de (1 − 𝛼)% es:

i�̅� − 𝑧:%;∙𝜎√𝑛

, �̅� + 𝑧:%;∙𝜎√𝑛j

Si en algunos de los casos se desconociera la desviación de la población podríamos realizar el intervalo con la desviación de la muestra siempre y cuando la muestra sea lo suficientemente grande como para eludir el error que cometeremos.

i�̅� − 𝑧:%;∙𝑠√𝑛

, �̅� + 𝑧:%;∙𝑠√𝑛j

Para definir el error admisible tendremos en cuenta el intervalo de confianza. Lógicamente , el error máximo será el radio del intervalo:

𝐸 = 𝑧:%;∙𝜎√𝑛

INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN Se tata ahora de encontrar un intervalo en el que afirmar, con un nivel de confianza determinada, que se encuentra la proporción total de la población.

Sabemos que las proporciones de las muestras (siempre que 𝑛 ≥ 30) siguen una distribución 𝑁 i𝑝,z23"j

y siguiendo un procedimiento totalmente análogo al de las medias muéstrales, podemos afirmar que el intervalo de confianza para la proporción de individuos de una población que cumplen una determinada característica:

}𝑃! − 𝑧: %;∙ z𝑝𝑞𝑛 ,𝑃! − 𝑧

:%;∙ z𝑝𝑞𝑛 ~

El error máximo cometido será igualmente el radio del intervalo:

𝐸 = 𝑧:%;∙ z𝑝𝑞𝑛