Repaso de probabilidades y estadística Introducción

Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli

1

Repaso de probabilidades y estadística

Introducción

El campo de la estadística tiene que ver con la recopilación, análisis y uso de datos para tomar

decisiones y resolver problemas.

Cuando se recibe información en forma de datos es necesario obtener alguna conclusión a partir de

la información contenida en ellos.

Las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad de los

datos. La variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las

observaciones.

Por ejemplo, la medición obtenida a partir de una escala puede depender del lugar del panel en que

se coloque el objeto que se ha de medir. El muestreo también puede ser causa de variabilidad. Por

ejemplo, supóngase que un lote de 5000 circuitos integrados contiene exactamente 50 circuitos

defectuosos. Si se inspeccionan los 5000 dispositivos, y el proceso de inspección no tiene error en

la inspección o medición, entonces se encontrarán 50 circuitos defectuosos.

Pero supongamos que se selecciona una muestra de 100 dispositivos; es probable que alguno de

los dispositivos en la muestra esté defectuoso. Se espera que la muestra contenga alrededor de un

1% de circuitos defectuosos (ya que el lote contiene 50/5000 ×100 = 1% de artículos defectuosos).

Pero esta cantidad puede ser 0%, 2% o 5% de circuitos defectuosos, dependiendo de los

dispositivos específicos contenidos en la muestra. Por lo tanto el proceso de muestreo introduce

cierta variabilidad en los resultados observados en el sentido que la proporción de unidades

defectuosas puede cambiar de la proporción real a éstas.

El campo de la estadística y la probabilidad consiste en métodos tanto para describir y modelar la

variabilidad, como para tomar decisiones en presencia de ésta.

En la estadística inferencial lo que se desea hacer es tomar una decisión acerca de una población

en particular. El término población se refiere a la recolección de mediciones de todos los

elementos del universo con respecto al cual se quieren obtener conclusiones o tomar decisiones.

Por ejemplo, la población puede ser el lote de 5000 circuitos integrados del ejemplo anterior.

Supongamos que el fabricante está interesado en la ganancia del transistor de un circuito en

particular de cada uno de los dispositivos. Los distintos niveles que puede tener la ganancia del

transistor pueden considerarse como la población de interés. Por lo tanto cada valor de la

población es una medición numérica, como 5.10 o 5.24; en este caso los datos son variables o

datos numéricos.

Es posible que el fabricante esté interesado en determinar si el dispositivo produce o no una

ganancia que cumpla con algún requisito de diseño. En este caso la población se considera

formada por datos de atributo, en los que a cada dispositivo se le asigna el valor de uno si la

unidad no satisface el requisito de diseño, y cero si cumple con él.

En la mayoría de las aplicaciones de la estadística, los datos disponibles consisten de una muestra

de la población de interés. Esta muestra es un subconjunto de observaciones seleccionadas de una

población.

En el ejemplo de los circuitos integrados, supongamos que la muestra está formada por cinco

dispositivos seleccionados de un lote de 5000. Las ganancias del transistor observadas en estos

dispositivos son 5.10, 5.24, 5.13, 5.19 y 5.08. El interés puede centrarse en cuestiones como:

“¿la información contenida en la muestra lleva a la conclusión de que la ganancia del transistor es

menor que 5.50?”, o “¿cuánta confianza puede tenerse en que la ganancia del transistor se


2

encuentre en el intervalo que va de 5.00 a 5.50?”. Los métodos de la estadística inferencial se

emplean para dar respuesta a estas preguntas y a otras del mismo tipo.

Los métodos para resumir y organizar datos se denominan estadística descriptiva. La mayor

parte del uso moderno de la estadística se dirige más hacia la inferencia que a la descripción. Por

ejemplo, un ingeniero que diseña un nuevo circuito de computadora fabricará una muestra

(prototipo) de ellos, y entonces querrá obtener conclusiones sobre la forma en que estos

dispositivos funcionarán una vez que se produzcan a gran escala.

Antes de estudiar las técnicas de la estadística inferencial, veremos los conceptos básicos de la

probabilidad. El conocimiento de este tema constituye la base que permite comprender la forma

en que se desarrollan las técnicas de la inferencia estadística y la toma de decisiones, por qué

funciona, y cómo pueden presentarse e interpretarse de manera correcta las conclusiones obtenidas

con estos procedimientos. La probabilidad es el lenguaje y la fundamentación matemática de la

estadística inferencial.

Si se mide la corriente que circula por un alambre de cobre delgado, lo que se está haciendo es un

experimento. Sin embargo, al repetir la medición durante varios días los resultados que se

obtienen son un poco diferentes debido a pequeñas variaciones en las variables que no están

controladas en el experimento, como son los cambios en la temperatura ambiente, ligeras

variaciones en el instrumento de medición y pequeñas impurezas en la composición química del

alambre en distintas partes, además de las variaciones en la fuente de corriente. En consecuencia,

se dice que este experimento (como muchos otros) tiene un componente aleatorio. En algunos

casos las variaciones aleatorias observadas son tan pequeñas en relación con las metas del

experimento, que pueden ignorarse. Sin embargo, la variación casi siempre está presente y su

magnitud puede llegar a ser tan importante a tal grado, que las conclusiones del experimento sean

no muy evidentes.

Sin importar con cuánto cuidado se diseñe y se realice un experimento, siempre se tendrán

variaciones. Se quiere comprender, cuantificar y modelar el tipo de variaciones que a menudo se

encuentran en la práctica. Cuando se incorpora la variación en el análisis, siempre pueden

obtenerse conclusiones fundamentales de los resultados que no se invaliden por la variación.

Experimentos aleatorios

La Teoría de Probabilidades estudia los llamados experimentos aleatorios.

Ejemplos clásicos de experimentos aleatorios son los juegos de azar:

a) tirar un dado y observar el número en la cara de arriba.

b) tirar una moneda.

c) lanzar una moneda cuatro veces y contar el número total de caras obtenidas.

d) lanzar una moneda cuatro veces y observar la sucesión de caras y cecas obtenidas.

e) realizar una medición.

Simbolizamos con a un experimento aleatorio.

Un experimento aleatorio tiene las siguientes características:


3

1-Se lo puede repetir bajo las mismas condiciones tantas veces como se desee.

2- No se puede predecir con exactitud el resultado de dicho experimento, pero se puede decir

cuáles son los posibles resultados del mismo.

3- A medida que el experimento se repite, los resultados individuales parecen ocurrir en forma

aparentemente caprichosa. Pero si el experimento se repite un gran número de veces, y

registramos la proporción de veces que ocurre un determinado resultado, veremos que esa

proporción tiende a estabilizarse en un valor determinado a medida que aumenta el número de

veces que se repite el experimento.

Por ejemplo, consideremos el experimento de lanzar un dado y observar el número de la cara

superior. Supongamos que tiramos el dado N veces, y sea n el número de veces que sale el

número 5 en los N tiros del dado. Entonces N

n es la proporción de veces que sale el número 5 en

los N tiros. Si el dado es normal a medida que N aumenta, N

n tiende a estabilizarse en un número

que es 1/6.

4- El resultado está determinado por factores que no se pueden controlar aún conocidos los

mismos.

A veces sucede que un experimento no es aleatorio estrictamente, pero resulta mucho más sencillo

estudiarlo como si fuera aleatorio. Por ejemplo, si tiramos una moneda y observamos qué lado

queda hacia arriba, el resultado sería predecible conociendo en forma precisa las velocidades

iniciales de traslación y rotación, y las elasticidades de los materiales del piso y de la moneda.

Pero la precisión con la que se necesitan conocer estos datos es casi imposible de obtener en la

realidad, por lo que es más conveniente tratar al experimento como aleatorio.

Por ejemplo,

a) Si : tirar un dado y observar el número en la cara de arriba, entonces podemos tomar

como espacio muestral a 6,5,4,3,2,1S

b) Si : tirar una moneda, entonces scS ,

c) Si : lanzar una moneda tres veces y contar el número total de caras obtenidas entonces

podemos considerar 3,2,1,0S

d) Si : lanzar una moneda tres veces y observar la sucesión de caras y cecas obtenidas,

entonces ),,();,,();,,();,,();,,();,,();,,(;,, sssscscsssscccscscscccccS

e) Si : tirar un dado las veces necesarias hasta que sale un 6 por primera vez, y contar el

número de tiros realizados, entonces NS ,.....4,3,2,1 , donde N es el conjunto de los

números naturales.

Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se

repita siempre de la misma manera.

El conjunto de los posibles resultados de un experimento aleatorio recibe el nombre de

espacio muestral del experimento. El espacio muestral se denota con la letra S.


4

f) Si : medir el tiempo de vida de una lamparita eléctrica, entonces 0, tRtS donde

R es el conjunto de los números reales.

g) Las lecturas en las miras graduadas pueden tomar cualquier valor dentro del rango de la

misma.

h) Las lecturas en los limbos o círculos graduados de los instrumentos topográficos.

Observaciones:

1- La elección de S no es única, depende de lo que se quiera observar del experimento

aleatorio.

2- El espacio muestral puede ser un conjunto finito, o infinito. A su vez si es infinito puede

ser infinito numerable o no numerable. En e) el conjunto S es infinito numerable, en f) el

conjunto S es infinito no numerable.

Se llama evento o suceso a todo subconjunto del espacio muestral. Por ejemplo,

a) En el experimento dado en el ejemplo a), un evento de S sería 6,4,2A pues SA .

Podemos expresar al evento A con palabras de la siguiente manera A: “sale un

número par”

También 3,2,1B es un evento al que podemos expresar verbalmente como

B: “sale un número menor o igual que 3”

b) En el experimento dado en el ejemplo d), un evento de S sería

),,();,,();,,(;,, ccscscscccccC , el que en palabras se puede expresar como

C: “salen por lo menos dos caras”

c) En el experimento dado en el ejemplo f), un evento de S sería D: “la lamparita

dura más de 1200 horas”, en notación de conjuntos 1200 ; tRtD

Interpretaciones de la probabilidad

Es útil cuantificar la posibilidad de que se presente un resultado de un experimento aleatorio.

La probabilidad de un resultado puede interpretarse como el valor límite de la proporción de veces

que el resultado aparece en N repeticiones del experimento aleatorio, a medida que N crece sin

cota alguna.

Por ejemplo, si se asigna una probabilidad de 0.25 al resultado “una lamparita dura más de 1200

hs”, esto pude interpretarse como una implicación de que, si se mide el tiempo de vida de muchas

lamparitas, (con las mismas características), aproximadamente el 25% de ellas durarán más de

1200 hs.

Este ejemplo proporciona una interpretación de frecuencia relativa para la probabilidad.

Dado un evento A asociado a un experimento aleatorio . Supongamos que se repite n veces el

experimento , y anotamos An al número de veces que ocurre A en la n repeticiones de . Se

define la frecuencia relativa de A, y se simboliza Af , al cociente n

nA . Es decir que Af es la

proporción de veces que ocurre A en las n repeticiones de .

La frecuencia relativa Af tiene las siguientes propiedades:


5

1- 10 Af

2- 1Af si y solo si A ocurre cada vez en las n repeticiones

3- 0Af si y solo si A no ocurre nunca en las n repeticiones

4- Si A y B son dos eventos mutuamente excluyentes entonces BABA fff

Las probabilidades de un experimento aleatorio a menudo se asignan sobre la base de un modelo

razonable del sistema que se estudia. Un enfoque es asignar las probabilidades con base en el

concepto de resultados igualmente probables.

A menudo es necesario asignar probabilidades a eventos que están compuestos de varios

resultados individuales del mismo espacio muestral.

Para un espacio muestral discreto, la probabilidad de un evento E anotada P(E), puede definirse

como la suma de las probabilidades de los resultados de E.

Independencia de eventos

Dados dos eventos A y B , puede ocurrir que saber que A ocurrió modifica la probabilidad de

ocurrencia de B. Cuando ocurre que saber que A ocurrió no modifica la probabilidad de

ocurrencia de B se dice que A y B son eventos independientes.

Se puede probar que

)()()( si soloy si ntesindependieson y BPAPBAPBA

Variables aleatorias

En muchos casos es deseable asignar un valor numérico a cada resultado de un experimento

aleatorio. Esta asignación se llama variable aleatoria.

Por ejemplo, supongamos que un ingeniero eléctrico tiene seis resistores en la mano. Tres de ellos

tienen etiqueta de 10 Ω y los otros tres tienen etiqueta de 20 Ω. El ingeniero quiere conectar un

resistor de 10 Ω y un resistor de 20Ω en serie, para crear una resistencia de 30 Ω. Ahora

supongamos que en efecto los tres resistores etiquetados con 10 Ω tienen las resistencias “reales”

de 9, 10 y 11 Ω y que los tres resistores etiquetados con 20 Ω tienen las resistencias “reales” de

19, 20 y 21 Ω. El proceso para seleccionar un resistor de cada tipo es un experimento cuyo espacio

muestral consta de nueve resultados igualmente probables:

resultado probabilidad

(9,19) 1/9

(9,20) 1/9

(9,21) 1/9

Cada vez que un espacio muestral esté formado por n posibles resultados

igualmente probables, la probabilidad de cada uno de ellos será 1/n.


6

(10,10) 1/9

(10,20) 1/9

(10,21) 1/9

(11,19) 1/9

(11,20) 1/9

(11,21) 1/9

Ahora lo que es importante para el ingeniero de este experimento es la suma de las dos

resistencias, en vez de sus valores individuales. Entonces se asigna a cada resultado un número

igual a la suma de las dos resistencias seleccionadas. Esta asignación se representa por la letra X y

se presenta en la siguiente tabla

La función X que asigna un valor numérico a cada resultado en el espacio muestral es una

variable aleatoria. En topografía una variable aleatoria puede ser: “la cantidad de veces que entra

el metro patrón entre dos marcas fijas o no.”

Se acostumbra anotar a las variables aleatorias con letras mayúsculas. Las letras X, Y y Z se usan

con más frecuencia.

Se puede calcular las probabilidades para las variables aleatorias de una manera obvia. En el

ejemplo anterior, el evento X = 29 corresponde con el evento {(9,20) , (10,19)} del espacio

muestral. Por lo tanto ( ) ,*( ) ( )+- Hacemos una lista de los valores posibles de la variable aleatoria (v.a) X y determinamos la

probabilidad de cada uno de ellos:

X P(X = x)

28 1/9

29 2/9

30 3/9

31 2/9

32 1/9

La tabla anterior contiene toda la información necesaria para calcular cualquier probabilidad que

considere a la v.a. X. Es de destacar la simetría de la distribución.

El conjunto de valores posibles de una v.a. se llama rango.

resultado X probabilidad

(9,19) 28 1/9

(9,20) 29 1/9

(9,21) 30 1/9

(10,10) 29 1/9

(10,20) 30 1/9

(10,21) 31 1/9

(11,19) 30 1/9

(11,20) 31 1/9

(11,21) 32 1/9


7

Las variables aleatorias se clasifican según su rango.

Sea X es una v.a. con rango XR . Si XR es un conjunto finito o infinito numerable entonces se

dice que X es una v.a. discreta. Si XR es un conjunto infinito no numerable (por ejemplo todos

los números reales de un intervalo) entonces X es una v.a. continua.

Esta clasificación va más allá de la forma numérica que adoptan sus resultados y se refiere a la

naturaleza del proceso. Los resultados numéricos están sujetos a las posibilidades del medio de

captura de datos es decir la precisión de los instrumentos y métodos empleados. En Topografía las

observaciones son variables aleatorias continuas.

Variables aleatorias discretas

Sea X una v.a. discreta. .Anotamos su rango como nX xxxR ,,, 21 si el rango es un conjunto

finito de n elementos, y anotamos ,, 21 xxRX si el rango es un conjunto infinito

numerable.

A cada ix se le asigna un número )()( ii xXPxp . Estos números deben satisfacer las

condiciones siguientes

a) ixp i todopara 0)(

b) 1)( i

ixp

La función )(xp que antes se definió, se llama función de probabilidad o de frecuencia de la v.a.

X. El conjunto de pares ,...2,1 ))(,( ixpx ii es la distribución de probabilidad de X.

Por ejemplo

1-Se tira una moneda normal tres veces, sea la v.a. X: “número de caras obtenidas”

Entonces 3,2,1,0XR

Para hallar la distribución de probabilidad de X supongamos que la probabilidad de salir cara es

0.5 entonces

8

1,,)0( sssPXP

8

3,,;,,;,,)1( cssscssscPXP

8

3,,;,,;,,)2( cscccssccPXP

8

1,,)3( cccPXP

Se puede presentar la distribución de probabilidad de X en una tabla de la siguiente forma

x 0 1 2 3

p(x) 1/8 3/8 3/8 1/8


8

Un gráfico de la distribución de probabilidad de X sería. Observe su simetría.

2-Se tira un dado normal. Sea X: “número que queda en la cara superior”

Entonces 6,5,4,3,2,1XR

La función de distribución de X es

A estas distribuciones se las denomina uniformes ya que en todo su rango de ocurrencia la

probabilidad es constante. Al error de lectura en los instrumentos digitales se los suele modelizar

estadísticamente con esta distribución de probabilidades.

Función de distribución acumulada

Sea X una v.a. con rango XR . Se define la función de distribución acumulada de X (abreviamos

F.d.a de X) como

xxXPxF )()( (12)

En el caso de ser X una v.a. discreta

xxpxXPxFx

i )()()( xi

Volviendo al ejemplo 1 anterior, la F.d.a. de X es

x 1 2 3 4 5 6

p(x) 1/6 1/6 1/6 1/6 1/6 1/6


9

3 si 1

32 si 8

7

21 si 2

1

10 si 8

10 si 0

)(

3 si 1

32 si 8

3

8

3

8

1

21 si 8

3

8

1

10 si 8

10 si 0

)(

x

x

x

x

x

xF

x

x

x

x

x

xF

La gráfica de la F.d.a. de X es

Observación: la F.d.a. de X es una función escalonada, los puntos de “salto” coinciden con los

puntos del rango de X, y la magnitud del salto en ix es igual a )( ixXP

Esperanza de una variable aleatoria discreta

Ejemplos:

1- Sea la v.a. X: “número que queda en la cara de arriba al tirar un dado normal”

6,5,4,3,2,1XR

Entonces

6

1

)()(x

xXxPXE

)6(6)5(5)4(4)3(3)2(2)1(1 XPXPXPXPXPXP

Sea X una v.a. discreta con rango . La esperanza , valor medio o valor esperado de X , lo anotamos

, y se define como

La sumatoria se hace sobre todos los posibles valores de X

Otra notación usual es o


10

5.32

7

6

16

6

15

6

14

6

13

6

12

6

11

2- Se tira una moneda normal tres veces, sea la v.a. X: “número de caras obtenidas”

Entonces 3,2,1,0XR

Calculamos la esperanza de X

5.12

3

8

13

8

32

8

31

8

10)()(

3

0

x

xXxPXE

Observaciones:

1- La esperanza de una v.a. no tiene que coincidir necesariamente con algún valor del rango de la

variable

2- En el ejemplo 1 donde el rango es finito y equiprobable, la esperanza de X coincide con el

promedio de los valores del rango de X 3- Se puede interpretar a la esperanza de una v.a. como un promedio “pesado” o “ponderado” de

los valores del rango de la variable, donde el “peso” de cada ix es la probabilidad )( ixXP

4- Otra interpretación que se puede hacer de la esperanza es la siguiente: consideremos el

ejemplo1, supongamos que tiramos el dado muchas veces, N veces, y entonces obtenemos una

secuencia de N valores Nxxx ,.....,, 21 donde cada ix es un número natural del 1 al 6. Supongamos

además que hacemos un promedio de esos N valores, y si llamamos in al número de veces que

sale el número i tenemos que

N

nnn

N

xxx N 6...21.... 62121

)()6(6...)2(2)1(16...21 621 XEXPXPXPN

n

N

n

N

n

Es decir si promediamos los N valores medidos de X, ese promedio tiende a E(X) cuando

N ,

pues )( iXPN

ni cuando N es grande.

Esta última forma de ver la esperanza o valor esperado es la que adoptamos cuando promediamos

distintas observaciones.

xN

xxx N ....21

Más adelante veremos más propiedades del promedio.

Esperanza de una función

A veces importa hallar la esperanza de una función de X y no de X misma. Veamos un ejemplo.

Un instructor de escritura técnica ha solicitado que cierto reporte sea entregado a la semana

siguiente, agregando la restricción de que cualquier reporte que sobrepase las cuatro páginas será

rechazado.


11

Sea X: “número de páginas del reporte de cierto estudiante seleccionado al azar”

Supongamos que X tenga la siguiente distribución de probabilidad

x 1 2 3 4

p(x) 0.01 0.19 0.35 0.45

Suponga que el instructor tarda X minutos calificando un trabajo que consiste en X páginas.

Claramente X es otra variable aleatoria. ¿Cuál será su esperanza?, es decir ¿a qué es igual

XE ?

Para calcular la esperanza de una v.a. se necesita conocer su función de distribución de

probabilidad, por lo tanto habría que hallar previamente la distribución de probabilidad de la v.a.

XY .

Está claro que si el rango de X es 4,3,2,1XR entonces el rango de Y será 4,3,2,1YR

.

Además

01.0)1()1( XPYP

19.0)2()2( XPYP

35.0)3()3( XPYP

45.0)4()4( XPYP

Por lo tanto

)4(4)3(3)2(2)1(1 YPYPYPYPYE

78491.1)4(4)3(3)2(2)1(1 XPXPXPXP

O sea

)()( xXPxYEx

Lo visto en este ejemplo se puede generalizar en el siguiente

Ejemplo:

Un negocio de computadoras ha comprado tres computadoras de cierto tipo a $500 cada una y las

venderá a $1000 cada una. El fabricante ha aceptado volver a comprar en $200 cualquier

computadora que no se haya vendido en un tiempo especificado.

Sea X: “número de computadoras vendidas” , y supongamos que la distribución de probabilidad de

X es

x 0 1 2 3

p(x) 0.1 0.2 0.3 0.4

Teorema: Si X es una v.a. discreta con rango RX y distribución de probabilidad p(x), entonces

la esperanza de cualquier función h(X) es igual a


12

Si consideramos la v.a. Y: “utilidad obtenida”, entonces Y es una función de X, es decir )(XhY

Específicamente 9008001500)3(2001000 XXXY

La utilidad esperada, es decir la )(YE será

3

0

)(900800)(x

xXPxYE

)3(9003800)2(9002800)1(9001800)0(9000800 XPXPXPXP

700$4.015003.07002.0)100(1.0)900(

Notar que aplicando propiedades de la notación se puede plantear

3

0

3

0

3

0

900)(800)(900)(800)(900800)(x xx

XExXPxXxPxXPxYE

y calculando la esperanza de X , se llega al mismo resultado

Propiedades de la esperanza

En el ejemplo anterior tenemos que Y es una función lineal de X , es decir baXY con a y b

números reales.

En este caso vale entonces la siguiente propiedad

bXaEbaXE )()(

La demostración sigue los mismos pasos que en el ejemplo anterior

bXaExXPbxXxPaxXPbaxbaXExxx

)()()()()(

)(XE 1

Ejemplo:

En el ejemplo anterior donde 900800 XY

Directamente calculamos 900)(800)( XEYE

Y 24.033.022.011.00)( XE

En consecuencia 7009002800900)(800)( XEYE


13

Observaciones:

1- Para cualquier constante a, )()( XaEaXE

2- Para cualquier constante b, bXEbXE )()(

Ejemplo:

Si poseo el valor esperado de dos cotas, PfA y PfB el desnivel esperado será

PfAPfBPfAPfBE 11)(

Varianza de una variable aleatoria

La esperanza de una v.a. mide dónde está centrada la distribución de probabilidad. Pero

supongamos el siguiente ejemplo

Sean X e Y dos variables aleatorias con distribuciones dadas por

Es fácil verificar que 0)()( YEXE , pero los valores que toma la v.a. Y están más “alejados”

de su esperanza que los valores de X.

Se busca una medida que refleje este hecho, se define entonces la varianza de una v.a.

x -1 1

p(x) 0.5 0.5

y -100 100

p(y) 0.5 0.5

X

Y

Sea X una v.a. discreta con rango RX, función de distribución de probabilidad p(x) y esperanza

𝐸(𝑋) 𝜇,

Entonces la varianza de X, que anotamos 𝑉(𝑋) 𝜎2 𝑜 𝜎𝑋2 es

La desviación estándar de X es 𝜎𝑋 𝑉(𝑋)


14

Observaciones:

1- La varianza de una v.a. nunca es negativa

2- La cantidad 2)( XXh es el cuadrado de la desviación de X desde su media, y la

varianza de X es la esperanza de la desviación al cuadrado. Si la mayor parte de la distribución de

probabilidad está cerca de , entonces 2 será relativamente pequeña. Si hay valores de la

variable alejados de que tengan alta probabilidad, entonces 2 será grande.

3- 2 está expresado en las unidades de medida de X al cuadrado, mientras que está expresada

en las mismas unidades de medida que X.

Ejemplo:

En el caso de las variables aleatorias X e Y nombradas anteriormente,

15.0015.001)(22

XV y 1X

2221005.001005.00100)( YV y 100Y

Otra forma de escribir la varianza de una v.a., que facilita los cálculos es

X XXXX Rx RxRxRxRx

xpxxpxpxxpxxxpxXV )()(2)()(2)()( 22222

2222222 )(2)()(2)( XEXEXEXE

Por lo tanto

22 )()( XEXV

Propiedades de la varianza

Las propiedades de la varianza de una v.a. son consecuencia de las propiedades de la esperanza de

una v.a.

Si X es una v.a. discreta con rango XR y distribución de probabilidad p(x), entonces la varianza de

cualquier función h(X) es igual a

XRx

xpXhExhXhV )())(()())((2

Si h(X) es una función lineal, entonces

)()( 2 XVabaXV y XbaX abaXV )(

Observaciones:

1- )()( 2 XVaaXV

2- )()( XVbXV

Ejemplo:


15

En un ejemplo anterior donde X: “número de computadoras vendidas” y Y: “utilidad obtenida”, la

V(Y) sería )(800)( 2 XVYV

Necesitamos calcular V(X) 22 )()( XEXV

Sabemos ya que

Calculamos 54.033.022.011.00)( 22222 XE

En consecuencia

80025800)(800)(800)( 222222 XEXVYV

Variables aleatorias discretas importantes

Distribución binomial

Sea un experimento aleatorio. Sea A un evento asociado a y anotamos pAP )( .

Supongamos un experimento aleatorio 0 que cumple los siguientes requisitos:

1- se realizan n repeticiones independientes de , donde n se fija de antemano.

2- las repeticiones son idénticas, y en cada repetición de observamos si ocurre A o no ocurre A

(cuando A ocurre se dice que se obtuvo un “éxito”, caso contrario se obtuvo un “fracaso”)

3- la probabilidad de éxito es constante de una repetición a otra de , y es igual a p .

Se dice entonces que 0 es un experimento binomial

Ejemplos:

1- Se tira una moneda 4 veces en forma sucesiva e independiente, y observamos en cada tiro si

sale cara o no sale cara.

Entonces este es un experimento binomial pues:

sería el experimento “tirar una moneda”

A sería el evento “sale cara”

se repite en forma sucesiva e independiente n = 4 veces

pAP )( es la misma en cada tiro.

2- Se tiene una urna con 15 bolillas blancas y 5 verdes. Se extraen al azar con reemplazo tres

bolillas y se observa si la bolilla extraída es blanca.

Entonces este es un experimento binomial pues:

sería el experimento “extraer al azar una bolilla de la urna”

A sería el evento “se extrae bolilla blanca”

se repite en forma sucesiva e independiente n = 3 veces

4

3

20

15)( AP es la misma en cada extracción.

El muestreo con reemplazo implica que las condiciones bajo las que se realiza el experimento no

se alteran en cada repetición. Es lo que debería suceder cuando realizamos nuestras observaciones.

2)( XE


16

Los factores que determinan los resultados ,aunque no controlables, deberían estar presentes en

cada medición.

Una forma de ver el experimento binomial es no en función de colores o figuras sino de signos

con que ocurre un determinado fenómeno, por ejemplo la coincidencia de dos marcas o señales.

En nuestro caso los extremos de una cinta con el objeto a medir o cualquier situación similar.

La variable aleatoria binomial y su distribución

En la mayoría de los experimentos binomiales, interesa el número total de éxitos, más que saber

exactamente cuáles repeticiones produjeron los éxitos

Sea la v.a. X: “número de éxitos en las n repeticiones de ”

Entonces se dice que X es una v.a. binomial

Veamos cuál es la distribución de probabilidad de X, para esto primero tomamos un caso concreto:

el ejemplo 1 anterior en el que se tira una moneda 4 veces. Supongamos que la probabilidad de

cara es ¾

Aquí el rango de X sería 4,3,2,1,0XR

Para facilitar la notación escribimos 4,3,2,1 tiro"ésimo elen cara sale:" iiAi

Por lo tanto

4

432143214

1

4

1

4

1

4

1

4

1)()()()()0(

CCCCCCCC APAPAPAPAAAAPXP

por independencia

Para calcular la )1( XP pensamos que hay cuatro casos posibles en los que se puede obtener

exactamente una cara, que la cara salga en el 1º tiro, o en el 2º o en el 3º o en el 4º tiro. Notar que

tenemos cuatro casos y eso es igual a la cantidad de formas en que podemos elegir entre los 4

tiros uno de ellos en el cual sale cara, es decir tenemos 4!3!1

!4

1

4

casos diferentes.

4321

432143214321

)1(

AAAAP

AAAAPAAAAPAAAAP

XP

CCC

CCCCCCCCC

Cada término es igual a 3)1( pp por lo tanto

3)1(4)1( ppXP

Análogamente, para calcular )2( XP tenemos 6!2!2

!4

2

4

casos en los que salen

exactamente dos caras, por lo tanto

22

43214321 )1(2

4)2( ppAAAAPAAAAPXP CCCC

Pensando de la misma forma los otros casos se llega a


17

)1(3

4)3( 3 ppXP

;

4)4( pXP

En general con un argumento análogo tenemos que nRX ,,2,1,0 y

nk-p)(pk

nkXP

n-kk,...,2,1,0 1)(

Notación: indicamos que X es una v.a. binomial con parámetros n y p con el símbolo

),(~ pnBX

Dado que los números )( kXP corresponden a la distribución de una v.a., automáticamente

cumplen que 1)(0

n

k

kXP

De todas formas se podría hacer una verificación algebraica utilizando la fórmula del binomio de

Newton

11)1()(00

nkn

n

k

kn

k

ppppk

nkXP

Ejemplos:

1- En el ejemplo anterior en el que se tira una moneda 4 veces, calcular la probabilidad de

obtener:

a) exactamente una cara

b) al menos una cara

c) a lo sumo una cara

Solución:

a) tenemos que la v.a. X: “número de caras obtenido” es )25.0,4(B

se pide 421875.04

3

4

14

4

11

4

1

1

4)1(

331

XP

b) la probabilidad de obtener al menos una cara es

kk

k kXPXPXPXPXP

44

1 4

3

4

14)4()3()2()1()1(

Pero más fácil es hacer

578125.0421875.014

31

4

11

4

1

0

41)0(1)1(

4040

XPXP

c) la probabilidad de obtener a lo sumo una cara es


18

84375.04

11

4

1

1

4

4

11

4

1

0

4)1()0()1(

141040

XPXPXP

Observación: si ),(~ pnBX para calcular )( kXP en general se debe hacer

)()1()0()()(0

kXPXPXPiXPkXPk

i

Notar que )( kXP es la F.d.a. de X evaluada en k, es decir )()( kXPkF

Existen tablas de la función de distribución acumulada de la binomial para diferentes valores de n

y p

Consultando estas tablas se puede obtener directamente el resultado del inciso c) buscando para n

=4 y p = 0.25

Además consultando las tablas podemos evaluar )( kXP haciendo

nkkFkFkXP ,...,2,1 )1()()(

2- Supongamos que el 20% de todos los ejemplares de un texto en particular fallan en una prueba

de resistencia a la encuadernación. Se seleccionan 15 ejemplares al azar.

Sea la v.a. X: “número de ejemplares que fallan en la prueba entre los 15 seleccionados”

a) ¿cuál es la probabilidad de que a lo sumo 8 fallen en la prueba?

b) ¿cuál es la probabilidad de que exactamente 8 fallen en la prueba?

c) ¿cuál es la probabilidad de que al menos 8 fallen en la prueba?

Solución:

a) Tenemos que )2.0,15(~ BX

999.0)8()()8(8

0

FkXPXPk

por tabla de la F.d.a.

b) 003.0996.0999.0)7()8()8( FFXP


c) 004.0996.01)7(1)7(1)8( FXPXP


Observaciones:

1- Si ),1(~ pBX entonces la v.a. X toma sólo dos valores 0 y 1 con probabilidades p y 1-p es

decir podemos escribir


19

contrario caso 0

éxito ocurre ejecutar al si 1 X

pAPXP

pAPXP

C

1)()0(

)()1(

En este caso se dice que X tiene distribución de Bernoulli

En el caso de ser ),(~ pnBX se dice que se tienen “n ensayos de Bernoulli”

2- A continuación se muestra cómo varía la forma de la distribución a medida que p aumenta

manteniendo n fijo en 15. Se grafica la distribución de frecuencia para p = 0.01; 0.2, 0.5, 0.7 y

0.995.

Observar que para p = 0.5 la distribución de frecuencia es simétrica.

p = 0,01n = 15

0 3 6 9 12 15

0

0,2

0,4

0,6

0,8

1

p = 0,2n = 15

0 3 6 9 12 15

0

0,05

0,1

0,15

0,2

0,25

0,3

p = 0,5n = 15

0 3 6 9 12 15

0

0,04

0,08

0,12

0,16

0,2


20

Esperanza y varianza

Más ejemplos de aplicación de la distribución Binomial

1) Si la probabilidad de cometer determinado error en una medida es 0.5, cuál es la

probabilidad de que en 10 mediciones se obtengan 8 que posean dicho error?

n=10 ; p=0,5 ; z= 8

P(z=8) = . / 2

Interpretación: si estas 10 mediciones ( el trabajo) se realizaran 100 veces, en promedio, 9 de esos

conjuntos tendrían z=8.

p = 0,7n = 15

0 3 6 9 12 15

0

0,04

0,08

0,12

0,16

0,2

0,24

p = 0,995n = 15

0 3 6 9 12 15

0

0,2

0,4

0,6

0,8

1


21

2) Para el caso anterior cuál es la probabilidad de que todas las mediciones tengan ese error.

P(z=10) = . /

3) Que ninguna tenga ese error.

P(z=0) = . /

4) Si en un conjunto de mediciones la probabilidad de no sobrepasar un determinado error es

del 25% calcular la probabilidad de que cada 4 mediciones realizadas ninguna sobrepase

dicho error.

n=4 ; p=0,25 ; z= 0

P(z=0) = . /

Ejemplos de usos en agrimensura específicamente

1) controlo dos cintas poniéndolas apareadas. Debería encontrar tantas diferencias positivas

como negativas. Puedo evaluar la probabilidad de encontrar los r resultados encontrados. La idea

es que una baja probabilidad nos permita sostener que existe una diferencia sistemática entre

ambas. También puede aplicarse a dos miras.

2) tengo una red de anillos de nivelación. Debería tener tantos cierres positivos como negativos.

Sólo cuento la cantidad de signos positivos sin fijarme en la magnitud de los desvíos.

Variables aleatorias continuas

En la sección anterior se consideraron variables aleatorias discretas, o sea variables aleatorias cuyo

rango es un conjunto finito o infinito numerable. Pero hay variables aleatorias cuyo rango son

todos los números reales de un intervalo dado, (es decir es un conjunto infinito no numerable).

Ejemplos de variables continuas podrían ser

X: “tiempo que tarda en llegar un colectivo a una parada”

Y: “tiempo de vida de un fusible”

Z: “Desnivel entre dos puntos”

T: “Distancia entre dos puntos”

Recordemos que las observaciones topográficas y geodésicas se toman como variables aleatorias

continuas

Como ahora los valores de una v.a. continua no son contables no se puede hablar del i-ésimo valor

de la v.a. X y por lo tanto )()( ii xXPxp pierde su significado. Lo que se hace es sustituir la

función )(xp definida sólo para ,...., 21 xx , por una función )(xf definida para todos los valores x

del rango de X. Por lo tanto se da la siguiente definición de v.a. continua .


22

Sea X una v.a. Decimos que es continua si existe una función no negativa f , definida sobre todos

los reales ,x , tal que para cualquier conjunto B de números reales

B

dxxfBXP )()(

O sea que la probabilidad de que X tome valores en B se obtiene al integrar la función f sobre el

conjunto B.

A la función f la llamamos función densidad de probabilidad (f.d.p.).

Observaciones:

1- Como X debe tomar algún valor real, entonces debe cumplirse que

dxxfXP )()(1

2- Si B es el intervalo real bxaRxba ;, entonces

b

a

dxxfbXaPBXP )()()(

Notar que en este caso la probabilidad de que X

tome valores en el intervalo ba, es el área bajo

f entre a y b

3- Si en la observación anterior ba entonces

0)()( a

a

dxxfaXP

Es decir la probabilidad que una v.a. continua tome algún valor fijado es cero. Por lo tanto,

para una v.a. continua

b

a

dxxfbXaPbXaPbXaPbXaP )()()()()(

Función de distribución acumulada

Sea X una v.a. continua. Se define la función de distribución acumulada de X (abreviamos F.d.a

de X) como

xxXPxF )()(


23

Si X tiene f.d.p. f(x) entonces

xdttfxXPxF

x

)( )()(

Además

)()()()()()( aFbFdxxfdxxfdxxfbXaP

abb

a

Observación:

Si X es una v.a. con f.d.p. f(x) y función de distribución acumulada )(xF entonces

)()()(

xfdttfdx

d

dx

xdFx

donde )(xF sea derivable

Es decir, se puede obtener la función de densidad de X a partir de su F.d.a.

El conocimiento de qué función de densidad describe el comportamiento de las observaciones

topográficas nos permitirá evaluar los rangos o intervalos de ocurrencias de las mismas con su

correspondiente probabilidad. Del mismo modo con las coordenadas o cotas que se deriven de

aquellas.

Esperanza de una variable aleatoria continua

Para una v.a. discreta la )(XE se definió como la suma de los )( ii xpx . Si X es una v.a. continua

con f.d.p. f(x), se define )(XE sustituyendo la sumatoria por integración y )( ixp por f(x).

A menudo se desea calcular la esperanza de una función de X, Y = h(X), esto se puede hacer

hallando previamente la densidad de Y y luego calcular E(Y) aplicando la definición anterior.

Otra forma de calcular E(Y) sin hallar la densidad de Y está dada por el siguiente

La esperanza de una v.a. continua X con f.d.p. f(x) se define como


24

De la misma forma que en el caso discreto, si baxxh )( , es decir si h es una función lineal,

aplicando las propiedades de linealidad de la integral tenemos

bXaEbaXE )()(

Varianza de una variable aleatoria continua

La interpretación de la varianza de una v.a. continua es la misma que para el caso discreto.

Además sigue valiendo la igualdad

22)( XEXV

Pues en la demostración hecha para el caso discreto si sustituyen las sumatorias por integrales.

Por la misma razón, también vale que

XbaX aXVabaXV y )()( 2

Variables aleatorias continuas importantes

Distribución normal o gaussiana

Sea X una v.a. Decimos que tiene distribución normal con parámetros y si su f.d.p. es de la

forma

Teorema: Si X es una v.a. continua con f.d.p. f(x) y h(X) es cualquier función de X, entonces

Sea X una v.a. continua con f.d.p. f(x) y sea 𝐸(𝑋) 𝜇, entonces la varianza de X es


25

xexf

x

2

2

1

2

1)(

Donde R y 0

Notación: 2,~ NX

Para darse una idea de la forma de la gráfica notar que:

1- )(xf es simétrica alrededor de , es decir )()( xfxf para todo x

2- 0)(lim

xfx

(eje x asíntota horizontal)

3- Si planteamos xxfdx

d 0)( . Se pude verificar que en x la función tiene un

máximo absoluto,

2

1)( f

4- Si planteamos xxfdx

d 0)(

2

2

. Se puede verificar que en x y en

x la función tiene dos puntos de inflexión, y además en el intervalo , la

función es cóncava hacia abajo y fuera de ese intervalo es cóncava hacia arriba

La gráfica de )(xf tiene forma de campana

Observación:

Cuando varía la gráfica de la función se traslada, es un parámetro de posición.

Cuando aumenta, la gráfica se “achata”, cuando disminuye la gráfica se hace más

“puntiaguda”, se dice que es un parámetro de escala o dispersión.

En las siguientes figuras vemos cómo varía la gráfica de f(x) con la variación de los parámetros


26

1 0

1 2

- - - - - 1 3

1 0

2 0

- - - - - 4 0

Se puede probar que f(x) es una f.d.p. es decir que

a) 0)( xf para todo x

b) 1)(

dxxf

Que a) es cierta se ve en la gráfica; para probar b) es necesario recurrir al cálculo en dos variables

(no lo demostramos).

Si 0 y 1 entonces se dice que X tiene distribución normal estándar. Se anota 1,0~ NX

En este caso la f.d.p. se simboliza con )(x , es decir

-6 -4 -2 2 4 6

0.1

0.2

0.3

0.4


27

xexx

2

1)(

2

2

1

En este caso la gráfica de la densidad es simétrica con respecto al origen.

La F.d.a. de una v.a. normal estándar se anota )(x

xt

dtexXPx2

2

1

2

1)()(

Esta integral no puede expresarse en términos de funciones elementales, por lo tanto se calcula

)(x para valores específicos de x mediante una aproximación numérica.

Esto ya está hecho, existen tablas de la función de distribución acumulada de la normal estándar

para valores de x que oscilan en general entre -4 y 4, pues para valores de x menores que -4,

0)( x , y para valores de x mayores que 4, 1)( x

Notar que como la )(x es simétrica con respecto al origen entonces

)(1)(1)()()( xxXPxXPxXPx

Por ejemplo, si 1,0~ NX entonces utilizando la tabla de la F.d.a. de X

a) 89616.0)26.1()26.1( XP

b) 10384.089616.01)26.1(1)26.1(1)26.1( XPXP

c) 91465.0)37.1()37.1()37.1( XPXP

d) )25.1()37.0()25.1()37.0()37.025.1( XPXPXP

53866.0)89435.01(64431.0)25.1(1)37.0(

e) ¿Para qué valor x se cumple que 95.0)( xXxP ?

Tenemos que 1)(2))(1()()()()( xxxxxxXxP

Por lo tanto 975.02

190.0)( 95.01)(2

xx

-x x 0


28

Observamos en la tabla de la F.d.a. que 96.1x , pues 975.0)96.1(

Para los incisos a) , b) y c) se grafican las regiones correspondientes

Una propiedad importante de la distribución normal es que si 2,~ NX entonces la v.a.

baXY con a y b números reales, 0a , tiene también distribución normal pero con

parámetros ba y 22a , es decir

),~ ,~ 222 abN(abaXNX (1)

Una consecuencia importante del resultado anterior es que

)1,0(~ entonces ),(~ si 2 NX

YNX

(2)

Notar que Y se pude escribir como

XY

1 es decir claramente Y es una función lineal

de X

Por lo tanto aplicamos el resultado (1) con

1a y

b y llegamos a (2).

1.26

b)

1.26

a)

c)


29

Si 2,~ NX entonces la F.d.a. de X es

dtexXPxF

tx2

2

1

2

1)()(

F(x) no puede expresarse en términos de funciones elementales y sólo hay tablas de la F.d.a. de la

normal estándar.

Para calcular F(x) procedemos de la siguiente forma

xxYP

xXPxXPxF )()(

1,0~ NY

Ejemplos:

1- Si 9,3~ NX entonces

a)

3779.03

1

3

2

3

32

3

35

3

35

3

3

3

32)52(

XPXP

b) 8413.0)1()1(13

30

3

3)0(

XPXP

c)

3

6

3

3

3

61636163163

XPXPXPXP

0456.0)2(12221

2- Hay dos niveles máquinas para cortar corchos destinados para usarse en botellas de vino. La

primera produce corchos con diámetros que están normalmente distribuidos con media de 3 cm y

desviación estándar de 0.1 cm. La segunda máquina produce corchos con diámetros que tienen

una distribución normal con media de 3.04 cm y desviación estándar de 0.02 cm. Los corchos

aceptables tienen diámetros entre 2.9 cm y 3.1 cm. ¿Cuál máquina tiene más probabilidad de

producir un corcho aceptable?

Solución:

Sean las variables aleatorias

X: “diámetro de un corcho producido por la máquina 1”

Y: “diámetro de un corcho producido por la máquina 2”

Entonces 21.0,3~ NX y 202.0,04.3~ NY


30

Calculamos cuál es la probabilidad que la máquina 1 produzca un corcho aceptable

6826.01)1(2)1()1(

1.0

39.2

1.0

31.3

1.0

31.3

1.0

3

1.0

39.2)1.39.2(

XPXP

Análogamente para la máquina 2

9987.009987.0)7()3(

02.0

04.39.2

02.0

04.31.3

02.0

04.31.3

02.0

04.3

02.0

04.39.2)1.39.2(

YPYP

Entonces es más probable que la máquina 2 produzca corchos aceptables.

3- Supóngase que la resistencia a romperse (en Kgr) de fibras de yute está descrita por una v.a.

continua X normalmente distribuida con 165 XEμ Kgr y 92 XVσ (Kgr)2.

suponiendo además que una muestra de esta fibra se considera defectuosa si 162X . Cuál es la

probabilidad de que una fibra elegida al azar sea defectuosa?

Solución:

Deseamos conocer 162XP

113

165

3

165162

3

165162

XP

XPXP ,

puesto que 3

165

XZ 10,N . Entonces

.XP 111162

De la tabla tenemos 841301 . 15870111 . .

Es decir 15870162 .XP .

Observación:

Uno puede pensar en objetar el usar una distribución normal estándar para describir a la v.a. X que

representa la resistencia a romperse de la fibra ya que ésta es, obviamente, una cantidad no

negativa, mientras que una v.a. normalmente distribuida puede tomar valores que varían entre

y . Sin embargo al modelar el problema con una normal estándar (que aparentemente debería

ser invalidada como modelo por lo señalado) vemos que les estamos asignando al suceso 0X

una probabilidad prácticamente nula (ver también la figura siguiente):

011551553

1650

3

1650

XPXP .


31

x [Kgr]

f(x)

0 5 10 15 150 180

0,5

1,0

1,5

= 165

Vemos que el fenómeno estudiado se modela estadísticamente mediante una ecuación del tipo

dtexXPxF

tx2

2

1

2

1)()(

Pero luego, para su resolución realizamos el cambio de variable que conduce a la distribución

estandarizada

xt

dtexXPx2

2

1

2

1)()(

En casos como estos se justifica usar la distribución normal para modelar situaciones en que la

variable aleatoria considerada puede tomar, por su significado, sólo valores positivos, aún cuando

la normal permita tomar valores tanto positivos como negativos por cuanto la probabilidad de que

la v.a. tome valores negativos es prácticamente nula.

La distribución normal explica cómo se distribuye la ocurrencia de un fenómeno determinado en

torno a un valor más probable o central más allá de los valores en sí mismos.

Esperanza y varianza de una variable aleatoria con distribución normal

Distribuciones de probabilidad conjunta

Anteriormente se estudiaron distribuciones de probabilidad para una sola variable aleatoria. Sin

embargo, a menudo es útil definir en un experimento aleatorio más de una variable aleatoria.

Por ejemplo, en la clasificación de señales transmitidas y recibidas, cada una de ellas puede

clasificarse como de baja, media o alta calidad. Incluso puede definirse una v.a. X igual al número

de señales de alta calidad recibidas, y otra v.a. Y igual al número de señales de baja calidad

recibidas. En otro ejemplo, la v.a. continua X puede denotar la longitud de una pieza moldeada por

inyección, y la v.a. continua Y puede ser el ancho de la pieza. Por ejemplo, si las especificaciones

Sea entonces y


32

para X e Y son (2.95 a 3.05) y (7.60 a 7.80) milímetros, respectivamente, entonces se puede tener

interés en la probabilidad de que una pieza cumpla con ambas especificaciones, o sea P( 2.95 < X

< 3.05 y 7.60 < Y < 7.80).

En general si X e Y son dos variables aleatorias discretas, la distribución de probabilidad que

define el comportamiento simultáneo de éstas se conoce como distribución de probabilidad

conjunta, que se anota p(x,y) . En el caso continuo se tiene la función de densidad conjunta que

se anota f(x,y) .

Independencia

En algunos experimentos aleatorios, el conocimiento de los valores de X no cambia ninguna de las

probabilidades asociadas con los valores de Y.

Se dice entonces que las variables X e Y son independientes. Por ejemplo dos muestreos con

reposición poseen esa cualidad. En topografía asumimos que las distintas observaciones (

experimentos aleatorios) son independientes. Luego veremos que los valores calculados a partir de

ellas, no lo serán. Nos referimos a desniveles y cotas.

Covarianza y correlación

Cuando se definen dos o más variables aleatorias en un espacio de probabilidad, es útil describir la

forma en que varían juntas; esto es, resulta útil tener una medida de la relación que existe entre las

variables. Una medida común de la relación que existe entre dos variables aleatorias es la

covarianza.

La covarianza está definida por la misma expresión para variables aleatorias discretas o continuas.

Este parámetro de dispersión conjunta será tenido en cuenta al preparar las observaciones para el

ajuste de la red en lo que llamaremos el modelado estadístico del trabajo.

Coeficiente de correlación lineal.

En realidad más que la covarianza aquí nos interesa considerar una cantidad relacionada con XYσ

y que según veremos nos dará información sobre el grado de asociación que existe entre X e Y .

Más concretamente nos contará si existe algún grado de relación lineal entre X e Y . Esa cantidad

es el coeficiente de correlación lineal.

cov(X Y) E,(X − μX)(Y − μY )- E(XY) − 𝜇𝑋𝜇𝑌

La covarianza entre las variables aleatorias X e Y denotada por

cov(X,Y) o σXY es

Si X e Y son variables aleatorias independientes, entonces .


33

En el mismo sentido en que podemos tener una idea aproximada sobre la probabilidad de un

suceso A si repetimos el experimento y consideramos las ocurrencias de A en las n repeticiones,

así podemos tener también una primera idea sobre la existencia de una relación funcional,

específicamente una relación lineal, entre X e Y si consideramos un diagrama de dispersión.

Consiste en dibujar pares de valores ji y,x medidos de la variable aleatoria Y,X en un sistema

de coordenadas. En la figura mostramos diversas situaciones posibles.

De la figura a se deduciría que entre X e Y no hay ningún tipo de relación funcional. La figura b

sugiere la posibilidad de que exista una relación funcional que corresponde a una parábola. La

figura c, por su parte, sugiere una relación lineal entre X e Y . Este último es el comportamiento

que nos interesa caracterizar. Con ese fin definimos el coeficiente de correlación lineal como

sigue:

En consecuencia:

YV.XV

YE.XEY.XE

YV.XV

YEY.XEXEρXY

.

Daremos una serie de propiedades de XYρ que nos permitirán establecer más concretamente su

significado.

0 0 a b c

x x

y y y

(xi yi)

x

Sea una variable aleatoria bidimensional. Definimos el coeficiente de correlación lineal

entre X e Y como


34

Propiedad 1

Propiedad 2 :

Propiedad 3 :

Propiedad 4 :

La extensión de una distribución normal a dos variables aleatorias da origen a la importante

distribución de probabilidad bidimensional ( o bivariada ).

Distribución normal bivariada

La función de densidad de probabilidad de una distribución normal bivariada es

( )

2 ,−

2( )(.

/2

−2 ( )( )

.

/2

)

para − −

y parámetros

− − −

Si X e Y son variables aleatorias independientes entonces .

Si , entonces con probabilidad 1 es donde a y b son constantes.

Si X e Y son dos variables aleatorias tales que Y = aX + b, donde a y b son constantes,

entonces . Si es y si es .


35

La gráfica de la función de densidad tiene el siguiente aspecto:

1)

2)

Pueden demostrarse los siguientes resultados:

Si X e Y tienen distribución normal bivariada con parámetros 𝜇𝑋 𝜇𝑌 𝜎𝑋 𝜎𝑌 𝜌

entonces 𝑋~𝑁(𝜇𝑋 𝜎𝑋2) y 𝑌~𝑁(𝜇𝑌 𝜎𝑌

2)


entonces la correlación entre X e Y es 𝜌


36

En algunos casos, se tienen definidas más de dos variables aleatorias en un experimento aleatorio.

Por ejemplo, supongamos que, en uno de los ejemplos anteriores, la calidad de cada bit recibido se

clasifica en cuatro clases: excelente, buena, aceptable o pobre anotadas respectivamente E, B, A y

P. Consideramos las variables aleatorias X1, X2, X3 y X4 que indican el número de bits que son E,

B, A y P respectivamente, en una transmisión de 20 bits. Aquí el interés está en la distribución

conjunta de cuatro variables aleatorias. La distribución de probabilidad conjunta estará

especificada por una función de cuatro variables p(x1,x2, x3, x4) = P(X1 = x1, X2 = x2 , X3 = x3, X4 =

x4). Dado que cada uno de los 20 bits clasificados cae en una de las cuatro clases, sólo los valores

de x1,x2, x3 y x4 que suman 20 reciben una probabilidad positiva.

En general si X1, X2, …,Xn son n variables aleatorias discretas entonces se tendrá una función de

distribución conjunta especificada por una función de n variables p(x1,x2, x3,…, xn)

En el caso de ser las variables aleatorias continuas, se tendrá una función de densidad de

probabilidad conjunta f(x1,x2, x3,…, xn).

La noción de independencia se generaliza al caso de más de dos variables aleatorias.

En el caso de las redes altimétricas nos encontraremos con un vector de observaciones con los

desniveles que integren la red. Cada desnivel estará acompañado por una varianza estimada según

la calidad del instrumental o método empleado. Como se dijo antes se supondrá que la

determinación de un desnivel en nada afecta a los demás.

Si X es una v.a. n-dimensional X = (X1, X2, …,Xn) su esperanza es la matriz

E(X) = [E(X1), E(X2), …,E(Xn)]

Y su matriz de varianzas-covarianzas es

( ) (

2

2 )

con

{ ( )

( )

Para nuestro caso las matrices de varianza covarianza de las observaciones serán matrices

diagonales con los términos

( )

La matriz de varianzas-covarianzas puede expresarse como


y 𝜌 = 0 entonces X e Y son independientes


37

( ) ,( − ( )) ( − ( ))-

o como

( ) , - − ( ( )) ( )

Algunas propiedades de interés:

1) Si Y = X A+ B donde A y B son dos matrices de constantes de dimensión y

respectivamente entonces

E(Y) = E(X) A + B y V(Y) = AT . V(X) . A

2) V(X) es una matriz simétrica y semidefinida positiva, siendo definida positiva si y solo

si no existe ninguna combinación lineal entre las variables X1, X2, … , Xn

3) En el caso particular de ser A una matriz columna de ( ) entonces

2 2 , es decir Y es una variable aleatoria combina-

ción lineal de las variables X1, X2, …,Xn

Por lo tanto ( ) ( ) ( ) 2 ( 2) ( ) y

V(Y) = AT . V(X) . A =

( 2 ) (

2

2 )(

2

) ∑ 2

∑

Si las variables son independientes entonces ( ) por lo tanto

V(Y) = ∑ 2

∑ 2

( )

Distribucion normal n-dimensional

La v.a. n-dimensional X = (X1, X2, …,Xn) sigue una distribución normal n-dimensional de

parámetros ( 2 ) y ( ) , matriz simétrica y definida positiva, si su función

de densidad es

( )

( ) 2 | | [−

( − ) ( − ) ]

para − . Se anota ~ ( )


38

Si es una matriz fila de ceros y es la matriz identidad, resulta la distribución normal n-

dimensional estándar, ~ ( ), que es la distribución conjunta de n variables X1, X2, …,Xn

normales estándar e independientes.

Las variables ~ ( ) y ~ ( ) se relacionan con la expresión Y = XA + µ, donde A

es una matriz cuadrada de orden n no singular tal que

Además

( ) y ( )

Algunos resultados importantes:

1) Si X es una v.a. normal n-dimensional, la v.a. formada por cualquier subconjunto de k

variables de las n iniciales, sigue una distribución normal k-dimensional. En particular,

cada una de sus componentes es normal unidimensional.

2) Si X1, X2, …,Xn son variables aleatorias tales que ~ ( 2) y además son indepen-

dientes entonces X = (X1, X2, …,Xn) sigue una distribución normal n-dimensional de

parámetros ( 2 ) y ( ). 3) Si X1, X2, …,Xn son variables aleatorias independientes, entonces están incorrelaciona-

das, no cumpliéndose, en general, el resultado recíproco. Pero para variables normales

n-dimensionales, ambos conceptos son equivalentes. Es decir, las n componentes de la

v.a. normal n-dimensional X, X1, X2, …,Xn son independientes si y solo si están incorre-

lacionadas.

4) Sea X una v.a. n-dimensional, con esperanza y matriz de varianzas-covarianzas si-

métrica y definida positiva. La v.a. X sigue una distribución normal n-dimensional si y

solo si cualquier combinación lineal de sus componentes sigue una distribución normal

unidimensional.

En particular se tiene el importante resultado:

Si son n variables aleatorias independientes donde

para todo entonces la v.a. , llamada promedio muestral,

tiene distribución normal con media y varianza


39

Aplicación. Propagación de errores

La medición es fundamental en el trabajo de investigación y de producción. Frecuentemente se

realizan cálculos con cantidades medidas. Por ejemplo al calcular el área de un rectángulo se

multiplican su longitud y ancho.

Cualquier procedimiento de medición tiene errores, también llamados incertidumbres, por

consiguiente, en general los valores medidos son algo diferentes de los “valores reales”. Cuando

se realiza un cálculo con mediciones, los errores en éstas producen un error en el valor calculado.

Se dice que el error se propaga de las mediciones al valor calculado. Si se tiene cierto

conocimiento con respecto al tamaño de los errores en las mediciones, como en la longitud y

ancho de un rectángulo, existen métodos para conocer la magnitud del error en una cantidad

calculada como el área.

En nuestro caso los errores en las punterías, los errores o incertidumbres en el sistema de

horizontalización del nivel se trasladarán a la lectura en las miras. Éstas se propagarán a los

desniveles en cada estación y a su vez estos últimos formarán el desnivel completo para un tramo

entre dos marcas fijas en donde se propagarán los errores individuales. Finalmente los errores o

incertidumbres acumulados en los desniveles se propagarán en las cotas definitivas de la red.

Error de medición

Una geóloga pesa una roca en una balanza. Toma cinco mediciones y obtiene los siguientes datos

en gramos: 251.3 252.5 250.8 251.1 250.4

Todas las mediciones son diferentes y es probable que ninguna sea igual a la masa “real” de la

roca. A la diferencia entre un valor medido y el valor “real” se lo llama error en el valor medido.

Por ejemplo supongamos que las mediciones de la roca se leían en una marca en una escala. Si la

balanza no estaba calibrada adecuadamente, cada medición estará lejos de su valor real en cierta

cantidad fija. Por lo tanto una calibración imperfecta aporta errores de la misma magnitud en cada

medición. La interpolación entre las marcas de graduación de la escala es otra fuente de error. La

magnitud del error debida a la interpolación quizá varíe entre mediciones y es probable que sea

positivo para algunas mediciones y negativo para otras. Es razonable suponer que a largo plazo el

promedio de los errores por interpolación será igual a cero.

En general, el error de una medición lo integran el error sistemático o sesgo, y el error aleatorio.

El primero presenta la parte del error que es igual ,o está funcionalmente determinada, para cada

medición, el segundo varía en forma aleatoria entre mediciones y, en promedio, será igual a cero

en el largo plazo. Algunas fuentes de error contribuyen con ambos tipos de error, el sesgo y el

error aleatorio.

Cualquier medición se puede considerar como la suma del valor real más las contribuciones de

cada uno de los dos componentes de error:

valor medido = valor “real” + sesgo + error aleatorio

error= sesgo + error aleatorio

Como parte del error es aleatorio, es adecuado utilizar un modelo estadístico para estudiar los

errores de medición. Los sesgos se asocian a modelos funcionales. Por ejemplo los errores por

curvatura y refracción y la influencia del error del nivel. Se modela cada valor medido como una

variable aleatoria, tomada de una población de mediciones posibles. La media µ de la población


40

representa esa parte de la medición que es igual para toda medición. Por lo tanto µ es la suma del

valor real más el sesgo. El estudio de los modelos funcionales es lo que va a permitir que esta

componente sistemática sea lo menor posible. La desviación estándar σ de la población representa

la desviación estándar del error aleatorio. Ésta representa la variación debida al hecho de que cada

medición tiene un valor diferente por su error aleatorio. Intuitivamente σ constituye el tamaño de

un error aleatorio estándar( desviación estándar).

Se tiene interés en dos aspectos del proceso de medición. El primero es su exactitud. Ésta la

determina el sesgo, que es la diferencia entre la media µ de la medición y el valor “real” de ésta

última. Entre más pequeño es el sesgo, más exacto será el proceso de medición. Si la media µ es

igual al valor real, el sesgo será igual a cero, en este caso al proceso de medición se le llama

no sesgado. El otro aspecto de interés en el proceso de medición es la precisión. Ésta constituye el grado con

que tienden a coincidir las mediciones repetidas de la misma cantidad. Si las mediciones repetidas

resultan cercanas entre sí todo el tiempo, la precisión es alta. Si son muy dispersas, la precisión es

baja. Por lo tanto la precisión se determina mediante la desviación estándar σ del proceso de

medición. Con frecuencia se llama a σ incertidumbre aleatoria del proceso de medición.

De ahora en adelante se supondrá que el sesgo es despreciable y entonces se describirán las

mediciones en la forma

Valor medido ± σ

donde σ representa la incertidumbre en el proceso que produjo el valor medido.

A menudo se suman constantes a las mediciones, se multiplican mediciones por constantes, o se

suman dos o más mediciones. Veremos cómo se afectan las incertidumbres debido a esas

operaciones aritméticas. Puesto que las mediciones son variables aleatorias y las incertidumbres

son desviaciones estándar de estas variables aleatorias, los resultados que se usan para calcular las

desviaciones estándar de combinaciones lineales de variables aleatorias se pueden aplicar para

calcular las incertidumbres en combinaciones lineales de las mediciones. Los resultados para

variables aleatorias independientes se aplican a las mediciones independientes

Ejemplo

El radio de un círculo mide 3.0 ± 0.1 cm. Calcule la circunferencia y determine la incertidumbre

de la circunferencia.

𝜎𝑎𝑋 |𝑎|𝜎𝑋

Si X es una medición y a es una constante, entonces

Si X1, X2, …,Xn son mediciones independientes y 𝑎 𝑎2 𝑎𝑛 son

constantes, entonces

𝜎𝑎 𝑋 𝑎 𝑋 𝑎𝑛𝑋𝑛 ∑ 𝑎𝑖 𝑛

𝑖 𝑉(𝑋𝑖) ∑ 𝑎𝑖 𝑛

𝑖 𝜎𝑋𝑖


41

Solución

Sea R el radio del círculo. El valor medido de R es de 3.0 cm y la incertidumbre es la desviación

estándar de esta medición, que es

La circunferencia está dada por .

La incertidumbre en C es la desviación estándar de C.

Entonces

| | ( )

La circunferencia es 18.84 ± 0.63 cm

Ejemplo

Un topógrafo mide el perímetro de un terreno rectangular. Toma medidas de dos lados adyacentes,

50.11 ± 0.05 m y 75.21 ± 0.08 m. Estas mediciones son independientes. Estime el perímetro del

terreno y determine la incertidumbre en la estimación.

Solución

Anotamos X = 50.11 y Y = 75.21 las dos mediciones.

El perímetro se estima como P = 2X + 2Y = 250.64 m y la incertidumbre en P es

2 2 2

2 ( 2) ( 2) = 0.19 m

El perímetro es 250.64 ± 0.19 m

Mediciones repetidas

Una de las mejores maneras de reducir y/o verificar la incertidumbre es tomar varias mediciones

independientes y determinar el promedio de ellas.

Si se realizan muchas mediciones independientes de la misma cantidad, entonces el promedio de

éstas tiene la misma media de cada medición individual, pero la desviación estándar se reduce en

un factor igual a la raíz cuadrada del tamaño de la muestra. En otras palabras, el promedio de

varias mediciones repetidas tiene la misma exactitud y es más preciso que cualquier única

medición.

Ejemplo

Supongamos que en el ejemplo anterior el presupuesto para este proyecto es suficiente para hacer

14 mediciones más. Cada lado ya se ha medido una vez. Un ingeniero sugiere asignar las nuevas

mediciones a cada lado equitativamente, por lo que éste será medido ocho veces. Un segundo

ingeniero sugiere hacer las 14 mediciones en el lado más largo, ya que ese lado se mide con

incertidumbre más grande. Estime la incertidumbre en el perímetro bajo cada plan. ¿Con cuál plan

se obtiene la incertidumbre más pequeña?

Solución

Con el primer plan, sea ̅ el promedio de las ocho mediciones del lado más corto y sea ̅ el promedio de las ocho mediciones del lado más largo. El perímetro se estimará con ̅ ̅. La incertidumbre en el perímetro con el primer plan es


42

2 ̅ 2 ̅ ̅2 ̅

2 √ (

√ )2

(

√ )2

√ (

√ )2

(

√ )2

Con el segundo plan, el perímetro se estimará con ̅, donde X es una sola medición del

lado más corto y ̅ es el promedio de las 15 mediciones del lado más largo.

La incertidumbre del perímetro con el segundo plan es

2 2 ̅ 2 ̅

2 √ ( )2 (

√ )2

√ ( )2 (

√ )2

El primer plan es mejor.

Combinaciones lineales de mediciones dependientes

Supongamos que X e Y son mediciones con incertidumbres y y se desea calcular la

incertidumbre de en la suma X + Y. Si X e Y son dependientes la cantidad que mide la relación

entre los errores aleatorios en X e Y es la covarianza. En la práctica cuando las mediciones son

dependientes sucede con frecuencia el caso de que no se conoce la covarianza. En estos casos se

puede establecer un límite superior a la incertidumbre de una combinación lineal de las

mediciones.

La expresión del lado derecho de la desigualdad es una estimación conservadora de la

incertidumbre de 2 2

Ejemplo

Un topógrafo está midiendo el perímetro de un terreno rectangular. Mide los lados adyacentes, de

50.11 ± 0.05 m y 75.21 ± 0.08 m. Estas mediciones no son necesariamente independientes.

Determine con una estimación conservadora la incertidumbre del perímetro del terreno.

Solución

Anotamos X1 = 50.11 y X2 = 75.21 las dos mediciones.

El perímetro se estima como P = 2X1 + 2X2 = 250.64 m y la incertidumbre en P es

2 2 ( ) ( )

La incertidumbre en el perímetro no es mayor que 0.26 m.

𝜎𝑎 𝑋 𝑎 𝑋 𝑎𝑛𝑋𝑛 |𝑎𝑖|

𝑛

𝑖

𝜎𝑋𝑖

Si X1, X2, …,Xn son mediciones y 𝑎 𝑎2 𝑎𝑛 son constantes, entonces


43

Incertidumbres para funciones de una medición

Los ejemplos que se han visto hasta ahora implican calcular incertidumbres en funciones lineales

de mediciones. En muchos casos se desea estimar la incertidumbre de una función no lineal de la

medición.

El tipo de problema que se desea resolver es: dada una variable aleatoria X, con desviación

estándar conocida y dada una función h(X), ¿cómo se calcula la desviación estándar ?. Si h

es una función lineal, los métodos presentados anteriormente son aplicables. Si h no es lineal, se

puede aproximar , multiplicando por el valor absoluto de la derivada dh/dX. La

aproximación es buena si es pequeña.

La ecuación anterior se conoce como la fórmula de la propagación de error.

Ejemplo

El radio R de un círculo mide 5.00 ± 0.01 cm. Estime el área del círculo y determine la

incertidumbre.

Solución

El área A está dada por 2. La estimación aproximada de A es 2 2 Ahora y ⁄ La incertidumbre de A será

|

| ( )( )

2

Se estima el área del círculo con 78.5 ± 0.3 cm2

Incertidumbres para funciones de varias mediciones.

Con frecuencia se necesita estimar una cantidad como una función de varias mediciones.

𝜎 |𝑑ℎ

𝑑𝑋|𝜎𝑋

Si X es una medida cuya incertidumbre 𝜎𝑋 es pequeña y si h es una función de X,

entonces

En la práctica, se evalúa la derivada 𝑑

𝑑𝑋 en la medición observada X.

𝜎 (𝜕ℎ

𝜕𝑋𝑖)2

𝜎𝑋𝑖2

𝑛

𝑖

Si X1, X2, …,Xn son mediciones independientes cuyas incertidumbres

𝜎𝑋 𝜎𝑋 𝜎𝑋𝑛, son pequeñas y si h = h(X1, X2, …,Xn) es una función de X1,

X2, …,Xn entonces

En la práctica se evalúan las derivadas parciales en el punto (X1, X2, …,Xn)


44

La ecuación anterior representa la fórmula de propagación de errores multivariada.

Ejemplo

Un desnivel se calcula con la suma de 2 desniveles de la misma precisión, determinada esta por

σ= ±0.002m. Cómo calculo la incertidumbre o desviación estándar del desnivel?

Solución

La estimación del desnivel es la suma de los desniveles parciales . Para calcular primero se

calculan las derivadas parciales de ℎ ℎ ℎ2

ℎ

ℎ

ℎ

ℎ2

Como

√( ℎ

ℎ )2

2 (

ℎ

ℎ2)2

2 2 2 2 2

La desviación estándar del desnivel calculado sería ∆h ± 0.0.03 m

Incertidumbre para funciones de mediciones independientes.

𝜎 |𝜕ℎ

𝜕𝑋𝑖|𝜎𝑋𝑖

𝑛

𝑖

Si X1, X2, …,Xn son mediciones cuyas incertidumbres 𝜎𝑋 𝜎𝑋 𝜎𝑋𝑛, son

pequeñas y si h = h(X1, X2, …,Xn) es una función de X1, X2, …,Xn entonces

En la práctica se evalúan las derivadas parciales en el punto (X1, X2, …,Xn)

La desigualdad es válida en casi todas las situaciones prácticas; en principio

puede fallar si algunas derivadas parciales de h son muy grandes.


45

Teorema Central del Límite

Se ha visto que la suma de un número finito n de variables aleatorias independientes que están

normalmente distribuidas es una variable aleatoria también normalmente distribuida. Esta

propiedad reproductiva no es exclusiva de la distribución normal. En efecto, por ejemplo, ya

vimos que existen variables aleatorias discretas que la cumplen, es el caso de la Poisson y la

Binomial.

En realidad, la propiedad que le da a la distribución normal el lugar privilegiado que ocupa entre

todas las distribuciones es el hecho de que la suma de un número muy grande, rigurosamente un

número infinito numerable, de variables aleatorias independientes con distribuciones arbitrarias

(no necesariamente normales) es una variable aleatoria que tiene, aproximadamente, una

distribución normal. Este es, esencialmente, el contenido del

Dem.) sin demostración

Observaciones:

1- Notar que nXEXESEn

i

i

n

i

in

11

y 2

11

nXVXVSVn

i

i

n

i

in

Por lo tanto 2

n

nSZ n

n

es la v.a. nS estandarizada

2- Notar que

n

XPz

n

n

n

nS

Pzn

nSP

n

n

22, por lo tanto también se puede

enunciar el Teorema central del límite de la siguiente forma

Teorema central del límite (T.C.L.):

Sean variables aleatorias independientes con y para todo

, es decir independientes idénticamente distribuidas

Sea la v.a. y sea .

Entonces , esto es


46

Donde

n

XZ n

es el promedio muestral estandarizado

3- Aunque en muchos casos el T.C.L. funciona bien para valores de n pequeños , en particular

donde la población es continua y simétrica, en otras situaciones se requieren valores de n más

grandes, dependiendo de la forma de la distribución de las iX . En muchos casos de interés

práctico, si 30n , la aproximación normal será satisfactoria sin importar cómo sea la forma de la

distribución de las iX . Si 30n , el T.C.L. funciona si la distribución de las iX no está muy

alejada de una distribución normal

4- Para interpretar el significado del T.C.L., se generan (por computadora) n valores de una v.a.

exponencial con parámetro 5.0 , y se calcula el promedio de esos n valores. Esto se repite

1000 veces, por lo tanto tenemos 1000 valores de la v.a. X .

Hacemos un histograma de frecuencias de X , esto es, tomamos un intervalo ),( ba donde

“caen” todos los valores de X , y lo subdividimos en intervalos más chicos de igual longitud. La

frecuencia de cada subintervalo es la cantidad de valores de X que caen en dicho subintervalo.

Se grafican estas frecuencias obteniéndose los gráficos siguientes que se pueden considerar una

aproximación a la verdadera distribución de X .

Se observa que a medida que aumenta el valor de n los gráficos se van haciendo más simétricos,

pareciéndose a la gráfica de una distribución normal.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

50

100

150

Sean variables aleatorias independientes con y para todo

, es decir independientes idénticamente distribuidas

Sea la v.a. promedio muestral y sea .

Entonces , esto es

n=2 n = 5


47

Ejemplos:

1- Supóngase que 30 instrumentos electrónicos D1, D2, ......,D30, se usan de la manera siguiente:

tan pronto como D1 falla empieza a actuar D2. Cuando D2 falla empieza a actuar D3, etc.

Supóngase que el tiempo de falla de Di es una v.a. distribuida exponencialmente con parámetro

= 0.1 por hora. Sea T el tiempo total de operación de los 30 instrumentos. ¿Cuál es la

probabilidad de que T exceda 350 horas?

Solución:

Si iX : “tiempo de falla del instrumento iD ” 30,...,2,1i

Entonces )1.0(~ ExpX i para 30,...,2,1i

El tiempo total de operación de los 30 instrumentos es

30

1i

iXT , donde

3001.0

130)(30)(

30

1

i

i

i XEXETE

30001.0

130)(30)(

2

30

1

i

i

i XVXVTV

Entonces por T.C.L. N(0,1)~3000

300T aproximadamente pues 30n

La probabilidad pedida es

18141.081859.019128.013000

3003501

3000

300350

3000

300)350(

TPTP

T.C.L.

2- Suponga que el consumo de calorías por día de una determinada persona es una v.a. con media

3000 calorías y desviación estándar de 230 calorías. ¿Cuál es la probabilidad de que el promedio

de consumo de calorías diario de dicha persona en el siguiente año (365 días) sea entre 2959 y

3050?

1 2 3 4 5 6 7 8 9 10 111213 14 1516 171819 202122

10

20

30

40

n = 15 n = 30


48

Solución:

Definimos las variables aleatorias

iX : “cantidad de calorías que una persona consume en el día i” 365,...,2,1i

Se sabe que 3000)( iXE y 2230)( iXV

Si

365

1365

1

i

iXX entonces 3000)( XE y 365

230)(

22

n

XV


10140.315.4

365230

30002959

365230

30003050

365230

30003050

365230

3000

365230

3000295930502959

X

PXP

T.C.L.

Aplicaciones del Teorema central del límite

Aproximación normal a la distribución binomial

El Teorema central del límite se puede utilizar para aproximar las probabilidades de algunas

variables aleatorias discretas cuando es difícil calcular las probabilidades exactas para valores

grandes de los parámetros.

Supongamos que X tiene una distribución binomial con parámetros n y p. Para calcular )( kXP

debemos hacer la suma

k

i

iXPkXP0

)()( o recurrir a las tablas de la F.d.a. , pero para

valores de n grandes no existen tablas, por lo tanto habría que hacer el cálculo en forma directa y

muchas veces es laborioso.

Como una opción podemos considerar a X como suma de variables aleatorias más simples,

específicamente, si definimos

contrariocaso

éxitoocurrederepeticiónésimaílaensi

X i 0

1

ni ,...,2,1

entonces cada iX se la puede considerar ),1( pB , y además nXXX ,...,, 21 son independientes

Podemos escribir

n

i

in XXXXX1

21 ... y si n es grande entonces X tendrá

aproximadamente una distribución normal con parámetros np y )1( pnp , es decir

1,0

1.

.

2N

ppn

pnX

n

nXZn

si n es lo suficientemente grande

Observaciones:


49

1- La aproximación normal a la distribución binomial funciona bien aun cuando n no sea muy

grande si p no está demasiado cerca de cero o de uno. En particular la aproximación normal a la

binomial es buena si n es grande , 5np y 5)1( pn , pero es más efectivo aplicar esta

aproximación cuando 10np y 10)1( pn

2- Corrección por continuidad.

Acabamos de ver que si XB(n,p) entonces, para n suficientemente grande, podemos considerar

que aproximadamente es X pp.n,p.nN 1 . El problema que surge de inmediato si deseo

calcular, por ejemplo, la probabilidad de que kX (con k alguno de los valores posibles

0,1,2,…,n) es que la binomial es una distribución discreta y tiene sentido calcular probabilidades

como kXP mientras que la normal es una distribución continua y, en consecuencia,

0 kXP puesto que para una variable aleatoria continua la probabilidad de que ésta tome un

valor aislado es cero. Esto se resuelve si se considera

2

1

2

1kXkPkXP

También se puede usar esta corrección para mejorar la aproximación en otros casos,

específicamente en lugar de )( kXP calculamos

2

1)( kXPkXP

Y en lugar de

2

1)( kXPkXP

En los gráficos siguientes se muestra para diferentes valores de n y p cómo aproxima la

distribución ))1( ,( pnpnpN a la distribución ) ,( pnB

5 10 15 20 25

0.025

0.05

0.075

0.1

0.125

0.15

0.175

2 4 6 8 10 12 14

0.05

0.1

0.15

0.2

n = 25

p = 0.7

n = 15

p = 0.5


50

Ejemplos:

1- Sea X B(25,0.4). Hallar las probabilidades exactas de que 8X y 8X y comparar estos

resultados con los valores correspondientes encontrados por la aproximación normal.

Solución:

De la tabla de la F.d.a. de la binomial encontramos 274.0)8( XP

Y 120.0154.0274.0)7()8()8( XPXPXP

Ahora usamos la aproximación normal

2709.061.06.04.025

105.8

)1()5.8()8(

pnp

npXPXPXP

corrección por continuidad

Observar que el valor aproximado está muy cercano al valor exacto para 274.0)8( XP

1170.01593.02709.0

61.06

1002.1

6

105.8

6

10

6

105.75.85.7)8(

XP

XPXPXP

5 10 15 20

0.05

0.1

0.15

0.2

0.25

0.3

0.35

50 60 70 80 90 100

0.02

0.04

0.06

0.08

20 40 60 80 100 120 140

0.02

0.04

0.06

0.08

0.1

2 4 6 8 10

0.1

0.2

0.3

0.4

n =15

p = 0.9

n = 100

p = 0.7

n = 150

p = 0.1

n = 10

p = 0.1


51

Nuevamente este valor aproximado está muy cerca del valor real de 120.0)8( XP

2- Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de

especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chatarra).

Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que estén fuera

de especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada) de que X

sea

a) a lo sumo 30?

b) menos de 30?

c) entre 15 y 25 (inclusive)?

Solución:

Sea la v.a. X: “número de ejes fuera de especificaciones”

Entonces )1.0,200(~ BX , además 5201.0200 np y 5180)1.01(200)1( pn

Por lo tanto podemos aplicar la aproximación normal a la binomial

a) la probabilidad pedida es )30( XP

993244.0474.218

205.30

18

205.30

)1()5.30()30(

pnp

npXPXPXP

b) La probabilidad pedida es )30( XP

Al ser X una v.a. discreta con distribución binomial )29()30( XPXP

98745.02391.218

205.29)5.29()29(

XPXP

c)

80294.0190147.0212963.122963.12963.1

18

205.14

18

205.255.255.142515

XPXP

3- El gerente de un supermercado desea recabar información sobre la proporción de clientes a los

que no les agrada una nueva política respecto de la aceptación de cheques. ¿Cuántos clientes

tendría que incluir en una muestra si desea que la fracción de la muestra se desvíe a lo mas en 0.15

de la verdadera fracción, con probabilidad de 0.98?.

Solución:

Sea X: “número de clientes a los que no les agrada la nueva política de aceptación de cheques”

Entonces ),(~ pnBX donde p es desconocido y es la verdadera proporción de clientes a los

que no les agrada la nueva política de aceptación de cheques. El gerente tomará una muestra de n

clientes para “estimar” p con n

XX ya que

n

XX es la proporción de clientes a los que no les

agrada la nueva política de aceptación de cheques en la muestra de n clientes. Si no se toman a

todos los clientes, entonces n

XX no será igual a p.


52

La pregunta es cuál debe ser n para que n

XX se aleje del verdadero p en menos de 0.15 con

probabilidad 0.98 por lo menos, o sea para que 98.015.0 pXP

Entonces planteamos

)1(

15.0

)1()1(

15.015.015.015.0

pnp

n

pnp

npX

pnp

nPpXPpXP

T.C.L.

98.01)1(

15.02

)1(

15.0

)1(

15.0

pnp

n

pnp

n

pnp

n

Por lo tanto 99.02

198.0

)1(

15.0

pnp

n

Además nn

pp

n

pnp

n3.0

)5.01(5.0

15.0

)1(

15.0

)1(

15.0

Entonces debe cumplirse que 33.23.0 n o sea 3211.603.0

33.22

n

O sea se debe tomar una muestra de al menos 61 clientes

Aproximación normal a la distribución Poisson

Se puede probar aplicando Teorema central del límite que

Es decir para suficientemente grande )1,0(NX

En la práctica si 30 la aproximación es buena.

Observación: la demostración es sencilla si es igual a un número natural n pues, si

consideramos las variables aleatorias )1(~ PX i con ni ,...,2,1 independientes, entonces ya

sabemos que

n

i

n

i

i PX11

1~ , es decir )(~1

nPXn

i

i

Si entonces para suficientemente grande tiene aproximadamente distribución


53

Pero además por T.C.L. si n es grande

n

i

iX1

tiene aproximadamente distribución normal con

parámetros nnn 1 y nnn 12

O sea la distribución de

n

i

iX1

que es exactamente Poisson con parámetro n, se puede aproximar

con una ),( nnN , por lo tanto )1,0(Nn

nX

aproximadamente para valores de n suficientemente

grandes

En los gráficos siguientes se muestra para diferentes valores de cómo aproxima la distribución

) ,( N a la distribución )(P

Ejemplo:

El número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil tiene una

distribución de Poisson con parámetro = 50. ¿Cuál es la probabilidad aproximada de que:

a) entre 35 y 70 infracciones se expidan en un día en particular?

b) el número total de infracciones expedidas durante una semana de 5 días sea entre 225 y 275?

Solución:

Sea X: “número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil”

Entonces )(~ PX donde 50

Como 50 entonces )1,0(50

50N

X

(aproximadamente)

a) la probabilidad pedida es

9805.0017.0997599.0

12132.28284.250

5035

50

50707035

XP

b) Sea Y: “número total de infracciones expedidas durante una semana de 5 días”

Entonces )(~ PY donde 250550


8859.0194295.0215811.12

5811.15811.1250

250225

250

250275275225

YP

20 40 60 80 100

0.01

0.02

0.03

0.04

0.05

5 10 15 20 25 30

0.05

0.1

0.15

0.2


54

Documents

Repaso de probabilidades y estadística Introducción