Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1
Repaso de probabilidades y estadística
Introducción
El campo de la estadística tiene que ver con la recopilación, análisis y uso de datos para tomar
decisiones y resolver problemas.
Cuando se recibe información en forma de datos es necesario obtener alguna conclusión a partir de
la información contenida en ellos.
Las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad de los
datos. La variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las
observaciones.
Por ejemplo, la medición obtenida a partir de una escala puede depender del lugar del panel en que
se coloque el objeto que se ha de medir. El muestreo también puede ser causa de variabilidad. Por
ejemplo, supóngase que un lote de 5000 circuitos integrados contiene exactamente 50 circuitos
defectuosos. Si se inspeccionan los 5000 dispositivos, y el proceso de inspección no tiene error en
la inspección o medición, entonces se encontrarán 50 circuitos defectuosos.
Pero supongamos que se selecciona una muestra de 100 dispositivos; es probable que alguno de
los dispositivos en la muestra esté defectuoso. Se espera que la muestra contenga alrededor de un
1% de circuitos defectuosos (ya que el lote contiene 50/5000 ×100 = 1% de artículos defectuosos).
Pero esta cantidad puede ser 0%, 2% o 5% de circuitos defectuosos, dependiendo de los
dispositivos específicos contenidos en la muestra. Por lo tanto el proceso de muestreo introduce
cierta variabilidad en los resultados observados en el sentido que la proporción de unidades
defectuosas puede cambiar de la proporción real a éstas.
El campo de la estadística y la probabilidad consiste en métodos tanto para describir y modelar la
variabilidad, como para tomar decisiones en presencia de ésta.
En la estadística inferencial lo que se desea hacer es tomar una decisión acerca de una población
en particular. El término población se refiere a la recolección de mediciones de todos los
elementos del universo con respecto al cual se quieren obtener conclusiones o tomar decisiones.
Por ejemplo, la población puede ser el lote de 5000 circuitos integrados del ejemplo anterior.
Supongamos que el fabricante está interesado en la ganancia del transistor de un circuito en
particular de cada uno de los dispositivos. Los distintos niveles que puede tener la ganancia del
transistor pueden considerarse como la población de interés. Por lo tanto cada valor de la
población es una medición numérica, como 5.10 o 5.24; en este caso los datos son variables o
datos numéricos.
Es posible que el fabricante esté interesado en determinar si el dispositivo produce o no una
ganancia que cumpla con algún requisito de diseño. En este caso la población se considera
formada por datos de atributo, en los que a cada dispositivo se le asigna el valor de uno si la
unidad no satisface el requisito de diseño, y cero si cumple con él.
En la mayoría de las aplicaciones de la estadística, los datos disponibles consisten de una muestra
de la población de interés. Esta muestra es un subconjunto de observaciones seleccionadas de una
población.
En el ejemplo de los circuitos integrados, supongamos que la muestra está formada por cinco
dispositivos seleccionados de un lote de 5000. Las ganancias del transistor observadas en estos
dispositivos son 5.10, 5.24, 5.13, 5.19 y 5.08. El interés puede centrarse en cuestiones como:
“¿la información contenida en la muestra lleva a la conclusión de que la ganancia del transistor es
menor que 5.50?”, o “¿cuánta confianza puede tenerse en que la ganancia del transistor se
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
2
encuentre en el intervalo que va de 5.00 a 5.50?”. Los métodos de la estadística inferencial se
emplean para dar respuesta a estas preguntas y a otras del mismo tipo.
Los métodos para resumir y organizar datos se denominan estadística descriptiva. La mayor
parte del uso moderno de la estadística se dirige más hacia la inferencia que a la descripción. Por
ejemplo, un ingeniero que diseña un nuevo circuito de computadora fabricará una muestra
(prototipo) de ellos, y entonces querrá obtener conclusiones sobre la forma en que estos
dispositivos funcionarán una vez que se produzcan a gran escala.
Antes de estudiar las técnicas de la estadística inferencial, veremos los conceptos básicos de la
probabilidad. El conocimiento de este tema constituye la base que permite comprender la forma
en que se desarrollan las técnicas de la inferencia estadística y la toma de decisiones, por qué
funciona, y cómo pueden presentarse e interpretarse de manera correcta las conclusiones obtenidas
con estos procedimientos. La probabilidad es el lenguaje y la fundamentación matemática de la
estadística inferencial.
Si se mide la corriente que circula por un alambre de cobre delgado, lo que se está haciendo es un
experimento. Sin embargo, al repetir la medición durante varios días los resultados que se
obtienen son un poco diferentes debido a pequeñas variaciones en las variables que no están
controladas en el experimento, como son los cambios en la temperatura ambiente, ligeras
variaciones en el instrumento de medición y pequeñas impurezas en la composición química del
alambre en distintas partes, además de las variaciones en la fuente de corriente. En consecuencia,
se dice que este experimento (como muchos otros) tiene un componente aleatorio. En algunos
casos las variaciones aleatorias observadas son tan pequeñas en relación con las metas del
experimento, que pueden ignorarse. Sin embargo, la variación casi siempre está presente y su
magnitud puede llegar a ser tan importante a tal grado, que las conclusiones del experimento sean
no muy evidentes.
Sin importar con cuánto cuidado se diseñe y se realice un experimento, siempre se tendrán
variaciones. Se quiere comprender, cuantificar y modelar el tipo de variaciones que a menudo se
encuentran en la práctica. Cuando se incorpora la variación en el análisis, siempre pueden
obtenerse conclusiones fundamentales de los resultados que no se invaliden por la variación.
Experimentos aleatorios
La Teoría de Probabilidades estudia los llamados experimentos aleatorios.
Ejemplos clásicos de experimentos aleatorios son los juegos de azar:
a) tirar un dado y observar el número en la cara de arriba.
b) tirar una moneda.
c) lanzar una moneda cuatro veces y contar el número total de caras obtenidas.
d) lanzar una moneda cuatro veces y observar la sucesión de caras y cecas obtenidas.
e) realizar una medición.
Simbolizamos con a un experimento aleatorio.
Un experimento aleatorio tiene las siguientes características:
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
3
1-Se lo puede repetir bajo las mismas condiciones tantas veces como se desee.
2- No se puede predecir con exactitud el resultado de dicho experimento, pero se puede decir
cuáles son los posibles resultados del mismo.
3- A medida que el experimento se repite, los resultados individuales parecen ocurrir en forma
aparentemente caprichosa. Pero si el experimento se repite un gran número de veces, y
registramos la proporción de veces que ocurre un determinado resultado, veremos que esa
proporción tiende a estabilizarse en un valor determinado a medida que aumenta el número de
veces que se repite el experimento.
Por ejemplo, consideremos el experimento de lanzar un dado y observar el número de la cara
superior. Supongamos que tiramos el dado N veces, y sea n el número de veces que sale el
número 5 en los N tiros del dado. Entonces N
n es la proporción de veces que sale el número 5 en
los N tiros. Si el dado es normal a medida que N aumenta, N
n tiende a estabilizarse en un número
que es 1/6.
4- El resultado está determinado por factores que no se pueden controlar aún conocidos los
mismos.
A veces sucede que un experimento no es aleatorio estrictamente, pero resulta mucho más sencillo
estudiarlo como si fuera aleatorio. Por ejemplo, si tiramos una moneda y observamos qué lado
queda hacia arriba, el resultado sería predecible conociendo en forma precisa las velocidades
iniciales de traslación y rotación, y las elasticidades de los materiales del piso y de la moneda.
Pero la precisión con la que se necesitan conocer estos datos es casi imposible de obtener en la
realidad, por lo que es más conveniente tratar al experimento como aleatorio.
Por ejemplo,
a) Si : tirar un dado y observar el número en la cara de arriba, entonces podemos tomar
como espacio muestral a 6,5,4,3,2,1S
b) Si : tirar una moneda, entonces scS ,
c) Si : lanzar una moneda tres veces y contar el número total de caras obtenidas entonces
podemos considerar 3,2,1,0S
d) Si : lanzar una moneda tres veces y observar la sucesión de caras y cecas obtenidas,
entonces ),,();,,();,,();,,();,,();,,();,,(;,, sssscscsssscccscscscccccS
e) Si : tirar un dado las veces necesarias hasta que sale un 6 por primera vez, y contar el
número de tiros realizados, entonces NS ,.....4,3,2,1 , donde N es el conjunto de los
números naturales.
Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se
repita siempre de la misma manera.
El conjunto de los posibles resultados de un experimento aleatorio recibe el nombre de
espacio muestral del experimento. El espacio muestral se denota con la letra S.
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
4
f) Si : medir el tiempo de vida de una lamparita eléctrica, entonces 0, tRtS donde
R es el conjunto de los números reales.
g) Las lecturas en las miras graduadas pueden tomar cualquier valor dentro del rango de la
misma.
h) Las lecturas en los limbos o círculos graduados de los instrumentos topográficos.
Observaciones:
1- La elección de S no es única, depende de lo que se quiera observar del experimento
aleatorio.
2- El espacio muestral puede ser un conjunto finito, o infinito. A su vez si es infinito puede
ser infinito numerable o no numerable. En e) el conjunto S es infinito numerable, en f) el
conjunto S es infinito no numerable.
Se llama evento o suceso a todo subconjunto del espacio muestral. Por ejemplo,
a) En el experimento dado en el ejemplo a), un evento de S sería 6,4,2A pues SA .
Podemos expresar al evento A con palabras de la siguiente manera A: “sale un
número par”
También 3,2,1B es un evento al que podemos expresar verbalmente como
B: “sale un número menor o igual que 3”
b) En el experimento dado en el ejemplo d), un evento de S sería
),,();,,();,,(;,, ccscscscccccC , el que en palabras se puede expresar como
C: “salen por lo menos dos caras”
c) En el experimento dado en el ejemplo f), un evento de S sería D: “la lamparita
dura más de 1200 horas”, en notación de conjuntos 1200 ; tRtD
Interpretaciones de la probabilidad
Es útil cuantificar la posibilidad de que se presente un resultado de un experimento aleatorio.
La probabilidad de un resultado puede interpretarse como el valor límite de la proporción de veces
que el resultado aparece en N repeticiones del experimento aleatorio, a medida que N crece sin
cota alguna.
Por ejemplo, si se asigna una probabilidad de 0.25 al resultado “una lamparita dura más de 1200
hs”, esto pude interpretarse como una implicación de que, si se mide el tiempo de vida de muchas
lamparitas, (con las mismas características), aproximadamente el 25% de ellas durarán más de
1200 hs.
Este ejemplo proporciona una interpretación de frecuencia relativa para la probabilidad.
Dado un evento A asociado a un experimento aleatorio . Supongamos que se repite n veces el
experimento , y anotamos An al número de veces que ocurre A en la n repeticiones de . Se
define la frecuencia relativa de A, y se simboliza Af , al cociente n
nA . Es decir que Af es la
proporción de veces que ocurre A en las n repeticiones de .
La frecuencia relativa Af tiene las siguientes propiedades:
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
5
1- 10 Af
2- 1Af si y solo si A ocurre cada vez en las n repeticiones
3- 0Af si y solo si A no ocurre nunca en las n repeticiones
4- Si A y B son dos eventos mutuamente excluyentes entonces BABA fff
Las probabilidades de un experimento aleatorio a menudo se asignan sobre la base de un modelo
razonable del sistema que se estudia. Un enfoque es asignar las probabilidades con base en el
concepto de resultados igualmente probables.
A menudo es necesario asignar probabilidades a eventos que están compuestos de varios
resultados individuales del mismo espacio muestral.
Para un espacio muestral discreto, la probabilidad de un evento E anotada P(E), puede definirse
como la suma de las probabilidades de los resultados de E.
Independencia de eventos
Dados dos eventos A y B , puede ocurrir que saber que A ocurrió modifica la probabilidad de
ocurrencia de B. Cuando ocurre que saber que A ocurrió no modifica la probabilidad de
ocurrencia de B se dice que A y B son eventos independientes.
Se puede probar que
)()()( si soloy si ntesindependieson y BPAPBAPBA
Variables aleatorias
En muchos casos es deseable asignar un valor numérico a cada resultado de un experimento
aleatorio. Esta asignación se llama variable aleatoria.
Por ejemplo, supongamos que un ingeniero eléctrico tiene seis resistores en la mano. Tres de ellos
tienen etiqueta de 10 Ω y los otros tres tienen etiqueta de 20 Ω. El ingeniero quiere conectar un
resistor de 10 Ω y un resistor de 20Ω en serie, para crear una resistencia de 30 Ω. Ahora
supongamos que en efecto los tres resistores etiquetados con 10 Ω tienen las resistencias “reales”
de 9, 10 y 11 Ω y que los tres resistores etiquetados con 20 Ω tienen las resistencias “reales” de
19, 20 y 21 Ω. El proceso para seleccionar un resistor de cada tipo es un experimento cuyo espacio
muestral consta de nueve resultados igualmente probables:
resultado probabilidad
(9,19) 1/9
(9,20) 1/9
(9,21) 1/9
Cada vez que un espacio muestral esté formado por n posibles resultados
igualmente probables, la probabilidad de cada uno de ellos será 1/n.
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
6
(10,10) 1/9
(10,20) 1/9
(10,21) 1/9
(11,19) 1/9
(11,20) 1/9
(11,21) 1/9
Ahora lo que es importante para el ingeniero de este experimento es la suma de las dos
resistencias, en vez de sus valores individuales. Entonces se asigna a cada resultado un número
igual a la suma de las dos resistencias seleccionadas. Esta asignación se representa por la letra X y
se presenta en la siguiente tabla
La función X que asigna un valor numérico a cada resultado en el espacio muestral es una
variable aleatoria. En topografía una variable aleatoria puede ser: “la cantidad de veces que entra
el metro patrón entre dos marcas fijas o no.”
Se acostumbra anotar a las variables aleatorias con letras mayúsculas. Las letras X, Y y Z se usan
con más frecuencia.
Se puede calcular las probabilidades para las variables aleatorias de una manera obvia. En el
ejemplo anterior, el evento X = 29 corresponde con el evento {(9,20) , (10,19)} del espacio
muestral. Por lo tanto ( ) ,*( ) ( )+- Hacemos una lista de los valores posibles de la variable aleatoria (v.a) X y determinamos la
probabilidad de cada uno de ellos:
X P(X = x)
28 1/9
29 2/9
30 3/9
31 2/9
32 1/9
La tabla anterior contiene toda la información necesaria para calcular cualquier probabilidad que
considere a la v.a. X. Es de destacar la simetría de la distribución.
El conjunto de valores posibles de una v.a. se llama rango.
resultado X probabilidad
(9,19) 28 1/9
(9,20) 29 1/9
(9,21) 30 1/9
(10,10) 29 1/9
(10,20) 30 1/9
(10,21) 31 1/9
(11,19) 30 1/9
(11,20) 31 1/9
(11,21) 32 1/9
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
7
Las variables aleatorias se clasifican según su rango.
Sea X es una v.a. con rango XR . Si XR es un conjunto finito o infinito numerable entonces se
dice que X es una v.a. discreta. Si XR es un conjunto infinito no numerable (por ejemplo todos
los números reales de un intervalo) entonces X es una v.a. continua.
Esta clasificación va más allá de la forma numérica que adoptan sus resultados y se refiere a la
naturaleza del proceso. Los resultados numéricos están sujetos a las posibilidades del medio de
captura de datos es decir la precisión de los instrumentos y métodos empleados. En Topografía las
observaciones son variables aleatorias continuas.
Variables aleatorias discretas
Sea X una v.a. discreta. .Anotamos su rango como nX xxxR ,,, 21 si el rango es un conjunto
finito de n elementos, y anotamos ,, 21 xxRX si el rango es un conjunto infinito
numerable.
A cada ix se le asigna un número )()( ii xXPxp . Estos números deben satisfacer las
condiciones siguientes
a) ixp i todopara 0)(
b) 1)( i
ixp
La función )(xp que antes se definió, se llama función de probabilidad o de frecuencia de la v.a.
X. El conjunto de pares ,...2,1 ))(,( ixpx ii es la distribución de probabilidad de X.
Por ejemplo
1-Se tira una moneda normal tres veces, sea la v.a. X: “número de caras obtenidas”
Entonces 3,2,1,0XR
Para hallar la distribución de probabilidad de X supongamos que la probabilidad de salir cara es
0.5 entonces
8
1,,)0( sssPXP
8
3,,;,,;,,)1( cssscssscPXP
8
3,,;,,;,,)2( cscccssccPXP
8
1,,)3( cccPXP
Se puede presentar la distribución de probabilidad de X en una tabla de la siguiente forma
x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
8
Un gráfico de la distribución de probabilidad de X sería. Observe su simetría.
2-Se tira un dado normal. Sea X: “número que queda en la cara superior”
Entonces 6,5,4,3,2,1XR
La función de distribución de X es
A estas distribuciones se las denomina uniformes ya que en todo su rango de ocurrencia la
probabilidad es constante. Al error de lectura en los instrumentos digitales se los suele modelizar
estadísticamente con esta distribución de probabilidades.
Función de distribución acumulada
Sea X una v.a. con rango XR . Se define la función de distribución acumulada de X (abreviamos
F.d.a de X) como
xxXPxF )()( (12)
En el caso de ser X una v.a. discreta
xxpxXPxFx
i )()()( xi
Volviendo al ejemplo 1 anterior, la F.d.a. de X es
x 1 2 3 4 5 6
p(x) 1/6 1/6 1/6 1/6 1/6 1/6
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
9
3 si 1
32 si 8
7
21 si 2
1
10 si 8
10 si 0
)(
3 si 1
32 si 8
3
8
3
8
1
21 si 8
3
8
1
10 si 8
10 si 0
)(
x
x
x
x
x
xF
x
x
x
x
x
xF
La gráfica de la F.d.a. de X es
Observación: la F.d.a. de X es una función escalonada, los puntos de “salto” coinciden con los
puntos del rango de X, y la magnitud del salto en ix es igual a )( ixXP
Esperanza de una variable aleatoria discreta
Ejemplos:
1- Sea la v.a. X: “número que queda en la cara de arriba al tirar un dado normal”
6,5,4,3,2,1XR
Entonces
6
1
)()(x
xXxPXE
)6(6)5(5)4(4)3(3)2(2)1(1 XPXPXPXPXPXP
Sea X una v.a. discreta con rango . La esperanza , valor medio o valor esperado de X , lo anotamos
, y se define como
La sumatoria se hace sobre todos los posibles valores de X
Otra notación usual es o
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
10
5.32
7
6
16
6
15
6
14
6
13
6
12
6
11
2- Se tira una moneda normal tres veces, sea la v.a. X: “número de caras obtenidas”
Entonces 3,2,1,0XR
Calculamos la esperanza de X
5.12
3
8
13
8
32
8
31
8
10)()(
3
0
x
xXxPXE
Observaciones:
1- La esperanza de una v.a. no tiene que coincidir necesariamente con algún valor del rango de la
variable
2- En el ejemplo 1 donde el rango es finito y equiprobable, la esperanza de X coincide con el
promedio de los valores del rango de X 3- Se puede interpretar a la esperanza de una v.a. como un promedio “pesado” o “ponderado” de
los valores del rango de la variable, donde el “peso” de cada ix es la probabilidad )( ixXP
4- Otra interpretación que se puede hacer de la esperanza es la siguiente: consideremos el
ejemplo1, supongamos que tiramos el dado muchas veces, N veces, y entonces obtenemos una
secuencia de N valores Nxxx ,.....,, 21 donde cada ix es un número natural del 1 al 6. Supongamos
además que hacemos un promedio de esos N valores, y si llamamos in al número de veces que
sale el número i tenemos que
N
nnn
N
xxx N 6...21.... 62121
)()6(6...)2(2)1(16...21 621 XEXPXPXPN
n
N
n
N
n
Es decir si promediamos los N valores medidos de X, ese promedio tiende a E(X) cuando
N ,
pues )( iXPN
ni cuando N es grande.
Esta última forma de ver la esperanza o valor esperado es la que adoptamos cuando promediamos
distintas observaciones.
xN
xxx N ....21
Más adelante veremos más propiedades del promedio.
Esperanza de una función
A veces importa hallar la esperanza de una función de X y no de X misma. Veamos un ejemplo.
Un instructor de escritura técnica ha solicitado que cierto reporte sea entregado a la semana
siguiente, agregando la restricción de que cualquier reporte que sobrepase las cuatro páginas será
rechazado.
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
11
Sea X: “número de páginas del reporte de cierto estudiante seleccionado al azar”
Supongamos que X tenga la siguiente distribución de probabilidad
x 1 2 3 4
p(x) 0.01 0.19 0.35 0.45
Suponga que el instructor tarda X minutos calificando un trabajo que consiste en X páginas.
Claramente X es otra variable aleatoria. ¿Cuál será su esperanza?, es decir ¿a qué es igual
XE ?
Para calcular la esperanza de una v.a. se necesita conocer su función de distribución de
probabilidad, por lo tanto habría que hallar previamente la distribución de probabilidad de la v.a.
XY .
Está claro que si el rango de X es 4,3,2,1XR entonces el rango de Y será 4,3,2,1YR
.
Además
01.0)1()1( XPYP
19.0)2()2( XPYP
35.0)3()3( XPYP
45.0)4()4( XPYP
Por lo tanto
)4(4)3(3)2(2)1(1 YPYPYPYPYE
78491.1)4(4)3(3)2(2)1(1 XPXPXPXP
O sea
)()( xXPxYEx
Lo visto en este ejemplo se puede generalizar en el siguiente
Ejemplo:
Un negocio de computadoras ha comprado tres computadoras de cierto tipo a $500 cada una y las
venderá a $1000 cada una. El fabricante ha aceptado volver a comprar en $200 cualquier
computadora que no se haya vendido en un tiempo especificado.
Sea X: “número de computadoras vendidas” , y supongamos que la distribución de probabilidad de
X es
x 0 1 2 3
p(x) 0.1 0.2 0.3 0.4
Teorema: Si X es una v.a. discreta con rango RX y distribución de probabilidad p(x), entonces
la esperanza de cualquier función h(X) es igual a
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
12
Si consideramos la v.a. Y: “utilidad obtenida”, entonces Y es una función de X, es decir )(XhY
Específicamente 9008001500)3(2001000 XXXY
La utilidad esperada, es decir la )(YE será
3
0
)(900800)(x
xXPxYE
)3(9003800)2(9002800)1(9001800)0(9000800 XPXPXPXP
700$4.015003.07002.0)100(1.0)900(
Notar que aplicando propiedades de la notación se puede plantear
3
0
3
0
3
0
900)(800)(900)(800)(900800)(x xx
XExXPxXxPxXPxYE
y calculando la esperanza de X , se llega al mismo resultado
Propiedades de la esperanza
En el ejemplo anterior tenemos que Y es una función lineal de X , es decir baXY con a y b
números reales.
En este caso vale entonces la siguiente propiedad
bXaEbaXE )()(
La demostración sigue los mismos pasos que en el ejemplo anterior
bXaExXPbxXxPaxXPbaxbaXExxx
)()()()()(
)(XE 1
Ejemplo:
En el ejemplo anterior donde 900800 XY
Directamente calculamos 900)(800)( XEYE
Y 24.033.022.011.00)( XE
En consecuencia 7009002800900)(800)( XEYE
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
13
Observaciones:
1- Para cualquier constante a, )()( XaEaXE
2- Para cualquier constante b, bXEbXE )()(
Ejemplo:
Si poseo el valor esperado de dos cotas, PfA y PfB el desnivel esperado será
PfAPfBPfAPfBE 11)(
Varianza de una variable aleatoria
La esperanza de una v.a. mide dónde está centrada la distribución de probabilidad. Pero
supongamos el siguiente ejemplo
Sean X e Y dos variables aleatorias con distribuciones dadas por
Es fácil verificar que 0)()( YEXE , pero los valores que toma la v.a. Y están más “alejados”
de su esperanza que los valores de X.
Se busca una medida que refleje este hecho, se define entonces la varianza de una v.a.
x -1 1
p(x) 0.5 0.5
y -100 100
p(y) 0.5 0.5
X
Y
Sea X una v.a. discreta con rango RX, función de distribución de probabilidad p(x) y esperanza
𝐸(𝑋) 𝜇,
Entonces la varianza de X, que anotamos 𝑉(𝑋) 𝜎2 𝑜 𝜎𝑋2 es
La desviación estándar de X es 𝜎𝑋 𝑉(𝑋)
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
14
Observaciones:
1- La varianza de una v.a. nunca es negativa
2- La cantidad 2)( XXh es el cuadrado de la desviación de X desde su media, y la
varianza de X es la esperanza de la desviación al cuadrado. Si la mayor parte de la distribución de
probabilidad está cerca de , entonces 2 será relativamente pequeña. Si hay valores de la
variable alejados de que tengan alta probabilidad, entonces 2 será grande.
3- 2 está expresado en las unidades de medida de X al cuadrado, mientras que está expresada
en las mismas unidades de medida que X.
Ejemplo:
En el caso de las variables aleatorias X e Y nombradas anteriormente,
15.0015.001)(22
XV y 1X
2221005.001005.00100)( YV y 100Y
Otra forma de escribir la varianza de una v.a., que facilita los cálculos es
X XXXX Rx RxRxRxRx
xpxxpxpxxpxxxpxXV )()(2)()(2)()( 22222
2222222 )(2)()(2)( XEXEXEXE
Por lo tanto
22 )()( XEXV
Propiedades de la varianza
Las propiedades de la varianza de una v.a. son consecuencia de las propiedades de la esperanza de
una v.a.
Si X es una v.a. discreta con rango XR y distribución de probabilidad p(x), entonces la varianza de
cualquier función h(X) es igual a
XRx
xpXhExhXhV )())(()())((2
Si h(X) es una función lineal, entonces
)()( 2 XVabaXV y XbaX abaXV )(
Observaciones:
1- )()( 2 XVaaXV
2- )()( XVbXV
Ejemplo:
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
15
En un ejemplo anterior donde X: “número de computadoras vendidas” y Y: “utilidad obtenida”, la
V(Y) sería )(800)( 2 XVYV
Necesitamos calcular V(X) 22 )()( XEXV
Sabemos ya que
Calculamos 54.033.022.011.00)( 22222 XE
En consecuencia
80025800)(800)(800)( 222222 XEXVYV
Variables aleatorias discretas importantes
Distribución binomial
Sea un experimento aleatorio. Sea A un evento asociado a y anotamos pAP )( .
Supongamos un experimento aleatorio 0 que cumple los siguientes requisitos:
1- se realizan n repeticiones independientes de , donde n se fija de antemano.
2- las repeticiones son idénticas, y en cada repetición de observamos si ocurre A o no ocurre A
(cuando A ocurre se dice que se obtuvo un “éxito”, caso contrario se obtuvo un “fracaso”)
3- la probabilidad de éxito es constante de una repetición a otra de , y es igual a p .
Se dice entonces que 0 es un experimento binomial
Ejemplos:
1- Se tira una moneda 4 veces en forma sucesiva e independiente, y observamos en cada tiro si
sale cara o no sale cara.
Entonces este es un experimento binomial pues:
sería el experimento “tirar una moneda”
A sería el evento “sale cara”
se repite en forma sucesiva e independiente n = 4 veces
pAP )( es la misma en cada tiro.
2- Se tiene una urna con 15 bolillas blancas y 5 verdes. Se extraen al azar con reemplazo tres
bolillas y se observa si la bolilla extraída es blanca.
Entonces este es un experimento binomial pues:
sería el experimento “extraer al azar una bolilla de la urna”
A sería el evento “se extrae bolilla blanca”
se repite en forma sucesiva e independiente n = 3 veces
4
3
20
15)( AP es la misma en cada extracción.
El muestreo con reemplazo implica que las condiciones bajo las que se realiza el experimento no
se alteran en cada repetición. Es lo que debería suceder cuando realizamos nuestras observaciones.
2)( XE
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
16
Los factores que determinan los resultados ,aunque no controlables, deberían estar presentes en
cada medición.
Una forma de ver el experimento binomial es no en función de colores o figuras sino de signos
con que ocurre un determinado fenómeno, por ejemplo la coincidencia de dos marcas o señales.
En nuestro caso los extremos de una cinta con el objeto a medir o cualquier situación similar.
La variable aleatoria binomial y su distribución
En la mayoría de los experimentos binomiales, interesa el número total de éxitos, más que saber
exactamente cuáles repeticiones produjeron los éxitos
Sea la v.a. X: “número de éxitos en las n repeticiones de ”
Entonces se dice que X es una v.a. binomial
Veamos cuál es la distribución de probabilidad de X, para esto primero tomamos un caso concreto:
el ejemplo 1 anterior en el que se tira una moneda 4 veces. Supongamos que la probabilidad de
cara es ¾
Aquí el rango de X sería 4,3,2,1,0XR
Para facilitar la notación escribimos 4,3,2,1 tiro"ésimo elen cara sale:" iiAi
Por lo tanto
4
432143214
1
4
1
4
1
4
1
4
1)()()()()0(
CCCCCCCC APAPAPAPAAAAPXP
por independencia
Para calcular la )1( XP pensamos que hay cuatro casos posibles en los que se puede obtener
exactamente una cara, que la cara salga en el 1º tiro, o en el 2º o en el 3º o en el 4º tiro. Notar que
tenemos cuatro casos y eso es igual a la cantidad de formas en que podemos elegir entre los 4
tiros uno de ellos en el cual sale cara, es decir tenemos 4!3!1
!4
1
4
casos diferentes.
4321
432143214321
)1(
AAAAP
AAAAPAAAAPAAAAP
XP
CCC
CCCCCCCCC
Cada término es igual a 3)1( pp por lo tanto
3)1(4)1( ppXP
Análogamente, para calcular )2( XP tenemos 6!2!2
!4
2
4
casos en los que salen
exactamente dos caras, por lo tanto
22
43214321 )1(2
4)2( ppAAAAPAAAAPXP CCCC
Pensando de la misma forma los otros casos se llega a
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
17
)1(3
4)3( 3 ppXP
;
4)4( pXP
En general con un argumento análogo tenemos que nRX ,,2,1,0 y
nk-p)(pk
nkXP
n-kk,...,2,1,0 1)(
Notación: indicamos que X es una v.a. binomial con parámetros n y p con el símbolo
),(~ pnBX
Dado que los números )( kXP corresponden a la distribución de una v.a., automáticamente
cumplen que 1)(0
n
k
kXP
De todas formas se podría hacer una verificación algebraica utilizando la fórmula del binomio de
Newton
11)1()(00
nkn
n
k
kn
k
ppppk
nkXP
Ejemplos:
1- En el ejemplo anterior en el que se tira una moneda 4 veces, calcular la probabilidad de
obtener:
a) exactamente una cara
b) al menos una cara
c) a lo sumo una cara
Solución:
a) tenemos que la v.a. X: “número de caras obtenido” es )25.0,4(B
se pide 421875.04
3
4
14
4
11
4
1
1
4)1(
331
XP
b) la probabilidad de obtener al menos una cara es
kk
k kXPXPXPXPXP
44
1 4
3
4
14)4()3()2()1()1(
Pero más fácil es hacer
578125.0421875.014
31
4
11
4
1
0
41)0(1)1(
4040
XPXP
c) la probabilidad de obtener a lo sumo una cara es
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
18
84375.04
11
4
1
1
4
4
11
4
1
0
4)1()0()1(
141040
XPXPXP
Observación: si ),(~ pnBX para calcular )( kXP en general se debe hacer
)()1()0()()(0
kXPXPXPiXPkXPk
i
Notar que )( kXP es la F.d.a. de X evaluada en k, es decir )()( kXPkF
Existen tablas de la función de distribución acumulada de la binomial para diferentes valores de n
y p
Consultando estas tablas se puede obtener directamente el resultado del inciso c) buscando para n
=4 y p = 0.25
Además consultando las tablas podemos evaluar )( kXP haciendo
nkkFkFkXP ,...,2,1 )1()()(
2- Supongamos que el 20% de todos los ejemplares de un texto en particular fallan en una prueba
de resistencia a la encuadernación. Se seleccionan 15 ejemplares al azar.
Sea la v.a. X: “número de ejemplares que fallan en la prueba entre los 15 seleccionados”
a) ¿cuál es la probabilidad de que a lo sumo 8 fallen en la prueba?
b) ¿cuál es la probabilidad de que exactamente 8 fallen en la prueba?
c) ¿cuál es la probabilidad de que al menos 8 fallen en la prueba?
Solución:
a) Tenemos que )2.0,15(~ BX
999.0)8()()8(8
0
FkXPXPk
por tabla de la F.d.a.
b) 003.0996.0999.0)7()8()8( FFXP
por tabla de la F.d.a.
c) 004.0996.01)7(1)7(1)8( FXPXP
por tabla de la F.d.a.
Observaciones:
1- Si ),1(~ pBX entonces la v.a. X toma sólo dos valores 0 y 1 con probabilidades p y 1-p es
decir podemos escribir
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
19
contrario caso 0
éxito ocurre ejecutar al si 1 X
pAPXP
pAPXP
C
1)()0(
)()1(
En este caso se dice que X tiene distribución de Bernoulli
En el caso de ser ),(~ pnBX se dice que se tienen “n ensayos de Bernoulli”
2- A continuación se muestra cómo varía la forma de la distribución a medida que p aumenta
manteniendo n fijo en 15. Se grafica la distribución de frecuencia para p = 0.01; 0.2, 0.5, 0.7 y
0.995.
Observar que para p = 0.5 la distribución de frecuencia es simétrica.
p = 0,01n = 15
0 3 6 9 12 15
0
0,2
0,4
0,6
0,8
1
p = 0,2n = 15
0 3 6 9 12 15
0
0,05
0,1
0,15
0,2
0,25
0,3
p = 0,5n = 15
0 3 6 9 12 15
0
0,04
0,08
0,12
0,16
0,2
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
20
Esperanza y varianza
Más ejemplos de aplicación de la distribución Binomial
1) Si la probabilidad de cometer determinado error en una medida es 0.5, cuál es la
probabilidad de que en 10 mediciones se obtengan 8 que posean dicho error?
n=10 ; p=0,5 ; z= 8
P(z=8) = . / 2
Interpretación: si estas 10 mediciones ( el trabajo) se realizaran 100 veces, en promedio, 9 de esos
conjuntos tendrían z=8.
p = 0,7n = 15
0 3 6 9 12 15
0
0,04
0,08
0,12
0,16
0,2
0,24
p = 0,995n = 15
0 3 6 9 12 15
0
0,2
0,4
0,6
0,8
1
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
21
2) Para el caso anterior cuál es la probabilidad de que todas las mediciones tengan ese error.
P(z=10) = . /
3) Que ninguna tenga ese error.
P(z=0) = . /
4) Si en un conjunto de mediciones la probabilidad de no sobrepasar un determinado error es
del 25% calcular la probabilidad de que cada 4 mediciones realizadas ninguna sobrepase
dicho error.
n=4 ; p=0,25 ; z= 0
P(z=0) = . /
Ejemplos de usos en agrimensura específicamente
1) controlo dos cintas poniéndolas apareadas. Debería encontrar tantas diferencias positivas
como negativas. Puedo evaluar la probabilidad de encontrar los r resultados encontrados. La idea
es que una baja probabilidad nos permita sostener que existe una diferencia sistemática entre
ambas. También puede aplicarse a dos miras.
2) tengo una red de anillos de nivelación. Debería tener tantos cierres positivos como negativos.
Sólo cuento la cantidad de signos positivos sin fijarme en la magnitud de los desvíos.
Variables aleatorias continuas
En la sección anterior se consideraron variables aleatorias discretas, o sea variables aleatorias cuyo
rango es un conjunto finito o infinito numerable. Pero hay variables aleatorias cuyo rango son
todos los números reales de un intervalo dado, (es decir es un conjunto infinito no numerable).
Ejemplos de variables continuas podrían ser
X: “tiempo que tarda en llegar un colectivo a una parada”
Y: “tiempo de vida de un fusible”
Z: “Desnivel entre dos puntos”
T: “Distancia entre dos puntos”
Recordemos que las observaciones topográficas y geodésicas se toman como variables aleatorias
continuas
Como ahora los valores de una v.a. continua no son contables no se puede hablar del i-ésimo valor
de la v.a. X y por lo tanto )()( ii xXPxp pierde su significado. Lo que se hace es sustituir la
función )(xp definida sólo para ,...., 21 xx , por una función )(xf definida para todos los valores x
del rango de X. Por lo tanto se da la siguiente definición de v.a. continua .
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
22
Sea X una v.a. Decimos que es continua si existe una función no negativa f , definida sobre todos
los reales ,x , tal que para cualquier conjunto B de números reales
B
dxxfBXP )()(
O sea que la probabilidad de que X tome valores en B se obtiene al integrar la función f sobre el
conjunto B.
A la función f la llamamos función densidad de probabilidad (f.d.p.).
Observaciones:
1- Como X debe tomar algún valor real, entonces debe cumplirse que
dxxfXP )()(1
2- Si B es el intervalo real bxaRxba ;, entonces
b
a
dxxfbXaPBXP )()()(
Notar que en este caso la probabilidad de que X
tome valores en el intervalo ba, es el área bajo
f entre a y b
3- Si en la observación anterior ba entonces
0)()( a
a
dxxfaXP
Es decir la probabilidad que una v.a. continua tome algún valor fijado es cero. Por lo tanto,
para una v.a. continua
b
a
dxxfbXaPbXaPbXaPbXaP )()()()()(
Función de distribución acumulada
Sea X una v.a. continua. Se define la función de distribución acumulada de X (abreviamos F.d.a
de X) como
xxXPxF )()(
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
23
Si X tiene f.d.p. f(x) entonces
xdttfxXPxF
x
)( )()(
Además
)()()()()()( aFbFdxxfdxxfdxxfbXaP
abb
a
Observación:
Si X es una v.a. con f.d.p. f(x) y función de distribución acumulada )(xF entonces
)()()(
xfdttfdx
d
dx
xdFx
donde )(xF sea derivable
Es decir, se puede obtener la función de densidad de X a partir de su F.d.a.
El conocimiento de qué función de densidad describe el comportamiento de las observaciones
topográficas nos permitirá evaluar los rangos o intervalos de ocurrencias de las mismas con su
correspondiente probabilidad. Del mismo modo con las coordenadas o cotas que se deriven de
aquellas.
Esperanza de una variable aleatoria continua
Para una v.a. discreta la )(XE se definió como la suma de los )( ii xpx . Si X es una v.a. continua
con f.d.p. f(x), se define )(XE sustituyendo la sumatoria por integración y )( ixp por f(x).
A menudo se desea calcular la esperanza de una función de X, Y = h(X), esto se puede hacer
hallando previamente la densidad de Y y luego calcular E(Y) aplicando la definición anterior.
Otra forma de calcular E(Y) sin hallar la densidad de Y está dada por el siguiente
La esperanza de una v.a. continua X con f.d.p. f(x) se define como
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
24
De la misma forma que en el caso discreto, si baxxh )( , es decir si h es una función lineal,
aplicando las propiedades de linealidad de la integral tenemos
bXaEbaXE )()(
Varianza de una variable aleatoria continua
La interpretación de la varianza de una v.a. continua es la misma que para el caso discreto.
Además sigue valiendo la igualdad
22)( XEXV
Pues en la demostración hecha para el caso discreto si sustituyen las sumatorias por integrales.
Por la misma razón, también vale que
XbaX aXVabaXV y )()( 2
Variables aleatorias continuas importantes
Distribución normal o gaussiana
Sea X una v.a. Decimos que tiene distribución normal con parámetros y si su f.d.p. es de la
forma
Teorema: Si X es una v.a. continua con f.d.p. f(x) y h(X) es cualquier función de X, entonces
Sea X una v.a. continua con f.d.p. f(x) y sea 𝐸(𝑋) 𝜇, entonces la varianza de X es
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
25
xexf
x
2
2
1
2
1)(
Donde R y 0
Notación: 2,~ NX
Para darse una idea de la forma de la gráfica notar que:
1- )(xf es simétrica alrededor de , es decir )()( xfxf para todo x
2- 0)(lim
xfx
(eje x asíntota horizontal)
3- Si planteamos xxfdx
d 0)( . Se pude verificar que en x la función tiene un
máximo absoluto,
2
1)( f
4- Si planteamos xxfdx
d 0)(
2
2
. Se puede verificar que en x y en
x la función tiene dos puntos de inflexión, y además en el intervalo , la
función es cóncava hacia abajo y fuera de ese intervalo es cóncava hacia arriba
La gráfica de )(xf tiene forma de campana
Observación:
Cuando varía la gráfica de la función se traslada, es un parámetro de posición.
Cuando aumenta, la gráfica se “achata”, cuando disminuye la gráfica se hace más
“puntiaguda”, se dice que es un parámetro de escala o dispersión.
En las siguientes figuras vemos cómo varía la gráfica de f(x) con la variación de los parámetros
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
26
1 0
1 2
- - - - - 1 3
1 0
2 0
- - - - - 4 0
Se puede probar que f(x) es una f.d.p. es decir que
a) 0)( xf para todo x
b) 1)(
dxxf
Que a) es cierta se ve en la gráfica; para probar b) es necesario recurrir al cálculo en dos variables
(no lo demostramos).
Si 0 y 1 entonces se dice que X tiene distribución normal estándar. Se anota 1,0~ NX
En este caso la f.d.p. se simboliza con )(x , es decir
-6 -4 -2 2 4 6
0.1
0.2
0.3
0.4
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
27
xexx
2
1)(
2
2
1
En este caso la gráfica de la densidad es simétrica con respecto al origen.
La F.d.a. de una v.a. normal estándar se anota )(x
xt
dtexXPx2
2
1
2
1)()(
Esta integral no puede expresarse en términos de funciones elementales, por lo tanto se calcula
)(x para valores específicos de x mediante una aproximación numérica.
Esto ya está hecho, existen tablas de la función de distribución acumulada de la normal estándar
para valores de x que oscilan en general entre -4 y 4, pues para valores de x menores que -4,
0)( x , y para valores de x mayores que 4, 1)( x
Notar que como la )(x es simétrica con respecto al origen entonces
)(1)(1)()()( xxXPxXPxXPx
Por ejemplo, si 1,0~ NX entonces utilizando la tabla de la F.d.a. de X
a) 89616.0)26.1()26.1( XP
b) 10384.089616.01)26.1(1)26.1(1)26.1( XPXP
c) 91465.0)37.1()37.1()37.1( XPXP
d) )25.1()37.0()25.1()37.0()37.025.1( XPXPXP
53866.0)89435.01(64431.0)25.1(1)37.0(
e) ¿Para qué valor x se cumple que 95.0)( xXxP ?
Tenemos que 1)(2))(1()()()()( xxxxxxXxP
Por lo tanto 975.02
190.0)( 95.01)(2
xx
-x x 0
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
28
Observamos en la tabla de la F.d.a. que 96.1x , pues 975.0)96.1(
Para los incisos a) , b) y c) se grafican las regiones correspondientes
Una propiedad importante de la distribución normal es que si 2,~ NX entonces la v.a.
baXY con a y b números reales, 0a , tiene también distribución normal pero con
parámetros ba y 22a , es decir
),~ ,~ 222 abN(abaXNX (1)
Una consecuencia importante del resultado anterior es que
)1,0(~ entonces ),(~ si 2 NX
YNX
(2)
Notar que Y se pude escribir como
XY
1 es decir claramente Y es una función lineal
de X
Por lo tanto aplicamos el resultado (1) con
1a y
b y llegamos a (2).
1.26
b)
1.26
a)
c)
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
29
Si 2,~ NX entonces la F.d.a. de X es
dtexXPxF
tx2
2
1
2
1)()(
F(x) no puede expresarse en términos de funciones elementales y sólo hay tablas de la F.d.a. de la
normal estándar.
Para calcular F(x) procedemos de la siguiente forma
xxYP
xXPxXPxF )()(
1,0~ NY
Ejemplos:
1- Si 9,3~ NX entonces
a)
3779.03
1
3
2
3
32
3
35
3
35
3
3
3
32)52(
XPXP
b) 8413.0)1()1(13
30
3
3)0(
XPXP
c)
3
6
3
3
3
61636163163
XPXPXPXP
0456.0)2(12221
2- Hay dos niveles máquinas para cortar corchos destinados para usarse en botellas de vino. La
primera produce corchos con diámetros que están normalmente distribuidos con media de 3 cm y
desviación estándar de 0.1 cm. La segunda máquina produce corchos con diámetros que tienen
una distribución normal con media de 3.04 cm y desviación estándar de 0.02 cm. Los corchos
aceptables tienen diámetros entre 2.9 cm y 3.1 cm. ¿Cuál máquina tiene más probabilidad de
producir un corcho aceptable?
Solución:
Sean las variables aleatorias
X: “diámetro de un corcho producido por la máquina 1”
Y: “diámetro de un corcho producido por la máquina 2”
Entonces 21.0,3~ NX y 202.0,04.3~ NY
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
30
Calculamos cuál es la probabilidad que la máquina 1 produzca un corcho aceptable
6826.01)1(2)1()1(
1.0
39.2
1.0
31.3
1.0
31.3
1.0
3
1.0
39.2)1.39.2(
XPXP
Análogamente para la máquina 2
9987.009987.0)7()3(
02.0
04.39.2
02.0
04.31.3
02.0
04.31.3
02.0
04.3
02.0
04.39.2)1.39.2(
YPYP
Entonces es más probable que la máquina 2 produzca corchos aceptables.
3- Supóngase que la resistencia a romperse (en Kgr) de fibras de yute está descrita por una v.a.
continua X normalmente distribuida con 165 XEμ Kgr y 92 XVσ (Kgr)2.
suponiendo además que una muestra de esta fibra se considera defectuosa si 162X . Cuál es la
probabilidad de que una fibra elegida al azar sea defectuosa?
Solución:
Deseamos conocer 162XP
113
165
3
165162
3
165162
XP
XPXP ,
puesto que 3
165
XZ 10,N . Entonces
.XP 111162
De la tabla tenemos 841301 . 15870111 . .
Es decir 15870162 .XP .
Observación:
Uno puede pensar en objetar el usar una distribución normal estándar para describir a la v.a. X que
representa la resistencia a romperse de la fibra ya que ésta es, obviamente, una cantidad no
negativa, mientras que una v.a. normalmente distribuida puede tomar valores que varían entre
y . Sin embargo al modelar el problema con una normal estándar (que aparentemente debería
ser invalidada como modelo por lo señalado) vemos que les estamos asignando al suceso 0X
una probabilidad prácticamente nula (ver también la figura siguiente):
011551553
1650
3
1650
XPXP .
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
31
x [Kgr]
f(x)
0 5 10 15 150 180
0,5
1,0
1,5
= 165
Vemos que el fenómeno estudiado se modela estadísticamente mediante una ecuación del tipo
dtexXPxF
tx2
2
1
2
1)()(
Pero luego, para su resolución realizamos el cambio de variable que conduce a la distribución
estandarizada
xt
dtexXPx2
2
1
2
1)()(
En casos como estos se justifica usar la distribución normal para modelar situaciones en que la
variable aleatoria considerada puede tomar, por su significado, sólo valores positivos, aún cuando
la normal permita tomar valores tanto positivos como negativos por cuanto la probabilidad de que
la v.a. tome valores negativos es prácticamente nula.
La distribución normal explica cómo se distribuye la ocurrencia de un fenómeno determinado en
torno a un valor más probable o central más allá de los valores en sí mismos.
Esperanza y varianza de una variable aleatoria con distribución normal
Distribuciones de probabilidad conjunta
Anteriormente se estudiaron distribuciones de probabilidad para una sola variable aleatoria. Sin
embargo, a menudo es útil definir en un experimento aleatorio más de una variable aleatoria.
Por ejemplo, en la clasificación de señales transmitidas y recibidas, cada una de ellas puede
clasificarse como de baja, media o alta calidad. Incluso puede definirse una v.a. X igual al número
de señales de alta calidad recibidas, y otra v.a. Y igual al número de señales de baja calidad
recibidas. En otro ejemplo, la v.a. continua X puede denotar la longitud de una pieza moldeada por
inyección, y la v.a. continua Y puede ser el ancho de la pieza. Por ejemplo, si las especificaciones
Sea entonces y
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
32
para X e Y son (2.95 a 3.05) y (7.60 a 7.80) milímetros, respectivamente, entonces se puede tener
interés en la probabilidad de que una pieza cumpla con ambas especificaciones, o sea P( 2.95 < X
< 3.05 y 7.60 < Y < 7.80).
En general si X e Y son dos variables aleatorias discretas, la distribución de probabilidad que
define el comportamiento simultáneo de éstas se conoce como distribución de probabilidad
conjunta, que se anota p(x,y) . En el caso continuo se tiene la función de densidad conjunta que
se anota f(x,y) .
Independencia
En algunos experimentos aleatorios, el conocimiento de los valores de X no cambia ninguna de las
probabilidades asociadas con los valores de Y.
Se dice entonces que las variables X e Y son independientes. Por ejemplo dos muestreos con
reposición poseen esa cualidad. En topografía asumimos que las distintas observaciones (
experimentos aleatorios) son independientes. Luego veremos que los valores calculados a partir de
ellas, no lo serán. Nos referimos a desniveles y cotas.
Covarianza y correlación
Cuando se definen dos o más variables aleatorias en un espacio de probabilidad, es útil describir la
forma en que varían juntas; esto es, resulta útil tener una medida de la relación que existe entre las
variables. Una medida común de la relación que existe entre dos variables aleatorias es la
covarianza.
La covarianza está definida por la misma expresión para variables aleatorias discretas o continuas.
Este parámetro de dispersión conjunta será tenido en cuenta al preparar las observaciones para el
ajuste de la red en lo que llamaremos el modelado estadístico del trabajo.
Coeficiente de correlación lineal.
En realidad más que la covarianza aquí nos interesa considerar una cantidad relacionada con XYσ
y que según veremos nos dará información sobre el grado de asociación que existe entre X e Y .
Más concretamente nos contará si existe algún grado de relación lineal entre X e Y . Esa cantidad
es el coeficiente de correlación lineal.
cov(X Y) E,(X − μX)(Y − μY )- E(XY) − 𝜇𝑋𝜇𝑌
La covarianza entre las variables aleatorias X e Y denotada por
cov(X,Y) o σXY es
Si X e Y son variables aleatorias independientes, entonces .
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
33
En el mismo sentido en que podemos tener una idea aproximada sobre la probabilidad de un
suceso A si repetimos el experimento y consideramos las ocurrencias de A en las n repeticiones,
así podemos tener también una primera idea sobre la existencia de una relación funcional,
específicamente una relación lineal, entre X e Y si consideramos un diagrama de dispersión.
Consiste en dibujar pares de valores ji y,x medidos de la variable aleatoria Y,X en un sistema
de coordenadas. En la figura mostramos diversas situaciones posibles.
De la figura a se deduciría que entre X e Y no hay ningún tipo de relación funcional. La figura b
sugiere la posibilidad de que exista una relación funcional que corresponde a una parábola. La
figura c, por su parte, sugiere una relación lineal entre X e Y . Este último es el comportamiento
que nos interesa caracterizar. Con ese fin definimos el coeficiente de correlación lineal como
sigue:
En consecuencia:
YV.XV
YE.XEY.XE
YV.XV
YEY.XEXEρXY
.
Daremos una serie de propiedades de XYρ que nos permitirán establecer más concretamente su
significado.
0 0 a b c
x x
y y y
(xi yi)
x
Sea una variable aleatoria bidimensional. Definimos el coeficiente de correlación lineal
entre X e Y como
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
34
Propiedad 1
Propiedad 2 :
Propiedad 3 :
Propiedad 4 :
La extensión de una distribución normal a dos variables aleatorias da origen a la importante
distribución de probabilidad bidimensional ( o bivariada ).
Distribución normal bivariada
La función de densidad de probabilidad de una distribución normal bivariada es
( )
2 ,−
2( )(.
/2
−2 ( )( )
.
/2
)
para − −
y parámetros
− − −
Si X e Y son variables aleatorias independientes entonces .
Si , entonces con probabilidad 1 es donde a y b son constantes.
Si X e Y son dos variables aleatorias tales que Y = aX + b, donde a y b son constantes,
entonces . Si es y si es .
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
35
La gráfica de la función de densidad tiene el siguiente aspecto:
1)
2)
Pueden demostrarse los siguientes resultados:
Si X e Y tienen distribución normal bivariada con parámetros 𝜇𝑋 𝜇𝑌 𝜎𝑋 𝜎𝑌 𝜌
entonces 𝑋~𝑁(𝜇𝑋 𝜎𝑋2) y 𝑌~𝑁(𝜇𝑌 𝜎𝑌
2)
Si X e Y tienen distribución normal bivariada con parámetros 𝜇𝑋 𝜇𝑌 𝜎𝑋 𝜎𝑌 𝜌
entonces la correlación entre X e Y es 𝜌
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
36
En algunos casos, se tienen definidas más de dos variables aleatorias en un experimento aleatorio.
Por ejemplo, supongamos que, en uno de los ejemplos anteriores, la calidad de cada bit recibido se
clasifica en cuatro clases: excelente, buena, aceptable o pobre anotadas respectivamente E, B, A y
P. Consideramos las variables aleatorias X1, X2, X3 y X4 que indican el número de bits que son E,
B, A y P respectivamente, en una transmisión de 20 bits. Aquí el interés está en la distribución
conjunta de cuatro variables aleatorias. La distribución de probabilidad conjunta estará
especificada por una función de cuatro variables p(x1,x2, x3, x4) = P(X1 = x1, X2 = x2 , X3 = x3, X4 =
x4). Dado que cada uno de los 20 bits clasificados cae en una de las cuatro clases, sólo los valores
de x1,x2, x3 y x4 que suman 20 reciben una probabilidad positiva.
En general si X1, X2, …,Xn son n variables aleatorias discretas entonces se tendrá una función de
distribución conjunta especificada por una función de n variables p(x1,x2, x3,…, xn)
En el caso de ser las variables aleatorias continuas, se tendrá una función de densidad de
probabilidad conjunta f(x1,x2, x3,…, xn).
La noción de independencia se generaliza al caso de más de dos variables aleatorias.
En el caso de las redes altimétricas nos encontraremos con un vector de observaciones con los
desniveles que integren la red. Cada desnivel estará acompañado por una varianza estimada según
la calidad del instrumental o método empleado. Como se dijo antes se supondrá que la
determinación de un desnivel en nada afecta a los demás.
Si X es una v.a. n-dimensional X = (X1, X2, …,Xn) su esperanza es la matriz
E(X) = [E(X1), E(X2), …,E(Xn)]
Y su matriz de varianzas-covarianzas es
( ) (
2
2 )
con
{ ( )
( )
Para nuestro caso las matrices de varianza covarianza de las observaciones serán matrices
diagonales con los términos
( )
La matriz de varianzas-covarianzas puede expresarse como
Si X e Y tienen distribución normal bivariada con parámetros 𝜇𝑋 𝜇𝑌 𝜎𝑋 𝜎𝑌 𝜌
y 𝜌 = 0 entonces X e Y son independientes
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
37
( ) ,( − ( )) ( − ( ))-
o como
( ) , - − ( ( )) ( )
Algunas propiedades de interés:
1) Si Y = X A+ B donde A y B son dos matrices de constantes de dimensión y
respectivamente entonces
E(Y) = E(X) A + B y V(Y) = AT . V(X) . A
2) V(X) es una matriz simétrica y semidefinida positiva, siendo definida positiva si y solo
si no existe ninguna combinación lineal entre las variables X1, X2, … , Xn
3) En el caso particular de ser A una matriz columna de ( ) entonces
2 2 , es decir Y es una variable aleatoria combina-
ción lineal de las variables X1, X2, …,Xn
Por lo tanto ( ) ( ) ( ) 2 ( 2) ( ) y
V(Y) = AT . V(X) . A =
( 2 ) (
2
2 )(
2
) ∑ 2
∑
Si las variables son independientes entonces ( ) por lo tanto
V(Y) = ∑ 2
∑ 2
( )
Distribucion normal n-dimensional
La v.a. n-dimensional X = (X1, X2, …,Xn) sigue una distribución normal n-dimensional de
parámetros ( 2 ) y ( ) , matriz simétrica y definida positiva, si su función
de densidad es
( )
( ) 2 | | [−
( − ) ( − ) ]
para − . Se anota ~ ( )
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
38
Si es una matriz fila de ceros y es la matriz identidad, resulta la distribución normal n-
dimensional estándar, ~ ( ), que es la distribución conjunta de n variables X1, X2, …,Xn
normales estándar e independientes.
Las variables ~ ( ) y ~ ( ) se relacionan con la expresión Y = XA + µ, donde A
es una matriz cuadrada de orden n no singular tal que
Además
( ) y ( )
Algunos resultados importantes:
1) Si X es una v.a. normal n-dimensional, la v.a. formada por cualquier subconjunto de k
variables de las n iniciales, sigue una distribución normal k-dimensional. En particular,
cada una de sus componentes es normal unidimensional.
2) Si X1, X2, …,Xn son variables aleatorias tales que ~ ( 2) y además son indepen-
dientes entonces X = (X1, X2, …,Xn) sigue una distribución normal n-dimensional de
parámetros ( 2 ) y ( ). 3) Si X1, X2, …,Xn son variables aleatorias independientes, entonces están incorrelaciona-
das, no cumpliéndose, en general, el resultado recíproco. Pero para variables normales
n-dimensionales, ambos conceptos son equivalentes. Es decir, las n componentes de la
v.a. normal n-dimensional X, X1, X2, …,Xn son independientes si y solo si están incorre-
lacionadas.
4) Sea X una v.a. n-dimensional, con esperanza y matriz de varianzas-covarianzas si-
métrica y definida positiva. La v.a. X sigue una distribución normal n-dimensional si y
solo si cualquier combinación lineal de sus componentes sigue una distribución normal
unidimensional.
En particular se tiene el importante resultado:
Si son n variables aleatorias independientes donde
para todo entonces la v.a. , llamada promedio muestral,
tiene distribución normal con media y varianza
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
39
Aplicación. Propagación de errores
La medición es fundamental en el trabajo de investigación y de producción. Frecuentemente se
realizan cálculos con cantidades medidas. Por ejemplo al calcular el área de un rectángulo se
multiplican su longitud y ancho.
Cualquier procedimiento de medición tiene errores, también llamados incertidumbres, por
consiguiente, en general los valores medidos son algo diferentes de los “valores reales”. Cuando
se realiza un cálculo con mediciones, los errores en éstas producen un error en el valor calculado.
Se dice que el error se propaga de las mediciones al valor calculado. Si se tiene cierto
conocimiento con respecto al tamaño de los errores en las mediciones, como en la longitud y
ancho de un rectángulo, existen métodos para conocer la magnitud del error en una cantidad
calculada como el área.
En nuestro caso los errores en las punterías, los errores o incertidumbres en el sistema de
horizontalización del nivel se trasladarán a la lectura en las miras. Éstas se propagarán a los
desniveles en cada estación y a su vez estos últimos formarán el desnivel completo para un tramo
entre dos marcas fijas en donde se propagarán los errores individuales. Finalmente los errores o
incertidumbres acumulados en los desniveles se propagarán en las cotas definitivas de la red.
Error de medición
Una geóloga pesa una roca en una balanza. Toma cinco mediciones y obtiene los siguientes datos
en gramos: 251.3 252.5 250.8 251.1 250.4
Todas las mediciones son diferentes y es probable que ninguna sea igual a la masa “real” de la
roca. A la diferencia entre un valor medido y el valor “real” se lo llama error en el valor medido.
Por ejemplo supongamos que las mediciones de la roca se leían en una marca en una escala. Si la
balanza no estaba calibrada adecuadamente, cada medición estará lejos de su valor real en cierta
cantidad fija. Por lo tanto una calibración imperfecta aporta errores de la misma magnitud en cada
medición. La interpolación entre las marcas de graduación de la escala es otra fuente de error. La
magnitud del error debida a la interpolación quizá varíe entre mediciones y es probable que sea
positivo para algunas mediciones y negativo para otras. Es razonable suponer que a largo plazo el
promedio de los errores por interpolación será igual a cero.
En general, el error de una medición lo integran el error sistemático o sesgo, y el error aleatorio.
El primero presenta la parte del error que es igual ,o está funcionalmente determinada, para cada
medición, el segundo varía en forma aleatoria entre mediciones y, en promedio, será igual a cero
en el largo plazo. Algunas fuentes de error contribuyen con ambos tipos de error, el sesgo y el
error aleatorio.
Cualquier medición se puede considerar como la suma del valor real más las contribuciones de
cada uno de los dos componentes de error:
valor medido = valor “real” + sesgo + error aleatorio
error= sesgo + error aleatorio
Como parte del error es aleatorio, es adecuado utilizar un modelo estadístico para estudiar los
errores de medición. Los sesgos se asocian a modelos funcionales. Por ejemplo los errores por
curvatura y refracción y la influencia del error del nivel. Se modela cada valor medido como una
variable aleatoria, tomada de una población de mediciones posibles. La media µ de la población
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
40
representa esa parte de la medición que es igual para toda medición. Por lo tanto µ es la suma del
valor real más el sesgo. El estudio de los modelos funcionales es lo que va a permitir que esta
componente sistemática sea lo menor posible. La desviación estándar σ de la población representa
la desviación estándar del error aleatorio. Ésta representa la variación debida al hecho de que cada
medición tiene un valor diferente por su error aleatorio. Intuitivamente σ constituye el tamaño de
un error aleatorio estándar( desviación estándar).
Se tiene interés en dos aspectos del proceso de medición. El primero es su exactitud. Ésta la
determina el sesgo, que es la diferencia entre la media µ de la medición y el valor “real” de ésta
última. Entre más pequeño es el sesgo, más exacto será el proceso de medición. Si la media µ es
igual al valor real, el sesgo será igual a cero, en este caso al proceso de medición se le llama
no sesgado. El otro aspecto de interés en el proceso de medición es la precisión. Ésta constituye el grado con
que tienden a coincidir las mediciones repetidas de la misma cantidad. Si las mediciones repetidas
resultan cercanas entre sí todo el tiempo, la precisión es alta. Si son muy dispersas, la precisión es
baja. Por lo tanto la precisión se determina mediante la desviación estándar σ del proceso de
medición. Con frecuencia se llama a σ incertidumbre aleatoria del proceso de medición.
De ahora en adelante se supondrá que el sesgo es despreciable y entonces se describirán las
mediciones en la forma
Valor medido ± σ
donde σ representa la incertidumbre en el proceso que produjo el valor medido.
A menudo se suman constantes a las mediciones, se multiplican mediciones por constantes, o se
suman dos o más mediciones. Veremos cómo se afectan las incertidumbres debido a esas
operaciones aritméticas. Puesto que las mediciones son variables aleatorias y las incertidumbres
son desviaciones estándar de estas variables aleatorias, los resultados que se usan para calcular las
desviaciones estándar de combinaciones lineales de variables aleatorias se pueden aplicar para
calcular las incertidumbres en combinaciones lineales de las mediciones. Los resultados para
variables aleatorias independientes se aplican a las mediciones independientes
Ejemplo
El radio de un círculo mide 3.0 ± 0.1 cm. Calcule la circunferencia y determine la incertidumbre
de la circunferencia.
𝜎𝑎𝑋 |𝑎|𝜎𝑋
Si X es una medición y a es una constante, entonces
Si X1, X2, …,Xn son mediciones independientes y 𝑎 𝑎2 𝑎𝑛 son
constantes, entonces
𝜎𝑎 𝑋 𝑎 𝑋 𝑎𝑛𝑋𝑛 ∑ 𝑎𝑖 𝑛
𝑖 𝑉(𝑋𝑖) ∑ 𝑎𝑖 𝑛
𝑖 𝜎𝑋𝑖
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
41
Solución
Sea R el radio del círculo. El valor medido de R es de 3.0 cm y la incertidumbre es la desviación
estándar de esta medición, que es
La circunferencia está dada por .
La incertidumbre en C es la desviación estándar de C.
Entonces
| | ( )
La circunferencia es 18.84 ± 0.63 cm
Ejemplo
Un topógrafo mide el perímetro de un terreno rectangular. Toma medidas de dos lados adyacentes,
50.11 ± 0.05 m y 75.21 ± 0.08 m. Estas mediciones son independientes. Estime el perímetro del
terreno y determine la incertidumbre en la estimación.
Solución
Anotamos X = 50.11 y Y = 75.21 las dos mediciones.
El perímetro se estima como P = 2X + 2Y = 250.64 m y la incertidumbre en P es
2 2 2
2 ( 2) ( 2) = 0.19 m
El perímetro es 250.64 ± 0.19 m
Mediciones repetidas
Una de las mejores maneras de reducir y/o verificar la incertidumbre es tomar varias mediciones
independientes y determinar el promedio de ellas.
Si se realizan muchas mediciones independientes de la misma cantidad, entonces el promedio de
éstas tiene la misma media de cada medición individual, pero la desviación estándar se reduce en
un factor igual a la raíz cuadrada del tamaño de la muestra. En otras palabras, el promedio de
varias mediciones repetidas tiene la misma exactitud y es más preciso que cualquier única
medición.
Ejemplo
Supongamos que en el ejemplo anterior el presupuesto para este proyecto es suficiente para hacer
14 mediciones más. Cada lado ya se ha medido una vez. Un ingeniero sugiere asignar las nuevas
mediciones a cada lado equitativamente, por lo que éste será medido ocho veces. Un segundo
ingeniero sugiere hacer las 14 mediciones en el lado más largo, ya que ese lado se mide con
incertidumbre más grande. Estime la incertidumbre en el perímetro bajo cada plan. ¿Con cuál plan
se obtiene la incertidumbre más pequeña?
Solución
Con el primer plan, sea ̅ el promedio de las ocho mediciones del lado más corto y sea ̅ el promedio de las ocho mediciones del lado más largo. El perímetro se estimará con ̅ ̅. La incertidumbre en el perímetro con el primer plan es
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
42
2 ̅ 2 ̅ ̅2 ̅
2 √ (
√ )2
(
√ )2
√ (
√ )2
(
√ )2
Con el segundo plan, el perímetro se estimará con ̅, donde X es una sola medición del
lado más corto y ̅ es el promedio de las 15 mediciones del lado más largo.
La incertidumbre del perímetro con el segundo plan es
2 2 ̅ 2 ̅
2 √ ( )2 (
√ )2
√ ( )2 (
√ )2
El primer plan es mejor.
Combinaciones lineales de mediciones dependientes
Supongamos que X e Y son mediciones con incertidumbres y y se desea calcular la
incertidumbre de en la suma X + Y. Si X e Y son dependientes la cantidad que mide la relación
entre los errores aleatorios en X e Y es la covarianza. En la práctica cuando las mediciones son
dependientes sucede con frecuencia el caso de que no se conoce la covarianza. En estos casos se
puede establecer un límite superior a la incertidumbre de una combinación lineal de las
mediciones.
La expresión del lado derecho de la desigualdad es una estimación conservadora de la
incertidumbre de 2 2
Ejemplo
Un topógrafo está midiendo el perímetro de un terreno rectangular. Mide los lados adyacentes, de
50.11 ± 0.05 m y 75.21 ± 0.08 m. Estas mediciones no son necesariamente independientes.
Determine con una estimación conservadora la incertidumbre del perímetro del terreno.
Solución
Anotamos X1 = 50.11 y X2 = 75.21 las dos mediciones.
El perímetro se estima como P = 2X1 + 2X2 = 250.64 m y la incertidumbre en P es
2 2 ( ) ( )
La incertidumbre en el perímetro no es mayor que 0.26 m.
𝜎𝑎 𝑋 𝑎 𝑋 𝑎𝑛𝑋𝑛 |𝑎𝑖|
𝑛
𝑖
𝜎𝑋𝑖
Si X1, X2, …,Xn son mediciones y 𝑎 𝑎2 𝑎𝑛 son constantes, entonces
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
43
Incertidumbres para funciones de una medición
Los ejemplos que se han visto hasta ahora implican calcular incertidumbres en funciones lineales
de mediciones. En muchos casos se desea estimar la incertidumbre de una función no lineal de la
medición.
El tipo de problema que se desea resolver es: dada una variable aleatoria X, con desviación
estándar conocida y dada una función h(X), ¿cómo se calcula la desviación estándar ?. Si h
es una función lineal, los métodos presentados anteriormente son aplicables. Si h no es lineal, se
puede aproximar , multiplicando por el valor absoluto de la derivada dh/dX. La
aproximación es buena si es pequeña.
La ecuación anterior se conoce como la fórmula de la propagación de error.
Ejemplo
El radio R de un círculo mide 5.00 ± 0.01 cm. Estime el área del círculo y determine la
incertidumbre.
Solución
El área A está dada por 2. La estimación aproximada de A es 2 2 Ahora y ⁄ La incertidumbre de A será
|
| ( )( )
2
Se estima el área del círculo con 78.5 ± 0.3 cm2
Incertidumbres para funciones de varias mediciones.
Con frecuencia se necesita estimar una cantidad como una función de varias mediciones.
𝜎 |𝑑ℎ
𝑑𝑋|𝜎𝑋
Si X es una medida cuya incertidumbre 𝜎𝑋 es pequeña y si h es una función de X,
entonces
En la práctica, se evalúa la derivada 𝑑
𝑑𝑋 en la medición observada X.
𝜎 (𝜕ℎ
𝜕𝑋𝑖)2
𝜎𝑋𝑖2
𝑛
𝑖
Si X1, X2, …,Xn son mediciones independientes cuyas incertidumbres
𝜎𝑋 𝜎𝑋 𝜎𝑋𝑛, son pequeñas y si h = h(X1, X2, …,Xn) es una función de X1,
X2, …,Xn entonces
En la práctica se evalúan las derivadas parciales en el punto (X1, X2, …,Xn)
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
44
La ecuación anterior representa la fórmula de propagación de errores multivariada.
Ejemplo
Un desnivel se calcula con la suma de 2 desniveles de la misma precisión, determinada esta por
σ= ±0.002m. Cómo calculo la incertidumbre o desviación estándar del desnivel?
Solución
La estimación del desnivel es la suma de los desniveles parciales . Para calcular primero se
calculan las derivadas parciales de ℎ ℎ ℎ2
ℎ
ℎ
ℎ
ℎ2
Como
√( ℎ
ℎ )2
2 (
ℎ
ℎ2)2
2 2 2 2 2
La desviación estándar del desnivel calculado sería ∆h ± 0.0.03 m
Incertidumbre para funciones de mediciones independientes.
𝜎 |𝜕ℎ
𝜕𝑋𝑖|𝜎𝑋𝑖
𝑛
𝑖
Si X1, X2, …,Xn son mediciones cuyas incertidumbres 𝜎𝑋 𝜎𝑋 𝜎𝑋𝑛, son
pequeñas y si h = h(X1, X2, …,Xn) es una función de X1, X2, …,Xn entonces
En la práctica se evalúan las derivadas parciales en el punto (X1, X2, …,Xn)
La desigualdad es válida en casi todas las situaciones prácticas; en principio
puede fallar si algunas derivadas parciales de h son muy grandes.
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
45
Teorema Central del Límite
Se ha visto que la suma de un número finito n de variables aleatorias independientes que están
normalmente distribuidas es una variable aleatoria también normalmente distribuida. Esta
propiedad reproductiva no es exclusiva de la distribución normal. En efecto, por ejemplo, ya
vimos que existen variables aleatorias discretas que la cumplen, es el caso de la Poisson y la
Binomial.
En realidad, la propiedad que le da a la distribución normal el lugar privilegiado que ocupa entre
todas las distribuciones es el hecho de que la suma de un número muy grande, rigurosamente un
número infinito numerable, de variables aleatorias independientes con distribuciones arbitrarias
(no necesariamente normales) es una variable aleatoria que tiene, aproximadamente, una
distribución normal. Este es, esencialmente, el contenido del
Dem.) sin demostración
Observaciones:
1- Notar que nXEXESEn
i
i
n
i
in
11
y 2
11
nXVXVSVn
i
i
n
i
in
Por lo tanto 2
n
nSZ n
n
es la v.a. nS estandarizada
2- Notar que
n
XPz
n
n
n
nS
Pzn
nSP
n
n
22, por lo tanto también se puede
enunciar el Teorema central del límite de la siguiente forma
Teorema central del límite (T.C.L.):
Sean variables aleatorias independientes con y para todo
, es decir independientes idénticamente distribuidas
Sea la v.a. y sea .
Entonces , esto es
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
46
Donde
n
XZ n
es el promedio muestral estandarizado
3- Aunque en muchos casos el T.C.L. funciona bien para valores de n pequeños , en particular
donde la población es continua y simétrica, en otras situaciones se requieren valores de n más
grandes, dependiendo de la forma de la distribución de las iX . En muchos casos de interés
práctico, si 30n , la aproximación normal será satisfactoria sin importar cómo sea la forma de la
distribución de las iX . Si 30n , el T.C.L. funciona si la distribución de las iX no está muy
alejada de una distribución normal
4- Para interpretar el significado del T.C.L., se generan (por computadora) n valores de una v.a.
exponencial con parámetro 5.0 , y se calcula el promedio de esos n valores. Esto se repite
1000 veces, por lo tanto tenemos 1000 valores de la v.a. X .
Hacemos un histograma de frecuencias de X , esto es, tomamos un intervalo ),( ba donde
“caen” todos los valores de X , y lo subdividimos en intervalos más chicos de igual longitud. La
frecuencia de cada subintervalo es la cantidad de valores de X que caen en dicho subintervalo.
Se grafican estas frecuencias obteniéndose los gráficos siguientes que se pueden considerar una
aproximación a la verdadera distribución de X .
Se observa que a medida que aumenta el valor de n los gráficos se van haciendo más simétricos,
pareciéndose a la gráfica de una distribución normal.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
50
100
150
Sean variables aleatorias independientes con y para todo
, es decir independientes idénticamente distribuidas
Sea la v.a. promedio muestral y sea .
Entonces , esto es
n=2 n = 5
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
47
Ejemplos:
1- Supóngase que 30 instrumentos electrónicos D1, D2, ......,D30, se usan de la manera siguiente:
tan pronto como D1 falla empieza a actuar D2. Cuando D2 falla empieza a actuar D3, etc.
Supóngase que el tiempo de falla de Di es una v.a. distribuida exponencialmente con parámetro
= 0.1 por hora. Sea T el tiempo total de operación de los 30 instrumentos. ¿Cuál es la
probabilidad de que T exceda 350 horas?
Solución:
Si iX : “tiempo de falla del instrumento iD ” 30,...,2,1i
Entonces )1.0(~ ExpX i para 30,...,2,1i
El tiempo total de operación de los 30 instrumentos es
30
1i
iXT , donde
3001.0
130)(30)(
30
1
i
i
i XEXETE
30001.0
130)(30)(
2
30
1
i
i
i XVXVTV
Entonces por T.C.L. N(0,1)~3000
300T aproximadamente pues 30n
La probabilidad pedida es
18141.081859.019128.013000
3003501
3000
300350
3000
300)350(
TPTP
T.C.L.
2- Suponga que el consumo de calorías por día de una determinada persona es una v.a. con media
3000 calorías y desviación estándar de 230 calorías. ¿Cuál es la probabilidad de que el promedio
de consumo de calorías diario de dicha persona en el siguiente año (365 días) sea entre 2959 y
3050?
1 2 3 4 5 6 7 8 9 10 111213 14 1516 171819 202122
10
20
30
40
n = 15 n = 30
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
48
Solución:
Definimos las variables aleatorias
iX : “cantidad de calorías que una persona consume en el día i” 365,...,2,1i
Se sabe que 3000)( iXE y 2230)( iXV
Si
365
1365
1
i
iXX entonces 3000)( XE y 365
230)(
22
n
XV
La probabilidad pedida es
10140.315.4
365230
30002959
365230
30003050
365230
30003050
365230
3000
365230
3000295930502959
X
PXP
T.C.L.
Aplicaciones del Teorema central del límite
Aproximación normal a la distribución binomial
El Teorema central del límite se puede utilizar para aproximar las probabilidades de algunas
variables aleatorias discretas cuando es difícil calcular las probabilidades exactas para valores
grandes de los parámetros.
Supongamos que X tiene una distribución binomial con parámetros n y p. Para calcular )( kXP
debemos hacer la suma
k
i
iXPkXP0
)()( o recurrir a las tablas de la F.d.a. , pero para
valores de n grandes no existen tablas, por lo tanto habría que hacer el cálculo en forma directa y
muchas veces es laborioso.
Como una opción podemos considerar a X como suma de variables aleatorias más simples,
específicamente, si definimos
contrariocaso
éxitoocurrederepeticiónésimaílaensi
X i 0
1
ni ,...,2,1
entonces cada iX se la puede considerar ),1( pB , y además nXXX ,...,, 21 son independientes
Podemos escribir
n
i
in XXXXX1
21 ... y si n es grande entonces X tendrá
aproximadamente una distribución normal con parámetros np y )1( pnp , es decir
1,0
1.
.
2N
ppn
pnX
n
nXZn
si n es lo suficientemente grande
Observaciones:
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
49
1- La aproximación normal a la distribución binomial funciona bien aun cuando n no sea muy
grande si p no está demasiado cerca de cero o de uno. En particular la aproximación normal a la
binomial es buena si n es grande , 5np y 5)1( pn , pero es más efectivo aplicar esta
aproximación cuando 10np y 10)1( pn
2- Corrección por continuidad.
Acabamos de ver que si XB(n,p) entonces, para n suficientemente grande, podemos considerar
que aproximadamente es X pp.n,p.nN 1 . El problema que surge de inmediato si deseo
calcular, por ejemplo, la probabilidad de que kX (con k alguno de los valores posibles
0,1,2,…,n) es que la binomial es una distribución discreta y tiene sentido calcular probabilidades
como kXP mientras que la normal es una distribución continua y, en consecuencia,
0 kXP puesto que para una variable aleatoria continua la probabilidad de que ésta tome un
valor aislado es cero. Esto se resuelve si se considera
2
1
2
1kXkPkXP
También se puede usar esta corrección para mejorar la aproximación en otros casos,
específicamente en lugar de )( kXP calculamos
2
1)( kXPkXP
Y en lugar de
2
1)( kXPkXP
En los gráficos siguientes se muestra para diferentes valores de n y p cómo aproxima la
distribución ))1( ,( pnpnpN a la distribución ) ,( pnB
5 10 15 20 25
0.025
0.05
0.075
0.1
0.125
0.15
0.175
2 4 6 8 10 12 14
0.05
0.1
0.15
0.2
n = 25
p = 0.7
n = 15
p = 0.5
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
50
Ejemplos:
1- Sea X B(25,0.4). Hallar las probabilidades exactas de que 8X y 8X y comparar estos
resultados con los valores correspondientes encontrados por la aproximación normal.
Solución:
De la tabla de la F.d.a. de la binomial encontramos 274.0)8( XP
Y 120.0154.0274.0)7()8()8( XPXPXP
Ahora usamos la aproximación normal
2709.061.06.04.025
105.8
)1()5.8()8(
pnp
npXPXPXP
corrección por continuidad
Observar que el valor aproximado está muy cercano al valor exacto para 274.0)8( XP
1170.01593.02709.0
61.06
1002.1
6
105.8
6
10
6
105.75.85.7)8(
XP
XPXPXP
5 10 15 20
0.05
0.1
0.15
0.2
0.25
0.3
0.35
50 60 70 80 90 100
0.02
0.04
0.06
0.08
20 40 60 80 100 120 140
0.02
0.04
0.06
0.08
0.1
2 4 6 8 10
0.1
0.2
0.3
0.4
n =15
p = 0.9
n = 100
p = 0.7
n = 150
p = 0.1
n = 10
p = 0.1
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
51
Nuevamente este valor aproximado está muy cerca del valor real de 120.0)8( XP
2- Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de
especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chatarra).
Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que estén fuera
de especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada) de que X
sea
a) a lo sumo 30?
b) menos de 30?
c) entre 15 y 25 (inclusive)?
Solución:
Sea la v.a. X: “número de ejes fuera de especificaciones”
Entonces )1.0,200(~ BX , además 5201.0200 np y 5180)1.01(200)1( pn
Por lo tanto podemos aplicar la aproximación normal a la binomial
a) la probabilidad pedida es )30( XP
993244.0474.218
205.30
18
205.30
)1()5.30()30(
pnp
npXPXPXP
b) La probabilidad pedida es )30( XP
Al ser X una v.a. discreta con distribución binomial )29()30( XPXP
98745.02391.218
205.29)5.29()29(
XPXP
c)
80294.0190147.0212963.122963.12963.1
18
205.14
18
205.255.255.142515
XPXP
3- El gerente de un supermercado desea recabar información sobre la proporción de clientes a los
que no les agrada una nueva política respecto de la aceptación de cheques. ¿Cuántos clientes
tendría que incluir en una muestra si desea que la fracción de la muestra se desvíe a lo mas en 0.15
de la verdadera fracción, con probabilidad de 0.98?.
Solución:
Sea X: “número de clientes a los que no les agrada la nueva política de aceptación de cheques”
Entonces ),(~ pnBX donde p es desconocido y es la verdadera proporción de clientes a los
que no les agrada la nueva política de aceptación de cheques. El gerente tomará una muestra de n
clientes para “estimar” p con n
XX ya que
n
XX es la proporción de clientes a los que no les
agrada la nueva política de aceptación de cheques en la muestra de n clientes. Si no se toman a
todos los clientes, entonces n
XX no será igual a p.
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
52
La pregunta es cuál debe ser n para que n
XX se aleje del verdadero p en menos de 0.15 con
probabilidad 0.98 por lo menos, o sea para que 98.015.0 pXP
Entonces planteamos
)1(
15.0
)1()1(
15.015.015.015.0
pnp
n
pnp
npX
pnp
nPpXPpXP
T.C.L.
98.01)1(
15.02
)1(
15.0
)1(
15.0
pnp
n
pnp
n
pnp
n
Por lo tanto 99.02
198.0
)1(
15.0
pnp
n
Además nn
pp
n
pnp
n3.0
)5.01(5.0
15.0
)1(
15.0
)1(
15.0
Entonces debe cumplirse que 33.23.0 n o sea 3211.603.0
33.22
n
O sea se debe tomar una muestra de al menos 61 clientes
Aproximación normal a la distribución Poisson
Se puede probar aplicando Teorema central del límite que
Es decir para suficientemente grande )1,0(NX
En la práctica si 30 la aproximación es buena.
Observación: la demostración es sencilla si es igual a un número natural n pues, si
consideramos las variables aleatorias )1(~ PX i con ni ,...,2,1 independientes, entonces ya
sabemos que
n
i
n
i
i PX11
1~ , es decir )(~1
nPXn
i
i
Si entonces para suficientemente grande tiene aproximadamente distribución
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
53
Pero además por T.C.L. si n es grande
n
i
iX1
tiene aproximadamente distribución normal con
parámetros nnn 1 y nnn 12
O sea la distribución de
n
i
iX1
que es exactamente Poisson con parámetro n, se puede aproximar
con una ),( nnN , por lo tanto )1,0(Nn
nX
aproximadamente para valores de n suficientemente
grandes
En los gráficos siguientes se muestra para diferentes valores de cómo aproxima la distribución
) ,( N a la distribución )(P
Ejemplo:
El número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil tiene una
distribución de Poisson con parámetro = 50. ¿Cuál es la probabilidad aproximada de que:
a) entre 35 y 70 infracciones se expidan en un día en particular?
b) el número total de infracciones expedidas durante una semana de 5 días sea entre 225 y 275?
Solución:
Sea X: “número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil”
Entonces )(~ PX donde 50
Como 50 entonces )1,0(50
50N
X
(aproximadamente)
a) la probabilidad pedida es
9805.0017.0997599.0
12132.28284.250
5035
50
50707035
XP
b) Sea Y: “número total de infracciones expedidas durante una semana de 5 días”
Entonces )(~ PY donde 250550
La probabilidad pedida es
8859.0194295.0215811.12
5811.15811.1250
250225
250
250275275225
YP
20 40 60 80 100
0.01
0.02
0.03
0.04
0.05
5 10 15 20 25 30
0.05
0.1
0.15
0.2
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
54