43
VEB Tema 6 Apuntes de VEB página 1 de 43 TEMA 6 PROBABILIDAD. 1.1. Introducción. 1.2. Experimentos aleatorios Espacio muestral. 1.3. Sucesos. Tipos de sucesos. 1.4 Operaciones con sucesos. 1.5. Algebra de Boole de sucesos.. 1.6. Definición de Probabilidad. Propiedades. 1.7 regla de Laplace 1.8 Probabilidad condicionada. Sucesos dependientes e independientes 1.9 Probabilidad Total 1.10 Teorema de Bayes 1.11 Tablas de Contingencia 1.12 Aplicaciones del teorema de Bayes 1.13 Prevalencia 1.14 Pruebas diagnósticas: Sensibilidad y especificidad 1.1 Introducción Hasta ahora hemos estudiado la estadística descriptiva: conjunto de técnicas utilizadas para resumir y describir de forma clara la información contenida en un conjunto de datos. En contraste con la estadística descriptiva la inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto. Conceptos: Población popular : Una población se define como un conjunto de individuos u objetos que presentan una característica común. Población estadística : población formada por características de individuos u objetos . Ejemplos: población de personas que habitan en Madrid cuya prueba de hepatitis C resulto positiva, población de las presiones sanguíneas de los estudiantes de la complutense. Muestra : subconjunto de una población Parámetro : cualquier resumen de los elementos de una población. Ejemplo: la media y la desviación típica ( , ) Estadístico : cualquier resumen de los elementos de una muestra. Ejemplo: la media y la desviación típica( , x s ) La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver algunos problemas relacionados con los juegos de azar.Aunque algunos marcan sus inicios cuando Cardano (jugador donde los haya) escribió sobre 1520 El Libro de los Juegos de Azar (aunque no fue publicado hasta más de un siglo después, sobre 1660) no es hasta dicha fecha que comienza a elaborarse una teoría aceptable sobre los juegos. Diversos restos arqueológicos ponen de manifiesto que es desde muy antiguo la fascinación que el hombre sintió por el juego. Astrágalos, dados, cartas, etc. es un ejemplo de ello y, en la actualidad, PDF created with pdfFactory Pro trial version www.pdffactory.com

Tema6-probabilidad

Embed Size (px)

Citation preview

Page 1: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 1 de 43

TEMA 6 PROBABILIDAD.

1.1. Introducción. 1.2. Experimentos aleatorios Espacio muestral. 1.3. Sucesos. Tipos de sucesos. 1.4 Operaciones con sucesos. 1.5. Algebra de Boole de sucesos.. 1.6. Definición de Probabilidad. Propiedades. 1.7 regla de Laplace 1.8 Probabilidad condicionada. Sucesos dependientes e independientes 1.9 Probabilidad Total 1.10 Teorema de Bayes 1.11 Tablas de Contingencia 1.12 Aplicaciones del teorema de Bayes 1.13 Prevalencia 1.14 Pruebas diagnósticas: Sensibilidad y especificidad

1.1 Introducción Hasta ahora hemos estudiado la estadística descriptiva: conjunto de técnicas utilizadas para resumir y describir de forma clara la información contenida en un conjunto de datos. En contraste con la estadística descriptiva la inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto. Conceptos: Población popular: Una población se define como un conjunto de individuos u objetos que presentan una característica común. Población estadística : población formada por características de individuos u objetos . Ejemplos: población de personas que habitan en Madrid cuya prueba de hepatitis C resulto positiva, población de las presiones sanguíneas de los estudiantes de la complutense. Muestra: subconjunto de una población Parámetro: cualquier resumen de los elementos de una población. Ejemplo: la media y la desviación típica ( , ) Estadístico: cualquier resumen de los elementos de una muestra. Ejemplo: la media y la desviación típica( ,x s ) La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver algunos problemas relacionados con los juegos de azar.Aunque algunos marcan sus inicios cuando Cardano (jugador donde los haya) escribió sobre 1520 El Libro de los Juegos de Azar (aunque no fue publicado hasta más de un siglo después, sobre 1660) no es hasta dicha fecha que comienza a elaborarse una teoría aceptable sobre los juegos. Diversos restos arqueológicos ponen de manifiesto que es desde muy antiguo la fascinación que el hombre sintió por el juego. Astrágalos, dados, cartas, etc. es un ejemplo de ello y, en la actualidad,

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 2: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 2 de 43

ruletas, máquinas tragaperras, loterías, quinielas, etc, etc, nos indican que dicha fascinación continúa. Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el caballero De Méré (Un problema histórico: Se lanzan 24 veces un par de dados y el problema es decidir si era lo mismo apostar a favor o en contra de la aparición de por lo menos un doble seis.) y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar. Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como una forma de matemática. A principios del siglo XX el matemático ruso A. Kolmogorov la definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad es parte de una teoría más amplia como es la teoría de la medida. El objetivo de este tema no es aprender probabilidad sino probabilidad en relación con la estadística inferencial. Así que, después de estudiar algunos �conceptos basicos�, estudiaremos la probabilidad en su relación con las tablas de contingencia y la curva normal 1.2 Definiciones de experimento aleatorio y espacio muestral Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de altura, velocidad, etc., sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc. Es una experiencia determinista. Si echamos un dado sobre una mesa, ignoramos qué cara quedará arriba. El resultado depende del azar. Es una experiencia aleatoria.

La vida cotidiana está plagada de sucesos aleatorios. Muchos de ellos, de tipo sociológico (viajes, accidentes, número de personas que acudirán a un gran almacén o que se matricularán en una carrera...) aunque son suma de muchas decisiones individuales, pueden ser estudiados, muy ventajosamente, como aleatorios

Experimentos o fenómenos aleatorios son los que pueden dar lugar a varios resultados, sin que pueda ser previsible enunciar con certeza cuál de éstos va a ser observado en la realización del experimento.

A la colección de resultados que se obtiene en los experimentos aleatorios se le llama espacio muestral.

Espacio muestral es el conjunto formado por todos los posibles resultados de un experimento aleatorio. En adelante lo designaremos por E

Ejemplos: En un dado, E={1,2,3,4,5,6} En una moneda, E={C,+} Ejercicios resueltos: 1.El espacio muestral asociado al experimento de lanzar una moneda y anotar el resultado de la cara superior es E = {C,X} 2. El experimento consiste en lanzar dos monedad sobre una mesa y anotar los resultados de las caras superiores tiene por espacio muestral el siguiente: E = {CC,CX, XC,XX}

Una forma sencilla de obtener en estos casos el espacio muestral es mediante un diagrama de árbol , como se indica a la derecha.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 3: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 3 de 43

3. Describe el espacio muestral asociado a cada uno de los siguientes experimentos aleatorios:

a. Lanzar tres monedas.

b. Lanzar tres dados y anotar la suma de los puntos obtenidos.

c. Extracción de dos bolas de una urna que contiene cuatro bolas blancas y tres negras.

d. El tiempo, con relación a la lluvia, que hará durante tres días consecutivos.

Solución:

a. Llamando C a obtener cara y X a la obtención de cruz, obtenemos el siguiente espacio muestral:

E={(CCC),(CCX),(CXC),(XCC),(CXX),(XCX),(XXC),(XXX)}

b. E={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18}

e. Llamando B a sacar bola blanca y N a sacar bola negra, tenemos:

E={BB,BN,NN}

c. Si llamamos L al día lluvioso y N al día sin lluvia, para tres días consecutivos se obtiene el siguiente espacio muestral:

E={(LLL),(LLN),(LNL),(NLL),(LNN),(NLN),(NNL),(NNN)}

1.3. Sucesos. Tipos de Sucesos. Por ejemplo, para el espacio muestral asociado al experimento aleatorio �lanzar 3 dados y sumar su puntuación� E={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18} Podemos considerar algunos subconjuntos de E como:

± Salir multiplo de 5 A={5,10,15} ± Salir numero primo B={3,5,7,11,13,17} ± Salir mayor o igual que 12 C={12,13,14,15,16,17}

A todos los subconjuntos contenidos en E los denominaremos sucesos

Suceso de un experimento aleatorio es cada uno de los subconjuntos del espacio muestral E.

Los elementos de E se llaman sucesos individuales o sucesos elementales.

También son sucesos el suceso vacío o suceso imposible , Ø, y el propio E, suceso seguro.

Al conjunto de todos los sucesos de una experiencia aleatoria lo llamaremos espacio de sucesos S.

Si E tiene un número finito, n, de elementos, el número de sucesos de E es 2n.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 4: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 4 de 43

Ejemplos:   {1,2},{2,4,6},{3,5} son sucesos. {1},{2}, {3}..., son sucesos individuales.

  En un dado hay 26 = 64 sucesos.

En una moneda hay 22 = 4 sucesos, que son: Ø, {C},{+}, {C,+} Es decir, S={Ø,{C},{+},{C,+}}

Ejercicio Se considera el sexo de los hijos de las familias de tres hijos. Sea A el suceso el hijo mayor es una hembra, y B el suceso los dos hijos pequeños son varones. ¿Cuáles son los elementos de A y B? Solución: Llamando V a ser varón y H a ser hembra, el espacio muestral está formado por los sucesos elementales:

E={(VVV),(VVH),(VHV),(HVV),(VHH),(HVH),(HHV),(HHH)} Y los sucesos A y B son compuestos y están formados por los siguientes sucesos elementales:

A={(HHH),(HHV),(HVH),(HVV)}

B={(VVV),(HVV)} Tipos de sucesos

± Sucesos elementales: son los que estan formados por un solo resultado del experimento

± Sucesos compuestos: son los que estan formados por dos o mas resultados del experimento, es decir, por dos o más sucesos elementales

± Sucesos seguro: es el que se verifica al realizar el experimento aleatorio, está formado por todos los resultados posibles del experimento aleatorio, y por tanto, coincide con el espacio muestral E.

± Suceso imposible: es el que nunca se verifica. Se representa con el símbolo del espacio vacío

± Suceso contrario: Dado un suceso cualquiera A del espacio de sucesos S, se llama suceso contrario del suceso A a un suceso que se realiza cuando no se realiza A, y recíprocamente

Ejemplos de Sucesos contrarios: Consideremos el espacio muestral asociado al lanzamiento del dado, E = {1,2,3,4,5,6}, y los siguientes sucesos: A ="salir número impar" = {1,3,5}

= "salir número par" ={2,4,6} Los sucesos A y son contrarios , ya que si se realiza A no se realiza y si se realiza no se realiza A.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 5: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 5 de 43

1.4 Operaciones con sucesos. Dados dos sucesos, A y B, se llaman:

  Unión de dos sucesos A, B es el suceso que se verifica si se verifica A o se verifica B o ambos. La unión de los sucesos A y B la designaremos por (A U B)

  Intersección de dos sucesos A, B es el suceso que se verifica si se verifica A y se verifica B. La intersección de los sucesos A y B la designaremos por (A B)

  Diferencia de dos sucesos A, B es el suceso que se realiza cuando se reazliza A y no B. La diferencia de los sucesos A y B la designaremos por

  A - B = (A y Bc )

Igualmente podemos considerar la diferencia B - A

Inclusión de sucesos : Un suceso A está incluido ( contenido) en otro B si todo suceso elemental de A pertenece tambien a B. se representa por A B También se dice que A implica B. Por ejemplo, en el experimento de lanzar un dado el suceso A6="Sacar un cinco" está incluido en el suceso A1="Sacar impar".

Unión

A B es el suceso formado por todos los elementos de A y todos los elementos de B.

Intersección

A B es el suceso formado por todos los elementos que son, a la vez, de A y de B.

Diferencia

A-B es el suceso formado por todos los elementos de A que no son de B.

Suceso contrario

El suceso A=E-A se llama suceso contrario de A.

inclusion

El suceso A está �incluido� en B A B A B

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 6: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 6 de 43

Dos sucesos A y B, se llaman incompatibles cuando no tienen ningún elemento común. Es decir, cuando A B (A y B son disjuntos)

Ejemplos: 1) Lanzamos un dado y consideramos los sucesos

A = {´´obtener número par´´} = {2, 4, 6} B = {´´obtener múltiplo de 3´´} = {3, 6}

2) Se lanza una moneda tres veces y se consideran los sucesos A = {´´salen al menos dos cruces´´} = {c++, +c+, ++c, +++} B = {´´sale alguna cara´´} = {ccc, cc+, c+c, c++, +cc, +c+, ++c}

Unión (A B) = {´´salen al menos dos cruces o sale alguna cara´´} = {+++, c++, +c+, ++c, ccc, cc+, c+c, +cc}

Intersección (A B) = {´´salen al menos dos cruces y sale alguna cara´´} = {c++, +c+, ++c}

Diferencias A - B = (A Bc ) = {´´salen al menos dos cruces y no sale alguna cara´´} B - A = (B Ac ) = {´´sale alguna cara y no salen al menos dos cruces´´}

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 7: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 7 de 43

Algunas consideraciones básicas con sucesos que serán útiles para la resolución de problemas

Si A es un suceso de un determinado experimento aleatorio cuyo espacio muestral es E, entonces A y su complementario son incompatibles, es decir

(A Ac ) = Ø Además (A o Ac ) = E Si lanzamos un dado y A es el suceso A = {´´obtener múltiplo de 3´´} = {3, 6} entonces Ac = {´´no obtener múltiplo de 3´´} = {1, 2, 4, 5} por lo que

(A Ac ) = {1, 2, 3, 4, 5, 6} = E y (A Ac ) = Ø

no es cierto, es decir dos sucesos incompatibles no tienen por qué ser complementarios. Por ejemplo, los sucesos A = {´´obtener múltiplo de 3´´} = {3, 6} y B = {´´obtener múltiplo de 5´´} = {5} son incompatibles pero no complementarios.

sean incompatibles los sucesos (A - B), (B - A) y (A B) son incompatibles Además podemos expresar tanto A como B como unión de dos sucesos incompatibles

A = (A - B) o (A y B) B = (B - A) o (A y B)

También podemos expresar el suceso (A o B) como unión de tres sucesos incompatibles

(A B) = (A - B) (A B) (B - A)

Consideremos el experimento aleatorio consistente en lanzar tres monedas y los sucesos A = {´´salen al menos dos cruces´´} = {c++, +c+, ++c, +++}

B = {´´salen dos cruces´´} = {c++, +c+, ++c} El suceso B es un subconjunto del suceso A. Si se verifica A necesariamente se verifica B. En este sentido, diremos que el suceso B está contenido en el suceso A. Leyes de De Morgan Dos propiedades importantes que, a veces, resultan útiles en la resolución de problemas son las siguientes:

1. El complementario de la unión de dos sucesos es la intersección de los complementarios de dichos sucesos

(A B)c = Ac Bc

2. El complementario de la interseción de dos sucesos es la unión de los complementarios de dichos sucesos

(A B)c = Ac Bc

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 8: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 8 de 43

1.5 Algebra de Boole de sucesos Las operaciones unión, intersección y complementación (contrario) verifican las propiedades:

Unión Intersección 1. Conmutativa A B B A A B B A 2. Asociativa ( ) ( )A B C A B C ( ) ( )A B C A B C

3. Idempotente A A A A A A 4. Simplificación ( )A B A A ( )A B A A

5. Distributiva ( ) ( ) ( )A B C A B A C ( ) ( ) ( )A B C A B A C

6. Elemento neutro A A A E A 7. Absorción A E E A 1.6 Definición de Probabilidad. Propiedades Definición de probabilidad Comenzaremos con un ejemplo: Supongamos que hay cuatro bolas en una caja, tres son negras y una es blanca. Metemos la mano sin mirar (selección al azar) y extraemos una bola: Ahora nos hacemos la pregunta ¿ Cual es la probabilidad de que la bola extraída sea negra?. Sospechamos que la respuesta seria algo así como � tres de cuatro� o �tres cuartos� o �cero coma setenta y cinco� ¿Qué definición de probabilidad hemos utilizado para llegar a esta respuesta? Si reflexionamos un poco nos daremos cuenta que la probabilidad de extraer una bola negra es el nº de bolas negras dividido por el nº total de bolas. Formalmente podemos definir la probabilidad de un suceso A como : P(A)= NA/N NA= nº de sucesos que cumplen un criterio determinado N= nº total de sucesos Se utiliza el símbolo A Aco para referirse al complementario(opuesto) de A. Así en el caso anterior P(A) o P(A )c se leería � probabilidad de no sacar una bola negra� Sea un determinado experimento aleatorio cuyo espacio muestral es E y P(E) el espacio de sucesos del mismo. Sea p la aplicación con dominio en P(E) e imagen en R

: ( )( )

p P EA p A

con las siguientes condiciones

Axioma AI A P(E) se cumple 0 p(A) 1 Axioma AII P(Suceso seguro) = 1

Axioma AIII Si A y B son dos sucesos incompatibles del experimento aleatorio, (A y B) = Ø, entonces p(A o B) = p(A) + p(B)

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 9: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 9 de 43

Propiedad 1 P(Suceso imposible) = 0 es decir p(Ø) = 0

Propiedad 2

La probabilidad de un suceso más la probabilidad de su complementario es la unidad. p(A) + p(no A) = 1 En el experimento aleatorio consistente en lanzar dos monedas los sucesos {´´obtener al menos una cara´´} y {´´no obtener ninguna cara´´} son complementarios por lo que p({´´obtener al menos una cara´´}) + p({´´no obtener ninguna cara´´}) = 1

Propiedad 3

Si el suceso B está contenido en A entonces P(A - B) = p(A) - p(B)

Propiedad 4

Dados dos sucesos cualesquiera (no necesariamente incompatibles) se verifica p(A o B) = p(A) + p(B) - p(A y B) Una propiedad bastante "lógica" pues si sumamos el valor de la probabilidad de A y el valor de la probabilidad de B habremos de restar una vez el valor de la intersección, pues el valor de (A y B) lo habrímos

sumados dos veces. Si los sucesos son incompatibles, es decir (A y B) = Ø, entonces p(A y B) = 0 luego nos quedaría p(A o B) = p(A) + p(B)

1.7 Regla de Laplace

Supongamos el experimento aleatorio consistente en lanzar una dado e intentemos calcular la probabilidad del suceso A ={"obtener número primo"}

E = A 1 o A 2 o A 3 o A 4 o A 5 o A 6

El espacio muestral de dicho experimento aleatorio es E = {A 1, A 2, A 3, A 4, A 5, A 6} en donde A i designa obtener el valor i. Como estos sucesos son incompatibles entre sí (sólo podemos obtener un resultado al lanzar el dado) y todos tienen la misma probabilidad de salir (estamos suponiendo un dado honesto) designemos por k la probabilidad de uno cualesquiera de ellos.

Tendremos: p(E) = 1 = p(A 1) + p(A 2) + p(A 3) + p(A 4) + p(A 5) + p(A 6) = 6 × k de donde k = 1/6 y p(A1) = p(A2) = p(A3) = p(A4) = p(A5) = p(A6) = k = 1/6

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 10: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 10 de 43

Consideramos ahora el suceso A ={"obtener número primo"} = A 2 o A 3 o A 5. Su probabilidad es P(A) = p(A 2 o A 3 o A 5) = p(A 2) + p(A 3) + p(A 5) =

= 3 × 1/6 = 1/2 Es decir tres sucesos elementales que son favorables a la aparición de número primo entre los seis posibles del espacio muestral E. Esta regla puede generalizarse muy fácilmente a n sucesos elementales equiprobables del espacio muestral y se obtiene la denominada Regla de Laplace o Ley de Laplace. La probabilidad de un suceso A es igual a

nº de casos favorablesp(A)=nºde casos posibles

Ejemplo 1

En el experimento aleatorio del lanzamiento de dos dados, consideramos el suceso ´´la suma obtenida sea 7´´ S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}

Los 36 elementos del espacio muestral son igualmente probables. Como el suceso S está compuesto por 6 de estos elementos, aplicando la regla de Laplace resulta p(S) = casos favorables / casos posibles == 6/36 = 1/6 = 0,1667

Ejemplo 2 Se lanza una moneda tres veces. Calcular la probabilidad de los sucesos

El espacio muestral es, como ya sabemos, E = {CCC, CC+, C+C, C++, +CC, +C+, ++C, +++} Todos estos sucesos elementales son igualmente probables e incompatibles dos a dos

E = A 1 o A 2 o A 3 o A 4 o A 5 o A 6A = A 2 o A 3 o A 5

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 11: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 11 de 43

Suceso A Podemos asignar a cada suceso elemental del espacio muestral la probabilidad 1/8Como A = {CCC, CC+, C+C, C++, +CC, +C+, ++C} tendremos p(A) = p(CCC) + p(CC+) + p(C+C) + p(C++) + p(+CC) + p(+C+) + p(++C) == 7 × 1/8 = 7/8 = 0,875 El suceso contrario de A es (no A) = {"No obtener ninguna cara"} = {+++}. Como p(A) + p((no A)) = 1 tendremos p(no A) = 1 - 0,8750 = 0,125 Suceso B

Como B = {CC+, C+C, +CC} tendremos p(B) = p(CC+) + p(C+C) + p(+CC) = 3 × 1/8 = 0,375 ya que a cada suceso elemental del espacio muestral se le ha asignado la probabilidad 1/8 Suceso C

Como C = {C++, +C+, ++C, +++} tendremos p(C) = p(C++) + p(+C+) + p(++C) + p(+++) = 4 ×1/8 = 0,5 ya que a cada suceso elemental del espacio muestral se le ha asignado la probabilidad 1/8

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 12: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 12 de 43

Ejercicio

Leyendo la prensa En Villa Horacia existen dos periódicos A y B. El 50% de sus habitantes son lectores del Diario A y el 30% del Diario B. Un 20% de ciudadanos leen ambos periódicos. Se elige un ciudadano al azar. Calcular la probabilidad de que dicho ciudadano:

sea lector de algún diario. Lea sólo el Diario A No lea la prensa. Lea sólo uno de los diarios.

Sean los sucesos A={"El ciudadano elegido lee el diario A"}" y B={"El ciudadano elegido lee el diario B}". Además los sucesos A y B no son incompatibles (es decir, existen ciudadanos que leen ambos periódicos: p(A y B) = 0,20).

Ser lector de algún diario. Podemos expresar el suceso pedido como (A o B) y puesto que ambos sucesos no son incompatibles, resulta

p(A o B) = p(A) + p(B) - p(A y B) = 0,5 + 0,3 - 0,2 = 0,6 (Es decir, el 60% de los habitantes de Villa Horacia es lector de algún diario A o B)

Leer sólo el Diario A Dicho suceso es A - B; como podemos expresar A como unión de los sucesos A - B y (A y B) (incompatibles) y por tanto p(A) = p(A - B) + p(A y B) por lo que p(A - B) = p(A) - p(A y B) = 0,5 - 0,2 = 0,3 (El 30% de los habitantes de Villa Horacia sólo leen el Diario A. ¿Cuántos habitantes de Villa Horacia leen sólo el Diario B?)

No leer la prensa Como la probabilidad de un suceso y de su complementario suman 1 y los sucesos "leer algún diario" y " no leer la prensa" son complementarios resulta

p("no leer la prensa") = 1 - p("leer algún diario") = 1 - 0,6 = 0,4 Leer sólo uno de los diarios

Podemos expresar dicho suceso por (A - B) o (B - A) ambos incompatibles. p((A - B) o (B - A)) = p(A - B) + p(B - A) = p(A) - p(A y B) + p(B) - p(A y B)

= p(A) + p(B) - 2 × p(A y B) = 0,4

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 13: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 13 de 43

Maneras de visualizar sucesos :

TABLAS DE CONTINGENCIA

DIAGRAMAS EN ARBOL

1.8. Probabilidad Condicionada. Sucersos dependientes e independientes En el calculo de probabilidades de algunos sucesos, el valor de dichas probabilidades varia en función del conocimiento de determinadas informaciones relativas a estos sucesos. Veamos algunos ejemplos.

ejemplo1 En la tabla de la izquierda podemos observar la distribución en grupos sanguíneos (O, A, B, AB) y el factor Rhesus( Rh+, Rh-) de la sangre de la población española. Elegido un individuo al azar :

  La probabilidad de que su sangre sea del grupo B es del 0,07 (7/100)   La probabilidad de que sean Rh+ es del 81%

  Si tienen el grupo B, la probabilidad de ser Rh+ es 4P(Rh+/B)= 0,577

ã

  Si tiene Rh+ la probabilidad de pertenecer al B es 4P(B/Rh+)= 0,04981

ã

  Los sucesos Rh+/B y B/Rh+ se leen �Rh+ condicionado a B� y �B condicionado a Rh+� . Estas situaciones nos conducen al concepto de Probabilidad condicionada

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 14: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 14 de 43

ejemplo2

Si lanzamos un dado y consideramos los sucesos B = {"Obtener puntuación inferior a 5"} y A = {"Obtener puntuación par"} la probabilidad de cada uno de ellos es, como sabemos, p(B) = 4/6 y p(A) = 1/2 ya que el espacio muestral del experimento aleatorio considerado es E = {1, 2, 3, 4, 5, 6} y los casos favorables son, respectivamente, B = {1, 2, 3, 4} y A = {2, 4, 6} sin embargo la probabilidad del suceso {"Obtener par en el supuesto que se ha obtenido una puntuación inferior a 5"} es 2/4 puesto que el espacio muestral de dicho experimento aleatorio es E = {1, 2, 3, 4}=B y los casos favorables son 2 y 4. Dicho suceso se representa, generalmente como A/B que se lee "el suceso A está condicionado por el suceso B" y para determinar la probabilidad de dicho suceso hemos de considerar como espacio muestral del mismo al suceso B. Con dicha notación podemos escribir, para el ejemplo considerado, que p(A/B) = 2/4

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 15: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 15 de 43

ejemplo 3 Se ha realizado una encuesta sobre el fenómeno de la violencia en los medios de comunicación y la información obtenida queda recogida en la siguiente tabla Dicha tabla se denomina tabla de contingencia de frecuencias y a partir de ella se puede obtener abundante información.

Elegido un encuestado al azar, la probabilidad de que haya dicho (S)í es p(S) = 418/600, de que haya dicho (N)o p(N) = 140/600 y la probabilidad de (N)s/(N)c es p(NN) = 42/600 Igualmente podemos determinar la probabilidad de que hayamos elegido un (H)ombre p(H) = 280/600 o de una mujer p(M) = 320/600

La probabilidad del suceso (H y S) = {"Hombres que han dicho sí"} es p(H y S) = 162/600. Dicho suceso no es lo mismo que el suceso

H/S = {"Seleccionar un hombre entre los que han dicho sí"} ni

S/H = {"Seleccionar respuesta afirmativa entre los hombres"} cuyas probabilidades respectivas son

Seleccionar un hombre entre

los que han dicho sí p(H/S) = 162/418 1

Seleccionar respuesta afirmativa entre los hombres

P(S/H) = 162/280 2

A partir de 1 podemos escribir

y análogamente a partir de 2

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 16: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 16 de 43

Se llama probabilidad de A condicionada a B, o probabilidad de A sabiendo que pasa B:

Error frecuentíiiiiiisimo:

No confundáis probabilidad condicionada con intersección. En ambos medimos efectivamente la intersección, pero�

En P(A B) con respecto a P(E)=1 En P(A|B) con respecto a P(B)

Resumiendo

Dados dos sucesos A y B podemos calcular la probabilidad p(A/B) teniendo en cuenta que el número de casos favorables vendría dado por el suceso (A y B) y que el número de casos posibles vendría dado por el suceso B. Es decir, como si B fuese el nuevo espacio muestral.

Llamamos probabilidad condicionada del suceso A respecto del ( condicionado al) suceso

B, y lo denotamos por P(A/B) al cociente: P(A B)P(A/B)=P(B)

Llamamos probabilidad condicionada del suceso B respecto del ( condicionado al) suceso

A, y lo denotamos por P(B/A) al cociente: P(A B)P(B/A)=P(A)

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 17: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 17 de 43

Probabilidad compuesta o del Producto

Si en las expresiones anteriores despejamos ( )P A B obtenemos:

cualquiera de estas dos expresiones recibe el nombre de probabilidad compuesta o del producto

Probabilidad condicionada e independencia de sucesos. Suceso dependientes e independientes El conocimiento de que ha ocurrido el suceso A modifica, en algunos ocasiones, la probabilidad del suceso B, pero en otras NO. Los sucesos en los que, conociendo que uno ha ocurrido no se modifica la probabilidad del otro, decimos que son independientes y, si se modifica, decimos que son dependientes entre sí.

Decimos que dos sucesos A y B son independientes si la ocurrencia de uno de ellos no modifica la probabilidad del otro:

P(B/A)=P(B) o P(A/B)=P(A)

Esto equivale a:

independientA y B son P(A B)=P(A)·es P(B)

Dos sucesos que no son independientes son ( obviamente) dependientes

Decimos que dos sucesos A y B son dependientes si la ocurrencia de uno de ellos modifica la probabilidad del otro:

P(B/A) P(B) o P(A/B) P(A)

Esto equivale a:

dependienteA y B son P(A B) P(A)· (B)s P

Si dos sucesos A y B son independientes p(A y B) = p(A) p(B) y recíprocamente

Otro ejemplo

Una urna tiene tres bolas azules y tres bolas rojas. Se extraen, con reemplazamiento, dos bolas. Consideramos los sucesos M = {La primera bola extraída es azul} y N = {Al menos una bola extraída es azul}. Vamos a ver si dichos sucesos son independientes o no. El espacio muestral es el conjunto E = {AA, AR, RA, RR} y los sucesos M y N son

M = {AA, AR} N = {AA, AR, RA} por lo que p(M) = 2/4 y p(N) = 3/4 Como (M y N) = {AA, AR} (en el gráfico puede observarse que M está contenido en N) resulta p(M y N) = 2/4

P(A B)=P(A)·P(B/A)P(A B)=P(B)·P(A/B)

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 18: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 18 de 43

Como p(M y N) p(M)×p(N) los sucesos M y N no son independientes

La probabilidad del suceso M/N = {La primera bola es azul en el supuesto que al menos una es azul} es

(Y sólo tienes que observar el dibujo para convencerte de ello :-)) Por otra parte, la probabilidad del suceso N/M = {Al menos una bola es azul en el supuesto que la primera es azul} es, evidentemente ...

¡el suceso seguro! (¿Lógico no?) Para el lector interesado: ¿qué pasaría si la extracción de bolas fuese sin reemplazamiento?

Uno más

Supongamos la urna anterior, pero en ella hay tres bolas rojas y dos azules. Extraemos, sin reemplazamiento dos bolas y nuevamente consideramos los sucesos M = {La primera bola extraída es azul} y N = {Al menos una bola extraída es azul}. Al no devolver la bola a la urna la probabilidad de la siguiente extracción dependerá de la bola que hayamos sacado en primer lugar. El siguiente diagrama de árbol da una idea de la situación

y los sucesos M y N son

M = { A 1 y R 2, A 1 y A 2 } N = { A 1 y R 2, A 1 y A 2, R 1 y A 2 } Por lo tanto

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 19: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 19 de 43

p(M) = p(A 1 y R 2) + p(A 1 y A 2) = = p(A 1)×p(R 2 / A 1) + p(A 1)× p(A 2 / A 1) =

= 2/5 × 3/4 + 2/5 × 1/4 = 2/5 p(N) = p(A 1 y R 2) + p(A 1 y A 2) + p(R 1 y A 2) =

= p(A 1)×p(R 2 / A 1) + p(A 1)× p(A 2 / A 1) + p(R 1)× p(A 2 / R 1) = = 2/5 × 3/4 + 2/5 × 1/4 + 3/5 × 2/4 = 7/10

En resumen p(M) × p(N) = 7/25 que es distinto de p(M y N) = 2/5 por lo que los sucesos M y N son dependientes.

La probabilidad de los sucesos condicionados M/N y N/M viene dada por

Experimentos Compuestos

ejemplo

Se considera el experimento aleatorio de lanzar una moneda y un dado con sus caras numeradas del uno al seis: Hallar la probabilidad de obtener cara y cuatro Se observa que en realidad este experimento aleatorio está formado por dos experimentos: lanzamiento de una moneda y el de un dado Los sucesos posibles en el primer experimento son C ( cara) y X (cruz). En el segundo experimento se lanza un dado y los sucesos posibles son {1,2,3,4,5,6} El espacio muestral asociado a este experimento es E:{C1,C2,C3,C4,C5,C6,X1,X2,X3,X4,X5,X6) que se peude obtener mediante el diagrama en árbol La probabilidad a calcular será la del suceso C4 que sería 1/12 Considerando dos experimentos independientes

1 1 1P(C 4) = P(C)·P(4) = · =2 6 12

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 20: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 20 de 43

Ejemplo En una urna hay 10 bolas numeradas del 1 al 10. Se extrae una, se anota su número y no se devuelve a la urna. Se extrae otra y también se anota su numero. Calcula la probabilidad de extraer dos bolas pares

P1= �el primer número es par�

P2= � el segundo número es par� Dado que la 1ª bola se extrae sin reemplazamiento esto afectara al segundo experimento y serán sucesos dependientes. La resolución se plantea en la figura Podríamos haberlo resuelto de la forma tradicional:

Casos posibles (espacio muestral) 210

10! 10·9 90(10 2)!

V ã ã ã�

Casos favorables 25

5! 5·4 20(5 2)!

V ã ã ã�

P(los dos sean pares) = 20 290 9

ã resultado que coincide con el anterior

Nota: Si la 1ª bola fuera devuelta a la urna, este hecho haría que fueran sucesos independientes Y ahora resolvámoslo utilizado las reglas de la multiplicación y la independencia

Al ser independientes 1 2 1 25 5 25 1( ) ( )· ( ) ·

10 10 100 4P P P P P P P

Resolviéndolo de la forma tradicional serían : 2 252 2

10

5 1P(las dos pares)=10 4

VRVR

ã ã

Los experimentos formados por varios experimentos simples se llaman experimentos compuestos

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 21: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 21 de 43

1.9. Probabilidad Total ¿Cómo se puede calcular la Probabilidad de un suceso B en función de una suma de probabilidades condicionadas? Previamente debemos definir un sistema completo de sucesos: A1, A2, A3�An que cumplen:

  Son incompatibles dos a dos A Ai j

  La unión de todos ellos es el suceso seguro 1

An

ii

ã

Sea un suceso B �incrustado� dentro del sistema completo de sucesos Ai sabemos que la probabilidad condicionada de B habiéndose cumplido un A cualquiera es

P(B A)P(B/A)= P(A)

Luego, despejando la intersección P(B A) P(B/A)·P(A)

Calculemos la intersección de B con cada Ai , la suma de todas ellas nos dará P(B)

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 22: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 22 de 43

ejemplo

Una compañía dedicada al transporte público explota 3 líneas de una ciudad, de forma que el 60% de los autobuses cubre el servicio de la 1ra línea, el 30% cubre la 2da y el 10% cubre el servicio de la 3ra línea. Se sabe que la probabilidad de que, diariamente, un autobús se averíe es del 2%, 4%y 1% respectivamente para cada línea. Determine la probabilidad de que 1 día el autobús sufra una avería.

L1 = 60 % Av1 = 2 %

L2 = 30 % Av2 = 4 %

L3 = 10 % Av3 = 1 %

P (Av) = p (L1) * P(AV/L1) + P(L2) *P(Av/2) + P(L3) * P(Av/L3)

P (Av) = (0.6) (0.02) + (0.3) (0.04) + (0.1) (0.01) = 0.02 + 0.012 +0.001=0,025

Resolver Una empresa del ramo de la alimentación elabora sus productos en cuatro factorías: F1, F2, F3 y F4. El porcentaje de producción total que se fabrica en cada factoría es del 40%, 30%, 20% y 10%, respectivamente, y además el porcentaje de envasado incorrecto en cada factoría es del 1%, 2%, 7% y 4%. Tomamos un producto de la empresa al azar. ¿Cuál es la probabilidad de que se encuentre defectuosamente envasado?

Sugerencia: D:�el envasado es defectuoso� ; :�el producto se elabora en la factoría F1� ( y de forma análoga para el resto de las factorías)

Ejemplo Se tiene una urna vacía y se lanza una moneda al aire. Si sale cara, se introduce en la urna una bola blanca y si sale cruz, se introduce una bola negra. El experimento se repite tres veces y, a continuación, se introduce la mano en la urna, retirando una bola. ¿Cuál es la probabilidad de que en la urna queden una bola blanca y otra negra?

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 23: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 23 de 43

Solución: Llamamos B = "obtener bola blanca" y N = "obtener bola negra". En el diagrama de árbol pueden verse las configuraciones posibles de las urna, después del lanzamiento de las monedas y las urnas finales, así como las probabilidades para cada una de ellas. Atendiendo a la notación expresada en el diagrama de árbol y según el teorema de la probabilidad total, se obtiene: P(BN) = P(BN BBN) + P(BN BNN) = P(BBN) · P(BN/BBN) + P(BNN) · P(BN/BBN) =

= 3/8 · 2/3 + 3/8 · 2/3 = 1/4 + 1/4 = 1/2

Ejemplo En un aula el 70% de los alumnos son hombres. De ellos el 10% son fumadores. El 20% de las mujeres son fumadoras. ¿Cuál es la probabilidad de que al elegir un alumno al azar sea fumador? P(H F)=P(H)·P(F/H)=0,7·0,1=0,07P(M F)=P(M)·P(F/M)=0,3·0,2=0,06

P(F) = P(F H) + P(F M) = P(F|H) P(H) + P(F|M) P(M)= 0,1 · 0,7 + 0,2 · 0,3 = 0,13

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 24: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 24 de 43

Ejemplo

La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del 0,1%. Si la prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la prevalencia del infarto en esa población?

A = {ser hipertenso} A = {no serlo} estos sucesos constituyen una partición B = {padecer infarto}

Resolución: datos:

p(B|A ) = , ;

p(B|A ) = , ;

p(A ) = , evidentemente p(A ) = , P(B)=P(B A )+ P(B A )= P(B/A )·P(A )+ P(B/A ) ·P(A )

p(B) = 0,003x0,25 + 0,001 x 0,75 = 0,0015

Ejemplo

Un gato persigue a un ratón. Este puede esconderse dentro de uno de los callejones A, B o C En cada uno de ellos el gato puede cazarlo o no. Se sabe que : A: entra en A + : lo caza B: entra en B - : no lo caza C: entra en C P ( de que entre en A)=0,3 P ( de que entre en B)=0,5 P ( de que entre en C)=0,2 P ( lo cace habiendo entrado en A)=P(+/A)= 0,4 P ( lo cace habiendo entrado en B)=P(+/B)= 0,6 P ( lo cace habiendo entrado en C)=P(+/C)= 0,1 Calcula la probabilidad de que el gato cace al ratón P(+) = ?

P(+)=P(A)P(+/A)+P(B)·P(+/B)+P(C)·P(+/C)=0,3·0,4+0,5·0,6+0,2·0,1=0,44

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 25: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 25 de 43

1.10. Teorema de Bayes Se trata de determinar la probabilidad de las causas a partir de los efectos que han podido ser observados. El calculo de dichas probabilidades recibe el nombre de teorema de Bayes Si A1, A2 ,... , An son: sucesos incompatibles 2 a 2 cuya P(Ai) 0 Y cuya unión es el espacio muestral (A1 A2 ... An = E) ( sistema completo de sucesos) Y B es otro suceso cualquiera del que se conocen sus probabilidades condicionales P(B/Ai) Entonces las probabilidades P(Ai/(B) vienen dadas por la formula

i ii

1 1 2 2 n n

P(A )·P(B/A )P(A /B)=P(A )·P(B/A ) P(A )·P(B/A ) .......P(A )·P(B/A )õ õ

Demostración: De la definición de probabilidad condicionada

ejemplo Si seleccionamos una persona al azar, la probabilidad de que sea diabética es 0,03. Obviamente la probabilidad de que no lo sea es 0,97. P(D)=0.03: P(NB)=0.97 Si no disponemos de información adicional nada más podemos decir, pero supongamos que al realizar un análisis de sangre los niveles de glucosa son superiores a 1.000 mg/l, lo que ocurre en el 95% de los diabéticos y sólo en un 2% de las personas sanas. P(HG/D)=0.95 P(HG/ND)=0.02 ¿Cuál será ahora la probabilidad de que esa persona sea diabética? Vemos así que la información proporcionada por el análisis de sangre hace pasar, la probabilidad inicial de padecer diabetes de 0,03, a 0,595.

i i i i i

i

i ii

1 1 2 2 n n

P(A B)=P(A )·P(B/A )=P(B )·P(A /B)despejando P(A /B)

P(A )·P(B/A )P(A /B)( )

P(B)por el teorema de la probabilidad total es P(B)= P(A )·P(B/A )+P(A )·P(B/A )+.....P(A )·P(B/A )

por tanto sustituyendo

P Bã

i i i ii

1 1 2 2 n n

el valor de P(B) en el denominadorP(A )·P(B/A ) P(A )·P(B/A )P(A /B)

( ) P(A )·P(B/A )+P(A )·P(B/A )+.....P(A )·P(B/A )P Bã ã

ø ÷ ø ÷ ø ÷ ø ÷ ø ÷P HG P HG / D ·P D P HG / ND ·P ND 0.95·0.03 0.02·0.97 0.0479( ) ( / ) 0.03 0.95( / ) 0.595

( ) 0.0479P D P HG DP D HG

P HG

ã õ ã õ ã

I Iã ã ã

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 26: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 26 de 43

Ejemplo

En el problema anterior del gato y el ratón supongamos que nos hace la siguienten pregunta: Vemos al gato con un raton en la boca ¿ en que callejón es mas probable que lo haya capturado? A: entra en A + : lo caza B: entra en B - : no lo caza C: entra en C P ( de que entre en A)=0,3 P ( de que entre en B)=0,5 P ( de que entre en C)=0,2 P ( lo cace habiendo entrado en A)=P(+/A)= 0,4 P ( lo cace habiendo entrado en B)=P(+/B)= 0,6 P ( lo cace habiendo entrado en C)=P(+/C)= 0,1

Nos está pidiendo que calculemos la probabilidad de que habiendo sido cazado lo sea en un callejón determinado. Debemos calcular la P(A/+) , P(B/+) y P(C/+) , el valor mas alto nos indicara el sitio mas probable donde ha sido cazado Como sabemos por el ejercicio anterior que la P(+) es 0,44 no necesitamos calcular el desarrollo de la probabilidad total de ser cazado ( que iría en el denominador) y podemos simplificar el calculo de la formula de Bayes

( ) 0,12( / ) 0, 273( ) 0, 44

( ) 0,30( / ) 0,682( ) 0, 44

( ) 0,02( / ) 0,045( ) 0, 44

P AP AP

P BP BP

P CP CP

õ ã ã ãõ

õ ã ã ãõ

õ ã ã ãõ

Por lo tanto lo mas probable es que el gato haya cazado al ratón en el callejón B

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 27: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 27 de 43

otro ejemplo y una pregunta La fábrica de enlatados PI S.A. produce 5000 envases diarios. La máquina A produce 3000 de estos envases, de los que el 2% son defectuosos y la máquina B produce los 2000 restantes de los que se sabe que el 4% son defectuosos. Determinar la probabilidad de que un envase elegido al azar sea defectuoso. Si D es el suceso "seleccionar un envase defectuoso" y (no D) = "seleccionar un envase no defectuoso", el diagrama siguiente nos muestra el camino

p(D) = p(A y D) + p(B y D) = p(A) × p(D/A) + p(B) × p(D/B) = 0,028

Y ahora la pregunta ¿Si el envase seleccionado es defectuoso, qué probabilidad hay de que proceda de la máquina A? ¿Y de la B? Es decir, sabemos que la botella seleccionada es defectuosa La respuesta a dicha cuestión viene dada por la denominada fórmula de Bayes

Probabilidad de que provenga de la máquina A Calculamos la probabilidad p(A/D) es decir, la probabilidad de que provenga de la máquina A en el supuesto que el envase es defectuoso:

Probabilidad de que provenga de la máquina B Calculamos la probabilidad p(B/D) es decir, la probabilidad de que provenga de la máquina B en el supuesto que el envase es defectuoso:

Las expresiones

son las de la "fórmula de Bayes" para cada uno de las preguntas formuladas. Estas expresiones pueden generalizarse fácilmente para un conjunto finito de sucesos con las condiciones indicadas.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 28: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 28 de 43

Ejercicio propuesto: Se realiza un estudio para estudiar el diagnóstico de seropositividad en VIH según lo valores de T4-T8, obteniéndose la siguiente tabla:

Soluciones:

1. P(T4-T8 bajo y S+) = 10+22/100 = 0.32. Si fueran independientes P(T4-T8 bajo y S+) = P(T4-T8 bajo) · P(S+) = 0.4 · 0.38 = 0.152 0.32 sucesos dependientes

2. P(S- / T4-T8 bajo) = P(S- y T4-T8 bajo)/P(T4-T8 bajo)=0.08/0.4=0.2 P(S- y T4-T8 bajo)=8/100=0.08; P(T4-T8 bajo)=40/100=0.4

1. El nivel de T4-T8 y el tipo de VIH ¿son sucesos independientes? 2. Calcula la probabilidad ser sero- si tenemos un valor bajo de T4-T8

Mas ejemplos Una mujer es hija de una portadora de la enfermedad de Duchenne. Dicha mujer tiene tres hijos varones sin la enfermedad. Calcular la probabilidad de que ella sea portadora de la enfermedad.

Solución

Si representamos por x el gen alterado y por X el gen normal, el espacio muestral para el nacimiento xX, XX}, cada suceso elemental con la misma probabilidad (1ª ley de Mendel). Por

tanto, si A = {xX} = {la mujer es portadora}, según la definición clásica de probabilidad p(A) = 1/2.Si la mujer fuera portadora, los posibles genotipos para sus hijos son xX, xY, XX, XY, todos con la misma probabilidad. El espacio muestral para xY, XY}, por tanto la probabilidad de que un hijo varón no tenga la enfermedad es 1/2 (también según la definición clásica). Cómo los genotipos de los sucesivos hijos son independientes (2ª ley de Mendel), y de acuerdo a la definición de independencia, la probabilidad de que los 3 hijos varones no tengan la enfermedad es (1/2)x(1/2)x(1/2) = 1/8. Obviamente si la mujer no fuera portadora, la probabilidad de que los 3 hijos varones no tengan la enfermedad es 1.

Como el suceso A = {la mujer es portadora} y su complementario Ac = {la mujer no es portadora} forman una partición, se puede aplicar el teorema de Bayes en relación con el suceso B = {los 3 hijos varones no tienen la enfermedad}

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 29: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 29 de 43

Mas ejemplos Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0,05 y falso-negativo de 0,10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad de 0,15 tiene un resultado negativo con la misma. Calcular la probabilidad de que no esté enferma.

Solución

Sea NE = {la mujer no está enferma}, + = {el resultado de la prueba es positivo} y - = {el resultado de la prueba es negativo}. La pregunta pide p(NE|-). Los datos que se dan son p(+|NE)=0,05; p(-|E)=0,10 y p(E)=0,15. Del primero se deduce que p(-|NE)=0,95 y del último p(NE)=0,85, por lo tanto aplicando el teorema de Bayes

1.11 Tablas de contingencia Además de los clásicos diagramas de árbol, existe una buena técnica para resolver los problemas de probabilidad que son las tablas de contingencia. Una tabla de contingencia es una es una distribución (una matriz) en filas y columnas en la que los individuos de una población se clasifican en función de algunas variables. Como ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han clasificado según el sexo y por su adicción al tabaco.

En los márgenes de la tabla se indican las suma de filas y columnas.

Grados de libertad de una tabla de contingencia es el número de casillas que pueden fijarse de forma arbitraria cuando los totales por filas y columnas permanecen fijos. En una tabla de contingencia de f filas y c columnas el grado de libertad es

G.L. = (f - 1)(c - 1) Para la tabla anterior 2 × 2 el grado de libertad es 1. Con las condiciones dadas, fijada una casilla, podemos rellenar la tabla. Puedes comprobarlo rellenado ambas tablas

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 30: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 30 de 43

Nota:

para referirnos a una casilla determinada usaremos esta nomenclaturaq de letras y numeros

A Fumadores a

NO fumadores b

Totales c

Hombres 1 Mujeres 2 b2 Totales 3

Así por ejemplo la casilla de mujeres no fumadoras es la b2

Podemos asociar a cada diagrama de árbol una tabla de contingencia y viceversa como puede intuirse en la siguiente figura.

Consideremos la tabla inicial de la distribución por sexo y fumadores. Dividiendo todas las casillas de la misma por 300 resulta

A la vista de la misma, podemos contestar, por ejemplo, a las siguientes preguntas:   Elegido una persona al azar hallar la probabilidad de que sea hombre (Casilla c1)= 0,6   Elegido una persona al azar hallar la probabilidad de que sea hombre fumador (Casilla c2)= 0,4   Elegido una persona al azar hallar la probabilidad de que sea mujer no fumadora(Casilla b2) = 0,2333   Si se ha elegido una hombre, ¿qué probabilidad hay de que sea fumador?

Nos piden que calculemos p(F/H), es decir p(H y F) / p(H) para lo cual sólo tendremos que dividir el contenido de la casilla a1 entre el contenido de c1. p(F/H) = 0,4 / 0,6 = 0,6667

  Si se ha elegido un fumador ¿qué probabilidad hay de que sea mujer?

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 31: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 31 de 43

Nos piden que calculemos p(M/F), es decir p(M y F) / p(F) para lo cual sólo tendremos que dividir el contenido de la casilla a2 entre el contenido de a3. p(M/F) = 0,1667 / 0,5667 = 0,2942

EJEMPLO 1 En el distrito universitario de Jauja los estudiantes se distribuyen entre las tres carreras que pueden

cursarse del siguiente modo: el 20% estudian arquitectura, el 35% medicina y el 45% economía. El porcentaje de alumnos que finalizan sus estudios en cada caso es del 5%, 12% y del 18%. Elegido un alumno al azar determinar la probabilidad de que haya acabado los estudios. Si son A, M y E los sucesos "estudiar arquitectura", "estudiar medicina" y "estudiar económica" y F y noF finalizar o no, comenzamos rellenando la columna de los totales (es un sistema exhaustivo), es decir las casillas c1, c2, c3, c4 como podemos ver en la primera tabla

Como el 5% (del 20% de los alumnos de arquitectura) finalizan la carrera, el número de alumnos que finalizan arquitectura es el 1% (casilla a1). Igualmente el 12% del 35% de los estudiantes finalizan medicina, por lo que el 4,2% finalizan medicina (casilla a2). Por último el 18% del los 45% de los alumnos finalizan económicas por lo que colocamos en la casilla a3 el 8,1% correspondiente. La suma de estas casillas es 13,3 que colocamos en la casilla a4.Como el g.l de dicha tabla es 2, ya podemos completarla y obtenemos

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 32: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 32 de 43

1.12. Aplicaciones del Teorema de Bayes

Diagnóstico médico: El diagnóstico consiste en establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los síntomas y las enfermedades no están ligados de un modo biunívoco. Llamemos Ei al conjunto de enfermedades E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc. y Si a los síntomas y síndromes asociados con las mismas. S1: tos; S2: estado febril; S3: hemotisis; etc. La información accesible en los libros de patología, o en un archivo de historias clínicas es del tipo. Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc. y lo mismo para las demás enfermedades. En términos de probabilidad condicionada, esta información es p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc. Para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades forman una partición (son mutuamente excluyentes y se consideran todas las enfermedades compatibles con el síntoma) y se conocen sus prevalencias. Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en poblaciones en las que las prevalencias fueran diferentes.

Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.

Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden representar en una tabla de doble entrada

Patrón de oro

NO enfermos Enfermos totales

Prueba negativa (-) VN (a)

(Verdadero negativo)

FN (b)

(Falso negativo) r

Prueba positiva (+) FP (c)

(Falso positivo)

VP (d)

(Verdadero positivo) s

totales t u

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 33: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 33 de 43

Resumida:

Patrón de oro

NE E

- a b r Prueba

+ c d s

t u

Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina coeficiente falso-positivo (CFP) al cociente c/t, y es una estimación de la probabilidad condicionada p(+|NE), se denomina coeficiente falso-negativo (CFN) al cociente b/u, y es una estimación de la probabilidad condicionada p(-|E). Estos dos coeficientes cuantifican los dos errores que la prueba puede cometer y caracterizan a la misma. Simétricamente, los coeficientes que cuantifican los aciertos son la sensibilidad, p(+|E), y la especificidad p(-|NE).

Cuando la prueba se usa con fines diagnósticos (o de "screening") interesa calcular p(E|+) y/o p(NE|-). Como E y NE son una partición, usando el Teorema de Bayes

y

Nótese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnóstica que funciona muy bien en la clínica Mayo, puede ser inútil en el Hospital Ramón y Cajal.

Ejemplo : Una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno en el que dé negativo?

p(+|NE) = 0,04 p(-|NE) = 0,96 p(-|E) = 0,05 p(+|E) = 0,95 p(E) = 0,07 p(NE) = 0,93

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 34: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 34 de 43

y

1.13. Prevalencia

En Epidemiología se denomina prevalencia a la proporción de individuos de un grupo o una población que presentan una característica o evento determinado en un momento o en un periodo de tiempo determinado ("prevalencia de periodo").

La prevalencia mide en medicina la proporción de individuos de un grupo o población (área geográfica y periodo de tiempo establecidos) que sufren una determinada enfermedad (presentan una característica o evento determinado), la prevalencia se calcula dividiendo el número de individuos que padecen el trastorno (numerador) por el del número total de habitantes del área considerada incluyendo a los que lo padecen. La prevalencia puede referirse a espacios determinados de tiempo por ejemplo un mes, un año o toda la vida. La prevalencia proporciona una estimación de la probabilidad (riesgo) de que un sujeto de esa población tenga la enfermedad en ese momento.

La prevalencia no debe confundirse con la incidencia. La incidencia es una medida del número de casos nuevos de una enfermedad en un periodo de tiempo determinado. La prevalencia se refiere a todos los individuos afectados, independientemente de la fecha de contracción de la enfermedad. Una enfermedad de larga duración que se extiende ampliamente en una comunidad en 2002 tendrá una alta prevalencia en 2003 (asumiendo como duración larga un año o más), pero puede tener, sin embargo, una tasa de incidencia baja en 2003. Por el contrario, una enfermedad que se transmite fácilmente pero de duración corta, puede tener una baja prevalencia y una alta incidencia. La prevalencia es un parámetro útil cuando se trata de infecciones de larga duración, como por ejemplo el SIDA, pero la incidencia es más útil cuando se trata de infecciones de corta duración, como por ejemplo la varicela.

Tanto la prevalencia como la incidencia son datos de una gran importancia a la hora de planificar los recursos necesarios en un sistema sanitario ya que nos acercan a una estimación del número potencial de usuarios que pueden acceder a los servicios sanitarios.

Es un parámetro útil porque permite describir un fenómeno de salud, identificar la frecuencia poblacional del mismo y generar hipótesis explicatorias. La utilizan normalmente los epidemiólogos, las personas encargadas de la política sanitaria, las agencias de seguros y en diferentes ámbitos de la salud pública.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 35: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 35 de 43

1.14. Pruebas diagnósticas: Sensibilidad y especificidad

La medicina es una ciencia de probabilidades y un arte de manejar la incertidumbre. Dicha incertidumbre se extiende no sólo a las actividades preventivas, terapéuticas y pronosticas sino también a las diagnósticas. En las fases del proceso diagnóstico intervienen la historia clínica, la exploración física y la realización de pruebas complementarias. Cuando existen varias hipótesis diagnósticas, se realizará el diagnóstico diferencial y las pruebas complementarias tratarán de aclarar las dudas existentes. Si solamente hay una sospecha diagnóstica, las pruebas complementarias tratarán de confirmarla. La realización simultánea de varias pruebas complementarias se denomina pruebas complementarias en paralelo y la realización de pruebas complementarias según los resultados de otras previas, se denomina pruebas complementarias en serie. Al realizar pruebas en paralelo aumenta la probabilidad de diagnosticar a un enfermo, pero también aumenta la probabilidad de considerar como enfermo a un sano. El riesgo de la realización de pruebas en serie es no diagnosticar a algunos enfermos. En cambio, pocos sanos serán considerados como enfermos.

Es evidente que una buena prueba diagnóstica es la que ofrece resultados positivos en enfermos y negativos en sanos. Por lo tanto, las condiciones que deben ser exigidas a un test son:

Validez: Es el grado en que un test mide lo que se supone que debe medir. ¿Con que frecuencia el resultado del test es confirmado por procedimientos diagnósticos más complejos y rigurosos? La sensibilidad y la especificidad de un test son medidas de su validez.

Reproductividad: es la capacidad del test para ofrecer los mismos resultados cuando se repite su aplicación en circunstancias similares. La variabilidad biológica del hecho observado, la introducida por el propio observador y la derivada del propio test, determinan su reproductividad.

Seguridad: La seguridad viene determinada por el valor predictivo de un resultado positivo o negativo. ¿Con que seguridad un test predecirá la presencia o ausencia de enfermedad? Ante un resultado positivo de un test ¿qué probabilidad existe de que este resultado indique presencia de la enfermedad? Veremos posteriormente que esta probabilidad está muy influenciada por la prevalencia de la patología

A su vez, es conveniente que el test sea sencillo de aplicar, aceptado por los pacientes o la población general, que tenga los mínimos efectos adversos y que económicamente sea soportable.

En este trabajo se revisarán fundamentalmente los conceptos que determinan la validez de un test (sensibilidad y especificidad) y su seguridad (valores predictivos positivos y negativos).

Tabla 1. Relación entre el resultado de una prueba diagnóstica y la presencia o ausencia de una enfermedad.

Verdadero diagnóstico Resultado de la prueba Enfermo Sano

Positivo Verdaderos Positivos (VP)

Falsos Positivos (FP)

Negativo Falsos Negativos (FN)

Verdaderos Negativos (VN)

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 36: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 36 de 43

La validez de una prueba diagnóstica: Sensibilidad y especificidad El caso más sencillo que se nos puede plantear es el de una prueba dicotómica, que clasifica a cada paciente como sano o enfermo en función de que el resultado de la prueba sea positivo o negativo. En casos como éste, generalmente un resultado positivo se asocia con la presencia de enfermedad y un resultado negativo con la ausencia de la misma. Cuando se estudia una muestra de pacientes, los datos obtenidos permiten clasificar a los sujetos en cuatro grupos según una tabla 2x2 como la que se muestra en la Tabla 1. En ella, se enfrenta el resultado de la prueba diagnóstica (en filas) con el estado real de los pacientes (en columnas) o, en su defecto, el resultado de la prueba de referencia o �gold standard� que vayamos a utilizar. El resultado de la prueba puede ser correcto (verdadero positivo y verdadero negativo) o incorrecto (falso positivo y falso negativo). El análisis de su validez puede obtenerse calculando los valores de sensibilidad y especificidad4:

Sensibilidad

Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la probabilidad de que para un sujeto enfermo se obtenga en la prueba un resultado positivo. La sensibilidad es, por lo tanto, la capacidad del test para detectar la enfermedad.

Cuando los datos obtenidos a partir de una muestra de pacientes se clasifican en una tabla como la que se muestra en la Tabla 1, es fácil estimar a partir de ella la sensibilidad como la proporción de pacientes enfermos que obtuvieron un resultado positivo en la prueba diagnóstica. Es decir:

VPSensibilidad=VP+FN

De ahí que también la sensibilidad se conozca como �fracción de verdaderos positivos (FVP)�.

Especificidad

Es la probabilidad de clasificar correctamente a un individuo sano, es decir, la probabilidad de que para un sujeto sano se obtenga un resultado negativo. En otras palabras, se puede definir la especificidad como la capacidad para detectar a los sanos. A partir de una tabla como la Tabla 1, la especificidad se estimaría como:

VNEspecificidad=VN+FP

De ahí que también sea denominada �fracción de verdaderos negativos (FVN)�.

Ejemplo:

Como ejemplo de lo visto hasta ahora, consideremos los datos de un estudio en el que se incluyó a 2.641 pacientes con sospecha de cáncer prostático que acudieron a una consulta de Urología durante un periodo de tiempo determinado. Durante su exploración, se recogió el resultado del tacto rectal realizado a cada uno de estos pacientes, según fuese éste normal o anormal, y se contrastó con el posterior diagnóstico obtenido de la biopsia prostática. Los datos del estudio y los resultados obtenidos se muestran en la Tabla 2.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 37: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 37 de 43

Tabla 2. Resultados de la exploración y biopsia prostática de una muestra de pacientes con sospecha de cáncer de próstata.

Resultado de la biopsia prostática Resultado del tacto rectal Cáncer Patología benigna Total Anormal 634 269 903 Normal 487 1251 1738

Total 1121 1520 2641

Se encontraron en total 1.121 casos de cáncer, lo cual representa un 42,45% del total de sujetos estudiados. La sensibilidad del tacto rectal para detectar cáncer fue de 56,56% (634/1121) y la especificidad de 82,3% (1251/1520). Así, el tacto fue anormal en un 56,56% de los casos de cáncer prostático y normal en un 82,3% de los casos que presentaron finalmente otras patologías. Esto significa que un 100-56,56=43,44% de los pacientes que efectivamente tenían cáncer presentaban tactos normales. Claramente ello indica la necesidad de utilizar otros marcadores más sensibles, como el PSA o sus derivados, para poder establecer el diagnóstico de forma más precisa.

Resulta obvio que lo ideal sería trabajar con pruebas diagnósticas de alta sensibilidad y especificidad, pero esto no siempre es posible. En general, las pruebas de screening deben ser de alta sensibilidad para poder captar a todos los enfermos. Una prueba muy sensible será especialmente adecuada en aquellos casos en los que el no diagnosticar la enfermedad puede resultar fatal para los enfermos, como ocurre con enfermedades peligrosas pero tratables, como los linfomas o la tuberculosis, o en enfermedades en las que un falso positivo no produzca serios trastornos psicológicos o económicos para el paciente (por ejemplo, la realización de mamografía en el cáncer de mama).

Por otra parte, la especificidad se refiere, como se señaló previamente, a la probabilidad de que un sujeto sano sea clasificado adecuadamente. En general, las pruebas confirmatorias del diagnóstico deben ser de alta especificidad, para evitar falsos positivos. Los tests de alta especificidad son necesarios en enfermedades graves pero sin tratamiento disponible que las haga curables, cuando exista gran interés por conocer la ausencia de enfermedad o cuando diagnosticar a un paciente de un mal que realmente no padece pueda acarrear graves consecuencias, ya sean físicas, psicológicas o económicas (por ejemplo, en el caso del SIDA).

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 38: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 38 de 43

La seguridad de una prueba diagnóstica. Valores predictivos

Los conceptos de sensibilidad y especificidad permiten, por lo tanto, valorar la validez de una prueba diagnóstica. Sin embargo, carecen de utilidad en la práctica clínica. Tanto la sensibilidad como la especificidad proporcionan información acerca de la probabilidad de obtener un resultado concreto (positivo o negativo) en función de la verdadera condición del enfermo con respecto a la enfermedad. Sin embargo, cuando a un paciente se le realiza alguna prueba, el médico carece de información a priori acerca de su verdadero diagnóstico, y más bien la pregunta se plantea en sentido contrario: ante un resultado positivo (negativo) en la prueba, ¿cuál es la probabilidad de que el paciente esté realmente enfermo (sano)?. Así pues, resulta obvio que hasta el momento sólo hemos abordado el problema en una dirección. Por medio de los valores predictivos completaremos esta información5:

Valor predictivo positivo:

Es la probabilidad de padecer la enfermedad si se obtiene un resultado positivo en el test. El valor predictivo positivo puede estimarse, por tanto, a partir de la proporción de pacientes con un resultado positivo en la prueba que finalmente resultaron estar enfermos:

VPVPP=VP+FP

Valor predictivo negativo:

Es la probabilidad de que un sujeto con un resultado negativo en la prueba esté realmente sano. Se estima dividiendo el número de verdaderos negativos entre el total de pacientes con un resultado negativo en la prueba:

VNVPN=FN+VN

Retomando el ejemplo anterior sobre cáncer prostático, el valor predictivo positivo es en este caso del 70,21% (634/903) y el valor predictivo negativo del 71,98% (1251/1738). Ello significa que en un 70,21% de los pacientes con un tacto anormal finalmente se confirmó la presencia de cáncer, mientras que de los que no se detectaron anomalías en el tacto un 71,98% estaban efectivamente sanos. La influencia de la prevalencia.

Hemos visto cómo los valores de sensibilidad y especificidad, a pesar de definir completamente la validez de la prueba diagnóstica, presentan la desventaja de que no proporcionan información relevante a la hora de tomar una decisión clínica ante un determinado resultado de la prueba. Sin embargo, tienen la ventaja adicional de que son propiedades intrínsecas a la prueba diagnóstica, y definen su validez independientemente de cuál sea la prevalencia de la enfermedad en la población a la cual se aplica.

Por el contrario, el concepto de valores predictivos, a pesar de ser de enorme utilidad a la hora de tomar decisiones clínicas y transmitir a los pacientes información sobre su diagnóstico, presenta la limitación de que dependen en gran medida de lo frecuente que sea la enfermedad a diagnosticar en la población objeto de estudio. Cuando la prevalencia de la enfermedad es baja, un resultado negativo permitirá descartar la enfermedad con mayor seguridad, siendo así el valor predictivo negativo mayor. Por el contrario, un resultado positivo no permitirá confirmar el diagnóstico, resultando en un bajo valor predictivo positivo.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 39: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 39 de 43

Ilustraremos lo anterior con un sencillo ejemplo. Para el diagnóstico del VIH se emplean tests que han confirmado tener una alta validez, con valores aproximados de sensibilidad y especificidad de un 99,5%. Supongamos que se aplicase esta prueba a la totalidad de la población gallega, que se cifra en 2.800.000 habitantes. Si asumimos que en Galicia existen 6.000 pacientes VIH positivos (lo cual implicaría una prevalencia de 6000/ 2.800.000 =0,21%), el test resultaría positivo en un total de 19.940 sujetos, obteniéndose un valor predictivo positivo del 29,9% (Tabla 3). Así pues, sólo un 29,9% de los sujetos con un resultado positivo en el test resultarían estar realmente afectados, mientras que un 70,1% de los mismos no presentarían la enfermedad. Resulta obvio que en una comunidad como la gallega la utilización de esta prueba no resultaría útil, debido a la alta proporción de falsos positivos que conllevaría.

Tabla 3. Resultados de la aplicación del test de VIH en una población de baja prevalencia.

Verdadero diagnóstico Resultado del test VIH+ VIH- Total

Positivo 5.970 13.970 19.940 Negativo 30 2.780.030 2.780.060

Total 6.000 2.794.000 2.800.000

Veamos ahora que ocurriría si se aplicase la misma prueba a una población en la que el número de enfermos VIH+ fuese de 800.000 (resultando en una prevalencia mucho mayor de un 800.000/2.800.000=28,6%). En este caso, la predictividad de una prueba positiva aumenta de un 29,9% a un 98,7%, disminuyendo la proporción de falsos positivos a tan sólo un 1,3% (Tabla 4). Por lo tanto, si la prevalencia es alta, un resultado positivo tiende a confirmar la presencia de la enfermedad, mientras que si la prevalencia es baja, un resultado positivo no permitirá afirmar su existencia.

Tabla 4. Resultados de la aplicación del test de VIH en una población de alta prevalencia.

Verdadero diagnóstico Resultado del test VIH+ VIH- Total

Positivo 796.000 10.000 806.000 Negativo 4.000 1.990.000 1.994.000

Total 800.000 2.000.000 2.800.000

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 40: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 40 de 43

Razones de probabilidad Queda claro pues cómo la prevalencia es un factor determinante en los valores predictivos de un test. Por lo tanto, éstos , no pueden ser utilizados como índices a la hora de comparar dos métodos diagnósticos diferentes, ni tampoco a la hora de extrapolar los resultados de otros estudios a datos propios. Por ello, resulta necesario determinar otros índices de valoración que sean a la vez clínicamente útiles y no dependan de la prevalencia de la enfermedad en la población a estudiar. Así, además de los conceptos de sensibilidad, especificidad y valores predictivos, se suele hablar del concepto de razón de verosimilitudes, razón de probabilidad, o cociente de probabilidades6. Estos miden cuánto más probable es un resultado concreto (positivo o negativo) según la presencia o ausencia de enfermedad:

Razón de verosimilitudes positiva o cociente de probabilidades positivo: se calcula dividiendo la probabilidad de un resultado positivo en los pacientes enfermos entre la probabilidad de un resultado positivo entre los sanos. Es, en definitiva, el cociente entre la fracción de verdaderos positivos (sensibilidad) y la fracción de falsos positivos (1-especificidad):

SensibilidadRV+ = 1 - Especificidad

Razón de verosimilitudes negativa o cociente de probabilidades negativo: se calcula dividiendo la probabilidad de un resultado negativo en presencia de enfermedad entre la probabilidad de un resultado negativo en ausencia de la misma. Se calcula por lo tanto, como el cociente entre la fracción de falsos negativos (1-sensibilidad) y la fracción de verdaderos negativos (especificidad):

1 - SensibilidadRV- = Especificidad

Volvamos de nuevo al ejemplo planteado en la Tabla 2 sobre el diagnóstico de cáncer prostático a partir del tacto rectal. En este caso, se obtiene un cociente de probabilidades positivo de 3,20. Ello viene a indicarnos que un tacto anormal es, por lo tanto, 3 veces más probable en un paciente con cáncer prostático que en otro sujeto sin cáncer. La razón de probabilidades ofrece la ventaja de que relaciona la sensibilidad y la especificidad de una prueba en un solo índice. Además, pueden obtenerse razones de probabilidad según varios niveles de una nueva medida y no es necesario expresar la información de forma dicotómica, como resultado de normal o anormal o bien positivo y negativo. Por último, al igual que sucede con la sensibilidad y la especificidad, no varía con la prevalencia. Esto permite utilizarlo como índice de comparación entre diferentes pruebas para un mismo diagnóstico.

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 41: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 41 de 43

Anexo I ejercicios sobre la formula de Bayes 1. Elegido un individuo al azar y observado por rayos X, se diagnosticó que estaba

tuberculoso. La probabilidad de que en la población de la que se eligió el individuo uno de ellos sea tuberculoso es de 0'01. La probabilidad de que un aparato de rayos X detecte que un individuo es tuberculoso siéndolo es 0'97 y no siéndolo es de 0'001. ¿Qué podemos decir acerca del diagnóstico?

2. Se tienen dos urnas U y U' con las siguientes composiciones: U = 10 bolas blancas,

7 negras y 5 rojas; U'= 24 bolas blancas, 4 negras y 9 rojas. Se saca una bola al azar de la urna U y se introduce sin mirarla en la urna U', y a continuación se extrae una bola de U' que resultó ser negra. Se desea saber cuál es la probabilidad de que la bola pasada de U a U' haya sido blanca.

3. Tres operarios A, B y C producen el 50%, 30% y el 20% de los artículos de una

fábrica. Resultan defectuosos el 3% de los artículos fabricados por A, el 2% de los de B y el 6% de los de C. Se selecciona al azar un artículo. Sabiendo que el artículo seleccionado es defectuoso, hallar la probabilidad de que lo haya fabricado A.

4. Una urna A contiene 2 bolas blancas y 3 negras. Otra urna B contiene 4 bolas

blancas y 3 negras. Se saca una bola al azar de la urna A y sin verla se echa en la B. A continuación se saca una bola de B que fue negra. ¿Cuál es la probabiolidad de que la bola pasada de A a B fuese blanca?

5. En una urna A hay 3 bolas blancas y 5 negras. En una urna B hay dos blancas y tres

negras. Se extrae una bola de A y se introduce en B sin verla. A continuación se extrae una bola de B. Calcular:

± la probabilidad de que haya pasado bola negra de A a B, si la bola extraída de

B es blanca. ± La probabilidad de que haya pasado bola blanca de A a B, si la bola extraída

de B es blanca

6. De los titulados que trabajan en una empresa multinacional, el 80% estudiaron en universidades públicas y el 20% en universidades privadas. Por otra parte, el 50% de los que estudiaron en universidades privadas y el 30% de los que lo hicieron en universidades públicas ocupan puestos directivos. Se elige un titulado aleatoriamente y resulta ser un directivo. ¿Cuál es la probabilidad de que haya realizado sus estudios en una universidad pública?.

7. Se dispone de 2 cajas. La caja 1 tiene 4 bolas blancas y 3 negras, mientras que la

caja 2 contiene 3 bolas blancas y 4 negras. Se selecciona una caja al azar y, seguidamente, se extrae una bola de la misma. Si al extraer la bola resulta ser blanca, ¿cuál es la probabilidad de que proceda de la caja 1?

8. De las 15 habitaciones dobles de un pequeño hotel de la costa, 10 tienen baño

mientras que de las 10 habitaciones sencillas, sólo 2 disponen de baño. Si seleccionamos una habitación y se sabe que tiene baño, ¿cuál es la probabilidad de que sea sencilla?

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 42: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 42 de 43

9. Tres máquinas A, B y C fabrican tornillos del mismo tipo. Los porcentajes defectuosos en cada máquina son, respectivamente, 1% , 2% y 3%. Se mezclan 120 tornillos: 20 de la máquina A, 40 de la B y 60 de la C; elegido uno al azar, resulta defectuoso. ¿Cuál es la probabilidad de que haya sido fabricado por la máquina B?

10. En un sistema de alarma, la probabilidad de que haya un incidente es de 0'1. Si éste

se produce, la probabilidad de que la alarma suene es 0'95. La probabilidad de que funcione la alarma sin que haya incidente es de 0'03. Si ha funcionado la alarma, calcular las probabilidades de que no haya habido incidente.

11. Se tienen cuatro dados en una bolsa. Tres de ellos perfectos y el cuarto cargado de

tal forma que la probabilidad de sacar un cinco es doble que la probabilidad de sacar otro valor. Se toma un dado al azar de la bolsa, se tira y sale un cinco. Hallar la probabilidad de que el dado sea el cargado.

12. En una universidad, en la que no hay más que estudiantes de ingeniería, ciencias y

letras, acaban la carrera el 5% de ingeniería, el 10% de ciencias y el 20% de letras. Se sabe que el 20% estudian ingeniería, el 30% ciencias y el 50% letras. Tomando a un estudiante cualquiera al azar se pide: si nos dice que ha acabado la carrera, probabilidad de que sea de ingeniería

13. Un armario tiene dos cajones. El cajón número 1 contiene 4 monedas de oro y 2 de

plata. El cajón número 2 contiene 3 monedas de oro y 3 de plata. Se abre un cajón al azar y se extrae una moneda. Calcular la probabilidad de que se haya abierto el cajón número 1, sabiendo que se ha extraído una moneda de oro.

14. En una casa hay tres llaveros A, B y C: el primero con 5 llaves, el segundo con 7 y el

tercero con 8, del los que sólo una de cada llavero abre la puerta del trastero. Se escoge al azar un llavero y de él, una llave para intentar abrir el trastero. Se pide: a) ¿Cuál será la probabilidad de que se acierte con la llave? b) ¿Cuál será la probabilidad de que el llavero escogido sea el tercero y la llave no

abra? c) Y si la llave escogida es la correcta, ¿cuál será la probabilidad de que

pertenezca al primer llavero A?

PDF created with pdfFactory Pro trial version www.pdffactory.com

Page 43: Tema6-probabilidad

VEB Tema 6

Apuntes de VEB página 43 de 43

PDF created with pdfFactory Pro trial version www.pdffactory.com