17
2. APLICACIÓN DE LA ESTADISTICA EN LA BIOMEDICINA 2.1 GENERALIDADES DE LA ESTADISTICA CON LA BIOMEDICINA La estadística puede definirse como la disciplina que se ocupa del tratamiento de los datos numéricos derivados de grupo de casos. A menudo estos casos pueden ser personas, animales u otros organismos. En ocasiones se dice que la estadística contribuye poco o nada al progreso de la medicina, porque el medico se ocupa en cada momento del tratamiento de un solo paciente y este difiere de los otros en aspectos importantes.Muchas técnicas de la estadística se emplean con mucha frecuencia en la investigación médica y describirlas en términos que sean accesibles para quien no domine las matemáticas. La elección de los temas estadísticos refleja el alcance de su empleo en la investigación médica; muchos de estos temas se ven más utilizados en la estadística aplicada, pero igual mostraremos casos puntuales que trabajan en la investigación médica o que están interesados en la aplicaciones médicas. La estadística biomédica consiste, según que opiniones, simplemente en formulacionesnuméricas

La Estadistica en la Biomédica

  • Upload
    ashlola

  • View
    137

  • Download
    0

Embed Size (px)

Citation preview

2. APLICACIÓN DE LA ESTADISTICA EN LA BIOMEDICINA

2.1GENERALIDADES DE LA ESTADISTICA CON LA BIOMEDICINA

La estadística puede definirse como la disciplina que se ocupa del tratamiento de

los datos numéricos derivados de grupo de casos. A menudo estos casos pueden

ser personas, animales u otros organismos. En ocasiones se dice que la

estadística contribuye poco o nada al progreso de la medicina, porque el medico

se ocupa en cada momento del tratamiento de un solo paciente y este difiere de

los otros en aspectos importantes.Muchas técnicas de la estadística se emplean

con mucha frecuencia en la investigación médica y describirlas en términos que

sean accesibles para quien no domine las matemáticas. La elección de los temas

estadísticos refleja el alcance de su empleo en la investigación médica; muchos de

estos temas se ven más utilizados en la estadística aplicada, pero igual

mostraremos casos puntuales que trabajan en la investigación médica o que están

interesados en la aplicaciones médicas. La estadística biomédica consiste, según

que opiniones, simplemente en formulacionesnuméricas sobre materias médicas:

cuantas personas fallecen por una determinada causa cada año, cuantas camas

hospitalarias se encuentran disponibles en un área concreta o cuánto dinero se

gasta en una determinada prestación médica. Estos hechos tienen una

importancia administrativa clara sobre todo el modo en que la estadística puede

mostrar resultados a personal administrativos que no son necesariamente

estadísticos. Por ejemplo, Para prever el número de camas de un servicio de

obstetricia de una comunidad necesitamos conocer cuántas mujeres dan a luz en

un periodo determinado y cuantas de ellas deben recibir cuidados en hospitales o

maternidades. Los datos numéricos también ofrecen la base de numerosas

investigaciones médicas. El estadístico necesita ir mas allá de esta labor

descriptiva en dos aspectos importantes: el primero, la posibilidad de mejorar la

calidad de información, planeando cuidadosamente la recogida de datos, y el

segundo, saber que los procedimientos de inferencia estadística proporciona una

amplia gama de métodos objetivos para extraer conclusiones de los datos sobre

los temas que se están investigando . En los últimos años se han constatado una

producción abundante de artículos que han desarrollado nuevos métodos

estadísticos específicamente para la investigación médica.

2.2 PRESENTACIÓN DE INFORMACIÓN MEDIANTE LA ESTADISTICA

El material bruto de las investigaciones estadísticas consiste en observaciones

individuales que casi siempre se deben resumir de algún modo para que puedan

ser de utilidad. El objetivo de los métodos estadísticos va más allá de la mera

presentación de datos e incluye la formulación de inferencias a partir de ellos.

Estos dos aspectos –descripción e inferencia- no pueden separarse. No podemos

referiros a las herramientas descriptivas sin considerar el fin para el que son

necesarias. Siempre es útil distinguir, en primer lugar entre dos tipos de variables,

cualitativas (o categóricas) y cuantitativas. Las variables cualitativas pueden

distinguirse en observaciones nominales y ordinales.Uno de los principales

métodos de presentación de la información estadística,sobre todo en la

biomedicina, lo constituyen las gráficas. Las tendencias y los contrastes suelen

percibirse con mayor rapidez y quizá son retenidos durante más tiempo en la

memoria mediante la observación causal de un diagrama bien proporcionado, que

por el escrutinio de los datos numéricos correspondientes, presentados en una

tabla. Sin embargo, las gráficas deben ser sencillas, pues los que contienen

demasiada información entrañan mayor dificultad en la interpretación. Otro método

de resumir y presentar algunas características importantes de un conjunto de

datos en forma de tabla. Existen muchas variantes, pero las características

esenciales son que la estructura y el significado de una se indiquen con

encabezamientos o títulos y que el resumen estadístico se exprese en el cuerpo

de la tabla mediante números.

Es útil clasificar las observaciones cuantitativas en variables discretas y continuas.

Las medidas discretas suelen ser recuentos como el número de veces que un

individuo ha sido ingresado en el hospital en los últimos 5 años. Las variables

continuas pueden adoptar un intervalo de valores continuos o interrumpidos como

la estatura, la edad, el peso y la presión arterial. Un paso práctico para resumir

gran cantidad de datos es la formación de una distribución de frecuencia. TABLA

1.5

2.3 PROBABILIDADES EN LA BIOMEDICA

El principal objetivo de la asignación de probabilidades numéricas es permitir la

realización de cálculos a partir de estos números. Las dos operaciones básicas

que nos ocupan son la suma y la multiplicación. Por ejemplo, si se escoge al azar

el nombre de un médico a partir del British Medical Register, la probabilidad de

que este médico sea varón es de 0,8. La probabilidad de que el médico se haya

graduado en una universidad en Inglaterra es de 0,6. ¿Cuál es la probabilidad de

que el médico sea un varón o se haya graduado en Inglaterra, o ambas

características a la vez? Si se suman ambas probabilidades se obtiene 0,8 + 0,6 =

1,4, lo cual es claramente erróneo, porque las probabilidades no pueden ser

superiores a 1. Para obtener la respuesta correcta se debe restar la probabilidad

del doble suceso. Así llamando A y B a los dos sucesos, obtenemos una expresión

más general de la ley aditiva. P (A o B o ambos) = P (A) + P (B) – P (A y B) y

designando a los sucesos A y B, obtendremos, P (A o B o ambos) = 0,80 + 0,06 –

0,48 = 0,92.

También en el estudio de la biomédica se pueden estudiar las probabilidades con

modelos de distribución binomial y distribución de Poisson. En la distribución

binomial se tiene una secuencia aleatoria en la que los sucesos de cada prueba

individual son de tipo A o B cuyas posibilidades de ocurrir es igual a µ. Para la

distribución binomial se tendrán las siguientes ecuaciones,

E(r) = nπ y Var(r) = nπ(1 – π). La figura 2.7 ilustra la distribución de varias

combinaciones de (π) y n. En la distribución de Poisson el modelo es análogo, en

forma continua, a las secuencias de los ensayos independientes. La probabilidad

de que en la serie completa de n pruebas aparezcan exactamente x sucesos,

según esta aproximación, vendrá dada por la distribución binomial

n (n−1 )…(n−x+1)x !

( µn)x

(1−µn)n− x

, la probabilidad de x se aproxime a:

P x=nx

x !(µn)x

e−µ

La figura 2.9 ilustra la distribución de Poisson para varios valores de µ.Después de

mencionar probabilidad mediante la distribución binomial y la distribución de

Poisson, mostraremos un ejemplo de un problema de probabilidad desarrollado

por distribución binomial.

Regresión múltiple en la Biomédica

En la biomédica es conveniente a menudo expresar el valor medio de una variable

en términos de no otra variable sino de varias. Es posible que se desee conocer a

fondo algunos mecanismos causales descubriendo cuál de las variables de un

conjunto x1, x2, tiene aparentemente más influencia sobre una variable dependiente

y. por ejemplo, la tasa de recién nacidos varía considerablemente en diferentes

ciudades de Gran Bretaña. Relacionando la tasa de recién nacido muertos

simultáneamente con un gran número de variables que describen las ciudades-

por ejemplo, variables económicas, sociales, meteorológicas o demográficas-sería

posible encontrar los factores que ejerce una influencia particular sobre la tasa de

recién nacidos muertos. Otro ejemplo se halla en el estudio de las variaciones del

costo por paciente en los distintos hospitales. Esto presumiblemente depende de

forma acusada de la mezcla de pacientes- las proporciones de los distintos tipos

de pacientes-, así como de otros factores. Un estudio de los efectos simultáneos

de algunas de estas variables puede explicar, en gran parte, la variación de los

costos hospitalarios y, prestar atención a determinados hospitales cuyos costos

altos o bajos están fuera de la línea de predicción, puede sugerir nuevos factores

de suma importancia. La técnica apropiada se denomina regresión múltiple. En

general, el planteamiento consiste en expresar el valor medio de la variable

dependiente en términos de los valores de un conjunto de variables

independientes.Mostraremos un ejemplo de un problema de regresión lineal

múltiple.

Ejemplo 1

Los casos de Sida diagnosticados en España en los últimos años vienen recogidos en la tabla, clasificados por grupo de riesgo del paciente.

Desarrolle y presente la distribución de frecuencia (frecuencia absoluta) y el histograma para dicha tabla.

Histograma de casos de Sida en España de 1993 a 1997

Ejemplo 2

El 1% de los niños sufre efectos secundarios tras la administración de un determinado antibiótico. Si éste fue aplicado a seis niños, determinar a) la probabilidad de que ninguno padezca efectos secundarios o b) lo padezca más de un niño. c) Si se suministrase el antibiótico a 1000 niños, ¿cuál sería el número medio de niños con efectos secundarios? Y d) calcular la probabilidad de que, de esos mil niños, padezcan efectos secundarios más de 15.

a) El problema se puede formalizar mediante un modelo binomial en donde cada prueba de Bernoulli sea el administrar el antibiótico en cuestión y el suceso éxito el que el niño padezca efectos secundarios. De esta forma, la variable número de niños, de entre los seis, que padecieron efectos secundarios, se puede modelizar mediante una variable X con distribución binomial B(6, 0.01) al ser 0.01 la probabilidad de que se dé el suceso éxito.

La probabilidad de que ninguno de estos niños padezca efectos secundarios, utilizando la tabla de la distribución binomial, P{X=0}=0.9415.

Conclusión: Existe el 94.15% de probabilidades de que ningún niño padezca efecto secundario.

b) La probabilidad de que más de un niño padezca efectos secundarios será la misma situación de la sección anterior pero de esta manera:

P{X>1} = 1 – P{X=<1} = 1 – [P{X=0} + P{X=1}]

= 1 – [0.9415 – 0.0571]

= 0.0014 , 0.0014 x 100%

= 0.14%

Conclusión: Existe el 0.14% de probabilidades de que más de un niño padezca efectos secundarios.

c) La probabilidad de que se suministrase el antibiótico a 1000 niños sería, ahora lo que ocurre es que se aumenta el número de pruebas B(1000, 0.01), por lo tanto la media de esta distribución es el producto de los parámetros, es decir, E[X] = n . p = 1000 . 0.01 = 10.

Conclusión: El número medio o número de niños esperado de niños con efectos secundarios, de entre los mil, seria 10 niños.

d) El cálculo de probabilidades de distribuciones binomiales para un gran número de ensayos, como ocurre aquí, se realiza aproximando dicha distribución mediante el teorema central de límite. En el caso de una distibución binomial X B(n,p), su aproximación mediante una normal Y N (np, √np (1−p )) es válida, cuando supuesto sea p=< 0.5 entonces sea también np> 5. Pr lo tanto, aproximaremos la X B(1000,0.01), Y (1000 . 0.01, √1000.0,01.0,99= N(10, 3.146) quedando la probabilidad igual a

P{X>15} = P{X−103.146

> 15−103.146

} = P { Z > 1.59} = 0.0559. 0.0559 x 100 % = 5.56%

Conclusión: Existe el 5.56% de probabilidades de que más de 15 niños de esos mil niños padezcan efectos secundarios.

Ejemplo 3

En el análisis de la posible influencia del peso, X1 y del nivel de ácido úrico, X2, sobre el nivel de colesterol, Y, en los individuos de una población, se seleccionó al azar a 10 personas de la población en estudio, anotándose el valor, que en ellos tomaban, las tres variables antes mencionadas. Los resultados obtenidos fueron los siguientes:

Se pide: Determinar la ecuación del sistema de regresión de Y sobre X1, X2.

Para calcular la ecuación del sistema de regresión lineal múltiple de Y sobre X1, X2.

Debemos determinar y resolver, previamente, el sistema de ecuaciones normales

Que para los datos del enunciado queda igual a

Sistema de tres ecuaciones con tres incógnitas, que tiene como solución los valores,

La ecuación del sistema de regresión lineal múltiple será: