Upload
henry-andrade
View
240
Download
5
Embed Size (px)
Citation preview
Programa Doctoral
“Formación, Empleo
y Desarrollo
Regional”
1. Conceptos básicos en estadística.
2. Escalas de medición
3. Medidas de tendencia central: media, moda
y mediana
4. Medidas de dispersión: desviación estándar,
error estándar
5. Distribución normal (de gauss). Test de
normalidad de los datos
6. Elaboración de tablas y gráficos
Estructura de la presentación
1. Conceptos Básicos en Estadística.
Medidas Básicas en Bioestadística
¿QUÉ ES LA BIOESTADÍSTICA?
Es la Ciencia que aplica el análisis estadístico a los
problemas y objetos de estudio de la biología
¿QUÉ ES LA ESTADÍSTICA?
“Conjunto de conocimientos y métodos usadosen la recolección, organización presentación yanálisis de la información relativa a unfenómeno determinado permitiéndole alinvestigador tomar decisiones en fenómenosdonde este presente la incertidumbre”
José Manuel Armas.
1. Conceptos Básicos en Estadística.
Medidas Básicas en Bioestadística
BIOESTADÍSTICA: NOCIONES ELEMENTALES
INCERTIDUMBREMEDICINA
LA ESTADISTICA COMO HERRAMIENTA FUNDAMENTAL EN LA INVESTIGACIÓN MÉDICA
MANEJO
ACTIVIDADES PREVENTIVAS,
DIAGNOSTICAS, TERAPÉUTICAS Y
PRONOSTICAS
PRACTICA
CLÍNICA
GENERA
INVESTIGACION
1. Conceptos Básicos en Estadística.
Aspectos que el investigador debe tener en cuenta sobre las
técnicas estadísticas
1. Centrar el problema de la investigación en su campo de
especialización. (objetivos, variables, hipótesis, relaciones
básicas de las variables).
2. Mantener el diseño y el análisis tan simple como sea posible
para no exagerar en el uso de técnicas estadísticas (análisis de
datos).
Medidas Básicas en Bioestadística
RAMAS DE LA ESTADÍSTICA
Estadística Descriptiva: Describe, analiza y
representa un grupo de datos utilizando métodos
numéricos y gráficos que resumen y presentan la
información contenida en ellos.
Estadística Inferencial: Apoyándose en el cálculo
de probabilidades y a partir de datos muestrales,
efectúa estimaciones, toma de decisiones,
predicciones u otras generalizaciones sobre un
conjunto mayor de datos.
1. Conceptos Básicos en Estadística.
Medidas Básicas en Bioestadística
1. Conceptos Básicos en Estadística.
Individuos o elementos: personas u objetos que contienen cierta
información que se desea estudiar.
Población: conjunto de individuos o elementos que cumplen ciertas
propiedades comunes.
Muestra: subconjunto representativo de una población.
Parámetro: función definida sobre los valores numéricos de
características medibles de una población.
Estadístico: función definida sobre los valores numéricos de una
muestra.
2. Escalas de medición
Medidas Básicas en Bioestadística
Es una característica observable que varía entre los diferentes
individuos de una población. La información que disponemos de cada
individuo es resumida en variables.
Ejemplo
El grupo sanguíneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad “declarado”
{Deprimido, Muy Feliz} Var. Ordinal
El número de hijos
{0,1,2,3,...} Var. Numérica discreta
La altura
{1’62 ; 1’74; ...} Var. Numérica continua
VARIABLES CATEGÓRICAS VARIABLES NUMÉRICAS
CUALITATIVAS CUANTITATIVAS
(0) NOMINAL
Ningún atributo
(1) ORDINAL
Un atributo
(2) (INTERVALO)
Dos atributos
(3) RAZÓN
Tres atributos
Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen
Posee categorías que no
se pueden ordenar por
alguna jerarquía
Posee categorías que se
pueden ordenar por
alguna jerarquía, pero no
se puede medir la
distancia entre ellas
Son variables numéricas
cuyos valores
representan magnitudes
y la distancia entre los
números de su escala es
igual
Las variables de razón
poseen las mismas
características de las
variables de intervalo, con
la diferencia que cuentan
con un cero absoluto; es
decir, el valor cero (0)
representa la ausencia
total de medida
Género Estado Civil Instrucción Intensidad Temperatura Hora (24 h) Peso Hijos
Masculino Soltero Primaria Leve -10º C 00 horas 00 Kg 1
Femenino Casado Secundaria Moderado 0º C 12 horas 25 Kg 3
Divorciado Universitaria Severo 15º C 22 horas 40 Kg 5
Dicotómicas: tiene solo dos categorías
Continuas : proviene de medir con números enteros o
fraccionaros, entre dos valores siempre existe
números intermedios
Politómicas: tienen más de dos categoríasDiscretas: provienen de contar, sólo admite valores
enteros
Medidas Básicas en Bioestadística
3. Medidas de tendencia central: media, moda y mediana
MEDIA
Es la medida de posición central más utilizada, la más conocida y la más
sencilla de calcular, debido principalmente a que sus ecuaciones se
prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su
principal desventaja radica en su sensibilidad al cambio de uno de sus
valores o a los valores extremos demasiado grandes o pequeños. La
media muestral se define como la suma de todos los valores observados,
dividido por el número total de observaciones.
n
x
X
n
i
i 1
Medidas Básicas en Bioestadística
3. Medidas de tendencia central: media, moda y mediana
MEDIANA
Con esta medida podemos identificar el valor que se encuentra en el
centro de los datos, es decir, divide el conjunto de datos en dos partes
iguales. 50-50
MODA
La medida modal nos indica el valor que más veces se repite dentro
de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el
valor que más veces se repite es el número 2 quien seria la moda de
los datos. Es posible que en algunas ocasiones se presente dos
valores con la mayor frecuencia, lo cual se denomina Bimodal o en
otros casos más de dos valores, lo que se conoce como multimodal.
Nota: Cuando la media, mediana y moda son iguales en un conjunto
de datos, estos deben proceder de una distribución normal
4. Estadísticos de posición
Percentil: Dividen a la muestra en 100 partes
iguales
• La mediana es el percentil 50
• El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
Cuartiles: Dividen a la muestra en 4 grupos con
frecuencias similares.
• Primer cuartil = Percentil 25 =
• Segundo cuartil = Percentil 50 = mediana
• Tercer cuartil = Percentil 75 =
5. Importancia de la media, mediana y estadísticos de posición en el análisis
estadístico
1.Permiten definir grupos de comparación categorizando variables cuantitativas
2. La muestra se homogeniza al categorizar la variable ya que los grupos tienen
aproximadamente el mismo número de elementos.
3. Permiten determinar puntos de corte donde se encuentra significancia
estadística.
Virtudes
Resiliencia total
P< 84,09 >= 84,09
Media (Ds) Media (Ds)
Sabiduría 4,04 (0,4) 4,4 (0,35) 0,000
Coraje 4,08 (0,4) 4,45 (0,33) 0,000
Humanidad 4,12 (0,42) 4,46 (0,36) 0,000
Justicia 4,17 (0,43) 4,42 (0,42) 0,000
Templanza 3,87 (0,47) 4,14 (0,47) 0,000
Trascendencia 4,11 (0,42) 4,43 (0,36) 0,000
Cuadro N° 1.
Comparación del puntaje promedio de las virtudes por resiliencia total
Universidad de Los Andes - Facultad de Medicina
Mérida, Venezuela. Año 2011
Resiliencia
Grupo de Edad
P≤ 21 > 21
Media (DS) Media (DS)
Inicio
Escala de Resiliencia 75,94 (13,11) 80,00 (9,70) 0,26
Competencia personal, tenacidad y
control 85,89 (12,8) 92,09 (11,22) 0,08
Confianza en si mismo 67,67 (17,25) 77,38 (14,41) 0,04
Aceptación positiva al cambio 79,51 (13,15) 82,14 (13,51) 0,48
Optimismo 72,18 (16,03) 71,88 (17,12) 0,95
Cuadro N° 2.
Comparación de la resiliencia por grupo de edad
Facultad de Farmacia y Bioanálisis
ULA. Año 2011
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
Así como las medidas de tendencia central nos permiten identificar el
punto central de los datos, las Medidas de dispersión nos permiten
reconocer que tanto se dispersan los datos alrededor del punto
central; es decir, nos indican cuanto se desvían las observaciones
alrededor de su promedio aritmético (Media)
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada
uno de los valores respecto a su punto central (media) al cuadrado.
1
)( 2
2
n
xxS
i
Desventajas
Es sensible a valores extremos (alejados de la media).
Su interpretación no es sencilla ya que las unidades de medida están
cuadrado.
Ventajas
De gran utilidad para determinar tamaños muestrales en estudios
posteriores
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
Desviación Estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de
los datos respecto a su punto central o media.
2SS Desventajas
Es sensible a valores extremos (alejados de la media).
Ventajas
Tiene las misma dimensionalidad (unidades) que la variable original.
Cierta distribución que veremos más adelante (normal o gaussiana) quedará
completamente determinada por la media y la desviación típica. De gran utilidad
para pruebas de hipótesis e intervalos de confianza
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
Error Estándar o Típica de la Media Muestral
Mide el grado de variabilidad de la media muestral con respecto a la media
poblacional. Se determina mediante el cociente entre la desviación estándar y
la raíz de n.
n
SS x
Es de gran utilidad para la inferencia estadística, para la elaboración de
intervalos de confianza para la media poblacional y para las pruebas de
hipótesis ya que permiten definir el estadístico de prueba.
7. Distribución normal (de gauss). Test de normalidad de los datos
La distribución normal o gaussiana es la distribución de probabilidad
más importante de la estadística, es una variable aleatoria continua con
media µ y varianza σ2 .
Propiedades de la distribución normal
1.Tiene forma de campana ya que es simétrica con respecto a la media
2. Todas las medidas de tendencia central son iguales (media, moda y
mediana)
3. Es unimodal
4. Rango de variación desde hasta
Medidas Básicas en Bioestadística
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss). Test de normalidad de los datos
La distribución normal en las pruebas estadísticas.
Existen pruebas estadísticas paramétricas y no paramétricas, las primeras
son de mayor precisión para detectar las relaciones existentes entre
variables, si es que estas existen, para llevar acabo este tipo de prueba es
necesario que los valores de la variable dependiente sigan una distribución
normal. Para ello se emplea la prueba de kolmogorov-smirnov para probar
normalidal
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Áreas de la Inferencia Estadística
1. Estimación
a) Estimación Puntual
b) Estimación Por Intervalos de Confianza
2. Prueba de Hipótesis
a) Pruebas de hipótesis para diferencias entre medias y/o
proporciones dos muestras (independientes, dependientes)
b) Experimentos de un factor (análisis de varianza para más de dos
muestras)
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza.
La estimación por intervalos se refiere al proceso de
determinar un intervalo de valores, el cual incluirá el
verdadero valor del parámetro, con un nivel de
confianza determinado y expresado en términos de
probabilidades.
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza.
Teorema del Límite Central.
Si es la media de una muestra aleatoria de tamaño
“n” tomada de una población con media µ y varianza
finita , entonces la forma límite de la distribución
de
X
2
nσ/
μXZ
Cuando n , se aproxima a la Distribución N(0,1) ∞
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza de µ con σ
conocida
Si es la media de una muestra aleatoria de tamaño
“n” de una población con varianza , conocida, un
intervalo de confianza de (1-α) 100% para µ está dado
por
X2
nzx
nzx
2/2/
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza para µ1-µ2
con σ1 y σ2 conocida
Si son las medias de muestras aleatorias
independientes de tamaño “n1 y n2” de poblaciones
normales con varianzas conocidas ,
respectivamente, un intervalo de confianza de (1-α)
100% para µ1-µ2 está dado por
2
2
1
1
2/2121
2
2
1
1
2/21)()(
nnzxx
nnzxx
21XyX
2
2
2
1 y
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Conceptos básicos.
Hipótesis estadística: es una aseveración o conjetura con respecto a una o
más poblaciones.
Hipótesis nula y alternativa: la hipótesis nula se refiere a la hipótesis que
deseamos someter a prueba se denota con H0. El rechazo de H0 conduce a la
aceptación de la hipótesis alternativa que se denota con H1.
Prueba de Hipótesis.
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Situaciones posibles al probar una hipótesis estadística
Resultado de la prueba
Realidad
H0 es verdadera H0 es falsa
Aceptar H0 Decisión correcta Error tipo II
Rechazar H0 Error tipo I Decisión correcta
Tipos de errores que se puede incurrir al probar una hipótesis estadística
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Procedimiento para pruebas de hipótesis.
1. Establecer las hipótesis nula y alternativa
2. Definir el nivel de significación α
3. Seleccionar la estadística de prueba apropiada (t-studen, F, otros.)
4. Calcular el valor de la estadística de prueba, a partir de los datos de la
muestra
5. Decisión
Medidas Básicas en Bioestadística
5. Distribución normal (de gauss).
Pruebas con respecto a una sola media (varianza conocida)
Estadística de prueba
nσ/
μXZ 0
Medidas Básicas en Bioestadística
5. Distribución normal (de gauss).
Pruebas con respecto a dos medias (varianza conocida)
Estadística de prueba
2
2
2
1
2
1
2121)μμ()XX(
Z
nn
Elaboración de gráficos y tablas
Obligación de revelar la fuente del dato
Artículo 16. Todas las personas naturales y jurídicas, privadas y públicas
que difundan información estadística están en la obligación de indicar la
fuente del dato.
Tutela del Secreto Estadístico
Artículo 19. Están amparados por el secreto estadístico los datos
personales obtenidos directamente o por medio de información
administrativa, que por su contenido, estructura o grado de desagregación
identifiquen a los informantes.