31
BIOESTADÍSTICA UNIVERSIDAD AUTONOMA DE NUEVO LEON FACULTAD DE CIENCIAS BIOLOGICAS POR: Dr Abraham Octavio Rdz de la Fuente

Estadistica y probabiliadd

Embed Size (px)

DESCRIPTION

estadistica inferencial y probabilidad

Citation preview

Page 1: Estadistica y probabiliadd

BIOESTADÍSTICA

UNIVERSIDAD AUTONOMA DE NUEVO LEONFACULTAD DE CIENCIAS BIOLOGICAS

POR: Dr Abraham Octavio Rdz de la Fuente

Page 2: Estadistica y probabiliadd

Datos generales

• Horas aula-teoría y/o práctica, totales:

72

• Horas extra aula, totales: 18• Modalidad: Escolarizada• Tipo de periodo

académico: 2° Semestre

• Tipo de Unidad de aprendizaje:

Obligatoria

• Área Curricular: ACFBP• Créditos UANL: 3

Page 3: Estadistica y probabiliadd

BREVE HISTORIA DE LA ESTADÍSTICA

• •Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas tablillas dearcilla para recopilar datos en tablas sobre la producción agrícola y losgéneros vendidos o cambiados mediante trueque.

• •En la Biblia observamos en uno de los libros del Pentateuco, bajo elnombre de Números, el censo que realizó Moisés después de la salidade Egipto. En el libro bíblico Crónicas describe el bienestar material delas diversas tribus judías.

• La palabra estadística es de origen italiano. Se deriva de la palabra

stato, Estado, y de statista, que es un hombre que se dedica a los

asuntos del Estado. El significado original de estadística era

entonces, una colección de hechos de interés para un hombre de

Estado.

• La mayoría de las civilizaciones antiguas recogían datos sobre losimpuestos recaudados, el número de soldados reclutados, baja debatallas, censos, etc.

• John Graunt (1623-1674) fue el primero en realizar tablas demortalidad y estudios demográficos.

Page 4: Estadistica y probabiliadd

Breve Historia…

La estadística moderna surge de la confluencia de dos disciplinas queevolucionaron de manera independiente: la aritmética de estado(estadísticas) y el cálculo de probabilidades. A la teoría de la probabilidadcontribuyeron entre otros los franceses Blaise Pascal (1623-1662), PierreFermant (1601-1665) y el suizo Jacques Bernoulli. Abraham de Moivre (1667-1754) combinó la estadística con la teoría de la probabilidad.

El Belga , Adolph Quetelet (1976-1894), fue el primero en aplicar métodosmodernos a conjuntos de datos y se le considera el padre de la estadísticamoderna por su insistencia en la importancia de aplicar métodos estadísticos.

Page 5: Estadistica y probabiliadd

Francis Galton (1822-1911) se interesó en el estudio de la herencia y suprincipal contribución fue el desarrollar métodos como la regresión y lacorrelación. Karl Pearson (1857-1936) descubrió en 1900 uno de losmétodos más importantes en la estadística “La distribución Ji cuadrada” ysentó las bases para gran parte de la estadística descriptiva y de correlación.

En el siglo XX Williams S. Gosset (1876-1937) quien escribía bajo elpseudónimo de “Student” dedujo la distribución “t” en el campo de lateoría de las pequeñas muestras.

Ronald A. Fisher (1890-1962) desarrolló la distribución “F” y fue la figuradominante del siglo XX, se desarrolló en los campos de la biología, genéticay agricultura, pero sus contribuciones crearon gran impacto en todas lasaplicaciones de la estadística. Se considera el padre del DiseñoExperimental. A la lista de los pioneros de su uso hay que añadir los de

Frank Yates, W.G. Cochran y G. E.P. Box,

Page 6: Estadistica y probabiliadd

MOMENTOS IMPORTANTES

EN LA HISTORIA DE LA

ESTADÍSTICA

Page 7: Estadistica y probabiliadd

Algunas razones para estudiar la estadística

a) Estamos rodeados de datos por todas partes.

b) Las técnicas estadísticas se usan para tomar decisiones en muchos de los aspectos que afectan nuestra vida.

c) El conocimiento de los métodos estadísticos ayuda a tomar decisiones con mayor efectividad.

La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla.

“El pensamiento estadístico será algún día tan necesario para el ciudadano competente como la habilidad de leer y escribir.”H.G. Wells.

Page 8: Estadistica y probabiliadd

Etapa I. Estadística Descriptiva y Probabilidad

Analizar conjuntos de datos por medio de métodos de estadística descriptiva para conocer características de muestras o poblaciones de origen biológico.

Reconocer las leyes y teorías de probabilidad en la solución de problemas estructurados para evaluar un evento probabilístico.

Evidencia 1. Reporte de problemas de casos en su área de competencia empleandoestadística descriptiva y probabilidad

Valor: 6% Evidencia 2 Exposición de la práctica de laboratorio de estadística descriptiva.

Valor: 4%

Producto Parcial de Aprendizaje (PPA) Reporte de investigación de la obtención de unamuestra y su análisis estadístico descriptivo como parte del producto integrador.

Valor: 10%

Primer Examen Parcial Valor: 5%

Segundo Examen Parcial Valor: 5%

Total = 30%

Page 9: Estadistica y probabiliadd

Etapa 2. Distribuciones de Probabilidad, Distribuciones Muestrales y Estimación.

Diferenciar las distribuciones de probabilidad en la solución de problemas que involucran tanto variables continuas como discretas del área de su competencia para evaluar eventos probabilísticos.Identificar las distribuciones muestrales de los diferentes parámetros poblacionales a partir de muestras extraídas aleatoriamente de una población para entender las bases de la estadística inferencial.Estimar los valores de los parámetros poblacionales a partir de sus respectivos estadísticos muestrales con la finalidad de comprender las bases de la estadística inferencial.

Evidencia 3 Reporte de la solución de problemas de distribuciones de probabilidad, distribuciones muestrales y estimación. Valor: 6%

Evidencia 4 Exposición de la práctica de laboratorio de distribuciones de probabilidad, distribuciones muestrales y estimación. Valor: 4%

Producto Parcial de Aprendizaje (PPA) Reporte de investigación de la estimación de parámetros poblacionales, utilizando los datos obtenidos en la primera etapa, que formará parte del producto integrador . Valor: 10%

Primer Examen Parcial Valor: 5%

Segundo Examen Parcial Valor: 5% Total = 30%

Page 10: Estadistica y probabiliadd

Etapa 3. Ensayos de Hipótesis, Regresión y Correlación Lineal.

Aplicar las diferentes distribuciones de probabilidad en ensayos de hipótesis que le ayudaran a realizar inferencias sobre una población a partir de muestras extraídas de la misma, en situaciones que suceden en el campo de su competencia..

Aplicar los modelos de Regresión y Correlación lineal en situaciones que suceden en el campo de su competencia con la finalidad de predecir y explicar la asociación entre dos variables de una población.

Evidencia 5 Reporte de solución de problemas de ensayos de hipótesis, regresión y correlación lineal simple. Valor: 6%

Evidencia 6 Exposición de la práctica de laboratorio de ensayos de hipótesis, regresión y correlación lineal. Valor: 4%

Producto Parcial de Aprendizaje (PPA) Reporte de investigación de la aplicación de la estadística inferencial en los conjuntos de datos obtenidos en la primera etapa. Este formara parte del PIA.. Valor: 20%

Cuarto Examen Parcial Valor: 5%

Sexto Examen Parcial Valor: 5% Total = 40%

Page 11: Estadistica y probabiliadd

DEFINICIÓN DE ESTADÍSTICA

La estadística es una rama de las matemáticas cuyafunción principal es proporcionar principios ymétodos para reunir, organizar, analizar einterpretar información.

Es además una disciplina que permite llegar aconclusiones válidas y tomar decisionesacertadas en la solución de problemas y en eldiseño de experimentos. La estadística se divideen dos ramas, como se muestra a continuación.

Page 12: Estadistica y probabiliadd

ESTADÍSTICA

DESCRIPTIVA Organiza y resumela información

INFERENCIAL

ESTADÍSTICADESCRIPTIVA

Describe conjuntos de datos a través de:Tablas de distribución de frecuenciasGráficasMedidas de tendencia centralMedidas de dispersiónCuartilesPercentilesSesgoCurtosis

Analiza e interpreta la información para llegar a

conclusiones.

Page 13: Estadistica y probabiliadd
Page 14: Estadistica y probabiliadd

Conceptos básicosPoblación. Es el conjunto o colección total de elementos acerca de los

cuales deseamos conocer alguna o varias características.

Muestra. Es un subconjunto de la población de interés.

Unidad de observación: Es cada uno de los elementos en donde hacemos las observaciones.

Variable. Es una característica de personas, animales, plantas o cosas y que pueden tomar diferentes valores. Pueden ser cualitativas o cuantitativas

Dato. Es cada uno de los valores que puede tomar una variable.

Medición. Asignar valores numéricos a las variables.

Estadístico. Es un valor numérico que describe una característica de la muestra.

Parámetro. Es un valor numérico que describe una característica de la población.

Page 15: Estadistica y probabiliadd

VARIABLES

CUANTITATIVAS

CUALITATIVAS

DISCRETAS

CONTINUAS

DISCRETAS

Las variables son de dos tipos: a) cualitativas o deatributos, son variables discretas ya que no pueden tomarcualquier valor entre dos valores dados, por ej., sexo delas personas y b) cuantitativas, pueden subdividirse endiscretas y continuas. Las cuantitativas discretas nopueden tomar cualquier valor entre dos valores dados porej., el número de glóbulos blancos en una rata (no hayfracciones de glóbulos blancos). Las cuantitativascontinuas si pueden tomar cualquier valor entre dosvalores dados, por ej., temperatura corporal de las ratas(el valor puede ser una fracción, por ejemplo 36.7 ºC)

Page 16: Estadistica y probabiliadd

VariablesVariables

CuantitativasCuantitativas

Intervalo

(No hay cero verdadero en su

origen)

Intervalo

(No hay cero verdadero en su

origen)

Proporción

(Hay un verdadero cero en su origen)

Proporción

(Hay un verdadero cero en su origen)

CualitativasCualitativas

Nominal

(se forman categorías

No hay un orden)

Nominal

(se forman categorías

No hay un orden)

Ordinal

(se forman categorías se pueden ordenar)

Ordinal

(se forman categorías se pueden ordenar)

Tipos de variables y sus niveles de medición

Page 17: Estadistica y probabiliadd

Escalas utilizadas para la medición:

a) Escala nominal.- Es la escala de medición más baja, puededesignarse por nombres o atributos y consiste en clasificar los datosen categorías. Son observaciones que sirven solo para identificar elfenómeno, son arbitrarias y no tienen orden, sentido ni magnitud, porejemplo: clasificación de personas por categorías, como el sexo, colorde los ojos, estado civil, éxito y fracaso, etc... Con estos númerospodemos determinar, el número, fracción o tanto por ciento de loscasos. Usted puede contar o enumerar datos nominales pero no podráordenarlos ni cuantificarlos.

b) Escala ordinal.- Consiste en clasificar los datos en categoríasy ordenarlos o graduarlos. Son mediciones que reflejan de maneraaproximada el grado de intensidad de las propiedades de un fenómenode tal manera que permite agruparlos de mayor a menor o viceversa,por ejemplo: la intensidad del dolor lo podemos clasificar en 0= no haydolor; 1= leve; 2= moderado; 3=intenso. Algunas otras característicaspor ej. los resultados de una prueba química se califican con cruces (-,+, ++, +++, ++++). Usted puede contar o enumerar datos ordinales,pero no cuantificarlos.

Page 18: Estadistica y probabiliadd

Las escalas de medición de intervalo y de proporción clasifican y gradúan los datos y establecen también una unidad de medición, de tal modo que podamos decir que tanto mayor o menor es una medición respecto a otra.

c) Escala de intervalo.- Son observaciones ordenadas que reflejan las diferencias entre particularidades, se caracterizan por una medida común y constante, donde el punto cero y la unidad de medida son arbitrarias. Por ejemplo, para medir la temperatura con la escala centígrada y la Fahrenheit. El cero ha sido asignado en forma arbitraria al punto de congelación, correspondiendo 0°C a 32 °F. Esta escala permite realizar operaciones aritméticas como la media y la desviación estándar. Usted puede contar, ordenar y cuantificar datos en escala de intervalo.

d) Escala de proporciones o razones.- Son observaciones ordenadas, caracterizadas por una medida común y constante donde la escala es conocida y tiene un punto cero real en su origen. La longitud, el peso, volumen y la escala Kelvin de temperatura, etc., corresponden a este tipo. Para nuestros propósitos consideraremos a las escalas de intervalo-proporción (I-P) como una sola ya que las pruebas estadísticas aplicables a ambas son las mismas. Usted puede contar, ordenar y cuantificar datos en escala de proporción.

Page 19: Estadistica y probabiliadd

RATAS DE LABORATORIO

Peso, edad Número de crías

Color: negro, gris, blanco

Calidad del nido: excelente, bueno, regular, malo

AUTOMÓVILES Peso, longitud Número de defectos por auto

Colores Tamaño

EJEMPLO DE ALGUNAS POBLACIONES QUE PUEDEN PROPORCIONAR LOS CUATRO TIPOS DE MEDICIONES.POBLACIÓN IP CONTÍNUOS IP DISCRETOS NOMINAL ORDINAL

IP Intervalo-Proporción

Page 20: Estadistica y probabiliadd

MUESTREO

El muestreoes simplemente un procedimiento para conocer la población con base en una cantidad de elementos extraída de ella de cierta manera.

Es, en verdad, un gran logro científico "hacia un dominio intelectual del mundo que nos rodea", comenta Roy Jastram en Elements of Statistical Inference, "el generalizar en forma lógica y precisa miles de valores que no hemos visto, simplemente con las pruebas proporcionadas por cincuenta o cien de esos valores, es una herramienta valiosa de la estadística".

La teoría del muestreo que hace posible este tipo de inferencia tiene un fundamento en las características permanentes de los datos masivos, que se pueden resumir simple y precisamente con la frase "diversidad en la unidad“.

Población

N (Tamaño)μ (Media) δ2 (Varianza)δ (Desv. Est.)P (Proporción %)ρ (Coef. de Corr.) α, β (Coef. de Reg.)

nXS2

Spra, b

Muestra

Muestreo

Inferencia

Parámetros Estadísticos

Page 21: Estadistica y probabiliadd

¿Cuáles son las razones para el muestreo?

¿Cuál es la base teórica del muestreo?

¿Cómo se deben diseñar las muestras?

¿Cuáles son los métodos de recopilación de los datos muestrales?

¿Cómo puede extraerse la información deseada de los datos muestrales?

¿Cómo se puede utilizar la información muestral para deducir conclusiones acerca de la población que la produce?

¿Cómo se puede evaluar o medir la confiabilidad de las generalizaciones hechas acerca de la población a través de la muestra?

Conocer el tamaño de la población e Inferencia de las características poblacionales.

Las relaciones existentes entre una población y muestras extraídas de las mismas y determinar si las diferencias que se pueden observar entre dos muestras son debidas a la aleatoriedad.

Considerando el tamaño de la población , sus características y el objetivo del trabajo.

Muestras aleatorias o no, encuestas, hojas de campo y hojas de cálculo .

Mediante la descripción de la muestra, usando las distribuciones de probabilidad.

Mediante la inferencia estadística: Estimación y Ensayo de hipótesis

Mediante el uso de las distribuciones de probabilidad apropiadas.

Page 22: Estadistica y probabiliadd

Si se extrae una muestra aleatoria cada vez mayor de la misma población, las características de cada muestra aumentada - es decir, promedios, variaciones, asimetría, etc. - tenderán a diferir cada vez menos de las características de la población; es decir, cuanto mayor es la muestra es más representativa de la población.

Teoría del muestreo.La teoría de muestreo es un estudio de las relaciones existentes entre una población y muestras extraídas de las mismas. Es también útil para determinar si las diferencias que se pueden observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas.

En general, un estudio de inferencias, realizado sobre una población mediante muestras extraídas de la misma, junto con las indicaciones sobre la exactitud de tales inferencias aplicadas a la teoría de probabilidad, se conoce como inferencia estadística.

Las unidades muestrales pueden ocurrir individualmente o en grupos en la población. Un grupo de elementos, como una familia o una caja de cerillos se llama unidad de muestreo.Las unidades de muestreo son colecciones disjuntas de elementos de la población. En algunos casos una unidad muestral está constituida por un solo elemento.

Page 23: Estadistica y probabiliadd

Tipos de muestreo.Nos dedicaremos ahora a describir diversos procedimientos muestrales siguiendo la guía que se da a continuación:

Tipos demuestreo

Aleatorio(p1=p2=..=pN)

No aleatorio

No restringido o Simple

Restringidos

Estratificado

Agrupado (conglomerados)

Sistemático

Doble, Múltiple o Secuencial

Muestreo dirigidoMuestreo por cuotasMuestreo deliberadoMuestreo por accidente

La aplicación del muestreo aleatorio tiene como condición, de que todas los elementos de la población tienen la misma probabilidad de ser seleccionados. Mientras que en los no aleatoriosla probabilidad de los elementos de la población poseen diferente probabilidad.

Page 24: Estadistica y probabiliadd

Muestreo aleatorio simple.Al seleccionar una muestra aleatoria de n elementos de una población finita de N elementos, si el muestreo se lleva a cabo de forma que todas las muestras posibles de tamaño n tenga la misma probabilidad de ser seleccionadas, el muestreo se llama aleatorio y el resultado es una muestra aleatoria simple.

Muestreo Aleatorio Estratificado,Una muestra aleatoria estratificada es una muestra aleatoria que se obtiene separando los elementos de la población en grupos disjuntos, llamados estratos, y seleccionando una muestra aleatoria simple dentro de cada estrato.

Muestreo Aleatorio por Conglomerados.Una muestra por conglomerados se obtiene seleccionando aleatoriamente un conjunto de m colecciones de elementos muéstrales, llamados conglomerados, de la población y posteriormente llevando a cabo un censo completo en cada uno de los conglomerados.

En el muestreo aleatorio estratificado las unidades muéstrales son los elementos individuales de la población, mientras que en el muestreo por conglomerados las unidades muéstrales son conglomerados de los elementos.

Page 25: Estadistica y probabiliadd

Muestreo sistemático.Para obtener una muetra sistemática, se elige aleatoriamente un elemento dentro de los primeros k elementos del marco muestral y posteriormente se selecciona en forma sucesiva el k-ésimo elemento que sigue al ultimo que se obtuvo.

Muestreo Doble, Múltiple o Secuencial.Se obtienen dos muestras simples (Doble), o más (Múltiple) o que siguen cadadetermiado tiempo o espacio.

Muestreo Aleatorio por Conglomerados bi-etápicoCuando el tamaño de los conglomerados es muy grande o cuando los elementos de un conglomerados son muy similares, el muestreo de dos etapas constituye una alternativa eficiente para el muestreo por conglomerados.

En los muestreos no aleatorios, después de determinar el tamaño de la muestra, los elementos de la población serán seleccionados a criterio del investigador y del objetivo del trabajo que se está desarrollando.

Muestreos no Aleatorios

Page 26: Estadistica y probabiliadd

PARÁMETROS Y ESTADÍSTICOS

Los promedios o porcentajes por ej. Acerca de una característica quese desea conocer de una población se llaman parámetros. Estos seestimarán, es decir se calcularán de forma aproximada mediantevalores obtenidos de la muestra. Estos valores que se calculan conlos datos de la muestra se llaman estadísticos. Generalmente losparámetros se describen con letras griegas y los estadísticos conletras latinas.

PARÁMETROS ESTADÍSTICOS

MEDIA

VARIANZA

DESVIACIÓNESTANDAR

µσ²σP

POBLACIÓN

MUESTRA

X

S

Page 27: Estadistica y probabiliadd

En el siguiente esquema se describe de una manera muy simple como se lleva a cabo un estudio estadístico.

Page 28: Estadistica y probabiliadd

1) Probabilístico o aleatorio (extrapolable a la población)a) aleatorio simpleb) sistemático

Tipos de Muestreo c) estratificadod) conglomerados

2) No probabilístico o no aleatorio (no extrapolable a la población)a) conveniencia b) Por cuotas

El muestreo es simplemente un procedimiento para conocerla población con base en una muestra extraída de ella.

MUESTRA: Es un subconjunto de la población

Page 29: Estadistica y probabiliadd

MUESTREO PROBABILISTICO

Muestreo aleatorio simple

El tipo más común de muestreo probabilístico es el muestreoaleatorio simple. Aquí cada miembro de la población tiene unaprobabilidad igual e independiente de ser seleccionado comoparte de la muestra. Este tipo de muestreo consta de cuatropasos: a) definir la población de interés b) listar todos losmiembros de la población c) asignar números a cada miembro dela población y d) aplicar un criterio para seleccionar la muestradeseada.

Muestreo Sistemático.

En este tipo de muestreo se escoge cada k-ésimo nombre de la lista. El término k-ésimo representa un número entre 0 y el tamaño de la muestra que se desea. Por ejemplo aquí se usaría un muestreo sistemático para escoger 10 nombres de una lista de 50

Page 30: Estadistica y probabiliadd

Muestreo Estratificado

Los dos tipos de muestreo aleatorio que acabamos de ver funcionan bien si no nosinteresan características específicas de la población como: edad, sexo, grupo étnico,religión, etc. Cuando si nos interesan, debemos asegurarnos que el perfil de la muestracoincida con el perfil de la población y esto se hace con el muestreo estratificado.

Muestreo por conglomerados

Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de muestreo es una colección, o conglomerado de elementos y no los elementos mismos

Ejemplos de conglomeradosUnidad de análisis Posibles conglomeradosAdolescentes PreparatoriasObreros IndustriasAmas de casa Mercados Niños ColegiosPersonajes de televisión Programas de TV

Page 31: Estadistica y probabiliadd

MUESTREO NO PROBABILISTICO

Muestreo por conveniencia

Se le da igualmente el nombre de sesgado, en él, el investigador selecciona loselementos que a su juicio son representativos, lo cual exige un conocimiento previo dela población que se investiga para poder determinar categorías o elementos que seconsideran como tipo o representativos del fenómeno que se estudia. Por ejemplo, enun laboratorio de un hospital se está estandarizando un nuevo procedimiento paraanalizar plomo en orina. Se toman muestras del personal del hospital porque seríanmás confiables. Es una forma muy cómoda de generar una muestra pero no esaleatoria y tal vez ni representativa de la población.

Muestreo por Cuotas

Cuando se desea obtener una muestra estratificada según ciertas variables, pero por alguna razón no es posible efectuar un muestreo estratificado. En este caso, el muestreo por cuotas podría ser lo mejor.Se divide a la población en estratos o categorías y se asigna una cuota para las diferentes categorías, a juicio del investigador se seleccionan las unidades de muestreo. Se utiliza en estudios de opinión y de mercadotecnia. Por ejemplo, para un estudio sobre la actitud de la población hacia un candidato político, se les dice a los encuestadores que vayan a determinado lugar y entrevisten a 150 sujetos. Que el 25% sean hombres mayores de 30 años, 25% sen mujeres mayores de 30 años, 25% hombres menores de 30 años y 25% mujeres menores de 30 años.