41
Grados en Biología, Biotecnología y Ciencias Ambientales Facultad de Biología Herramientas de trabajo útiles en el grado Metodología de la investigación científica

Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

  • Upload
    others

  • View
    21

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Grados en Biología, Biotecnología y

Ciencias AmbientalesFacultad de Biología

Herramientas de trabajo útiles en el grado

Metodología de lainvestigación científica

Page 2: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Profesor: José Francisco Calvo Sendín | [email protected] | http://webs.um.es/jfcalvo

1. El método científico

2. Fundamentos de probabilidad

3. Contraste estadístico de hipótesis

4. Fundamentos del diseño experimental

5. Análisis estadístico: enfoques metodológicos

6. Análisis estadístico: estadísticos descriptivos

7. Análisis estadístico: métodos y modelos

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 3: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Metodología de la investigación científica

0. Antes de empezar

• Esta charla intenta proporcionar una visión amplia y generalista sobre diversas cuestiones aplicadas relacionadas con la (bio)estadística y los aspectos metodológicos de la investigación científica.

• José F. Calvo es profesor de ecología, no es profesor de estadística.

• Se proporciona como complemento un guion de ejercicios prácticos de análisis estadísticos utilizando el software R

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 4: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Metodología de la investigación científica

1. El método científico

Ciencia e hipótesis científicas

• La ciencia trata de explicar racionalmente la naturaleza obteniendo explicaciones sobre el funcionamiento de un sistema, o siendo capaz de predecir los resultados del sistema (Kéry y Schaub 2012).

• Science is a process for learning about nature in which competing ideas about how the world works are measured against observations (Richard Feynman, citado en Hilborn y Mangel 1997).

• Las hipótesis son las ideas o descripciones sobre cómo funciona el mundo.

• Dado que nuestras descripciones del mundo son casi siempre incompletas y nuestras medidas incorporan incertidumbre e imprecisión, necesitamos métodos que nos permitan evaluar el grado de concordancia entre las ideas confrontadas y las observaciones: la estadística (Hilborn y Mangel 1997).

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 5: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Metodología de la investigación científica

1. El método científico

Ciencia e hipótesis científicas

• Hipótesis y teoríasUna hipótesis científica se refiera a un mecanismo o relación causa-efecto particular. Una teoría científica es mucho más general y sintética (Gotelli y Ellison 2004) e implica un nivel de evidencia y soporte considerablemente mayor (Hilborn y Mangel 1997).

• Método científicoEs la técnica que se utiliza para decidir entre las hipótesis en base a las observaciones (Gotelli y Ellison 2004).

• Azar, variación, impredecibilidad, incertidumbreCualquier sistema que encontramos en la naturaleza (y cualquier faceta de la vida) es estocástico; es decir, sistemas que no son completamente predecibles porque incluyen procesos aleatorios que añaden un mayor o menor grado de variabilidad y, en consecuencia, de incertidumbre en sus resultados.

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 6: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Metodología de la investigación científica

1. El método científico

Modelos

Para interpretar formalmente cualquier observación necesitamos un modelo. Los modelos son herramientas para evaluar las hipótesis (Hilborn y Mangel 1997). Un modelo es una definición abstracta de cómo creemos que nuestras observaciones son el resultado de cantidades observables (datos) e inobservables (parámetros).

Los resultados de un sistema estocástico (la respuesta) pueden expresarse en forma de modelo estadístico:

𝐫𝐞𝐬𝐩𝐮𝐞𝐬𝐭𝐚 = 𝐩𝐚𝐫𝐭𝐞 𝐬𝐢𝐬𝐭𝐞𝐦á𝐭𝐢𝐜𝐚 + 𝐩𝐚𝐫𝐭𝐞 𝐞𝐬𝐭𝐨𝐜á𝐬𝐭𝐢𝐜𝐚

Pero… un modelo es una abstracción y, por tanto, siempre es incorrecto (Kéry2010).

“señal”, información estructural “ruido”, entropía

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 7: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

El papel de los modelos en ciencia: Dichos sobre los modelos científicos

Fuente: Kéry y Schaub (2012)

Modelling is as much art as it is science (McCullagh y Nelder)

All models are wrong, but some are useful (Box)

There has never been a straight line nor a Normal distribution in history, and yet, using assumptions of linearity and normality allows, to a good approximation, to understand and predict a huge number of observations (Youden)

Everything should be made as simple as possible, but not simpler (Einstein)

Nothing is gained if you replace a world that you don’t understand with a model that you don’t understand (Maynard Smith)

It is difficult to imagine another method that so effectively fosters clear thinking about a system than the use of a model written in the language of algebra (Kéry)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

1. El método científico

Page 8: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Contraste de hipótesis

Fuente: Wiens (1989)

Método hipotético-deductivo

Karl Popper (1902-1994)Fuente: Wikimedia Commons

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

1. El método científico

Page 9: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Cuatro visiones filosóficas de la ciencia

Filósofo Palabras clave Tipo de confrontación

Popper Falsación de hipótesisUna única hipótesis es refutada por confrontación con los datos.

KuhnParadigmas, ciencia normal, revolución científica

Una única hipótesis es utilizada hasta que exista mucha información de que ha sido “derrocada” por una hipótesis “mejor”.

Polanyi República de la ciencia

Se permiten múltiples visiones del mundo de acuerdo a diferentes opiniones de los científicos. La confrontación de estas visiones y los datos son juzgadas en función de su (i) verosimilitud, (ii) valor, (iii) interés.

LakatosPrograma de investigación científica

Confrontación de múltiples hipótesis con los datos como juez.

Fuente: Hilborn y Mangel (1997)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

1. El método científico

Page 10: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Probabilidad y estadística

• Son ciencias que tratan sobre la incertidumbre.

• Estudian las características de:

Sistemas estocásticos (descritos por los parámetros de un modelo).

Los efectos o resultados de dichos sistemas (los datos observados).

• La teoría probabilística especifica los parámetros y el modelo.

• La estadística intenta inferir (deducir) las propiedades del sistema, dado el modelo.

La inferencia estadística tiene como objetivo la estimación de las propiedades o características de una población a partir del análisis de una muestra de dicha población

“You can, for example, never foretell what any one man will do, but you can say with precision what an average number will be up to. Individuals vary, but the percentages remain constant. So says the statistician.”

Sherlock Holmes. The Sign of Four.

Metodología de la investigación científica

2. Fundamentos de probabilidad

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 11: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Probabilidad

Es la frecuencia esperada con la que ocurre un evento.

Midiendo la probabilidad

Si no hubiese incertidumbre en el

resultado no haría falta ni la probabilidad ni la

estadística

𝑃 =número de resultados

número de ensayos

𝑃 =número de hembras nacidas

número de individuos nacidos

0,0 ≤ 𝑃 ≤ 1,0

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

2. Fundamentos de probabilidad

Page 12: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Den

sid

ad

z

Variables aleatorias y distribuciones de probabilidad

La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso la probabilidad de que ocurra.

95%

𝑁(0,1)

Distribución normal (media = 0, desviación

estándar = 1)

-1,96 1,96Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

2. Fundamentos de probabilidad

Page 13: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Variables aleatorias y distribuciones de probabilidad

Ejemplos:

Distribución Media Varianza Comentarios

Bernoulli 𝑝 𝑝(1 − 𝑝) Un único experimento con dos posibles resultados

Binomial 𝑛𝑝 𝑛𝑝(1 − 𝑝) Secuencia de n ensayos de Bernoulli

Poisson 𝜆 𝜆 Eventos raros independientes

Uniforme(𝑏 − 𝑎)

2

(𝑏 − 𝑎)2

12Resultados equiprobables sobre el intervalo [a, b]

Normal 𝜇 𝜎2 Genera curvas simétricas para datos continuos

Log-normal 𝑒𝜇+𝜎2

2 𝑒𝜇+𝜎2

2 × 𝑒𝜎2 Para datos con asimetría positiva (right-skewed)

Exponencial Τ1 𝛽 Τ1 𝛽2 Distribución continua análoga a la de Poisson

Dis

cret

asC

on

tin

uas

Fuente: Gotelli y Ellison (2004)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

2. Fundamentos de probabilidad

Page 14: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Significación estadística y valores de P

El contraste de hipótesis se realiza mediante pruebas o test estadísticos. Un test produce un resultado numérico (un estadístico) y un valor de probabilidad asociado (P).

La hipótesis nula estadística (H0)

Establece un modelo simple que considera que las variaciones observadas en los datos son debidas al azar y no al efecto del factor o factores estudiados.

La hipótesis alternativa (H1)

En general, como hipótesis alternativas (una o varias), se definen las que sí consideran la existencia de efectos debidos al factor o factores estudiados.

Habitualmente se utiliza el criterio P < 0,05 para rechazar H0

Pero el rechazo de H0 NO implica aceptar H1 (solo sugiere que H1 puede ser cierta).

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 15: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

El valor de probabilidad (P, p, P-value, p-value)

Expresa la probabilidad de obtener los datos observados (y otros más extremos pero no observados) dado un modelo específico (definido por un parámetro o conjunto de parámetros θ):

Habitualmente el modelo considerado es la hipótesis nula (H0), y por tanto, el valor de P es la probabilidad de obtener unos datos (generalmente expresados como el resultado de un test estadístico) al menos tan extremos como los observados:

También es frecuente utilizar otras notaciones:

Pr (datos|H0)Pr {datos|H0}

P (datos|H0)

P ( y ≥ yobs|θ )

P no es la probabilidad de que

H0 “sea cierta”

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Page 16: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Errores en el contraste de hipótesis

Decisión:

Realidad: No rechazar H0 Rechazar H0

H0 ciertaDecisión correcta

(probabilidad = 1 – α)

Error Tipo I(probabilidad = α)

“falso positivo”

H0 falsaError Tipo II

(probabilidad = β )“falso negativo”

Decisión correcta(probabilidad = 1 – β )

Nivel de significación;

habitualmente α = 0,05

Poder o potenciaestadística: 1 – β

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Page 17: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Verosimilitud (likelihood)

De manera similar a un valor de P, la verosimilitud (ℒ) cuantifica la probabilidad de los datos dado un modelo. Pero ℒ solo usa los datos observados, no los más extremos e inobservados. :

La interpretación de ℒ es opuesta (como una versión inversa) a la de P: aquél valor 𝜃 que proporcione el máximo de la función de verosimilitud para los datos observados es considerado la mejor estima de θ (estimación de máxima verosimilitud, maximum likelihood estimate, MLE).

La verosimilitud de los datos es directamente proporcional a la probabilidad de obtener los datos observados dado el parámetro o parámetros estimados.

ℒ(θ | yobs ) ∝ P ( yobs | θ )

“es proporcional a” θ puede ser un escalar o un vector

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Page 18: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Verosimilitud (likelihood)

Las verosimilitudes son números muy pequeños, menores que 1, por lo que suele utilizarse más frecuentemente el logaritmo (natural) de la verosimilitud:

Un buen modelo es el que tiene una alta verosimilitud. Por tanto, cuanto mayor es logℒ, mejor es el ajuste del modelo a los datos.

Un valor de ℒ es, en sí mismo, irrelevante. Pero tiene utilidad comparativa. La razón de verosimilitudes (likelihood ratio) permite comparar cuánto más verosímil es un parámetro frente a otro:

También denotado como logLik, LL, L

ℒ(θ 2 | yobs ) / ℒ(θ 1| yobs )

logℒ

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Page 19: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Verosimilitud, desvianza y criterio de información de Akaike (AIC)

La desvianza (deviance) se calcula como:

siendo ℒs la verosimilitud del modelo saturado: aquél que tiene tantos parámetros como datos y, por tanto, tiene un “ajuste” perfecto.

El criterio de información de Akaike (Akaike’s information criterion) se calcula como:

siendo K el número de parámetros del modelo.

Al igual que la verosimilitud y la desvianza, el AIC proporciona una medida de la calidad relativa de un modelo, para un conjunto dado de datos. Cuanto menor sea el valor de AIC de un modelo, mejor es el ajuste.

−2 (logℒ − logℒs)

−2 (logℒ − logℒs) + 2K

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Page 20: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

El debate sobre la utilidad de P

La cultura científica basada en el uso de P ha dominado durante la mayor parte del siglo XX (y aún domina en el siglo XXI). No obstante, se tiende a abandonar su utilización y cada vez con mayor frecuencia se emplean como alternativa procedimientos de selección de modelos e inferencia multimodelo, nuevo paradigma para el análisis estadístico (Burnham y Anderson 2002).

En síntesis, un procedimiento de selección de modelos evalúa un conjunto de modelos “candidatos” (generalmente mediante el AIC) y realiza la estimación de parámetros en función de las estimaciones ponderadas de dicho parámetro en los diferentes modelos.

Se busca la “mejor” explicación posible para los datos observados (best approximating model) y, bajo esta perspectiva, el uso de Pno tiene sentido.

Portada del libro deBurnham y Anderson (2002)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Page 21: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Selección de modelos e inferencia multimodelo (model averaging)

Ejemplo: modelos de supervivencia del búho real (Bubo bubo) en función del sexo (hembras/machos), la población (Murcia/Sevilla) y el año (2007-2010).

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

3. Contraste de hipótesis estadísticas

Modelo AICc AICc wi K -2log(L)

S sexo 178.575 0.00 0.62111 2 174.544

S sexo + población 180.462 1.89 0.24174 3 174.400

S nulo 182.457 3.88 0.08913 1 180.447

S población 183.848 5.27 0.04448 2 179.817

S sexo + año 189.488 10.91 0.00265 9 171.015

S año 192.334 13.76 0.00265 8 175.957

S población + año 194.099 15.52 0.00026 9 175.627Fuente: León-Ortega M et al. (2016). European Journal of Wildlife Research 62: 343-351© Carlos González Revelles

Page 22: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

• Diseño experimental:

Término que describe la estructura lógica de un experimento.

• Experimento:

Es una operación o procedimiento para testar una hipótesis.

• Unidad experimental:

División más pequeña de material experimental que recibe un tratamiento.

• Tratamientos y controles:

Tratamiento es un término general para cualquier conjunto de comparaciones. Entre los tipos tratamientos de un experimento debe figurar uno de control, que sirva de comparación para el análisis de los efectos (generalmente un no-tratamiento). En determinadas ocasiones (por ejemplo cuando se pretende determinar entre dos o mas tratamientos cuál es el mejor), cada tratamiento actuaría como control del resto.

Metodología de la investigación científica

4. Fundamentos del diseño experimental

[Krebs, 1999]

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 23: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Experimentos “manipulativos” y “experimentos” mensurativos

En sentido estricto, un experimento es un procedimiento de investigación en el que todos los factores ambientales están bajo control. Como consecuencia es imprescindible manipular las condiciones en las que se realiza el estudio: hablamos de experimentos “manipulativos” o estudios experimentales.

No obstante, muchas investigaciones utilizan procedimientos de obtención de la información “no manipulativos” que reciben la denominación de muestreos. El muestreo es un procedimiento de observación y medida exclusivamente: hablamos de estudios observacionales, “experimentos” mensurativos, o “experimentos naturales”.

Generalmente el tratamiento estadístico en ambos casos es idéntico, pero la diferencia radica en la confianza y generalidad que podemos atribuir a las conclusiones derivadas del estudio. En cualquier caso, los principios generales del diseño experimental deben ser igualmente aplicados.

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 24: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Elementos clave en el diseño experimental

1. Replicación y pseudorreplicación. Replicar consiste en disponer al menos de dos unidades experimentales por cada tipo de tratamiento. La incorrecta consideración de lo que constituye una unidad experimental se conoce como pseudorreplicación.

2. Aleatorización y espaciamiento. Otro aspecto fundamental es la distribución de las réplicas en el espacio: un esquema de disposición espacial aceptable debe considerar la adecuada separación o espaciamiento (interspersion) de aquellas unidades experimentales con el mismo tratamiento. Lo ideal es una distribución aleatoria.

3. Control del diseño. Por control del diseño nos referimos a la consideración de otros elementos que tiene por objeto reducir el error experimental: unidades experimentales homogéneas, variables adicionales, más replicas, diseños equilibrados, uso de bloques.

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 25: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Elementos clave en el diseño experimental

1. Replicación y pseudorreplicación

Fuente: Krebs (1999)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 26: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Elementos clave en el diseño experimental

2. Aleatorización y espaciamiento

Fuente: Krebs (1999)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 27: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Elementos clave en el diseño experimental

3. Control del diseño

Para reducir el error experimental (es decir, para que las conclusiones de las comparaciones estadísticas sean más precisas), hay que considerar:

a) usar unidades experimentales más homogéneas;

b) usar información de variables adicionales medidas en cada unidad experimental (análisis de la covarianza);

c) usar más réplicas;

d) usar un diseño experimental más eficiente: diseños equilibrados o“balanceados” (balancing) y uso de bloques (blocking).

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 28: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Factores (efectos) fijos y factores (efectos) aleatorios

Una variable la consideramos factor fijo cuando sus niveles o valores son considerados de interés específico en la investigación y son seleccionados o “deliberadamente”.

Una variable la consideramos como factor aleatorio cuando sus niveles o valores se seleccionan aleatoriamente entre todos los posibles. [No confundir con el concepto de variable aleatoria.]

Los efectos fijos son los que analizamos normalmente sobre observaciones estadísticamente independientes. Los efectos aleatorios surgen cuando tenemos más de una observación en cada unidad experimental (Venables y Ripley 2002).

Según los factores considerados, tenemos diseños (y modelos estadísticos) fijos, aleatorios o mixtos (si incluyen ambos tipos de efectos).

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 29: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Tipos (en función de la naturaleza de las variables) (Gotelli y Ellison 2004)

Tipos de diseño experimental (Krebs 1999)

1. Modelos lineales aditivos

2. Diseños factoriales

3. Diseños de bloques aleatorios

4. Diseños split-plot

5. Diseños anidados

6. Diseños de cuadrado latino

7. Diseños de medidas repetidas

8. Estudios de impacto ambiental

Variable independiente

Variable dependiente Continua Categórica

Continua Regresión ANOVA

Categórica Regresión logística Tabular

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

4. Fundamentos del diseño experimental

Page 30: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Metodología de la investigación científica

5. Análisis estadístico: enfoques metodológicos

• Análisis paramétrico

• Análisis Bayesiano

• Análisis de Monte Carlo

• Análisis no paramétrico

• Selección de modelos e inferencia multimodelo

• Análisis paramétrico (clásico, convencional o frecuentista)

Asume que los datos se ajustan a un determinado tipo de distribución conocida.

Estima los parámetros de dicha distribución a partir de los datos.

Ronald Fischer (1890-1962)Fuente: Wikimedia Commons

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 31: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Thomas Bayes (1702-1761)Fuente: Wikimedia Commons

Análisis Bayesiano

El análisis Bayesiano es mucho más antiguo (s. XVIII) que el frecuentista, pero es más complejo y su uso no se ha generalizado hasta el desarrollo de software accesible para la mayoría de usuarios (WinBUGS).

La estadística Bayesiana también asume que los datos se ajustan a una distribución, pero los parámetros se estiman no solo a partir de los datos. Por tanto, la probabilidad se usa para expresar la incertidumbre sobre un parámetro(en estadística clásica es sobre los datos).

La receta para un análisis Bayesiano es (Lindley 1983):

¿Qué es lo que no sabes y te interesa? Llámalo θ.

¿Qué sabes? Llámalo D.

Ahora calcula P (θ |D).

¿Cómo? Usando las reglas de probabilidad.

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

5. Análisis estadístico: enfoques metodológicos

Page 32: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Probabilidad condicional y Teorema de Bayes

Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B (probabilidad de A dado B):

Teorema de Bayes:

𝐴

𝐵

𝐴 ∩ 𝐵 𝑆

Conjunto de todos los resultados

posibles

𝑃 𝐴 𝐵 =𝑃 𝐵 𝐴 𝑃(𝐴)

𝑃(𝐵)

área de B / área de S

𝑃 𝐴 𝐵 =𝑃(𝐴 ∩ 𝐵)

𝑃(𝐵)

Probabilidad conjunta de A y B

prior (distribución o probabilidad

previa)

posterior(distribución o probabilidad

posterior)𝑃𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 =

𝑉𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 × 𝑃𝑟𝑖𝑜𝑟

𝐸𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

5. Análisis estadístico: enfoques metodológicos

verosimilitud

Page 33: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

• Análisis de Monte Carlo (tests de aleatorización)

No asume ningún tipo de distribución paramétrica de los datos (por ejemplo, normalidad). Utiliza la aleatorización de los datos observados (permutaciones aleatorias).

• Análisis no paramétrico

Se fundamentan en el análisis de los datos transformados en sus rangos (número de orden), pero son un caso especial de análisis de Monte Carlo.

Actualmente su uso no se recomienda (Gotelli y Ellison 2004) porque:

a) con la transformación se pierde mucha información,

b) las técnicas paramétricas son a menudo “robustas” frente las violaciones de las asunciones, y

c) solo hay métodos disponibles para análisis simples.

• Selección de modelos e inferencia multimodelo: punto 7

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

5. Análisis estadístico: enfoques metodológicos

Page 34: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Exactitud y precisión

Son dos aspectos fundamentales en el proceso de obtención de datos. La ausencia de exactitud se denomina sesgo (bias). La precisión se refiere a la dispersión de los datos y se relaciona con la repetibilidad y la reproducibilidad.

Metodología de la investigación científica

6. Análisis estadístico: conoce tus datos

Fuente: Wikimedia Commons

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 35: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Representa tus datos> sewage

> attach(sewage)

Variable de respuesta (dependiente)

Tratamiento (variable

categórica independiente)

Covariable

Tamaño de la

muestra (8 + 8)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

6. Análisis estadístico: conoce tus datos

Page 36: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Representa tus datos> hist(coliform)

> plot(day, coliform, col=factor(method))

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

6. Análisis estadístico: conoce tus datos

Page 37: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Box plot (box-and-whisker plot, diagrama de caja)> boxplot(coliform ~ method)

Fuente: Wikimedia Commons

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

6. Análisis estadístico: conoce tus datos

Page 38: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Barras de error

Barra de error Tipo Descripción Fórmula

Rango DescriptivoAmplitud entre los extremos de los datos

El mayor valor menos el menor

Desviación estándar (SD)

DescriptivoDiferencia media entre los datos y su media SD =

σ (𝑥𝑖− ҧ𝑥2

𝑛 − 1

Error estándar InferencialMedida de la variabilidad de la media, si el estudio se repite muchas veces

SE = ΤSD 𝑛

Intervalo de confianza (CI)

Inferencial

Intervalo de valores entre los cuales se estima que estará la media verdadera con una determinada probabilidad de acierto

ҧ𝑥 ± 𝑡𝜐,1− Τ𝛼 2 × SE

Fuente: Cumming et al. (2007)

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

6. Análisis estadístico: conoce tus datos

Page 39: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Requisitos de normalidad y homocedasticidad. Transformaciones

La aplicación de los test paramétricos presenta una serie de requisitos que deben cumplir los datos: independencia, normalidad (ajuste a una distribución normal) y homogeneidad de varianzas (homocedasticidad).

La independencia se consigue con un diseño experimental (o de muestreo) adecuado. Si tenemos datos no independientes hay que utilizar las técnicas adecuadas para analizarlos (modelos mixtos).

La normalidad y la homocedasticidad (en el caso de variables continuas) se pueden conseguir a través de transformaciones (por ejemplo aplicando logaritmos).

No obstante, los tests paramétricos suelen ser “robustos” frente a las violaciones de estos requisitos.

Herramientas de trabajo útiles en el grado – Facultad de Biología

Metodología de la investigación científica

6. Análisis estadístico: conoce tus datos

Page 40: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Guion de ejercicios prácticos

ANOVA, regresión lineal y ANCOVA

ANOVA de dos factores

Modelos lineales generalizados

Más sobre regresión

Modelos mixtos

Modelos anidados

Análisis split-plot

Análisis de datos pareados

Tablas de contingencia, chi-cuadrado y análisis log-lineal

Tablas de contingencia con más de un factor

Selección de modelos e inferencia multimodelo

Metodología de la investigación científica

7. Análisis estadístico: métodos y modelos

Herramientas de trabajo útiles en el grado – Facultad de Biología

Page 41: Metodología de la investigación científica · Metodología de la investigación científica 1. El método científico Ciencia e hipótesis científicas • La ciencia trata de

Bibliografía recomendada

• Gotelli NJ, Ellison AM. 2004. A Primer of Ecological Statistics. Sinauer, Sunderland, MA.

• Krebs CJ. 1999. Ecological Methodology. 2ª ed. Benjamin/Cummings, Menlo Park, CA.

• Venables WN, Ripley BD. 2002. Modern Applied Statistics with S. 4ª ed. Springer, New York.

Otras referencias citadas

• Burnham KP, Anderson DR. 2002. Model Selection and Multimodel Inference. 2ª ed. Springer, New York.

• Cumming G, Fidler F, Vaux DL. 2007. Error bars in experimental biology. The Journal of Cell Biology, 177: 7-11.

• Hilborn R, Mangel M. 1997. The Ecological Detective. Confronting Models with Data. Princeton University Press, Princeton, NJ.

• Kéry M. 2010. Introduction to WinBUGS for Ecologists. Elsevier, Amsterdam.

• Kéry M, Schaub M. 2012. Bayesian Population Analysis Using WinBUGS. Elsevier, Amsterdam.

• Lindley DV. 1983. Theory and practice of Bayesian statistics. Statistician 32: 1-11.

• Royle JA, Dorazio RM. 2008. Hierarchical Modeling and Inference in Ecology. Elsevier, Amsterdam.

• Wiens JA. 1989. The Ecology of Bird Communities. Cambridge University Press, Cambridge.

Herramientas de trabajo útiles en el grado – Facultad de Biología