36
Máster en Metodología de la investigación 2014/15 Fundamentos de Diseño y Estadística Preguntas más frecuentes (FAQ) Tabla de contenidos Cuestiones generales sobre el funcionamiento del curso Q0.1 ¿Qué debo hacer si me he retrasado con el envío del test de una unidad? Q0.2 ¿Las fechas de los stages y exámenes finales presenciales son definitivas? Q0.3 ¿Puedo utilizar una calculadora diferente a la que se recomienda en el curso? Q0.4 ¿Se facilitan guías de uso para todo tipo de calculadoras? Q0.5 ¿Existe alguna recomendación-guía para efectuar las PEC? Q0.6 ¿Cómo se valora el trabajo de las PEC dentro de la evaluación global del curso? Q0.7 ¿Los errores de redondeo afectan la calificación de las PEC? Q0.8 ¿Cómo se asigna la calificación final del curso? Q0.9 ¿Se puede llevar material de consulta al examen final presencial en Barcelona? Q0.10 ¿Se puede asistir al examen final presencial de junio y también al de septiembre? Q0.11 ¿En caso de no poder asistir en la fecha del examen final presencial, se dispone de alguna posibilidad de realización de la prueba en una fecha extraordinaria? Q0.12 ¿Los exámenes presenciales finales en Barcelona tienen el mismo formato que las PEC? Q0.13 ¿Se pueden realizar las PEC en grupo? Q0.14 ¿Es obligatorio realizar los ejercicios complementarios que aparecen en la web el curso? Q0.15 ¿Se debe tener acceso al programa STATA para realizar el curso, o se debe saber usarlo? Q0.16 ¿Cómo se valora el trabajo de los tests dentro de la evaluación global del curso? Q0.17 ¿Se recomienda asistir a los stages aunque no se hayan estudiado todas las unidades que cubren? Q0.18 ¿Se puede asistir al stage 1 en una ciudad diferente a la que he sido convocado? Q0.19 ¿Se puede asistir a los stages de junio y/o septiembre en una fecha diferente a la que he sido convocado y/o he confirmado? Unidad 01: Descripción de datos cuantitativos Q01.1 ¿Cuántas líneas debe ocupar cada tallo cuando se dibuja el diagrama de tallo y hoja? Q01.2 ¿Es indispensable que al dibujar el diagrama de tallo y hoja se ajuste exactamente al número de líneas dado por la regla de Sturges? Q01.3 ¿En el diagrama de tallo y hoja se tienen que poner líneas para las cuales no hay hojas? Q01.4 ¿Cómo se debe considerar la puntuación Apgar, categórica o métrica? Q01.5 ¿Cómo es posible que al calcular los cuartiles primero y tercero con la fórmula “Haverage" se obtengan resultados distintos a los que se obtienen al calcular los cuartos de Tukey? Q01.6 ¿El diagrama de caja sólo se puede dibujar con los cuartos datos por la fórmula de Tukey? Q01.7 ¿Es posible que para una distribución de valores el resultado obtenido con el coeficiente de variación sea superior al valor de la desviación estándar? Q01.8 ¿Por qué es incorrecta la expresión media+-SD? Q01.9 ¿Cómo se dibuja un polígono de frecuencias? Q01.10 ¿Qué valores corresponden a las “patillas” superior e inferior del diagrama de caja? Q01.11 ¿La escala de medida de la variable “consumo de cigarrillos-día” es contínua? Q01.12 ¿Cuándo se mide la edad de un sujeto siempre debe registrarse añadiendo 0,5 años al valor dado por la persona?

Tabla de contenidos - UAB Barcelona

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tabla de contenidos - UAB Barcelona

Máster en Metodología de la investigación 2014/15 Fundamentos de Diseño y Estadística Preguntas más frecuentes (FAQ)

Tabla de contenidos

Cuestiones generales sobre el funcionamiento del curso Q0.1 ¿Qué debo hacer si me he retrasado con el envío del test de una unidad? Q0.2 ¿Las fechas de los stages y exámenes finales presenciales son definitivas? Q0.3 ¿Puedo utilizar una calculadora diferente a la que se recomienda en el curso? Q0.4 ¿Se facilitan guías de uso para todo tipo de calculadoras? Q0.5 ¿Existe alguna recomendación-guía para efectuar las PEC? Q0.6 ¿Cómo se valora el trabajo de las PEC dentro de la evaluación global del curso? Q0.7 ¿Los errores de redondeo afectan la calificación de las PEC? Q0.8 ¿Cómo se asigna la calificación final del curso? Q0.9 ¿Se puede llevar material de consulta al examen final presencial en Barcelona? Q0.10 ¿Se puede asistir al examen final presencial de junio y también al de septiembre? Q0.11 ¿En caso de no poder asistir en la fecha del examen final presencial, se dispone de alguna

posibilidad de realización de la prueba en una fecha extraordinaria? Q0.12 ¿Los exámenes presenciales finales en Barcelona tienen el mismo formato que las PEC? Q0.13 ¿Se pueden realizar las PEC en grupo? Q0.14 ¿Es obligatorio realizar los ejercicios complementarios que aparecen en la web el curso? Q0.15 ¿Se debe tener acceso al programa STATA para realizar el curso, o se debe saber usarlo? Q0.16 ¿Cómo se valora el trabajo de los tests dentro de la evaluación global del curso? Q0.17 ¿Se recomienda asistir a los stages aunque no se hayan estudiado todas las unidades que cubren? Q0.18 ¿Se puede asistir al stage 1 en una ciudad diferente a la que he sido convocado? Q0.19 ¿Se puede asistir a los stages de junio y/o septiembre en una fecha diferente a la que he sido

convocado y/o he confirmado? 

Unidad 01: Descripción de datos cuantitativos Q01.1 ¿Cuántas líneas debe ocupar cada tallo cuando se dibuja el diagrama de tallo y hoja? Q01.2 ¿Es indispensable que al dibujar el diagrama de tallo y hoja se ajuste exactamente al número de

líneas dado por la regla de Sturges? Q01.3 ¿En el diagrama de tallo y hoja se tienen que poner líneas para las cuales no hay hojas? Q01.4 ¿Cómo se debe considerar la puntuación Apgar, categórica o métrica? Q01.5 ¿Cómo es posible que al calcular los cuartiles primero y tercero con la fórmula “Haverage" se

obtengan resultados distintos a los que se obtienen al calcular los cuartos de Tukey? Q01.6 ¿El diagrama de caja sólo se puede dibujar con los cuartos datos por la fórmula de Tukey? Q01.7 ¿Es posible que para una distribución de valores el resultado obtenido con el coeficiente de

variación sea superior al valor de la desviación estándar? Q01.8 ¿Por qué es incorrecta la expresión media+-SD? Q01.9 ¿Cómo se dibuja un polígono de frecuencias? Q01.10 ¿Qué valores corresponden a las “patillas” superior e inferior del diagrama de caja? Q01.11 ¿La escala de medida de la variable “consumo de cigarrillos-día” es contínua? Q01.12 ¿Cuándo se mide la edad de un sujeto siempre debe registrarse añadiendo 0,5 años al valor dado

por la persona? 

Page 2: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 2

Q01.13 ¿Es adecuado calcular y comparar medias entre grupos para escalas analógicas? Q01.14 ¿Para qué sirve la amplitud o rango? Q01.15 Cuando tenemos un tiempo transcurrido (como la edad gestacional) expresado en semanas y días

(ejemplo, 40 semanas y 2 días), ¿en la matriz de datos las semanas son una variable y los días otra? 

Q01.16 ¿Son comparables el coeficiente de variación obtenido a partir de la desviación estándar y la media de una variable y el coeficiente de variación cuartil? 

Q01.17 ¿Es lo mismo desviación estándar que desviación típica? Q01.18 ¿Cómo se calculan los días transcurridos entre dos fechas? Q01.19 ¿Se puede calcular el intervalo del 95% central de las observaciones si la distribución es

asimétrica? Q01.20 ¿Son el mismo concepto “simetría” y “normalidad”? Q01.21 ¿Para qué sirve conocer el número de valores desconocidos (missing) de un estudio? 

Unidad 02: Descripción de datos categóricos Q02. 1 Si se desea describir la frecuencia de un evento en un estudio transversal, ¿cuándo se debe utilizar

la proporción y cuándo la odds? Q02.2 ¿Por qué no tiene sentido dibujar un diagrama de pareto en distribuciones categóricas ordinales? Q02.3 ¿Es cualquier cociente una razón? Q02.4 ¿Por qué una tasa absoluta no mide adecuadamente el ritmo con el que se presenta un evento? 

Unidad 03: Teoría de la probabilidad y pruebas diagnósticas Q03. 1 ¿Cómo se resuelve paso a paso el ejemplo planteado por el lanzamiento del disco? Q03.2 ¿El resultado de una prueba diagnóstica siempre se representa mediante una variable dicotómica? Q03.3 Cuando se estudia la validez de una prueba diagnóstica, ¿es necesario que el grupo de los “no

enfermos” esté formado por sujetos “clínicamente sanos”? Q03.4 ¿Para valorar pruebas diagnósticas siempre se utilizan diseños de caso-control? Q03.5 ¿Por qué con una prueba diagnóstica cuantitativa no es suficiente con calcular la sensibilidad y la

especificidad, y debe calcularse el área bajo la curva ROC? Q03.6 ¿Cómo se evalúa el "coste" de los falsos positivos y negativos en el momento de valorar una

prueba diagnóstica? Q03.7 ¿Qué hacer si los índices de exactitud (Se y Sp) de una prueba diagnóstica son buenos pero los

valores predictivos son muy malos? 

Unidad 04: Descripción de datos de supervivencia (unidad opcional) Q04.1 Algunos cálculos dados en esta unidad se basan en el Teorema de Tales. ¿En qué consiste este

teorema? Q04.2 ¿A partir de qué valor se considera alta la proporción de sujetos perdidos en un estudio de

seguimiento? Q04.3 ¿Qué se debe utilizar para describir la tendencia central de la distribución de supervivencia, la

media o la mediana? Q04.4 ¿Por qué no se puede calcular la media aritmética en distribuciones con datos censurados? Q04.5 Para calcular la tasa relativa media de incidencia de "muertes" o probabilidad condicionada por

unidad de tiempo (fórmula 4-12), ¿por qué no se usa el número medio de "muertes" y sí se usa el número medio de expuestos? 

Q04.6 ¿Se pueden comparar a nivel estadístico dos o más curvas de supervivencia? 

Unidad 05: Leyes de probabilidad Q05.1 La Tabla de la ley Normal presenta las probabilidades p(z) para valores positivos de z. ¿Cómo se

obtienen las correspondientes probabilidades para valores negativos? Q05.2 Concepto de muestreo finito-infinito, sin reposición-con reposición Q05.3 ¿Por qué con algunos problemas de la ley Normal a veces al valor dado por las Tablas Z se le

resta 1 y otras veces no? Q05.4 ¿En los cálculos con la ley Binomial, cómo se debe proceder si al calcular 100! con la calculadora

da error? Q05.5 ¿Cómo se comprueba que una distribución de valores se ajusta a una ley Normal? 

Page 3: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 3

Unidad 06: Estimación de parámetros Q06.1 ¿Por qué el intervalo de confianza no se puede interpretar en términos de probabilidad o de riesgo? Q06.2 ¿Cómo se calcula el intervalo de confianza de una media, con valores t o z? Q06.3 ¿Con datos cuantitativos es suficiente considerar muestra grande a partir de n=30? Q06.4 ¿Es lo mismo error estándar que desviación estándar? Q06.5 ¿Por qué no se debe dar en una publicación el error estándar, si es muy frecuente verlo publicado? Q06.6 ¿Es lo mismo teoría de la probabilidad que estadística? Q06.7 ¿Cómo se obtiene el valor t que se utiliza en la fórmula del IC de las medias si el número de grados

de libertad no aparece en la correspondiente tabla? Q06.8 ¿Cómo se efectúa una interpolación lineal para conocer un valor que no viene en el libro de tablas

del curso? 

Q06.9 ¿Se pueden comprobar las condiciones de aplicación del IC de asintótico-aproximado con la proporción observada en la muestra (po)? 

Q06.10 ¿De un modo practico, qué diferencia hay entre intervalo de probabilidad y de confianza? Q06.11 ¿Qué se debe hacer si para calcular el tamaño de muestra desconozco totalmente el valor del

parámetro “Pi” en la población? Q06.12 ¿Es lo mismo error estándar que error típico? Q06.13 ¿Qué se entiende por intervalo de confianza asintótico? 

Unidad 07: Comprobación de hipótesis Q07.1 ¿El cálculo del grado de significación siempre se debe efectuar con tablas? Q07.2 ¿En qué casos el grado de significación P se puede considerar una medida de la intensidad de la

relación entre una exposición y una respuesta? Q07.3 ¿Por qué razón el grado de significación P depende del tamaño de la muestra? Q07.4 ¿En un artículo, comunicación, etc., cómo se indica el grado de significación cuando el ordenador

presenta el valor .000? Q07.5 ¿Cómo se decide cuál es el umbral a partir del cual una diferencia se considera importante práctica

o clínicamente? Q07.6 ¿En qué criterios se basa considerar una diferencia importante a nivel clínico-práctico? Q07.7 ¿Cómo se efectúan las pruebas de significación que aparecen en esta unidad? Q07.8 ¿Cuándo fijar delta positivo y negativo en pruebas de no inferioridad? Q07.9 ¿Es recomendable plantear pruebas unilaterales con el propósito de incrementar la probabilidad de

rechazar la hipótesis nula? 

Unidad 08: Diseño de estudios Q08.1 ¿Los resultados estadísticamente significativos indican que los cambios en una exposición son “la

causa” de las modificaciones de una respuesta? Q08.2 Si se estudia la relación (no ajustada) entre una exposición X y una respuesta Y, y el resultado es

estadísticamente no significativo, ¿esto podría ser debido al efecto de una variable de confusión? Q08.3 ¿Una variable puede ser a su vez confundidora y modificadora del efecto? Q08.4 ¿Es lo mismo hablar de potencia estadística que de potenciación? Q08.5 ¿La interacción es solamente propia de diseños no experimentales? 

Unidad 09: Comparación de dos proporciones. Medidas de asociación Q09.1 ¿Si no se dispone de un programa de inferencia exacta, y la prueba de homogeneidad Ji-cuadrado

no cumple las condiciones de aplicación, es incorrecto dar el resultado de la prueba de Fisher? Q09.2 ¿Qué es preferible dar como medida de asociación, la diferencia de proporciones o la razón de

proporciones? Q09.3 ¿Por qué se considera que el IC de la diferencia de proporciones es no significativo si incluye el 0 y

el IC de la razón de proporciones es no significativo si incluye el valor 1? 

Unidad 10: Relación entre dos variables categóricas. Pruebas de Ji-cuadrado Q10.1 ¿En una tabla de 2×2 es mejor obtener el grado de significación con la prueba Z o con la de Ji-

cuadrado? Q10.2 ¿Cómo se obtiene el grado de significación P para un valor Ji-cuadrado a partir de la Tabla T3? Q10.3 ¿Cómo se calcula el coeficiente de correlación en una tabla 2×2? 

Page 4: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 4

Q10.4 ¿La prueba de la razón de verosimilitud es análoga al Ji-cuadrado de Pearson? Q10.5 ¿Con una variable independiente con categorías ordenadas, es mejor utilizar la prueba de

tendencia lineal o la prueba de homogeneidad? Q10.6 ¿En la prueba de tendencia lineal, qué implica una tendencia cuadrática significativa? Q10.7 ¿En tablas 2×2, qué es mejor realizar la prueba de comparación de proporciones con la prueba Z o

con un Ji-cuadrado? Q10.8 ¿Cuándo se deben usar las pruebas incondicionales y cuándo la prueba exacta de Fisher? 

Unidad 11: Comparación de dos medias. Pruebas t Q11.1 ¿Puede efectuarse la comparación de dos medias con la prueba Z si la muestra es grande? Q11.2 ¿Si el resultado de la prueba de significación que compara dos medias es no significativo es

obligado dar el intervalo de confianza de la diferencia de medias? Q11.3 ¿Qué prueba de normalidad es más recomendable, la de Kolmogorov o la de Shapiro-Wilks? Q11.4 ¿Se puede prescindir estudiar la normalidad de las distribuciones si las muestras superan 30

sujetos? Q11.5 ¿Qué son las pruebas no paramétricas? Q11.6 ¿En qué ocasiones se usa la transformación logarítmica para normalizar una distribución de

valores? Q11.7 ¿Cómo puedo saber cuántos empates tienen los datos con el objeto de valorar si una determinada

prueba no paramétrica es o no adecuada? Q11.8 ¿Con datos asimétricos, puedo usar pruebas no parámetricas y a la vez estimar el IC de la

diferencia de medias? Q11.9 ¿En un estudio con VI cuantitativa y VD binaria se puede aplicar un t-test de comparación de 2

medias? Q11.10 ¿Por qué es posible utilizar la prueba clásica del t-test en muestras grandes si se presentan

anomalías? 

Unidad 12: Comparación de varias medias. Análisis de la variancia Q12.1 ¿Qué aspecto de una relación valoran la tendencia lineal y la cuadrática? Q12.2 ¿Cómo se interpreta el análisis de la variancia de tendencias? Q12.3 ¿Qué significa que los contrastes ortogonales sean redundantes? Q12.4 ¿Existen contrastes “a posteriori” para el supuesto de variaciancias distintas? Q12.5 ¿Con contrastes polinómicos, se debe interpretar los términos que el STATA etiqueta como

“ponderados” o como “no ponderados”? Q12.6 ¿Cómo se asignan coeficientes a los contrastes? 

Unidad 13: Correlación y regresión lineal Q13.1 ¿Cómo se valora a nivel estadístico la confusión en un diseño no experimental? Q13.2 ¿Qué es el coeficiente “Beta” en un modelo de regresión lineal? Q13.3 ¿Qué es el “análisis de la covariancia” (ANCOVA)? Q13.4 ¿Cómo se obtienen con la calculadora SS(X) y SS(Y)? Q13.5 ¿Qué es el coeficiente R cuadrado ajustado y cuándo se utiliza? Q13.6 ¿Por qué no se pueden efectuar predicciones fuera del rango de variación de la variable

independiente? 

Unidad 14: Medida del cambio. Análisis de diseños con medidas intrasujeto Q14.1 ¿Qué se entiende por estudio de la “simetría relativa” en datos categóricos? Q14.2 ¿Cómo se realiza la comparación de varias medias con medidas repetidas? Q14.3 ¿Por qué la kappa ponderada da un resultado superior a la kappa no ponderada? 

Page 5: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 5

Cuestiones generales sobre el funcionamiento del curso

Q0.1 ¿Qué debo hacer si me he retrasado con el envío del test de una unidad?

En relación a las autoevaluaciones que acompañan cada unidad didáctica, el calendario que os facilitamos para la realización del curso es meramente orientativo, y tiene como objetivo ayudaros a planificarlo. No pasa nada si alguien se demora con la preparación de alguna unidad y por ello demora el envío de la solución. Se trata de enviar las cosas de acuerdo a vuestra agenda personal. Nuestra recomendación es que intentéis ajustaros lo máximo posible a las fechas que os sugerimos. Ir dejando las cosas hace que al final haya una cantidad ingente de trabajo y en ocasiones conlleva que alguien no acabe a tiempo para poder venir al examen final. De todos modos, tampoco os agobies si de forma ocasional no podéis ajustaros a la agenda propuesta. Lo que sí es fundamental es adaptarse a la fecha de envío de las PECs. No se recogen-corrigen pruebas que lleguen en fechas posteriores a los plazos que fijan los profesores.

Volver a Tabla de contenidos

Q0.2 ¿Las fechas de los stages y exámenes finales presenciales son definitivas?

En efecto. Estas fechas, que se conocen en el momento de la inscripción al curso, son fijas y no se cambian. El curso no prevé realizar exámenes especiales para alumnos que tengan dificultades para la asistencia a estas sesiones. Por este motivo se programa el examen extraordinario de septiembre destinado a los alumnos que por cualquier motivo no pueden asistir al examen ordinario de junio. No obstante, también se permite acceder al examen de septiembre a los alumnos que no han superado la evaluación de junio.

Volver a Tabla de contenidos

Q0.3 ¿Puedo utilizar una calculadora diferente a la que se recomienda en el curso?

Por supuesto. Es más, seguro que muchos de vosotros ya disponíais de una calculadora antes de apuntaros al curso. Si vuestra máquina dispone de funciones estadísticas para dos series de valores (por ejemplo, os permite estimar los parámetros A y B de una recta de regresión o el coeficiente de correlación de Pearson), es mejor no comprar una nueva máquina.

Volver a Tabla de contenidos

Q0.4 ¿Se facilitan guías de uso para todo tipo de calculadoras?

Los responsables del curso no disponemos de los recursos necesarios para elaborar tantas guías de uso como modelos de calculadora existen en el mercado. Nuestro equipo de profesores se limita a prestar una ayuda para la máquina que recomendamos en el curso. Si tenéis un modelo distinto, revisad nuestra guía (seguro que es útil, ya que no hay tantas diferencias entre modelos) y leed también atentamente la guía de instrucciones que acompaña a vuestra maquina.

Volver a Tabla de contenidos

Q0.5 ¿Existe alguna recomendación-guía para efectuar las PEC?

Las PEC constituyen ejercicios que abarcan los contenidos más relevantes que se estudian en el curso. Es recomendable que estas pruebas se resuelvan, en la medida de lo posible, de forma simultánea a la preparación de las unidades. A la hora de resolver una PEC es imprescindible que leáis atentamente las indicaciones que aparecen en la primera página, donde se especifican las instrucciones para responder las preguntas, la forma en que la prueba será valorada y el modo de envío. Podéis comentar aspectos relativos a las PEC a través del foro. Sin embargo, los profesores no participaremos en estos debates porque se pretende que lleguéis a soluciones de forma autónoma, y en la medida de lo posible, individual. Únicamente intervendremos si se detecta algún error en los enunciados. La fecha límite para el envío de cada PEC será publicada con antelación suficiente, y no se aceptarán ejercicios llegados en días posteriores. Finalizado el plazo de envío, os dejaremos en el campus virtual un documento con la solución comentada de todos los ejercicios. Simultáneamente, recibiréis una comunicación personal con la nota que cada uno ha obtenido.

Volver a Tabla de contenidos

Page 6: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 6

Q0.6 ¿Cómo se valora el trabajo de las PEC dentro de la evaluación global del curso?

Las PEC constituyen parte de la evaluación continuada, y aunque su entrega es optativa, es muy recomendable su realización. Para que se tengan en cuenta en la nota final, no es imprescindible la entrega de todas, y se debe haber obtenido una calificación igual o superior a 4 (escala 0-10) en el examen final presencial de Barcelona.

Volver a Tabla de contenidos

Q0.7 ¿Los errores de redondeo afectan la calificación de las PEC?

La cuestión referida al redondeo es uno de los aspectos que sí son evaluables en las PEC. Es importante que en disciplinas como la estadística aprendamos a ser lo más precisos y exactos posibles, tanto en lo que se refiere a la aplicación de procedimientos de análisis, como de comunicación de resultados y formulación de conclusiones. Pare evitar errores de precisión, en las PEC deben usarse las memorias de la calculadora, o en su defecto un número de decimales alto en los cálculos intermedios.

Volver a Tabla de contenidos

Q0.8 ¿Cómo se asigna la calificación final del curso?

La calificación final del curso se efectuará de acuerdo a los siguientes criterios:

- El examen presencial final es obligatorio. Cada alumno puede presentarse en la convocatoria que lo desee, y si se suspende en junio se puede recuperar en septiembre.

- Cada PEC puede contribuir con un 10% en la calificación final de curso.

- Si la nota obtenida en el examen presencial supera 4 puntos (en una escala de 0 a 10) y es superior al promedio de la nota de las PEC, la calificación final es igual a la nota del examen presencial.

- Si la nota obtenida en el examen presencial supera 4 puntos (en una escala de 0 a 10) y es inferior al promedio de la nota de las PEC, la calificación final se calcula con la siguiente expresión:

a) caso de haber entregado 1 PEC: 0.1*PEC + 0.9*ExamenFinal

b) caso de haber entregado 2 PEC: 0.1*PEC1+0.1*PEC2+0.8*ExamenFinal

c) caso de haber entregado 3 PEC: 0.1*PEC1+0.1*PEC2+0.1*PEC3+0.7*ExamenFinal

d) caso de haber entregado 4 PEC: 0.1*PEC1+0.1*PEC2+0.1*PEC3+0.1*PEC4+0.6*ExamenFinal

- Si la nota obtenida en el examen presencial es inferior a 4 (en escala de 0 a 10), la calificación será “Suspenso”.

- Los alumnos que no entreguen ninguna PEC obtendrán una calificación final igual a la nota del examen presencial.

Volver a Tabla de contenidos

Q0.9 ¿Se puede llevar material de consulta al examen final presencial en Barcelona?

Sí. Al examen final presencial se puede llevar todo el material de consulta que se desee. Sólo está prohibido el uso de ordenadores, móviles u otros sistemas que permitan la comunicación con el exterior de la sala o entre los alumnos dentro del aula.

Volver a Tabla de contenidos

Q0.10 ¿Se puede asistir al examen final presencial de junio y también al de septiembre?

Sí. Se permite a los alumnos que suspenden en Junio presentarse a la convocatoria de Septiembre. Volver a Tabla de contenidos

Q0.11 ¿En caso de no poder asistir en la fecha del examen final presencial, se dispone de alguna posibilidad de realización de la prueba en una fecha extraordinaria?

No. El curso dispone de dos convocatorias de carácter oficial. El alumno puede escoger entre cualquiera de las dos (aunque en caso de suspender en junio se puede recuperar en septiembre). No se contempla en modo alguno otra convocatoria extraordinaria.

Volver a Tabla de contenidos

Page 7: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 7

Q0.12 ¿Los exámenes presenciales finales en Barcelona tienen el mismo formato que las PEC?

No necesariamente. Lo habitual es que las evaluaciones finales presenciales tengan formato de respuesta abierto, de manera que después de cada enunciado el alumno dispone de un espacio limitado para escribir sus contestaciones.

Volver a Tabla de contenidos

Q0.13 ¿Se pueden realizar las PEC en grupo?

El actual plan de estudios de formación continuada en "Metodología de la Investigación" está diseñado para eliminar el máximo número posible de exámenes presenciales en el Campus de la UAB Bellaterra, pero garantizando la calidad de los títulos otorgados; esto significa que todo profesional con una acreditación nuestra tiene realmente los conocimientos que se acreditan. Este enfoque requiere introducir el Compromiso de Honor que, al contrario del mundo académico anglosajón, carece de tradición en las universidades españolas. Por este motivo se ha desarrollado un protocolo para detectar aquellas pruebas de evaluación continuada que tienen probabilidad casi nula de haber sido realizadas de forma independiente, lo que implica una violación del Compromiso de Honor. En el caso de su PEC el resultado de aplicar este protocolo ha sido POSITIVO: la prueba que nos ha enviado coincide en su totalidad con otra/s PEC/s realizada/s por otro/s compañero/s. Por consiguiente, su ejercicio no será tenido en cuenta en la calificación global del curso. Estudiar la materia de los cursos con algún colega es siempre recomendable y consideramos que contribuye de forma notable a mejorar el aprendizaje. Sin embargo, las pruebas de evaluación continuada no deben realizarse en colaboración con otras personas porque la nota es individual.

Volver a Tabla de contenidos

Q0.14 ¿Es obligatorio realizar los ejercicios complementarios que aparecen en la web el curso?

No. Estos ejercicios están preparados para aquellos estudiantes que desean ampliar el número de ejemplos y practicar más con las técnicas fundamentales del curso. Son muy recomendables, ya que ayudan a preparar las PEC y también el examen final presencial.

Volver a Tabla de contenidos

Q0.15 ¿Se debe tener acceso al programa STATA para realizar el curso, o se debe saber usarlo?

Para realizar este curso no es necesario disponer del STATA, ni tampoco es preciso conocer su manejo. El hecho de que incluyamos listados obtenidos con un programa de ordenador permite aprender a interpretar los resultados que presenta el programa y tomar conciencia de lo sencillo que es realizar el análisis con Stata ya que también se presenta la secuencia de menús y la sintaxis para obtener el listado. Disponer de los resultados calculados directamente por el ordenador facilita mucho el seguimiento del curso. En cualquier caso, como es un curso introductorio, se exige realizar con la calculadora algunos cálculos sencillos encaminados a asimilar los conceptos. Hemos escogido el programa STATA porque es muy potente, su uso está muy extendido en Ciencias de la Salud y porque Stata ofrece la posibilidad a los alumnos de postgrado de adquirir una licencia perpetua a un precio muy bajo. Disponer del programa es obligatorio para los siguientes cursos cuyos cálculos se realizan exclusivamente con ordenador. No obstante, si un alumno de este curso dispone del programa y conoce mínimamente su funcionamiento puedan replicar los ejemplos del texto y comprobar por sí mismo cómo se obtienen los correspondientes resultados.

Volver a Tabla de contenidos

Q0.16 ¿Cómo se valora el trabajo de los tests dentro de la evaluación global del curso?

Los tests constituyen “autoevaluaciones” (esto es, ejercicios de autocomprobación) que tienen como objetivos básicos:

- Ayudaros en la organización temporal de la asignatura, pues contribuyen a establecer y mantener un calendario.

- Ayudaros a determinar el grado de comprensión que tenéis de los contenidos.

- Ayudaros a preparar las pruebas finales.

Es muy importante ir realizando los tests. Nuestra experiencia nos dice es que los alumnos que realizan estos ejercicios acostumbran a obtener los mejores resultados finales.

Volver a Tabla de contenidos

Page 8: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 8

Q0.17 ¿Se recomienda asistir a los stages aunque no se hayan estudiado todas las unidades que cubren?

En efecto, acudir a los stages es altamente recomendable, especialmente al primero. Esta sesión constituye una excelente ocasión para que los alumnos obtengan directamente de los profesores una explicación sintetizada de los contenidos fundamentales de la primera parte del curso. Las unidades que abarca recogen conceptos básicos (“pilares”) de la estadística, que resultan imprescindibles para la comprensión del resto de contenidos. Esta sesión permite contrastar con los docentes cualquier duda que persista referente a estos conceptos, y también clarificar cuestiones que los alumnos consideraban aprendidas pero que no tenían bien consolidadas. Aunque es recomendable seguir el calendario que se propone en el curso, no es condición indispensable para asistir al stage haber preparado las 8 unidades que se revisan en la sesión. Incluso a los estudiantes que tienen contenidos pendientes, el stage les permite obtener una introducción a estos temas y una panorámica general de la primera parte del curso.

Volver a Tabla de contenidos

Q0.18 ¿Se puede asistir al stage 1 en una ciudad diferente a la que he sido convocado?

El primer stage se realiza en diferentes ciudades (Barcelona y Madrid son fijas, y generalmente se organizan también sesiones en Santiago de Compostela, Oviedo, Sevilla, Bilbao y Valencia). Durante el mes de enero se envía notificación a cada alumno para que confirme su asistencia a la ciudad más cercana geográficamente a su lugar de residencia. Aunque pueden hacerse cambios, es obligado comunicarlos previamente a administración del curso con el fin de garantizar una correcta organización de estas sesiones.

Volver a Tabla de contenidos

Q0.19 ¿Se puede asistir a los stages de junio y/o septiembre en una fecha diferente a la que he sido convocado y/o he confirmado?

Sí, en efecto. Si por cuestiones de agenda no podéis asistir en la fecha que se os convoca y/o habéis confirmado, podéis hacerlo en un día diferente (no es imprescindible comunicarlo, ya que estos stages los realizamos en Barcelona, en la facultad donde el curso tiene su sede).

Volver a Tabla de contenidos

Page 9: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 9

Unidad 01: Descripción de datos cuantitativos

Q01.1 ¿Cuántas líneas debe ocupar cada tallo cuando se dibuja el diagrama de tallo y hoja?

En general, se considera que la partición más adecuada es aquella que ofrece una imagen más sintética y clara de la forma de la distribución. Sin embargo, no existen reglas exactas que indiquen qué división concreta se debe utilizar en cada caso. Elegir una partición u otra depende, fundamentalmente, del número de valores de la distribución: cuantos más datos, más líneas puede tener el diagrama. A modo orientativo (aunque no preceptivo), puede emplearse la regla de Sturges que se enseña en esta unidad. Esta pauta nos da una sugerencia sobre cuántas líneas totales puede tener un buen diagrama de tallo y hoja según el número de sujetos que se van a representar. Por ejemplo si se dispone de un número de observaciones comprendido entre 11 y 22, un gráfico que ocupe aproximadamente 5 líneas ya sería adecuado; sin embargo, si la muestra comprende entre 45 y 90 sujetos, el gráfico deberá tener en torno a 7 líneas. En cualquier caso, tened presente que en la práctica los ordenadores dibujan este gráfico de forma automática y los usuarios no tienen que preocuparse por este aspecto.

Volver a Tabla de contenidos

Q01.2 ¿Es indispensable que al dibujar el diagrama de tallo y hoja se ajuste exactamente al número de líneas dado por la regla de Sturges?

La regla de Sturges es aproximativa, y no preceptiva. Esto quiere decir que el número de líneas que sugiere esta regla es un número aproximado para obtener un gráfico que permita obtener una “imagen” adecuada de la distribución. Como el gráfico de tallo y hoja únicamente puede dibujarse utilizando una, dos o cinco líneas por tallo, en ocasiones es imposible cumplir exactamente con la indicación Sturges. En estos casos, es importante escoger una división que sea lo más compatible posible con dicha regla.

Volver a Tabla de contenidos

Q01.3 ¿En el diagrama de tallo y hoja se tienen que poner líneas para las cuales no hay hojas?

Depende. No deben ponerse líneas vacías al inicio y al final del gráfico. Sí tienen que aparecer cuando dichas líneas están dentro del diagrama. Se debe tener en cuenta que el objetivo de este gráfico es ofrecer una imagen visual de la forma de la distribución. Si dentro del diagrama aparecen (líneas vacías) esto denota que hay huecos (“gaps” en inglés), esto es, zonas en la distribución sin datos. Si se omitieran estas líneas sin hojas el gráfico no permitiría detectar esta situación.

Volver a Tabla de contenidos

Q01.4 ¿Cómo se debe considerar la puntuación Apgar, categórica o métrica?

La puntuación total Apgar es un ejemplo de variable que puede llevar a confusión. El resultado individual de cada ítem se evalúa con una escala ordinal (0-1-2). Sin embargo, lo más frecuente es utilizar la suma total de los 5 ítems del test para valorar el estado general del neonato, lo cual hace que esta puntuación global pueda estar comprendida entre 0 y 10. En este caso, es frecuente que los investigadores consideren dicha puntuación bajo una perspectiva "métrica". En la Unidad 1 se indica que esta decisión comporta hacer el supuesto adicional de que los intervalos en la escala representan diferencias iguales en los atributos que supuestamente miden (por ejemplo, pasar de una puntuación total 7 a 8 equivale a pasar de 8 a 9).

Volver a Tabla de contenidos

Q01.5 ¿Cómo es posible que al calcular los cuartiles primero y tercero con la fórmula “Haverage" se obtengan resultados distintos a los que se obtienen al calcular los cuartos de Tukey?

La razón estriba en que los algoritmos que se utilizan con ambos procedimientos son distintos. La técnica de Tukey se basa en efectuar particiones de la distribución sin hacer supuestos adicionales sobre su forma. En este curso os enseñamos a utilizar este método y se comprueba que cuando un cuarto ocupa una posición en la cual “no hay valor”, el resultado final que se le asigna se obtiene de la media aritmética entre el valor correspondiente a la posición anterior y al de la posterior. Otros métodos de estimación sí hacen supuestos sobre los datos y son más sensibles a la presencia de asimetrías. Esto ocurre, por ejemplo, con la técnica de Haverage. En este caso, los cálculos no se basan en simples medias aritméticas sino que incorporan un algoritmo que utiliza una interpolación. De este modo, cuando hay asimetrías, el percentil que se obtiene queda desplazado en dicha dirección. En este curso no se presenta el cálculo manual de percentiles con métodos diferentes al de Tukey debido a que la fórmula es más tediosa de aplicar y no aporta nada conceptualmente para la compresión de estos índices.

Volver a Tabla de contenidos

Page 10: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 10

Q01.6 ¿El diagrama de caja sólo se puede dibujar con los cuartos datos por la fórmula de Tukey?

Algunos programas estadísticos dibujan el diagrama de caja (“boxplot”) con los cuartos calculados de acuerdo a la definición dada por Tukey, pero este gráfico también se puede construir calculando los cuartos con otros procedimientos. No hay un consenso al respecto.

Volver a Tabla de contenidos

Q01.7 ¿Es posible que para una distribución de valores el resultado obtenido con el coeficiente de variación sea superior al valor de la desviación estándar?

En efecto, así es. El coeficiente de variación será superior a la desviación estándar cuando, por ejemplo, la media esté comprendida entre 0 y 1. Es fácil comprobarlo con datos como los siguientes: media=0.5 y s=1. En este supuesto, CV=1/0.5=2.

Volver a Tabla de contenidos

Q01.8 ¿Por qué es incorrecta la expresión media+-SD?

No existe ninguna prohibición explícita respecto a usar la expresión media+-SD, con lo cual es probable que en algunas publicaciones encontréis esta expresión. Sin embargo, es una forma de sintetizar la distribución "anticuada", y en muchos casos puede conducir a error. En la unidad os indicamos que la desviación estándar es una medida de variabilidad que sólo tiene interpretación práctica cuando la distribución sigue Ley Normal. Cuando esto sucede, sumando y restando al valor de la media un determinado número de veces la correspondiente SD se obtiene un intervalo que incluye una parte de los sujetos. Pero en la práctica, muchas veces trabajamos con distribuciones que se alejan de la ley Normal, con lo cual esta definición no tiene sentido. Los intervalos que incluyen un determinado porcentaje de casos se obtienen de otra forma: a través del cálculo de percentiles. En síntesis. En la práctica podemos encontrarnos con que algunos colegas siguen ciertas "tradiciones" a la hora de analizar y resumir sus datos. En nuestro curso os enseñamos a valorar en qué situaciones es más o menos adecuado seguir estas "normas", y también qué alternativas más actuales podemos emplear. Por cierto, en la Unidad 5 ampliamos esta explicación, pues vemos la Ley Normal de forma detallada y el uso concreto de la SD en estas distribuciones.

Volver a Tabla de contenidos

Q01.9 ¿Cómo se dibuja un polígono de frecuencias?

Este gráfico surge después de dibujar el histograma, y se obtiene uniendo los centros de la parte superior de cada barra. El histograma se ha utilizado tradicionalmente para la representación de variables continuas. Sin embargo, es una representación que en la actualidad se considera bastante obsoleta. De hecho, cada vez son más los trabajos que tienden a sustituirlo por el diagrama de caja. En la unidad 1 os detallamos las razones.

Volver a Tabla de contenidos

Q01.10 ¿Qué valores corresponden a las “patillas” superior e inferior del diagrama de caja?

Las patillas del diagrama de caja corresponden al valor mínimo y máximo de la distribución que no se consideran valores anómalos. En otras palabras, si no hay valores alejados en los datos, las patillas corresponden al valor inferior (el más bajo que se haya registrado) y al valor superior (el más alto en los datos). Para saber cuáles son las patillas del diagrama de caja, primero tenemos que determinar a partir de qué valor se consideran datos alejados. Por lo tanto, el procedimiento para dibujar el gráfico sería el siguiente: - Primer paso: representar la caja. Se dibuja con los cuartos primero y tercero. - Segundo paso: marcar la mediana dentro de la caja. - Tercer paso: buscar los umbrales a partir de los cuales se considera que cualquier valor es anormalmente alto o anormalmente bajo (es decir, buscar los umbrales a partir de los cuales cualquier valor será considerado alejado). En la unidad 1 se detalla el algoritmo concreto que permite obtener estos límites. - Cuarto paso: si el valor mínimo de la distribución y el valor máximo no están fuera de los umbrales anteriores, se considera que no hay datos alejados. En este caso, las patillas inferior y superior se dibujan trazando dos líneas verticales hasta el valor mínimo y máximo. Si en la distribución hay valores más alejados que los umbrales que se han calculado, lo más sencillo es representar primero TODOS los datos alejados (por la cola inferior y superior) con algún símbolo como un pequeño círculo o un asterisco. A continuación, se dibujan las patillas del diagrama de caja trazando las correspondientes líneas verticales hasta los valores mínimo y máximo que han quedado después de dibujar los alejados.

Page 11: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 11

Volver a Tabla de contenidos

Q01.11 ¿La escala de medida de la variable “consumo de cigarrillos-día” es contínua?

Ciertamente, el caso del consumo de tabaco en c/d siempre genera dudas respecto a la escala de medida. Se debe diferenciar entre el resultado de la medida y el valor real que estamos midiendo. En muchas ocasiones, para las variables cuantitativas el resultado de la medida tiene apariencia de "discreto" (imaginad que medimos la talla-altura en cm), pero en realidad la escala de medida que subyace es de tipo continuo (en la realidad tiene sentido pensar que un sujeto puede tener cualquier valor dentro de un rango determinado, incluidos valores decimales). Con el consumo de tabaco medido en c/d ocurre esto último. Una cuestión que puede ayudar a determinar la escala subyacente es la siguiente: determinar si el uso de decimales es aplicable a la medida concreta de un sujeto. Por ejemplo, ¿es coherente afirmar que el consumo individual de un sujeto ha sido de 1,5 c/d? Si la respuesta es afirmativa, la escala de medida es continua. Cuando los decimales no tienen sentido para definir el valor individual de los sujetos (es decir, cuando estamos ante meros resultados de recuentos) la escala es discreta.

Volver a Tabla de contenidos

Q01.12 ¿Cuándo se mide la edad de un sujeto siempre debe registrarse añadiendo 0,5 años al valor dado por la persona?

Para medir el tiempo que transcurre entre dos fechas lo aconsejable es registrar en la matriz de datos la fecha inicial y la fecha final, y posteriormente utilizar las funciones FECHA del programa estadístico para calcular los tiempos exactos. Esta estrategia es la única que garantiza que este tipo de variables no contienen sesgos de medición y en este caso no debe añadirse 0.5 unidades al tiempo transcurrido. Cuando se dispone da la edad en tiempo cumplido (porque no es posible registrar las fechas) siempre se debe corregir añadiendo 0.5 unidades para calcular correctamente las medidas de posición (media, mediana, etc.).

Volver a Tabla de contenidos

Q01.13 ¿Es adecuado calcular y comparar medias entre grupos para escalas analógicas?

Las escalas analógicas se acostumbran a valorar como si la escala de medida fuera métrica, ya que se basan en que el sujeto marque su “situación” en una línea continua. Esto implica que es posible calcular y comparar índices de tendencia central tipo media.

Volver a Tabla de contenidos

Q01.14 ¿Para qué sirve la amplitud o rango?

La respuesta viene dada en el mismo algoritmo en que se basa este índice. La amplitud-rango se calcula a partir de la diferencia entre el valor máximo y mínimo (absolutos) de la distribución. Por lo tanto, el resultado aporta una medida de la “anchura”, dispersión o variabilidad de los datos. En otras palabras: la amplitud es una medida de variabilidad. Si los datos son homogéneos, este índice dará un valor pequeño ya que entre el valor mínimo y máximo hay poca distancia. En cambio, con distribuciones heterogéneas (dispersas), la amplitud será grande porque la diferencia entre mínimo y máximo es también alta. En términos más matemáticos, el rango de una distribución puede considerarse como un índice de variabilidad basado en ordenaciones, ya que valora la diferencia entre el valor de orden 1 y el valor de orden máximo. En la práctica, este índice es muy poco utilizado.

Volver a Tabla de contenidos

Q01.15 Cuando tenemos un tiempo transcurrido (como la edad gestacional) expresado en semanas y días (ejemplo, 40 semanas y 2 días), ¿en la matriz de datos las semanas son una variable y los días otra?

Desde el punto de vista del análisis estadístico, cada tiempo transcurrido se considera como una única variable. En el ejemplo planteado tenemos, por ejemplo, dos opciones en el momento de analizar: a. Expresar 40 semanas y dos días todo en semanas, utilizando decimales. Para ello simplemente hay que convertir los 2 días en semanas y agregarlo a 40. La expresión es muy sencilla: 40 + (2/7) = 40.29 semanas. b. Expresarlo en días. Para ello, las 40 semanas se convierten en días y al resultado se le suma 2. La expresión es: 40*7 + 2 = 282 días. En cualquier caso, si en el formulario en papel hay dos variables (o en la matriz de datos ya se han grabado dos variables), es mejor grabar directamente esta información en el ordenador y que sea el programa estadístico el que efectúe directamente la creación de la variable final que será analizada estadísticamente. Esto reduce la posibilidad de que se cometan errores en la conversión.

Page 12: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 12

Volver a Tabla de contenidos

Q01.16 ¿Son comparables el coeficiente de variación obtenido a partir de la desviación estándar y la media de una variable y el coeficiente de variación cuartil?

Como el resto de índices descriptivos explicados en la unidad 1, se debe tener presente que uno se obtiene con estadísticos basados en momentos (CV) y el otro con estadísticos basados en ordenaciones (CVcuartil). Esto hace que el uso de uno u otro dependa de la forma de la distribución. Si los datos presentan anomalías (distribución asimétrica) se debe utilizar el coeficiente de variación cuartil, del mismo modo que se usarían índices basados en ordenaciones para describir la distribución. Por otro lado, si los datos no presentan asimetrías, se puede utilizar cualquiera de ellos de forma análoga. En cualquier caso, los resultados finales no son iguales, ya que uno se basa en SD-Media y el otro no. Lo importante es que cuando se escoge uno de estos índices, en ambas distribuciones se calcule el mismo para que los resultados puedan ser comparables.

Volver a Tabla de contenidos

Q01.17 ¿Es lo mismo desviación estándar que desviación típica?

Sí, ambos términos designan la dispersión de una distribución de datos cuantitativa, obtenida como el promedio de las distancias de los datos respecto al centro de gravedad (media aritmética). Se expresa en las mismas unidades de medida que la variable.

Volver a Tabla de contenidos

Q01.18 ¿Cómo se calculan los días transcurridos entre dos fechas?

Este cálculo se efectúa con ordenador, por ejemplo con una hoja de cálculo tipo Excel o con un programa estadístico como el STATA. La diferencia entre dos fechas efectúa el cálculo del tiempo transcurrido en días, y el valor resultante lo redondea al entero superior. Por ejemplo, el tiempo transcurrido en días entre las fechas 20-Mayo-1989 al 14-Junio-2001 se efectuaría así: Día Mes Año 14 6 2001 20 5 1989

-6 1 0012 12 años + 1 mes – 6 días = 12365.25 + 30.43751 - 6 = 4407.4375 4408

Volver a Tabla de contenidos

Q01.19 ¿Se puede calcular el intervalo del 95% central de las observaciones si la distribución es asimétrica?

Sí, pero no a partir de la fórmula media±DE. Se obtiene a partir de los percentiles (dicho intervalo está comprendido entre el percentil 2.5 y el 97.5).

Volver a Tabla de contenidos

Q01.20 ¿Son el mismo concepto “simetría” y “normalidad”?

No. Simetría indica que en una representación gráfica se aprecia la exacta correspondencia de todas las partes de a un centro, un eje o un plano. Normalidad es un concepto más amplio que indica que una distribución de valores continuos sigue una ley Normal, o lo que es lo mismo una distribución de Gauss.

Volver a Tabla de contenidos

Q01.21 ¿Para qué sirve conocer el número de valores desconocidos (missing) de un estudio?

El porcentaje de datos faltantes es un indicador fundamental en una investigación porque aporta evidencias de la "calidad" de dicho proyecto. Un estudio con muchos valores desconocidos denota algún tipo de problema o incidencia, muchas veces relacionado con una mala planificación. Respecto al porcentaje aceptable, depende del contexto y del tipo de diseño. No es lo mismo, por ejemplo, un diseño de tipo transversal en el que sólo se efectúa una evaluación de los sujetos que un diseño longitudinal que implica seguimiento. El primero, por definición, debería tener un porcentaje de valores missing muy inferior.

Volver a Tabla de contenidos

Page 13: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 13

Page 14: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 14

Unidad 02: Descripción de datos categóricos

Q02. 1 Si se desea describir la frecuencia de un evento en un estudio transversal, ¿cuándo se debe utilizar la proporción y cuándo la odds?

En la unidad 2 se enseña que hay una equivalencia matemática entre proporción y odds, de manera que por ejemplo o=p/(1-p). Si esto es así, escoger una u otra en principio es una decisión que desde el punto de vista de la metodología resulta un tanto arbitraria. En la práctica, sin embargo, las proporciones suelen resultar más fáciles de interpretar, en primer lugar porque forman parte de nuestro vocabulario y cultura popular, y por otro porque dichos índices están acotados entre 0 y 1. Por esta razón la frecuencia de un evento concreto que se mide en un momento determinado del tiempo suele informarse en forma de proporción, y el nombre que recibe este índice en el ámbito de la epidemiología es el de prevalencia.

Volver a Tabla de contenidos

Q02.2 ¿Por qué no tiene sentido dibujar un diagrama de pareto en distribuciones categóricas ordinales?

El diagrama de pareto se basa en “organizar” los niveles (también denominados valores, grupos, clases o categorías) de una variable en función de la frecuencia con la que aparecen en un estudio. Esto implica efectuar una “ordenación estadística” sobre la distribución de datos, con objeto de que el gráfico resultante ofrezca una interpretación visual sencilla sobre la importancia relativa de las distintas categorías. Desde un punto de vista práctico y clínico, esta organización de la información tiene sentido cuando las categorías no poseen de forma intrínseca un orden natural, cosa que sucede con las variables ordinales. De hecho, cuando las categorías de una variable ordinal no se distribuyen siguiendo una tendencia creciente o decreciente, aplicar un pareto implicaría que en la representación gráfica de estos datos las barras se dibujarían en un orden distinto al que las categorías poseen de forma natural. En otras palabras, al ordenar estadísticamente los grupos se desordenarían las categorías originales.

Volver a Tabla de contenidos

Q02.3 ¿Es cualquier cociente una razón?

En efecto, cuando se emplea el término “razón”, usamos un término que es equivalente (sinónimo) al de “cociente”. Siendo así, cualquier división entre dos magnitudes puede clasificarse como una razón o cociente. Sin embargo, en la práctica existen ciertos cocientes que resultan tan relevantes que poseen denominaciones concretas. Este es el caso de las prevalencias, las incidencias (o riesgos), las tasas, etc.

Volver a Tabla de contenidos

Q02.4 ¿Por qué una tasa absoluta no mide adecuadamente el ritmo con el que se presenta un evento?

No se trata de que el resultado dado por la fórmula que se utiliza al calcular la tasa absoluta esté mal por definición. De hecho, esta fórmula coincide con el concepto más familiar que poseemos de una tasa: aporta información sobre la magnitud del cambio en un parámetro en relación al cambio que sufre otro parámetro. El ejemplo habitual lo tenemos en la física y en la fórmula dada por la velocidad: esta fórmula mide el espacio que un cuerpo recorre en un determinado transcurso de tiempo. El problema de la tasa absoluta acontece cuando se aplica al ámbito de las ciencias de la salud. En este contexto la tasa se utiliza también para medir una “velocidad”, en este caso para valorar con qué ritmo se van acumulando los nuevos casos (habitualmente enfermos, aunque no siempre) en una determinada población. Pero este dato en sí mismo no es directamente interpretable en términos clínicos si no se tiene en consideración cuántos eran los sujetos que estaban “expuestos” (o en riesgo). En otras palabras, si la población de sujetos en la que se efectúa el estudio es muy amplia e incluye un gran número de expuestos, la tasa absoluta de nuevos eventos será mucho mayor que si se efectúa el mismo cálculo en una población pequeña y por lo tanto con muchos menos sujetos en riesgo. Por esta razón en ciencias de la salud se calculan tasas relativas, que incorporan en la fórmula el promedio de expuestos en la población durante el seguimiento.

Volver a Tabla de contenidos

Page 15: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 15

Unidad 03: Teoría de la probabilidad y pruebas diagnósticas

Q03. 1 ¿Cómo se resuelve paso a paso el ejemplo planteado por el lanzamiento del disco?

Matemáticamente, la solución del problema consiste en aplicar la definición de probabilidad dada por Laplace. Por lo tanto, es necesario conocer cuáles son los “casos favorables” y los “casos posibles” que se requiere para aplicar este cociente. Para ello es necesario obtener las dimensiones que se representan en la figura de este ejemplo. Por ejemplo, el enunciado indica que el cuadrado exterior (blanco) tiene un lado de longitud igual a 1; por consiguiente, su área (o superficie) será igual a ladoxlado=1x1=1. Asimismo, se informa de que el disco tiene un radio igual a 0.25. Finalmente, el cuadrado central sombreado tiene un lado de longitud igual a 1-2xRadio=1-2x0.25=0.5. La pregunta que se formula es: ¿cuál es la probabilidad de que al lanzar el disco sobre el cuadrado exterior no corte (esto es, no toque) ninguno de sus lados? Del dibujo se deduce que esto sólo ocurrirá si el centro del disco cae dentro del cuadro central sombreado. En este planteamiento, los casos posibles vienen representados por todos los puntos sobre los cuales podría caer el centro del disco, y se concretan en todos los puntos del cuadrado exterior cuya área total es 1. Los casos favorables vienen representados en los puntos del cuadrado central sombreado, cuya área hemos visto que vale 0.25. Por consiguiente, la probabilidad que se pide se obtiene a través del siguiente cociente entre las dos áreas o superficies: P(A) = casos favorables / casos posibles = 0.25 / 1 = 0.25.

Volver a Tabla de contenidos

Q03.2 ¿El resultado de una prueba diagnóstica siempre se representa mediante una variable dicotómica?

No. Según la prueba diagnóstica que se utilice, el resultado es métrico, ordinal o nominal. De hecho, el ejemplo de la glucosa como prueba diagnóstica de la diabetes (precisamente es el ejemplo que se trabaja en esta unidad) aporta una medida que inicialmente es cuantitativa. Otra cosa es el tratamiento posterior que se hace de este resultado. En este curso el uso de las pruebas diagnósticas se aborda dentro del proceso diagnóstico de una enfermedad. En este ámbito es frecuente que cuando las pruebas diagnósticas aportan un valor cuantitativo posteriormente se decida cuál es el “mejor umbral” a partir del cual clasificar a los sujetos en los grupos “resultado positivo” versus “resultado negativo”. Aquí encontramos una de las más habituales aplicaciones de la curva ROC.

Volver a Tabla de contenidos

Q03.3 Cuando se estudia la validez de una prueba diagnóstica, ¿es necesario que el grupo de los “no enfermos” esté formado por sujetos “clínicamente sanos”?

En el contexto de las pruebas diagnósticas, cuando se alude al grupo de sujetos “control” y se les etiqueta como sujetos “sanos”, únicamente se hace referencia a que en esta cohorte el diagnóstico objeto de estudio está ausente. Los sujetos de este grupo, sin embargo, pueden presentar otros cuadros clínicos. La selección inadecuada de la muestra de sujetos "no enfermos" es uno de los principales sesgos para la correcta validación de una prueba diagnóstica. Se debe tener presente que cuando la prueba se aplica a un grupo de sujetos "no enfermos" el objetivo es estimar de la forma más precisa la frecuencia de falsos positivos. Por esta razón, es importante que este grupo control (o de “sanos”) incluya pacientes con cuadros clínicamente similares a la enfermedad estudiada y enfermos cuyo diagnóstico diferencial plantee dificultades. En otras palabras: la muestra de control debe ser representativa de la población a la que posteriormente se aplicará la prueba. Finalmente, el sesgo al que hemos aludido puede presentarse tanto en la selección de la muestra de no enfermos como en la de enfermos. Para ilustrar este punto, exponemos la reflexión que aparece en el texto de Hulley y Cummings (1993, p.104): "Los individuos con la enfermedad pueden haber sido seleccionados, por ejemplo, a partir de un centro de referencia, con lo cual tendrán más posibilidades de ser casos graves y presentar resultados más anormales que los casos leves de la enfermedad. Esto lleva a sobreestimar la sensibilidad de la prueba (capacidad de identificar a los individuos enfermos) respecto a la práctica real. De forma similar, si se seleccionasen los individuos sin la enfermedad a partir de voluntarios, habría más posibilidades de que estuviesen más sanos que los pacientes sintomáticos, pero que no presentan la enfermedad, visitados en una consulta. En esta situación puede exagerarse la especificidad de la prueba (capacidad de identificar a los individuos sin la enfermedad."

Volver a Tabla de contenidos

Page 16: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 16

Q03.4 ¿Para valorar pruebas diagnósticas siempre se utilizan diseños de caso-control?

Aunque es frecuente utilizar estos diseños, en ocasiones también se utilizan diseños de tipo transversal. En unidades posteriores (unidad 7), y también en cursos más avanzados de metodología de la investigación sanitaria, se amplía la lógica que comportan estos estudios.

Volver a Tabla de contenidos

Q03.5 ¿Por qué con una prueba diagnóstica cuantitativa no es suficiente con calcular la sensibilidad y la especificidad, y debe calcularse el área bajo la curva ROC?

El cálculo de la sensibilidad y la especificidad ofrece unos resultados concretos para cada posible resultado numérico que se tome como punto de corte (o umbral) a la hora de clasificar a los sujetos en los grupos resultado positivo versus resultado negativo. Por ejemplo, si cuando se mide la capacidad diagnóstica de la glucosa se toma como punto de corte el valor 95, los resultados serán distintos que cuando se toma como punto de corte el valor 100. Por ello, en las pruebas que aportan resultados numéricos tiene interés conocer la capacidad de clasificación global de la prueba a lo largo de todos los posibles puntos de corte. Esta medida es la que aporta la curva ROC. Esta metodología también se utiliza a la hora de decidir cuál es el mejor punto de corte cuando la prueba se utiliza con objetivos diagnósticos.

Volver a Tabla de contenidos

Q03.6 ¿Cómo se evalúa el "coste" de los falsos positivos y negativos en el momento de valorar una prueba diagnóstica?

No hay ninguna fórmula-estrategia estadística para determinar cuál es el coste de un falso positivo versus un falso negativo. Para determinar su "importancia relativa" se recurre a criterios clínicos. Por ejemplo: suponer que se trabaja en un contexto de detección precoz psiquiátrico con el objetivo de detectar sujetos de alto riesgo. En este caso el coste de un falso negativo es mayor que el coste de un falso positivo, ya que supondría que sujetos en riesgo no son identificados y por lo tanto no se pueden aplicar las correspondientes estrategias preventivas.¿Qué valor concreto asignar? Insistimos: la estadística no pueda dar esta respuesta, se debe recurrir al juicio de expertos

Volver a Tabla de contenidos

Q03.7 ¿Qué hacer si los índices de exactitud (Se y Sp) de una prueba diagnóstica son buenos pero los valores predictivos son muy malos?

Una prueba diagnóstica se considera válida-exacta siempre que los valores de Se y Sp son muy buenos. Esto garantiza lo siguiente: el uso clínico-diagnóstico será también muy bueno siempre y cuando se trabaje con prevalencias suficientemente altas. Pero si las prevalencias son bajas, por definición el PV+ cae en picado, y la prueba deja de tener valor diagnóstico en esa determinada población. En otras palabras: las pruebas diagnósticas sólo funcionan bien en poblaciones en las que exista una alta prevalencia de la enfermedad. Caso contrario, no tienen valor diagnóstico incluso aunque en los estudios previos de validez hayan demostrado valores muy altos de sensibilidad y especificidad.

Volver a Tabla de contenidos

Page 17: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 17

Unidad 04: Descripción de datos de supervivencia (unidad opcional)

Q04.1 Algunos cálculos dados en esta unidad se basan en el Teorema de Tales. ¿En qué consiste este teorema?

El filósofo y matemático griego Tales de Mileto fue uno de los siete sabios más grandes de la antigüedad. El teorema de Tales, llamado así en su memoria, es una parte fundamental en el estudio de la semejanza. A este matemático se debe una de las numerosas aplicaciones que tiene la semejanza, que es la determinación de la distancia entre dos puntos inaccesibles entre sí. De hecho, con este propósito se dice que calculó la altura de una de las pirámides de Egipto sin medirla directamente, basándose en la longitud de la sombra de su bastón y logrando así una brillante triangulación. El Teorema de Tales afirma lo siguiente: si tres o más paralelas son cortadas por transversales, la razón entre las medidas de dos segmentos cualesquiera cortados por una transversal será igual a la razón de las medidas de los segmentos correspondientes de la otra, es decir, son proporcionales. Matemáticamente, el Teorema de Tales establece que los segmentos interceptados por rectas paralelas en un conjunto de rectas concurrentes son proporcionales entre sí. Esta definición, que de entrada puede resultar compleja, aparece clarificada en muchos textos básicos, e incluso en enciclopedias especializadas. Podéis consultarlas para comprender el concepto subyacente. El objetivo de la unidad no es que entendáis el funcionamiento de este teorema, sino que sepáis aplicarlo a los ejemplos que se plantean. Para ello, debéis revisar detenidamente los ejemplos que se plantean. Podéis obtener información ampliada e incluso hacer prácticas de ejercicios sencillos con este teorema en numerosas webs. Os hemos seleccionado estas: http://descartes.cnice.mecd.es/3_eso/Semejanza/Semejan1.htm http://descartes.cnice.mecd.es/4b_eso/Semejanza_y_homotecia/Homote2.htm http://es.wikipedia.org/wiki/Teorema_de_Tales

Volver a Tabla de contenidos

Q04.2 ¿A partir de qué valor se considera alta la proporción de sujetos perdidos en un estudio de seguimiento?

Determinar la proporción de sujetos perdidos es un índice importante a la hora de evaluar la calidad de un estudio de seguimiento. Sin embargo, no hay un consenso sobre cuál es el umbral para considerar que el estudio reúne las condiciones necesarias para efectuar adecuadamente las estimaciones o cálculos. De hecho, este límite depende del ámbito y de la duración total del estudio. Por ejemplo, no es igual seguir una cohorte durante un año que hacerlo durante cinco años. Es más previsible que si el seguimiento es mayor, la magnitud de las pérdidas también será más considerable. En cualquier caso, se considera que una proporción aceptable de pérdidas podría oscilar entre el 10% y el 20%.

Volver a Tabla de contenidos

Q04.3 ¿Qué se debe utilizar para describir la tendencia central de la distribución de supervivencia, la media o la mediana?

Es imposible calcular la media porque el tiempo de supervivencia sólo es conocido para los sujetos con tiempos completos. Por esta razón deberemos utilizar medidas de posición basadas en ordenaciones, como la mediana y los cuartiles. Por otro lado, se debe prestar atención a los listados dados por muchos programas de análisis de datos. En estos sistemas, la media que se presenta para los análisis de supervivencia es un valor sesgado a la duración del seguimiento. En otras palabras, no representa una estimación de la media de la distribución de supervivencia, sino la media obtenida con los tiempos, tanto completos como incompletos (censurados), de todos los sujetos.

Volver a Tabla de contenidos

Q04.4 ¿Por qué no se puede calcular la media aritmética en distribuciones con datos censurados?

Porque el cálculo de una media aritmética presupone que al final del seguimiento todos los sujetos que participan en el análisis han presentado el evento que se estudia. En distribuciones con datos censurados, esta condición precisamente es la que no se cumple.

Volver a Tabla de contenidos

Page 18: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 18

Q04.5 Para calcular la tasa relativa media de incidencia de "muertes" o probabilidad condicionada por unidad de tiempo (fórmula 4-12), ¿por qué no se usa el número medio de "muertes" y sí se usa el número medio de expuestos?

Tiene sentido utilizar un valor promedio para los expuestos porque a lo largo del intervalo este número va cambiando. Sin embargo, es correcto utilizar el total de “eventos” (muertes) que se han producido a lo largo de todo el período. Esta lógica coincide con la que se explica en el curso para el cálculo de una tasa relativa promedio (revisar la unidad 2). Para calcular esta tasa partimos de tres informaciones: tiempo total transcurrido, total de nuevos eventos (esto es, número de nuevos casos durante el período) y promedio de sujetos expuestos durante el período.

Volver a Tabla de contenidos

Q04.6 ¿Se pueden comparar a nivel estadístico dos o más curvas de supervivencia?

En efecto, así es. Existen técnicas estadísticas específicas para comparar curvas de supervivencia, y también un modelo general para este tipo de datos (regresión de Cox). Estos procedimientos son técnicas inferencias cuya realización es muy laboriosa, y se explican en los cursos más avanzados de regresión múltiple.

Volver a Tabla de contenidos

Page 19: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 19

Unidad 05: Leyes de probabilidad

Q05.1 La Tabla de la ley Normal presenta las probabilidades p(z) para valores positivos de z. ¿Cómo se obtienen las correspondientes probabilidades para valores negativos?

Para utilizar esta tabla se deben tener presentes tres cuestiones que son características de toda ley Normal: a) el centro de la distribución coincide con la correspondiente media; b) es simétrica; y c) el área total bajo la curva que representa la distribución vale 1. Existen múltiples distribuciones que se ajustan a forma dada por la ley Normal, y cada una tiene un valor de media y de desviación estándar concretos. Sin embargo, sólo existe una tabla, y ha sido creada para una ley Normal concreta: la ley Normal estandarizada que tiene como media el valor 0 y como desviación el valor 1. Por otro lado, esta tabla sólo da las áreas que quedan a la derecha de un valor z positivo. El razonamiento que se debe hacer para determinar cuál es el valor de probabilidad que corresponde a un valor z negativo es bien simple: puesto que la distribución Normal es simétrica, las probabilidades dadas por la tabla pueden interpretarse como las áreas que quedarían a la izquierda de los correspondientes valores z negativos.

Volver a Tabla de contenidos

Q05.2 Concepto de muestreo finito-infinito, sin reposición-con reposición

Muestreo con reposición es análogo a muestreo infinito. Implica que una vez que el sujeto ha sido "extraído" de la población, previo a la próxima extracción el sujeto es "devuelto". Esto hace que la población sea, en términos teóricos, infinita, ya que nunca puede "agotarse". Muestreo sin reposición (o finito) implica que una vez el sujeto es extraído de la población ya no vuelve a ser candidato para volver a ser escogido en extracciones sucesivas. Esto hace que la población sea finita, ya que es candidata a "agotarse". En otros contextos, también se denomina población finita aquella que tenemos censada. Este aspecto lo veremos más ampliamente en la unidad 6.

Volver a Tabla de contenidos

Q05.3 ¿Por qué con algunos problemas de la ley Normal a veces al valor dado por las Tablas Z se le resta 1 y otras veces no?

Las tablas de la ley Normal dan el área por la derecha para un valor z positivo, y el área por la izquierda para un valor z negativo. En función de si se desea obtener la zona de la derecha del valor z hallado o la zona de la izquierda, el resultado coincidirá con el valor de las tablas o será su complementario. Por ejemplo, si trabajamos con un valor z=-0.32 y se desea conocer el área por la izquierda de este valor, el resultado de las tablas ya es el correcto. En cambio, si lo que se desea es el área por la derecha, el resultado correcto surgirá de restar 1 al valor dado por las tablas.

Volver a Tabla de contenidos

Q05.4 ¿En los cálculos con la ley Binomial, cómo se debe proceder si al calcular 100! con la calculadora da error?

En los ejemplos-ejercicios que se plantean en la unidad no es necesario calcular n!. Planteamos un ejemplo. La primera parte de la fórmula es: n! / k!(n-k)! Ahora supongamos que n=100 y k=0. Siendo así, la fórmula a resolver es esta: 100! / 0!(100-0)!. Dado que 0!=1, la expresión queda reducida a: 100! / 100! = 1. Por lo tanto la probabilidad de que no haya ningún caso queda reducida a la segunda parte de la fórmula de la ley binomial. Si quisiéramos aplicar la fórmula para n=100 y k=1 entonces: 100! / 1!(100-1)! = 100! / 99! = 100 * 99! / 99! = 100 * 1 Si k=2 entonces: 100! / 2!(100-2)! = 100 * 99 * 98! / 2 * 98! = 100 * 99 / 2 La idea es separar el 100! (n!) en sus productos hasta poder llegar a eliminar el resto con el denominador.

Volver a Tabla de contenidos

Q05.5 ¿Cómo se comprueba que una distribución de valores se ajusta a una ley Normal?

El supuesto de normalidad se verifica con pruebas estadísticas de bondad de ajuste. Las más utilizadas son la prueba de normalidad de Kolmogorov (Lilliefors) y la de Shapiro-Wilks, que se estudian en la Unidad 11 del curso.

Volver a Tabla de contenidos

Page 20: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 20

Unidad 06: Estimación de parámetros

Q06.1 ¿Por qué el intervalo de confianza no se puede interpretar en términos de probabilidad o de riesgo?

Al IC de un parámetro no puede atribuirse una probabilidad de acierto (o su complementario, un riesgo de error) de contener el parámetro debido a que: a) se obtiene para una ocasión única, lo cual implica que no hay repetición del proceso (“experimento aleatorio”) que permita establecer una distribución de probabilidad subyacente; b) cuando se calcula, el potencial "suceso" (término que escojo de la teoría de la probabilidad) ya se ha realizado; en otras palabras, cuando se calcula el IC, los datos (o la muestra, si lo preferís) ya están disponibles, y “son los que son” independientemente del grado con el que la muestra represente a la población (y por tanto, de forma independiente al grado con el que el estadístico represente al parámetro). De hecho, la probabilidad en la que acostumbramos a pensar frente a cualquier cálculo estadístico, en el caso de la estimación de parámetros no radica en el intervalo obtenido en sí mismo, sino en el procedimiento o método usado para obtenerlo. Este método es el que garantiza que, a la larga, si el proceso se repitiera muchas veces y se construyeran intervalos con cobertura del 95%, un gran número de ICs contendrían el parámetro deseado, y un número pequeño no lo contendrían.

Volver a Tabla de contenidos

Q06.2 ¿Cómo se calcula el intervalo de confianza de una media, con valores t o z?

Siempre es más correcto utilizar la distribución t. Se debe tener presente que usar t en lugar de z es debido a que el cálculo del error estándar utiliza la desviación estándar de la propia muestra en lugar del error estándar de la población. Esto introduce un sesgo en el IC que se debe corregir utilizando un valor t que es ligeramente mayor al valor z correspondiente. Lo que ocurre es que con muestras grandes, este sesgo es cada vez menor, y llega un momento en que es estadísticamente despreciable. De hecho, lo que se observa es que con muestras grandes (y por tanto con un número de grados de libertad grande), la distribución t converge a la ley Normal. Por esto, al hacer los cálculos a mano, os indicamos que podéis utilizar directamente el valor z en lugar de t cuando el número de observaciones es suficientemente alto (en estas situaciones las diferencias entre los valores z y t son prácticamente inapreciables). En cualquier caso, esta duda se desvanecerá finalizado el curso. Cuando en la práctica utilicéis el ordenador, los programas de análisis estadístico como el STATA siempre calculan el IC a partir de la distribución t independientemente del tamaño muestral (ya que conceptualmente es lo más correcto).

Volver a Tabla de contenidos

Q06.3 ¿Con datos cuantitativos es suficiente considerar muestra grande a partir de n=30?

Con distribuciones cuantitativas es difícil establecer un umbral a partir del cual la muestra se pueda considerar suficientemente grande como para asumir que la correspondiente distribución muestral de la media seguirá una ley Normal. La razón es que no hay un criterio matemático concreto como en el caso de las distribuciones binarias (proporciones). En esta unidad se destaca, precisamente, que el valor n=30 se ha establecido por convenio en la comunidad científica, pero sólo es asumible cuando la distribución de datos original no tiene asimetrías importantes. Por esta razón, es importante no adoptar este umbral “a ciegas”, y utilizar otras estrategias a la hora de decidir si se pueden o no utilizar técnicas estadísticas que asumen que la distribución muestral tiene una determinada forma. Por ejemplo, es muy útil que con tamaños de muestra relativamente pequeños (y no nos referimos sólo a situaciones donde n<30, sino a estudios con muestras mayores) se valore el grado de asimetría o la presencia de observaciones alejadas. Para ello puede ser útil utilizar procedimientos gráficos, como el diagrama de caja (“boxplot”).

Volver a Tabla de contenidos

Q06.4 ¿Es lo mismo error estándar que desviación estándar?

Desde un punto de vista meramente matemático, es cierto que todo error estándar (SE) es una desviación estándar (SD), pero no toda desviación estándar es un error estándar. Además, el error estándar es una desviación estándar para una distribución muy particular: la de la distribución muestral de un estadístico. En otras palabras: tanto SE como SD tienen en común que son medidas de variabilidad. Sin embargo, miden el grado de dispersión de distribuciones bien diferentes. En la práctica, el término SD se reserva para denominar al estadístico concreto que mide la heterogeneidad que aparece en una distribución de datos cuantitativos medidos en una muestra (o población) de sujetos. Por lo tanto, aporta información sobre cuál es el grado de variabilidad en dicha muestra (o población) real de individuos. El término SE se reserva para designar a la desviación estándar que se calcula en la distribución muestral de un estadístico. Por ello, aporta información sobre la variabilidad de los errores de muestreo de ese estadístico concreto.

Volver a Tabla de contenidos

Page 21: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 21

Q06.5 ¿Por qué no se debe dar en una publicación el error estándar, si es muy frecuente verlo publicado?

En este curso recomendamos no dar este índice debido a que en la práctica no tiene interpretación en sí mismo, y además muy pocos investigadores poseen los conocimientos necesarios en estadística como para comprender el concepto que subyace a este número. Por ejemplo, si el propósito de un estudio es dar una estimación de la prevalencia de una determinada enfermedad en una comunidad, es mucho más fácilmente interpretable para cualquier investigador disponer del intervalo de confianza de esta proporción a nivel poblacional que saber que el correspondiente error estándar vale, por ejemplo, 0.073. Es cierto que todavía es frecuente encontrar el valor de los errores estándar en numerosas publicaciones y comunicaciones científicas. Sin embargo, también es cierto que cada vez con mayor frecuencia se tiende a sintetizar los resultados en términos fácilmente interpretables en términos prácticos y clínicos. A mero modo de ejemplo: la filosofía que subyace en la medicina basada en la evidencia (corriente metodológica muy popular actualmente) se nutre de esta concepción.

Volver a Tabla de contenidos

Q06.6 ¿Es lo mismo teoría de la probabilidad que estadística?

Aunque formalmente y a nivel académico forman parte de una misma disciplina, las matemáticas, son materias diferentes que resuelven aspectos también opuestos. La teoría de la probabilidad es una rama de las matemáticas cuya aplicación al ámbito de las Ciencias de la Salud permite dar respuesta al problema de la “predicción”, que se plantea cuando el interés del investigador es obtener conocimiento “a priori” de una muestra aleatoria obtenida de una población para la cual conoce cómo se distribuye una determinada característica. La estadística aporta las herramientas necesarias para resolver el problema inverso (habitualmente denominado de inferencia), que consiste en obtener conocimiento de una población para la cual lo único se conoce es la distribución del atributo en una muestra limitada de sujetos. Es decir, la teoría de la probabilidad nos permite “aproximarnos” a una muestra desconocida partiendo de una población conocida. Y la estadística nos “aproxima” a una población desconocida a partir de una muestra conocida.

Volver a Tabla de contenidos

Q06.7 ¿Cómo se obtiene el valor t que se utiliza en la fórmula del IC de las medias si el número de grados de libertad no aparece en la correspondiente tabla?

La tabla de Student-Fisher con la que trabajamos en el curso no es exhaustiva, ya que no da el valor t concreto para todos los posibles grados de libertad (df) ni para todos los posibles riesgos de error (valores alfa). Este comentario es general a las otras tablas que os hemos confeccionado para estos estudios de postgrado. La razón es la siguiente: en la práctica, los cálculos los hará un ordenador, y la máquina tiene implementados todos los valores posibles para cualquier número de grados de libertad y riesgo de error. Las tablas que os damos las utilizareis únicamente durante los cursos, y su objetivo es más didáctico que práctico: os dan valores que intervienen en cálculos que os hacemos realizar para que mejoréis vuestra comprensión de los conceptos que hay detrás. Por eso, las tablas sólo dan los valores que en la práctica más se utilizan. En cualquier caso, la tabla t de Student en particular (tabla T5) comienza dando valores para grados de libertad continuos (df=2, df=3, df=4, ...). Llega un momento en que los valores se dan para grados de libertad más distantes entre sí (pasa de df=30 a df=35, luego a df=40, ...). Llega un momento en que las distancias entre los grados de libertad todavía se agrandan más. La razón es la siguiente: a partir de un determinado momento los valores de t son prácticamente idénticos para grados de libertad distantes (las diferencias entre un valor t y otro están en el tercer decimal). Por ejemplo, para alfa/2=0.025, el valor t(df=70)=1.9944 y el valor t(df=80)=1.9901. Para realizar los ejercicios del curso, yo os recomiendo que si tienes, por ejemplo un número de grados de libertad entre 70 y 80 utilicéis el valor t cuyos df se parezcan más a los del ejercicio, o incluso un valor promedio. Y si deseáis ser “muy precisos”, obtened dichos valores con ordenador (por ejemplo con una calculadora on-line o con una hoja de cálculo tipo Excel) o haced una interpolación lineal tal como os enseñamos en otra FAQ de esta misma unidad (aunque esta última opción es muy laboriosa y no os la exigimos en el curso). Otra aclaración, la tabla finaliza para df=500, y se indica que a partir de aquí los valores t convergen a la ley normal (es decir, el valor de t para df>500 es prácticamente idéntico al valor z que deja a la derecha un determinado riesgo de error). Así, para un tamaño de muestra muy grande, la ley t se convierte en la ley z.

Volver a Tabla de contenidos

Page 22: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 22

Q06.8 ¿Cómo se efectúa una interpolación lineal para conocer un valor que no viene en el libro de tablas del curso?

Una interpolación lineal es un caso particular de la interpolación lineal de Newton, y en el ámbito de las matemáticas designa la obtención de nuevos puntos partiendo del conocimiento de un conjunto discreto de puntos. En términos prácticos consiste en hallar un dato dentro de un intervalo en el que conocemos los valores en los extremos. El término lineal designa que se utiliza un polinomio de interpolación de grado 1 que se denota del siguiente modo:

f(xo | x1;x2) = f(x1) + 1x2x1xox

[ f(x2) f(x1) ]

Si nunca habéis aplicado este tipo de cálculo, es bien sencillo. Os proponemos un ejemplo para el valor chi-cuadrado con 59 grados de libertad y un alfa=0.975. Suponed que los únicos valores disponibles que nos dan las tablas son para DF=50 y DF=60 son, y valen respectivamente 32.357364 y 40.481748.

A partir de estos valores se opera así: 32.357364 + 50605059

(40.481748 32.357364)

Puesto que los valores de las tablas también son aproximados, la solución no es exactamente igual a la de los programas informáticos, pero se aproxima muchísimo (operando se obtiene: 39.669).

Volver a Tabla de contenidos

Q06.9 ¿Se pueden comprobar las condiciones de aplicación del IC de asintótico-aproximado con la proporción observada en la muestra (po)?

No. Las condiciones de aplicación del IC de una proporción mediante la fórmula asintótica-aproximada basada en la ley Normal se comprueban a partir de los propios límites del IC una vez se ha calculado. De forma teórica, se considera que puede ser cualquier valor dentro del rango del propio intervalo de confianza, luego se tendrían que comprobar infinitos productos n× y n(1). Pero en la práctica se demuestra que en realidad los productos más desfavorables (esto es, los que aportan resultados más bajos) están siempre en los límites del intervalo. Lo que se suele hacer es comprobar el producto que a priori sabemos que va a dar un resultado más bajo posible.

Volver a Tabla de contenidos

Q06.10 ¿De un modo practico, qué diferencia hay entre intervalo de probabilidad y de confianza?

Un intervalo de probabilidad se construye si: a) se conoce el valor de un parámetro (por ejemplo una media o una proporción) en una población completa de sujetos; y b) se plantea qué valor tendrá el correspondiente estadístico (media o proporción) que se obtendría si de esa población completa se obtuviera una muestra aleatoria. En la práctica, desde el punto de vista de la investigación biomédica, este intervalo no es el que interesa, ya que el objetivo no es plantearse qué ocurrirá en una muestra aleatoria obtenida de una población conocida. En la práctica, el problema es el siguiente: disponemos de una muestra concreta, en esa muestra calculamos el valor de un estadístico (media o proporción) y a partir de esta información nos planteamos qué valor tendrá el parámetro correspondiente en la población original de la que procede la muestra de estudio. Pues bien, el intervalo que nos permite pasar de esta muestra conocida a la población amplia desconocida es el intervalo de confianza.

Volver a Tabla de contenidos

Q06.11 ¿Qué se debe hacer si para calcular el tamaño de muestra desconozco totalmente el valor del parámetro “Pi” en la población?

Es atípico que se planteen estudios epidemiológicos para los cuales se desconozca totalmente el valor de los parámetros en poblaciones de composición similar a la del estudio. Por lo general, una adecuada documentación bibliográfica (con revisiones sistemáticas) aporta indicios sobre los valores que pueden tomar estos parámetros. Pero si se está en un contexto totalmente exploratorio y se desea efectuar un cálculo de muestra, se utiliza el valor de “Pi” más desfavorable, esto es, el que comporta un tamaño de muestra mayor. Este valor es 0.50.

Volver a Tabla de contenidos

Page 23: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 23

Q06.12 ¿Es lo mismo error estándar que error típico?

Sí, ambos términos designan la dispersión de la distribución muestral de un estadístico respecto a su centro de gravedad.

Volver a Tabla de contenidos

Q06.13 ¿Qué se entiende por intervalo de confianza asintótico?

Se denomina intervalo de confianza asintótico al que se obtiene utilizando un procedimiento no-exacto, y que por lo tanto debe cumplir unos supuestos para su interpretación. En el caso de la media y de la proporción, el intervalo de confianza asintótico se calcula mediante el procedimiento de estimación basado en el supuesto de que la distribución muestral del estadístico sigue ley Normal.

Volver a Tabla de contenidos

Page 24: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 24

Unidad 07: Comprobación de hipótesis

Q07.1 ¿El cálculo del grado de significación siempre se debe efectuar con tablas?

En la práctica, el valor concreto del grado de significación (P) para una prueba de comprobación de hipótesis siempre se obtiene con la ayuda de un ordenador. En este curso, sin embargo, con objeto de ayudar a los alumnos a consolidar el concepto que subyace a estos valores se formulan ejemplos y ejercicios que implican obtenerlos a partir de tablas estadísticas. Esto implicará que en la mayoría de los casos los valores P calculados manualmente serán aproximados, y no exactos (tal como los daría el ordenador). Esto se debe a la forma en que las tablas están elaboradas. En las siguientes unidades se enseña la forma concreta de interpretarlas.

Volver a Tabla de contenidos

Q07.2 ¿En qué casos el grado de significación P se puede considerar una medida de la intensidad de la relación entre una exposición y una respuesta?

Nunca. El grado de significación P constituye un índice matemático que indica el grado de credibilidad de la hipótesis nula, pero no tiene nada que ver con la importancia práctica de la hipótesis (a nivel clínico, biológico o psicológico), con la magnitud del efecto o con la intensidad de la relación. Por esta razón, cuando se afirma que una relación es "muy significativa" (o "poco significativa") no se aporta información de interés práctico, ya que el valor P depende, fundamentalmente, del tamaño de la muestra.

Volver a Tabla de contenidos

Q07.3 ¿Por qué razón el grado de significación P depende del tamaño de la muestra?

Cuando las pruebas de significación se aplican en muestras pequeñas, es probable obtener un valor P no significativo a pesar de que exista una asociación o efecto prácticamente importante, ya que la variabilidad del muestreo (SE) es muy grande. Por ejemplo, vamos a suponer que estamos realizando una prueba de bondad de ajuste para verificar si una muestra procede de población en la cual la distribución de la variable sigue ley Normal. En este caso, podría suceder que la distribución en cuestión observada presentara desvíos importantes de la normalidad, pero si la muestra contiene pocos casos la prueba carece de potencia para detectar estas anormalidades.

Volver a Tabla de contenidos

Q07.4 ¿En un artículo, comunicación, etc., cómo se indica el grado de significación cuando el ordenador presenta el valor .000?

En los listados de ordenador los resultados aparecen redondeados. Si se obtiene un valor P=0.000 significa que P es muy pequeño, en este caso, inferior a P<0.0005 (ya que si por ejemplo P fuera 0.0006 el ordenador lo habría redondeado a P=0.001). Se debe tener presente que es totalmente incorrecto decir que P=0 ya que esto es teórica y conceptualmente imposible. El valor P concreto de un estudio puede ser infinitamente pequeño, pero nunca cero (las distribuciones muestrales sobre las que se trabaja son asintóticas, y por tanto el área por las colas puede ser muy pequeño pero no cero). Por otro lado, desde el punto de vista más filosófico-conceptual, la hipótesis nula que se plantea como base para el cálculo de la prueba de significación podría ser poco creíble a partir de los resultados de una investigación (esto es lo que se reflejaría con un valor P muy pequeño), pero nunca podría concebirse como una posibilidad imposible (esto es lo que representaría una valor P=0). La forma habitual de expresar en un artículo o comunicación este tipo de resultado es: P<0.001.

Volver a Tabla de contenidos

Q07.5 ¿Cómo se decide cuál es el umbral a partir del cual una diferencia se considera importante práctica o clínicamente?

El “umbral de significación práctica” lo determina el conocimiento teórico, y no tiene nada que ver con la estadística. En otras palabras, para establecer el punto a partir del cual un resultado se considera clínicamente relevante se debe recurrir a un clínico “experto” en la materia.

Volver a Tabla de contenidos

Q07.6 ¿En qué criterios se basa considerar una diferencia importante a nivel clínico-práctico?

No existen pruebas o umbrales estadísticos a partir de los cuales se pueda considerar que una determinada diferencia es importante a nivel clínico o práctico. Estos umbrales se establecen tras la consulta con expertos. Por ejemplo, en contextos terapéuticos se basan en la valoración de los costes-beneficios de una determinada intervención.

Page 25: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 25

Volver a Tabla de contenidos

Q07.7 ¿Cómo se efectúan las pruebas de significación que aparecen en esta unidad?

Esta unidad es una presentación muy teórica de la lógica que vamos a seguir en el resto del curso para resolver el contraste de hipótesis. Lo que se hace es, simplemente, ofrecer una idea general de los conceptos que hay detrás de las pruebas de significación y de las pruebas de hipótesis. En las próximas unidades, se concretan cada una de las técnicas estadísticas, se enseña a comprobar los supuestos de aplicación de las pruebas clásicas que no son exactas y se detalla cómo proceder cuando estos supuestos no se cumplen. En concreto, en esta unidad se muestra la lógica de las pruebas de contraste de hipótesis con dos tipos de problemas: comparación de una media observada a una teórica y comparación de dos medias observadas. Os damos la aproximación basada en la prueba Z porque utiliza la ley Normal que ya conocéis. En la práctica, comprobaréis que en realidad lo que se hace es utilizar una distribución similar a la Z pero que permite trabajar con la variabilidad de las propias muestras, a través de la popular prueba T de Student-Fisher. Pero esto, lo veremos en la unidad 9. En síntesis: esta unidad debéis prepararla desde una vertiente más conceptual. Las cuestiones de cálculo son auxiliares, y su desarrollo formal lo vemos más adelante.

Volver a Tabla de contenidos

Q07.8 ¿Cuándo fijar delta positivo y negativo en pruebas de no inferioridad?

Ejemplos de No Inferioridad: cuándo fijar delta positivo y cuándo delta negativo Para comparar la eficacia del tratamiento A frente al de referencia R se pueden utilizar distintos criterios (variables dependientes). Por ejemplo, se puede considerar el valor de la PAS (mmHg) al final del estudio o la diferencia (cambio) entre los valores basales y los finales (obtener para cada paciente la diferencia pretratamiento - postratamiento).

PAS al final del tratamiento

Cambio de la PAS (pre-post)

Fármaco Sujetos Media Variancia Media Variancia A 50 142 106 15 8 R 50 138 94 20 6

Si nos fijamos en los valores finales, a

mayor media PEOR eficacia

Si nos fijamos en los cambios pre-pos, a

mayor media MEJOR eficacia

Si como variable respuesta utilizamos la PAS al final del tratamiento: Comprobar si la eficacia del tratamiento A no es inferior a la del tratamiento R implica fijar un valor * positivo, pues a MAYOR respuesta MENOR eficacia. Diferencia observada en el estudio: A – R = 142 – 138 = 4 mmHg. En este estudio concreto, el tratamiento A es menos eficaz que el de referencia R, ya que al final del tratamiento A obtiene en promedio 4 mmHg más que R.

Si como variable respuesta utilizamos el cambio pre-post de la PAS: Comprobar si la eficacia del tratamiento A no es inferior a la del tratamiento R implica fijar un valor * negativo, pues a MENOR respuesta MENOR eficacia. Diferencia observada en el estudio: A – R = 15 – 20 = –5 mmHg. En este estudio concreto, el tratamiento A es menos eficaz que el de referencia R, ya que el cambio que se observa para A es -5 mmHg menor.

Volver a Tabla de contenidos

Q07.9 ¿Es recomendable plantear pruebas unilaterales con el propósito de incrementar la probabilidad de rechazar la hipótesis nula?

Rotundamente, no. Las pruebas nunca deben plantearse con la previsión de incrementar la posibilidad de detectar diferencias significativas. Si lo hiciéramos, siempre utilizaríamos comparaciones unilaterales. Sin embargo, en la práctica estas pruebas son muy poco utilizadas, y se suelen reservar a contextos muy concretos en los que no existe ningún interés por analizar resultados en la línea contraria a la que se plantea (por ejemplo, en el ámbito de las pruebas de no inferioridad).

Volver a Tabla de contenidos

Page 26: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 26

Unidad 08: Diseño de estudios

Q08.1 ¿Los resultados estadísticamente significativos indican que los cambios en una exposición son “la causa” de las modificaciones de una respuesta?

Es fundamental diferenciar entre significación estadística y relación causal entre variables. Las pruebas estadísticas tienen como objetivo generalizar la asociación observada en una muestra a la población origen, pero en ningún caso permiten deducir que esta asociación implica una relación causa-efecto. Dar interpretaciones causales depende del diseño del estudio, y sólo se pueden expresar cuando se utilizan estrategias de control adecuadas. Por ejemplo, imaginemos que en un colegio se registra para niños desde primaria hasta finalizada la ESO las siguientes dos variables: número total de problemas de aritmética que son capaces de resolver correctamente y peso (en kg). Si se valora la relación entre ambos factores de forma “bruta” la asociación estadística es evidente, y además tiene un carácter positivo: a mayor peso del niño mayor número de operaciones resuelve bien. Este resultado no debe inducir a considerar que el peso de los jóvenes en edad escolar es la causa del rendimiento matemático-aritmético. De hecho, esta “relación ficticia” desaparece cuando se controla la edad de los niños y se efectúa un análisis “ajustado”. Por ejemplo, si la experiencia se repite de forma separada en cada curso, la asociación estadística no emerge. En otras palabras, un resultado estadístico sólo puede interpretarse en términos de causalidad cuando existen las suficientes garantías como para asegurar que no hay variables de confusión que puedan estar alterando la intensidad y el sentido de los resultados.

Volver a Tabla de contenidos

Q08.2 Si se estudia la relación (no ajustada) entre una exposición X y una respuesta Y, y el resultado es estadísticamente no significativo, ¿esto podría ser debido al efecto de una variable de confusión?

En efecto, cuando no se controla su efecto, las variables confundidoras producen diferentes sesgos en la relación entre una exposición y una respuesta. En la práctica, esta influencia se puede manifestar haciendo que emerja una relación inexistente, enmascarando la relación o invirtiendo el sentido del efecto.

Volver a Tabla de contenidos

Q08.3 ¿Una variable puede ser a su vez confundidora y modificadora del efecto?

Así es, una variable puede ser a la vez un factor de confusión y un factor modificador del efecto. Es variable confundidora aquella que guarda relación con la respuesta objeto de estudio y se presenta de forma desigual en los grupos. Es modificadora del efecto si en función del valor que posea se obtienen unos resultados u otros. En este curso únicamente se presentan estos conceptos, y se matiza que si bien la confusión es un aspecto más ligado a las investigaciones de tipo no experimental, la interacción (o modificación de efecto) puede aparecer en cualquier diseño. La valoración y el tratamiento estadístico de ambos fenómenos se detallan en los cursos más avanzados de metodología de la investigación sanitaria y análisis multivariante.

Volver a Tabla de contenidos

Q08.4 ¿Es lo mismo hablar de potencia estadística que de potenciación?

El término "potencia" tiene diversos significados en el ámbito de la investigación científica, y en concreto de la estadística. Por ejemplo, nos podemos referir a la potencia concreta de una prueba estadística (como la t de Student para comparar dos medias). Este concepto está explicado en la unidad 8. En esta unidad se usa el término "potenciación" desde la vertiente de la metodología de la investigación. Aquí también tiene diversas interpretaciones, aunque solemos hablar de potenciación cuando la presencia de un factor incrementa la probabilidad de ocurrencia de un efecto. El objetivo de muchas investigaciones consiste, precisamente, en cuantificar la intensidad de dicha relación a través de técnicas estadísticas.

Volver a Tabla de contenidos

Q08.5 ¿La interacción es solamente propia de diseños no experimentales?

No, en absoluto. Si bien la confusión es un fenómeno que tiene más importancia en la metodología no experimental, la interacción puede aparecer en cualquier tipo de diseño sea o no de carácter experimental.

Volver a Tabla de contenidos

Page 27: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 27

Unidad 09: Comparación de dos proporciones. Medidas de asociación

Q09.1 ¿Si no se dispone de un programa de inferencia exacta, y la prueba de homogeneidad Ji-cuadrado no cumple las condiciones de aplicación, es incorrecto dar el resultado de la prueba de Fisher?

Aunque en estudios comparativos es preferible el uso de pruebas incondicionadas, durante décadas en la práctica estos procedimientos se han sustituido por el test clásico de Fisher debido a que su realización resultaba menos laboriosa. Todavía hoy en día es habitual continuar dando este resultado cuando las muestras son pequeñas. Sin embargo, deberíamos abandonar esta costumbre, pues muchos programas de análisis estadístico ya incorporan otros métodos de estimación (como por ejemplo los basados en técnicas de Monte-Carlo). La diferencia fundamental que en la práctica se observa entre ambas técnicas (métodos incondicionados y prueba de Fisher) radica en el grado de potencia: la prueba de Fisher acostumbra a ser más conservadora y por consiguiente da un valor P mayor (menos significativo).

Volver a Tabla de contenidos

Q09.2 ¿Qué es preferible dar como medida de asociación, la diferencia de proporciones o la razón de proporciones?

Ambos índices son matemáticamente correctos para valorar el grado de asociación/intensidad de la relación. Desde el punto de vista práctico, sin embargo, aportan informaciones diferentes. La diferencia de proporciones es más frecuente en contextos de gestión y organización de recursos, pues mide cómo se modifica la proporción de sujetos con el evento al cambiar el nivel de exposición. La característica más importante de este número es que su magnitud depende directamente del propio tamaño de las proporciones que se están restando. Un valor próximo a cero, por lo tanto, no es necesariamente indicativo de relación poco intensa. La razón de proporciones es una medida más frecuentes en estudios que tienen como objetivo valorar el factor de riesgo de una exposición, ya que su magnitud es independiente del tamaño de las proporciones. Esto hace que, desde un punto de vista etiológico, sea más sencillo de interpretar.

Volver a Tabla de contenidos

Q09.3 ¿Por qué se considera que el IC de la diferencia de proporciones es no significativo si incluye el 0 y el IC de la razón de proporciones es no significativo si incluye el valor 1?

La hipótesis nula establece que en las poblaciones de origen las proporciones son iguales. Cuando dos proporciones que son iguales se restan, la diferencia de proporciones da valor 0. En cambio, cuando dos proporciones que son iguales se dividen, el cociente (razón) da 1.

Volver a Tabla de contenidos

Page 28: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 28

Unidad 10: Relación entre dos variables categóricas. Pruebas de Ji-cuadrado

Q10.1 ¿En una tabla de 2×2 es mejor obtener el grado de significación con la prueba Z o con la de Ji-cuadrado?

Si la tabla es de 2×2, el resultado de ambas pruebas coincide, y por lo tanto es indiferente utilizar una u otra. En términos generales, se debe tener presente que el valor de la distribución Ji-cuadrado con 1 grado de libertad es igual al correspondiente valor Z elevado al cuadrado.

Volver a Tabla de contenidos

Q10.2 ¿Cómo se obtiene el grado de significación P para un valor Ji-cuadrado a partir de la Tabla T3?

La tabla T3 te permite "aproximarse" al valor concreto P que corresponde a un valor de Ji-cuadrado. Lo que esta tabla presenta son los valores P asociados a resultados Ji-cuadrado concretos. Por ejemplo, si en un estudio se obtiene un valor Ji-cuadrado=9.2103 y se trabaja con df=2 grados de libertad, el valor P sería exactamente de 0.01. Si se dispone de un valor Ji-cuadrado=10.5966 con df=2 grados de libertad, P sería 0.005. Esto ayuda a valorar de forma aproximada qué valor P corresponde al resultado de cualquier estudio. Si resulta que el valor Ji-cuadrado obtenido con df=2 grados de libertad es 9.5, el valor P que le corresponde está entre 0.01 y 0.005. Una manera de expresar esto es decir, simplemente, que P<0.01. Por otro lado, los valores P exactos que corresponden a cualquier valor de Ji-cuadrado los da el ordenador.

Volver a Tabla de contenidos

Q10.3 ¿Cómo se calcula el coeficiente de correlación en una tabla 2×2?

En el documento sobre uso de la calculadora tenéis explicado cómo calcular índices estadísticos para dos series de números, por ejemplo los parámetros a y b de la regresión o el coeficiente de correlación de Pearson necesario para realizar la prueba de tendencia lineal. Os facilitamos ahora un ejemplo para una tabla 2×3. Suponed que los datos son los siguientes: Columna X=0 Columna X=1 Columna X=2 Fila Y=1 2 4 8 Fila Y=0 8 6 2 Según los datos anteriores, tenemos un total de 2+4+8+8+6+2=30 sujetos. La correspondiente matriz de datos es muy simple. En concreto, tenemos la serie X e Y con los siguientes valores y frecuencias: El par X=0 Y=1 con frecuencia de 2 veces El par X=1 Y=1 con frecuencia de 4 veces El par X=2 Y=1 con frecuencia de 8 veces El par X=0 Y=0 con frecuencia de 8 veces El par X=1 Y=0 con frecuencia de 6 veces El par X=2 Y=0 con frecuencia de 2 veces Esto implica lo siguiente: Tenemos que entrar el par (0,1) dos veces. Tenemos que entrar el par (1,1) cuatro veces. Tenemos que entrar el par (2,1) ocho veces. Tenemos que entrar el par (0,0) ocho veces. Tenemos que entrar el par (1,0) seis veces. Tenemos que entrar el par (2,0) dos veces.

Volver a Tabla de contenidos

Q10.4 ¿La prueba de la razón de verosimilitud es análoga al Ji-cuadrado de Pearson?

Esta prueba permite la comparación simultánea de proporciones en tablas de contingencia, y valora la misma hipótesis estadística que la clásica prueba Ji-cuadrado de Pearson. Aunque algunos programas de estadística siempre presentan el resultado de la prueba de razón de verosimilitud cuando se ejecuta el procedimiento CROSSTABS, a nivel práctico esta prueba se utiliza e interpreta cuando los datos se analizan a través de modelos de regresión logística. En caso contrario, es más habitual utilizar la prueba clásica de Pearson.

Volver a Tabla de contenidos

Page 29: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 29

Q10.5 ¿Con una variable independiente con categorías ordenadas, es mejor utilizar la prueba de tendencia lineal o la prueba de homogeneidad?

Si la variable exposición tiene categorías ordenadas, lo más habitual es escoger la prueba de tendencia lineal, ya que en esta situación lo más frecuente es querer valorar si a medida que la exposición cambia también lo hace la respuesta en una misma dirección (creciente o decreciente). Por ejemplo, suele tener más interés saber si a medida que los sujetos incrementan el nivel de exposición a humo también aumenta la probabilidad de que presenten cáncer de pulmón que cuestionarse si la probabilidad de cáncer es distinta (en cualquier sentido) para sujetos con distintos niveles de exposición al humo. La prueba de tendencia lineal es, además, más potente que la prueba clásica de Pearson. Esto implica que en ocasiones puede que la prueba clásica de Ji-cuadrado aporte un resultado no significativo y la de tendencia lineal sí sea significativa. No es extraña esta situación: el azar puede explicar en ocasiones las diferencias globales entre las proporciones, pero si estas mismas diferencias están "ordenadas" (esto es, tienen una tendencia creciente o decreciente) el azar es menos probable que lo explique.

Volver a Tabla de contenidos

Q10.6 ¿En la prueba de tendencia lineal, qué implica una tendencia cuadrática significativa?

Si previamente se ha valorado que sí hay tendencia lineal, lo único que implica es que las diferencias entre las proporciones no son constantes para los distintos niveles de la exposición. En otras palabras, que aunque pueda haber tendencia creciente o decreciente, esta tendencia no se ajusta exactamente a un a línea recta.

Volver a Tabla de contenidos

Q10.7 ¿En tablas 2×2, qué es mejor realizar la prueba de comparación de proporciones con la prueba Z o con un Ji-cuadrado?

Ambas pruebas son análogas, lo cual implica que ofrecen idénticos resultados. Escoger una u otra es indiferente, ya que finalmente se llega a la misma conclusión.

Volver a Tabla de contenidos

Q10.8 ¿Cuándo se deben usar las pruebas incondicionales y cuándo la prueba exacta de Fisher?

Desde un punto de vista matemático, en los estudios de homogeneidad siempre se deberían usar pruebas incondicionales si no se cumplen las condiciones de uso del estadístico clásico de Pearson, ya que la distribución de probabilidad subyacente así lo exige. En la práctica, sin embargo, se ha generalízado el uso del estadístico exacto de Fisher debido a que los programas clásicos de análisis estadístico no disponían de estas pruebas, cuya realización es enormemente laboriosa. Actualmente, sin embargo, ya disponemos de sistemas informáticos que incluyen este tipo de algoritmos, y por lo tanto su uso es más habitual.

Volver a Tabla de contenidos

Page 30: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 30

Unidad 11: Comparación de dos medias. Pruebas t

Q11.1 ¿Puede efectuarse la comparación de dos medias con la prueba Z si la muestra es grande?

La comparación de dos medias observadas en grupos independientes se efectúa con la clásica prueba t de Student-Fisher, siempre que ésta cumpla con los requisitos de aplicación: muestras grandes o procedentes de población normal.

Volver a Tabla de contenidos

Q11.2 ¿Si el resultado de la prueba de significación que compara dos medias es no significativo es obligado dar el intervalo de confianza de la diferencia de medias?

Actualmente la comunidad científica requiere presentar de forma simultánea el resultado de las clásicas pruebas de significación (valores P) y el grado de intensidad de la relación a través de los intervalos de confianza (IC) de las medidas de asociación-efecto. Puestos a escoger, recomendamos dar los IC de los efectos porque permiten valorar de forma simultánea la significación estadística y el alcance clínico de una exposición.

Volver a Tabla de contenidos

Q11.3 ¿Qué prueba de normalidad es más recomendable, la de Kolmogorov o la de Shapiro-Wilks?

La prueba de Kolmogorov es la clásica en el estudio de la normalidad. Sin embargo, se recomienda utilizar la prueba de Shapiro-Wilks, especialmente cuando se dispone de muestras pequeñas.

Volver a Tabla de contenidos

Q11.4 ¿Se puede prescindir estudiar la normalidad de las distribuciones si las muestras superan 30 sujetos?

El Teorema Central del Límite asegura que la distribución muestral de las medias (y de su correspondiente diferencia) se ajusta a una ley Normal cuando las variables siguen leyes Normales en las poblaciones origen o las muestras son suficientemente grandes. Se considera que con datos cuantitativos, este Teorema tiene potencia suficiente a partir de N=30 si en las poblaciones las asimetrías son moderadas. En casos de asimetrías más importantes, el número de sujetos debe ser mayor para que la distribución muestral se normalice (este aspecto se puede revisar ampliamente en la Unidad 6).

Volver a Tabla de contenidos

Q11.5 ¿Qué son las pruebas no paramétricas?

Se denominan pruebas no paramétricas aquellas que se pueden utilizar independientemente de que los datos cumplan o no unas determinadas condiciones. En general, son pruebas "exactas" que no tienen condiciones de aplicación, o las tienen muy débiles. Por otro lado, el término paramétrico hace referencia a pruebas aproximadas que tienen condiciones de uso. Son las más populares debido a que su cómputo acostumbra a ser menos laborioso y a que son más potentes.

Volver a Tabla de contenidos

Q11.6 ¿En qué ocasiones se usa la transformación logarítmica para normalizar una distribución de valores?

El recurso de las transformaciones implica un cambio de escala de la variable, y su objetivo fundamental según estudiaremos este curso es conseguir que los datos reúnan unas características determinadas que les permitan ser analizados con unas técnicas estadísticas concretas. En la práctica, existen numerosas formas de transformar una variable métrica. Una de ellas, y muy clásica por cierto, es la logarítmica. En la unidad 1 ya la presentamos al hablar de la media geométrica. Entonces comentamos que la transformación logarítmica permite normalizar una distribución cuando hay asimetrías de tipo positivo. En el caso de la comparación de medias, ¿cuándo usarla? Clásicamente esta estrategia se ha empleado cuando las muestras son pequeñas y manifiestan asimetrías evidentes, ya que en esos casos la distribución muestral del estadístico de contraste no sigue ley normal (revisar unidad 6) y las pruebas T clásicas que se utilizan habitualmente no funcionan. De todas formas, en este caso de incumplimiento de los supuestos del t-test, hay otras estrategias distintas a la transformación logarítmica. En esta unidad, por ejemplo, se enseñan diferentes técnicas que también implican una transformación y que se usan cuando las técnicas paramétricas no cumplen las condiciones: las pruebas del signo, T de Wilcoxon, U de Mann-Whitney, etc. Estas técnicas también implican transformar los datos originales, en concreto lo que se hace es identificar qué valor ocupa cada dato en el conjunto de la distribución, para luego trabajar con estas posiciones

Page 31: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 31

(también denominadas órdenes). En la actualidad es más habitual encontrar estas técnicas que las transformaciones logarítmicas. En cualquier caso, el recurso a la transformación se reserva únicamente para situaciones en que las técnicas habituales no pueden ser utilizadas. Esto es así porque por lo general los datos transformados ofrecen resultados que son menos interpretables a nivel clínico, o incluso pueden conllevar análisis con menos potencia estadística.

Volver a Tabla de contenidos

Q11.7 ¿Cómo puedo saber cuántos empates tienen los datos con el objeto de valorar si una determinada prueba no paramétrica es o no adecuada?

Si la prueba es ordinal, por definición habrá muchos empates. Si es cuantitativa, saber los empates es bien sencillo: con STATA basta obtener la tabla de frecuencias de la variable que se contrasta especificando que ordene los resultados por frecuencia descendiente.

Volver a Tabla de contenidos

Q11.8 ¿Con datos asimétricos, puedo usar pruebas no parámetricas y a la vez estimar el IC de la diferencia de medias?

No sería correcto. Si las distribuciones son asimétricas y las muestras pequeñas, la prueba estadística de comparación de medias se realiza a través de pruebas no paramétricas (la prueba t-test no es adecuada porque la distribución muestral de la diferencia de medias no sigue ley Normal). En estos casos, para obtener una medida de asociación clínica, es mejor estimar el IC de la diferencia de medianas.

Volver a Tabla de contenidos

Q11.9 ¿En un estudio con VI cuantitativa y VD binaria se puede aplicar un t-test de comparación de 2 medias?

No sería correcto. La prueba t-test es “asimétrica” en su aplicación, y exige que la exposición sea categórica binaria y la respuesta cuantitativa. En caso contrario, se debe recurrir a modelos de regresión logística binaria (se explican en cursos más avanzados de regresión múltiple).

Volver a Tabla de contenidos

Q11.10 ¿Por qué es posible utilizar la prueba clásica del t-test en muestras grandes si se presentan anomalías?

La prueba clásica t-test se basa en que la distribución muestral de la diferencia de medias siga ley Normal. Esto se cumple en dos supuestos: a) si las muestras son grandes (sea cual sea la forma de la distribución, ya que el teorema central del límite actúa normalizando la distribución muestral de la diferencia, ver unidad 6); y b) si las muestras son pequeñas y no presentan anomalías destacables.

Volver a Tabla de contenidos

Page 32: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 32

Unidad 12: Comparación de varias medias. Análisis de la variancia

Q12.1 ¿Qué aspecto de una relación valoran la tendencia lineal y la cuadrática?

Decimos que entre las medias existe este tipo de relación cuando los cambios al pasar de una a otra no son constantes. Es decir, que al pasar por ejemplo del nivel 1 al 2 de la exposición el cambio medio en la respuesta es diferente que al pasar del nivel 2 al 3. Dicho de otro modo, cuando se representan gráficamente las medias y se traza una línea sobre ellas se observa que se dibuja un polinomio de segundo grado (tiende a verse una "parábola"). La línea no es perfecta. Si la tendencia cuadrática es estadísticamente significativa significa que las medias no siguen una tendencia "lineal" perfecta, es decir, que cuando se representan gráficamente la línea que las une tiene una curvatura. Matemáticamente esto supone que al pasar, por ejemplo, del valor alcoholemia nulo a medio se produce un cambio distinto (mayor o menor) que al pasar del valor alcoholemia medio a alto. Fijaros que en el ejemplo sobre alcohol y tiempo de reacción desarrollado en la unidad lo que se sugiere es, precisamente, esto: que además de una tendencia creciente en las medias hay un polinomio de segundo grado. ¿Por qué no lo ha detectado la prueba de significación? Por falta de potencia: se dispone únicamente de 5 sujetos por grupo, y es difícil poder aprehender este aspecto de la distribución.

Volver a Tabla de contenidos

Q12.2 ¿Cómo se interpreta el análisis de la variancia de tendencias?

En relación a la interpretación de las tendencias, lo más relevante es lo siguiente: a). Si la tendencia lineal es significativa lo que se observa es que entre las medias hay una tendencia creciente o decreciente. Esto es, los valores medios de la respuesta tienden a crecer (o decrecer) cuando se incrementan los niveles de la exposición. b.) Si la tendencia cuadrática es significativa lo que se observa es que los incrementos (o decrementos) entre las medias de la respuesta no son constantes. Por ejemplo, puede suceder que al pasar del nivel 1 al nivel 2 de la exposición haya un incremento pequeño en la respuesta, y en cambio un incremento mayor al pasar del nivel 2 al nivel 3 de la exposición. Dicho de otra forma, imaginad que representas gráficamente las medias de los grupos. Si la forma del dibujo se ajusta más o menos a una línea creciente o decreciente, la tendencia lineal es significativa. Si además, se observa que hay desvíos respecto a la línea (por ejemplo, se intuye un dibujo para una función de segundo grado), la tendencia cuadrática también es significativa.

Volver a Tabla de contenidos

Q12.3 ¿Qué significa que los contrastes ortogonales sean redundantes?

El criterio de "redundancia" es difícil de valorar "a ojo". Se necesita experiencia y algo de conocimiento en matemáticas. Por lo general, se usan contrastes "ad hoc" que calculan automáticamente los ordenadores y garantizan la ortogonalidad. De todas formas, no te obsesiones por este aspecto. El tema de la ortogonalidad es relevante en análisis específicos que suelen versar sobre "reducción de variabilidad" (por ejemplo, análisis factoriales). En el tipo de pruebas que enseñamos en la diplomatura, es un aspecto que resulta más accesorio y en el que los investigadores recaban poca atención. Respecto al concepto de ortogonalidad, este curso no tiene por objetivo que acabéis de entender este concepto, ya que se explica con mucho más detalle en el curso de multivariante. La idea que debéis tener es que cuando se calculan contrastes ortogonales se garantiza que no contienen información redundante.

Volver a Tabla de contenidos

Q12.4 ¿Existen contrastes “a posteriori” para el supuesto de variaciancias distintas?

En efecto, así es. El programa STATA, por ejemplo, dispone de una amplia gama de estrategias para realizar los contrastes “a posteriori” (comparaciones múltiples) cuando no se cumple el supuesto de homogeneidad de variancias. Es habitual escoger en estos casos los contrastes de Tamhane.

Volver a Tabla de contenidos

Q12.5 ¿Con contrastes polinómicos, se debe interpretar los términos que el STATA etiqueta como “ponderados” o como “no ponderados”?

La ponderación es una corrección que se efectúa para muestras distintas. Siempre se deben interpretar los términos etiquetados como “ponderados”.

Volver a Tabla de contenidos

Page 33: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 33

Q12.6 ¿Cómo se asignan coeficientes a los contrastes?

La asignación de contrastes depende precisamente de la comparación que quieres efectuar. Supongamos que disponemos de 4 grupos a comparar A-B-C-D, y que se quieren efectuar las siguientes comparaciones: - En el contraste 1 se desea comparar C y D. En este caso asignamos a A y B el valor de 0, ya que estos grupos no forman parte de la comparación. Por otro lado, puesto que un contraste no es ni más ni menos que una diferencia entre dos medias, para obtener la diferencia que nos interesa a uno de los dos grupos que sí participan en la comparación se le asigna 1 y a otro se le asigna -1. El signo se asigna a uno u otro grupo dependiendo de cómo se quiere obtener la diferencia (en positivo o en negativo). - En el contraste 2 se desea comparar A contra C y D, entendiendo que los sujetos de los grupos C y D irán en un mismo "conjunto" en la comparación. Por ello, la idea es la siguiente, se asigna al grupo A el valor 1 (o -1, según se desee la diferencia) y el complementario (esto es, el valor -1) se divide entre los dos grupos C y D que se van a integrar dentro de un mismo conjunto. Para este tipo de contrastes, cuando las muestras que se agrupan en un mismo conjunto tienen distinto tamaño, no es correcto dividir el valor 1 del coeficiente en partes iguales, sino que se debe ponderar por el tamaño de la muestra.

Volver a Tabla de contenidos

Page 34: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 34

Unidad 13: Correlación y regresión lineal

Q13.1 ¿Cómo se valora a nivel estadístico la confusión en un diseño no experimental?

Este tema se estudia ampliamente en cursos más avanzados. En este curso damos una orientación sobre cómo se aborda la confusión cuando se utilizan técnicas de ajuste estadístico. La idea es simple: si se sospecha que hay una variable de confusión se obtienen dos modelos, uno simple que sólo incluya la exposición y otro múltiple con la exposición y la confusora. La lógica de la interpretación se basa en comparar, a partir de criterios clínicos, si el parámetro b asociado a la exposición es igual o distinto en ambos modelos. Si es análogo, no es imprescindible utilizar un modelo múltiple con variables de ajuste. Si el parámetro b es diferente, es imprescindible utilizar el modelo múltiple. Debe quedar claro que en ningún caso se mira la significación del parámetro b de la variable de ajuste, ya que esta variable en realidad no interesa al investigador (sólo se incluye porque de no hacerlo los resultados podrían estar sesgados).

Volver a Tabla de contenidos

Q13.2 ¿Qué es el coeficiente “Beta” en un modelo de regresión lineal?

La beta es otra forma de expresar el parámetro b, pero haciéndolo independiente de las unidades de medida. Es algo así como estandarizar las pendientes para que su valor pueda ser comparado más fácilmente ya que no dependen de las unidades de medida de las variables. En análisis multivariante se amplía esta explicación. En regresión lineal simple tiene poco interés porque sólo se introduce al modelo una variable predictora.

Volver a Tabla de contenidos

Q13.3 ¿Qué es el “análisis de la covariancia” (ANCOVA)?

Clásicamente el análisis de la covariancia (ANCOVA) se consideró una extensión del análisis de la variancia que permite considerar los posibles efectos de variables continuas concomitantes (covariables) sobre la respuesta, además de los efectos de la/s variable/s factor. Según este planteamiento, se trata de una técnica que combina aspectos de la regresión lineal y del análisis de la variancia. La suposición habitual es que existe una relación lineal entre la respuesta y las covariables y que dicha relación es igual para cada combinación de los niveles de los factores. En diferentes textos más actuales, el análisis de la covariancia se define como una técnica estadística de comparación de medias que incorpora el ajuste de los grupos respecto a una o más variables de control (covariables). Supone que dichas variables de control no interactúan con el factor de estudio. En este análisis, la exposición es una variable categórica y las covariables acostumbran a ser cuantitativas. En el curso de análisis multivariante se estudia detalladamente esta técnica y se presentan diferentes ejemplos que ayudan a esclarecer sus fundamentos teóricos y prácticos.

Volver a Tabla de contenidos

Q13.4 ¿Cómo se obtienen con la calculadora SS(X) y SS(Y)?

SS(X) y SS(Y) son, respectivamente, la suma de cuadrados de las variables X e Y, esto es, el numerador de las respectivas variancias. Si se revisa la unidad 1 se recordará que la fórmula de una variancia es: SS/(n-1). Muchas calculadoras no disponen de una tecla-función para obtener directamente estas sumas de cuadrados. En estas situaciones, estos valores se obtienen despejando SS de la fórmula de la variancia: SS=Variancia*(n-1).

Volver a Tabla de contenidos

Q13.5 ¿Qué es el coeficiente R cuadrado ajustado y cuándo se utiliza?

Se demuestra que el coeficiente R cuadrado siempre tiende a incrementarse a medida que se incluyen variables independientes en un modelo de regresión, al margen de que estas variables sean significativas dentro del modelo. Una forma de minimizar este efecto es realizar un ajuste sobre el coeficiente de determinación, y el resultado se denomina R cuadrado ajustado. Lo más habitual es utilizar este índice en modelos de regresión con más de un predictor, aunque no está demás interpretar siempre, por definición, el coeficiente R cuadrado ajustado en lugar del R cuadrado.

Volver a Tabla de contenidos

Page 35: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 35

Q13.6 ¿Por qué no se pueden efectuar predicciones fuera del rango de variación de la variable independiente?

Porque más allá de los valores incluidos en el análisis, no es posible garantizar que la relación entre las variables continúe siendo lineal, y por lo tanto no podemos asegurar que la recta estimada con los datos del estudio represente adecuadamente la realidad.

Volver a Tabla de contenidos

Page 36: Tabla de contenidos - UAB Barcelona

Preguntas más frecuentes (FAQ) Para uso exclusivo de los alumnos del Curso “Fundamentos de Diseño y Estadística”

© 2014 Laboratori d’Estadística Aplicada (UAB) FAQ - 36

Unidad 14: Medida del cambio. Análisis de diseños con medidas intrasujeto

Q14.1 ¿Qué se entiende por estudio de la “simetría relativa” en datos categóricos?

Simplemente, estamos reordenando la tabla y la estamos mirando como si se tratara de un diseño con datos independientes. En el ejemplo del texto (estación del año y peso del sujeto) esto se plantea de la siguiente forma: a) Nos fijamos en lo que ocurre en la primera medición (mayo), y de acuerdo a estos datos vemos que tenemos dos grupos distintos de sujetos: los que en mayo tienen normopeso y los que en mayo tienen sobrepeso; b) A continuación valoramos cuántos de los que tenían normopeso cambian (pasan a sobrepeso en septiembre) y cuántos de los que tenían sobrepeso cambian (pasan a normopeso en septiembre); y c) La prueba de significación únicamente valora si los porcentajes de cambio observados son o no iguales entre sí.

Volver a Tabla de contenidos

Q14.2 ¿Cómo se realiza la comparación de varias medias con medidas repetidas?

En estos casos se realiza un Análisis de la Variancia para diseños con medidas intrasujeto. El procedimiento GLM del STATA permite realizar esta prueba. Si no se cumplen las condiciones de aplicación, también se puede aplicar la prueba no paramétrica de Friedman. Debido a que estos modelos son más complejos en su planteamiento y desarrollo, se estudian en cursos más avanzados de estadística.

Volver a Tabla de contenidos

Q14.3 ¿Por qué la kappa ponderada da un resultado superior a la kappa no ponderada?

La razón está en los pesos que se asignan a los desacuerdos. La kappa no ponderada considera por igual cualquier tipo de desacuerdo (esté en la casilla que esté), y le otorga la máxima "penalización" (ponderación o peso en términos estadísticos). En cambio, La kappa ponderada considera que algunos desacuerdos tienen más importancia que otros, y les asigna mayores pesos o penalizaciones. Por ejemplo, si la escala de medida es asintomático-dudoso-enfermo-grave la kappa ponderada considera más grave la no coincidencia asíntomatico-grave que la no coincidencia asintomático-dudoso. En el primer caso le otorga una penalización o peso mayor al desacuerdo.

Volver a Tabla de contenidos