CONFIABILIDAD

1Confiabilidad y Validez

UNIVERSIDAD NACIONALJOSÉ FAUSTINO SÁNCHEZ CARRION

ESCUELA DE POSTGRADO

MAESTRÍASALUD PÚBLICA

TEMA

CONFIABILIDAD Y VALIDEZ PARA EVALUAR LOS INSTRUMENTOS DE MEDICIÓN (*)

APLICACIÓN EN SPSS Y EXCEL

Escuela de Post Grado – José Arias Pittman


José Augusto Arias [email protected]

Huacho 20 de marzo de 2013

(*) Tema preparado y modificado por José Arias, para uso interno de la Escuela de Post Grado en la Maestría de Salud Pública, de los Autores: Juan Bogliaccini – Manuel Cardoso – Federico Rodríguez. Uruguay. 2005



CONSTRUCCIÓN DE ÍNDICES

RESUMEN ……………………………………………………………………………………………. 03INTRODUCCIÓN …………………………………………………………………………………….. 03

1. DESCRIPCIÓN …………………………………………………………………………………….. 032. EJEMPLO ………………………………………………………………………………………….. 033. EJERCICIO DE REVISIÓN ………………………………………………………………………. 05 CONFIABILIDAD ……………………………………………………………………………………… 05

1. CONCEPTO DE CONFIABILIDAD. CONSISTENCIA INTERNA ……………………… 052. INTERPRETACION DE LOS COEFICIENTES DE CONFIABILIDAD ………………… 073. PROCEDIMIENTO ………………………………………………………………………….. 074. ANÁLISIS DE RESULTADOS ……………………………………………………………... 105. PROCEDIMIENTO ………………………………………………………………………….. 126. ANÁLISIS DE RESULTADOS ……………………………………………………………… 14

CASO DE VARIABLES POLICOTOMICAS ……………………………………………………….. 17

CALIDAD DE LA FORMACIÓN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIAEN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE HUAMANGA ……………………………………………….…. 17

2.1 PROCEDIMIENTO …………………………………………………………………………. 17 2.2 ANÁLISIS DE RESULTADOS ……………………………………………..……………….. 18

2.3 PROCEDIMIENTO …………………………………………………………………………. 21



2.4 ANÁLISIS DE RESULTADOS …………………………………………………………….. 222.5 COEFICIENTE DE CORRELACIÓN BISERIAL PUNTUAL (RBP) …………………….. 24

BIBLIOGRAFÍA DE REFERENCIA ………………………………………………………………… 27

ANEXOS

FORMULAS ……………………………………………………………………………………………. 29MUESTRA ……………………………………………………………………………………………... 33

CALIDAD DE LA FORMACIÓN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDADNACIONAL SAN CRISTÓBAL DE HUAMANGA …………………………………………………. 34

DATOS DE LA ENCUESTA ………………………………………………………………………… 39



CONSTRUCCIÓN DE ÍNDICES

RESUMEN

Muy pocos instrumentos de medición (o ningunos) que utilizan los investigadores son puros o infalibles. Mas bien las puntuaciones obtenidas por los instrumentos de medición puede descomponerse en dos elementos: una puntuación verdadera y un componente de error. La primera es una entidad hipotética que representa el valor que podría obtenerse si se pudiera llegar a una medición perfecta. El componente de error o error de medición, representa las inexactitudes que surgen en el proceso de medición. Las fuentes de error de medición incluyen contaminantes situacionales, errores de grupo de respuesta, factores transitorios personales y otros tipos semejantes.

Una de las características importantes del instrumento de medición es su confiabilidad, que denota el grado de congruencia o precisión con el cual el instrumento mide un atributo. Cuanto mayor sea la confiabilidad del instrumento, menor será el grado de error de las puntuaciones o mediciones obtenidas. Existen varios métodos empíricos para evaluar los aspectos de la confiabilidad de un instrumento.

El aspecto de estabilidad, que se ocupa de la magnitud con la cual el instrumento genera los mismos resultados en aplicaciones repetidas, es corroborado por técnicas de prueba y nueva prueba. La congruencia interna u homogeneidad de la confiabilidad denota la magnitud con la cual todas las fracciones o puntos integrantes del instrumento miden el mismo tributo.

La congruencia interna puede evaluarse por medio de la técnica de confiabilidad de división en mitades o el método alfa de Cronbach. Cuando en la corroboración de la confiabilidad se orienta a establecer equivalencias entre los observadores en cuando a conducta de calificación, pueden obtenerse calificado de la confiabilidad entre observadores.

La confiabilidad de un instrumento en parte de pende de su longitud (extensión), la adecuación del muestreo de los puntos de indagación y la heterogeneidad de los grupos a los que se aplico el instrumento y la técnica utilizada para obtener el coeficiente de confiabilidad. La mayor parte de los métodos para estimar la confiabilidad se basa en el cálculo de un coeficiente de confiabilidad, índice que refleja la proporción de la verdadera variabilidad en un grupo de puntajes en relación con la variabilidad total obtenida.

INTRODUCCIÓN

El instrumento óptimo de medición es aquel que genera mediciones importantes, precisas, objetivas, sensibles, unidimensionales y eficientes. Los requerimientos anteriores son bastantes importantes tal como ocurre con casi todos los conceptos de interés para los investigadores en enfermería, existen pocas técnicas de recolección de datos (si las hay) que cumplen o se acercan tal ideal. Las medidas de índole física o fisiológica, tiene mayores posibilidades de alcanzar las meta señaladas en comparación con las índoles psicológicas o conductual, pero prácticamente ningún instrumento de medición es perfecto.

En l medida en que la medición tiene una función central en el proceso de investigación, los científicos han creado diversas técnicas para evaluar la calidad de sus instrumentos. El investigador cuidadoso, por lo regular, duda en aceptar un instrumento de medición sin antes hacer una evaluación critica del mismo.



1. DESCRIPCIÓN

Muchas variables utilizadas en investigación en ciencias humanas son latentes, y esto es especialmente cierto de algunas de las variables más relevantes desde el punto de vista teórico: status socio-económico, inteligencia, nivel de aprobación, logro académico, cultura organizacional, por mencionar solamente algunos ejemplos. Estas variables no pueden ser medidas en forma directa, a través de un único indicador (a diferencia de las observables). Una de las formas habituales de medir variables latentes son los índices sumatorias, ya sean simples o ponderados.

2. EJEMPLO

En el estudio se plantean trece preguntas, de una encuesta realizada a 24 jóvenes donde cada una de ellas tiene solo dos opciones (Dicotómicas) La base de datos contiene los valores de cada uno de los 13 indicadores para una muestra aleatoria de 24 casos, extraída a su vez de la muestra (también aleatoria) más grande.

3. EJERCICIO DE REVISIÓN

Describa en forma univariada el índice resultante, teniendo en cuenta su nivel de medición (Ver tema relacionado con, "Análisis descriptivo univariado de variables continuas").

Como la inclusión de los 13 ítems obedeció a criterios



conceptuales o teóricos, nada asegura que efectivamente todos los ítems pertenezcan a la dimensión. La pregunta es naturalmente, cuáles ítems “pertenecen” y cuáles no. En el procedimiento de índices sumatorias el test que nos permite despejar esta duda, se efectúa calculando la fuerza de las correlaciones de los ítems entre sí o de cada ítem con el índice. Intuitivamente, la idea es sencilla, todos los ítems que presentan correlaciones altas formarán parte del índice, los que tienen correlaciones bajas es más probable que no formen parte y por lo tanto se eliminan. (Tener presente las fortalezas y debilidades de un test de esta naturaleza).

CONFIABILIDAD

1. CONCEPTO DE CONFIABILIDAD

La confiabilidad es la "exactitud o precisión de un instrumento de medición". Existen distintos tipos de confiabilidad: ● la estabilidad a través del tiempo (medible a través de un diseño test-retest); ● la representatividad, que se refiere a la ausencia de variaciones en la capacidad del instrumento para medir un mismo constructo en distintas subpoblaciones; y por

último ● la equivalencia, que se aplica a las variables latentes, medidas a través de múltiples indicadores, y que se puede poner a prueba mediante diversos métodos,

incluyendo el llamado Alpha de Cronbach, split-half, y distintas formas de verificar la consistencia entre evaluadores.

La Confiabilidad del instrumento de medición constituye el criterio fundamental para evaluar su calidad y adecuación; no es un concepto unitario que pueda ser descrito o definido con facilidad, lo que continué desventaja para el investigador novato. En esencia la confiabilidad de un instrumento es el grado de congruencia con la que mide el atributo que se supone evalúa. Si una balanza arroja un dato de 54.43k para el peso de una persona ni un minuto después da una lectura de 68.03k (descontando cualquier intromisión con el instrumento o el sujeto), debemos tener gran cautela al usarla porque la información que genera será poco fidedigna. Cuanto menor variación produzca un instrumento de mediciones repetidas de un atributo, mayor será su confiabilidad de este modo, la confiabilidad puede equiparse con la estabilidad congruencia o confiabilidad de un instrumento de medición.

Otra forma de definir la confiabilidad es en términos de precisión es posible señalar que un instrumento es confiable si sus mediciones reflejan exactamente las mediciones “verdaderas” del atributo en estudios. La definición anterior vincula la confiabilidad con puntos señalados en nuestro comentario del error de medición. Intentaremos esclarecer aun más tal medición, para indicar que el instrumento es confiable y preciso en la medida en que no existan errores de medición en los resultados obtenidos. En otras palabras, una medición confiable es aquella que lleva al máximo el componente verdadero y el mínimo componente de error. Cuando mayor el error, mayor será la falta de confiabilidad.

Las dos formas de abordar el concepto de confiabilidad no son distintas, tal como podría parecer a simple vista. Los errores de medición son errores aleatorios, fuertemente variables. Los factores que influyen en una medición en un punto del tiempo tal vez no intervengan en otro momento o el mismo factor puede afectar en forma diferente a los sujetos. En resumen, los errores de medición que influyen en precisión de instrumento también alteran su congruencia. El ejemplo de la balanza de producía lecturas variables de peso no servirá para esclarecer el punto. Supongamos que el peso real del individuo es de 56.69k, pero que dos mediciones independientes generaron 54.42k y 68.03k. En términos de la ecuación presentaba en la sección anterior podemos expresar las mediciones de esta manera:

CONSISTENCIA INTERNA Las escalas de tipo psicosocial se evalúan a veces tomando en cuenta su consistencia interna. En circunstancias óptimas las escalas hechas para medir un atributo están compuestas por un conjunto de puntos de indagación (reactivos) o de estudio de los cuales todos miden el atributo crítico y nada más. Es una escala que intenta medir la



capacidad de decisión de las enfermeras, no seria adecuado incluir un punto que sea una medida mejor de la empatia que de la pericia en la toma de decisiones. Cabe señalar que un instrumento tiene congruencia u homogeneidad interna en la medida en que todas sus fracciones o sus sub.-secciones miden la misma característica.

En la actualidad la técnica de congruencia interna para estimar l confiabilidad de un instrumento tal vez se el método mas usado entre los investigadores. La razón de la gran aceptación de los métodos que describiremos a demás de la economía (solos e necesita una sesión de prueba) también incluyen el hecho que son las formas mejores de evaluar una de las fuentes mas importantes de error de cuantificación que es la recolección o muestreo de los puntos de indagación.

Uno de los métodos más antiguos para evaluar la congruencia interna es la técnica de división por mitades. En ella, los puntos que comprende la prueba se divide en dos grupos se cuantifica y se da una puntuación independiente y los resultados cuantificados de las dos medias pruebas se utilizan para computar un coeficiente de correlación. Para ilustrar este método, en la primera columna del cuadro siguiente se reproducen las puntuaciones ficticias de la primera aplicación de la escala de capacidad de liderazgo. En aras de la simplicidad señalaremos que el instrumento total comprende 20 planteamientos. Para computar un coeficiente de confiabilidad de dos mitades habrá de dividir los puntos de estudio en dos grupos de 10. En la práctica es posible un número grande de divisiones, si bien la técnica mas aceptada es usar y comprar los pares contra los nones. Por esa razón, una de las mitades comprende los punto 1,3 1,5 1,7 1,9 1,11 1,13 1,15 1,17 1,19, en tanto que el resto comprende la segunda mitad, esto es los pares. Las puntuaciones de las dos mitades del ejemplo se muestran en la segunda y tercera columnas del mismo cuadro. El coeficiente de correlación que describe la relación entre las dos mitades es una estimación de la congruencia interna de la escala de capacidad del liderazgo. Si los nones midieran el mismo atributo que los pares, en este caso el coeficiente de confiabilidad debe ser alto.

Numero delsujeto

PuntuaciónTotal

Puntuación de númerosimpares

Puntuación de NúmerosPares

123456789

10

55497837445058624867

28263618233030332328

27234219212028292539

r 0.67

El coeficiente de correlación computado con la técnica de dos mitades de algún atributo por medir tiende a generar una estimación sistemáticamente menor de la real en cuando a la confiabilidad de toda la escala. Al igual que los otros aspectos, las escalas de menos tamaño son más fidedignas o confiables que las más cortas. El coeficiente de correlación computado con base en los datos del cuadro es una estimación de confiabilidad para un instrumento de 10 puntos y no para uno de 20. A fin de superar esta dificultad se ha creado una formula para ajustar l coeficiente de correlación, de tal manera que arrojen una estimación de confiabilidad para toda la prueba. La ecuación de correlación que se conoce como la formula del calculo (profecía) de Spearman - Brown, es la siguiente

r = 0.67 r1 = 2r/ (1 + r)



Done r es igual al coeficiente de correlación computado en dos mitades y r1= confiabilidad estimada de toda la prueba. Por ejemplo la formula, la confiabilidad de la medición hipotética de 20 reactivo de la capacidad de liderazgo seria:

r1 = 2(0.67)/(1 + 0.67) = 0.80

La técnica de dos mitades es fácil de usar y elimina muchos de los problemas de la técnica de prueba y nueva prueba. Sin embargo, la primera técnica tiene como desventajas que puede tenerse de diferentes estimaciones, de confiabilidad o uso de fracciones o mitades diferentes, esto es, siempre surgen diferencias y se usa una división entre pares y nombres, una división de primera y segunda mitad o cualquier otro método para dividir los puntos en dos grupos. Por tal razón, la técnica de dos mitades ha sido sustituida cada vez mas por formulas que compensan tal eficiencia. Los métodos mas usados son: El coeficiente alfa o alfa Cronbach y la formula 20 de Kuder-Richardson (abreviada KR-20). Va mas halla de los limites de este texto explica en detalle la aplicación de tales formulas, pero dado que el coeficiente alfa constituye el índice mas útil de confiabilidad con que se cuenta, convendría que el lector consultara las obras de Cronbach (1970) o Nunnalli (1978).

Tanto el coeficiente alfa como la técnica KR-20 producen un coeficiente de confiabilidad que pueden interpretarse en la misma forma que otro procedimientos de esta índole aquí descritos, es decir, la jerarquía normal de valores esta entre 0 y +1 y las cifras mas altas reflejan un grao mayor de congruencia interna. El coeficiente alfa (y la técnica KR-20, que en realidad es una especialización o refinamiento del coeficiente alfa mas general utilizado con puntos dicotómicos) , es preferible al método de dos mitades porque genera una estimación de la correlación de las mitades en todas las formas posibles de dividir la medida en dos mitades.

En resumen, los índices de homogeneidad o congruencia interna estiman la magnitud en la cual a sus fracciones de un instrumento son equivalentes en términos de la medición de atributo crítico. La técnica de la mitades a menudo se ha utilizado para evaluar la homogeneidad, pero el coeficiente alfa, es el método preferible, ninguno de los instrumentos mencionados incluyen en las fluctuaciones con el paso del tiempo como fuente como falta de confiabilidad.

2. INTERPRETACION DE LOS COEFICIENTES DE CONFIABILIDAD

Los coeficientes de confiabilidad computados con base en los métodos descrito pueden utilizarse como indicador importante de la calidad de un instrumento. Una medición que no es confiable interfiere con la corroboración adecuada de las hipótesis del investigador. Si los datos no confirman una predicción por investigar una de las posibilidades es que los instrumentos de medición no eran confiables y no obligadamente que las relaciones esperadas no exista. No hay un estándar respecto a los que debe ser un coeficiente de confiabilidad. Si el investigador se interesa solo en hacer comparaciones a nivel de grupo, probablemente bastarían los coeficientes cercanos a 0.70 o incluso a 0.60.

Por comparaciones de niveles de grupo darnos a entender que el investigador se interesa comparar las puntuaciones grupo como varón en comparación de mujer, enfermera en comparación con médicos, fumador empedernido en relación a fumar ocasional y este en comparación con no fumador etc. Sin embargo si se tuvieran que usar las medidas como base para decisiones respecto a de individuos el coeficiente de confiabilidad en estos casos deberá ser de 0.90 o mayor.

Por ejemplo, si la puntuación de una prueba de clases se empleara como criterio para admisión a un programa de post grado en enfermería si exactitud seria de importancia fundamental para los solicitantes e individuales en la escuela de enfermería. El coeficiente de confiabilidad tiene una interpretación especial que explicaremos someramente, sin entrar en detalles técnicos.



Tal interpretación se relaciona con el comentario antes expuesto de descomponer una puntuación observada en un componente de error y verdad. Supongamos que aplicamos a 50 enfermeras una escala que mide la empatia. Cabria esperar que las puntuaciones variaran de una persona a otra, pues alguna de las enfermeras tiene mayor empata. Que sus compañeras. Parte de la variabilidad es verdadera pues refleja las diferencias reales de cada persona en lo que toca en atributo que se mide, pero otra fracción de la variabilidad no es verdadera, es decir, es error.

Si, por ejemplo el coeficiente de confiabilidad fuese 0.85 el 85% de la variabilidad de sus puntuaciones obtenidas podría aceptarse como una representación de las diferencias individuales “verdaderas”, en tanto que el 15% de la variabilidad reflejaría fluctuaciones extrañas y aleatorias. Considerado en esta forma el lector puede advertir con mayor claridad porque instrumentos con confiabilidad de 0.60 o menos son riesgosos en la práctica.

La determinación de la confiabilidad de un instrumento es útil para los investigadores no solo porque los ayuda a interpretar un resultado, sino porque proporciona sugerencia si se necesitan modificaciones del instrumento. Los creadores de instrumentos y escalas deben saber los siguientes puntos para mejorar sus mediciones:

a. La confiabilidad de una medición es, en parte, función de su longitud (magnitud) o número de puntos de indagación. Para mejorar tal confiabilidad habría que agregar más puntos en relacional mismo concepto.

b. En las escalas observacionales muchas veces pueden aumentarse la confiabilidad con una mayor precisión en las definiciones acompañadas de un sistema de categorías, o si se entrena con mas intensidad a los observadores.

c. La confiabilidad es un instrumento depende en parte de la heterogeneidad del grupo al cual se aplica. Cuanto mas homogénea sea la muestra, esto es, mas semejantes sean las puntuaciones obtenidas, menor será el coeficiente de confiabilidad. Lo anterior se debe a que los instrumentos están diseñados para medir diferencias entre los objetos que se miden. Si la muestra es homogénea, es mas difícil para el instrumento discriminar confiablemente entre los que tienen grados diversos del atributo que se mide.

d. Las estimaciones de confiabilidad varían con el metido que se utiliza para obtenerlas. El investigador debe precisar el aspecto de la confiabilidad, es decir, estabilidad, congruencia interna, o equivalencia que tiene mayor importancia, en la relación con el atributo y el instrumento en consideración

TRABAJANDO CON EL SPSS3. PROCEDIMIENTO

El análisis de confiabilidad permite estudiar las propiedades de las escalas de medición y los ítems que las componen. El procedimiento Reliability Analisys calcula algunas medidas comúnmente usadas de confiabilidad de escalas y también provee información acerca de las relaciones entre ítems individuales en la escala.Utilizaremos el coeficiente de confiabilidad de Spearman – Brown, de Rulon – Guttman y el Kuder Richardson 20 . Estos dos primeros coeficiente dividen los ítems en dos mitades y sobre ellos calcula el coeficiente de confiabilidad.El coeficiente Alpha de Cronbach y KR 20 son modelos de consistencia interna, basado en el promedio de las correlaciones entre los ítems. Entre las ventajas de esta medida se encuentra la posibilidad de evaluar cuánto mejoraría (o empeoraría) la confiabilidad del índice si se excluyera un determinado ítem. El KR 20 no se utiliza para ítems policotómicos.



Primeramente tenemos que dividir los ítems en dos mitades, para ello creamos dos variables utilizando la función SUM(numexpr,numexpr,…). Esta función nos permite crear una variable de columnas pares y otra de valores impares.

Ingresamos al Menú Transform, opción Compute y se ingreso al siguiente cuadro de dialogo. Dentro del recuadro Funtions, buscamos la función SUM(numexpr,numexpr,…), y la ingresamos al recuadro mas grande. La nueva variable que vamos a crear se llama impar_1 (Target Variable).

Los valores impares se encuentran en las variables: CN_9; CN_12, CN_14, CN_16, CN_18, CN_20, CN_22, tal como se muestra en el otro recuadro. Salimos pulsando OK. Hemos creado una variable con la suma de los datos impar_1.



Ahora los valores pares se encuentran en las variables: CN_11; CN_13, CN_15, CN_17, CN_19, CN_21, tal como se muestra en el otro recuadro. Salimos pulsando OK. Hemos creado una variable con la suma de los datos par_1.



Ahora estamos listos para determinar los coeficientes para encuesta dicotómicas.

El procedimiento consiste en ingresar al menú Analyze, luego Scale (Escala) y opción Reliability Análisis… (Análisis de fiabilidad)

Se apertura la nueva ventana Reliability Análisis

Seleccionar las variables que van a ser analizadas. En este caso se ingresan las dos nuevas variables que hemos creado, impar_1 y par_1, tal como se muestra a continuación. Por defecto la ventana Model es Alpha.



Seleccionar el tipo de análisis a utilizar, en el menú Model: en este caso elegimos la opción Split-half (Dos mitades), se refiere al análisis mitades o partir la mitad. Determina los coeficientes de Spearman y Guttman.

Oprimir el botón Statistics, para solicitar información adicional. En el menú de Statistics, marcar la opción Scale y Scale if ítem deleted (Escala si se elimina elemento), que me permite evaluar qué ocurriría con la confiabilidad de la escala si excluyo cada uno de los ítems.Salir del menú Statistics presionando el botón Continue.



Ejecutar el procedimiento presionando el botón OK, del grafico anterior.

4. ANÁLISIS DE RESULTADOS

A mayor valor de Spearman y Guttman, mayor confiabilidad. El mayor valor teórico de un coeficiente es 1, y en general .80 se considera un valor aceptable. En este caso, los valores de Coeficiente de Spearman Brown (Igual longitud o desigual longitud) (0.394) y el coeficiente de Guttman dos mitades (0.392) se encuentran bastantes alejados, pero ya veremos que existen posibilidades de elevar la confiabilidad del índice.

Para saber el coeficiente de correlación de cada ítem, utilizaremos la opción en el recuadro Model: Alpha, ingresamos todas las variables o ítems a excepción de la variable par e impar. Oprimir el botón Statistics, para solicitar información adicional. (También su puede utilizar Model: Guttman) En el menú de Statistics, marcar la opción Scale if ítem deleted, que me permite evaluar qué ocurriría con la confiabilidad de la escala si excluyo cada uno de los ítems. Salir del menú Statistics presionando el botón Continue. Para ello, es recomendable observar las dos últimas columnas del análisis ítem por ítem:



● La columna etiquetada Corrected ítem-Total Correlation (Correlación elemento total corregida) proporciona una medida de la correlación entre el ítem y el índice, que como toda medida de correlación varía entre -1 y 1. Si algún ítem presenta correlaciones negativas, o bien correlaciones positivas muy leves, es probable que sea recomendable excluir el ítem del índice.

● Los ítems cuyos coeficientes de correlación ítem - total arrojan valores menores a 0,35 deben ser desechados o reformulados (correlaciones a partir de 0,35 son estadísticamente significativas más allá del nivel del 1 %) (Cohen – Manion, 1990), dado que una baja correlación entre el ítem y el puntaje total puede deberse a diversas causas, ya sea de mala redacción del ítem o que el mismo no sirve para medir lo que se desea medir. La depuración de los ítems tiene como consecuencia aumentar el coeficiente de fiabilidad del instrumento.

● La confiabilidad del instrumento se estima a través del coeficiente Alfa de Cronbach. La ventaja de este coeficiente reside en que requiere de una sola administración del instrumento de medición. Puede tomar valores entre 0 y 1, donde 0 significa nula confiabilidad y 1 representa la confiabilidad total. Obsérvese que los ítems CN-9, CN-13, CN-14, CN-16, CN-17, CN-19, CN-20, tienen coeficientes de correlación cero o negativos, siendo el CN-16, el más bajo.

● La columna etiquetada Cronbach´s Alpha if ítem deleted (Alfa si se elimina el elemento) proporciona el valor del coeficiente de confiabilidad Alpha de Cronbach para el caso hipotético en que se excluyera un determinado ítem del cálculo del índice. Obsérvese que la exclusión del ítem CN-9 y CN-16 permitirían un aumento del valor de Alpha, pero la ganancia en confiabilidad sería mayor si se excluyera otros ítem como se vera posteriormente.



Si observamos bien, el valor que nos da Alpha, es igual al Kuder Richardson 20, ya que hemos dicho anteriormente que Alpha de Cronbach si calcula coeficiente para ítems dicotómicos, por lo tanto se reemplaza por KR 20, y es valor es de -0.123. El valor negativo debido a una covarianza promedio entre el elemento negativo. Lo cual viola los supuestos del modelo de confiabilidad. Puede que desee comprobar las codificaciones de loe elementos.



5. PROCEDIMIENTO

Se excluye los ítems CN-9, CN_13, CN_14, CN-16, CN_17, CN_20, y se vuelve a calcular dos nuevas variables par e impar; que ahora se llamara impar_2 y par_2. En estas dos nuevas variables, ya no se consideran esos ítems que han sido retirados, y se repite el procedimiento descrito en el 2. PROCEDIMIENTO, tal como se muestra a continuación. Como puede verse se han retirado las seis variables con valores cero y negativo



Seleccionamos las variables que van a ser analizadas, ahora es par_2 e impar_2. En este caso se ingresan las variables, tal como se muestra a continuación. En Model seleccionamos Split-half.



En este caso, los valores de Coeficiente de Spearman (0.681) y el coeficiente de Guttman (0.676) se encuentran bastantes cerca, pero que si eliminamos aquellos ítems que todavía son negativos o muy bajos se elevaría la confiabilidad del índice.

Para conocer los nuevos coeficientes de correlación de cada ítem, utilizaremos la opción en el recuadro Model: Alpha, ingresamos todas las variables o ítems a excepción de las variables pares e impares. Oprimir el botón Statistics, para solicitar información adicional. En el menú de Statistics, marcar la opción Scale if ítem deleted, que me permite evaluar qué ocurriría con la confiabilidad de la escala si excluyo cada uno de los ítems. Salir del menú Statistics presionando el botón Continue. Debemos de tener en cuenta que ahora ya no ingresan los ítems que han sido retirados.




Se repite el análisis de la instancia anterior, y se procede en forma iterativa, excluyendo ítems uno a uno hasta que ya no se producen ganancias en el valor de Alpha aunque se excluya cualquiera de los ítems.



Dados estos resultados que nos permiten alcanzar valor de Alpha de 0,570, que es positivo, y que este valor es equivalente al de Kuder Richardson 20, ¿continuamos eliminando ítems? ¿Qué ventajas obtenemos si lo hacemos? ¿Lo que gano de incremento del Alpha justifica seguir adelante con la “depuración” de ítems, o gano muy poco?

Finalmente se excluye los ítems CN-15 ya que tiene un coeficiente de correlación bajo de 0.056, y luego repetimos el procedimiento descrito en el 2. PROCEDIMIENTO, tal como se muestra a continuación. Como puede verse se han retirado las dos variables con valores negativos.

Se vuelven a calcular las dos nuevas variables par e impar, que se llamara par_3 e impar_3. Los resultados son los siguientes

Los valores de Coeficiente de Spearman (0.806) y el coeficiente de Guttman (0.803) se encuentran por encima del 0.80, lo cual consideramos aceptable para nuestro estudio



Dados estos resultados que nos permiten alcanzar valor de Alpha de 0,618, que es positivo, y que este valor es equivalente al de Kuder Richardson 20,

Los resultados del ítem-Total Statistics, se muestran a continuación, y en donde se puede apreciar que existen coeficientes de correlación negativos a los cuales se tiene que depurar de la base.



¿Podemos seguir eliminado variables para un mejor análisis, aunque el ítem CN_11 tiene un coeficiente de correlación muy bajo 0.202? Para responder a esta interrogante es necesario tener en cuenta que el número ideal de ítems no se define sólo por el test de correlaciones sino por la inconveniencia de tener cuestionarios muy extensos y costosos. Si con 6 ítems obtengo en un pre-test un Alpha muy próximo al encontrado con 13 ítems, parece razonable definir el índice por el número menor de ítems si el instrumento será empleado en el estudio final.

Tabla de interpretación de valores de coeficientes de confiabilidad hallados:

VALORES INTERPRETACION1,00 Confiabilidad perfecta

0,72 a 0,99 Excelente confiabilidad0,66 a 0,71 Muy confiable0,60 a 0,65 Confiable0,54 a 0,59 Confiabilidad baja

Menos a 0,53 Confiabilidad nula

Determinación del grado de dificultad del test: X

Gd = ---------- x 100Pm

Gd = grado de dificultad de la pruebaX = promedio de los puntajes obtenidosPm = puntaje máximo posible de alcanzarse en la prueba

Para interpretar las cifras obtenidas, se puede tomar como referencia la siguiente escala de KR 20



VALORES INTERPRETACION81 % a mas Muy fácil61 – 80 % Relativamente fácil51 – 60 % Dificultad adecuada31 – 50 % Relativamente difícil11 – 30 % difícil

Menos de 10 % Muy difícil

Para nuestro ejemplo dicotómico, Pm viene dado por la suma de todos valores 1 en las trece variables, y en los 24 sujetos, por lo tanto el puntaje máximo será de 312 (24*13).

El puntaje X, viene dado por el promedio de los puntajes obtenidos (los que tienen valor) y es de 7.17.

Por lo tanto Gd, aplicando la formula será de 2.3 %, con lo que podemos afirmar que al dificultad del test es muy difícil.

CALCULO DEL ERROR ESTANDAR DE LA MEDIDAEl error estándar de la medida nos proporciona una manera especialmente útil de describir la confiabilidad del test, ya que nos indica la cantidad de error que debemos considerar al interpretar puntuaciones individuales de un test. Para calcular basta con conocer la desviación estándar , el coeficiente de confiabilidad ( r ), tal como se aprecia

Error estándar de medida =

GRADOS DE ERROR QUE SE PUEDEN ESPERAR DE LOS TEST

DE DIFERENTES CANTIDADES DE ITEMS

Numero de ítems del test

ERRAR ESTANDAR

Menos de 24 02



24 - 47 0348 - 89 0490 - 109 05

110 - 129 06130 - 150 07



CASO DE VARIABLES POLICOTOMICAS

CALIDAD DE LA FORMACIÓN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE HUAMANGA

1. PROCEDIMIENTO

Cuando se trata de instrumentos policotómicos o no binarios, se utilizan los Coeficientes de Spearman-Brown, Coeficiente de Rulon – Guttman y el Coeficiente Alfa de Cronbach.

Se dividen los ítems en dos mitades, para ello creamos dos variables utilizando la función SUM(numexpr,numexpr,…). Esta función nos permite crear una variable de columnas pares y otra de valores impares.

Los valores impares se encuentran en las variables: va1, va3, va5, va7, va9, va11, va13, va15, va17, va19, va21, va23, va251, tal como se muestra en el otro recuadro. Salimos pulsando OK. Hemos creado una variable con la suma de los datos impar_1.



Ahora los valores pares se encuentran en las variables: : va2, va4, va6, va8, va10, va12, va14, va16, va18, va20, va22, va24, tal como se muestra en el otro recuadro. Salimos pulsando OK. Hemos creado una variable con la suma de los datos par_1.

Ahora estamos listos para determinar los coeficientes para la encuesta policotómicas.

El procedimiento consiste en ingresar al menú Analyze, luego Scale y opción Reliability Análisis...

Se apertura la nueva ventana Reliability Análisis

Seleccionar las variables que van a ser analizadas. En este caso se ingresan todas las variables ordinales, tal como se muestra a continuación. Por defecto la ventana Model es Alpha.



Seleccionar el tipo de análisis a utilizar, en el menú Model: en este caso elegimos la opción Split-half, se refiere al análisis mitades o partir la mitad. Determina los coeficientes de Spearman y Guttman.

Oprimir el botón Statistics, para solicitar información adicional. En el menú de Statistics, marcar la opción Scale y Scale if ítem deleted, que me permite evaluar qué ocurriría con la confiabilidad de la escala si excluyo cada uno de los ítems.Salir del menú Statistics presionando el botón Continue.



Ejecutar el procedimiento presionando el botón OK, del grafico anterior.


A mayor valor de Spearman y Guttman, mayor confiabilidad. El mayor valor teórico de un coeficiente es 1, y en general .80 se considera un valor aceptable. En este caso, los valores de Coeficiente de Spearman (0.890) y el coeficiente de Guttman (0.883) se encuentran cercanos a 0.90, valores muy significativos, pero veremos que existen posibilidades de elevar la confiabilidad del índice.



Para saber el coeficiente de correlación de cada ítem, utilizaremos la opción en el recuadro Model: Alpha, ingresamos todas las variables o ítems a excepción de la variable par e impar. Oprimir el botón Statistics, para solicitar información adicional. En el menú de Statistics, marcar la opción Scale if ítem deleted, que me permite evaluar qué ocurriría con la confiabilidad de la escala si excluyo cada uno de los ítems. Salir del menú Statistics presionando el botón Continue. Para ello, es recomendable observar las dos últimas columnas del análisis ítem por ítem:

● La columna etiquetada Corrected ítem-Total Correlation proporciona una medida de la correlación entre el ítem y el índice, que como toda medida de correlación varía entre -1 y 1. Si algún ítem presenta correlaciones negativas, o bien correlaciones positivas muy leves, es probable que sea recomendable excluir el ítem del índice.



● La confiabilidad del instrumento se estima a través del coeficiente Alfa de Cronbach. La ventaja de este coeficiente reside en que requiere de una sola administración del instrumento de medición. Puede tomar valores entre 0 y 1, donde 0 significa nula confiabilidad y 1 representa la confiabilidad total. Obsérvese que los ítems va9, va18, va20, tienen coeficientes de correlación cero o negativos, siendo el v9, el más bajo.

● La columna etiquetada Cronbach´s Alpha if ítem deleted proporciona el valor del coeficiente de confiabilidad Alpha de Cronbach para el caso hipotético en que se excluyera un determinado ítem del cálculo del índice. Obsérvese que la exclusión del ítem negativos permitirían un aumento del valor de Alpha, pero la ganancia en confiabilidad sería mayor si se excluyera otros ítem como se vera posteriormente.





Si observamos bien, el valor que nos da Alpha, es igual a 0.854.

3. PROCEDIMIENTO

Se excluye los ítems va9, va18, va20, y se vuelve a calcular dos nuevas variables par e impar; que ahora se llamara impar_2 y par_2. En estas dos nuevas variables, ya no se consideran esos ítems que han

sido retirados, y se repite el procedimiento descrito en el 2. PROCEDIMIENTO, tal como se muestra a continuación. Como puede verse se han retirado las TRES variables con valores negativos.





Seleccionamos las variables que van a ser analizadas, ahora es par_2 e impar_2. En este caso se ingresan todas las variables ordinales, tal como se muestra a continuación. En Model seleccionamos Split-half.

En este caso, los valores de Coeficiente de Spearman (0.929) y el coeficiente de Guttman (0.967) se encuentran bastantes cerca de 1.00.



Para conocer los nuevos coeficientes de correlación de cada ítem, utilizaremos la opción en el recuadro Model: Alpha, ingresamos todas las variables o ítems a excepción de las variables pares e impares. Oprimir el botón Statistics, para solicitar información adicional. En el menú de Statistics, marcar la opción Scale if ítem deleted, que me permite evaluar qué ocurriría con la confiabilidad de la escala si excluyo cada uno de los ítems. Salir del menú Statistics presionando el botón Continue. Debemos de tener en cuenta que ahora ya no ingresan los ítems que han sido retirados.




Se repite el análisis de la instancia anterior, y se procede en forma iterativa, excluyendo ítems uno a uno hasta que ya no se producen ganancias en el valor de Alpha aunque se excluya cualquiera de los ítems.

Dados estos resultados que nos permiten alcanzar valor de Alpha de 0,879, que es un coeficiente cerca de 0.90, por lo tanto creemos que el estudio quedaría validado con 22 ítems, y con ello se haría el análisis correspondientes.





Finalmente diríamos que con los coeficientes encontrados en Spearman y Guttman, y con la determinación del análisis hecho por Alfa de Cronbach para las correlaciones de cada ítem, el estudio seria valido para solamente 22 variables (ítems) y con ello se daría al siguiente análisis que seria de la Prueba Chi Cuadrado para el grupo de variables.

TRABAJAR CON EXCEL5. COEFICIENTE DE CORRELACIÓN BISERIAL PUNTUAL (RBP)

Este coeficiente es muy utilizado en el ámbito de la Psicometría para evaluar la discriminación de los ítems que componen un test. La Psicometría es una disciplina que según Muñiz (1992) puede definirse en términos generales como el conjunto de métodos, técnicas y teorías implicadas en la medición de las variables psicológicas. Dentro de este conjunto de métodos de medición encontramos los tests, instrumentos de medida regidos por un procedimiento estándar y que son utilizados para obtener valores de los indicadores de un determinado constructo. El test está formado por una serie de ítems que representan variables que operativizan el constructo a medir (una habilidad, un rasgo de personalidad, etc.).



La discriminación de un ítem es la capacidad de éste para distinguir entre individuos con diferente situación en el rasgo o atributo medido por el test. Un ítem discriminará bien si las respuestas y puntuaciones de cada uno de estos sujetos al ítem están relacionadas con sus puntuaciones globales del test, de modo que cada ítem se convierte en un pequeño test que facilita la puntuación que describe la capacidad, actitud, etc. de la persona evaluada.

Una forma de calcular el índice de discriminación de un ítem i, se da mediante el índice de correlación biserial puntual entre el ítem i (variable dicotómica: respuesta correcta ó respuesta incorrecta) y la puntuación total X del test (variable continua), de la que el ítem forma parte como elemento. El coeficiente de correlación biserial puntual oscila como la r de Pearson entre ±1, interpretándose de igual modo.

Si los ítems están bien enunciados, es de esperar que exista correlación entre la respuesta dada al ítem y la puntuación del sujeto en la prueba.

En general, la correlación biserial puntual se establece como una correlación de Pearson entre dos variables, con la particularidad de que una de esas variables es de tipo continuo y la otra es una variable dicotómica (no dicotomizada, como ocurre en el caso de la correlación biserial). En el caso concreto que se expone, en el que la discriminación va a ser calculada mediante un coeficiente de correlación ítem-test, se considera a cada uno de los ítems i como una variable dicotómica, puesto que lo que se tiene en cuenta es si el sujeto contesta o no correctamente al ítem. A la respuesta correcta se le puede asignar el valor uno y a la respuesta incorrecta el valor cero, de manera que cualquier sujeto obtendrá, como vector de respuesta a la prueba un conjunto de unos y de ceros. Las puntuaciones globales de los sujetos en la prueba, si las hay en número suficiente, pueden considerarse como valores de una variable continua. (En ítems no acertados incluimos ítems no alcanzados y omisiones).

Sea p la proporción de respuestas correctas dadas a un cierto ítem y sea q = 1-p la de incorrectas. Designamos mediante mx, mp, mq y S2x, respectivamente, a la media de las

puntuaciones obtenidas en la prueba por el conjunto de todos los sujetos, la media de las puntuaciones obtenidas en la prueba por aquellos que dieron respuesta correcta a ese ítem, la media de las puntuaciones en la prueba por aquellos que no respondieron correctamente al ítem y la variancia de las puntuaciones en la prueba.

El coeficiente de correlación biserial puntual se obtiene mediante la expresión:

(La diferencia mp-mq será tanto mayor cuanto más difieran en puntuación los que contestan correctamente, de aquellos que lo hacen incorrectamente. Para mp>mq, entonces rbp

tenderá a crecer con mp-mq, o sea, con la corrección entre el test y la respuesta correcta al ítem).

O bien, podemos decir que, para un cierto ítem i, el coeficiente de correlación biserial puntual puede obtenerse mediante:

donde mp representa la media de las puntuaciones de los sujetos que responden correctamente al ítem i, mx indica la media de las puntuaciones de los examinados en el test, Sx es la desviación estándar de las puntuaciones obtenidas por todos los examinados en el test y pi expresa la dificultad del ítem.

Para realizar los cálculos indicados anteriormente, a la puntuación total del test (X) hay que descontarle el ítem cuyo índice de discriminación se pretende hallar (X-i), de lo contrario una de las variables (el ítem) estaría impropiamente incluida en la otra (el test).

Si al calcular la correlación ítem-test no se descontase de éste las puntuaciones correspondientes al ítem, se estaría elevando impropiamente la correlación, pues estrictamente no se estaría correlacionando el ítem con el resto de los ítems (test), sino con un test que incluiría también al ítem en cuestión. En suma, se estaría correlacionando una variable (test) con parte de ella (ítem). Cuando el test consta de un número elevado de ítems este efecto puede ser de poca relevancia empírica, pero ello no legítima su incorrección.



Lo más sencillo es calcular la corrección descontando el ítem. Sin embargo, si por cualquier razón se tiene la correlación ítem-test sin descontar los efectos del ítem, puede utilizarse la siguiente fórmula de corrección para obtener la correlación pertinente:

donde ri(x-i) es la correlación entre el ítem j y el test tras descontar el ítem (x-i), rix es la correlación ítem-test cuando el ítem está incluido en el test, Sx es desviación estándar del test y Si es la desviación estándar del ítem.

A continuación se proporciona la tabla de respuestas de 10 sujetos a 5 ítems, donde el valor 1 indica «respuesta correcta» y el valor 0 «respuesta incorrecta»:

I T E M S

TOTAL

SUJETO

va1

va2

va3

va4

va5

PUNTUACIO

NES

1 2 3 4 5 6 7 8 910

1

1

1

0

1

1

1

1

0

1

1

0

0

1

1

0

0

1

1

1

0

1

1

0

0100101001

3522424224



0

1

1

1

1

1

0

1

1

0

1

1

1

0

0

0

Total Ítem

8 7 6 5 4 30

pi 0.8

0.7

0.6

0.5

0.4

qi 0.2

0.3

0.4

0.5

0.6

La media mx del test viene dada por: mx = ∑ pi. Este valor coincide con el hallado a partir de las puntuaciones totales del test:

mx = 0.8 + 0.7 + 0.6 + 0.5 + 0.4 = 3

La variancia del test es una variancia poblacional. Así pues, su divisor es n y no n-1.

Cálculo del coeficiente de correlación biserial puntual para el ítem 3:La puntuación media de los sujetos que han contestado correctamente al ítem viene dada por:



La media de las puntuaciones totales al test, la desviación estándar, así como el índice de dificultad del ítem se ha calculado con anterioridad, lo cual nos permite hallar el coeficiente de correlación biserial puntual.

Si descontamos a las puntuaciones totales del test, el valor del ítem, podemos obtener el coeficiente de correlación biserial puntual corregido. Debemos pues, hallar la puntuación media de los sujetos que aciertan el ítem, así como la media y la desviación estándar de las puntuaciones totales corregidas:

Va3

TOTAL

PUNTUACIONES TOTALES

CORREGIDA

S

PARA EL ITEM va3

0110011011

3522424224

3412413213

Así, el coeficiente de correlación biserial puntual corregido vendrá dado por:

A la luz de los resultados, se puede comprobar el sesgo que se produce en el valor final al incluir la puntuación obtenida en el ítem. La discriminación de un ítem se verá pues,



muy afectada, por la inclusión impropia del mismo en el procedimiento de cálculo. Este sesgo disminuye a medida que aumenta el número de ítems que componen la puntuación total del test.

A continuación se ofrece el valor del coeficiente de correlación biserial puntual para cada uno de los ítems que constituyen el test anterior, así como el de dicha correlación corregida.

Vector de coeficientes de correlación biserial puntual

ITEM

1 2 3 4 5

rbp 0 0.5978

0.1864

0.5479

0.93207

Vector de coeficientes de correlación biserial puntual corregida

ITEM

1 2 3 4 5

rbp -0.3429

0.2182

-0.2567

0.1104

0.80

ÍNDICE DE DISCRIMINACIÓNSegún EBEL y FRISBIE (1986), nos dan la siguiente regla para determinar la calidad de la prueba (Test), en términos de índice de discriminación.La validez de una pregunta en una prueba nos permite determinar si la pregunta mide lo que la prueba se propone medir. En este sentido la correlación pregunta-prueba (punto biserial) es el indicador que nos mide el grado de validez de la pregunta. Es un índice de validez interna pues la correlación se calcula con el puntaje total de la prueba, a falta del verdadero criterio o constructo.

El siguiente cuadro presenta las categorías que se usaron para evaluar la validez de las preguntas.

DISCRIMINACION

CALIDAD RECOMENDACION

> 0.39 Excelente Conservar0.30 - 0.39 Buena Posibilidad de mejorar0.20 - 0.29 Regular Necesidad de revisar0.00 - 0.19 Pobre Descartar o revisar



< 0.00 Pésima Eliminar

DIFICULTAD DE UN ITEMEs la proporción de sujetos que escoge la opción correcta. Se suele obtener como el cociente entre el número de personas que lo aciertan y el número de personas que lo responden.

La dificultad de las preguntas se mide en base al porcentaje de aciertos en la pregunta. El indicador varía entre 0 y 1. Una pregunta con una dificultad de 0.3 es más difícil que una pregunta con una dificultad de 0.8. En el primer caso solo el 30% acertaron la pregunta y en el segundo caso acertaron el 80%. Es decir, y como se ha observado en la literatura, el indicador se mide en forma inversa a la dificultad de la pregunta.

Una pregunta tiene una dificultad media si fue respondida correctamente por aproximadamente el 50% de los examinados, o sea, su índice de dificultad es cercano a 0.5. Generalmente índices de dificultad entre 0.3 y 0.7 maximizan la información que el test provee sobre la diferencia entre los examinados.

El siguiente cuadro presenta las categorías para determinar el grado de dificultad de las preguntas de las pruebas.

Índice de dificulta de un ítem

Índice INTERPRETACION0.75 - 1.00 Muy fácil0.55 - 0.74 Fácil0.45 - 0.54 Intermedio0.25 - 0.44 Difícil0.00 - 0.24 Muy difícil



BIBLIOGRAFÍA DE REFERENCIA1. Peña, D. Romo, J - Introducción a la Estadística para las Ciencias Sociales. Mc Graw Hill 1997.2. Mason y Lind - Estadística para administración y economía. Alfaomega 1998.México, D.F. 8ª edición.3. Juan Bogliaccini – Manuel Cardoso – Federico Rodríguez. Uruguay. 2005



ANEXOS



COEFICIENTES DE CONFIABILIDAD DE ESCALAS PARA INSTRUMENTOS DICOTOMICOS O BINARIOS

La confiabilidad de división por mitades se obtiene correlacionando dos pares de puntuaciones obtenidas de mitades equivalentes de una sólo prueba aplicada una vez.Es útil cuando es poco práctico o indeseable hacer otro procedimiento.Los pasos implicados en este procedimiento serían:

1. Dividir la prueba en mitades equivalentes.2. Calcular un r de Pearson entre las puntuaciones de las dos mitades de la prueba.3. Ajustar la confiabilidad de la mitad de la prueba usando la fórmula de Spearman-Brown.

Además de la fórmula de Spearman –Brown (coeficiente de confiabilidad por mitades) hay otros dos estimadores de consistencia interna frecuentemente usados, Kuder Richardson (1937) y Alfa de Cronbach (1951)

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE SPEARMAN – BROWN

= Coeficiente de Confiabilidad de Spearman - Brown = Coeficiente de Confiabilidad de R Pearson entre los puntajes impares y pares

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE RULON - GUTTMAN

= Coeficiente de Confiabilidad de Rulon Guttman = Varianza de la diferencia de los puntajes impares y pares = Varianza de la escala (Puntaje total)

COEFICIENTE DE CONFIABILIDAD SEGÚN LA FÓRMULA 20 DE HUDER RICHARDSON (KR 20)Llegan a la formula por la insatisfacción de los métodos de división por mitades.

En el caso que los reactivos de la prueba sean homogéneos, las estimaciones de confiabilidad KR-20 y de división por mitades será similar (producirá un coeficiente de confiabilidad inferior a la división por mitades).

KR-20 será mejor para determinar la consistencia entre reactivos de reactivos dicotómicos, sobre todos aquellos reactivos que pueden ser calificados como correctos o equivocados (opciones múltiples).



= Coeficiente de Confiabilidad KR 20 = Número de ítems o variables

= Probabilidad de sujetos (encuestados) que contestan correctamente el ítem i-avo = Probabilidad de sujetos (encuestados) que contestan incorrectamente el ítem i-avo

= Varianza de la escala (Puntaje total)

COEFICIENTE DE CONFIABILIDAD SEGÚN LA FÓRMULA 21 DE HUDER RICHARDSON (KR 21)

= Coeficiente de Confiabilidad KR 21 = Número de ítems o variables

= Proporción promedio de los que pasan todos los ítems componentes de la escala = Proporción promedio de los que NO pasan todos los ítems componentes de la escala

= Varianza de la escala (Puntaje total)

COEFICIENTE DE CORRELACION PUNTUAL BISERIAL

= Coeficiente de Correlación Puntual Biserialmp = representa la media de las puntuaciones de los sujetos que responden correctamente al ítem i, mx = indica la media de las puntuaciones de los examinados en el testSx = es la desviación estándar de las puntuaciones obtenidas por todos los examinados en el test pi expresa la dificultad del ítem, mientras que q = 1 – p



COEFICIENTES DE CONFIABILIDAD DE ESCALAS PARA INSTRUMENTOS POLITOMICAS O NO BINARIOS

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE SPEARMAN – BROWN

= Coeficiente de Confiabilidad de Spearman - Brown = Coeficiente de Confiabilidad de R Pearson entre los puntajes impares y pares

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE RULON - GUTTMAN

= Coeficiente de Confiabilidad de Rulon Guttman = Varianza de la diferencia de los puntajes impares y pares = Varianza de la escala (Puntaje total)

COEFICIENTE DE CONFIABILIDAD ALFA DE CRONBACHDesarrollado por Cronbach (1951) y ampliado posteriormente.

Puede considerarse como la medida de todas las correlaciones de división por mitades posibles, las buenas junto con las malas, corregidas por la fórmula de spearman –Brown.

El coeficiente alfa también puede ser usado en pruebas con reactivos dicotómicos, además de las pruebas donde los reactivos no son dicotómicos: reactivos que pueden calificarse de una forma individual a lo largo de un rango de valores (ejemplos: encuesta de opinión y de actitudes, donde se presenta un rango de alternativas posibles, las pruebas de ensayo y respuesta corta, donde puede darse puntaje parcial).

Actualmente el coeficiente alfa es la estadística preferida para obtener una medida de la consistencia interna.

= Coeficiente de Confiabilidad Alfa de Cronbach = Número de ítems o variables = Varianza de la suma del ítem i-avo = Varianza de la escala (Puntaje total)



COEFICIENTE DE REGRESION - R PEARSON

= Coeficiente de Regresión entre el conjunto X y Y = Tamaño del conjunto X y Y

= Sumatoria de puntajes simples de la variable X= Sumatorias de puntajes al cuadrado de los puntajes de la variable X

= Sumatoria de puntajes simples de la variable Y= Sumatorias de puntajes al cuadrado de los puntajes de la variable Y



MUESTRAEl tipo de muestreo que se utiliza es el probabilística, ya que todos los sujetos de la población tienen la misma posibilidad de ser escogidos. El tamaño muestral se fija con un margen de error, que puede ser entre 0.01 al 0.05; y un nivel de confianza del 95 %, del 95.45 % o del 99.87 %; utilizando la fórmula de Cochran, donde el estimador es el porcentaje de elección de cada elemento.

Donde:

p = probabilidad de ocurrencia del eventoq = probabilidad de no ocurrenciae = márgenes de error promedioZ = Nivel de confianzaN = Población

Por ejemplo se tiene una población de 1240 sujetos, y se desea estimar una muestra para realizar el estudio, para ello se fija un nivel de confianza del 95.45 %; un 5 % de error y la probabilidad de que ocurrencia es 50 %. Calcule la muestra.

Nivel de confianza Valor de Z99.87 % 3.00095.45 % 2.00095.00 % 1.960

Datos:p = 50% (0.50)q = 1 – p (1-0.50) = 0.5e = 5 % = 0.05Z = 95.45 % ( 2.00)



N = 1240

Aplicando la formula nos da una muestra n de 150 elementos a ser observados.

Nota: La muestra piloto debe ser por lo menos el doble de la cantidad de ítems o variables estudiadas.



CALIDAD DE LA FORMACIÓN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE

HUAMANGA

ENCUESTA ANÓNIMA

Estimado profesor, el presente cuestionario es parte de un proyecto de investigación que tiene por finalidad la obtención de información acerca de la calidad de la formación que se brinda en la escuela profesional de Obstetricia.

A. DATOS PERSONALES.1. UNIVERSIDAD: UNMSM (1) UNSCH (2)2. PROFESOR: PRINCIPAL (1) ASOCIADO (2) AUXILIAR (3)

B. INDICACIONES.

Al responder cada uno de los ítems marcara solo una de las alternativas propuestas. Los ítems están clasificados de acuerdo a las variables de estudio: Planes de Estudio, Nivel Profesional Docente, Contexto Académico, y Tecnología de Sistema de Información.

C. VARIABLES DE ESTUDIOSPLANES DE ESTUDIOS

1. Las asignaturas se encuentran estructuradas e integradas suficientemente para lograr una formación de alta calidad.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

2. El plan de tesis de su Escuela profesional prioriza asignaturas que inciden mas en la teoría que en la practica.1. Totalmente de acuerdo2. De acuerdo



3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

3. Los contenidos de las asignaturas permiten una formación que desarrolle las habilidades necesarias de los alumnos en el campo de la Obstetricia hacia niveles profesionales competitivos.

1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

4. La programación de las actividades académicas se encuentra diseñada para posibilitar una actualización científica - tecnológica permanente de los profesores.


5. Las actividades académicas promueven el desarrollo intelectual de los profesores para conocer y aplicar los avances científicos – tecnológicos en el campo de la obstetricia.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

6. El plan de estudios de su Escuela Profesional prioriza el desarrollo de asignaturas que son importantes para la producción de investigaciones en el campo de la obstetricia1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

7. En general los planes de estudios de su carrera profesional desarrollan el dominio teórico – practico de la metodología para producir investigaciones.1. Totalmente de acuerdo2. De acuerdo



3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

8. Los alumnos están capacitados para realizar proyectos de investigación producto de la formación investigativa recibid en su escuela profesional.1. Todos los alumnos2. La mayoría de los alumnos3. La mitad de los alumnos4. Algunos alumnos5. Ninguno de los alumnos

9. Los planes de estudios son lo suficientemente flexibles para potenciar el desarrollo de las capacidades cognitivas y valorativas de los alumnos.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

10. Los planes de estudio son evaluados permanentemente permitiendo una actualización académica de sus contenidos.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

NIVEL PROFESIONAL DOCENTE11. El general los profesores de su escuela Profesional tienen un alto dominio teórico – practico para el desarrollo de las asignaturas.

1. Todos los docentes2. La mayoría de los docentes3. La mitad de los docentes4. Algunos docentes5. Ninguno de los docentes

12. Los profesores de su escuela profesional poseen las competencias necesarias para producir investigaciones científicas en el campo de la obstetricia.1. Todos los docentes2. La mayoría de los Docentes3. La mitad de los docentes4. Algunos docentes



5. Ninguno de los docentes13. Los docentes utilizan estrategias metodológicas modernas para promover el desarrollo del pensamiento hacia niveles de reproducción y producción de los conocimientos

científicos de la obstetricia.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

14. La metodología utilizadas por los profesores potencializan el desarrollo de las capacidades cognitivas y valorativas de los alumnos.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

15. Los profesores manejan adecuadamente el Internet y el e-mail como recursos para promover aplicación de la ciencia y tecnología de la obstetricia.1. Todos los docentes2. La mayoría de los docentes3. La mitad de los docentes4. Algunos docentes5. Ninguno de los docentes

16. En general las formas de evaluación utilizadas por los profesores son adecuadas para evaluar las competencias de los alumnos.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

CONTEXTO ACADEMICO - ADMINISTRATIVO17. La gestión académica – administrativa de la escuela profesional crea las condiciones para que los profesores asuman el compromiso de lograr las metas y objetivos

institucionales.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

18. El contexto académico – administrativo promueve la actualización académica y las actividades de investigación de los profesores.




19. La gestión administrativa brinda las facilidades para el uso de soportes tecnológicos modernos como Internet, e-mail que permitan el acceso a la información actualizada.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

20. Existe cohesión interna en la comunidad universitaria de la escuela que se expresa en la cooperación y la participación en actividades académicas de los profesores.´1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

21. En la escuela profesional existe un clima de motivación que favorece el desarrollo intelectual y la actualización permanentemente de los profesores.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

TECNOLOGIA Y SISTEMA DE INFORMACION22. Los equipos de computo con los que cuenta la escuela Profesional que permiten el acceso a Internet, e-mail a los profesores son en cantidad y en calidad.

1. Excelentes2. Buenos3. Regulares4. Malos5. Pésimos

23. Los medios audiovisuales que se encuentran a disposición de los profesores, como retroproyectores, videos, rotafolios, láminas entre otros son en cantidad y calidad.1. Excelentes2. Buenos



3. Regulares4. Malos5. Pésimos

24. La biblioteca especializada de su escuela se encuentra lo suficientemente actualizada e implementada para coadyuvar una formación de calidad en obstetricia.1. Totalmente de acuerdo2. De acuerdo3. Ni de acuerdo ni en desacuerdo4. En desacuerdo5. Totalmente en desacuerdo

25. Los laboratorios de enseñanza con los que cuenta su Escuela Profesional para coadyuvar a las investigaciones de calidad en el campo de la obstetricia son en calidad y cantidad.

1. Excelentes2. Buenos3. Regulares4. Malos

5. Pésimos







DATOS DE LA ENCUESTA

CALIDAD DE LA FORMACIÓN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTÓBAL DE

HUAMANGA

docente

va1

va2

va3

va4

va5

va6

va7

va8

va9

va10

va11

va12

va13

va14

va15

va16

va17

va18

va19

va20

va21

va22

va23

va24

va25

1 1 4 2 2 2 2 3 3 4 1 3 2 4 2 4 2 2 5 4 4 2 3 2 4 22 1 3 2 5 4 2 4 2 4 1 3 2 3 2 4 2 2 5 4 4 2 3 2 3 23 1 3 2 5 4 2 2 3 4 1 2 2 2 2 3 2 2 5 3 3 2 3 2 2 24 0 3 2 4 4 3 3 3 3 3 3 4 4 4 4 4 5 4 4 3 4 3 5 2 35 2 4 2 3 3 4 1 2 3 2 3 4 3 3 3 4 5 5 4 3 4 5 2 2 36 4 2 3 2 2 4 4 3 4 4 0 0 0 0 0 0 4 2 4 4 4 0 0 2 37 4 4 4 4 4 4 4 4 4 5 4 4 4 4 4 4 4 4 4 4 4 0 4 4 58 2 3 2 4 4 4 4 4 4 2 4 4 4 3 4 4 3 4 4 4 4 4 3 4 49 4 2 4 4 4 4 4 4 4 5 4 2 2 2 4 2 4 4 4 3 3 3 4 4 5

10 4 4 2 4 4 4 4 2 2 5 4 2 4 2 4 4 3 2 5 4 4 4 4 4 3




Documents

CONFIABILIDAD