Muestreo y generalizabilidad

Embed Size (px)

DESCRIPTION

Documento. Curso #2: 'Diseños en investigación Educativa' considerado dentro del plan de estudios del Master en Master en Psicología de la Educación y Desarrollo Humano en Contextos Multiculturales. Instituto CREA, Universidad de Valencia, 2011

Citation preview

  • 5/10/2018 Muestreo y generalizabilidad

    1/33

    ,CAPITULO

    CUATRO

    Muestreo y generalizabilida'dLaque oprendero en este capitulo Por que un buen muestreo podria ser el paso mas importante de un proyecto de inves-

    tigacion La importancia de la generalizabilidad La diferencia entre una muestra y una poblacion El significado de la paJabra aleatorio Como usar una tabla de nurneros aJeatorios para seleccionar una muestra La diferencia entre muestreo aleatorio simple y muestreo estratificado La diferencia entre las estrategias de muestreo probabilisticas y no probabilisticas Que es el error de muestreo y por que es importante Comoreducir el error de muestreo Comoestimar el tamaiio de la muestra

    95

  • 5/10/2018 Muestreo y generalizabilidad

    2/33

    Uno muestro es unsubconjunto de uno

    pobloci6n.

    La generol izobil idod amenudo es 1 0 clovepora que un estudio

    tengo exile,

    Im~gine esto. Se Ie ~a asi~ado a~!,.~s~,I~,,;~~~;\~;e;~~dir la actitud. general de los es-tudiantes de educacion media hacl,,~~,~t.'~il~~~'~~~cto de sus casilleros ~ busca dedrogas. Usted ya tiene suficiente experiencia en investigaci6n para saber-que tendra queelaborar algun tipo de cuestionarioasegurandose de que cubra las areas de contenidoimportantes y sea facil de administrar y call.ti'caJ;\Una vez realizado todoel trabajo prelimi-nar, surge la pregunta mas importante: i,a q'wenes Ie pedira usted que contesten el cuestio-nario? ift todos los estudiantes de todas laa.escuelas de educaci6n media del distrito, quepodrian ser millares? Imposible; seria demasj~do'oo8tosO.iftdministrar el cuestionario 8610

    ~"'!fen aquellas escuelas en las que se ha info~~do de problemas con drogas? Tampoco puedehacerse eso; es muy probable que tambien:i'fiiiya'drogas en las escuelas que no se han iden-tificado como escuelas problema. i,~e\"t~Ii',:$~,~:p~~~ 8610a los estudiantes de Ultimoafio, ya que se supone que son los que,nlE!j~r.cdrlQci!nho que esta sucediendo en la comuni-dad? Tampoco puede hacerse eso porque los estudiantes de los grados inferiores tambienusan drogas. ;,Quehacer?

    [Decisiones, decisiones, decisiones! Y decisiones que no se pueden tomar a la Iigera. EIexito ?el ~~~~i~!i!Ir:~?~1e,!.Ia..~?~~:~n q~e l~fW~~\~~o~e '~ra.~nt;e..qu~:\~i~~~~~ elestudio, sea que I:lsf.e

  • 5/10/2018 Muestreo y generalizabilidad

    3/33

    trabajo"? Presentaremos algunas pautas en este capitulo, pero una forma de efectuar unaespecie de autoverificacion es hacemos la pregunta: iLa muestra que seleccione de la pobla-cibn tiene al parecer todas las caracteristicas de la poblacion, en la misma porporcibn? ;,Esla muestra, efectivamente, una minipoblacion]

    Para entender el proceso de muestreo, primero necesitamos distinguir entre dos tiposgenerales de estrategias de muestreo: probabilisticas y no probabilisticas. EI muestreoprobabilistico es un tipo de muestreo en el que se conoce la probabilidad de seleccionarun miembro individual de la poblacion. Si hay 4500 estudiantes en todas las escuelas debachillerato, y ~i 1000 de ellos estan en el Ultimo afio, la probabilidad de seleccionar un es-tudiante de Ultimo ano como parte de la muestra es de 1000:4500 = 0.22.

    El muestreo DO probabilistico es aquel en el que se desconoce la probabilidad deseleccionar cualquier miembro individual de la poblacion. Por ejemplo, si no sabemos cuan-tos muchachos estan inscritos en las escuelas de educacion media del distrito, no podremoscalcular la probabilidad de seleccionar cualquiera de elIos.

    Estrategias de muestreo probobilisticoLas estrategias de muestreo probabilistico son las mas utilizadas porque la seleccion de losparticipantes esta detenninada por el azar. Puesto que la decision de quien entra y quienno entra en la muestra esta regida por reglas no sistematicas y aleatorias, hay una buenaposibilidad de que la muestra represente verdaderamente a la poblacion,

    Muestreo oleororio simpleEl tipo mas comun de procedimiento de muestreo probabilistico es el muestreo aleatoriosimple. Aqui, cada miembro de la poblacion tiene una probabilidad igual e independientede ser seleccionado como parte de la muestra. Las palabras clave aqui son igual e indepen-diente. Igual, porque no existe alguna predisposicion a escoger una persona en lugar deotra. Independiente porque el hecho de escoger una persona no predispone al investigadoren favor 0 en contra de escoger otra persona dada. Si se muestrea aleatoriamente, las ca-racteristicas de la muestra deberan ser muy parecidas a las de la poblaci6n.

    Por ejemplo, ;,estariamos realizando un muestreo aleatorio simple si escogieramos cadaquinto nombre del directorio telefonieo? No, porque estariamos violando ambos criterios deigualdad e independencia. En primer lugar, si comenzamos con el quinto nombre de la pagi-na 234 del directorio, los nombres 1,2,3 y 4 nunca tuvieron una probabilidad igual de serescogidos. Segundo, si escogemos el numero 5 de la lista y luego cada quinto nombre de a men adelante, solo los nombres 10, 15, 20, etc., tendran la posibilidad de ser escogidos. Enotras palabras, el proceso de seleceion ya no es independiente.

    EI proceso de muestreo aleatorio simple consta de cuatro pasos:1. Definir la poblacion de la cual se desea seleccionar una muestra.2. Listar todos losmiembros de la poblacion.3. Asignar nfuneros a cada miembro de la poblacibn.4. Aplicar un criterio para seleccionar la muestra deseada.Por ejemplo, en la tabla 4.1 se muestra una lista de 50 nombres a los que ya se han asigna-do numeros (pasos 1, 2 y 3). No es una poblacion muy grande pero si excelente para finesilustrativos. De esta poblacion seleccionaremos una muestra de 10 individuos utilizandouna tabla de nnmeros aleatorios. Veamos como funciona esto.

    Capitulo 4: Muestreo y generolizobilidod

    Enmuchoscasos noconocemos 1 0probobilidcd deseleccionor cualquiermiembro individual de1 0 poblaci6n.

    97

  • 5/10/2018 Muestreo y generalizabilidad

    4/33

    Uno labia de nomerosalealor ios es 1 0

    herramienta menospredispuesla que

    podemos usor paraseleccionarparticipanles

    alealoriamente.

    1. Juana 11. Susana 21. Eduardo T . 31. Daniela 41. Narciso2. Biaulio 12. Nora ',,22. Jorge ,32. Bernardo 42. Penelope3. Enriqueta 13. Diego 23. Cecilia 33 e . Diona ~.Ines4. Lauro 14. juon S. 24. Gabriela 34. Felipe 44 . Debora5. Miguel 15. Bruno 25. Mario 35. Federico 45. Carlo6. Sara 16. Lorenzo 26. Celio 36. Manuel 46. Vicente7. Teresa 17. Roberto 27. Silvestre 37. Donato 41. Gema8. jooquina 18. Esfebon 28. Felicia 38. Eduardo M. 48. Elena9. Jaime 19. Samuel 29. Javier 39. Timoleo 49. Alejondro10. Tomas 2 0 . ' Mario 30. Enriq!Je . 4 0 . ~~lJE!IG. SO . Juan p .

    Tabla 4.1 He aqui un grupo de 50 nombres que constituye uno' 'poblaci6n' para nuestros fines.Observe que coda uno esto numerado y listo para seleccionorse.

    Como usar una tabla de nurneros aleatoriosUna tabla-de nfuneros aleatorios es un criterio magnifico, ya que la forma como se generanlosnfuneros de la tabla carece totaImente de pFedisposici..6n. Por ejemplo, en la tabla 4.2hay cantidades casi iguales de digitos 1,2,3,4,5, etc. En consecuencia,la probabUidad deseleccionar un nfunero que termine en 1 0 en 2 0 en 3, etc., es igual. Esto implica que si serelacionan nombres con los nfuneros la probabilidad de seleccionar cualquier nombre dadoes tambien igual. '

    23157 48559 01837 2599305545 50430 10537 4350814871 03MO 32404 3622338976 49751 94051 7585397312 17618 99755 3087011742 69183 44339 4751243361 82859 11016 4562393'806 04338' 38268 0449149540 31181 08429 8418736768 76233 37948 21569

    Tabla 4.2 Tabla parcial de nurneros aleotorios. En uno tabla de numeros aleatorios, cabe esperar quehabra cantidades iguales de los digitos individuales, dlstrlbuldos 0 1 ozor entre todos 1 6 5 nomeros.

    'Thniendo 10 anterior en mente, seleecionemos un grupo de diez nombres utilizando latabla de numeros aleatorios de la tabla 4.2. Siga estospasos.1. Escoja un punto de partida en algun lugar de la tabla eerrando los ojos y colocandosudedo (0 la punta de uft' ,: lApiz) E m cualquier parte de III~bla': AI seleionaJ' el punta departida de este modo aseguramos que no se escogera algtm punto de partida (0 nom-bre) especifico.

    98 Metodos de investigoci6n

  • 5/10/2018 Muestreo y generalizabilidad

    5/33

    Para este ejemplo, el punto de partida fue la primera columna de numeros, en la Ulti-ma fila (36768); la punta del lapiz qued6 en el cuarto digito, el nfunero 6.2. El primer numero de dos digitos, entonces es 68 (en negritas en la tabla 4.3). Puestoque la poblaci6n lIega hasta 50, y no hay un nomhre en el lugar 68, pasamos por altoeste numero y consideramos el siguiente numero de dos digitos. Ya que no podemos ba-jar mas en la tabla, pasamos al tope de la siguiente columna y leemos hacia abajo, unavez mas seleccionando los primeros dos digitos. Por comodidad, hemos separado los pa-res de digitos en la tabla 4.3.

    23157 48559 01837 2599305545 50430 10537 4350814871 03650 32404 3622338976 4975 1 94051 7585397312 17618 99755 3087011742 69183 44339 4751243361 82859 11016 4562393806 04338 38268 0449149540 31 18 1 08429 8418736768 76233 37948 21569

    Tabla 4.3 Puntode portida pora 1 0 selecci6nde 10 casos utilizondo1 0 tabla de nurnerosaleotorios. Sepuede comenzar en cualquier punto, en tonto ese punto se determine 0 1 azar y no se escojcintencionalmente.

    3. j48! jLo logramos! La persona 48 de la lista es Elena, y ella se convierte en la primerade la muestra de 10 miembros.4. Si seguimos seleccionando numeros de dos digitos hasta haber hallado 10 valores entre01 y 50, habremos seleceionado los nombres de la tabla 4.1 que corresponden a los nu-meros que aparecen en negritas en la tabla 4.4. He aqui un desglose de cuales numerosfuncionaron y cuales no para los fines de escoger una muestra aleatoria de 10 personasde la poblaci6n de 50.

    Leyendo hacia abajo en la primera columna de numeros de dos digitos, 48, 50, 03, 49 Y17 estan bien, porque .quedan dentro del intervalo de 01 a 50 (el tamaiio de la pobla-ci6n) y no-se han seleccionado antes,

    .69y82estan :fuera del intervalo, 04 y 31'estan bien, y 76 esta fuera del intervaloPuesto que no podemos bajar mas por la primera columna de nfuneros de dos dtgitos,

    hay que subir alsiguiente conjunto de numeros de dos digitos (en la misma columna de cin-codigitos) en la parte superior de la columna, que comienza con el nurnero 55. 55no esta dentro del intervalo, 43 esta bien, 65, 75'y'61 no son aceptables, 18st, 85 no,'y (jpor fin!) 33 si, yya tenemos las 10 personas.

    Capitulo 4: Muestreo y generalizabilidad 99

  • 5/10/2018 Muestreo y generalizabilidad

    6/33

    EIusc de cualquiercriteria pora

    seleccionar unamuestra supone que elcriterio no est6relocionado con 10que

    se est6 estudiando.

    Aqui estan: Niunero NombreElenaJuanD.EnriquetaAlejandro. RobertoLauraDanielaInesEstebanDiana

    4850.0.349170.431431833

    Ahora ya tiene usted una muestra de 10. nombres de una poblacion de 50, seleeciona-dos totalmente al azar. Su muestra se escogi6 al azarporque la distribuci6n de los nfunero&en la tabla parcial de numeros aleatOrios de Ia tabla 4.2 se genero al azar. i,Es una simplecoincidencia que tresde los primeros cinco numeros (48,50.,03,49,17) de la tabla p a r c i B Ide nfuneros aleatorios esten agrupados? jAbsolutamente! Este grupo de cinco es la mejoraproximaci6n y Ia mas representativa de cualquier muestra de cinco de toda la poblaci6n,dado que cada miembro de la poblaci6n tiene Ia misma probabilidad independiente de se,rescogido.

    23157 48 55 9 01837 2599305545 50430 10537 4350814871 03650 32404 3622338976 49751 94051 7585397312 1761 8 99755 3087011742 69183 44339 4751243361 82859 11016 4562393806 04338 38268 0449149540 31 18 1 08429 84187,36768 76233 37948 21569

    Tabla 4.4, Seleccion de los nurneros de 1 0 tabla de numeros aleotorios que corresponde a los 10nombres seleccionodos COIl1) muestra. Observe que los pares de numeros individuales est6n en negritosparo peder distinguirlos de los que no se seleccionoron.

    EI gran supuesto, desde luego, es que los nombres de la poblacionItabla 4.1) se listaronde manera aleatoria. En otras palabras, los nombres del 0.1 a1,20. Q.o's.e.listaron como losprimeros 20. de los 50.porque provienen de un vecindario d~tintoj tieneJ:l QlQ.chpdinero, notienen hermanos, 0 tienen alguna otra caracteristica que pudiera predisponeI:"de algunaforma la selecci6n.La regla general es usar un criterio que no tenga relaci6n con 10que se estfl estudian-do. POl' ejempl0, si va a realizar un estudio sobre ofrecerse como voluntarios, tno va a pedirvoluntarios!

    Muestreo sistematicoOtro tipo de muestreo aleatorio se denomina muestreo 8~tjCO;. en el cua1 se escoge

    '~~i8jl7W:'n(liliIDre de lal lista. EI termino k -es i17W represenia un nilmero entre 0 . Y ' el ta-~!'III):U~~mque-usted quiere seleccionar. Por ejemplo. He aqpi.oolJlo ee usarta un, para escoger 10.nombres de la lista de 50.que aparece ~n la tabla 4.1.

    Metodos de investigocion

  • 5/10/2018 Muestreo y generalizabilidad

    7/33

    1. Divida el tamafto de la poblacion entre el tamafto de la muestra deseada. En este caso,50 dividido entre 10 es 5. Por tanto; se escogera cada quinto nombre de la lista.2. Como punto de partida, escoja unnombre de la lista al azar. Haga esto usando el meto-do de "apuntar con los ojos cerrados" 0, si Ia Iista: esta numerada, utilice cualquier digi-to 0 par de 'digitos del nfunero de serie de un billete que traiga en su cartera. EI billeteque usamos en este ejemplo tenia como sus dos primeros digitos 43, y este sera nuestropunto de partida.

    3. Una vez determinado el pun to de partida, seleccione cada quinto nombre. En esteejemplo, si usamos los nombres de la tabla 4.1 y comenzamos con Ines (#43), la mues-tra consistira en Elena (#48), Enriqueta (#3), Joaquina (#8), Diego (#13), Esteban(#18), Cecilia (#23), Felicia (#28), Diana (#33) y Eduardo M. (#38).El muestreo sistematico es mas facil y.menos problematico que el aleatorio, y esta es

    una razon por la que muchas veces se prefiere. EI muestreo sistematico tambien es un pocomenos deseable. Es evidente que se viola el supuesto de que cada miembro de ila poblaciontiene la misma ,p''i'obabilidadde ser seleccionado. Por ejemplo, dado que el punto de partidaes Ines (#43), seria imposible seleccionar a Debora (#44).

    Muestreo esfrotilicodoLos dos tipos de muestreo aleatorio que acabamos de ver funcionan bien.si no nos interesancaracteristicas especificas de la poblacion (como edad, sexo, grupo etnico, grupo de habili-dad, etc.). En otras palabras, si se seleccionara otro conjunto de 10 nombres, supondrlamosque, comoambos grupos se escogieron al azar, son efectivamente iguales. Pero, ;,que sucedesi desde un principio los individuos de la poblacion no son "iguales"? En tal caso, querremosasegurarnos de que el perfil de la muestra coincida con el perfil de la poblacion, y esto sehace creando una muestra estratiticada.La teorla en que se basa el muestreo (y todo el proceso de inferencia) es a grandes ras-gos la siguiente: si usted puede seleccionar una muestra 1 0 mas representativa posible deuna poblacion, cualesquier observaciones que pueda hacer sobre esa muestra se deberancumplir tambien para la poblacion, Hasta aqui vamos bien. Sin embargo, hay ocasiones enque el muestreo aleatorio deja demasiado al azar, sobre todo si no hay garantia de que lasdistribuciones de los miembros de la poblacion dentro de la muestra sean iguales. En esoscasos se utiliza un muestreo estratificado.

    Po'r ejemplo, si la poblacion es 82% catOlicos; 14% protestantes y 4%judios, la muestradeberatener las mismas caractertsticas si la religion. es una variable importante. Es crucialentender' la llltim!a parte del enunciado anterior. Si esta '0 aquella caraeteristica de Ia po-blacion no tiene relaci6n alguna con 10que se esta estudiando, no hay raz6n para preocu-p a r s e por obtener una muestra que siga el mismo patron de la poblaci6n y este estratifica-da segUn una de esas variables.

    Supongamos quela lista de nombres de Ia tabla 4.1 representa una poblacion estratifi-cada (hombres y mujeres), y que el tema del estudio son las actitudes 'haeia elaborto. Pues-to que las diferencias de sexo 0 genero podrian ser importantes.vusted quiere una muestraque refleje las diferencias de g(mero de Iii poblaeion. La lista de '50 nombres consiste en 20mujeres y 30 hombres, 0 sea, es 40% mujeres y"60%hombres. La muestra de 1'0debera re-flejar esa distribuci6n y tener 4 mujeres y 6 hombres. He aqui como se seleccionaria seme-jante muestra utilizando muestreo aleatorio estratificado.1. Los hombres y las mujeres seIistan por separado.2. Cada miembro de cada grupo recibe un nfunero. En este caso, los hombres se numera-nan del 01 'al 30 Y las mujeres del 01 al 20.3. Usando-una tabla de nfuneros aleatorios, se seleccionan 4 mujeres al azar de la listade 20.4. Usando una tabla de numeros aleatorios, se seleccionan 6 hombres al azar de la listade 30.

    Capitulo 4: Muestreo y generolizobilidod

    EImuestreosistematicoreduce 1 0 probobilidodde que ciertosparticipantes seanseleccionodos.

    Losestratosson comodiferentes niveles, querepresentancorocterlsticos.

    101

  • 5/10/2018 Muestreo y generalizabilidad

    8/33

    Loscurnulos son gruposque oporecen juntos.

    102

    Aunque podrian presentarse ejemplos sencillos (con un solo estrato 0 capa) como este,en muchos casos sera.neeesario estratdficar segun mas de una variable. Por ejemplo, en lafigura 4.1 una poblacion de 10000 nines se estratifica segun las variables de a:iio(40% deprimer. a:iio, 40% de tercer ano, 20% de quinto afio) y lugar de residencia (30% rural, 70%urbano). Se utiliza Is misma estrategia: seleccionar 10% (puesto que 1000 es 10% de10000) de cada una-de .las capas estratificadas para producir Ia muestra-de la figura 4.1.Por ejemplo, de los 1200 nifios rurales de primer afio, se seleccion6 aleatoriamente 10%,0120 nifios. De forma similar, se escogieron 140 nifios urbanos de quinto afio.

    2800(280)

    10000(1000)

    2800(280)

    7000(700)

    1400(1401

    4000(4001

    2000(200)

    4000(400)

    Figura 4.1 Laselecci6n de una muestracuondo hay mas de un estrato consisteen tamar una proporci6nde coda nivel. Aqui el tamano de lo muestra se indica entre porentesis debo]o del tamano de codagrupa de 1 0 pablaci6n.

    Muestreo por cumulosEI Ultimo tipo de muestreo probabilistico es el mue,~ por ~-un.ulQ8, en ~I que se selee-cionan unidades de indj~PHQI\Iy, no los individuos mismos. 'pOJ; ejemplp, usted podQa estarrealizando una encuesta de las aetitudes de los padres hacia la vacunaci6n. EI) lugar deasignar aleatoriamente padres individuales ados grupos (digamos, aquellos a los que sa lesenviara material informative :y .aquellos a los que no se les enviara), usted podrla siI:nple-mente identific~ ~Oeonsultorios pediatricoa de la ciudad y.Iuego, utilizando una .tabla denumeros aleatorios, seleccionar 15 para un grupo y designar 15 para el segundo _ g r u p ,o . . ,

    EI muestreo p

  • 5/10/2018 Muestreo y generalizabilidad

    9/33

    Muestrea de conveniencioEI muestreo de .conveniencia es justo 10 que indica-au nombre. Un entrenador de futbolda a cada miembro desu equipo un cuestionario. El'publico (el equipo) es c&utiv.o"y es unaforma muy c6moda de generar una muestra. i,Facil? Si. i,Aleatoriaq No. ;,Representativa?Tal vez, pero basta cierto grado. Quiz8. usted reconozca este metodo de-muestreo como.la ra-zon por la que tantos experimentos en psicologia, realizados en Estados Unidos.se basan enresultados obtenidos usando estudiantes universitarios de segundo aiios; estos estudiantesson un publico cautivo y a menudo deben participar para obtener los creditos de un curso.

    Muestrea par cuatosUsted podria encontrarse en una situacion en la que necesitara obtener una muestra es.~ra-tificada segUn ciertas variables, pero por alguna razon no es posible efectuar un mu~tJ.eoestratificado. En este caso, el muestreo por cuotas podria ser 10 mejor.En el muestreo por cuotas se escogen personas con las caractertsticas deseadas (di-gamos, ninos rurales de primer ano) pero no se selecciona aleatoriamente de la poblacionun subconjunto de todos esos nines, como ocurrirla en un muestreo estratificado proporcio-naI. Mas bien, el investigador continuarla reclutando niiios hasta cumplir conla cuota de120. EI 17fr' niiio rural de primer ano no tiene posibilidad de ser escogido, y esta es la prin-cipal razon por la que esta tecnica de muestreo es no probabilistica.He aqui otro ejemplo de sistema por cuotas. Digamos que usted tiene que entrevistar20 estudiantes universitarios de primer afio de ambos sexos. Primero usted podria entre-vistar 10 hombres 'I;sabiendo que la distribucion de hombres y mujeres estS dividida apro-ximadamente 50i50, usted entrevistarla las siguientes. i6' mujeres que llegaran, y' con ellohabrla acabado. Si bien el muestreo por cuotas es mucho mas facil que el estratifieado,tambien es menos preciso. Imagine euanto mas facil seria encontrar 10 estudiantes de.pri-mer aiio de sexo masculino que 10 hombres especificos, que es 10 que usted tendria que ha-eer si realizara un muestreo estratificado.En la tabla 4.5 se listan los diferentes tipos de estrategias probabilisticas y no probabi-listicas que hemos visto, y se indica cuando deben usarse, junto con algunas de sus venta-jas y desventajas.

    MUestros y error de muestreoPor mas que se esfuerce el investigador, es imposible seleccionar una muestra que repre-sente perfectamente a la poblacion. Desde luego, el investigador podria seleccionar toda lapoblacion como muestra, pero esto elimina el prop6sito del muestreo: haeer una infereneiaa una poblacion con base en una muestra mas pequena,Una forma de expresar la falta de eongruencia entre -la muestra y la poblacion se ex-presa como el~..ror de mu~. ;Este error es la diferencia entre las caracterlsticas dela m~es~ra y las.caracterlstioas de la poblacion.de la eual se seleceieno la muestna, Porejemplo, la estatura promedio de 10000 alumnos de quinto aiio es 102 em. Si usted toma25 muestras de 1 0 0 alumnos de quinto afio y calcula la estatura promedio para cada grupode 100 alumnos, tendra un promedio para cada grupo, es decir, 25 promedios. Si todos esospromedios .son exactamente 102 em, no habra error de muestreo, Sin embargo, es casi se-guro que no se obtendra tal resultado ..La vida no .es tan facil ni la seleccion de muestras esas1 de perfects, Lo J A S s probable es que usted Q~tenga valores como :102.5, 102.2, 101.6,100.1 em, etc. La cantidad de-variabilidad, 0 la dispersion, deestos v:aJ.oresnos da una ideade la magnitud del error de muestreo. Cuanto mayor es la diversidad de los valores de lasmuestras, mayor es el error.Piense un momento en 10 que sucederta.si toda la poblaci6n de 10000 alumnos dequinto ano fuera la muestra. [La estatura promedio seria 102 cm! .jPenecto! [Cero error!;,La moraleja? Cuanto mayor es la muestra, menor es el error de muestreo, porque euantoCapitulo 4: Muestreo y generalizabilidad

    L a re du cc i6 n d el e rro rde m ue stre o e s u no bje tiv o im p orta nte d ecua l qu i e rp ro ce d im ie n to d ese l ecc i 6n .

    103

  • 5/10/2018 Muestreo y generalizabilidad

    10/33

    104

    Muestreo Cuanda lo s miembros de Asegura un 0110 gradealeatorio simpl4!t 10 poblocion son s imi/ares de represenlalividad

    Tardada y lediaso

    Muestreo 'sistematico

    Cuanda los miembros.,i de 10 pobloclon sontodos similares

    Asegura un alto gradode represenlalividad; nohoy que usar uno labiade nurneros alealorios

    Menos verdaderamenleoleo Iorio que elmueslreo alealoriosimple

    Cuando 10poblccion esde naluraleza heteroqe-nea y conliene variosgrupos dislinlos

    Asegura un alto gradode represenlal iv idad detodos los estrotos de 10poblocion

    Tardado y tedioso

    Focil y comedouando 10poblooonconsisle en unidodesmas que en individuos

    Posibi lidod de que losmiembros de losunidcdes diheron entresi y redozcon 10eleclividod del mueslreo

    Estr'at\ltgias de muestreo no probabilisticas"Muestreo deconvenUnciG

    Cuando hay estralospero no es posibleun mueslreo estroiilicodo

    Asegura cierlo grade derepresentatividad derodos los eslralos de10 poblocion.

    Cuando 10mueslraes cautiva

    Comedo y econornico

    La represenlatividades dudosa

    Muestreopar cuotas

    La represenlatividades dudoso

    Tabla 4.5 Resumen de los diferenles tecnicos de muestreo. AI comenzar a considerar 10seleccion de unarnuestro, hoy que lener en cuenla muchos factores, todos los cuales olecicrcn el lipo y el romano deI a mueslra que escoja.

    mas grande es una muestra mas se aproxima su tamaiio al tamaiio de la poblacion yes mas representativa de esa poblacion.

    EI proceso exacto para calcular el error de muestreo, que se expresa comoun valor nu-merico, rebasa el alcance de este libro, pero el lector debe tener presente que su propositoal seleccionar una buena muestra es minimizar ese valor. Cuanto mas pequeno sea el valor,menor discrepancia habra entre la muestra y la poblacion,

    Pero hay mas. Yasabemos que cuanto mas grande es una muestra, mas representativaes de una poblacion. Digamos que llega el momento de probar si hay una diferencia entremuestras. Resulta que, cuanto mejor las muestras representan su respectiva poblacion,mas exacta es la prueba de las diferencias. En otras palabras, un mejor muestreo da lugara pruebas mas exactas y verdaderas de las diferencias entre poblaciones.

    lComo minimizamos el error de muestreo? Sencillo. Utilizamos buenos procedimientosde seleccion comolos que describimos al principio del capitulo y aumentamos el tamaiio dela muestra hasta donde es posibley razonable. La siguiente pregunta que usted esta a pun-to de hacer (espero) es, "lque tan grande debe ser la muestra?" jQue bueno que pregunt6!Pasemos a la Ultima secci6ndel capitulo para entender mejor la respuesta a esa pregunta.

    Metodos de investiqocion

  • 5/10/2018 Muestreo y generalizabilidad

    11/33

    2Que tan grande es grande?Ahora que usted sabe algo acerca de muestreo, i.que tantos de esos estudiantes de educa-cion media necesita seleccionar de la poblacion de 4500? Si con 50 basta, i.no es mejor 500?i.Ypor que no 1500, si tiene el tiempo y los recursos suficientes para el proyecto?Usted ya sabe que una muestra demasiado pequena no es representativa de la pobla-cion, y que una demasiado grande es una exageracion. Muestrear demasiados estudiantesde educacion media anularia el prop6sito del muestreo, pues ya no se estaria aprovechandola utilidad de la inferencia. Hay quienes piensan que cuanto mas grande es una muestra,mejor, pero tal estrategia no es logtca desde un punto de vista econ6mico 0 cientifico. Unamuestra demasiado grande no aumenta la precisi6n de la prueba de la pregunta en un gra-do que justifique el costo y el trabajo de obtener una muestra de ese tamano. Necesitamosun metodo para calcular el numero real de estudiantes de educacion media que convieneseleccionar para Ia muestra. Recuerde, cuanto menos representativa de Ia poblaciorr sea lamuestra, mayor sera el error de muestreo presente. Ademas, cuanto mayor sea el errorde muestreo, menos generalizables a la poblacion seran los resultados y menos precisa serala prueba de la hip6tesis nula.

    Estimaci6n del tornofio de 1 0 muestraEs posible estimar ,el tamano de muestra que se necesita para representar de la maneramas exacta posible .la poblacion, pero esto va a requerir un poco de fe por parte del lectorpor dos razones. Primera, implica conceptos que estan un poco mas alla del nivel-de este Ii-bro. Sin embargo, dado que el lector es inteligente y entusiasta, es probable que entiendalos fundamentos de este material. Segundo, y mas importante, es preciso estimar ciertosvalorea.Jo cual muchas veces es dificil aun para los expertos.He aqui los componentes que' necesitamos para estimar los tamafios de muestra de dosgrupos que se van a comparar entre st.

    s = la desviaci6n estandar de la variable dependiente, es decir, que tanta variabilidadhay en los puntajes para esta variablet = el valor critico necesario para rechazar la hipotesis nulaD = la magnitud que usted estima tiene la diferencia promedio entre los dos grupos.'Ibmemos.como ejemplo el caso deurr-estudio-en.elque uatedvesta tratando de deterrni-nar si un programa de lectura es mas eficaz que otro, La variable dependiente es el puntajede lectura promedio.La forma como estimamos Ia desviacion estandar de una muestra antes de probar losmiembros de la muestra es examinando los puntajes y estadisticas descriptivas de la varia-ble dependiente cuando esta variable se uso en otros estudios. Por ejemplo, digamos que ea-ta prueba de lectura tiene un manual, YQue el manual indica que la desviaci6n estandarpara alumnos de primero de bachillerato en el pasado ha bido de 15.A continuaci6n, introducimos el valor .erttieo que refleja la diferencia que usted espera-ria si el azar (y no cualquier tratamiento) fuera el unico factor que operara. Los valores cri-ticos se pueden encontrar en tablas especializadas. Examinaremos mas a fondo este con-cepto en el capitulo 8.Por .ulti.J;no,necesitamos tener una idea de a cuanto. ascendera la diferencia entre .losdos grupos. Si el puntaje .que puede obtenerse en la prueba de lectura esta entre 20 y 50,ciertamente no esperaremos que la diferencia entre los dos promedios sea de mas de 30.Hay que serrazonables.Para este ejemplo,

    la desviaci6n estandar es igual a 15 (supuestamente informada en otro estudio),

    Capitulo 4: Muestreo y generolizobilidod

    Losmuestrasdeben ser1 0 bostante grandescomo para paner derncnihesto cualesquierdilerencios, si existen,pero no ton grandesque sean demasiadocostosos.

  • 5/10/2018 Muestreo y generalizabilidad

    12/33

    el valor t es 2 (el valor que obtuvimos de nuestra tabla especial), y la diferencia estimada entre los grupos es de 6, que tambien es una cifra de orden de

    magnitud.Dados estos valores, podemos usar la siguiente formula para calcular n, que es el tama-

    no de muestra estimado necesario para cada grupo bajo las restricciones que se han esta-blecido:

    donde n = tamafio de muestra estimado para cada grupos = desviacion estandar basad a en estudios anteriorest = valor criticoD = nuestra estimacion de la diferencia entre cada grupo

    Si sustituimos valores, la formula queda aS1:(2 X 152) x 2.002n = 62

    Esta formula revela que, dadas las anteriores restricciones, necesitamos unas 50 perso-nas en cada grupo.

    Lo que resulta interesante examinar son los efectos de cambiar ciertos valores (como ladesviacion estandar y la diferencia estimada) sobre el valor estimado de n, el tamaiio demuestra que necesitamos. Yea 1 0 que sucede en la tabla 4.6 cuando cambia la diferencia es-tim ada entre los dos grupos.

    , .Efecto S O bre ~ l ama;k . dellG"m~stra cuando ~ificC:~.,1a ~ t':~.~;";,. ,del erTOr' estimaclo, ',J

    " ~ . - ' ' , I "

    5 t d n15 2 6 5010 2 6 225 2 6 6

    Efecto'sob . .. .. lamano de' Ia muestra cuando mOdificamo. I e . lmagnitud I, "de lei diferencia timaclo ', ' , r , ' , . " . " , ' < . :5 t d n10 2 2 20010 2 4 5010 2 6 22

    Tabla 4.6 Podemos ver 10dr6stico que puede ser el efeeto cuondo combrornos 1 0 diferencio estimodoentre grupos.

    Cuanto mayor es la diferencia estimada (de 2 a 4 a 6), menos grande necesita ser el ta-mario de las muestras. ;,Por que? Porque cuanto mayor es la diferencia entre las muestras,menos representativas tienen que ser estas de la poblacion para que podamos ver el efecto,si existe. Esto es un poco como decir que es mas facil percibir una diferencia grande entredos cosas que una diferencia pequefia. En la tabla 4.6 podemos ver 1 0 drastico que puedeser el cambio. Si duplicamos el tamafio estimado de la diferencia (de 2 a 4), reducimos dras-ticamente el tarnaiio de muestra estimado necesario, de 200 en cada grupo a 50.

    106 Metodos de investigaci6n

  • 5/10/2018 Muestreo y generalizabilidad

    13/33

    l.Quees 10 mas importante en cuanto al tamaiio de muestra? Thnga presentes las consi-deraciones siguientes: En general, cuanto mayor es la muestra (dentro de limites razonables), menor es el

    error de muestreo ymejores son'losresliltados. Si va a utilizar varios subgrupos en su trabajo (comohombres y mujeres, ambos de 10

    afiosde edad, y residentes rurales saludables y no saludables), asegilrese de que su se-lecci6ninicial desujetos sea 10 bastante grande comopara contemplar la divisi6n nece-saria engrupos de sujetos.

    Si usted va a enviar por correo encuestas y cuestionarios (yya sabe usted 10 que puedesucederles a muchos de'e'llos), corrterrrple un aumento de 40%-50%en el t.arrrafiodemuestra' para dar cabida a las perdidas en el correo y la falta de cooperaci6n de los su-jetos.

    Por Ultimo,recuerde que 10 grande es bueno, pero 10 apropiado es mejor. No gaste sudinero arduamente ganado ni su valioso tiempo generando muestras mas grandes de10 necesario.

    Aunque algunas personas podrian. no estar de acuerdo con los temas que usted ha escogidopara estudiar, 10que usted escoja es asunto suyo en tantopresente una juetificaciors razona-ble elf! 10que esta hacienda, En cambia, s_useleccion. e l f ! una muestra. es cuestion aparte.Existen muchae formas correctas de hacerlo, pero tarnbien. esta Laforrna incorrecta. Si ustedescogeLa forma incorrecta "rporquees arbitrario y no sigue ningun plan), bien podrio. sabo-tear toda su labor de investigacibn porque sus resuLtados podrfan carecer de generalizabili-dad y, por tanto, de utilidad para Lacomunidad cieruifica.

    Capitulo 4: Muestreo y generalizabilidad 107

  • 5/10/2018 Muestreo y generalizabilidad

    14/33

    Med'ic'ion del comp1ortamie'ntoLa que oprendero en este capitulo Por que la medici on es una parte importante del proceso de investigacion Que incluye el proceso de medicion Cuales son los diferentes niveles de medicion, y como se aplican Que es la confiabilidad Los diferentes tipos de confiabilidad, y como sa usan Como aumentar la confiabilidad de una prueba Que es la validez Los diferentes tipos de validez, y como se usan Como aumentar la validez de una prueba La relacion entre confiabilidad y validez

  • 5/10/2018 Muestreo y generalizabilidad

    15/33

    La rnedicion es 10asignaci6n de valores

    a resultados.

    EInivel de medici6nempleado depende dec6mo se desea rnedirun resultado.

    11 2

    EI proceso de medici6nAun sin saberlo, es probable que usted dedique mucho tiempo a juzgar las cosas que sure-den a su alrededor. En muchos casos, tales juicios son informales ("Realmente me gustO laforma en que Luis presentO ese material'), pero a veces son tan formales como es posible("85% de sus respuestas fueron correctas"').En ambos ejemplos, se estA ernitiendo, un juieio acerca de un resultado especifico. De esose trata el proceso de medicion, y no debemos subestimar su importancia para el proceso deinvestigacion, 'lbda nuestra labor y empeno .paIi8' tratar de contestar esta 0 aquella pregun-ta interesante de nada sirven si a

  • 5/10/2018 Muestreo y generalizabilidad

    16/33

    del siguiente nivel hacia arriba. En otras palabras, las variables medidas en el nivel ordi-nal tambien contienen las cualidades de las variables medidas en el nivel nominal. Asi rnis-mo, las variables medidas en el nivel de intervalo contienen las cualidades de las variablesmedidas en los niveles tanto nominal como ordinal. Por ejemplo, si sabemos que Luis tiene175 cm de estatura y Laura tiene 163 ern de estatura (nivel de medicion de intervalo 0 posi-blemente de razon), sabemos tambien que Luis es mas alto que Laura (nivel ordinal de me-dicion), y que Luis y Laura tienen diferente estatura (nivel nominal de medicion), Segunda,en cualquier proyecto de investigacion una variable de resultado pertenece a uno de estoscuatro niveles de medicion. La clave, desde luego, es como se mide dicha variable.A continuacion presentamos un tratamiento mas detallado de cada uno de estos nivelesde medicion, con ejemplos y aplicaciones. En la tabla 5.1 hacemos un resumen de los cuatroniveles, y de 10 que podemos y no podemos decir acerca de ellos.

    Tabla 5.1 Los niveles de rnedicion.

    Nominal

    Quit no ...puede decir

    GeneroImosculino 0femeninol

    PreferencioIgusto 0 no gustol

    vorocion len proo en control

    Codo observocion Uno observocionpertenece 0 su prepresento "mas"propia cotegorio. 0 "rnenos" que

    otro observocion.

    Rongo Uno observoci6n Que tonto unouniversitario se closihco arriba variables es

    Orden de o obojo de otro. mayor 0 menorlIegada en que otro.una correro

    N0mero de Un puntoje difiere Lomagnilud de 1 0polobros de olro en alguna diferencio es unacarreclamenle rnedido que liene represenlaci6ndelelreodas inlervolos exacla de las

    Puntajesen equiespociados. diterencios en 1 0pruebas de voriable que seinteligencia esto esludianda.

    Temperatura Edad Un valor es el iNo mucho! Peso doble de otro 0 Tiempo ninguna conlidod

    de esa voriablepuede exislir.

    EInivel nominal de medicion, de la palabra latina nomin (nombre), describe variablesde naturaleza categ6rica y que difieren en calidad mas que en cantidad. Es decir, la varia-ble que estamos examinando caracteriza nuestras observaciones de modo tal que cada una

    Capi tulo 5: Medicion del comportomiento

    Losvariables de nivelnominal soncoteqoriccs.

    11 3

  • 5/10/2018 Muestreo y generalizabilidad

    17/33

    Losvalores de nivelordinal est6nordenados ,

    114

    puede colocarse en una (y solo una) categorta. Ademas, podemos rotular esas categorias anuestro antojo. 1bdos los niveles nom ina les de medicion son exclusivamente cualitativos.

    Por ejemplo, el color del pelo (rubio, rojo, negro), la raza (negra 0 afroamericana, blancao angloeuropea, americana nativa) y filiacion politica (socialista, socialdernocratacperonis-ta, sandinista) son ejemplos de variables de nivel nominal. Incluso es posible usar numerosen la medicion de variables de nivel nominal, aunque los nUmeros no tienen un valor in-trinseco. Por ejemplo, asignar los hombres al grupo 1 y, las mujeres al grupo 2, 0asigriar atodos los hombres de linea de un equipo de futbol americano camisetas con los numeros del40 al 50, son ejemplos de medicion nominal 0categerica. Los numeros no tienen un signifi-cado intrinseco; son solo r6tulos que identifican las cosas que se miden.

    Un ejemplo de estudio que utiliza una variable de nivel.nominal seria uno que examina-ra los meritos de dos programas escolares que buscan facilitar la mtegracion de niiios"nor-males" con nines que tienen discapacidades mentales severas (Cole, Vandercook y Rynders,1988). La variable nominal 0 categoria en este casoes el tipo de programaen el que partici-paron los nifios; el de Amigo Espeeial 0el de Tutor Igual. Loa-riinospodian participar en unprograma oen otro' pero rroen 'am'bos. Los investigadores examinaron las diferencias en lainteraccion del nino con Ia discapacidad y el nino Sill ella ..en funcion del tipo de programaen el que participaron. Se estudiaron las diferencias en la interaccion social durante el pro-grama, durante el.juego libre y durante una sesion tutorial,

    Debemos ..ecordar ciertas cosas acerca del nivel nominal de medicion. Primera, las cate-gorias son mutuamente excluyentes; no se puede estar eTImas de una categoria 'a la vez.No es posible ser al mismo tiempo judio y cat6lico (jaunque celebre tanto Hanukkah comoNavidad!). Segunda, si se usan numeros como valores, no tienen significado alguno masafla de la simple clasificacion. No es posible saber si alguien de la categoria 3 es menos 0mas inteligente que alguien de la categoria 11.

    OrdinalEl nivel ordinal de Dledici6n describe variables que se pueden ordenar a 10largo de al-gun tipo de continuo. Las variables no solo se pueden colocar en categortas, sino que taroTbien se pueden ordenar. Por esta razon, el nivel ordinal de medicion a menudose refiere alas variables como ordenarnientos de diferentes resultados, aunque solo; se m a n e j i : m ' d'os ca-tegorias, como grande y pequeiio, ' '..,

    Por ejemplo, ya vimos que alto y bajo son dos posibles resultados cuando se mide la es-tatura. Estes valores son ordinales porque reflejan un ordenamiento dentro del continuedeestatura. Asimismo, el rango de usted dentro de su generacion al graduarse de bachilleratOse baso (probablemente) en su promedio de cahficaciones. Usted pudo ser el primero de300, 0 el centesimo quincuagesimo de 300. Cabe senalar que no es posible inferir el prome-dio de calificaciones a partir de este ordenamiento, sino solo la posicion relativa a otros. Us-ted pod ria haberse graduado primero de 300 con un promedio de9.54, o como el ceI'lti!sim9quincuagesimo de 300 con unpromedio de 9.71.

    A partir de alto y bajo 0 primero y J50-esimo no es posible saber que tan alto 0,que.tanbajo, 0 que tan buen estudiante es el individuo, porque los niveles ordinales de-medioion-noincluyen esta informacion. Lo que si podemos decir es que si Diana es mas baja/que\Juanay Juana es mas baja que Lucia, entonces Diana tambien es mas baja que Lucia. Asi;IPU~~,aunque no es posible hacer juicios 'absolutos (como que tanto mas alta es Lucia que Diana),SI pueden hacerse juicios relativos. Solo podemos asignar el valor 'graduaclo con menc[o;"_honorifica aSI como con mencion. honorifica eon distincion y con maxima' mencion honorifi-ea eon distincion. para distinguir aun mas entre quienes se graduan con mencion honcrifi-ca. Esta escala es de naturaleza ordinal.

    Metodos de investiqocion

  • 5/10/2018 Muestreo y generalizabilidad

    18/33

    IntervaloE1 nivel de intervaJo de medicion, del latin interual lum. ,~que significa, espacios entreparedes) describe variables.que tienen intervalosiguales entre ellas.Icomo ternan las pare-des construidas POI'los soldados romanos). Las variables de nive1 de intervalo.nos permitendeterminar la diferencia entre puntos a 10largo del mismo tipo de continuo que menciona-mos en la descripcion de la informacion ordinal.

    POI' ejemplo, la diferencia entre 30 y 40 .grados es la misma que 1a diferencia entre 70 y80 grados: 10 grados. Asi mismo, si usted escnbio correctamente .20 palabras en una prue-ba de ortografia y alguien mas escribio correctamente 10 palabras, podemos decir.eon exac-titud que usted escribio correctamente 10,palabras mas que Ia otra persona. Dicho de otromodo, un grado es un grado de. un gnado y.una palabra correctamente escrita es una pala-bra correetamente escrita con una palabra correctamente escrita.

    Un estudio realizado POI'Wigfj.eld y Eccles (1989) sobre la .ansiedad ante .los examenesen unidades de educacion primaria rI secundaria ilustra como un .eonstrueto ...omo.~a ansie-dad se puede medir con variables de nive1 de intervalo ..Porejemplo.ila Escala de Ansiedadante-Bxamenes paraNifios (Sarason, Davidson, Lighthall, Waite y Ruebush, 1960).es unaescala de 30 reactivos que evalua diversos aspectos de la ansiedad y que produce una medi-da global. Reactivos como

    Si {altas a la escuela y no haces una tarea, ique tanto te preocupas poratrasarte respecto a los 'demos estudiardes cuando regresas a Laescuelal

    proporcionan una medida exacta del niv.el de ansiedad en los ninos y es una medida am-pliamente utilizada de este fascinante.constructo.

    Para contrastar.Ies niveles de medicion de intervalo y ordinal, consideremos la variableedad donde el ordenamiento POI'edad es como sigue:

    Mas viejo MasjovenGuillermo Enriqueta Josue Raquel Julia

    Sabemos que Guillermo es mas viejo que Enriqueta, pero no que tanto. En realidad, elpodria ser dos anos mayor que Enriqueta, y Enriqueta podria ser 20 anos mayor que Josue.Las variables de nivel de intervalo nos dan esa diferencia, 'cosa que-no pueden hacer las es-calas ordinates. En terminos simples, con una escala de intervale podemos conocer 1a dife-rend.a~n~ p.~tos a lo.Iargo de UJl continuo (y 1a diferencia exacta entre las edades deG~t;nno~ En.r.iqu~ta, ~~ue, Ra9ue~,y.Julia). no as1 con una escala ordinal ...t\u,nque una .~sc.ala en, el nivel.de Intervale es mas precisa. y comunica mas, informacion

    que una ~!JFala\en~~nivelQow.~al.u ordinal, debemos.tener cuidado al interpreter los valo-res reales a lQ.largo:.de la eseala. Treinta grades podrian ser 10 rnasque 20, y,-5 podria es-tar a la misma ~~cia.~e +5, perp,.eB98 1,0podrian pnpli~ unagran.diferencia, Los 10grados entre 30 y'.,.20~rian hacer el ~a.un ~ ~as Ma, ~.ro ~~ los 10(~~os entre -5y +5 el agua se congela. Asimismo, el hecho de-que \.l.S~.~SCfi9io,cp~ente 10 pala-bras ~,que lun companero no signi.fi~ .que U8~ tiene unap$gr~a 'dos, veces .mejor (2POI'10), .ya que no tenemos idea de la~cultad de las ,pala9t\a~ ~ de si esas ~O.palabrasmues~'l,~1 qni~e,~ entero de todas .las p'~~bras. de la .p.l'lle.ba ,de ,ort;ogra~a: Lo que esmas ~po,~~.JJi -,usted.no escribe correctamente tnguna,,{pal.abra, lS~gnip~ e89 que us-ted no.sebe.escrfbir? Claro que no, Lo que s1 significa es que en esta prueba a usted no Ie

    , fuemuy bien.

    Capitulo 5: Medici6n del comportamiento

    las variables de nivelde intervalo tienenpuntas equidistantes a1 0 largo de uncontinuum.

    115

  • 5/10/2018 Muestreo y generalizabilidad

    19/33

    Lasvariables de nivelde rozon tienen uncero verdadero.

    116

    RozonEI nivel de razon de medieion, del latin ratio (que significa calculo), describe variablesque tienen intervalos igualesentre elIas pero que tambien tienen un cero absoluto. E;n losterminos mas sencillos.iesto significa que existen.variables para las cuales un posible valores cero oes posible la ausencia dela variable 0 rasgo.Por ejemplo, un estudio sobre tecnicas para mejorar la conducta prosocial en el sal6n declases (Solomon et al., 1988) midio la conducta prosocial con puntuaciones de comporta-miento. Las cinco categorias de conducta que se midieron durante un periodo de cinco afios(jque largo!) fuerort actividades cooperativas, disciplina del desarrollo, actividades quepromueven el entendimiento social, actividades que destacan los valores prosociales. y acti-vidades de ayuda, Los investigadores dedicaron mucho tiempo a desarrollar sistemas. quepudieran medir de manera.eonsistente (0 "confiable", que es el termino que usaremosdes-pues) estos tipos de conductas. Las escalas que ellos diseiiaron son por su naturaleza de ra-zon, ya que tienen un verdadero punto cero. Por ejemplo, no es dificil imaginar que unniiiono exhiba ninguna conducta prosoeial,

    Este es en verdad un nivel de medicion interesante, y es por mucho el mas precise. Po-der decir que Samuel (quien tiene ocho afios de edad) es dos veces mas viejo que Erica(quien tiene cuatro afios) es una forma muy precisa, aunque no la mas precisa, de hablarde las diferencias entre personas en 10 tocante a una variable. Imagine poder decir que larapidez de respuesta cuando se utiliza el metodo A es 1~mitad de la que Be observa cuandose usa el metodo S. en lugarde decir Unicamente que la tasade respuesta es mas rapida (1 0cual es ordinal) 010 segundos mas rapida (10 cual es intervale).

    Esta es la escala mas interesante de las cuatro, por varias razones mas. Primera, el va-lor cero no es arbitrario. Por ejemplo, podriamos pensar que, puesto que.la temperatura (engrados Celsius) tiene un punto cero (jque friol) es una. variable de razon, Aunque es verdadque esa escala de temperatura tiene un punto eero, se trata de un cero arbitrario. Una tem-peratura de cero grados Celsius no representa la ausencia de cheques-entre las moleeulasque crean calor (la definicion no tecnica de temperatura, y mis disculpas a Lord Kelvin). Encambio, la escala de temperatura Kelvin S 1 tiene un cero absolute te6rico (cerca de -273 gra-dos Celsius), que es el punto donde no hay actividad molecular, .y es un verdadero cero 0una ausencia de 10 que se esta midiendo (actividad molecular).

    2Por que tonto cornplicocionvSeamos practices. En un estudio de investigacion queremos medir la variable de interes dela forma mas precisa posible. No sirve de mucho decir que -e l grupo A es mas debil que elgrupo B si podemos deeir que los miembros del gnlPo A'realiZattlp en prrim~o '100 "'8})40-minales'" nueritras que los del grope) B s6lo hicieron 75 en p~riledi(). 'Ien'ei' Ulft8ihfo~aci6hincrementa lapotencia y Ia utilipad' general de las conclusiones. Imagine' que usted es su-perintendente escolar y puede gastar '$100 000 d61ares en' un prograina de intervenciontemprana. "No' Ie gustarta saber cuales programas Son mejores y por c u a J . margen, en vezde solo averiguar que uno es "mejor" que otro? '

    No obstante;' a veees hay que Iimitarse a la cantidad de informaci6n disponible. Porejemplo, "que ta1 si usted quiere' estudiar 1 '8 relaci6n entre la edad de los adultos ysu fuer-za corporal, Y 16unico que sabe es a que grupo pertenece un adulto (fuerte 0 debil) pero nosu puntaje en unaprueba de fuerza? Tales'Iimitaciones son una de las restriceiones al efec-tuar investigaciones en el mundo real; hay que conformarse con 10 que se tiene, Esas limi-taciones tambien dan lugar a uno de los aspectos creativos de la investigaeion: definir lasvariables de tal manera que la definicion maximice la utilidad de la informacion.

    ;,En que nivel de medici6n encontramos la mayor parte de las variables en las cienciassociales y del comportamiento? Probablemente en el nominal u ordinal, mientras que la ge-neralidad de los puntajes obtenidos en pruebas (como las de aprovechamiento) producendatos en el nivel de intervalo. No obstante, es muy dudoso si los puntajes de tales medicio-nes como las pruebas de inteligencia y personalidad proporcionan algo mas que niveles or-

    Metodas de lnvestiqocion '

  • 5/10/2018 Muestreo y generalizabilidad

    20/33

    dinales de medici6n. Un nifioeon un IQ de 110 no es 10 puntos mas inteligente que un ninocon un IQ de 100, pero s1podria haber obtenido 10 puntos mas. Asimismo, Crist6bal podriapreferir las "chispas" de chocolate delpaquete A a las del paquete B con una frecuencia dosveces mayor, pero esto no implica ,necesariamente que Ie gustan dos veces mas. Am radicaun punto >importante: la forma como decidimes medir un resultado define el nivel de medi-ci6n de ese resultado. Una frecuencia dos veces mayor es una variable en el nivel de raz6n,pero que tanto Ie gustan las "chispas" de chocolate a Crist6bal es una actitud y POI'tantouna variable de naturalezaordinal.La mayorla de los investigadores se toma ciertas libertades al tratar variables ordinales(como los puntajes en una prueba de personalidad) como variables en el nivel de intervalo,y no hay problema en tanto recuerden que l'OSintervalos podrian ser (y probablernentesean) desiguales. AI interpretar sus datos, eSDSinvestigadores deben tener en cuenta taldesigualdad.

    Tambien, hay que tener presente que la tipologta de niveles de medici6n de Stevens nose ha escapado de ser cuestionada. En l'OS50 anos que tiene de existencia esta rnetodologia,han surgido varias dudas acerca de la utilidad del sistema y de que tan bien refleja las va-riables del mundo real que IDSinvestigadores deben evaluar (Velleman y Wilk'OnSDn,1993).

    Primordialmente, dichas criticas se concentran en el hecho de que una variable podriano ajustarse facilmente a ninguna de las cuatro clasificaciones, sin POI'ello dejar de ser va-liosa. PDr ejemplo, si bien la inteligencia no es una variable en el nivel de raz6n (nadie ca-rece totalmente de ella), ciertamente esta mas alla del nivel de intervale en sus aplicacio-nes de la vida real. En otras palabras, Is. taxonomia podria ser demasiado estricta paraaplicarse a datos del mundo real. AI igual que tantas otras cosas en el mundo de la investi-gaci6n, esta taxonomia de cuatro niveles es un punto de partida con el que se puede traba-jar pero que no tiene que obedecerse C'OmDna ley.

    Conliobilidod y vclidez:par que son importantesPodemos tener el autornovil mas llamativo del camino, pero si las ruedas estan oval a -das podemos olvidarnos de un buen manejo y un paseo comedo. Los neumaticos, el puntodonde "elcaucho toea el camino", son cruciales.

    Del mismo modo, podemos tenen la pregunta de -investigacion mas imaginativa delmundo, con una.hipotesis bien definida y claramente expresada, pero si las herramientasque-ueamos para medir el comportarniento que deseamos estudiar son defectuosas, pode-mos olvidarnos del wto. .La confiabilidad ('0coherencia) y la validez (las cualidades de hacelo que debe, hacer) de un instrumento de medici6n son indispensables, ya que Ia ausencia deestas cualidades podria explicar POI'que actuamos incorrectamente al aceptar 0 rechazarnuestr.a hipbte.sis demvestigaci6n ..:.H'Orejemplo, usted ..podria .estar. estudiando el efecto de cierto programa de adiestra-miento sob.re las.habilidades verbales. de ninos con un leve retraso mental, y esta usandouna-prueba mtya!(X)nfiabilidady validez es dudosa. Supongamos POI'el momento que el tra-tamiento ..en verdad funeiona bien y podria ser.la raz6n de que haya diferencias significati-vas en las habilidades verbales de los grupos que reciben el tratamiento, en comparaci6ncon las de l'OSgrupos que no 1'0reciben. Puesto que el instrumento que usted esta usandopara evaluar las habilidades verbales no es siempre 1'0suficientemente sensible como paracaptar los cambios en la conducts verbal de los nifios, puede olvidarse de detectar diferen-cias e8''8USresultados POI'mas bueno que sea el tratamiento (y POI'solida-que sea su hipo-tesis) ..Con eso en mente, recuerde: las herramientas de evaluacion deben ser confiables yvaIidas; de 10 contrario, la hip6tesis de investigaci6n que usted rechace podria sen correctaiYusted nunea 1'0sabra!La confiabilidad y la validez son nuestra primera linea de defensa contra conclusionesespurias e incorrectas. Si el instrumento falla, todo 1'0demas falIa tambien, Pasemos ahoraa un tratamiento mas detallado de la confiabilidad y la validez, que son y como funcionan.

    Copifulo 5: Medici6n del comportamiento

    Laconfiabilidad y 1 0validez soncarocteristicosdistintivosde unabuenamedici6n.

    117

  • 5/10/2018 Muestreo y generalizabilidad

    21/33

    La conhobihdodconsiste tanto en unpuntaje verdadero

    como en un puntaje deerror.

    11 8

    Una definicion conceptual de la conlicbilidcdAqui vamos otra vez con otro jUlilgode sinonimos, i,Que tal fiable, consistente, eatable, fiel,predecible, fidedigno?'lCapta laidea? Algo que.es eonfiable funcionara en el futuro como 1 0ha hecho en el pasado. Una prueba 0medida de conducts confiable puede medir la mismacosa mas de una vez y producira el mismo resultado.Podemos usar cualquiera de los sinonimos anteriores de la palabra confiable como defi-nicion inicial, pero es importante entender prirnero la teoria en que se basa la eonfiabili-dad. Por tanto, comencemos con el principio.Cuando hablamos de .cenfiabilidad, hablamos de puntajes. El desempefio de cualquierpersona respecto a cualquier variable consiste en un puntaje formado por tres componentesclaramente definidos, como se muestra en la figura 5.1.

    Errorde rnelodoPuntojeobservodo = Puntojeverdodero + Puntojede error ./

    ~ Errorde rosgo

    Figura 5.1 Cornponenres de 1 0 conhobilidod. EI puntoje verdadero y el puntoje de error son 1 0 5componentes primarios.

    Primero esta el pun~e observado. Este es el puntaje que usted registraria (u obser-varia) realmente en una situacion de investigacion. Es el numero de palabras, correctas e~una prueba, el numero de silabas memorizadas, el tiempo que toma leer cuatroparrafos deprosa 0 la velocidad de respuesta. Puede ser la variable dependiente de su estudio 0 cual-quier otra variable que se este midiendo. Cualquier puntaje observado consiste en los otrosdos componentes: puntaje verdadero y puntaje de error.El segundo COrriponente,qi!l'pun~e, verdadero, es un reflejo perfecto del valor verda-dero de esa varieble; descontando cualesquier otras influencias intemas 0 extemas. Enotras palabras, una persona dada tiene un solo "puntaie verdadero" respecto a una variableen particuler, Si se . realizan mediciones repetidas podrian obtenerse varios valores parauna variable, pero el valor. verdadero sole es uno. Sin embargo, nunca podemos determinarcual es ese valor, i,For que? En primer lugar, porque Iamayorparte de las variables, comomemoria,' inteligencia, agresion e incluso estatura (somos mas.altos en la manana, ya quenuestra columna, vertebral se comprime a.medida que avanza el dia) no se ..pueden medirdirectamente; yen segundo lugar, porque.el-proceso de medicion es impellfecfo.:' ~.No obstante, el proceso de medici6n siempre supone que. existe un puntaje verdadero.Por ejemplo, -respecto a una variable oomola inteligencia, cada- persona tiene un puntajeverdadero que reflejll' exactamente (y te6ricamente) el-nivel de inteligeneia de.esa-persona,Supongamos qlle. por alguna. magia el verdadero puntaje de inteligencia1de usted 'es 110. Sientonces.se le.administra a usted una prueba de inteligencia y.obtiene un. puntaie.observa-do de ,U3; la prueba habra sabreestimado.su cociente de inteligeneia, -Sin embargo, dadoque el puntajeverdadero es un concepto.teorico, no hay-forma de saber-eso.

    EI tercer componente enla figura 5.1 es el pun~e de error, que abarca todas esasra-zones por las que el puntaje veedadero y el puntaje observado difieren. Por ejemplo, Miguelpodria escribir 85 de 100 palebrasreorrectamente en una.prueba deortografie, ..i,Significaesto.queiMiguel "tiene una ol'tografia' 85% corrects" todos los diu y en.todosdos exltmenesde ortografia?'Pues no. Lo que. si~ifica.es que' este dta, en esteexamen, Miguel escribi6 co -rrectamente 85 palabras de 100. Quiza manana, eon un conjunto diferente.de 100 palabras,Miguel escribirla 87 0 90, 0 ineluso 100;,correctarnente. Tal vez, si pudiera medirse su uer-dadera capacidad para escribir -eorrectamente, seria 88. i,Por que las diferencias entre supuntaje verdadero (88) y su puntaje observado (85)? En una palabra, error. Tal vez no estu-

    Melodos de invesligacion

  • 5/10/2018 Muestreo y generalizabilidad

    22/33

    dio tanto comodebia haberlo hecho, 0quiza no se sentia bien. Quiza no pudo escuchar cla-ramente al profesor dictar cada palabra. 'Tal vez las instrucciones respecto is donde debiaescribir las palabras en el formate de examen no estaban cIaras. Tal vez se Ie rompio el la-piz. QuizA,quiza, quiza .... 'lbdas son fuentes de error.'Ibdas estas posibles explicaciones ponen de manifiesto que los puntajes repetidos paracasi cualquier variable regularmente son diferentes entre si, ya que el rasgo que se estaevaluando cambia de momento a momento, y el instrumento que se esta usando puedecambiar (aunque sea muy poco)y no es perfecto (ningun instrumentode medicion 10 es).

    eQue constituye los puntajes de error?Vayamos mas alla del concepto general de puntajes de error. En la figura 5.1 vemos tam-bien que los puntajes de error se componen de dos elementos que ayudan a explicar por quedifieren los puntajes verdaderos y los observados,El primer componente de los puntajes de error se denomina error demetocio. Esta es

    la diferencia entre el puntaje verdadero y el observado que se debe a la situacion de prue-ba. Por ejemplo, digamos que usted esta a punto de presentar un examen en su clase de in-troduccion a la psicologia. Usted ha estudiado bien, ha asistido a los r~pf.lSO,t;;siente con-fianza en que conoce el material. Sin embargo, cuando usted se sienta parapresentar elexamen, ve que hay preguntas de igualar (cual elemento de la columna A va con que ele-mento de la columna B) y preguntas tipo crucigrama, jy usted estaba esperando preguntasde opcien multiple! Ademas, las instrucciones acerca de como igualar elementos no estanclaras. En lugar de alcanzar su pleno potencial en el examen (0 lograr un puntaje 10 mascercano posible a su puntaje verdadero), usted obtiene un puntaje menor. El error entre losdos puntajes se debe al metodo de medicion, las instrucciones pococlaras, y dernas.El.segundo componente es ,el error de rasgo. Aqui, la razon de la diferencia entre los

    puntajes verdadero y observado es .caractezistica de.Ia persona que esta presentando laprueba. Por ejemplo si usted olvide sus anteojos y no puede leer los problemas, 0 si no es-tudio, 0 si simplemente no entiende el material, la fuente de la diferencia entre el puntajeverdadero (1 0 que usted real mente sabe si ninguna 'otra cosa inte'rviene) y 1 0 que usted ob-tiene en la prueba (el puntaje observado) es resultado de errores de rasgo.En-la tabla 5.2'se listan algunos ejemplos de fuentes Importantes de error que puedenafectar los puntajes' en las pruebas de Una prueba a 'otra, Cuanto mas influyen estos facto-

    res, menos exectaes la..medicion. 'Es decir, cuanto mas mfluyenlos factores, menos proba-ble es que .el puntaje observado se acerque 10 mas posible al puntaje verdadero, que es elobjetivofinal.Muy' bien, usted ha sido consecuente y ha seguido leyendo esto, pero lQue tienen que

    ver los.componentesdel error con la confiabilidad?'8encillamente; que cuanto mas se puedeacercar una prueba 0 instrumento de medieion al puntaje verdadero, mas confiable es eseinstrumento. lComo nos acercamos mAs?-Reduciendo las porcienesde error de la ecuacionde la figura 5,1;' ~Ilto:,ces, coneeptualmente, lai conflabilidad-ea Un eociente, como se mues-tra en la figura 5.2. Aqui podemos ver que, a medida que el p~~taje de error se reduce, elgrado deeonfiabilidad aumenta yse acerca a :t{)E~,un"~Undo~~ectol 'no habria error y laeonfiablidad.seria 1, yaque el puntajereal seria igual al"pUl'}taje,dbServado. Asimismo, amedida que el 'error aumenta, la confiabilidad disminuye 'poi-quemas de 1 0 quese observaBe debe a algo queno puede predecirse con mucha exactitud: las contribuciones camhiantesdelos errores de rnetodo y de rasgo.

    PuntojeverdoderoConhob ihdod =-----.;__------Puntojeverdodero + Puntojede error

    f"..,..a 5.2 Formulaconceptual paro Ia conhobll ldod.

    Capitulo 5: Medici6n del comportamiento

    Tonto el error de r0590como el de metodocontribuyen a Ia faltade conhob.lldod deuna pruebo.

    119

  • 5/10/2018 Muestreo y generalizabilidad

    23/33

    120

    Nivel de hoblhdodHabilidod pora presenter pruebos Habilidad pora entender instrucciones

    Nivel de habilidod en relaci6n can el rosgoque se evolooHabilidades pora presenter pruebos especificaspora elt ipo de reactivos de 10pruebo

    SoludFatiga

    tv'.otivaci6nTensi6n emocionalAmbiente de 10 pruebo

    Condiciones de 10 pruebo Interacci6n entre el ex'aminador y el sujetode 10prueboPredisposici6n en 10 collhcocionSuerte (jen serio!1

    Tabla 5.2 Fuentes de error en 10 coohoblhdod. EI error puede ser porte del rnetodo empleodo poraevaluar 1 0 conducta 0de 1 0 persona 0rosqo que se est6 evaluondo.

    Como oumentor 1 0 conhcbilidodLa confiabilidad esta intimamente relacionada con el puntaje verdadero y el de error. Dadoun puntaje verdadero fijo (10 que siempre es el caso, lno?), la confiabilidad disminuye amedida que el componente de error aumenta. Por tanto, si queremos un instrumentoconfiable, tenemos que reducir el. error. No podemos afectar el puntaje, verdadero directa-mente, asi que minimizamos las fuentes de error externas (tener instrucciones. claras y as-tandarizadas, traer.mas de un lapiz en caso de que se rompa la puntilla.de-uno, asegurarsede que, el recinto sea comodo) que, podamos eontrolar, Tambien hay que esCorzarse por mini-mizar los errores de rasgo (hacen que los sujetos duerman bien la noche anterior, posponerla evaluaci6n si alguien no se siente bien, etcetera).

    He aqui un resumen de algunas Cormas importantes de aumentar la confiabilidad.,

    1. Aumentar el numero de reactioos u observaciones. Cuanto mayor sea la muestra deluniverso de conductas que usted esta investigando, mas probable sera que la muestrasea representativa y confiable.

    2. Elimine los reactivos poco claros. Un reactivo poco claro no es confiable porque algunaspersonas responderan a el de una manera y otros responderan de forma distinta.

    3. Estandarice las condiciones en las que se administra La prueba. Si los alurnnos de cuar-to afio tienen que presentar una prueba de aprovechamiento mientras hay maquinariaruidosa en operaci6n justo afuera de la ventana del sal6n, 0 la calefacci6n esiA dema-siado alta, ciertamente podemos esperar que tales condiciones afecten el desempedo, ypor ende Ia confiabilidad.

    4. Modere la facilidad y dificultad de las pruebas. Cualquier prueba que es demasiado di-ficil 0 demasiado facil no refleja con exactitud el desempedo del sujeto.

    5. Minimice los efectos de sucesos externos . Si ocurre un suceso de especial importancia-sean las vacaciones de primavera, la firma de un tratado de paz, el retiro de un miern-

    Metodos de investigoci6n

  • 5/10/2018 Muestreo y generalizabilidad

    24/33

    bro academico importante, etc.- cerea del momento en que se administra la prueba,posponga I s evaluaci6n. Ell demasiado probable que tales sucesos acaparen la aten-dIm a expensas de un desempefio real.6. Estandarice las instrucciones. Guillermo en una clase y Cecilia en otra deberan estarleyendo instrucciones identicas y deberan presentar la prueba en exactamente las mis-mas condiciones.7. Mantenga procedimientos de calificacion. coherentes. Quienquiera que haya calificadouna pila de examenes tipo ensayo le dira que leer el primero es muy distinto de leer elUltimo. Procure ser consistente al calificar, aunque esto implique usar una hoja quetenga puntajes en una columna y criterios en la otra.

    Como se rnide la conliobilidodUsted conoce a los cientificos: les encantan los numeros, No debe sorprendernos, entonces,que se utilice un concepto estadistico muy util y facil de entender llamado correlaci6n (y lamedida de la correlaci6n, el coeficiente de correlaci6n) para medir la confiabilidad. Ustedaprendera a calcular el coeficiente de correlacion en el capitulo 9. Las correlaciones se ex-presan como un valor numerico que se representa con una r minuscule. Por ejemplo, la co-rrelaci6n entre la prueba 1y la prueba 2 se representaria como

    rpruebal prueba2Por ahora, 1 0 unico que usted necesita saber acerca de la correlaci6n y la confiabilidades que cuanto mas similares sean los puntajes en terminos de cambio de un momento aotro (de una prueba a otra), mayor sera la correlaci6n y mas alta la confiabilidad. La con-fiabilidad es cuesti6n del.instrumento, no del individuo.Por .ejemplo~como pronto veremos, una forma de medir la confiabilidad de una pruebaes administrar laprueba a un grupo de personas en unpunto dado del tiempo y luego ad-ministrar la misma prueba al mismo grupo de personas en un segundo punto del tiempo,digamos cuatro meses despues,Aho~ bien, pueden suceder varias cosas cuando se tienen dos juegos de puntajes. Esposible que el puntaje de todo mundo baje del tiempo 1 al tiempo 2, 0 que suba. En amboscasos, si los puntajes lti~nden a cambiar de forma similar y en la misma direcci6n, la corre-laci6n'tendera a ser positive y la confiabilidad sera alta. .Por otra parte, "que tal si las personas que obtienen puntajes altos en el tiempo 1 obtie-nen puntajes bajos en el tiempo 2, .0 las ~Jl!Onas que obtienen puntajes bajos en el tiempo1 obtienen puntajes altos en el tiempo 2? Entonces la confiabilidad no seria buena; masbien, seria b~a 0mexistente porque no hay coherencia en el desempefio entre el tiempo 1 yel tiempo 2 . En general, cuando los puntajes en la primera administracion permanecen enla misma posici6n relatiua en la segunda (altos en la prueba 1 y altos en la prueba 2, porejemplo), la co~abilidad de la prueba sera sustancial . .Los coeficientes de confiabilidad(queson mas 0menos la misma cosa que los coeficientes de correlaci6n) varian entre -1.09y 1.00. Un valor de 1.00 seria una confiabilidad perfecta, donde no hay ningun error en elprocesode medici6n. Las pruebas estandarizadas que se usan en )amayor parte de los pro-yectos de investigaci6n y que veremos en el siguiente capitulo suelen tener coeficientes deconfiabilidad del orden de 0.80 a 0.90.

    Tipos de conliobilidodLa confiabilidad es-un concepto, pero tambien eauna medida practica de que tan consis-tente y eatable podria ser un instrumento.de: medicion 0 una prueba. Hay varies tipos deconfiabilidad, cada uno para un prop6sito distinto. A continuacion estudiaremos esos tiposy la forma 'en que se usan. En la tabla 5.3 se muestra una comparaci6n y un resumen de lain formacion .

    Capitulo 5: Medici6n del comportamiento

    L a c o nh ob ilid od amenudo se rnideulilizondo coelicientesde correloci6n.

    121

  • 5/10/2018 Muestreo y generalizabilidad

    25/33

    La conhob il idod depruebo original y

    repeiido examina 1 0conhobilidod con el

    liempo.

    La conl iob il idod deIorrnos porolelos

    examina 1 0conliobilidod enlre

    formoso

    1 22

    Adminislrar 1 0 mismapruebo en dos punlosdel liempo distintos 01mismo grupo depersonas.

    Uno medido de Adminislrar des formasd iie re nte s 0 1 mismogrupo de personas.

    rforma 1 . r forma 2

    Uno rnedido de acuerdo Hacer que dos personascollliquen los conduclasy determinar el gradode acuerdo entre el ias.

    Nurnero deacuerdos/ nornero deobservacianes lolales

    Tabla 5.3 Diferenles tipos de corfiobihdod. S ea cuol sea el lipo de inslrumenlo que usted desee user ,hoy un tipo de medido de 1 0 conliobil idod apropiodo pore usted,

    Conliobil idod de prueba original y repetidaDos sinonimos de confiabilidad que utilizamos al principio de esta seccion fueron consisten-cia 0 estabilidad, La confiabilidad de prueba original y repetida es una medida de que tanestable es una prueba con el tiempo. En este caso se administra la misma prueba 8 .I mismogrupo de personas en dos puntos del tiempo distintos. En otras palabras, si 'se administrauna prueba en el tiempo 1 y luego se vuelve a administrar en el tiempo 2 i.seran estableslos puntajes de la prueba con el tiempo? i.EI puntaje de Jaime en el tiempo 1 cambiara 0 se-ra el mismo que su puntaje en el tiempo 2, relatiuo al resto del grupos?

    Una pregunta importante para establecer la confiabilidad de prueba original y repetidaes cuanto tiempo debe esperarse entre las pruebas, La respuestaa esta pregunta dependedel uso que se le piense dar a los resultados de la prueba y tambien del prop6sitodel estu-dio. Por ejemplo, digamos que usted esta midiendo cambios en la interaccion social de adul-tos jovenes durante su primer afio en la universidad. Usted quiere efectuar una medicionde la interaccion social en septiembre y luego otra en mayo, y Iegustaria saber si la pruebaque usa tiene confiabilidad de prueba original y repetida. Para determinar esto, usted ten-dria que administrar la prueba a los mismos estudiantes en el tiempo 1 (septiembre) y enel tiempo 2 (mayo) y luego correlacionar el conjunto de puntajes. Puesto que a usted no Ieinteresa el cambio en la interaccion social a 1 0 largo de un periodo de dos semanas, estable-cer la confiabilidad de prueba original y repetida en un periodo tan corto no seria util, dadala intencion del estudio.

    Conliobilidcd de formas paralelasOtra forma comun de confiabilidad es la de formas paralelas 0 equivalencia. En este ca-so, se administran diferentes formas de la misma prueba al mismo grupo de personas. Lue-go se correlacionan los dos conjuntos de puntajes. Se dice que las pruebas son equivalentessi la correlacion es estadisticamente sigdificativa.

    i.Cuando querria usted utilizar la confiabilidad de formas paralelas, suponiendo que hacreado (0 tiene) dos formas de la misma prueba? El ejemplo mas comun es cuando se nece-sita administrar dos pruebas del mismo constructo dentro de un tiempo relativamente cor-

    Melodos de invesligaci6n

  • 5/10/2018 Muestreo y generalizabilidad

    26/33

    to Yse desea eliminar la influencia de los efectos de la practica sobre los puntajes de losparticipantes.Por ejemplo, digamos que usted esta estudiando la memoria a corto plazo. Usted lee

    una lista depalabras a los sujetos y les pide recitar 10 que puedan recordar diez minutosdespues. Tal vez seria necesario repetir este tipo de prueba cada dia durante siete dias, pe-ro ciertamente no podria usarse la niisma lists de palabras cada dia. Si asi se hiciera, parael ultimo dia los sujetos sin duda habrian memorizado una buena parte de la lista como re-sultado de la repeticion, y la prueba proporcionaria poca informacion acerca de la memoriaa corto plazo. Lo que usted haria es disenar varios conjuntos de palabras que en su opinionson equivalentes entre si; luego, si pudiera establecer que son formas paralelas de la mis-rna prueba, podra usarlas cualquier dia y esperar que los resultados del Dia 1 sean equiva-lentes a los resultados del Dia 2.

    Conlicbilidod intercolilicodoresLa confiabilidadde prueba original y repetida y la de formas paralelas son medidas de queta n coherente es una prueba a 10 largo del tiempo (prueba original y repetida) y de una formaa otra (formas paralelas). Otra forma de confiabilidad es la confiabilidad intercalificadores.La confiabilidad intercalificadores es una medida de la consistencia de un califica-

    dora otro, mas que de un tiempo a otro 0 de una prueba a otra. Por ejemplo, digamos queusted esta realizando un estudio que mide la agresion en nifios de edad preescolar. Comoparte del estudio, usted esta adiestrando a varios de sus colegas para recabar datos conexactitud, Usted ha ideado'una "escala de 'calificacion"que consiste en una lista de diferen-tes conductas en las que participan los nifios, numeradas dell al 5, cada una de las cualesrepresenta un tipo distinto de comportamiento, comose muestra en la tabla 5.4.

    Jugor solo sin interoctuor can otro ninoJugor junto can otros nii ios en 1 0 mismo ocnvidodGolpeor fisicomente 0 otro nino sin provococi6nGolpeor fisicomenle 0 olro nino can provococi6n

    Tabla 5.4 Losconductos pueden ogruparse en cotegorios y luego utilizcrse poro regislrar objelivomenlesufrecuencio, pero 1 0 conliobi lidod es ton imparlonle paro este coso como paro cuolquier olro close demedici6n.

    Comopuede ver, la conducta numero 1 de la lista se denomina hablar y se define como"interaccionverbal conotro nino". Laconducta 4 de la lista se denominagolpear 1 y se defi-necomo"golpear fisicamente otro nino sin provocacion". No estan muy complicadas las de-finiciones,l,verdad? Parecen funcionales y objetivas.l,Pero quien puede saber si incluso conestas definicionesEsteban yAndrea (los dos calificadores) van a clasificar de manera iden-tica los comportamientos 'que observan? lQue tal si Andrea ve que Julia golpea a Isabel ycJasificaesa 'condueta comonumero 4, pero Esteban la clasifica comonumero 5 porque vioa Isabelgolpearprimero a Julia? Estamos en problemas. Los caliticadores deben ser capa-cesde calificar ycolocar'Ios sucesos en Iamisma categoria.Para tener Ia seguridad de-que todos los calificadores estan de acuerdo, es preciso esta-blecerla confiabilidad intercalificadores. Ello se logra haciendo que los calificadores basen

    Copitulo 5: Medici6n del comportamiento

    La conliobilidod entrecollhcodores examina1 0 conliobilidod de uncol ii icodor a otro.

    123

  • 5/10/2018 Muestreo y generalizabilidad

    27/33

    el puntaje en un comportamiento y examinando despues el porcentaje de acuerdo entreellos. Digamos que usted hace que Andrea y Esteban califiquen la conducta de un nino 'cada 10 segundos mientras usted los adiestra en el uso de la escala de calificacion, Su patronde elecciones podria ser parecido al que se muestra en la tabla 5.5. Para ealcular su COMabilidad intercalificadores, basta con tomar el numero de acuerdos y dividirlo entre el totalde periodos calificados (20 en este ejemplo). En su calificaci6n antes del adiestramiento S Eobtiene una confiabilidad intercalificadores de 15 (el numero de acuerdos) dividido entre 2C(el numero de posibles acuerdos), que es .75 0 75%. Despues del adiestramiento, como pue-de verse, el valor ha aurnentado a 18/20 =.90 0 90%, que es muy respetable.

    Tabla 5.5 Conliobthdod intercalificadores antes y despues del adiestramiento. EI adiestramiento es 1 0clave si se pone atenci6n a los ospectos importantes de 1 0 observaci6n.

    "En que consistio el adiestramiento? El director del proyecto probablemente detect6d6nde estaban los errores de clasificaci6n equivocada, modific6 la definicion de las conduc-tas y analiz6 ejemplos con los calificadores. En la tabla 5.5 puede verse que el problemamas frecuente eran desacuerdos entre las calificaciones de una conducta numero 4 y unanurnero 5, que son tipos de conductas de golpear. Aqui es donde se aclararian las diferen-cias entre los juicios de los calificadores.

    Las consecuencias de una confiabilidad intercalificadores baja pueden ser graves. Siuno de los calificadores clasifica mal 20% de las ocurrencias, esto significa que 20% de susdatos podria ser err6neo, y eso pod ria echar todo a perder.

    Consistencio interno

    Aunque 1a consistencia interns es una forma de confiabilidad que se estab1ece con me-nos frecuencia, usted, como investigador principiante, debe saber de que se trata. La con-sistencia interna examina que tan unificados estan los reactivos en, una prueba 0 evalua-cion. Por ejemplo, si usted esta administrando unaprueba de, personalidad que contiene100 reactivos distintos, es deseab1e que todos esos reactivos.esten relacionados. entre. si. en1a medida en que e1modelo 0 teoria en que se .basa la prueba considere que cada uno de los100 reactivos refleja e1 mismo constructe de personalidad.basico, Del mismo modo, si ustedva a administrar una prueba de 100 reactivos dividida en cinco diferentes subescalas, cadauna de las cuales consiste en 20 reactivos, cabria esperar que la prueba tenga consistencia

    124 Metodos de investigaci6n

  • 5/10/2018 Muestreo y generalizabilidad

    28/33

    interna si los 20 reactivos dentro de cada subescala tienen una relacion mas cercana unoscon otros que con los reactivos de cualquiera de las otras cuatro subescalas. Si asi es, cadauna de las subescalas tiene consistencia interna.La consistencia interna se evalua correlacionando el desempefio en cada uno de losreactivos de una prueba 0 escala con el desempefio total en la prueba 0 escala, y adopta la

    forma de un coeficiente de correlaci6n.

    Como establecer la conliobilidod: un ejemploUno de los mejores lugares para buscar estudios de confiabilidad es en el anuario The Men-tal Medu,.em.entS ~a':book"(Conoley &Kran'ler, 1989), un compendio deresumenes y rese-fias de pruebas q~e ~~tlmdisponibles. tn esas resefias, a menudo se describe y se comentala forma enque se estllbleci61a confiabilidad.Por ejemplo, la ~ultidimensional Aptitude Battery es una prueba general de aptitud 0inteligencia' para adultos que se puede calificar objetivamente y que adopts. la forma dediez puntajes de subpruebas, cinco verbales y cinco de desempeno. Los autores de la prue-ba calcularon varios tipos de confiabilidad, incluidos coeficientes de correlacion de pruebaoriginal ~ repetida,. que variaron entre .83 y .97 para.la escala verbal de la.prueba y en-tre .87 y .94 para-laescala de desempefio. Los autores.tambien calcularon ot,rpsindices deconfiabilidad que dan cierta indicaci6n de que tan homogeneas a unidimensionales son lasdistintas pruebas. En otras palabras, se determin6,que las pruebas evaluaban de maneraconsistente s610una dimensi6n de aptitud 0 inteligencia, Si bien los resultados de estos es-tudios de confiabilidad no nos emocionan terriblemente (aunque si a los autores de la prue-ba), es informacion crucial que un usuario en potencia tienenecesidad de conocer y que elautor de cualquier prueba necesita establecer para que la prueba sea util.

    Val idez;.Recuerda que al principio del capitulo mencionamos dos canacteristicas indispensables deuna buena prueba? La primera es que sea confiable, y es 10que acabamos d-ever; la segun-da es que sea valida, 0 que la prueba mida 1 0 que se supone que debe medir.

    Definicion conceptual de volidezi,Recuerda la consistencia, la estabilidad y la predecibilidad (entre otros sin6nimos de con-fiabilidad)? "Que tal ueracidad, exactitud, autenticidad, genuinidad y solidez como sin6ni-mosde valide,z?Estos terminos describen de que se trata la validez: de que la prueba 0 elinstrumento que se esta usartdo realmente mida 10que ustednecesitamedir;Cuando listed ve eltermino validez, una 0 m as de tres cosas Ie deberan venir a la menteacerea de la definici6n y el uso del tertnino.Tenga 'presente que la validez de un instrumen-to a menudo se define dentro del contexto de c6mo se esta usando la prueba. He aqui lostres aspectos de la validez.Primero, la validez se refiere a los resultados de una prueba y no a la prueba misma.Por tanto, si tenemos la prueba ABC de habilidades sociales, los resultados de la pruebapodrian ser validos para medir la interaccion social en adolescentes, Hablamos de validezs610a la luz de los resultados de una prueba.Segundo, al igual que la confiabilidad (aunque la validez no se cuantifica tan facilrnen-OO),1aalidez nunea es una euesti6n de "todo 0nada". Los resultados de una prueba no sonsimplemente "validos" 0 "no validos". Esta progresi6n ocurre en grados desde escasa vali-dezbasta mucha validez.

    Capitulo 5: Medicion del comportomiento

    La volidez es 1 0cuoltdcd de unopruebo que haceaquello para 1 0 cualse diseno.

    125

  • 5/10/2018 Muestreo y generalizabilidad

    29/33

    126

    Tercero, la validez de los resultados de una prueba se debe interpretar dentro del contex-to en el que ocurre la prueba. Si no fuera asi, cualquier cosa podria considerarse valida consolo darle otro nombre. Por ejemplo, he aqui un reactivo de una prueba de 100 reactivos.

    2+2=?Casi todos nosotros reconoceriamos que esta pregunta tiene validez como medida de la ha-bilidad para sumar. Pero si utilizamos la pregunta en un experimento que se concentra enlas habilidades para multiplicar, el reactivo pierde su validez de inmediato.

    La forma de examinar la validez de una prueba, entonces, es determinar si la prueba seconcentra en los resultados de un estudio y si los resultados se entienden dentro del contex-to del proposito de Ia investigacion.

    AI igual que con la confiabilidad, .hay varios tipos de vaJidez que usted encontrara ensus actividades de investigacion. Desde luego, usted tendra que considerar la validez cuan-do Begue el momento de seleccionar los instrumentos que piense usar para medir la varia-ble dependiente que Ie interesa.

    En la tabla 5.6 se presenta un resumen de los diferentes tipos de validez, que significany como se establecen.

    Una medido de que tan bienlos reactivos repre_ntan eluniverso entero de reactivos.

    Pregunte a un experto si losreactivos evalUan 10que ustedquiere que evoluen.

    iDe criterio'Concurrente Uno medido de que tan bien

    uno prueba estima un criterio.

    Uno rnedido de que ton bienuno prueba predice un criterio.

    Seleccione un criterio ycorrelocione los puntojes en 10prueba con los puntojes en elcriterio en el presente.

    Seleccione un criterio ycorrelacione los puntojes en 1 0prueba con los puntojes en elcriterio en el futuro.

    \ .De con~trvcta Uno rnedido de que ton bien

    uno prueba evalUa olqunconstructo subyocente.

    Evoloe el constructo subyocenteen el que se basa 1 0 prueba ycorrelocione estos puntojes conlos de 1 0 prueba.

    ,.01

    De consiStenciG interna Uno medido de 10consistenciocon que codo reactivo mde elmsmo constructo subyocente.

    Correlacione el desernpeno encoda reactivo con el puntoje totoIde 1 0 prueba.

    Tabla .5.6 Tipos de volidez. AI igual que en el coso de 1 0 conliobilidod. hoy un tipo apropiodo paro suinve:;tigoci6n.

    Tipos de volidezHay cuatro tipos de validez, cada uno de los cuales sirve para establecer la veracidad de losresultados de una prueba 0 una herramienta de evaluaci6n.

    Metodos de investigaci6n

  • 5/10/2018 Muestreo y generalizabilidad

    30/33

    Validez de contenidoEI tipo de validez mas directo y sencillo es la validez de contenido. La validez de conte-nido es el grado en que una prueba representa el universo de reactivos del cual se extrajo yes util sobre todo para evaIuar'la utilidad de las pruebas de aprovechamiento 0 pruebasque muestrean un area de conocimientos en particular,

    i,Por que solo una muestra? Porque es imposible crear todos los reactivos que podrianescribirse. [Nada mas piense en la magnitud de'Ia tarea! Imagine escribir todos los posiblesreactivos de opci6n multiple sobre el material cubierto (no necesariamente contenido) enun libro de introduccion a la psicologia. Debe haber un millen de reactivos que concebible-mente podrian escribirse sobre los dominios de personalidad, percepci6n, 0 nada mas lapersonalidad. [Podria cansarse nada mas de pensar en ello! Es por eso que muestreamos deentre todos los reactivos que podrian escribirse,

    Pero regresemos aI mundo real. Digamos que usted se esta ocupando de los cursos dehistoria de segundo de secundaria y I~ unidad trata el descubrimiento de Norteamerica ylos viajes y peripecias de varios gran des exploradores europeos. Si usted fuera a crear .unexamen de historia con preguntas acerca de este periodo y quisiera establecer la validez delas preguntas, podria rnostrarselas a un experto en la historia de America y preguntarle:"i,Estas preguntas representan .conjusticia el universo 0 dominio de la historia de Americaen la Era de 'losd~~~ubrimientOs?"No es necesario que usted utilice palabras dominguerascomo"universo'ly "dominic", pero ~.inecesita sa~, si ha cubierto 1 0 que ;necesita cubrir,Si sus preguntas son apropiadas, ya tiene la muestra de preguntas que prueba los cono-

    cimientos de un estudiante de segundo de secundaria en el area de la historia de Americaen la Era de los descubrimientos. Felicitaciones. Eso es validez de contenido.

    volidez de criterioLa validezde criterio se ocupa de que tan bien una prueba estima el desempeii.o actual(llamada valide~concurrente) as! como de que tanbien predice el desempeii.o futuro (lla-mada validez predictiva). La validez de criterio es una medida del grado en que unaprueba esta relacionada con algun criterio. Es de suponer que el criterio con el que se estacomparando la prueba tiene alg6n valor intrinseco como medida de alg6n rasgo 0 caracte-ristica. La validez de criterio generalmente .sirve -para evaluar Ia validez de las pruebas decapacidad (habilidades actuales) y de aptitud (habilidades potenciales).En ambos tipos de validez de criterio, se usa un criterio como medida de confirmacion.

    Por ejemplo, digamos que usted desea investigar el uso de las calificaciones en los estudiosde posgrado para predecir cuales integrantes del programa de psicologia clinica van a tenermuchoexito como investigadores.' Para ello, usted localiza una muestra de "buenos" inves-tigadores ~tomando como crtterie-para definir "bueno" el numero de arnculos publicados enrevistas cientdficas en los ultimos ,20 aii.os~Luego, usted averiguazia que caJ.ificaciones ob-tuvieron esos investigadores cuando eran ,estudiantes de posgrado, y -que tan bien su. de-sempeii.oacademico (0 calificaciones) predijo su pertenencia al grupo de investigadores"buenos". Quiza -sezia conveniente tambi,en localizar up grupo de investigadores "males"(aquellos-que nQIhan publicado nada) : y determiner que tan bien las cahfieaciones en susestudios de posgrado predijer.on su-pertenencia al grupo de los"malos". En este caso, las ca-Iificaciones.en Ios.estudios ;de posgrade tendeian validez predicriva (del exito como dnvesti-gador)si dichas calificaciones (Ia prueba) tienen una buena correlacion con el .desempenocomoinvestigador (el criterio).Esto suena bonito 'Y muy claro, pero i,quien va a 'juzgar el valor del criterio? i,EI nurnerodearticulos publicados hace que un investigador sea eficaz? i,Que tal si 90% de los articulospublicados por un investigador aparecen en una revista que tiene una tasa de rechazo de50%,y otro investigador ha publicado un solo articulo pero en una revista cuya tasa de re-chazoes de 90%? i,Y que tal si ese unico articulo que aIguien publica tiene un efecto sig-nificativoy profundo sobre la direcci6n que seguiran las investigaciones futuras en esa disci-plina?AI igual que con cualquier otro bloque de construccion del proceso de investigacion, el

    Capitulo 5: Medici6n del comportomiento

    A menudo seusa laopini6n de expertospara establecer lavolidez del conrenido.

    Un tipo de volidez decriterio, Ia volidezpredictive. nos permitesaber que tan bien unapruebo predice eldesernpeno futuro.

    127

  • 5/10/2018 Muestreo y generalizabilidad

    31/33

    Los pruebos deinteligencio tienen

    niveles elevodos devolidez de constructo.

    criterio que se usa para establecer la validez se debe escoger con alguna justific