153
(, (JI INI ' IW/)( }( '( ' I( N AI, IINAu I DE DATO I I/I ·tlll/ll/¡: un>8t/l 1/ ' 1'11 0 prohibidas, sin la 11111011 , 11 'h /1 (' s<Ti la d, los tit ulares del ( 'U/II'II}';'I, IlflJo I(/ s s(J n ion es e {ab lecidas ' /1 /11 ' II 'VI'.I', 111 1 ' l' l irodll ' 'i6n tolal o /111/ !'lo 1 di ' 1' ,1' /11 ohm Imr ual quier medio "1 1//11'1'11111111 ' /110 , l'O lll pr ' l1 didos la reprografía l' I'/llrIlr/l I/II' lIlu il/Jill'l 1/ 6/i 'O, Y la di stribución d, ' 1 '/1'1/1/1/011'\ rll ' ('11 (/ I/I '( li an/e al qui ler 11/ ' 1, \111/1//1,1 ,mMlm,I ', ti 1 111/ l'I'I.I!tll/I/ Noclol/al el 1 :.'clucaci6n a Dist ancia A 1/1111 ItI (J(J( 1.1/1/1"(11 I/Nh'I : 8mll Muri llo, 38 - 28015 Madr id MI .. ' ( 1 l'JH 75 60 I 7 7 t' 1111111: IlIiI't' IItIC n1 orlll1./l/p cl. e «) , 1/1/111 (,'t/I/ : iW I - 7'I: ilIo, Pau la Lubin Pigouche, José María Merino Me rino, Miguel Padilla , 1'(/11'11' 10 I? ' / aboya y Juan Carlos Suár ez Fa lcón /, ' IIN: ()/ti 8/ ·. M2 -6042-7 /), ' /11 , \11(1 1 1'¡'(d ,' M. 6.464-2009 ¡'II/lIt·/II tI/ti! /l .' ,l'1!¡J li'mbre de 2009 III/¡I/ I·.\'(I 1'11 - Pri l1led in Spain Nl>l H 1, " 11'.'." .••••••.• , ... · .... ·111 •••••••••••• , •• •••••••••••••••••••••••• •••••• ••• •••• •••••••• 11 •••••••• ClN( 'It,p'I'() nÁsl os y ORGANIZACiÓN DE DATO .............. ........ .. 'i 11 ....... . ................................... ............. . d aut valuación ..... .. .............. ........ . 1, '11 'S ........... .. ....... . ........... ......... ........ t ••••• t •••••••• , 11 •• " •••••••• , •• , •• " ••••••••• 11 ,'.' ••• 0111' ••• '1 •••••••••• (', ('I'( ' lelos l' :lU lO 'V' dll ll '1 11 ............................... . 7 H (11 ti

Libro Análisis de datos.pdf

Embed Size (px)

Citation preview

Page 1: Libro Análisis de datos.pdf

( , (JI I()~(;IW I A()I)

INI 'IW/)( }( '( 'I( N AI, IINAu I DE DATO

I I/I ·tlll/ll/¡:un>8t/l 1/ ' 1'110 prohibidas, sin la 11111011 ,11 'h /1 ('s<Tila d, los titu lares del ( 'U/II'II}';'I, IlflJo I(/ s s(J n iones e {ablecidas ' /1 /11 ' II 'VI'.I', 111 1'l'l irodll ' 'i6n tolal o

/111/ !'lo 1 di ' 1',1' /11 ohm Imr ualquier medio " 11//11'1'11111111 '/110, l'O lllpr ' l1didos la reprograf ía l' I'/llrIlr/l I/II 'lIlu il/Jill'l 1/6/i 'O, Y la distribución d,' 1'/1'1/1/1/011'\ rll ' ('11(/ I/I '(lian/e alquiler 11/

'1, \111/1//1,1 ,mMlm,I',

ti 1 111/ l'I'I.I!tll/I / Noclo l/al el 1:.'clucaci6n a D istancia A 1/1111 ItI (J(J(

1.1/1/1"(11 I/Nh'I : .¡ 8mll Murillo, 38 - 28015 Madr id MI .. ' ( 1 l'JH 75 60 I 7 7 t' 1111111: IlIiI't 'IItICn1orlll1./l/p cl. e

«) ~/l11 ,1/1/111 (,'t/I/: iWI-7'I:ilIo, Paula Lubin Pigouche, José María Merino M erino, Miguel Padilla , I/I/II' ~, 1'(/11'11'10 I? ' / aboya y Juan Carlos Suárez Falcón

/, ' IIN: ()/ti 8/·.M2-6042-7 /), '/11 ,\11(1 11'¡'(d ,' M. 6.464-2009

¡'II/lIt ·/II I·tI/ti! /l .' ,l'1!¡Jl i ' mbre de 2009

III/¡I/ I·.\'(I 1'11 ¡ :'S¡)(II~a - Pri l1led in Spain

Nl>l H

1, " 11'.'." .••••••.• , ... · .... ·111 •••••••••••• , •• •••••••••••••••••••••••• • •••••• ••• •••• •••••••• 11 ••••••••

ClN( ' It,p'I '() nÁsl os y ORGANIZACiÓN DE DATO .............. ........ ..

'i 11 ....... . ................................... ............. .

d aut valuación ..... .. .............. ........ .

1, '11 'S ........... .. ....... . ........... ......... ........ t ••••• t •••••••• ,

11 •• " •••••••• , •• , •• " ••••••••• 11 ,'.' ••• 0111' ••• '1 ••••••••••

(', ('I'( ' lelos l ' :lU lO 'V' dll ll ' 1 11 ............................... .

7 ~

H (11 ti

Page 2: Libro Análisis de datos.pdf

!JI ItI 1111 ,111 11 ' 11\""'1'1(1 """"'111"11""'1"1""'""",, 11111 (Id 11 • • (111 H

\, . ' •• , •• "'." •• 1 ••• ' •••• "1""11· ••••••••• ", •••• 1" •• , •• ,1 •••••••• "11111 •••••••••••

M, ti 11, Iv ' U" ti jll 111 1 ........................................... .. 9 1

.. 1. AIIII III1Id lol '" o 1" \11 ro .......... ......... . .

J. .2. Vlu·hnz·J.Y 1 'sv ia ¡ n l f~'i"~":::: :: ::::: : : : :: ::: :: : ::: :: : : :: :::::: : : : : : :: : :: : 92 93

() ,/'1 -¡ 'nl ' i varia ión Ami li l Id ' 11 i-in t Icuar~ii· .. · .. · .. .. .. .. ·· · .. · .... ·· .. · .. · ...... · .... · .. ·· .. ·

IlId l " 1, us im tría d Pearson .. ...... .. ... .. ..... .. ........................... .. t . Plltllu tI ' ¡Ol • típi a

.. ......... ...... ..... .. ............. ... ......... ...... ... .. ..... ... .. .... .... .. ............ ... ...... ... ... ...... ... ... ........

1 \' 11111 ' 11 ........ ... .. .. .... .. .. .... .. .. l o:,¡ ' /" i ' los d \ aU l valuación ...... · ...... · .. · .. · .. · .... · .. · .. · .............. · ...... · .. ..

o lu io n '~ los jercicios de ~~~~·~~~i~~~ió~ .. · .. · .. .... · .. · ...... · ........ ..

Ihll" t. ANÁu sr 1. , . IllI me! ti

ONJUNTO DE DOS VARIABLES

.. .... ...... .................. .

.... .. .. ..... .............. ............

................................ ............... ...... ... .......................................................

'd~' '~~~~~~~i~~;ió~""""""""""""" " """"" " "" " """"" " " a los ejercicios de ~~~~'~~~i~~~ió~""""""""" " "'" ' '' ' '''' ... ............... .......... ...

11 '/1/(/ 5. No IONES BÁSICAS DE PROBABILIDAD , 1 1IIII'OUlI ión .. ............... ....... .. ..................................... .

( ' ............................................................ .. () II " pl previos ............................................ ..

1) /'i 1 ¡ i n de probabilidad ... ......................... .. .............................................................

Pml f.'IbiJidad condicionada 1, \ !' 'glu del producto y el te~;~·~~·d~·B·~;~~ .. · ............ · .. · .. · .. · .. · .... .. I 'S \11 1 11 ... . ... . ....... . ... . ........ . .. . .

1 • • •••••• • • • ••• • • • •••••••••• • ••• • •• •• • • ••••• • •• • •• • •• •• • • ••• • •••• •• •••• • •••••••• • ••••• • ••• • ••

hil'!" ¡ ' 1 de autoevaluación '; ,111 ' ion a los ejercicios de ~~~·~·~~~i~~~ió~ .... · .. · ...... · .. · .. · .. · .. · .. · .. ·

........ ... ....................

11 ' /1/(/ n. I)ISTIUBUCIONES DISCRETAS DE PROBABILIDAD I I I ......................... . • /1 j , '0 ti ' i n .. ............................................................. .................... ..

11 ' " 1 "J I a toria: definición y tipos .... ... ..................................... . ti · Ibl 's 1 a torias discretas

1, \. 1. hIn i n de probabilidad .. · .. · .. · .... ·· .... ·· ........ · .. · .......... .. .... · .... .. ... ...... ... ...... ..... .... ......... ... ... ...... ......

95 101 103 105 107 110 111 113

119 121 122 124 132 139 143 143 147

155 157 158 161 164 166 172 173 176

183 185 186 188 188

I j j()

ti t, H(1I1 , " ....... 111.11......... 1')·1

I

I 1>1 'I'RIIJ'U IONES CONTINUAS DE PROBABILIDAD ... . ..... . ........ ...... ..

l . , ti HlI 'H 1 i 11 nOl~llal ... .............. .. ...... .. .... .. .... ........ ........... ......... .. 1, . I . r t rí ticas y propiedades .. ............................ ... ..... ....... .

t ili zación de las Tablas ... .. ... ... .. ... ....... .. .. .. .... ... .......... ....... . l li ' lograma y distribución Norm al .. ..... .. ... .. ....... ......... ...... . Aproximación de la binomial a la Normal ......... ... ........ .... .

, L 1 1 Islribución «Chi-cuadrado» de Pearson .... .. .... .... .. .......... ..... .. 1, \ 1 istribución «t» de Student ... ..... ........................ .. .......... ..... .... ..

n ...... ... .... ...... .. .. ... .. ........ ... .. .. ................. .. ...... ....... ......... ...... . 1.1 '1' j ios de autoevaluación .... ........... ................... ........ .. ...... ...... ..

o lu i nes a los ejercicios de autoevaluación ......... .... ...... .. .. ... .... .

11'///11 H. ESTIMACIÓN .................................................................... .. . .. . .... ..

l . IIlI r ducción ................................................... .. ........... .. .... ............ .. . 0 11 ptos previos ................................ ............................... .. ... ....... .

H.2. l. Población y muestra .................................................... ........ . H.2.2. Muestreo .... .................... .... .. .. ... ... .. .. ..... .... ........ .. .. ............ .... .

' , In r rencia estadística .................................... .. .... ........ ... ... ...... .. ..... .. E1; ümación de la media ........................................ ...... ............ ....... .. RA.1. Distribución muestral de la media ... .. .... .. .... ..................... .. R.4.2. La media como estimador .... .................................. .. .... ..... ..

, , 1;. timación de la proporción ..................................................... .... . 8.5.1. Distribución muestral de la proporción ... ....... ... ... ............. . 8.5.2. La proporción como estimador ............................ ..... .... .... ..

M,l . Intervalos de confianza ........................................................ ....... ... . 8.6.1. Concepto ......................................................................... ..... .

.6.2. Tamaño de la muestra ................................................... ..... ..

Page 3: Libro Análisis de datos.pdf

III I ,11111 " "" " N Al. ANÁLISIS DE DATOS

H, , . Aplicaciones ........................... .. ............................................. 269 8.6.3 .1. Intervalos de confianza para la media .................. 270 8.6.3.2. Intervalos de confianza para la proporción .......... 274

H, ; , l . 'umen ...... ... .... ........ .. ................... ... ............. .. ............................... 276 H,H, E.l rcicios de auto evaluación .. ....................................... ...... ........... 277 H,t) , luciones a los ejercicios de autoevaluación ........ .. .... ................. 279

1'/'11'1" /1 ia bibliográficas 283

/ JI l/di e: Tablas 285

PRÓLOGO

I I I ni ra ha sido concebida como un libro de texto dirigido a 1 s 'S 11I4

1\ I rimer curso del Grado en Psicología de la Universidad Nn ' 10 Jldu ' ión a Distancia, y ha sido elaborado por el equipo d

I ¡' 11 ' \ ' t ' rf 'ticas de los alumnos a los que va dirigido y la melo 10101 ' 11

1I JlI! tI! I NED hacen que el objetivo del texto no sea tratar nu V'\S 1 v 11 ,'¡'C() ' 1' aportaciones originales sino presentar una seri d ' 0 111 '

, , 1(11' ,' ' 1 U ntran ya en muchos otros libros, de manera la!"l y s ' 11

, l ' ' ntido, hemos tratado de presentar los 0 1 ' ' pi o 111111 I t 1 lit 's s 'guidos de ejemplos concretos aplicados - n 1 1 , 1 i ItI ti '

11,1" \ 1\ Psicología y hemos prescindido de desarron s 11 a l ' tll (

1" 1111 ~' \11 's lri lamente necesarios.

la utilizu ' ¡<'In

lI ' nla ' ()II 1111

tos.

Page 4: Libro Análisis de datos.pdf

, 1, 1I1l0 I los t 'm' ls 0 1 11 ' 1 za 'o n lIn ') intr c.lu i n, d nd S pl" -111 111 los o lj ' ti vos 1\ ' Ipl" ' 11 li z'lj' '1 'ons guir n ' u ludi, y han s fta-

11 lo ' 1111 'rri V\ IO ' l n il s f'unda l11 nla l qu aparec 11 alo largodel t x­lo aclo d n lro d cuadros las fórmulas y definiciones

111 1. 1111 1 OIÜllll", han r allaclo los j mplos y se ha añadido un resu-1IIt ' II. 1 01" ("til ,al, final de cada tema, se presenta un gran número de ejer­( l ' n,', on s IS oluciones correspondientes, que permiten la autoevalua­I 1111 1 ,1 'd In no,

1" 1\ 11 m nL , queremos señalar que este texto es fruto de una amplia , 1 ~I I ' ¡ n ia d I quipo docente. Durante todos esos años han sido muchos

In, 111111'11105 que nos han ayudado a intentar mejorar nuestros textos. A lo lo,' '1Ios nues tro agradecimiento. Los aciertos, si los hay, en este texto se (1 I ' 11 ' t ,11 ,los errores son sólo nuestros.

Los autores, Madrid, marzo de 2009

1 I

'1" ' 111 \

"H S I /\Si ( S.y )1' " U li za i )1

11111 "dllll j()11

I \ 1II l' I il':Il'ioll l'll psi 'ología

"lit! pln y 1IIIlciones de la estadística: tk~Sll'ipciolll' ildl'll 111 1 I M ¡jll i011 .Y escalas de medida

IIlo1hll''': clasificación y noLaciúl1

j) ti I!JI Il iOllL'S dI.' frecuencias

I I 1''1 M'111<1ciones gráficas

1 7, l. ReprL'sen lación gráfica de una variable

I / RL'prL'Senlación grMica de dos variables

1'llIpll·(bdL's de una distribución de frecuencias 1 1 IIlllL'l1

1 (1 1- jl'I'l'Íl'ios de auLoevaluación

I I 1I111l'ioncs a los ejercicios de autoevaluación

Page 5: Libro Análisis de datos.pdf

INTRODUCCIÓN

El, la actualidad, la estadística se aplica en casi todas las áreas del saber, (1 ' lila forma muy importante en las ciencias sociales y naturales. Sirva

11m ejemplo su utilización en estudios epidemiológicos (Medicina), en Illdios toxicológicos relacionados con la eficacia de los medicamentos

(I 'lIrmacia), en estudios genéticos y de impacto ambiental (Biología), en IIIU streos en las prospecciones petrolíferas o hidráulicas (Geología), en los l ' 'n os de población e información demográfica (Sociología), y en estudios obre la optimización del coste-beneficio (Economía).

Se puede hacer, por tanto, una distinción entre estadística teórica y apli­cada; la primera se ocupa de los aspectos formales y normativos, y la segun­ti ' constituye la aplicación a un campo concreto, como los ejemplos que n abamos de ver. Esta estadística aplicada ha recibido distintas denomina-

iones según su campo de aplicación, tales como bioestadística, psicoesta­Ifstica o socioestadística. Algunos autores han propuesto para la estadísti­a aplicada la denominación de análisis de datos (Botella, León y San

Martín, 1993; Merino y otros, 2007; Pardo y San Martín, 1998), término uyo uso se está extendiendo en los nuevos planes de estudio de Psicología

y que da nombre a este libro.

A pesar de su diversidad de aplicaciones, esta disciplina no es popular ni entre los estudiantes de ciencias sociales ni entre muchos profesionales de estas ciencias, debido posiblemente a la imagen de la estadística como una rama de las matemáticas de difícil comprensión y carácter abstracto. En contradicción directa con esta percepción, está la imagen de la estadís­tica como una especie de instrumento mágico que impregna de carácter científico cualquier investigación que la utilice.

En este tema explicaremos el papel que juega la estadística en el análi­sis de los datos en Psicología, analizaremos los distintos niveles de medida

/ 15

Page 6: Libro Análisis de datos.pdf

apÍlul n:

d datos en el plan d '

• I ir " ' 1 iar y manejar los conceptos básicos, la nomenclatura y las I n 11 ¡in ntrales de la estadística, a fin de poder aplicarlos en I 's lu li f nnal de la materia.

• EIII ' ] lIla importancia de la medición en el ámbito psicológico, di -I ir, f U indo entre las distintas escalas de medida (nominal, ordinal, d illt rv lo y de razón), y conociendo las relaciones que pueden esta-I I l' r n cada una de ellas.

• M '\ 1 j r con soltura las distintas denominaciones y clasificaciones d Ins v dables.

• Snb 1 laborar, a partir de un conjunto de datos, una distribución d 1'1' • 1 n ias, adquiriendo y desarrollando la capacidad para recopila!, 01' 1 [i zar, presentar, e interpretar datos numéricos.

al las técnicas de representación gráfica adecuadas en función datos disponibles (diagrama de barras, diagrama de sectore ,

I j t grama, histograma y polígono de frecuencias).

l . • LA INVESTIGACIÓN EN PSICOLOGÍA

1\ lo hrgo de la historia, el hombre se ha servido de diversas formas d \ 'oll()t'imi nto, tales como la religión, el sentido común o el folclore popu­I 1" , ( nll la parición de la ciencia moderna en el siglo XVII, el método cien­I Ir ( () I ' IR a er la fuente de conocimiento más utilizada, aunque no la úni­( 1. L P 'i logía se sirve del método científico para acercarse a su objet

I r\

hlo,',

Iv los l' \ ulLados obtenidos.

(1 11 I ' li ho resultados y búsqueda de concllsiol1 'S,

un informe de la investigación.

ocupa de la cuarta fase de una investiga i ) 11 , 'I 111'

1(1 l ' ,' ull ado obtenidos. En las asignaturas Fundam n/os 114· , • f " .Y Diseños de Investigación se tratarán de man 1"1 I Inll,d ti 11,' I'a de una investigación científica, así como 1 s pOHlhl , 111 11 i'.'H' Y 1 análisis correspondiente a cada uno d Il os.

Hay evidencia en la literatura de la influencia d l ~","'~'.LVU arterial. En particular, se considera que det r

encaminadas a combatir el estrés pueden resultar controlar la hipertensión arterial. Un investigado fenómeno en un grupo de 40 pacientes con este

divide su muestra en dos grupos: (1) pacient estándar para la hipertensión con lllC: Ul\.;i::lJLUc;,,,!,

t\Cllen.tes que, además del tratamiento estándar, recib n to de situaciones estresantes. Al final del t

_! _.~-- los datos de la tensión arterial de los pacu;mtO'I'. una serie de características sociodemográficas: sexo, nivel de estudios, número de hijos, altura y peso .

Page 7: Libro Análisis de datos.pdf

encontraría la determinación de un plan de tra-

' Li ga i n. En el ejemplo 1.1 el investigador decide escoger a 1 40 pacientes que acuden a las consultas externas del lr baja, asignándolos de manera aleatoria en los grupos (1) r iban un tratamiento diferente, comparando después sus

01111 arar los r sultados conlleva el análisis de los datos obtenidos y la (1 ' 11 , ¡ m di ho resultados (fases 4 y 5). Aquí se analizarían los niveles dI (%' ¡ 11 d ambos grupos para comprobar si realmente el grupo (2) que 1, \ l ' I I I I doble tratamiento psicológico y farmacológico obtiene nive­I 11\ ,' I nJ ' n tensión arterial. Por último, para difundir los resultados de

IIVl .' ti oci n se elabora un informe (fase 6).

HI1 's t libro de texto, se explicarán de manera detallada los análisis de 1\(0 I s i que pueden ser necesarios realizar tanto en la investigación

p col I ¡ '1 omo en el ejercicio profesional. Las técnicas estadísticas 1111 lit lIy '11 una parte integral no solo de la actividad investigadora, sino

1 1 \ 11 h ¡ 11 1 1 análisis de los datos que se originan en las actividades que d \1'1' >!l Ul las instituciones y organizaciones. En este sentido, no hay que 1II ¡ I \1' q l 1 psicólogo que comprenda los conceptos estadísticos y su 111 lod I gía acará mejor provecho de ellos, ya que estará más preparado p 11 ' \ nlu r los resultados de una investigación y podrá leer con mayor

II( do rftico la literatura que, sobre su campo de acción, va día a día tI' \1 ' li ' 1

I ~

i n d la ladf ti a , pod ' n10S '011 . d l' 11\

a De criptiva yla E ladl ' li Inl"l"lH' d,

11 I . 1 () I una variable, podemos recurrir a índi S I ' I ),' Illl

\1 111 \' 11 ti 's ' n los valores más habituales de esa va tia bl \ ( Il I '¡.

I 1,.",lt,,, 'la central), hasta qué punto esos valor n ' imll 11 " 1

II1 \l I11 s 'nlr sí (estadísticos de variabilidad) y en qu l'rll do I .b 1' \ 1 ' ¡Ol se reparten equilibradamente por encim a y I 0 1' h I 1

111 d I1 I 'n 1 ncia central (estadísticos de asimetría) . E l S ' 011 ' '1 l.. \ IJ r nderán de manera intuitiva al final de e t l ' 1 1'1, . I 111 111 '1'1\ r rmal en los temas 2 y 3.

I 11 I 'us de dos variables podemos utilizar índices qu nos ¡ 11 I 1" ' 1\ h'l ' la qué punto están ambas variables relacionadas 'nI \" ( ".¡k/ 7ntes de correlación), así como procedimientos qu ' \lO,' I 1

111 I l ' In pr decir el valor de una variable en función d oU"l (('C I

"fI( ',~ de regresión). El tema 4 abordará de manera d ' lnll Id

IIl1hm; procedimientos.

I 1111 ' I Estadística Inferencial se realizan inferencias a ' 1" 1 d I I H i I basándose en los datos obtenidos a partir de una mu '. 11 ' 1

" y,lIr tas generalizaciones de la muestra a la poblaci61 l o l d \ ti ulo de probabilidades. Los últimos capítulos de est l lo tI ' 1

1I Ilrobabilidad e inferencia estadística.

Page 8: Libro Análisis de datos.pdf

Ilili zal á n pal a SUL11 al parámetros d 1'\

1': 11 t's l s ' 1 ti I , n nu s lro ejemplo s de esperar que el investigad l' I 11 t '1' su I lud iar i el tratam iento combinando es útil para tra-1 11 ' 1, !t i l ' It ' nsi n d la personas hiperten sas en generaL Por tanto su poli, '1)11 bj ' ti v lÍan las personas que padecen hipertensión. Dad '111 ' 11 0 's I sibl eder a todas las personas hipertensas, escoge una l' It 1 .. tI', l ' 40 q u on las que realmente participan en la investigación .

IJ I1 'j 'n p i barto con ocido para todos es el de los sondeos electorales . I1II l' 1 n '1110S, por jemplo, que estamos interesados en predecir el resulta­do 1, tll r r r ndum que se celebrará próximamente en España. La po /)I , -1 Jl bj lO de estudio serían todos los españoles mayores de 18 años

111 • ,' \ HI I s qu e pueden votar; no sería posible preguntar a todos por su 111 ¡' II c! ( 11 I voto por lo que escogemos una muestra representativa de ,()OO 'S l '1 1 y les preguntamos por el sentido de su voto en el referén­IlIll !. l '5 'amos conocer un parámetro: el porcentaje de individuos de la

p()1 I 1 ' 1 n u responderían «sí»; eso no es posible, pero sí lo es conocer 1, tI, I i ll ltl i n de ese parámetro, el estadístico o porcentaje de la muestra Itl l' l ' '. '1 ond «h.

11

Es te s ' nc ptos pueden definirse de la siguiente manera:

/'o"'a i6n es el conjunto de todos los elementos que cumplen una ti -1 ' 1'I 1in da característica objeto de estudio.

Muestra un subconjunto cualquiera de una población.

, fl fÍ IIPtrO: es una propiedad descriptiva (una medida) de una pobla­l' 0 11 ,

, ,', IfIl/(siico: es una propiedad descriptiva (una medida) de una muestra.

hSCALAS DE MEDIDA

1I 0 11 '$ 1 proceso por el cual se asignan números a ob.i , (os ()

t I I (1 'a según determinadas reglas.

uenta que llamamos característica a cualquier PI'OI !l'" \ lo () I lonas que deseamos estudiar y modalidad ~ las ~islilll \ I pI ' 's ntarse esta característica, esta definición/i~phca a · 1 ~ I1.tlI ' \1 1

I ,( 11 a una de las modalidades de una caractenstlca, conv ll 'l t ' 1I II I la j nes entre modalidades en sus correspondientes r h ' 1011

1I1lrn ros que representan su medida. Por ejemplo, ~ las d , • la variable sexo (hombre y mujer) se les puede aSIgnar 1

Page 9: Libro Análisis de datos.pdf

I 1I 1111 ,di \ .11\11 111111111111 111'1 11111) 1111

omo ala l ·

. Un ejemplo de escala de medida '. 1\ '.' (':da . 'ni f Ta la d t mp ratura, que se basa en asignar 0° a la teml 'M

1' \1111 ' \ 1' 'on ' 1') i 11 del agua y 100° a la de ebullición.

HII !'un ' ió l d las r laciones que puedan verificarse empíricamen l 1

11111 ' lI s n lalidad d las características, y siguiendo la clasificación d '1 • (I IIS ( 1 46), pucd n distinguirse cuatro tipos de escala de medida: nomi·

11 d, o l'dlll 'll d inl rvalo y de razón.

I ~ II 1 \ " ala nominal solo distinguiremos la igualdad o desigualda I 1111 '( los 1 dalidades, la escala ordinal añade la posibilidad de establec l'

1111 (11 , 1 '11, 'n la escala de intervalo se usa una unidad y tienen sentido las 1 l' ' I'l ll 'hs y, por último, en la escala de razón se pueden comparar d s

111 1 11 Ins n diante un cociente.

) l ' ala nominal

L I 's 'ala d medida nominal consiste en la asignación, puramente arbi · 11 ' 11I 1 1, n ''lmeros o símbolos a cada una de las diferentes modalidades d ' I1 ' \1 '1\ ' l rí tica. Por tanto, la única relación que se tiene en cuenta es la d ' 'IUI/dad (y la desigualdad), que implica la pertenencia o no a una categ -

I 1 \ ' I 'rmi nada.

Usnnd una escala nominal podemos decidir si un sujeto es igualo dif -l ' ' 11I 1 ti o ll" ,pero no podemos establecer relaciones de orden respecto a e 'l

( 1" Icl 'r sU a , ni de cantidad. Por ejemplo, si réalizamos una distinción 11 poi ' Ii ntre católicos: (1) «practicantes» y (2) «no practicantes», carec di' 1I1I 1 tablecer relaciones entre estos dos números del tipo 1 + 1 = 2, 11 , I l. En el primer caso estaríamos diciendo algo así como que dos 1 Ilnllcos «PI acticantes» es igual a un católico «no practicante», y en I

, ,

1I I ' 1111 1111 ' 1141

'lsi gnan núm ros a obj lo para indi al ' \11 ' t ' 11

tina caract rística. S cla in a a h s I " " ()It \ ,

'i ión con relación a cierto atribu lo, I '1'0

11 1,1111 \ 1'1 ' h y ntre las posiciones. Cuando s 1 orden de las posiciones de lo qu

d I 111 • "lo p rmite la identificación y diferenciaci 1

ti 1 rmite establecer relaciones del tipo «111

no se plantea una distancia entre una n asignación de números a las distintas cal nte arbitraria, debe hacerse atendiendo al rel '11 l

ti \s de intervalos son aquellas que ordenan los objetos o 111 1 J' I i lud del atributo que representan y proveen interval s i \ 1 \

1, \l[ idades de medida. Con la escala de intervalo, los 11 '\111 1'0

,1 objetos, no solo permiten decidir si un objeto es igual 111"

Page 10: Libro Análisis de datos.pdf

1" 1 '1 I11 IlIlylll 111111'1\111 ' 1 "leI 1\ 1 11 \1111 r 11" di ' 11I ' 1' ,

,dl'llll , 11. 111' ' 1' ' 11 '

tllvl 111 ',

1 sta l t , qu' p rmil a ' i:rn r un núm r 1"111

rd nado. En la cala de jnL '1

fJ ja n ningún mom nto ausencia d ' I ,

1. , i/lleli¡.p/1 ia.ID dida con un test es un ejemplo de escala de intel"V'l-1(1, i 'u 'llro p r nas, A, B, e y D han obtenido 80, 90, 150 Y 160 punte,

11 1111 1 'st I int lig ncia, podemos decir que la diferencia en inteligen in 1111 " 1\ ' la misma que entre e y D (90 - 80 = 160 - 150), ya qu ,1

I I I I'Op< r i na una unidad de medida estable. Sin embargo, no pod '. 11I(l, d'¡ 1'11 1 qu e ea el doble de inteligente que A aunque tenga el dobl ' lit' I II11ltl '1 ' i 11 n 1 test, ya que para realizar una afirmación de ese tipo

(1 ' , n ' "al io que el cero de la escala fuera absoluto. En este caso s 11 h Indo p lque obtener un cero en un test de inteligencia no refl j ', 111 \ 11 ,¡o I la característica medida, no significa que no se posea ni un Ip ' 1, int ligencia.

d) 'scala de razón

EII h s ala de razón los números asignados a los objetos admiten como d ,-iris las r laciones de igualdad-desigualdad, orden, suma, resta, multi.

I 11 · , ' 1 n y división.

S t.\ ra teriza porque tiene todas las características de una medida d . Illl' I 'V't1 y, además, se le puede asignar un punto de origen verdadero d

d< l ' ' 1', s decir, el valor cero de esta escala significa ausencia de la mago 11 IlId ~1.1 stamos midiendo. Dado que el cero ya no es arbitrario, sino un

d, l ' (lb oluto, podemos decir que A tiene dos, tres o cuatro veces la mago 11 IlId 1, la propiedad presente en B. La altura y el peso son dos ejemplo ' I 1) ' ()S 1, cala de razón.

HIl ,1 uadro 1.1 se resumen los tipos de escalas, las características básj . \, (1, ada una de ellas, las relaciones que admiten, así como algunos

1 1'11" los ,

l. '. 1111 111 .Iltl,

I I I I ",S: CLASIFICACIÓN y NOTACIÓN

111 '111 1,111

1 1 \( In

111 "1 \ S una representación numérica de una caracterí ti '} )11 '

1111 111 \S d una modalidad (valor) de un conjunto determil <.Ido,

t rística tiene una única modalidad, se trata de ti na 011 ·

, 11 vi nivel de medición que les sea aplicado, podemos clasif'i '.11 ' 11

I \'1\ n minales, ordinales, de intervalo y de razón. Para ae.!;" IIp I ,bl ' 'xisten unos procedimientos estadísticos apropiados par'l hu ' ' 1

11 tI. () de la información que contienen los valores de las variablv, ,

h Ihltualla distinción en la literatura científica de tres grand 's (il () hlt's: cualitativa, cuasicuantitativa y cuantitativa, perten' ¡ '1\ 1,.

Page 11: Libro Análisis de datos.pdf

1, '\ I ,h lile 1111 11 d ti 1" 111 I t pI! , 1, e 11 ti 11 d \' ti . \' 1111( 111, . I \ ti 11111 dn , l' \'/,(111 d t j" ' j ' tlPlI ,

1. 1 11 '1 \1,1 '

HII () 'asi n ti ' cat gorizan variables qu podrían medirse a un I Iv I 111 'dol'; J slc aso decimos que una variable se ha dicotomizado si , •

It \11 's(n ll ' i] dos categorías, y politomizada si se han establecido más l · IIc. rías. Un jemplo sería la variable peso del roedor de un exp ' 1'1

IIIPlllo: 'IUI qu podríamos medir exactamente su peso en gramos, pu' I I IIllnl' útil n una investigación dicotomizar la variable peso clasificando I I 1/\ I"ll s n p o alto y bajo, o politomizarla, estableciendo tres o mCl.

II II 's I p

1. 1,' vnriabl cuantitativas se clasifican, además, en función de los va lo·, j " 11l1l1l ri os que pueden asignarse, en continuas y discretas.

Un'l variable continua es aquella para la que los individuos pued 11

en cualquier punto de una escala ininterrumpidamente. l · ' 11', I 'u' una variable continua, dados dos valores, siempre se pu dt' I Il 'c 11 I 1 J"1 l' un tercer valor que esté incluido entre los dos primeros. Un ejen •

I lo I variable continua es el peso, ya que entre los valores 79 y 80 kg pod '. 1110. 'on 'id rar uno, dos, tres o todos los decimales que se quiera. Una lit" I,,/JI ~ discreta es aquella que adopta valores aislados. Por tanto, fijad s In,' 'O I1 S cutivos, no se puede tomar ningún valor intermedio. Un ejemplo

tll' vnrhbl discreta es el número de hijos (huelga decir que se pueden tener lo. hijo o tres, pero nunca un valor intermedio entre ambos).

1,tI fi gura 1.1 recoge las clasificaciones de las variables comentadas en 1\ lo,

I Nominal I~ _ ___ - I

I De inlervalos De razón

1 I

Cualitaliva

Cuasicuantitaliva

Cuanlilativa

f Dicotómico 1 Polilómico

{Discreta Continua

" 1\ 11 '" 1.1. Clasificación de las variables (tomado de Merino y otros, 2007).

X siendo i = 1,2, 3 ... , n ,

1\ 111 \ 1) anteriores ha quedado de manifies~o que en ~sj 'o l( f c.1I I \l de variables que pueden ser nommales, ordJl d .." (

I I I'IIZ n, con las peculiaridades propias de cada es ah. Jo. , te I 11 I r v nir de la medición directa de estas variabl s ~J(, ."i()

II"I/IIJO ?mpleado en realizar una tarea, rendimiento acadérrl/ '0,

11 11 ins que provienen de un proceso de conteo (núme~o d · I~/(/II "11/1 '/Ir o académico, número de pacientes en un hospztal PS/(/II

I tlq"i 'r caso, una vez que el investigador ha recabado la, il rOI '11I

I t 111t' 1 procedimiento de recogida de datos correspondl 1 I " I

Page 12: Libro Análisis de datos.pdf

11"111 d 11111 Ild .. d ' IIIIII , 11 ' 11 ' 1111111111 plllll vdlll , pll hll 1111 11 Illpl,. 11 . ji ( ', 111 11" 1 , lo, 1111 1110 , ' 1 111' -, 111 ' PIII ' \ 1" (1'11 1 I 1" 11 01111'1\0 '. llId \ lo, 1'~'1 '() .. lo no 's 11 Id I 1',,' ' 11 ' III{ ', 11 111/(11111111 'ni ' IH \('

I 1IIIn,' , 10 1' UIll lo, 0 1' r'llIlz lI ' lo Inforl11a ' j n 111 ' Ii \111 ' UIlH IJ!-Itri! 1I ' j 1\ I 1, ' 11 ' 11 ' liS,

\JII I disll'n II Ión I /'r ' ti 'n ¡as" UI a l' pr nLa i n d la r'h ' 1011

1111 1" UIl 'on.JUl1L d m didas xhaus Liva ' y l11utuam nte excluy nt 's .Y 11

1'1'\ ' 11 ' ll ia 1, 'ada una de ellas (Hay , 1988).

1 ganización de los datos, la distribución de fyecu 11<:11

1111'1 1, los run iones fundamentales: ofyecer la información nec SI.II '11

ji '" I l' 'n li z'lr 1" 'pi sentaciones gráficas y facilitar los cálculos para obt 11 ' 1

lo 'H i n I sU ' l'l1U strales que serán objeto de atención en los próxinlO ( 1 pililos.

Vl IInosJ basándonos en el ejemplo 1.1. Se presentan los datos d lo W pi ' j " L n las variables: sexo, edad, estado civil, nivel de estudi() .... ,

l/f/ll/C'ro d ? hijo, altura, peso e hipertensión arterial mínima y máxima. Lo, ti ,lo,' 1, l da estas personas, junto con un número de identificación //J , 1 P lI 'l'C' n n la Tabla 1.1.

lIt '1' 'ra columna de la tabla nos informa sobre el sexo de los parti '1 p IlIt 'S; sin mbargo, la simple inspección visual de estos datos no es su/'i ( ' ('lit' p'l1 'a que el investigador se haga una idea precisa de los hombr s 1I111.1l ' I' 's qu hay; es necesario construir una distribución de frecuencia.

n truir la tabla de distribución de frecuencias se inspeccionan ' 11

pl'llll '1' lu ar los valores que toma la variable. En este caso se trata de UI1I1

1 1'1 a l I 'd carácter cualitativo (nominal) que puede adoptar dos valOr<'. 11 ,' 1 111os, hombre y mujer. En la primera columna especificamos los valo.

1'.. 111 \ adopta nuestra variable X. En la segunda columna aparece la fr'. 'lU'l1 la absoluta (n¡) que es el número de observaciones en cada catego

1I \. Hll la iguiente columna aparece la frecuencia relativa o proporción d,< 'ada categoría (P¡), que se obtiene dividiendo la frecuencia absoluta, ni, (\1111 ' I número total de observaciones, que se representa por n. La fr '. (' 11 ' 11 ' In r lativa también se expresa en términos de porcentaje (P¡) para lo , ' 11 d hny que multiplicar cada una de las proporciones por cien (cuarto ( 1I It IIl llla) .

",,111111(' MIIII 'I

MIII" I' ",,1111111' 1111111111 '1' II""IIB" MIII" I'

",,"1111 ' Mlllt "

ni, In

Nlvlllli 11. lIullo"

()

j

11

,,',1\, Mlllhllll

7', IH lil} 1\7 6~ I¡

H~ H 1

PI'I 11 11\1'111 O

1,7

1, 2 1,6H

1,64

1, ~

1,62

1,68

72 H.1 lISO 67 72 ESO 4 ,9 1\7 Pdlll l1l'1l1 2 70 MH

2 1,82 H4 H4 ----1 1,76 85 H2

O 1,59 6 90 2 1,55 62 1) ,1

1,63 68 ( ~

1 1,74 78 SK O 1,73 83 H()

3 1,77 79 Hj

J 1,59 70 H~

o 1,67 68 KM

FP o 1,79 89 81

Primaria 1,71 79 B' Licenciatura 2 1,82 89 80

ESO 1 1,63 75 84 ==~--~Pr~im~ar~i-a --+-~2--f-~1~,5~8~--7~2,-t-~87

FP '1,83 89 89 1~~~--+P~r~im--ar~ia---r--~1 --t-~1~,5~9-i~7~2~¡-~80

ESO 3 1,58 63 82 ~~~~~L~i~ce~n-cl~'a-tu-r-ar--2~-t~1~,6~2 -t~7~1--¡--o8

2H Primaria 3 1,69 83 7

48:.......t.:C::a:.:::sa::d~o~+F::=P~--:-__ + __ 0:---t~1~ ,7-;:;2-t~6~9 __ ¡-o93

64:.......t.:C~a=sa::d~o~+p::=r~im_a_r~ia __ + __ :---t~1~,6-;:;7-t~7~5 __ ¡-~8~3 7 1 Casado Primaria 1,57 58 81

29 Divorciado FP 2 1,73 69 77

44 Casado Diplomatura 2 1,69 72 79

48 Divorciado Primaria 1,59 78 85

59 Soltero FP O 1,68 72 77

58 Casado Primaria 1,73 80 78

47 Viudo ESO 3 1,63 75 72

49 Soltero Diplomatura 2 1,67 67 74

37 Casado Primaria O 1,79 84 76

57 Casado ESO 3 1,73 86 76

1 \1

1 1',

11 1

1 1

1111

11 M 1'1 I 1)

1,11

11

I HI

1 ~ \

I ' ~I\

I IH IH

1 1/

11)

Page 13: Libro Análisis de datos.pdf

1'11 \ ' 1 i '11, ah ra sf p d 1110S hacelno una idea de la distribu .i 11 I 111

( . o el \ I ()~ I 'trli ipc: nt , ab mos que hay más hombres que muj r S ' 11 11

11 .. t 1I 11 ' j 1 (24 v . 16), lo que en porcentaje corresponde al 60% de h 0111

III 't /'1 ' ' li t· 'll 4 % d mujeres.

1 v riables ordinales se procede de la misma manera, 'HIII

dal idad s situadas en la tabla de acuerdo a un determil 'Id" mpl , la variable nivel de estudios presenta los niveles « 1 1

Itlll ' 1," P, Diplomatura, Licenciatura» y en la distribución d 1'1 " ' \1 ' 1Il ' h~ hay q le preservar este orden:

'1' Ihl • 1.3. Distribución de frecuencias de la variable nivel de estudios

ni Pi Pi na Pa P"

1'1 111 \ I '1, 13 0,32 32 13 0,32 32

IV O 11 0,28 28 24 0,6 60

1'1' 7 0,18 18 31 0,78 78

1 1101 1 mili!' \ 4 0,1 10 35 0,88 88

1. " 1\ ' In lura 5 0,12 12 40 1 100

40 1 100

1':11 'sta tabla se han añadido tres columnas más: la frecuencia absolu. 1I1 Ill'umulada (na)' la frecuencia relativa acumulada o proporción acu· ",,,I,,da (P(l) y el porcentaje acumulado (Pa), para cada una de las catego·

() 111 dalidades de respuestas. Para obtener estos valores, simplemen lt' qll \ ir acumulando (sumando), desde la categoría de menor valor de 1, tll a la de mayor valor, las frecuencias absolutas, proporciones o p l '

\O

s qu s a In tillO I

'U','lIt'" 'la relativa (PJ cocient entr la fr \ ' ll '11 ' 11 ,,1 1 d Ol ' I la variable (ni) y el número total d 0 1 s I V \

, ti" olltia acumulada (na): número de veces qu s r '1 1111 I di 1111 ti ' lI a lquiera de las modalidades inferiores.

" ""lIl11ulada o frecuencia relativa acumulada (P/I) : IIIII I I 1'1' u ncia absoluta acumulada de cada l y 1

. Formalmente Pa = na/no

tlt'III11Ulado (Pa) : valor de la frecuencia relativa a lit 111111-

"lo 1 01" ien. Formalmente: Pa = Pa X 100.

I 1 ' "dad del ejemplo 1 forma parte de este segundo caso. I I 111 '

11\( ' 11 r edad tiene 26 años y el mayor 75. Si construy S IIW.

I d ., tribución de frecuencias como la anterior tendríam S III \

Page 14: Libro Análisis de datos.pdf

I 1, 1, 111 1 11111 1 11 11 ti " d · l, 111111111

1. \ \1'1 " 1, u.lCld l I [t val 1'" nLI' 26 y 75 a s mbo in ' Iui lo,' , p 11

111110 , pu 1, n i pLal' 50 val 1'" di ' LinL s (75 - 26 + 1 = 50) , En pdn '1' ", 11

11 Iy 111 \ el' ' i lil' qu nÚI11 r d inLervalos tendl.á la distribuci n k, 11 \ , ' \1 ' 1\ " 1.', ¡ 'n Ir habrá varia po ibilidades pudiendo optar di ' • I I hit l '1' 1111 11(11 '1' muy p qu fio de intervalos muy amplios hasta n ti ' hll

111 ' 1 vnlos 1, 1 LI P qu fia amplitud. A la hora de tomar esta deci ión II [ 1'1 1 ' 11 ' 1' 1 I"S nl qu al stablecer intervalos siempre se pierde inrol 'ltll

11 11 , yll lll ' 'Ih 1 a la fr cuencia no estará referida a un solo valol' l · 1, 11 '1 11 I ',sil a L d s los contenidos en el intervalo, Por tanto, esta d

ti 'P ' 1\ 1 'd I I LraLamiento que el investigador quiera dar a la variabl 111 110, tralan 1 d encontrar el equilibrio entre la precisión que n I I IlHlI1 'j bUi.dad d los datos.

HII 1 'j mpl que nos ocupa, consideramos que unos intervalos d '"Ipl/lu I 10 s rán apropiados para la variable edad, El valor más pe II ' 1)"

, I ( l' J qu el primer intervalo contendrá las edades 26, 27, 28, 2 , \(1,

1, 1, ,34 Y 35 Y el último 66, 67, 68, 69, 70, 71, 72, 73, 74 Y 75 . La t" ltl , I dl. 'll'Ilu i6n d frecuencias agrupada sería la siguiente:

Tabla 1.4. Distribución de frecuencias con los datos agrupados en intervalos de la variable edad del ejemplo 1.1

Itlh , 'V ,los

26· 5

)·45

, ·55

6·65

( ·75

XI ni

10

3

13

7

7

40

Pi

0,25

0,08

0,33

0,17

0,17

1

na PiI

10 0,25

13 0,33

26 0,66

33 0,83

40 1

dol' i 1 r rmado ± 0,5 x l,

11 ' 11' 1m nto de medida,

ti ·

J ti mpo que se emplea en ejecutar UI', 1'1 ' 1'· utiliza un cronómetro con preci i 11 d \ " lit '

1 ularemos el tiempo real de un ti mp Up"I ' ' 11 ·

l' ' Lando 0,005 a este valor, Así:

22,37 ± 0,5 x 0,01 ::= 22,37 ± 0,005 ::= 22,365 - 22, 75 .

1I'Ihución de frecuencias con los datos agrupados .,18105 de la variable edad del ejemplo 1.1

Punto medio

ni Pi na I

p"

30,5 10 0,25 10 0, 25

40,5 3 0,08 13 0,

50,5 13 0,33 26 O,

60,5 7 0,17 33 O, 8

70,5 7 0,17 40

40 1

Page 15: Libro Análisis de datos.pdf

111.'11111111, el d 111 11111 tI

ia nula.

L(),' IltI 'vos on qu han aparecido son:

1,,1,· va/o: s inó nim d] concepto de modalidad, es cada uno de 1 s 1'11 1

!lO,' ti \ valor 's qu o upan una fila en una distribución de frecu n '1 \

1, 1/1/1 's aparentes, virtuales o infonnados: son los valores mayo\' \ 111 ' 1lOr 1\ 'ada intervalo, teniendo en cuenta el nivel de precisi n tltol 11I,' tl 'uln 'n t d medida.

l . ",/lNi reales o exactos: son los valores máximo y mínimo qu 1 ' 11

11 1 ' <\ h inl rvalo si el instrumento de medida tuviera una pre is lllll I !'I 't ' l '\.

1'11II1t) medio del intervalo: es la semisuma de los límites exactos o d • In, I mil '1; a parentes.

Amplitud del intervalo: es la diferencia entre el límite exacto sup I'iol .Y ,1 I n1 i t exacto inferior.

I 7. I E PRESENTACIONES GRÁFICAS

IJII el' n o es una forma rápida e intuitiva de visualizar un conjunlo d I 11o, () tina distribución de frecuencias.

HII 1 ) h r presentación gráfica se encuentra subyacente la idea d \ 111

11 ' 111 1 1\ oordenadas, consistiendo el más habitual en dos línea I '1

111 11 I 'lIhr ' . La línea o eje vertical se llama ordenada o eje de las Y.y I

111111111111111" X Y

I I I I

y

6

4 3·-1- -1> 2

(2,3)

. AlldlCl \ I ti /': "1 \lllh"

Primor cuodronlo +X +Y

A ~ 4 3 - 2 - 1 - 1

123456 x

, 11"' IIIIIIIIIInlo X y

-2 -3 - 4 - 5 -6

Cuorto cuodronte +X -y

,' 1st ' l11a referencial de Coordenadas Cartesianas.

1 pll '11I~1l1 variables cualitativas, o en puntuacione pos it 1-1, III It d jl lal s representar únicamente el primer cuadnlll "

, I I po l' gráfico más apropiado hay que tener en cu nl'\ l' l 1" d ' In v dable. A continuación se describen las repr s 1 1tI -

111 1, III i !izadas en Psicología para una y dos variable .

I I , ' i()n gráfica de una variable

1 l ' 'presentaciones se suele utilizar para variables nomina­I cllantitativas discretas. En el eje de abscisas se colocan 101'

II 1 ' el la variable y en el eje de ordenadas las frecuen h s,

Page 16: Libro Análisis de datos.pdf

, c d 111 ' 1 111 1 ' dt 11 di' I 1 I 11 1 hl 1 11 1 tt 1 d 1111 ' 1 ti ¡"

I • t 11 ' \ 1. L

311

o lIombro Mujer x

1 0,9 0,8 0,7

:~ 0,6 §. 0,5 ti: 0,4

0,3 0,2 0,1 O

(1 )

--~

--

Hombre x

Fi r llra l . Diagrama de barras con frecuencias absolutas (a) y r lativas (b) construido sobre la variable sexo.

o-

'-

I=-I =-

Mulor

1': 11 vtl ri ab l rdinales y cuantitativas discretas, se puede utiliza!' 1 1 11\ 1, \111 Dla/:,rrama de barras acumulativo, que nos permite conoc l' 1111\

I I ni ,' 'I'V'l j ne se sitúan por debajo de un valor cualquiera de la v \1 ,\

1111" Il ny ~1I' iLuar en el eje de abscisas los valores de la variable y n l' l I 11 1' 1 ' 111 I-ls las fr cuencias acumuladas, ya sean absolutas o relativas, 1I I

'" 1I1 In sol 1" ada valor una perpendicular cuya longitud sea igual a !tI II

,

' \1 ' lIdn H ' lIl11ulada. En la figura 1.4 se muestran un diagrama de barra, ( "

14 I? 10 O

6 4 ? O

(a ) (b) 45 40

-g 35 ~ 30 ~ 25 .~ 20 g¡ 15 ~ 10

5 ESO FP O P' . ESO FP Diplomado SuporlOI H' rcmarcos

Estudios Estudios

I II~ 111 ' \ 1.4. Diagrama de barras (a) y diagrama de barras acumulativo (b) de la variable nivel de estudios.

fr ul 11 la qu s l · s' tlivi 1, ' 1\

L1 n ia d la modlllld \ I nta 1 ntll1 '1'() lol d 1

d hlllOltI

I \1 pi ' ',' ' 1 L mos gráficamente la variable sexo, a h t¡u " . 11111 ' \ 'o lul11na en la distribución de frecu n ias, ' 0 11 lo

11I '101 tI ada categoría o modalidad para su r pI' 's III ,

1111 d \1" 1':\ n ,d sectores .

Mujer ~ m 1'1 Pi Grados

111

O, 60 216

0,4 40 144

I 100 360

i ' lribución de frecuencias y diagrama de sectore de la variable sexo del ejemplo 1.1.

1 1111 ' \ ' xpresan con dibujos alusivos al objeto de estudio ItI , t 11,' 1 odalidades de la variable. Estos gráficos se hacen l ' p I"

t I l' 'nt s escalas un mismo dibujo, de tal manera qu I 1\1' ,

Page 17: Libro Análisis de datos.pdf

L(),' I 1'10 1'11Hll 'l S S ' uLilizan ha bilLla lm nl para variables cual/lul I ,

/\ 'olltlllll 'l j 1 1 tI' m S un a r pI' nla Ión, I11cdianL un I i ' [Op l 1111

1(, I 1 VII I'i t\ I 1 \ S ? O .

25

20

'i ura 1.6. Pictograma de la variable sexo del ejemplo 1.1.

ti) Histograma

El hi s l grama se utiliza para variables cuantitativas continuas t''', 'nlo¡; agrupados en intervalos. En el eje de abscisas se colocan lo ' I 11II

' \ I S d cada uno de los intervalos en que se han agrupado lo I \ I ( I (lo los 1 la misma amplitud), o los puntos medios de los interva l() ol)!" ,11) levantan rectángulos cuyas áreas sean proporcional ' \ III

11 '1' ' ti '11 ia orrespondiente, absoluta o relativa, según se quiera repr' , ' 1\

I \1 ' 11111\ ti lra. También se utiliza para la distribución de frecuencia ti 11

IlIldn los. -I n la figura 1.7 se muestra el histograma Ca) e histograma l.\ ' 11

IlIld lIivo (b) para la variable edad. Al igual que en el diagrama de barl' I ¡ ' II ,1 I l'im r caso, cada rectángulo representa únicamente un valor el II ' \1 111\ " mi ntras que en el segundo representa ese valor y los valol 111"1 i< l'

1M

45,5 Edad

55,5 65,5

5

75,5

I 1111 t q) histograma acumulativo (b) de la va ri a bl . edat!.

cuencias

dl s l' tas, el polígono de frecuencias es la figul"\ 111 ' I 1" l ' ti ' mos superiores de las que hubieran sido las I ¡¡ 1'1 ' \.

I I 110 un diagrama de barras. Si se trata de una vari a bl ' ' () II

I ti ' ' Ir I mismo pero referido a los puntos m edi , ti , "'. I lit' lo ' rectángulos correspondientes a un hipotéti hi sl() IIldo VOl os mismos datos. En la figura 1.8 Ca) se pre' Ill u ,1 " II1 ' 11 ias de la variable edad del ejemplo 1.1 Es h'lI ilu " 1" logl ama junto con el polígono de frecuencias en In 111 1,

I " 'omo se presenta en la figura 1.8Cb).

continuas también se utiliza el polígono de frecu ' 11 " \

111 ,111 'ndo en el eje de ordenadas las frecuencias acumuhd \. I

IlIt lo ' relativas. Para realizarlo, se une, mediante un gnl ' 1\

Page 18: Libro Análisis de datos.pdf

14 12 10

(1) j : 4 2

O //

25,S

l' '\ " I "-/ -

35,S 45,S 55,S 65,S 75,S Edod

Ji' fU I' \ J .8. Polígono de frecuencias Ca) y polígono de frecuencias realiz Id" sobre la base del histograma (b) de la variable edad.

lo 1" ' Lilf¡ 0 , el vértice inferior izquierdo del primer rectángulo (el SI(111I

\ In i/'. ¡ui rda de todos) con su vértice superior derecho; este punt I'Li ' sup rior derecho del siguiente rectángulo, y así sucesivamen l , I

I \ Ji! fura 1.9(a) se muestra el polígono de frecuencias acumuladas J 11 1 I I \\'h 1 edad y en la Figura 1.9(b) se puede comprobar cómo se ha

11 ' \1 ¡ I a partir del histograma correspondiente.

� ------~I ----~I ---

45,5 55,5 65,5 75,5 Edad

If 111111 tl l' 1'1' u ncias acumulado (a) y polígono de rr 11,. tdo obr la base del histograma (b) de la variabJ

m gráfica de dos variables

ti 'neio, dad .

1 '1 H 1/) (tl menos una de las dos variables es cualital IWI ,

' 11 ti I son cualitativas, antes de realizar la repr 's ni 1-

11 ' ' 11 rganizar los datos en una tabla de doble entrad" . I Ihl IH S sitúan los valores de una de las variables en las /'il I

le 'C)1 1 ejemplo 1.1, tenemos en la siguiente tabla (v l '

II 111 '0 posibles valores (casado, divorciado, soltero y viu lo) tlldo ivil en las filas, y los dos posibles valores (hombl'l .

1I " l ' exo en las columnas. Cada celdilla representa ItI fl"

Page 19: Libro Análisis de datos.pdf

jI (atl" f'l l' ,

II C) mili' MIlJ l '

12 12 2

4 2

4 2 6 - --4 O 4 - --

24 16 40

11 1 11 ' 1 1 () 11(111 ro d 1 m ntos que reúne a la vez los valol 's 1, 11

11 di ',' 1(1' s' Tuzan nada casilla. Como puede observar dll ., '" ,1 n(ln '1' d p rsonas que reúnen los requisitos de ' 1" h 0111l11

\. \ 1 () I ' (1 \ 1m '8 I nú 111 ro de personas que reúnen los req u i s il () I ICll ld l ' .Y livor ¡'ld , y así sucesivamente.

H I\ ,1 si fui "L gráfico se muestran dos formas de represenL'l l' I di 1111 ' 111 ' h s vUl" iabJ s tado civil y sexo mediante un diagrama de I tlll 1

70 1 ~

10

() osado Dlvorciodo Soltero Viudo

Estodo Civil

oMujer o Hombre

70

60 50

'" ~40 '" 15 30

"'-

20 10

O

r-

t-

t-

r- 11 [""""]

I I I 1 I Cosodo Divorciodo Soltero

Estodo Civil

1 p lll ' \ 1. 1 . Diagramas de barras conjunto de las variables estado civil y SI'\II

EII IIml S casos se ha situado la variable estado civil en el eje de ah I I 111 Illztl l I distinto trazo para cada modalidad de la variabl ,\'

( ",\11 1 ) s' r presentan dos variables conjuntamente, hay que te! ' 1

1 ti -111 1 1I1 ' P ra utilizar las frecuencias absolutas es conveniente qlll

1111111 1'0 1, suj tos sea similar en las dos variables, siendo preferible el 1111111' 11 () utilizar las frecuencias relativas o porcentajes.

I IHIIII.,

l. I'fIIllI lJlc ', ('/11111111,,(/

• •• • • - • • • • • •• • • • .~ .. • • • • • •

, 1,6 1,65 1,7 1,75

Alturo

n UIl 1 (11110 ,

las v'l l'i ti 1 I 'S (/ / 1/1 S 11 Tabla 1, 1),

. • • • •

1,8 1,85

111 11 m 111 de dispersión de las variables altura y peso.

ti d Ip "H11a de dispersión, podemos observar qu x is l ' I 111,,,1 ' nlr las variables altura y peso, correspondiend , ' 11

I ' 1', lit a alturas mayores y viceversa. En el tema cuall'O 1IIIHI111 I d de explicar la relación entre variables con m /l S

h ' DE LA DISTRIBUCIÓN DE FRECUENCIAS

1 llllllO construir una distribución de frecuencias y cómo 1 1111 'nte sus datos; ahora mostraremos, también de fOrn,.l

1I '101 r rmas que adoptan las distribuciones de frecuen in

4

Page 20: Libro Análisis de datos.pdf

1 1\ IIHII' 111 t 11 1111 1I 1'1011

l '

,) T 'l\d l1cia central

1, 1 1 ' 11 1 I ' ia nLrc 1 d una distribución se refiere al lugar d< 11 1 • 11 ' 1 11111 Ilsll'ibu ión particular en la escala de valores. Así, pal'u In 111

{( ' l/ sir 1/ or{ 'rial máxima del Ejemplo l.11a mayoría de los suj L S s' ' 11 I

11' 111 ' 11tl" los val r 136 y 150 mientras que, para la tensió11 I/dl/ /11"

I tl CII IItl" ll1 ' J lr 76 y 90 (ver Figuras 1.12 y 1.13).

1 11 . 1 15

l :¿ 1. 125

12 . 1 O

1 11 · 1 5

U . 140

1· 145

( . 150

ni

O

2

5

7

11

8

4

1 !l6· 1 O 1

40

16~------------------------------~

14+-------------------------------~

12+-------------------------------~

10+-----------------------~

8+-----------------------~

6+-------------------~

4+---------------~

2 +-------------~~

° LfI----.-- +--+-+--+-+----jr---+- 1--f!!!!IIIII 110,5 115,5 120,5 125,5 130,5 135,5 140,5 145,5 150,5 1~~,

F1lura 1.12. Histograma de la variable T.A. Máxima con su distribu '1 111

de frecuencias .

85,5 90,5

n su diSLribu ' 16 11

I I 1 "( ' 'ti grado de concentración d la 1111 I 1" lJ 11'\ distribución de fyecuencia s homo~ lU'a I 1I 1) . 1< s v 101' s de la distribución e tán '1' ' lIlOS ti

IIc'a (ti n mucha variabilidad) si los val r 's s' 11. 1" (o '1\ promedio.

1 Hit 1111 1< 1.1, si observamos los datos de la varial\ . {( ' /I

I p lll¡ o 1 y para el grupo 2 (ver Figuras 1.14 y 1.1 :; ), I 11 (-11 rlm ro hay más variabilidad que en el egundo '11

I ,1, .

Page 21: Libro Análisis de datos.pdf

"/ 111 · 11 ()

16 14 12 ·

10 · 8

6 4

2 O

151 I ~~ 2 11 0,5 115,5 120,5 125,5 130,5 135,5 140,5 145,5 1 SO, I'¡'" I 1 ~ (l 1 r ()

20

1'1/ (11'0 1. 14. 11 i l grama de la variable T.A. Máxima en el grupo 1 (P¡W 11" 1" 'n n 1 tra tamien to estándar), con su distribución de fr ' lI l, , 1( 1

n i

O

11 1 120 O 16 O 14

O 12

3 10 8

1 ~ ~. 1 40 4 6 1"<1 · 145 6 4

1--

1 ' ). 150 5 2

1 ~ 1. 15 2 O

¡-

h // I 11 0,5 115,5 120,5 125,5 130,5 135,5 140,5 145,5 150,5 1 5,~ "

1 ~ ). 1 O O

20

Ji' 1 111'0 1.1 5, Histograma de la variable T.A. Máxima en el grupo 2 (pa i " 111 '1" ' "l' 'n n además una terapia de afrontamiento del estrés) con su dislr illl

de frecuencias,

~() , 11.1 ' l S n la variable tensión art ' r ial 1/ ¡(,, ¡/l1i/

1I1 , '111 di o rado d simetría. Por el conll al'io, Ins 11. , grupos 1 y 2 por separado p I' " l1 ttll l m.¡l · livamente, como puede ob 1 'V'H 'S , ' 11 1 \,

, I 1I h s 'iguras 1.16 y 1.1 7 los pacientes qu si 11 i , , 'O lt

, 111 ji \1 ' \ l· hip r tensión obtuvieron con mayor rr LI ' 1\ '1 \ I '1 11 11 ,1" mi ntras que los pacientes tratado ad n ós '01\

1 1111 1 111 0 1 ituaciones estresantes obtuvieron val r 's '11 ,

11 I/r d 1I/ (lI ima, por lo que éste tratamiento par r 'su ll W' I I H I \ l ' n pacientes con hipertensión arterial.

16 14

12 10

8

6

4

2

O 11 70,5 75,5 80,5 85,5 90,5

ma de la variable T.A. Mínima en el grupo 1 (paci nl s miento estándar) con su distribución de frecuencias.

9 ,

4/

Page 22: Libro Análisis de datos.pdf

11,

20

Ih 14 12 10

4+-------1 2 -1-----,----1

O +-tiL--~--~~--_4-----4----_+

70,5 75,5 80,5 85,5

/11 u I'U /. / 7. Hi tograma de la variable T.A. Mínima en el grupo 2 (/ n ' j ' l1l S qu reciben además una terapia de afrontamiento del s il '

con su distribución de frecuencias.

1. . n. ... SlJMEN

1/ \1 ' t , apítulo hemos tratado el papel que juega el Análisi I ' 1111 '0 d 1 111 todo general de la ciencia y hemos visto algunos (l ll

1111 )r! nt relacionados con la Estadística, además de tratar el, J'()ltI It , 1 \ 1 di ión y los distintos tipos de escala: nominal, ordinal, d ' 111I /

In n. Posteriormente se ha abordado el concepto de variall , 111 1I I '1 [ lasificación de acuerdo a distintos criterios. También s ' 11 , I I , lo 111 rganización y tabulación de los datos, mediante la conf " 1111

1111 \ Ils tribución de frecuencias. Además, se han presentado algulI I

111 \.' 1, r pr sentar gráficamente una distribución de frecuencias, 1, 1111

1\ I ' su vi 'ión aporte una información de carácter general acerca l · 11

, (' 0111 rta el fenómeno objeto de estudio. Por último, hemos ad "1 \111

1 III 'm ra intuitiva los aspectos más relevantes que se deben anall ". 11

lo 1 \ Iistribución de frecuencias: la tendencia central, la variabili I ,,1 , 1111 tri , que serán objeto de estudio en los próximos temas.

1.1 n. • .... ERCICIOS DE AUTOEVALUACIÓN

1,1, El número de aciertos en un examen es una variable: A) nomill 11 , rdinal; C) de razón.

1,2, Para poder concluir que un sujeto posee el doble que otro de la . 11

l rística evaluada, es necesario disponer de una escala de: A) inl 1 B) orden C) razón.

Itl

IS: A) , I admiten do valor p sil I '.; Ji )

111 11 1110 Imi v I res posibles; C) admiten dos o 111

I 11 '1 ,do s tr te de una variable nominal.

nc Sociológicas (CIS) realiza d ' 111 ' \1l l ' I

iudadanos españoles m ayor '5 l ' - I \ \, I plI ' lI11l a 1600 ciudadanos sobre el plil il a l, 1'0

t 11 '1 ualmente en España, encontrand ~lI ' I \ 11\ 11 \ ' lados (el 52,5%) opinaron que 1 pa ro l' l 'lI ,1

111 11\ 1. ¿Cuál es la población objeto d ' lu li o? A \111 1 \t I n spañola; C) La población españ. I 111 ' 1)'(11'

jercicio anterior, 52,5% es el valor d : A) '111

dístico; C) una muestra.

, olll inuación la distribución de frecuencias de la v'lda·

,II,t! 1 -1 j mplo 1.1

X ni

Soltero 6

Casado 24

Divorciado 6

Viudo 4

40

ti I v riable es? A) Nominal; B) Ordinal; C) De intervalo.

Page 23: Libro Análisis de datos.pdf

1 , I ()

1. 1 1.

1. 1 .

1. 1 . , uól s on lo límites exactos del valor 18,56? A) 18,55 1 H, 555 - 18,565; C) 18,565 - 18,565.

1. 1 , En 111 xperimento de atención visual focalizada s h 1 ,,"1 ' 01 variabl dependiente el tiempo de reacción en n i1i :;t, '1111.1

II n I ,t [minado estímulo visual presentado en la panta] 1,1 ti ' 1111 "

n ''\ 1 r. Los ti mpos de reacción obtenidos han sido:

520,487,458,399,458,465,502,389,444,478,415,501 , 43 ,474,458,468,479,511,458,499,487,468,423,41 5,

2 , 409, 450, 410, 439, 490, 480, 417, 432, 491, 451, 3 2, , 3 0,433,487,429,389,477,466,520.

(. , nivel de medida tiene la variable tiempo de reacció, ? 11 .11 ; B) De intervalo; C) De razón.

1. 15. 1: , di tribución de frecuencias de la variable tiempo de r (/( '( 1'/1' /

',i ' 1' icio anterior es:

()

Hl l ·4

HlI ·4

21·4

1,41 .

00

20

40

60

80 1, 1·4

iH 1.50

'lO 1·52

O

O

ni

6

5

8

8

11

6

6

B)

riores. X ni

400 o menos 6

401-425 6

426-450 9

451 -475 13

476-500 10

más de 500 6

11 IIIUIIIII I 11 i 111 lit ' 1

I () . EJERCICIOS DE AUTOEVALU¡\('ION

onsl:lllt o

I " el 1 01 r de una escala de razón, que es la Cm i 'tI 11 I ' di I la relación de división.

11 li I" I:/. n el origen de la escala no es arbitrario, sil () 1" ' 1111 OI'ig n real que corresponde a la ausencia (valor <: ' 1'0)

11', r 11 ' que se está midiendo.

I "l ' lida es ordinal, porque los números asignad l o " 's puesta solo nos permiten diferenciarlas y ord , !lila scoge la opción 4, solo podemos afirmar qu' '. '1

IIlO, ' 1 con la cuestión planteada que otra persona qu ' 11 \ 1\ op Ión 3, pero no podemos saber cuánto más de a LI , .. do

Page 24: Libro Análisis de datos.pdf

1, ,11111\ 11 11 H H 1 II ,1 ti • 1111 'd ti I • n i ' 1 11 ti " I "1 ' ji I 1 ' 111 () d l' l ' ' 11 1I

I ti ,1 .. d o 01 11 lo' I 1'( ro I ¡ , y () l' 1 ' I I!' d m: ' 1\ 1'1 111 '1 () 1I 1 \ , 1I ¡ l' 'v no I o 1 ' lllOS 1 1" ' 1:-;'11' ItI lis tt\l1 'h 'l\ l r' ull niv ' l y otl'() ,

1, , Solu i )I: A. LJIl ' \ vüriabl di t6 n i a s d ri n s'nt 'l r los a teg rfa val.or s.

1.7. o lll' i n: e A) os ,1 tamaño m ue tral y B) incluye a toda la p bh i )11

'u'wd 11 1 studio solo interesan los m ayore d dad.

I ,H. So lu i n: B Es '1 va l r de un estadístico, ya que 52,5 es un porc nLH.l ' 1

sob l' 1 1600 encuestados que forman parte de la rnu

1 ,( . 01 I Ión: A. E' n minal, ya que no podemos más que diferenciar goda existentes.

1,10, lu Ión: A.

PI = n;ln = 24/40 = 0,6

1, 1 l . lución: C. N ti ne sentido calcular la frecuencia acumulada, ya qu ' 1 ,

s t do civil es nominal.

1. 12. lución: A. ' 1 diagrama de barras es un gráfico apropiado para variab l

la tivas, no como el histograma (opción B) que se utiliza 1 :tI ' I

bl cuantitativas en intervalo y el diagrama de dispersión (°111 IIII

q 1 e utiliza en el caso de representar conjuntamente dos v 1I I , u ntitativas .

1 • l . lución: B. Límites exactos = Valor informado ± 0,5 x 1 = 18,56 ± 0,5 I ,56 ± 0,005 = 18,555 - 18,565.

1 ,1 , lución: C. razón, porque el cero representa la ausencia total de la

ti medida (del tiempo).

1\0

()()

1-

1-

-- 1-

- 1-

11,

6

9

13

10

6

111 ti ,l o lt 'l '.1 ' l" ' (1 1.1 ~, d 1

n" -6

12

21

34

44

50

10 111 , 1 1, l'" p ' ' to 0 1 1111111

-p"

0, 12 1-

0,24

0,42

0,68

0,88

1

' l'lo l' 'y ,1 1 I11 h

P"

I

2

4

8

I

2

4

2

8

8

00

t lI 'tI 450 milisegundos o menos.

11 1 d Id I m di da es la unidad, basta con restar y SUI1UII ' () ,~

"1' 11 ' 'lit 's para obtener los límites exactos. Así, 38 1 () ,~

400,5 .

1 \) intervalo es la semisuma de los límite 'x' ' ·to,' 11

ntes, (381 + 400)/2 = 390

111 1 l ' '1 I senta adecuadamente los valores de esta variol 1 "

\1 111 lit tiva. El diagrama de barras (opción A) no s 1 ti ' I ' l . lribuciones de frecuencias agrupadas en interva los . ,1 I dispersión (opción e) se utiliza para repres nlal' eOIl

1, s variables .

Page 25: Libro Análisis de datos.pdf

1I 111.1

• 11 t 1"11 Y P n

UII.I IIIl'dida de tenuencia central

iil's

.du.\cirín

I ~ idos de autoevaluación

Page 26: Libro Análisis de datos.pdf

I RODUCCIÓN

( 11111 ) S ha mencionado en el tema anterior, una de las propiedad s m(Ís 1I11'IIII:tnleS a estudiar de una distribución de frecuencias es la tenden iél " 11 ·

II 11 ti 1 s puntuaciones. Esta característica de la distribución se puede 1 surnil' 11 1111 valor o puntuación que refleje esa tendencia central de la distribu i n y 1" I 'presente al conjunto de observaciones. Con el fin de cuantificar esta pro

1I d¡,d, e han desarrollado una serie de medidas o índices de tendencia '11 t 1"11 1"1 111 lican sobre qué puntuación se concentran las observaciones.

En este tema se van a presentar los principales índices de tenden ¡él " 11

I1 ti : 1 media aritmética, la mediana y la moda. Además de exponer 1 pro· I dlmiento de cálculo de los índices, se discuten las principales ventajas '

11 ollvenientes de cada uno de ellos y se ofrecen criterios para su aplica i )11.

I steriormente, se abordan las medidas de posición, las cuales SOI1 liti · I ra informar sobre la posición relativa en la que se encuentra un suj '.

111 ' n respecto al conjunto al que pertenece, a partir de su puntuaci 11 ' 1\

1, v riable. Se describen los tres índices de posición más utilizados 11 111 I'I'Ó tica: los percentiles, los cuartiles y los deciles.

Los objetivos de aprendizaje que se persiguen en este tema son los iguientes:

• Conocer las características de las principales medidas de tendcn ' itl central (media aritmética, mediana y moda) y de posición (per "ni j. les, cuartiles y deciles).

• Saber aplicar los índices de tendencia central y de posición.

• Seleccionar los índices de tendencia central y de posición adecua los en cada caso.

• Interpretar correctamente los valores obtenidos mediante los índ i ' 's de tendencia central y de posición.

~7

Page 27: Libro Análisis de datos.pdf

I ~ II ,1 111. d 1. 1.

IIIH ' 11 l' '11' 's 'nlar l da la di lribución de frecuencia 01 lIlI 1111 1 ..

,1 1 '1I1(IS, h ilitan la comparación de diferentes conjunl s d ' I 1111111 I

I\IHI variall '. P r j mplo, si medimos el nivel de autoeslil17C/ '11 1111 I 11 1, 200 Ilillos (100 niños y 100 niñas), además de estudiar la l 'lid ' 11111 '11 11i! os.y nil a ' de forma conjunta, los índices de tend neia t' '1111 tll

I 111 1(1 '0111 para ' i n de niños y niñas en su grado de auto Slill(1. " 1, I \ '1 i 'w,r si I nivel medio de autoestima es mayor en lo ni! () 1/11

11 1 liS, o vi 'versa. Trabajando directamente con las 200 obs 1'V:ll II11 JI

1 ',, 110 podríamos, de forma eficiente, ni describir la tendencia 'v lIll ti 1 IIi1US, ni mparar las distribuciones de ambos en su grado ti' Itlllt

/\ '01 Linuación se van a describir las tres medidas de tend '111 I 1 'pi ' 's 'nlaLivas de la distribución, más utilizadas en el análisi s 1

IIINlill aritmética, la mediana y la moda.

. . l. ].él media aritmética

L'\ m dia aritmética, también llamada promedio o simpl 1 1 ' 111 , 's ID m dida de tendencia central más conocida y usada en la pr:í 1

d(), be. s i amente, a la sencillez de su cálculo y a que es el fund anl ' 11111

'1'(111 Illl111CrO de técnicas estadísticas.

L-, 11 dia aritmética indica la tendencia general de una distl'illlh 1 11' ' ' ti '1 ias de una variable y es el valor central alrededor del ' tud I 111 I'yorfa de las observaciones. De hecho, desde una perspectiva r '0111 1:. 111 'dia aritmética se puede interpretar como el «centro de gnl ti In li s ll'ibución de frecuencias - véase Amón (1999)- . Por otro 1(,,11.. I '11 'h. d otros índices de tendencia central, sólo puede calcllhl

· ,l'ia~ 1 cuantitativas.

H

1 I

11 I d ,1, \, ti 11111 .. 1.1 1'"1 \, "dI'! 111 \lh ' 1 "dll, 1, 1 1 ill ¡ ti 1 ' d j d 111

l' pl "S 1 111 \1 1I1 11 l n 1111 ' 1111 d

, I " I ,\ 11

/1 11

n d ,1 slIj 'lo i,

n 1 que se obLi n ' la 111 ' 11 1 11 1

ariable aptitud espacial en 5 a1\:un:noIa: e ntro educativo, Calculemo 1

Aptitud espacial (X)

133

120

125

115

122

observaciones es:

+120+125+115+122 = 615 =123 5 5

Page 28: Libro Análisis de datos.pdf

1'111 111 '111 1 d, I 11111111 111 di' IIh 1 \1 1111\

l . ' 1I1plo , 1, 1'111 ' 111011 o, .. 11 . \1 ti 1II 111 ' pi

" ti I1 IHI l' (111 1, 11" ' 11 '11 ' Irl ." 1 I'\lpU I()s () 110 11 111 ' \

I1 11\ ·tli:r :Id! "' ''1 I '~ I s' plI 'd 'td ' \dr\l ' :\ I ti 1'1 ir ' 1, hs 1'1' (11 /) () ti ' IlIs 1'1" 'u '11 ' ¡as r 'laLiv'ls o prol or ' ion 's (p ,):

( lulo de la media en tablas de distribución d • 1'.'( 11

con datos agrupados o no en intervalos

Ml·dln aritmética a partir de una distribución d Ih olufas:

- ~n.x. ~ nX X=..c.., 1 1 =..c.., 1 1.

Ln¡ n

IOlld ';

11 'S ·1 número total de observaciones.

\, 's 1 valor i en la variable Xi o el punto medio del intervulll,

1/ , 's la frecuencia absoluta del valor o intervalo i.

M 'dia aritmética a partir de una distribución de frecuencia. •

d( nd ;

1', '5 la frecuencia relativa o proporción de observaciones d '1 ti ,1 in tervalo i.

mo es de esperar, con una u otra fórmula se obtiene el mi. 1111

Indo para la media. Su cálculo se ilustra con los siguientes ejempltl

lutas. Si aplicamo b olutas, obtenemos

45,7+ 36 . 8 + 18 . 9 = 1836 = 6 12 45+36+18 300'

ni Pi = nln

135 135/300 = 0,45

66 66/300 = 0,22

45 45/300 = 0,15

36 36/300 = 0,12

18 18/300 = 0,06

300

0,22· 6+0,15· 7 +0,12 · 8+ 0,06·9 = 6,12

fórmulas se obtiene el mismo valor p

Page 29: Libro Análisis de datos.pdf

n, P, 1 2 2 0,04

46 5 7 .. 0,14

79 8 13 0,26

10 12 11 18 0,36

13 15 14 10 0,20

50 1

2·2 + 7 ·5+ 13 ·8+ 18 ·11 + 10 ·14 481 2+7+13+18+10 = 50 =9,62

0,04 · 2+0,14 ·5+0,26 ·8+ 0,36 ·11 +0,20 ·14 = 9,62

('11 1110 potl 'mos observar, la media aritmética aprovecha toda la informa-1 11111 "11'11 ollibl en los datos, ya que para su cálculo es necesario utilizar todas 11 JlIIIIIIIll 'iones de los sujetos. Como veremos posteriormente, esto no ocu­II nll olro ' indices. Asimismo, la media aritmética presenta una serie d' 1" "1) 'e1n I 's matemáticas, de las que podemos destacar las siguientes:

1, En una distribución, la suma de las desviaciones de cada valor con lo a su media es igual a cero. Matemáticamente se expresa como:

n

I,(Xi - X) = O i=l

l . 111 1~I 'op i eda_d se puede comprobar con los datos del ejemplo 2.1. La II JI el " " 1) lI a l a X == 123, y el sumatorio de las desviaciones se obtiene de la

¡'I lft ' lIl ma n ra:

I 's a lli 'amos h sigui 'lit' Inlllsl'ollll I

/J \ ( I (f, I él n ' 1 h d , 1 ' n u v ' val r 's Y s 'r/i y h I (/ .

1 IJlplo . 1, si la ' puntua ione d la variabl X = Clptitlld ('s/}((c ';fll, Itlpll "" 101' 2 (b = 2) Y se le suman 10 (a = 10), s obti ' 1 '11 I~\s 1'1111

el ' t]u' s igue iendo la puntuación en ap titud spa iéll I 'r() '11

11 ' , "\h:

"1 IIITI no Aptitud espacial (X) Aptitud espacial (Y)

I 133 Y 1 = 2 . 133 + 10 = 276

2 120 Y2 = 2· 120 + 10 = 250

3 125 Y3 = 2 · 125 + 10 = 260

4 115 Y4 = 2 . 115 + 10 = 240

5 122 Ys = 2 . 122 + 10 = 254

1111 1 ia de Y calculada a partir de las puntuaciones es:

5

I,Y y= i = l ¡ = 276 + 250 + 260 + 240 + 254 = 1280 = 256

5 5 5

,pi i 'amos la propiedad de la media, podemos obtener la media ti ' Y

y = bX + a = 2 ·123 + 10 = 256

11 l'dtimo, a la hora de utilizar la media como medida representaliv:1 klldencia central de la distribución, conviene tener en cuenta las

111 " limitaciones:

( liando los datos están agrupados en intervalos, la media no se pu . l ' calcular si el intervalo máximo no tiene límite superior y/o t' l

illL rvalo mínimo no lo tiene inferior. Por ejemplo, en la sigu i 'IlI ' (Iistribución de frecuencias:

Page 30: Libro Análisis de datos.pdf

20-24

25-29

X ~ 30

12

8

5

22

27

?

'1 inl rval máximo no tiene límite superior, por lo que no podemos I '1 '1'11 i nar el punto medio de ese intervalo, necesario para el cálcu­

lo l ' la m dia aritmética.

1 ) 1.t1 In 'dia es sensible a la existencia de unas pocas observaciones con va lor 's xtremos en la distribución de frecuencias. Esta circunstancia s' eh '11 distribuciones marcadamente asimétricas, por lo que no e

ndable la utilización de la media en este tipo de distribuciones a que afecta a su representatividad como valor central de la dis-

1 ri bu in. E tos valores extremos pueden ser: 1) producto de errores en h l' gida o grabación de los datos, o 2) valores que aportan informa-i n relevante de la variable. En el primer caso, se eliminan estas obser­

v iones y la distribución se vuelve más simétrica, por lo que podría cal­' ular e la media aritmética. En el segundo caso, se recomienda aplicar

o lr S índices de tendencia central menos sensibles a los valores extre­III como la mediana, que la abordaremos en el siguiente epígrafe.

. .2. I a mediana

Tol y como hemos mencionado en el apartado anterior, cuando la dis­tI 1 I u ión es asimétrica una buena alternativa a la media aritmética para l' 'sumir la tendencia central de las puntuaciones es el índice denominado I1I ' li ana. A diferencia de la media, la mediana no se ve afectada por los vn lor s extremos que pueda adoptar la variable debido a que en su cálculo 110 in t rvienen todos los valores de la distribución sino únicamente los que () 'upan las posiciones centrales. Por tanto, en este caso, la mediana es un vn l r más apropiado para representar la tendencia central de la distribu­' i )1'1. Por otro lado, la mediana se puede obtener en todo tipo de variables, . " pto en variables cualitativas.

11111\ \11 Ihl · .\, I ' PI . 1 lit "1,, pOI !vid, l' ti IHI I v, dol l · h VII 1'1-1 1 1 • IlI l' ti i 1, In Il s tl'illl '1 )11 1, 11 " ' 11 1\

j llltd 's, ' ()1I1 ' 111 n lo 'ti h lIll'l ,1 50'r,) ti ' I I

I Clllpomos qu h mo obtenido la puntuación d n suj ,tos '1\ 1111 I

I III IlIl r . Para 1 cálculo de la mediana con po . 'asos s ' pI ', H 1

1, 1\li ' nt manera:

l ' 11 pl'i m r lugar, se ordenan las n puntuaciones de menor ti III:lYOI

1.1\ s 'gundo lugar se observa si el número de ob 1 va ion 's I1

lit¡ nI' o par.

Si n es impar, el valor de la mediana es el de la ob rV'1 'i )ll 111

() upa la posición central, dentro de ese conjunto de obs 'I'VlIt'i1l1l

' \ ordenadas.

Sin embargo, si el número de observaciones n es par, la 111 'd 111 I

, . la media aritmética de los dos valores centrales d la cJi s tl 11)(1 'ión.

(IIllinuación presentamos un ejemplo de cada caso:

2.4. Cálculo de la mediana con n impar.

la mediana en los datos del Ejemplo 2.1. siguiendo lo d

....... u ..... u'--'" las puntuaciones de los alumnos en aptitud espacial a mayor valor:

115, 120, 122, 125, 133

que n = 5 es un número impar, la mediana es el valor o p que ocupa la posición central en esa secuencia ord

observaciones, es decir, Md = 122.

11 1

Page 31: Libro Análisis de datos.pdf

u.f o

1 18

2 16

3 24

4 20

5 28

6 30

!I11mf!!' lugar, ordenamos las puntuaciones de menor a mayor:

16, 18, 20, 24, 28, 30

do lugar, dado que n = 6 es un número par, la m ediana es la tmética de los dos valores centrales de la distribución:

Md= 20+24 =22 2

(011 ocurría con la media aritmética, lo normal es que el número dI' 01 scrvaciones no sea tan pequeño, aparezcan valores de observa­

()I' 's repetidos y, por ello, los datos se presenten en tablas de distri­I lI ' j n: de frecuencias agrupados o no en intervalos. En el caso más ' V II ' ral, cuando los datos están agrupados en intervalos, el intervalo en I 11I ' se encuentra la mediana se denomina intervalo crítico y se

I. IIIT' ' ponde con aquél en el que la frecuencia absoluta acumulada na • j ual O superior a n/2. La mediana se obtiene con la siguiente fór-

111I1h:

xacto inferior del intervalo crítico.

N 11111 '1" de observaciones.

Ji, ' \ U ncia absoluta acumulada por debajo del in t rval ' d i j 'o,

I 1"1' uencia absoluta del intervalo crítico.

I An plitud del intervalo crítico.

2.6. Calculemos la mediana en el Ejemplo 2.3, en el qu agrupados en intervalos.

X Xi n i

1-3 2 2 4-6 5 7

7-9 8 13 10-12 11 18 13-15 14 10

L 50

este ejemplo los intervalos se presentan en orden creciente, P el cálculo de la mediana y de cualquier medida de posición

"'-.... , ...... , ... ble invertir el orden de la tabla:

X Xi n i na

13-15 14 10 50 10-12 11 18 40 7-9 8 13 22 4-6 5 7 9

1-3 2 2 2

L 50

Page 32: Libro Análisis de datos.pdf

Md

1,(1 r >r1l1111a planteada se basa en el método de interpoln . (111 • 11

1 11111 1:\ li stribución homogénea de las puntuaciones d 'ntl(l d. ¡do , V "unos m podemos calcular directamente la IlI ·d 111'

111 ,toc!o utilizando los datos del ejemplo 2.6. Sabemos ~II ' ,1 1111

ohsl'l'va ion s s n = 50 Y que, por lo tanto, la mediana s ·1 v dlll I pOI' I 'b"lj de sí a 25 sujetos. Hemos identificado el interv'llo 111, 1 1, 1 número de puntuaciones acumuladas hasta el lfmit· 111 lit ' lV'll anlerior al crítico [7-9] es de na = 22. Por tanl I I'ult 111

oh 'I'V'l i nes para llegar al 50% en el que se encuentra 1" 1I1 di 1 'III 'a 2. 1).

Si asumimos que las puntuaciones se reparten a lo largo dI' :do d' r rma homogénea, entonces podemos afirmar que 1", I i()n 's del intervalo crítico se distribuyen homogéneamenl' ' 11 1111

111(1 1\ 3 unidades. Por lo tanto, si 18 observaciones se r I ¡1I1t 11

oIl1lplitud de 3, ¿qué amplitud o unidades dentro del intervalo, 111

pnl':'ln la 3 observaciones que faltan para llegar al 50%? Por 1111 1

11 'S:

18 observaciones ~ 3 Unidades} ~ x = 3·3 = O 5 3 observaciones ~ x unidades 18'

Estas 0,5 unidades debemos sumarlas al límite inferior del illt I

t il () obl niendo el mismo resultado que con la fórmula:

Md = 9,5 + 0,50 = 10

~

x :6 ~I~ 1)11 l~ ~

• • • • • , 1 t

t

t

• +

· •

x{ Med ~na = 9 5 ·

• 3 •

+x

q f- IJ ZZ 7 9

1 3 2 2 20

1111 d '1 ál uJo de la Mediana para los dalos 1 ,1 '.i mplo 2.6.

diana en la distribución de frecuen ia

las frecuencias absolutas acumuladas:

6tJ

Page 33: Libro Análisis de datos.pdf

00 135J 2 66 ,1 5,727 5,73

LlI ni 'diana, por lo general se puede calcular en cualquier distribuci 11

dl\ 1'1' ' ti 'n ias x ep lo cuando los datos están agrupados en intervalo . , Isl 'tll inl 'rvalo abierto en el que se encuentra la mediana. Veamos UII

'1 ' Illplo:

/O

2.8.

Tabla 2.1 Tabla 2.2

ni na X ni na

14 X ~ 31 35 -

18 76 121-130 9 25

29 58 111-120 8 16

20 29 100-110 6 8

9 9 90-99 2 2

90 L 60

d · tri'b . , d fr . di' . d n 90 1 lS UClOn e ecuenCIaS e a lzquler a, - = - = 45 por o 2 2

1 intervalo crítico es [20-24] con na = 58. En este caso, como el crítico no es el intervalo abierto, se puede calcular la media­

es igual a:

n 1 tabl 2.2, 2 2

1 int rvalo superior qu stá abi alcular la mediana,

Il ' ' 1' índice de tendencia central que se puede obtener lanto '11

l'\w lilativas como en cuantitativas es la moda.

mla d una distribución, que se representa por Mo, se define 0 1 lO

le 11 () ategoría de la variable con mayor frecuencia absoluta.

I " ' SO de una distribución de una variable cualitativa, la moda 's 1" n la máxima frecuencia.

2.9. En la tabla adjunta se mues­de frecuencias del idio-

, la categoría con mayor absoluta es Inglés, y esa es, por

moda de esta distribución.

Idioma elegido

Alemán

Francés

Inglés

Italiano

ni

35

52

90

23

11 \I na distribución de una variable cuantitativa con los datos no a 1'11

, 'n intervalos, la moda es el valor con la mayor frecuencia absolulIl ,

71

Page 34: Libro Análisis de datos.pdf

18

300

Flllldllll'llle, s i se tra ta de una distribución de una variable cuantitalivlI I elll Iwo¡ dolos agrupados en intervalos, se localiza el intervalo modal que l'

I 11111'1 vu lo (;0 11 la frecuencia máxima y la moda es el punto medio de diclHI

1.

. 11. En la distribución de fre­del Ejemplo 2.3, el intervalo [10, 12], por lo que la moda es

X

1-3

4-6

7-9

10-12

13-15

L

Xi ni

2 2

5 7

8 13

J 1 18

14 10

50

ClIando en una variable existe un único valor con la frecuencia máxima, 101 ti Is ll"i bllción presenta una moda y es unimodal. Sin embargo, la distri-11I1 l'i() 1l c.l e una variable no tiene por qué tener una única moda. De hecho,

,",e 11I dos los valores con la frecuencia más alta la distribución es bimodal, ¡ ,",e 111 I res los valores sería trimodal, etc. En la figura 2.2, la distribución de

1" 1/1IIIierda es unimodal y la moda es el valor X 3 , mientras que la de la dere­fol l1 l l'S bi modal, siendo las dos modas los valores X 2 y X 3 • También puede c H 111"1 ir que una distribución no tenga moda, lo que se denomina distribu­I lelll :\lllodal. Esto sucede cuando todos los valores tienen la misma fre­I 11I '11l'Ín absoluta; en este caso no se puede calcular la moda.

16 14 11 10

oi 8 6 4" 2 O

X XI X4 XI X¡

X XI X~

111"II 'lbución de fl-ecuencias unimodal (izquierda) y bimodal (dcr<.'cllu) .

111111110, completando lo dicho hasta aquí, las principales caracWl'ts­hl 1" IlIoda son las siguientes:

1111 índice de cálculo sencillo y de fácil interpretación

n., los tres índices de tendencia central estudiados, la moda es el (111 i-111 que, además de aplicarse a variables cuantitativas, se puede cul ­

,d,\1' en variables cualitativas .

1!;lIlc.lO los datos están agrupados en intervalos y existen interv~\I()s ,"jerlos, la moda se puede calcular excepto si el intervalo 111 oc.l a I e ,llIc ide con el intervalo abierto. Si nos fijamos en las tablas 2. 1 y 2.

,It-I ejemplo 2.8, la moda se puede calcular en el primer caso y su \'illn!" es Mo = 22, mientras que no es posible calcularla en el segun­d" caso debido a que el intervalo modal (el intervalo superior) cs t{¡ ,bierto. .

ta elección de una medida de tendencia central

1Ii1lldo se ha medido una variable en una muestra de n sujetos y dc­'"111'1 seleccionar un valor que resuma adecuadamente la tendencia cen­I ,k la distribución de frecuencias, la primera pregunta que nos debernos IIlt'ur' es: ¿qué medida de tendencia central debemos utilizar? Pues bien, 111 primera opción se recomienda la media aritmética porque en ella 11 basadas un gran número de estadísticos y técnicas estadísticas de

11 I Il1portancia y de uso frecuente que se estudiarán posteriormente.Ú n i­IIt'nle se desaconseja su utilización cuando la distribución es muy asi ­t ri ca con unos pocos valores extremos que pueden distorsionar la rel'l'l'-

73

Page 35: Libro Análisis de datos.pdf

I 111 ,11 ' d,\ I di 1" 111 di \ 11111111 11 lid 111 I , 11111 , I1 111 ti 1110 , Illl 'ti '1 Iplil ' \1 : 1) \\ IIHIIlI I 11 '11 ti ' 1\1 ' 1I ItI 1, ItI V II

I I , llIlIl\ill l " ti 01 ' 1111 d, y/o 2) '11 lIto, 11" IIp 1 lo, '11 los q l ' , is l ' 11 illl I

"1) "i ' 1Ios ' n los ll' mos 1, h li s ll'it 11 '1 )11.

( \1 111 lo In 111 odia 11 s pu d aplicar, o no es recomendahIe su ulill ,. 1

1 1111 , 111 s il' ui ' nl p i n pued ser la mediana. Como hemos señal 10, 1, 111 d 111:1 's más J" 's is lc nlc a los valores extremos que generan asimelrfu ' 1\

1, 1 , 11 ¡Iu ' i )11 , s ' pu d oblener en variables con nivel de medida ordill " \, Id ' 111. s, s' lId aleular en distribuciones con datos agrupados ' 1\

,,11 ' 1 dos 'on inl l"Valos abiertos. Sin embargo, en ocasiones no se pu 'ti 111 1 ' 11 ' 1' hl m 'di a na . E lO puede ocurrir por dos motivos: 1) el nivel de m 'ti d 1 d ' 1" va ri a bl s nominal y/o 2) con datos agrupados en intervalo ' , 11 111 ' 11 11 11 ' 1 S' 'n u nlra en el intervalo abierto. En esa situación, la únit 1

di 111111 ivtl p s ibl es utilizar la moda. Por otro lado, como ya sabemo , 11 11 lO 1 1 11 0 s' pu de calcular cuando la distribución sea amodal (no ti 11

1110 1,) () ,1 inle rvalo abierto coincide con el intervalo modal.

' 1 día, con el uso de programas informáticos para el análisis es lH I , 1 leo 1, 1 s dalos, se recomienda, siempre y cuando sea pertinente, el cá l "In 1, 1 • lr índices para el estudio de la tendencia central de la distr¡

li ando las variables son cualitativas únicamente puede utilizars(' 1 1 1110 h omo medida de tendencia central. Sin embargo, en el caso d '

11 1 I I 's on nivel de medida ordinal, se pueden obtener tanto la modo 111110 1" m diana. Por último, si la variable es cuantitativa se pueden cal ,,1 " ' los tI" s índices de tendencia central, lo que implica que dispondrem :-. 1 111!\y r información para estudiar esta propiedad de las distribuciones,

ante resaltar que cuando la distribución de una variable cuanti . imétrica y unimodal, coinciden los valores de la media, mediana

1110 la , omo podemos apreciar en la figura 2.3.

1() --- ~ .. _-~

i~ -~

70 - f-

", 1 S

.--- f-10 r--- -

=== :::::=

O 1 2 3 4 6 7 8 9

l· \Ira 2 ,3. Medidas de tendencia central en una distribución de frecuencias simétrica y unimodal.

I I ) DAS DE POSICIÓN

1 , I ri mera parte de este tema hemos definido medidas que ' pI' '. 111 al conjunto de datos. Interesaba disponer de un indicado r () 11 11 Imérico de la tendencia central de todas las puntuaciones. Pu 's

IIII)l'a la cuestión que nos planteamos va dirigida a un sujeto o da to ,,1.11' y la podríamos formular de la siguiente manera: en una di s lri · 11 tlt' rrecuencias de una variable, un sujeto s obtiene una puntua j n 1" I osición ocupa este sujeto en la distribución con respecto al r 's·

IIj 'tos?, ¿qué puntuación tendría que obtener para superar a UIl

IIlnj determinado de sujetos de la distribución? Por ejemplo, en UII

1 ' l ' atividad administrado a los 50 niños de una clase podemos pl an . 111 1 s siguientes cuestiones: ¿qué puntuación debe alcanzar un alu 111 ·

"1 uperar al 50% de sus compañeros?, ¿qué puntuación debe obl '. I Ira estar entre el 25% de los más creativos? Imaginemos que UI1

1110 obtiene una puntuación de 15, ¿qué posición le corresponde aX 11 ,1 conjunto de puntuaciones de los alumnos de la clase?, ¿está e l1lJ"

III.lS creativos de la clase?, ¿qué porcentaje de sus compañeros e tá n I -bajo de él en creatividad o qué porcentaje le superan en dicha V ') ·

Il.

7~

Page 36: Libro Análisis de datos.pdf

() Ido (U' s' trata d lo alizar la p si ión de un uj lo en una di. 1I 1II

(111, pUI't\ 'ons truir un fndi de posición, debemos dividir la di ' trilll h ' 11 11111l(1\l1 '1' o parl s o eccioI1 s iguales entre sí en cuanto al nÚIll ' Itl

oh, ' 1 V' I ' ion 's. P r jcmplo, si queremos dividir una distribució n ' 11 dI P 111 's i '11 ' 11 'S, n ilamos un único valor para esa partición, que oi ll ti ~ (111 In 111' li 'l na d la distribución (recuerda que la mediana divid la di ti I II Ci )11 'n 00 ' partes, cada una con el 50% de los sujetos). En el aso ti tt" ' l' '1' divi liria en lres partes, cada una con un tercio de los sujetos, 11 '

iI IIIlOS los val res de la variable, y así sucesivamente. Dependienoo ti l' ll lIllos v'll r s de la variable utilicemos para dividir la distribución, ( od III()S 11 '\1 lar el diferentes medidas de posición.

A 'ontinua ión vamos a describir tres medidas de posición o cuan ti I ' los 1 '1' 'nlile, los cuartiles y los deciles. Estos cuantiles se utilizan 11111 'In rr uencia en la práctica, especialmente los dos primeros.

. .1. )' n:cntiles

Los fJercentiles, también denominados centiles, son los 99 valores d ' 11

II 'iul I ' que dividen en 100 partes iguales la distribución de frecuencias.

( ~ I percentil k , denotado por P'o es un valor de la variable de interés que I 'ja p r debajo de sí un porceI1taje k de sujetos, donde k = 1,2, ... 99.

III ngamos que en una distribución de frecuencias de la variable in/e li~(' 1I 'ia espacial, la puntuación X = 25 deja por debajo de sí al 40% de 1 .

11.1 'los de la distribución. Entonces, podemos afirmar que el percentil 40 ti ' 'S'l distribución es X = 25, P40 = 25, Y que los sujetos con X = 25 están p l'

' 11 ' ima del 40% de los sujetos en inteligencia espacial y son superados pOI' ,1 ()O% de los sujetos. Otra forma de expresarlo sería que un 40% de los suje­

t ti,' 110 'uperan la puntuación 25 y un 60% sí superan dicha puntuación.

I JI 11", ti

n. En cambio, en los percentile y de r I'IlUl III1 2

1 , n·k E' . 1 11 I a numero -- o ste numero es Igua a - ' lItlll( () 100 2

k 1 n ·50 n ntil 50. En efecto, = 50 por o que --= -

100 2

111 s' presentan en tablas de distribución de frecuencias a bso­I '1 111 (. dos en intervalos. Pues bien, el intervalo en el q u ' s'

1111 il I percentil k se denomina intervalo crítico y se corr SpOI1

11 .Itjll 1 en el que la frecuencia absoluta acumulada na es igual ()

n· k El '1 k b . l" f' 1 - -o percentI se o tIene con a sIgUIente ormu a: 100

P = L + Wü - nd .1 [n.k J

k 1 n e

1'1" cuencia absoluta acumulada por debajo del intervalo críti o.

'[ ecuencia absoluta del intervalo crítico.

Límite inferior exacto del intervalo crítico.

Amplitud del intervalo.

cllno ocurría con la mediana, cuando en la distribución de frecu n­IS los datos no están agrupados en intervalos, se aplica la misma r 1'-

111 la pero con amplitud del intervalo igual a uno (I = 1).

77

Page 37: Libro Análisis de datos.pdf

8 13 22

5 7 9

2 2 2

50

n . k = 50·10 = 5 por lo que el intervalo crítico 100 100 '

plicando la fórmula:

- n ---2 [

n .IO] [ 50.10] + IOOne

d .1=3,5+ 10~ .3=4,7857",,4,79

(nll " III l do descrito podemos calcular el valor de cualquiera de lo. ) P ' 1 " llliI 'S d una distribución. Sin embargo, puede suceder que ten a

111 1 1111 vu lo)' puntuación de la variable, Xi' y nos interese saber qué p l'

111 I () ' \11 ' 1 e e valor en la distribución. Es decir, ¿qué percentille corr s IIl lld ' 1 h puntuación del sujeto s, X,? Realmente nos están pidiendo el

,le 11 ,1 ' ¡" I do el valor de Xi' Para realizar ese cálculo debemos despejar "" " I \ . ' (1'\ 0j n anterior y obtenemos la siguiente fórmula:

( ,ll,.t10 de k para Xi:

r(p, - L)·n 1 k 1 e +n

k = 1 d . lOO n

18

8 13 22

5 7 9

2 2 2

50

11 está en el intervalo [10-12] que va a ser, por tan crítico. Se aplica la fórmula y se obtiene lo sigui n t :

·100 = 3 ·100 = 62 ) ·n + nd 1 [ (11-9,5) .18+ 22 ]

n 50

la puntuación X = 11 , le corresponde el percentil 62, P 62 = 11 .

"le) S ' calcula el percentil que corresponde a una puntuación deL r­I 111 I \ I ocurrir que obtengamos un valor con decimales. En el'

Ildo que los percentiles son 99 valores enteros, tomamos la canl j ­I 1" más próxima. Por ejemplo si nos piden el percentil de X = 9 en 11" anterior, el resultado es que P39,67 = 9, con k = 39,67. La cantidad 111 l. ' próxima es 40, por lo que el percentil es 40, P40 = 9.

llar tiles y deciles son dos medidas de posición en las que las s -el 1 ar tes en las que se divide la distribución de frecuencias SO l

111 nos que en los percentiles.

79

Page 38: Libro Análisis de datos.pdf

111 "IImlll,' 111111' ,dlll\' d\,I,,1I1 111I1I\lIlIllItII p.llll' <I'¡"I:IIII'II'II\'I, ,lndL'lllIlIl '¡OIl :

El ,"t'~II"do cuartil, Q2' d ja p r d baj d pell '11 ' ill1 'l ' \1 Lr 50%. E qujvalcnt al p r 1.1 111 'li:lIw l' la di lribudón, Q2 = Pso = Md.

I'CII' 1 d limo, ,1 tercer cuartil, Q3' deja por debajo d 's ,,1 111·los.Y I nI' n ima al 25% restante. Se correspond' ' 011

1, ti 'la listribu ión, Q3 = P7S '

1> ,\ i lo a la quivalenda con los percentiles, para el tíl ' \1111 11. I I 11 11 1 ¡ 1 's vam a utilizar los métodos propuestos para los I '11

Illm' \' '10,01 1 calculamos mediante Pzs , Qz con Pso, Y Q3 011 1' ,

p()1' olra parte, los cuartiles se utilizan para construir flldj¡ 1 I IlItlio l' la variabilidad de una distribución de frecuencias, r01l11l

1I 1 Ir) i1110 tema.

POI ' (IILimo, los deciles se definen de la siguiente manera:

I,os decUes son nueve valores que dividen en diez partes i )\1 "

II Sll'ibu ión. Se representan por Di' donde i = 1,2, ... ,9.

I ~ I primer decil, D¡ deja por debajo de sí al 10% de los sujetos, ·11 0%, '1 D3 al 30% y así hasta el D9 que deja por debajo de sí al l }()'

los sujetos. De este modo,

D¡ = p ¡O' Dz = Pzo, ... D s = Pso = Md, ... D 9 = P90

P()I' 1 lanto, también podemos calcular los deciles a partir ti ' 1" 1I'IIl il's orrespondientes. En la figura 2.4 se representa la qlli II

1111' '1 s diferentes cuantiles estudiados de una distribución de fr' 11 1

IHI

Qr Po

111 \1 11111 1, In relación entre medidas de posi Ión.

pll ('lllnc.!o una de las propiedades o caractcrfsti ' liS

I Illhll ' i n de frecuencias como es el estudi c.! I In plll1lll ' l i n s. Se han descrito las tres medidas ti I

IlIpll '" las, que son la media aritmética, la mediana .Y ¡' 1I '\n xpuesto sus principales característica, los 'Illaja y limitadones de su aplicación al análisis

1 1 p,1I1 ' d 1 tema se ha concluido con la discusión de P,II" In 'lección del índice más adecuado en cada aso,

1 .. 111 '\bordado las medidas de posición, con el fin ti ' , 11 1. I11 V'I d los sujetos con respecto al conjunto de pu \1 -

II "lid n. Dependiendo del número de partes en las que 11 11111 1, fr cuencias, se pueden definir diferentes cuan-111 IlIs tI' índices de posición más relevantes (percen ti ­I ) y s ' ha explicado el procedimiento de cálculo segú 11

I 1I l. latos y el tipo de cuestión a la que se quiere r s­I, I IItI nfatizado la equivalencia entre los tres tipos d I

1111,1 V 'Z definidos los percentiles, se pueden obtener los 111\10 asas particulares de los percentiles.

81

Page 39: Libro Análisis de datos.pdf

H

, 1. 1. 1111 'ti 11 I1 1111 11e. \ IIO . C. 111111 ' \ ; B) 1, li sll'ihll ' lo" 'S Silll Id ' ti; ti ¡ '1 lo,

1·:1 vnlol' ti' un 'l val'iabl' qu' s i mi r' livi 1, lo Ii . ll 1111111 I ' \1 ' 11 ' i ~ l s ' 11 dos p'lrl ' • 1 ,1 misn nLI01 'ro d oh. 1 11 1111

111111 s' I 'nomina: A) m odia aritm ti a; B) n '(\i.1I1:I; ( ) 1111111

, " I'III't1 'slu li ar la tendencia c ntral en una variabl' ' \1 tll 1I ,

¡" ': \l1 nsim trfa, el índice adecuado es: A) la m di'!; Ji) 11 11111 I 11Ic.'dhrl a,

, 1. 10:" Ull:! distribución de frecuencias de una variabl ' 111 'el 1, 01 ' Ijnal, I índice que NO se puede aplicar es: A) la n ,11 \, 111 1

) 1:.1 m ,d iana.

, ~ , En II na di tribución unimodal se obtienen los mi mos tI " l 11 1 i . moda, media y mediana cuando: A) los dato ' si \ 11 1 11

' 11 jnt rvalos; B) la distribución es simétrica; C) el nÚIl. ' 111 1 va ' i ne es pequeño.

En un conjunto de observaciones de una variable, la pUlIlIII

's s Iperada por el 75% de los sujetos se corresponde ¡>7~ ; ) D2•

, 7. El quinto decil de una distribución es equivalente al: A) 1 1'1

B) p rcentil 5; C) percentil 50.

,H, El una distribución de frecuencias, el número de sujetos ' 111.

O el mismo que entre: A) DI Y D2 ; B) P2S Y Pso ; C) QI y ( \

.'), L'l variable X toma los siguientes valores: 50, 26, 35, 64, 34, M, 48, 52, 54, 67. La media aritmética es igual a: A) 48; B) 47; ( 1 I

. 1 (l , El valor de la mediana en los datos del ejercicio 2.9 es: A) )51.

1 1, I ~ n 1 iguiente diagrama de barras se representa la variabk ,\ ro d hijos.

N.i de hijos

I lti.ios 's i ual a: A) 2,32; B) 1; C) 1,48.

" \ 0 : 1111 ' ri 1", ¿cuál es la moda?: A) 13; B) 1; ) 2,

1 I i ' 1 ,¡ ' i 2.11, el valor de la mediana e ' i l"lIa l :1 : ) (I ,?;,

, In" ,jo 2.11, a la puntuación X = 2, ¿qué P '1' • '1 1 ji

) 11" ; 1 ) P 6S ; C) Pso·

11 1 .. d:\los d 1 ejercicio 2.11, el primer cuartil d l a dis­I fI ,O ; B ) 0,50; C) 0,58.

1111111.1 .' , muestra la variable edad agrupada en inlerva­) ~5,5; B) 46; C) 50,S.

X ni

66-75 7

56-65 7

46-55 13

36-45 3

26-35 10

1, lOll la tabla del ejercicio anterior, la edad media de los ) 0,5; B) 50 ; C) 52.

Page 40: Libro Análisis de datos.pdf

,1 .dlll IlIl' Ii \IH) d

1"

()I\ los lutos 1 ,1 'Jl' I' '1 ' lo 2. 1 , -II VI" '1Itil O 's igual a: A) 70,50; H)

)l ,7'; )65,82.

1) n 'u 'rdo a la di lribución del ejercicio 2.16, el valor del cuarto I " 11 's: A) 46,50; B) 47,81; C) 52,11.

( tU IONhS A LOS EJERCICIOS DE AUTOEVALUACIÓN

'o lu ' j )11:

vi Inl ' I'valo máximo no tiene límite superior, no podemos deter­Ildll \1 ' ,11 II1l0 medio de ese intervalo, el cual es necesario para el cál­l 1 do l ' la 111 dia aritmética (ver apartado 2.2.1).

Solu ' j 1 : B V liS' la d finición de mediana en el apartado 2.2.2.

Solu ' i n: B lWI d

1 1': ti q 1

la variable es cualitativa la única medida de tendencia cen­e puede utilizar es la moda (ver apartado 2.2.4).

Solu ' i n: A \I()I d la variable está medida a nivel ordinal podemos utilizar la

111 0 la y la mediana, pero no la media que requiere que sea de inter­vnl) de razón (ver apartados 2.2.1 y 2.2.4).

Solu i n: B 'l'nl y omo se señala en el apartado 2.2.4, cuando la distribución es uni­Il!Odal y simétrica, los valores de la media, mediana y moda coinciden.

Solu Ión: A Ln 1 untuación que es superada por el 75% de los sujetos es aquella tU ' sup ra al 25%, por lo que se corresponde con el percentil 25 o el

1 l'il11 r cuartil, Q¡. (ver apartado 2.3.2)

7, Sol LI Ión: e Los 1 iles son nueve valores que dividen en diez partes iguales la distri­III ' j )11. De este modo el Decil 5, Ds, deja por debajo de sí al 50% de las 01 s '\'Va iones, por lo que equivale al percentil50 (ver apartado 2.3.2).

111\ 1111 B lO 1, s U,Í ,tos ' 1\11" ( I .Y ,1 ( ,

11111 f) 1 I 2 " I 10%

11111 1 ' ~ yP50 e125%

11111 (JI Q 2 s el 50%

':.:.1.- 50+26+35 + 64 + 34 +28 + 73 + 45+48+52+54 +67 = 576 4H 12 - 12 12

11111 i n: A I 11 ': 1 ,1 cálculo de la mediana, primero se ordenan los datos d' 111 ' 1101'

, ItI ' l 'y r:

(,2 ,34,35,45,48,50,52,54,64,67,73

" \ lo que n = 12 es par, la mediana es la media aritmética de 1 s los nlores centrales de la distribución:

I I Solución: e

Xi ni

O 9 1-

1 13

2 10

3 6

4 2

¿ 40

na

9

22

32

38

40

Md = 48+50 = 49 2

n;Xi

O

13

20

18

8

59

Solución: B El valor de Xi con la frecuencia absoluta mayor es Xi = 1, por lo qUl'

Mo = 1.

Page 41: Libro Análisis de datos.pdf

I \, ,h I 1111 ,

/1 () 20 2 '

pOl ' lo ]lI ' '1 inl rvalo rílico es [O,5-1,5J con na = 22. Aplicando la fól' 111111 :\:

, 1 I 'olll ' ¡ )11: B

l.

1.1 IlIl1lll'l i nX = 2 está en el intervalo unitario [l,5-2,5J

¡, = 1 .100 = 1 ·100 = 67 5 r (Pi< -L)· nc + nd l r (2 - 1,5) ·10 + 22 1

n ~ ,

1 01' I tanto, a la puntuación X = 2, le corresponde el percentil68, P68 = 2.

I . So lu ión: e () = p n . 25 = 40·25 = 10

I 25 ' 100 100 '

1 Ol' I que el intervalo crítico es [O,5-1,5J con na = 22.

It , So lu ión: e HI l 'rcer intervalo es el intervalo modal (ni = 13), Y su punto medio es iO,5, Por lo tanto, Mo = 50,S.

1111 , 11

"1 11" • 1"1

r,rl ~ "¡O,5 7 40 4!)j,5

~O, 5 7 3 42 ,S - L /I,X, 2000 50,S 26 656,5 =- - t;o

/1 40 40,S 3 13 121,5

0,5 10 10 305

40 2000

,.111 ,¡ 11: A

11 0 = 20, por lo que el intervalo crítico es [46-55J con na = 2 . Apl l· 2

¡lIldo la fórmula:

(n -n J ( 40 -13J Md = Li + 2 nc d ·1= 45,5 + 2 13 ·10 = 50,88

ni Ición: B

II!:.. = 40·90 = 36 por lo que el intervalo crítico es [66-75J con nll 40. 100 100 '

Aplicando la fórmula:

P90 ~ L; +l fk~ nd l H5,5 +l 4~~~: 33J ·10 = 69,79

olución: B

n·k 40·40 D 4 = P40 , 100 = 100 = 16,

por lo que el intervalo crítico es [46-55J con na = 26. Aplicando la r)l' mula:

(~-n J ( 40-40 -13J P = L + 100 d. 1 = 45 5 + 100 ·10 = 47,81 40 in' 13

e

H7

Page 42: Libro Análisis de datos.pdf

'1' 11tH \

'1 ' 11 lrh.

lIlo .1111:11 ión

I '11 1\ le lS de auloevaluación

Page 43: Libro Análisis de datos.pdf

l . INTRODUCCIÓN

II:n te tema se van a abordar dos nuevas propiedades de una distribu-1111 I puntuaciones: la variabilidad o dispersión y la asimetría o sesgo de

1\ d is tribución.

La egunda propiedad de una distribución de frecuencias, y de la mis-11 1 \ 11 1por tancia que la tendencia central estudiada en el tema anterior, es I , variabilidad o dispersión de los datos. La variabilidad hace referencia al

l ' \ I en que las puntuaciones se asemejan o diferencian entre sí, o se apro-1111 . n o alejan de una medida de tendencia central como la media ariméti­\, han propuesto numerosos índices para medir la variabilidad de una

I . lribución. En este tema se describen los índices de dispersión más habi-111 ti en la práctica como son la amplitud total, la varianza y desviación I 1 ¡ a y la amplitud semi-intercuartil. Además, se presenta un índice, el coe­I d nte de variación, que resulta útil para comparar distintas distribucio­li tiS de frecuencias en términos de su variabilidad.

Posteriormente, se estudia un tercer aspecto de la distribución de fre-1 11 ncias relacionado con su forma que es la asimetría o sesgo. Como se ha

¡s to en el primer tema, mediante la representación gráfica se puede analizar , i una distribución es más o menos simétrica o qué tipo de asimetría la carac­I riza . En este tema se describe el índice de asimetría de Pearson que ofrece t m resultado numérico sobre el grado y tipo de asimetría de la distribución.

Por último, con el fin de poder comparar a los sujetos entre sí y en dife­t' 'ntes variables, se describen dos puntuaciones que se derivan de las pun­ILaciones directas: las puntuaciones diferenciales y las típicas. Se presen­I an sus principales propiedades y la información que proporcionan ambos tipos de puntuaciones.

Los objetivos de aprendizaje que se persiguen en este tema son los siguientes:

91

Page 44: Libro Análisis de datos.pdf

111' 1:\ nI' 'is

[y ~ber ~plicar el índice de Pearson para analizar el grado y d a lmetna de una distribución .

. is tit guir ~ntre los distintos tipos de puntuaciones: directas, diferen­,li s y típIcas, la información que proporcionan y sus propiedades lu nd mentales.

.. MI 'BlnAS DE VARIABILIDAD

l" 11 1 l ma anterior vimos que uno de los aspectos más rele~antes a la 11 0)' l I racterizar una distribución de frecuencias es la tendencia cen­(1" \ I 1, l. ~atos y se presentaron las tres principales medidas que resu-111 ' n I Iméncamente esta característica. Sin embargo el estudl'O de II I 'b . ,una

. ' n u~lón resultaría incompleto sin el análisis de una segunda propie-lu I l n Importante como la tendencia central; esto es, la variabilidad de

In,' la to. La variabilidad o dispersión hace referencia al grado de varia-11 qu hay en un conjunto de puntuaciones. Por ejemplo, en la figura

, ', 1 s mue~tra la rep.rese~tac!~n gráfica de dos distribuciones que pre-, 111 n la ml.sma medIa antmetlca pero que difieren en la variabilidad de ,' li S puntuacIOnes.

30 25 20

n,a 15

10 5 O

r--

r-- i--

,-- 1---

2 3 456 7 89 X

30 25

20 n.º 15

10 5

O

r-- -

==fi Il== 234 5 6789

X

III! Ira 3.1. Representación gráfica de dos distribuciones; a)menos dispersión. b) más dispersión.

(ll\ l fin de cuantificar la dispersión presente en los dat s, s ' I1'Ul I '1' 1I

IIll1n rosas medidas o índices de variabilidad. Dos tipos de índ i 's s \ I 11 \

11 li slinguir: aquellos que miden el grado en el que las puntua ion's s \ 1 \

I I \ 1 \ diferencian entre sí, y aquellos otros en los que la disp r i 1 S 111 d 11 l ' sp cto a alguna medida de tendencia central como la media ari lll1 I \

11 's l tema se van a estudiar dos índices del primer tipo: la amplitu I 101 ti II p Y la amplitud semi-intercuartil. Del segundo tipo, y de gran in I 0 1'( \11

I l'l1 la estadística, se van a describir la varianza y la desviación lfpi HI •

T :nto unos como otros son útiles para el estudio de la varie: bi lidll I 11 IlIlI di tr:ibución de frecuencias, pero resultan poco adecuado lWIl lo

1I Iln de comparar la dispersión de dos o más distribuciones. Para r \ " ,/, \ III h análisis, un índice apropiado y que se presenta en este telTla 's ·1 'o I ¡ ' ) te de variación que se basa en la relación entre la desviaci 1 I I l ' \ 1, n dia de cada distribución de frecuencias.

. l. Amplitud total o rango

Una primera aproximación a la dispersión de los datos es el fJ di ' \ ti Il11plitud total, también denominado rango o recorrido, de las obs rva ' ¡O\l

La amplitud total, denotada como AT, de un conjunto de punW'¡ ·jo­nes es la distancia que hay en la escala numérica entre los valor s 1\1' representan la puntuación máxima y la puntuación mínima. E d' '11',

1)

Page 45: Libro Análisis de datos.pdf

' U ' 1I1 lo H, lIlIdll\(), ItI' tI ' ,1> tj:II110, l 011 V \1 ti 1 .. 'wllllIlI 11'1, IH JUIl ­

tu ión máxjl a " '1 1 mil' , , t S 11 ri( \' ti J inL 'rv lo 111 x il11 y h puntuación mínima es 1 límiL xacto inf 1'i I d 1 int r v Jo mínim (v e el apartado 1.6 del primer tema).

V(\ \111.0S un ejemplo.

3.1. La siguiente distribución de frecuencias corresponde a de los alumnos del ejemplo 2.2 del tema anterior.

Nota (Xi) ni

5 135

6 66

7 45

8 36

9 18

L 300

,1lLl';;UJLV;:' la amplitud total o rango de la distribución.

se asume que es continua con amplitud de intervalo igual . Por 10 tanto, la puntuación máxima es Xrnáx = 9,5 Y la mínima es

= 4,5. La amplitud total es igual a AT = Xrnáx - Xrnín = 9,5 - 4,5 = 5.

Como se puede apreciar, este índice es muy sencillo de calcular y utili· '1. I I uy poca información del conjunto de puntuaciones, ya que se trata

t ,I() 1 la diferencia entre el mayor valor (XrnaJ y el menor valor (Xmin) de 1" ' 11 di. Por otro lado, y como consecuencia de lo anterior, su principal 11 tI\lV , .. ti ente es que es sensible únicamente a los valores extremos de la II 11 IlIl ' i n . De esta manera, este índice no captura la poca o mucha dis-

I I '1 11 IU pueda existir entre los restantes valores, que son la gran mayo· I 1" , J untuaciones. Aún así, en el análisis de datos se recomienda

I ." , Y d 'sviaci(m (í"ka

1, 1, v riabilidad lal11bi n pued basa r '11 1:,\ 11 I 111

1, ' \111' 1 a puntuaciones y un valor entral d I IIH dio aritmética. De este modo, una distribu i n

, 111 ' lI a n la que la mayoría de las puntuacion 't 11 1l1l1 .Y pi 11

, 1, 111' li , mientras que en una distribución con I11U h'\ v1\"¡lIh 1 I'lIl1tu iones están alejadas o muy alejadas d 1 val r n ' Iio 1, 1

111 I11I 'r índice que nos podemos plantear de forma lógi a 's ,1 PI '(

1 lIs d sviaciones o diferencias de cada puntuación con r 'S lwvto I \,

11,,1 1 ma de este índice es que, según vimos en la primera propi (1 I

I I "1 de la media en el tema anterior, el sumatorio del I1UIl1 ' \'II In

, . ' ), iempre es igual a cero, por lo que no sería una buena 111 ' 11 I I " ¡Iidad.

11 ,1 fin de poder utilizar un índice con estas desviaciones vit 'IlIde I I ual a cero, se han propuesto dos soluciones. La primera ollsL 1

I IIlur el valor absoluto de cada desviación antes de realizar la S UIII ,

lid un índice denominado desviación media cuya expresi I 'S la siguiente:

n n

I \ vi ación media se emplea muy poco en la actualidad, d I co manejable matemáticamente por el uso del valor abs IlIt o, le

I 11 vado a que apenas existan técnicas estadísticas basada

Page 46: Libro Análisis de datos.pdf

' ()II

S I1

I l ar/anza d un onjunto d n puntuaciones en una variable X, d ' 1101 1. h p t l, define como el promedio de los cuadrados de las d . vh ' 1 I ' d la puntuaciones con respecto a la media. Matemáti­

xpresa como:

2 _ (XI - X)2 + (X2 - X)2 + ... + (Xn

- X)2 _ L (Xi - x)2 X - n n

0(1' \ rol'l a alternativa de calcular la varianza que se deriva de la fór-111111 \ '\ 11 L ri r y que simplifica los cálculos es la siguiente:

2 Lx2 - 2 5 = --' - X x n

importante darse cuenta de que, para el cálculo de la varianza, pri­levan al cuadrado las diferencias y después se obtiene el prome­

as desviaciones al cuadrado.

~!:J1.1elmll)lo 3.2. En la tabla adjunta figuran las puntuaciones de 5 alum­n la variable aptitud espacial del ejemplo 2.1 del tema anterior. La

Li .. ¡.I&C;;I.Ué:l que se obtuvo fue de X = 123. Calcúlese la varianza de las pun-"wC"';!\J!1t;~ con las dos fórmulas propuestas.

Aptitud espacial (Xi) (Xi - X) (Xi - X)2 x.2 •

133 10 100 17689

120 -3 9 14400

125 2 4 15625

115 - 8 64 13225

122 -1 14884

178 75823

__ LX¡ - 1232 __ 75823 5 5 15129 = 15164,5-15129 = 35,6

I nr tI a parte, cuando los datos se presentan en tablas d di s lrit ti ' ¡611

11,'r 1 ncias agrupados o sin agrupar en intervalos, la varianz'l ., pu ' I ' I I 1\ ' 1' utilizando las dos expresiones equivalentes siguientes:

úlculo de la varianza en tablas de distribución de frecuenciaH con datos agrupados o no en intervalos

,danza a partir de una distribución de frecuencias absoluta

52 '" n.X2 - 2 '" nX

2 - 2

x=L.J, ' - X = L.J, '-X Lni n

d nde:

/1 es el número total de observaciones.

; es el valor i en la variable X ó el punto medio del intervalo.

11; es la frecuencia absoluta del valor o intervalo i.

Page 47: Libro Análisis de datos.pdf

IJH

al'l ti '.1. a 11 ti f.' ' ti IU; 1, l ' I allv, :

dlll l( l ':

/ JI ia r la tiva o proporción de observaciones del valor d -1 ¡ 111 l'val i.

Calcúlese la varianza de la distribución de frecuencias 1, abiendo que la media aritmética es igual a 6,12.

PI (X¡- X) (X¡ - X)2 n¡(X¡- X)2 X 2 . n¡Xl

0,45 -1 ,12 1,2544 169,344 25 3375

0,22 -0,12 0,0144 0,9504 36 2376

0,15 0,88 0,7744 34,848 49 2205

36 0,12 1,88 3,5344 127,2384 64 2304 18 0,06 2,88 8,2944 149,2992 81 1458

300 1 481,68 11718

la primera fórmula:

S2 = Lni(X¡ -6,12)2 481,68 = 1,6056:::: 1,61 = x 300 300

la segunda fórmula:

p;.;...~-(6,12)2 = 1 ~~~8 -37,4544 = 39,06-37,4544 = 1,6056 '"' 1,61

.w.~.ClJ.JLU.U la tercera fórmula:

_x2 = (0,45 ·25+0,22·36+0,15·49+0,12 ·64+0,06 ·81)- (6,12i =

- 37,4544= 1,6056 "" 1,61

- 1,62 2,6244 34,1172 64

0,36 1,38 1,9044 34,2792 121 21 78

0,20 4,38 19,1844 191,844 196 1960

1,00 525,78 5153

_(962)2=5153 -925444=103,06-92,5444=10,5156,",10,52 , 50 '

.x~ - X2 = (0,04 ·4+0,14 ·25+ 0,26·64+0,36 ·121 +0,20·196)-(9,62)2 = ¡ ¡

,06-92,5444 = 10,5156 "" 10,52

. mo se puede observar, la varianza, al basarse en diferencias al cua­I I ,es un número positivo que se expresa en las unidades de la variabl '

I uadrado. Por ejemplo, supongamos que la variable X se mide en metros, , te caso, las desviaciones de las puntuaciones con respecto a la meclh

I X), también vendrán expresadas en metros, mientras que al elevarlas 1 'uadrado, (Xi - X )2, las unidades se elevan al cuadrado. Por lo tanto, la

Page 48: Libro Análisis de datos.pdf

iÓJ típi a .

1 I ' 1 d ti 1 • I 'I '() "

·1 1'111 I logl',tl' tllll ti al n i danza y . '

1, I elc', v/a lÓ'n típica de un conjunto de n puntuaciones, que se repre-I lit I I 01' " la raíz cuadrada de la varianza y la fórmula para cal-,,1" '1 t 's:

s = J'I(X, -X)' x n

'1" llIt o h vari anza como la desviación típica son índices de dispersióll IIIII ,Y \It i l 's ' n 1 desarrollo posterior de la estadística inferencial estando 11

1 I h ,.' ' el \ 1 umerosas técnicas estadísticas. Por lo general, a la hora de cual tr I' \1 ' h vari abilidad de los datos, la desviación típica se suele utilizar má I\H' 1 I v' ld nza debido a que se expresa en las mismas unidades de medid \ lit • 1\ v d able objeto de estudio. Asimismo, ambos índices presentan un'!

lOO

I pI' piedades de las que pueden destacarse las siguientes:

1, ni álculo de la varianza y la desviación típica, a diferencia de otros 1 d i s de dispersión, requieren el uso de todas las puntuaciones

o b rvadas en la distribución.

La varianza y la desviación típica miden la variabilidad de los datos con r \ p eto a la media aritmética, por lo que únicamente deben aplicar ' si tamos utilizando la media como medida de tendencia centraL

varianza y la desviación típica siempre son no negativas, es decir, I u d n ser iguales o mayores que cero. Son iguales a cero única­n nte si todas las puntuaciones son iguales entre sí. En este caso, n habría variabilidad o dispersión en los datos. En el resto de los casos la varianza y la desviación típica son positivas, siendo sus valore ' mayores a medida que aumenta la variabilidad de las puntuaciones.

i a las puntuaciones de la variable X les aplicamos la siguiente trans­r r mación lineal: Y; = bXi + a, la varianza de las nuevas puntuaciones y

J s tant '.

el variabilidad r la ionado on la varianza y ¡ti ' tadística s la cuasivarianza que s d fil1 0 1110 :

2 ¿(Xi _X)2 S = --=-'---..:._-"--

'1- 1 n-1

d 11 , P r n - 1, en lugar de n como en la varianza . De forma al1(l -

11 t, ¡ I viación típica se define como la raíz cuadrada de la LI 'l s i.

I ¡dente de variación

' U nte que uno de los objetivos del análisis descriptivo d 1< s 1'1 comparación del grado de variabilidad o dispersión entre d s

IlItll I puntuaciones en una misma o distintas variables. Debido a I 1" lo general, las variables objeto de estudio se miden en unidad s 1, n tiene sentido compararlas en base a los valores de sus varian­,11 .'vi ciones típicas. Para paliar este inconveniente es necesario d [ i­

I! flldlce de variabilidad relativa que no dependa de las unidades d .11. Un coeficiente que cumple con estos requisitos es el coeficiente d

1111 , que se expresa en porcentajes y se define como:

cv = S~ .100 X

10 1

Page 49: Libro Análisis de datos.pdf

I " dll pi" 1 111 Ihll 'elll O .Y I 'Hvi ' -¡ n Lípi-

E.' Iml rt' 1 l 1" altar qu uand omp ram d conjuntos de pun-1" 1 -¡O" 'H bl 1 id d la misma variable, también es necesario el coefi­, ' 111 I 1, vari ión para comparar la dispersión de ambas distribuciones, IJIII '1IIll ' l1l po ible utilizar la desviación típica cuando la media d' IlId OH 1'1I1 s es la misma, y, en ese caso, llegaríamos a las mismas con-\ lit ion 's ' n ambos índices.

lO

V 'ti lííOS un ejemplo:

.S. Se desea saber si la distribución de frecuencias de las alumnos del ejemplo 3.1 presenta un mayor o menor gra­

lI!lJiStlE~rsj en comparación con las puntuaciones de una segun­de alumnos en un test de inteligencia general en el que han una media de 102 y una varianza de 17,3.

de los alumnos del ejemplo 3.1 presentan una media de varianza de 1,61. Por tanto, la desviación típica es

y el coeficiente de variación es igual a:

CV:::: S~ .100= 1,27 .100=2075 1 X 612 ' ,

~liinm()s de la segunda clase, con una media de 102 y una desvia­

.-""'"'-'\...<1 de Sx = .J16 = 4 obtienen un coeficiente de variación igual a:

S 4 CV2 = ~ ·100=-·100 = 3,92

X 102

de variación de la primera clase en las notas es del mientras que el de la segunda clase en inteligencia general es

Por lo tanto, dado que el coeficiente es mayor en el primer podemos concluir que el grado de dispersión de los datos es en el primer grupo, siendo el segundo grupo más homogéneo

It Jllil ud semi-intercuartil

Il'Inl za y la desviación típica, junto con la media aritmética, son lo. I ' OS r comendados para estudiar la variabilidad y la ten den i;, . ' 11

,""\ distribución de frecuencias. Sin embargo, como se ha n '11 ' lo I 1 ," viamente, en ocasiones, y debido a la asimetría de la distr ibu ' 1011 ,

I 'OJ) ' jable el uso de estos índices y debemos buscar una ah rn ' \llv \, 1 l . ir unstancias, un índice resistente de dispersión adecuado,

~ 11 ' l junto con la mediana como medida de tendencia central, I IlId mi-intercuartil.

1" amplitud semi-intercuartil, Q, o rango semi-intercuartil e ' h 1 111 ia media entre el tercer y el primer cuartil. Es decir,

Q = Q3 - Q1 = P7S - P2S

2 2

CIl o se puede observar, este índice no informa de la variabilidad d ,1 IlInto de puntuaciones, sino del 50% de las mismas comprendidas 'ni,"

l' ' -ntil 25 y el 75 de la distribución.

Page 50: Libro Análisis de datos.pdf

I () I

l' 111111 1111 ' ' 1IIplll:

x XI ni na

13-15 14 10 50

10-12 11 18 40

7-9 8 13 22

4-6 5 7 9

1-3 2 2 2

L 50

.'i"io_~_~_5 = 37,5, por lo que el intervalo crítico es [10,12] con na = 40.

la fórmula:

[

n.75 J [ 50 ·75 J P. =L.+ ToO-nd .1 = 95+ 100-

22 ·3=1208

75 1 n ' 18 ' e

50·25 = 12,5, por lo que el intervalo crítico es [7,9] con na = 22. 100

_ :nao la fórmula:

L.+ ToO - nd ·1 = 65 + 100-9

·3=730769===731 [

n . 25 J [ 50 ·25 J 1 nc ' 13 ' ,

'ología, n concreto, en la construcción de escalas de ac liLud s, 111 1II 'r uartil (P7S-P2S ), se ha utilizado profusamente en aqu ' 11 ,

1 lid ' lIl de selección de ítem s en los que se tiene en cuenta la v'llo 11 dI' JII' S o expertos en la materia.

E DE ASIMETRÍA DE PEARSON

1I Y , 1110 se ha señalado en el primer tema, otra propiedad de un a lis 1 1111 d [Tecuencias relacionada con su forma es la asimetría s ':'Ip'Il .

Iw'tr{a de una distribución nos indica el grado en el que las p 111111 \

ti I s sujetos se reparten por debajo y por encima de la medid 'l I _r1ll. ... ,.ll iH ntral. Asimismo, en ese tema vimos cómo, mediante la r I r '-

1011 gráfica de la distribución, podemos realizar un primer anális i: l·1 rado de asimetría y observar si ésta es positiva o negativa. En sI '

1 limo a proponer un índice numérico que cuantifique esta propi \ I J> . ntre los numerosos indicadores, hemos seleccionado el índic d \

de Pearson que se basa en la relación entre la media y la moda y I 111. licamente se expresa de la siguiente manera:

mil 'e de asimetría de Pearson

X - Mo A = --­

s S x

, trata de un índice adimensional (no tiene unidades de medida) qu ' "Ika a distribuciones unimodales. Cuando la distribución es simétri ' 1,

1 dia y la moda coinciden, por lo que el numerador se anula y el valo l' " = O. En distribuciones con asimetría positiva, la media es mayor qll '

105

Page 51: Libro Análisis de datos.pdf

\ 111 1 HII , p n l lo qll l ' \ 1l ll' II' ' l \ IH'l 11 "

O. En lo I'i l 'lIl 'H .2 . ' 1 \ lu (s il ' l rf d L1 11 \

I . Mo

30 s

2 1 __ -1 n.' 1

o ¡-...-5 o 5 o

1

-

3

h r 1r-4 5 6 7 8 9 X

30 25 20

n·' 15 1 o 5H o

1 2

1--

l rt1 3 4 5 6 7 9X

X=6,64 Mo =8

JI 1I hll '1 )n sil11 lI-ica:

Mo=H =3,36

Asimetría positiva: Asimetría negativa:

\ M() ~ As =0 X> Mo:::::>As >0

t ll lll ' 1 t 2. 1 ' la ' i n entre la asimetría de una distribución y el índice de PearSO il ,

V IIlI OH UIl .i m plo:

IO t1

los datos del ejemplo 3.4, calcúlese el índice de asime­¡ .. 'OI:ILU~~~.u\JLvque la media es 9,62 y la varianza es igual a 10,52.

X Xi ni

1-3 2 2

4-6 5 7

7-9 8 13

10-12 11 18

13-15 14 10

L 50

III·V la'-'JLV.u típica es Sx = JSf = JlO,52 = 3,24, Y la moda es el

del intervalo modal [10-12] que es 11. Por lo tanto,

= X -Mo = 9,62-11 = - 1, 38 =-0,4259 ",,-0,43 As Sx 3,24 3,24

2 5 6 11 14

l' 111' 3.3. Representación gráfica de la distribución de frecuencias del Ejemplo 3.7.

I lJNTUACIONES TÍPICAS

I I In ahora hemos tratado fundamentalmente con puntuacion 'H

I l . (puntuaciones de un sujeto en un test, etc.). Son los p rim r s 1, los que habitualmente disponemos pero la comparación de las

II ' i nes directas de un mismo sujeto en dos variables distintas pu ,_ u-nos a confusión, ya que las puntuaciones directas nos oír n

10 información. De hecho, conocida una puntuación directa I

1110 ' i se trata de un valor alto o bajo porque esto depende del p i 0 -

o I 1 grupo.

I una puntuación directa Xi le restamos la media de su grupo obl '_ I ' una puntuación diferencial o de diferencia, que representamos pOI'

cula) y que, por tanto, viene definida así:

x . =x - x 1 1

lO?

Page 52: Libro Análisis de datos.pdf

L, 111111111 II 111 11 ' ti I l ' ll ll í di Ipl llllll 111 ' IlI CII lll llloll : 110 . IId l 11' . 1, 1'"11111 Il' 111 '01 1' Id , '(j I! 1I 111 1 1 I . ti '1l lpO, ,' 111 1 -!'1m () 's SUI ' dOl

, t ll \. I ~\ t t\~ , luntuu i<>n 's 1 r H 'Il l \11 I'\H si tli 'l1l 's I 1'()1 i \ lu I ..

"'::=L= L(Xi-X)=LXi - i x =LXi_ nX =X-X= O n n n n n

I La va ri anza de las puntuaciones diferenciales es igual a la varianZ~l

( 11 1,. I ~11l1 la iones directas:

POI' l' \n L ,al restar a las puntuaciones directas su media hemos obteni­do !l ila 1 Ll va escala con media O y con idéntica varianza a las puntuacio-11 '.' Ii 1" L . Sin embargo, dos puntuaciones diferenciales idénticas pueden II II ' 1' In ignificado muy diferente en función de la media y de la varianza (11' IlIs I i lribuciones de las que proceden. Para eliminar este inconveniente

• IIt ilizan las puntuaciones típicas . Las puntuaciones típicas van más allá IIOS p rmiten no sólo comparar las puntuaciones de un sujeto en dos

' I,'hbl distintas sino también comparar dos sujetos distintos en dos prue­I Il ' () variables distintas.

U n p untuación típica viene definida por:

x x - x z =-=--x S S

x x

Al proceso de obtener puntuaciones típicas se llama tipificación, por o tivo estas puntuaciones se denominan también tipificadas.

l in realidad una puntuación típica indica el número de desviaciones li le que se aparta de la media una determinada puntuación.

IOH

1111 1111 H' (I \l í ' II p I 1 11 ' 111 1 11 111 pi " 11 1'" "It .. 11 II It·d I 1 '. 'l' ro

z = LZx = .\' n

1) 11 v ll'Íanza es igual a 1

n n n n

, IHlIlluaciones típicas reflejan las relaciones entre las punlu a iOIl '.'

1111 1 " ndencia de la unidad de medida . Por este motivo permi t n 11 <1 ' '1' 11' 11 ' \ 'i nes entre distintos grupos e incluso entre distintas vari a ll 's.

3.8. Demostrar para las siguientes puntuaciones de 5 ni IISllgnlatllra x: 6, 8, 7, 10 Y 4 las propiedades de las puntuad n .ü,~~a.L~" y típicas señaladas anteriormente.

x x (x - i)2 z~ (zx - zx)2

6 -1 1 -0,5 0,25 8 1 1 0,5 0,25 7 ° ° ° ° 10 3 9 1,5 2,25

4 - 3 9 -1 ,5 2,25

L ° 20 ° 5

unlluaClOIles Directas:

IO(

Page 53: Libro Análisis de datos.pdf

n

S2 = I {X-X )2 = 20 =4=Sx2

x n 5

ümmt:ualc!ones Típicas:

z = LZx =.2.=0 x n 5

S2 = L (zx - ZJ2 = ~ = 1 Zx n 5

b SL' t ma se ha centrado en un aspecto fundamental en la caracteriza· ' 011 I una distribución de frecuencias: la variabilidad o dispersión de los

d " )10;. han descrito las medidas de variabilidad que se emplean habi . Ilmlm nt , haciendo hincapié en las dos más relevantes en el campo de la " In 1 s U a: la varianza y la desviación típica. Asimismo, se ha presentad< IIIl no j ,el coeficiente de variación, que resulta útil para el estudio com­"mülv de la variabilidad en diferentes conjuntos de puntuaciones.

A ntinuación se ha analizado otra propiedad importante de una di -1I 1I II i n relacionada con su forma como es la asimetría o sesgo. Con el fin ti ' U'H Lificar el grado asimetría de una distribución y detectar el tipo d' l . In 'tría, se ha presentado el índice de asimetría de Pearson, basado en la

I I leí n ntre la media y la moda del conjunto de las puntuaciones.

1 r último, se han definido las puntuaciones diferenciales y las típicas 1I1 • s \ d rivan, a través de una transformación, de las puntuaciones direc-

1 1 o' 1 s sujetos. Se han estudiado las propiedades de cada tipo de pun-111 I( ¡ n así como la información que podemos obtener a partir de ellas p II 'H 1 d r comparar entre sí a los sujetos, o al mismo sujeto en diferen-1 . v. riables.

I I ()

ión típica de una distribución de frecuencias: A) \ 1 l' • 1 1' 11 h mismas unidades de medida que las puntuaciolle ; I ) , ' pl"'S'1 n las mismas unidades pero elevadas al cuadrado; C) no 11 •

" t III i lades de medida.

" ,11 1111 distribución marcadamente asimétrica, se recomienda n '11 1'

II !lls l rsión de los datos con: A) la amplitud semi-intercuartil; 1 ) 1I , 1I1 "'Iza; C) el coeficiente de variación.

I' II 1 tudio de la asimetría de una distribución de frecuencia s \ 1, I

111 .' l-vado unAs = 0,80. La media de las puntuaciones es: A) igu 'll ¡IIl'

1, 111 da; B) menor que la moda; C) mayor que la moda.

1. 1 variable X toma los siguientes valores: 50, 26, 35, 64, 34, 28, 73, 45, IH, 52, 54, 67. Sabiendo que la media es 48, la varianza es igual a: A) 15'

11) 213; C) 115. '

El valor del rango en los datos del ejercicio anterior es: A) 73 ' B) 2 ( ) 48. '

1, I iguiente gráfica se corresponde con las notas en lengua d 80 111 os de una clase de Primaria. Se sabe que la media es 4,63.

111

Page 54: Libro Análisis de datos.pdf

~ ! , 6 5 4 3 2 1 O

----

1-1-1--,....--

--~~

.~

I ~ 10

La d viación típica es igual a: A) 1,97; B) 2,53; C) 3,88.

\,'J, 1':11 los datos del ejercicio anterior, ¿cuál es el valor de la amplitu 1

loVII?: A) 8; B) 20; C)10.

1 linuando con el ejercicio 3.8, el valor del índice de asimetría d \ , J on es: A)-0,09; B)- 0,19; C)-0,18.

n los datos del ejercicio 3.8, a un sujeto con una puntuación de X = 7, ¿qué puntuación típica le corresponde?: A) 0,61; B) 1,20; C) 2,37.

¿ Cuál es el coeficiente de variación de la distribución de frecuencias I 1 ejercicio 3.8?: A) 83,80; B ) 46,32; C) 42,55.

, f) acuerdo con los datos del ejercicio 3.8, la amplitud semi-inter­. lartil es igual a: A) 3,56; B) 1,35; C) 2,69.

L I n la tabla adjunta se muestra la variable edad agrupada en inter-valo cuya media es 50.

X ni

66-75 7

56-65 7

46-55 13

36-45 3

26-35 10

a desviación típica es: A) 13,96; B) 194,75; C) 6,50.

1 I ;¿

ti ' (UIIl ' 111 'sl lll 11 ' l' , 1 ,

1 ' \1 '1'c.1 a la di tribución del ejercicio 3.14, un uj l

I h JI 1I1l'l P II1tuación diferencial de: A) - 5; B) 5; C) O. I 55 '\ lO,',

t )n para la variabilidad de las distribuciones de fr cu '1 ias 1, 1, I t, l' ,¡ io 3.8 y 3.14, se concluye que la dispersión: A) s mayor ' 11

1 .. I H Inl 1I ción en lengua; B) es mayor en la variable edad; C) e la mis-11\ \ l l' ambas variables.

IlI lal

de asimetría de Pearson NO se puede calcular cuand : A) h es continua; B) la distribución es bimodal; C) la amplHud

superior a diez.

l ' 'alizamos la siguiente transformación lineal con las puntuacion 's t I ¡ , V = 14 + 4z , la varianza de la variable V será: A) 14; B) 4; C) 1 .

OLUCIONES A LOS EJERCICIOS DE AUTOEVALUACIÓN

I olución: C I in varianza mide la dispersión de los datos con respecto a la medi a, I d y como se puede apreciar en su fórmula (ver apartado 3.2.2).

I Solución: B )~ = 3Xi

gún la cuarta propiedad de la varianza y la desviación típica (ver apa 1'­

lado 3.2.2) la desviación típica de las nuevas puntuaciones es S y = IblSx· i n este caso, Sy = 3Sx, es decir, es igual a la desviación típica original multiplicada por tres.

I \, olución: A La desviación típica, a diferencia de la varianza, se expresa en las mis­mas unidades que la variable medida (ver apartado 3.2.2).

Solución: A En una distribución asimétrica no es recomendable utilizar la med ia como medida de tendencia central. Como consecuencia, la varianza,

11

Page 55: Libro Análisis de datos.pdf

'111 ' , , " 1 \ ,'1 1 1 ,

1'1 (lItH ' 1I Id 1" 1)1111 di ' \11 1I 1 ' di. I ' 1', 1(1\1

L', ()1t1 '1 )11 :

p , I p \ 1 \ 1111 '" 1, I 11"1 H) ' ()

IIlIplllll I I ' 111 . 111t ' \' 'unt'til , 1111

Il'lu lo ,2, ),

'J' tI .Y ' ()\l)O S in Ii a n I ap rl .d 3.3, uand 1 índi de asimetrfll I l' I 11 'so 11 's J ' jtiv (A" = 0,80), la m dia mayor que la moda.

0 1 •• '() Iu ,¡ )n:

X R

Xi (Xi - X) (Xi - X)2 X 2 . 50 2 4 2500 26 - 22 484 676 35 -13 169 1225 64 16 256 4096 34 -14 196 1156 28 -20 400 784 73 25 625 5329 45 -3 9 2025 48 O O 2.304 52 4 16 2704 54 6 36 2916 67 19 361 4761 ¿ O 2.556 30204

S2 = I.Xi2

- 482 = 30204 - 2304=2517 - 2304=213 x 12 . 12

.l. 80 lu ión: C

Xl11 áx = 73,5 Y Xmín = 25,5. Ar = Xmáx - Xmín = 73,5-25,5 = 48

.H. So lu ión: A

. • 1 "1 1111 • I 1,, \, lO 1 HO I ( tO lOO ti ). 7') H I I 12 H 4 77 25 7 5 7 245

12 8 4 2 5 20 56 500

12--- -4 36 16 192 3 11 24 9 99 2 9 13 4 36 1 4 4 4

¿ 80 2026

X= 4,63

S2 = I. ni X i2

_ (4 63)2 = 2026 - 21 4369 = 3 8881 x 80 ' 80' ,

Sx =~3,8881 = 1,9718;0:: 1,97

n :C

olu ión: B

= 4,63 Mo = 5 A = X -Mo = 4,63 - 5 = - 0,37 =-018781 ;0::-01 s Sx 1,97 1,97' ,

\ lución: B

x-x 7-4,63 X = 4,63 Sx = 1, 97 Zx = - S- = 1 97 = 1,2030 ;0:: 1,20

x '

lución: C

X =4,63 Sx = 1,97 CV = S~ .100= 1,97. 100 =42,54859 ;0:: 42, 55 X 4,63

JI

Page 56: Libro Análisis de datos.pdf

\ , 1 \ 11111 (111 ' "

\,1 ,

I 111

( I / ) 11 ,25

, 100

,5 1 '0111/ (/ = 24.

HO ,2 100

20, 101' lo ItI · ·1 inl Iv llo ' 1' li , . l2 , ~

- - n ---13

[

n . le J [ 80·25 J P2s = L¡+ 100

nc el ·1=2,5+ 10~1 ·1=3,136""3,14

n·75 80·75 (\ P7~ ' 100 = 100 = 60, por lo que el intervalo crítico es [5,5-

1,5 1 ' 11 n" = 68 .

[

n . k J [ 80 . 75 J - - n - - -56

p. = L. + 100 el. / = 5 5 + 100 ·1 = 5 833:::: 5 83 75 In' 12 "

e

Q = P75-P25 = 5,83-3,14 = 1345",,135 2 2 ' ,

lución: A

X Xi ni na X,2 1 ni X/

66-75 70,5 7 40 4970,25 34791,75

56-65 60,5 7 33 3660,25 25621,75

46-55 50,5 13 26 2550,25 33153,25

36-45 40,5 3 13 1640,25 4920,75

26-35 30,5 10 10 930,25 9302,50

2: - 40 107790

11111 -i n: B

1'1 I - ' nLil 25 :

Sl . , II IX/ (50)

40

= 107~_ 25 0 = 194 7S 40 '

Sx= J194,75 =1 ,9552 ",, 13,6

/1 ' t = 40 ·25 = lO, por lo que el intervalo crítico e [26-35] n 11 /1 10, lOO 100 1)1 ¡ - ndo la fórmula:

P =L.+ loü- nel ·/ = 255+ 100 -O .10 = 355

[

n.k J (40 ·25 J 25 1 n ' 10 '

e

l' l ' entil 75:

/I :.!5:.. = 40·75 = 30, por lo que el intervalo crítico es [56-65] on /11/ n , 100 100

Al licando la fórmula:

p = L. +(f06-- nd J. / = 55 5+(_40"-'10"-'" ~,-5_2_6J .10 = 61,21

75 1 n ' 7 e

Q = P75 -P25 =61,21-35,5=12,855::::12,86 2 2

I h , olución: e = X -Mo = 50-50,S =-003581

As S 13 96 ' x '

Page 57: Libro Análisis de datos.pdf

1,

50 "/ = - 55 - 50 = 5

3.18. Solución: A

Coeficiente de variación de lengua: CVL

== 42,55.

Coeficiente de variación de edad:

X=50 Sx =13,96 CV = S.! .100= 13,96. 100 =2792 E X 50 '

Dado que CVL > CVE , existe mayor dispersión en la distribución de las puntuaciones en lengua.

3.19. Solución: B

El índice de asimetría de Pearson se puede calcular en variables con­tinuas y con cualquier valor en su amplitud total. En cambio, no s puede calcular cuando la distribución es bimodal (ver Apartado 3.3).

3.20. Solución: C

118

Page 58: Libro Análisis de datos.pdf

Análi njunlo d dos variables

4.1. Introducción 4.2. Conceptos previos 4.3 . Asociación entre dos variables cualitativas 4.4. Correlación entre dos variables cuantitativas

4.5. Regresión lineal

4.6. Resumen 4.7. Ejercicios de autoevaluación 4.8. Soluciones a los ejercicios de autoevaluación

Page 59: Libro Análisis de datos.pdf

IN I IU)J)UCCIÓN

I 11 los l mas estudiados hasta ahora, nos hemos limitado al análisis y I l!l I H de una variable. En Psicología, y en cualquier otra disciplina de It 1101 inadas Ciencias de la Salud, es frecuente trabajar con varias I I . I bteniendo en ello más información. En este tema nos limitare­" I'Slldio conjunto de dos variables. En primer lugar consideraremos

, C I l· dos variables cualitativas (clasificadoras o categóricas y medidas \ idn I ominal) y, posteriormente, analizaremos el caso de dos variables

111 (¡divas (medidas en una escala de intervalo o de razón).

Nc, , nsideraremos, separadamente, las variables cuasi-cuantitativas, I ,lis n una escala ordinal. Estas se pueden elaborar con las mismas

IS, que indicamos para las variables cualitativas. Trabajando así no I 11 ' n cuenta la información que aporta el hecho de que sus valores

11 ClI ' ] nados. Por supuesto, existen métodos de análisis apropiados, que 11 'n cuenta la información de orden de estas variables, pero no vamos

pll ' lrlOS aquí.

I 1I , [ caso de dos variables cualitativas utilizaremos la tabla de datos, I CII '(II'" mos la tabla de contingencia, el diagrama de barras, y la tabla de

1\ JI ias entre frecuencias empíricas y teóricas, para su representación I In, Aprenderemos a calcular el coeficiente Xl, y el coeficiente de con-

1I i ,para el estudio de su grado de asociación. Veremos las propieda-111 Jldamentales de estas elaboraciones, su cálculo, su aplicación a casos

, l ' ·t y su interpretación.

"'" "caso de dos variables cuantitativas, X e Y, utilizaremos la tabla de , njuntos. Elaboraremos el diagrama de dispersión como represen­

I gráfica; aprenderemos a calcular la covarianza y el coeficiente de la ión de Pearson como los dos índices fundamentales para el análisis

1, l' ' lación lineal entre ellas. Veremos las propiedades fundamentales de

121

Page 60: Libro Análisis de datos.pdf

Lo, olj ' 1 iv qu pretendemos son los siguientes:

nlre variables cualitativas y cuantitativas, y saber qu hay que utilizar en cada caso.

0 11 0 " 1' m l dos gráficos y cuantitativos para analizar la reja ' 11111

, Isl ' nl ' 'nlr dos variables.

A 1 IlIlrir la apacidad para saber si dos variables están más o m I 't " \ 1011'1 I ' n tre sí, la forma de esa relación, y el significado d los vari 'lbl estén relacionadas.

EII " . d dos variables cuantitativas, entre las que hay rela i 111

III "11, pr nderemos a hacer predicciones de los valores de la varl 1

hl ' Y, rrespondientes a cada valor de la variable X, mediante la r \( I 1 el \ r gresión .

• • ('ONCEPTOS PREVIOS

V:U1 a iniciar el estudio conjunto de dos variables observando 100 11I ·los. Un mismo sujeto tendrá dos medidas, una por cada una deja,

11 ' ti I cogidas. Una de las variables es la variable X, Género, y se an I I 1' 11 ' ada caso si es Varón o Mujer. A cada sujeto le administraremos 1II\

I - I I lra medir el estrés, si padece estrés (Sí) o no (No), yanotaremos I I - 1I1 t do. Nos resulta una lista en la que en cada fila está la información el ' IIII suj to y tenemos cuatro columnas. La primera columna aparece con 1

1I ( II1l 'r del caso, o su identificador. En la segunda aparece el Nombre y

Ap -Ilido del sujeto, en la tercera Varón o Mujer, según proceda, y en la 1 11 lita aparece «estrés» o «no estrés» (Sí o No, respectivamente), según el l' .' tlllado del test. Al final de este trabajo, tendremos una lista de cuatr

I 2

lo dato d ta mu tr d 100 I P nta 1 género o s xo e Y 1 gr ( í padece estrés o No padece estré ).

1 principio y el fin de esta lista de dato (un rel::OJ~er ordenadamente la información, pu d t

valúan más variables sobr e cada sujeto):

Tabla 4.1. Tabla de datos

Género (X) Estrés (Y)

hllCi~¡co Pérez García Varón Sí

Mujer No

Mujer Sí

Ruipérez Rodríguez Varón Sí

1 IIIC, definir el concepto de Asociación y/o Relación entre dos I Ihl ' . Dos variables están relacionadas entre sí, cuando ci - rtos le 11 ' 1'1 , de una de las variables, se asocian con ciertos valores d It l

l' '\riable. Por ejemplo, si tenemos en cuenta las variables Giro • tI' y .. . si sucede que cuando se tiene el valor «Varón» en la val+l­

I (, nero, hay una incidencia mayor del valor «Sí» en la variat 1 -

tll'S, y además, cuando se tiene el valor «Mujer» en la variable G n _ • hay una incidencia mayor del valor «No» en la variable Eslr 's , 'In s que las variables Género y Estrés están relacionadas.

I I

Page 61: Libro Análisis de datos.pdf

11 ' ,hit " ' 11 ' I'() ,

, 11 1111 ' I 11 1 ' JI \ 1\0 I ' 11 ' 1'

1111 .. 1101 1 ' otru 01 i 11 P s ib l ' qu pu' I en ta situa i o : I 1II

101,), V lI 'on 'S ' 0 11 muj r pu d n star equiparados en I s lll o 110 (' ,' 11 ' s, As , n i tiria asociación y/o relación entre las varÍ'l1 1 ( (JII , Id I'U h s,

. A 'O 'II\('IÓN ENTRE DOS VARIABLES CUALITATIVAS

11 ' 111t) ti ' l'ini 1 una variable como «cualitativa» cuando está medid 1 1

11111 l ' (' Jln nominol, de clasificación (tema 1). Estas variables pueden s ' 1

11 ("1, Ii ' <'J I 1111 "15 , uando sólo presentan dos categorías, o politóll111 1

11 IIldo 1 l' 's 'nt tlll un mayor número. También consideraremos como 1111 I 111 ' 1 1'111 11 IS v'ldables que, en un principio, presentan un mayor niv ,1 ti 111 " " d 1 Inl !'vnlc s razón) pero, a posteriori, han sido categorizadas. CUIII 1" , ti , pon ' 1, I ' datos de dos variables cualitativas para todos los suj '11'

d, 11111 11111 S11"1 s puede elaborar la denominada Tabla de Contingencia ,

el ejemplo 4.1, al que ya nos hemos referido, de 100 SIJ.l' lel , ' 11 ' [\ h un de los cuales se han recogido el valor de la variable g ' 11 '

1 (1 , 's il' 's, A partir de la tabla con la información de toda la muestra dl'l HI 1111 lo 4. 1, ontabilizamos los cuatro casos posibles (Varón, Sí), (Val' )JI ,

No), (Muj '1', SO, (Mujer, No) y elaboramos la Tabla de Contingencia d ,1 HI 'I"plo 4,2,

4.2. Hemos recogido los datos de esta muestra de 1 00 suje­variables: X, representa el género o sexo e Y el grado de estré

(Sí padece estrés o No padece estrés). Estos datos, las cuatro combinaciones posibles, aparecen en la

tabla de contingencia:

()

35 60

55 45 100

1111 11 l · Contingencia podemos representarla gráficamente 111 dinllll' 11 I¡ ngrama de barras:

••.• - - ~ - - - - - -- - - - - - - - - - - -- - - - - - - - - - - - -- - - - - - - - - -r-- ----,

"",~ ,--~---, - -- - - - -- - -- - - - - - - - - - - - - - - - - - - - - - -

.. ~'" - - - - - - - - - - - - - - - - - - - - - -r-----j

.. ~

V-Si V-No M-Si M- No

X-y

O Si

O No

1'1 ura 4.1. Diagrama de barras correspondiente al ejemplo 4.2 .

I1 , 'rvamos detenidamente la tabla 4.2 y la figura 4.1, podremos v r III ':

JlI rupo de varones tiene una incidencia mayor de «padece !:) lr s», 111' 1 grupo de mujeres.

10'1 Yrupo de varones tiene una incidencia menor de «no pad 'st!' s» 111 \ 1 grupo de mujeres.

l' 1

Page 62: Libro Análisis de datos.pdf

. " Total fila x Total columna r cuenCla teonca = nI =

n

/\ .. (, I ul'a la Tabla de Contingencia del ejemplo 4.2, tendl' 111111

l' II ' lit 's 1'1" ' LI ncias teóricas:

()I ¡ un ' 1 l , la suma de todas las frecuencias teóricas mar rl ll ti 1' 11 d \ 1\ Slll11a de todas las frecuencias empíricas marginales, . 1' "

j (lj ti 1, t )da las observaciones, n.

,d ' lIl da las frecuencias teóricas, a continuación se puede ' ltll '1'111 h 4.4 d diferencias entre frecuencias empíricas menos frecu ' I\( ' 1

1'1 • 11'\,

Tabla 4.3. Frecuencias teóricas (nt ) correspondientes a la tabhl 4í

y

Sí No

V 40 x 55=22 40x45=18 40 100 100

X

M 60 x 55 =33 60x45=27 60 100 100

55 45 100

12

N)

- 8

IOlld .:

v « VIU ' )1) ), M C<lIHI,I '1', ,

ce¡ ud " ·sl l' .» 'y

No

1111

II

n a la relación entr la variabl s, '1'\ 11 . .. \

valore positivos de la dif r n ia ' ( ' 18), 11 0

1 Sí-V (sí padecer estrés y er varón) y 'nll" ,1 ,d" ,', (',"" /Y: S Y er mujer). Los valores negativos d' lo,' 1 l'

, 1111 11 1 i an una relación negativa entre el No-V (ser I (/1 ( 11

,,,,, 11/1 ¡J al? er estrés) y entre el Sí-M (ser mujer y /o I/ ('I:(/I'/tl ll

'" I ). lJ ni' ndo estos resultados se ve la forma d 1 tl l ' ,1 \!' (111

hl, .. I..n nuestro ejemplo, los varones ti en n UII ' \ 1\1 \ 111

I 11\ I si r s y las mujeres tienen menos tend n ia I I '1\ 1

I , 1\ r rma de la relación entre las dos variables, a l ' tll :lIl1n. ( uadrado) cuya expresión es:

ia empírica (o también llamada frecuencia I .i unl ti

ia teórica (o también llamada frecuencia c njullllI

I ~

Page 63: Libro Análisis de datos.pdf

1, I ,11\ , L ~ , ,nll 11, 1'1 '\ '

1 IIIpll l' ,,1 , 111 Itll"\<I o - \ o ,,(¡I'III :

l 0-22) . (10-18)2, (25 ) . ( 5-222...] = 29 1 356 194 2 I 22 1- 18 1- 3 I 27 ' + , +, 1- "

l!110 li s in nv nientes del estadístico X2 es su difíciliJ l ' 1'1 1 '¡II' pll 'o l o ¡ti \ 1\$ onoc mos su límite superior. Sólo sabemo qu ti '1' , . ' 1'0 , ' Uf\! d n hay r lación entre las dos variables, es de ir , ' ti 111 111 1'1 ' ' ti ' 11 'h s mpíricas y teóricas son iguales en todos los casos. POI' -1111

\ 1'1 11 I s s n ind pendientes.

I ' I" l r \ $ Iv r 1 problema que conlleva la interpretación de la " ,1, ' 11[1 ' - \ )$ varia bles, de acuerdo al valor obtenido de X2 (X cuadra lo) ,

ti -nnj \0 \1 índice o Coeficiente de Contingencia, C. Este índic dol' 's O S < 1. Su fórmula es la siguiente:

Coeficiente de Contingencia = C = fT f~

mplo anterior:

c - rxz - 10,78 = ~O 097 = 0312 -~~ - 10,78 + 100 ' ,

PI valor de C obtenido se puede comparar, dado que la Tabla d \ Iln 'n ia tiene igual número de filas que de columnas (k), con un IlIO I nnido como:

n nuestro caso, para k = 2,

R- 1 .JO:s C . = - = O 5 = O 707 max 2 ' ,

128

I I I 4, , Tabla de frecuencias empíricas, ne> en X e Y

y = Número de aciertos en la identffl Id 11

de olores

O 1 2 3 4 5

rupo Control 18 42 54 I 2 1211

Deterioro ognitivo Leve

6 54 30 30 120

Pacientes de 72

Alzheimer 43 17 12

78 97 65 84 54 12 W ()

I 1)

Page 64: Libro Análisis de datos.pdf

)'

Ntllll IlIt l " rlo n In Id nun 'u " de olores

,~ ,= O 1 2 3 4 5

!"upo Control 25,20 31,34 21,00 27,14 17,45 3,88

D terioro 24,00 29,85 20,00 25,85 16,62 3,69

gn ilivo Leve

Paci nles de 28,80 35,82 24,00 31,02 19,94 4,43

Al zh imer

78 97 65 84 54 12

Tabla 4.7, Tabla de diferencias entre ne y nt

y = Número de aciertos en la identificación de olores

O 1 2 3 4 5

Grupo Control -25,20 -31,34 -3,00 14,86 36,55 8, 1

IIP() d Deterioro -18,00 24,15 10,00 4,15 -16,62 -3,

uro Cognitivo Leve Ivo (GDC)

Pacientes de Alzheimer

43,20 7,18 -7,00 -19,02 - 19,94 -4, '

El valor de X2 = 322,05 Y el del Coeficiente de Contingencia, e = 0,67 ~ 11 11 os tadísticos indican que existe una relación significativa entre lo

(,I' UpOS de Deterioro Cognitivo y el Número de Aciertos en la Identifl l ' ' Ión de Olores. El grupo control tiene el mayor número de aciertos y 1\( 1

1 l' ll ningún sujeto con menos de 2 aciertos. Los grupos con deterioro 11(1

1I ' 11 'n ningún sujeto con más de tres aciertos.

Vi ' to el ejemplo del coeficiente e utilizando tablas de contingencia l · 1II lS d dos filas y dos columnas, pasamos a mencionar las Característictl dl'l oeficiente C. Éstas son:

I ~()

1I\lIIn ll1ay r s el valor d e, mayor 11 I hlL,s, y al r vés, cuanto n1enor es , l1'l ' nol' '. ' In 111 111 ntr las dos variables. Si queremo utiljzar I va lol' 1 \ '

Oll1p rar la relación entre las mismas d varjabl 'S, lI 'yo,

limos en dos tablas de contingencia difer nt y ' n l' 'SI d· 1\ dos investigaciones distintas, tenemos que vigil r 111'"

IIII! IH l bIas de contingencia tengan el mismo número d nhs y I 1 olumnas y aproximadamente el mismo número de datos. ¡ 11 0

I 1\l'1I 1 mismo número de filas, de columnas, y aproximadtllll ' 11

I 1 n lsmo número de datos, los valores de e no perm il ' 11 1111 \

01111 aración válida de la relación de las variables en amb'ls I1I

I

In a pecto más complejo es fundamentar la causalidad ' 11 lIll

.,l'I'¡ Lente de contingencia. Cuando existe un valor el va 1) ' 11

1111 's tro coeficiente de contingencia, no se puede afirmar qu ' UII I

Il 1, variables es causa de la otra. Hay cantidad de variabl . qu \ l ' l' lacionan entre sí, porque existe otra variable ajena qu ti ' 1

\llI tl relación clara con ambas. Un ejemplo de esto es la inrlu 1 ' itl 111 aparece en muchos casos entre zona geográfica y la corr ,¡ 11

111 la forma de hablar. Esto no implica que la corrección n If.'I fol'-

111 de hablar sea causada por la geografía, sino, tal vez, 1 01' h IIfluencia de diferentes procesos educativos.

S ' puede estimar, en casos en que la tabla de contingen i a I n 11

I rual número de filas que de columnas, un valor máximo q 1 \ JIu '. I alcanzar C.

1\ 1

Page 65: Libro Análisis de datos.pdf

ti 1I1 lo 1 '11 'IIIOS I)S yul'iohl " (,' 111111 I Uly 1.' ·11 1'i1l1 ' 1' I ' ISO ti I\ ' d 1 11

lIí 11 ' 1\ '1' tllnl 11i1l sIn g rm 1" • J 1() h c.l ,1 "j 11 1 4.1 (n = 100) , 11.11 I

'1' ' 11111 utili za r ' IHOS, n fin didá ti ,un j 111 pI l'nuy' '11 ¡II0.Y '0111

IH 111 ' 1 () n(II,\1 ' 1 d· b rvacione. Indicaremo ,a conLinua i 1'1, ' >I\I(j 1

I '/, 11 ' d tllulfruma de dispersión, calcular la covarianza y calcular ·1 t '

{,,..,,, ' ti J 'orrelación de Pearson. Terminaremos indicando CÓI 10

1 l 'p l 11 ' los 1'" d Lados.

I ~ II I ri 1 ' l ' lugar presentamos la Tabla de Datos del ejemplo, sobr j" d '/. 11 ' IllOS l das las elaboraciones de este apartado, y del apartado .,1111 I 1 1" ' t ' l d r gresión.

_~", ...... la variable X la puntuación obtenida en un te umérico y sea la variable Y la calificación OIJ'teJIlI

de matemáticas. Para un grupo de 5 niños plJrU. ~é:I."lU:::' recogidos en esta Tabla.

Niño X Y

1 4 6

2 8 4

3 10 7

4 12 8

5 16 10

I n r rimer lugar, vamos a considerar la representación gráfica d ' dt 111 '1'11 1 s uantitativas. Se trata del diagrama de dispersión, o «nul '

I Ullt )5», que es la representación gráfica más utilizada, y más habitua 1, I't I I in r I"l11ación que facilita.

Ltl 1" presentación gráfica de la tabla del ejemplo 4.3 aparece en la l' , l' \ .2. En ella puede apreciarse que existe una cierta relación lineal ' 11

Irla 1 X e Y. En general, a medida que aumentan las puntuacione ' 11

tl'.' t (variable X) aumentan también las calificaciones en mate m 1\

(vtll'h,bl Y) .

I \2

• +

+ I

I 'r I .1 1 .¡ ............. ..1 ...

I ! 1 ! ¡

O I I () 2 4 6 8

1--10 12 14 16 18

X (test)

iagrama de dispersión correspondiente al ej mpl 4 ..

1 .' ~"d .~ar ~os índices, relacionados entre sí, qu I ' 1'111111 ' 11

11 I la Ión lmeal que pueda haber entre dos variab l 'H ' 111111

11:III ~a un prim~r í~dice, que nos permitirá estudiar '1'1 1 po n (11 11 X e Y. El termmo covarianza hace referencia a h y 11 ' 1

1111 , .1 dos variabl.e~, y tanto por su definición como p r' su ' ti 111 111 11 que cuantlfica la variabilidad conjunta de dos va rÍ'l I 1 ' I1 1)( l' Cov (X, Y), o por Sxy. Se define así: ' I

n

. I,xiY¡ Covananza = Sxy = i=1 - X Y

n

" r de la variable X en el caso i .

" r de la variable Yen el caso i.

111 dia de la variable X.

11 1 dia de la variable Y.

nLlmero de casos de la muestra.

In

Page 66: Libro Análisis de datos.pdf

Apl ' 11110 Illollllld 1

I 1 1'\ 1 'ni I 1111 pll J' I ·1 I ~

Nlo 1-

I 1-

2 -

3

4

5

= ;= 1 y

-

n

-

,1 '1lIplo , \, I IhOl 11111

Y XY - - - - -

4 6 24

8 4 32

10 7 70

12 8 96

16 10 160

50 35 382

- - 382 X Y =--(1O·7) = 76 4-70 = 64

5 "

1,:1 s lgn ,po itivo o negativo, de la covarianza nos indica si la r I 1 \ ' \ I nlr ambas variables es directa o inversa, respectivamente.

P d mos definir que la relación lineal directa es la que asu 11 H'

ItI valores mayores en una de las variables, corresponden tambi 11

VII lor s mayores en la otra variable y los valores menores en una val'i I

bl s rresponden con los valores menores en la otra variable.

Igualmente, definimos que la relación lineal inversa es la que aSII n que a valores mayores en una de las variables, corresponden -va lo l' 's 1 nores en la otra variable y viceversa.

En nu stro caso existe, como habíamos pronosticado a partir d I 1I I )' In a d dispersión, una relación directa entre la puntuación en el I ' v \1 '1 bl X, y la calificación en matemáticas, variable Y.

in mbargo, la covarianza presenta un grave problema, al igual I 11'\\ famo visto para el coeficiente)(2 (con variables cualitativas), des (lJI

s 1 rango de la covarianza. En este caso son los valores máxim(,

d, I e 111'/ •

tl l'SO)) nll 'l' dos vul'llhlt . X ' )', (JII ' l · In si tul ' 11! ' 111 111 \1'11 :

'o 'fj i d nte Corr laci n d P ar 01 = r ' y =...::.A.

Correlación de Pearson = (fórmula 4.6)

,1, . vi ión típica de la variable X.

,h , vla ión típica de la variable y. , IIV Irianza entre X e y.

1 . , ' II ·"nt~~oeficiente de correlación de Pearson es el coci nl' ' 111 1' 1, I Y X e Y y ~l ~roducto de la desviación típica de X y h ,

. Las deSViaCIOnes típicas de X e Y son, respectivam n l " 4'y I

"lo ' 11 los mismos datos de la tabla d 1 . Io n 's típicas de las . bl X e ejemplo 4.3, y calcu la lus II

vana es e Y, como ya sabemos:

_ Sxy 6,4 6,4 rxy ---=--=-=08

SXSy 4x2 8 '

1)( /'i iente de correlación de Pearson I " lit S . d d ' rxy, presenta -entr lJ'tlS • prople a es.

I ~xy$. 1. Es decir, sólo toma valores comprendidos entre - 1 " <.Irá O cuando no exista relación lineal entre X y Y " e .

± l,si una variable es una transformación lineal de la otra.

I ~

Page 67: Libro Análisis de datos.pdf

_ nI, (XY) - I,XI,Y

rXY

- ~nI,x2 -(I,xt ~nI, y2 -(I,yt

V ' 1111 S u aplicación a partir de los datos de la tabla del ejemplo t· llhol'tl nd la iguiente Tabla y efectuando los cálculos oportunos:

NI ()

--~

,=

--= 1-

=

- -

X Y XY Xl

4 6 24 16

8 4 32 64

10 7 70 100

12 8 96 144

16 10 160 256

50 35 382 580

r = nI, (XY)-I,xI,y -XY ~nI,x2 -(I,xt ~nI,y2 -(I,yt -

5 x 382 - 50 x 35

~5 x 580- (50)2 ~5 x 265- (35)2

= 1910-1750 = 160 =0 8 -1400-1100 200 '

1

4

6

10

26

4

()

5

I lt' ¡nt rpretar los resultados que se obtienen con el coeficien l ' CO IT ' la ' i n de Pearson hay que tener en cuenta, en primer lugar, el v dlll

t1 .'OIIlLO. Llanto mayor es el valor absoluto el coeficiente nos está indi ' 111

1(1 ]lI ' la l' lación lineal entre las dos variables es más fuerte. En segllllllt " W 11' , I Y qu tener en cuenta el signo del coeficiente de correlaci 11 d l' Il'son. lando el signo es positivo, indica que a valores mayores 1, I

Id d " X li nd n a corresponder, en media, valores mayores de la va l hit Y, 1 Ve I r menores de la variable X tienden a correspond r,

dol' 's 111 1 res de la variable Y. Esta es una relación directa. el! 11\

'llivo, indica que a valores mayores de la variable X LI ' 1\

1\1

••••• • • ••• , . , ..

X Caso A

• •• •

' ... •

• • • • • • • '. . • • • • •

X CasoC

y

y • •

• • • • • ••••• • . '. • • • X

CasoB

• • • • • • •• • • • • •

• • • • •

X CasoD

" f- Ilra 4.3. Cuatro nubes de puntos, para comentar sus coefici n i 'H de correlación de Pearson.

.'

1\ lIS cuatro nubes de puntos, que vemos en la figura 4.3, 1 OS '11 'Olt

• s ituaciones típicamente diferentes. El caso que está arril ti , II o la (Caso A), responde a un coeficiente de correlación po il ivo, 111 I

1 1\ na relación lineal directa bastante clara. A valores may r 's 1, I , lit, X, corresponden valores mayores de la variable Y. El cas qu \ I

n la derecha (Caso B), responde a un coeficiente de corr 1 ' i 11 11 ~'\

I I ~

Page 68: Libro Análisis de datos.pdf

111110 , UI1 O fi ient decorrelaciónlinealcercanoacero, indica qu 11 11

I ' l ' -, \ '1 n Ii! al ntre las variables, pero no excluye la posibilida 1 I 1\ V \1'1 \1>1 'S l ngan otras relaciones entre sí de carácter no lineal.

l ' 11 ' \ \ll 'tli z r 1 valores de los coeficientes de correlación de I

, lara la situación, cuando nos encontramos con un ualquiera, por ejemplo, 0,55. No se puede afirmar qu -correlación alta, o baja. Depende del tipo de datos qu - I

ItI )S Hll'l lizando. Será baja, si se trata de dos test similares, que es l 111 11

" li tll el a los mismos sujetos, o si tenemos pocos sujetos. Podrfu IIIII ,Y \It a, si se trata de tests bastante diferenciados entre sí, o si ten ' 111 11

IIllI 'h ~ ' Lljetos. Un número grande de sujetos en la muestra pueden I 11

<1(11' l I 'ljar el valor de los coeficientes de correlación que se obtienen, 1 11

l' ,' lIlL el de otros investigadores, con variables similares y mu sIl 1

¡\llv I nt ,son los que nos sirven de comparación para evalual' 1" 1'" ul v el que obtengamos con nuestros datos. El coeficiente de COTi ' -1 I , ) 1\ 'v luado por nosotros será bajo, si los coeficientes de correlaciól 111

n i ti 1 'o otros investigadores en circunstancias similares, son mucho 1\1 \

di os, Y lo mismo se puede afirmar en la dirección contraria. Si nos 11 "

ni I 'n 1110S unos coeficientes de correlación mucho mayores qu 1 I ' 11 'ontr dos por otros investigadores en circunstancias similares, l .

11IH's t r serán muy elevados.

tr aspecto más complejo es fundamentar la causalidad en un c nl d correlación. Cuando existe un coeficiente de correlación elev'\dll

' 11 I I dos variables, no se puede afirmar que una de las variables es call I

" di -

I l. I t i 1s t una relación lineal podemos utilizar la den 1 inll I \ ,,'. '" Mn para efectuar pronósticos de los valores de una v'ld ti 1, \ 1 , ni I'a variable. La ecuación general de una recta es el la f(lI'I lI \: )

I dllll I «b » es la pendiente y «a» es la ordenada en l ri g ' 11 .

11 Id I de regresión lineal de Y sobre X, es decir, la qu 11 ' h s puntuaciones en Ya partir de las puntuacion

Y¡'= a + bXi

b= n.L:(XY)- .L: X.L:Y n.L: X2 -(.L: xt a=Y -bX

\1 ' \

, \ ' 1 \

Page 69: Libro Análisis de datos.pdf

pi i 1111111 111 \111111111,

IlIel ' ·1 ',l' llIpl() ,\, 11(1 1

1 lO

NI ()

2

4

:;

2:

=

- 1-

- -

--

- 1-4

1-8

10

12

16

50

--) ~

= -1- -24 16

- -4 32 64

7 70 100

8 96 144

10 160 256

35 382 580

1/ ( Y) - LXLY = 5x382-50x35 = 1910-1750 = 160 =04 /1 2_ (L X)2 5x580-(50)2 2900 - 2500 400 '

a = y -bX = 7-0,4x10 = 3

1(11' 1 1111 0 h 1" la d regresión es: Y' = 3 + 0,4x.

1'11 1 ' \1 lOS 01 s ' rva r la representación de esta recta de regresión sobr \ ,1 l ' Ii 'P 1- ión en la figura 4.2.

1 2 ~------~----~---,--~~--~--~------~

10

8 •

6

4

2

o O 2 4 6 8 10 12 14 16 18

X (test)

l' I "i 'n 4.4. La recta de regresión de Y sobre X, con los datos de la Tabla del ejemplo 4.3.

I 11\ pi, 1 pOI 1 ptlllln (\ , )) , t 11, I 1111 1 ,ti ' 11 Id I 1111 (IO,f). A 1I

111111 , )'/,01 It,"ld 1, Il\l,d 01 111 ' 1 I l' 'v l 1 ti ' 1'('/ 1'(', 011 11, dl'!IOIII 11 I

"'lItld()",'~ IJronm;1/ 'lIda,', A l I 111"1 ' 11 ' In ' lItl" l t 11111111 \ ' 11 111 ' d 1 1 1, )1/, Y HU I I'on )sl i ' ), /, la lI n lll ' \l11OS « ' 1'1'01'» lo l ' ' \ l' .' 111 lI 't'

,'= •

=-

~

=

~

, ("d 'lll ar I ' puntua ion pron ' ti adas y I s ' 1'1' ) 1' 's 11 1111

X

4

8

10

12

16

50

su ' 111 di Y us varjanza, lab rand h l ' tI ItI , 1

Tabla para el cálculo de las estimaciones, Y'¡ error' , U, varianzas de los mismos, S~ y S~ . x

Y P Y' = 3 + 0,4X

6 36 4,6

4 16 6,2

7 49 7,0

8 64 7,8

10 100 9,4

35 265 35

E = (Y - Y') (Y')2

1,4 21, 16

-2,2 38,44

0,0 49,00

0,2 60,84

0,6 8 , 6

0,0 257,8

,-J ~'

1 ,~ <'

H4

)0

) I

4,

() ,(

() ,(

O, \

7, ()

i ne reseñar las siguientes propiedades ejemplificadas 011 lo d . la tabla 4.12:

1.11 media de los errores es O. E = I, Ei = I, (Y¡ - Y¡') .Q = O n n n

I,a media de las puntuaciones pronosticadas coincide con la m I i ' \ 1\ las verdaderas puntuaciones en Y:

a varianza de las puntuaciones en Y,

I I

Page 70: Libro Análisis de datos.pdf

t "" 1 11 . tllltl d · 11 111111 :1, I ti 111 Plllll!) li ' s,

, , v ~ =

rror , que representaremo PO]

5~ = 4 = 5;'. +5;'.x = 2,56+ 1,44

POI' o lro h I e puede comprobar que:

2 l i S'. \

1. 1. I I ' 11 11 ' nL ' de la recta de regresión es: b = rxy 5y El signo 1 ,1

5x

11 '

'o ,n I 'n L de correlación de Pearson nos dice si la relación lin ' d '1Itl' 1 I variables es directa, o inversa, pues el signo del coefici '11 1

1, 'n la fórmula de regresión es el mismo del coeficiente de CO I'I"

n d Pearson. Las desviaciones típicas siempre son positivas,

2

, r,~ ll = -f- , nos explica que podemos tomar el cuadrado del co ft y

'1 ' nL d correlación de Pearson como el tanto por uno de varian :1:\ 'xp licada (o proporción de varianza explicada).

52 r~ l' = y.x, nos explica que podemos tomar el resto a uno d ,1

5;' 'ulldl'ado del coeficiente de correlación de Pearson como el tanLo I 0 1' LIno, o proporción, de la varianza no explicada en la regresión 1111 'a l.

1l' Ill tl s' 11 '\n 1 ,nnl lo lo: r( l ' ll1U H, o Ill "l< 1 ),', I '1ludl :l. " ' 1 \ 1 1\ I()s val'iabl 's.

pr parad para 'lI1 'llizar 1 \ J' 'h ' j Il 1111 " 1" 1 IInliL Uvas. Como ualqui r variabl ' uant iLa tiva s' j'lU ' I ' tI' \11

11 I1I a variable cualitativa, clasifi and u ' va l r 's ' 1) los () 111

h val res consecutivos, este método irvc para anali z'u' la l' ' I:I V 11\

I dqui r par de variables. Para ello hemo xpli ado h s tlll 11. d ' ' 11 1'1, las tablas de diferencias entre la h-ecuenci n prri '~I S .Y 1\. I Y ] oeficiente de contingencia, C.

\ undo método, se ha definido una forma de analizar la l' la '1 )11

lo vnriables cuantitativas. En esta parte, se han explicado la nul \ 1\ I ' ficiente de correlación de Pearson, la recta de regr i n, 'y 11

tl' lILr el coeficiente de correlación de Pearson y la recta de r 11' 's i )11 .

'1 I CIClOS DE AUTO EVALUACIÓN

lI'n una muestra de 100 personas hemos obtenido la sigui n L ' tn 1 1 \:

y

A B

X ~50 12 38

>50 4 46

JlII na se recogen los datos de la variable X: Edad, (que se ha di 'oto· Illizado en iguales o menores de 50 años y mayores de 50), Y: s il' S

((" toma los valores A: no tener estrés, y B: si tener estré), i 1 's' IIn s conocer si existe relación entre X e Y debemos utilizar: 1\.) 1\ ovarianza; B) XZ; C) rxy.

Para los datos del ejercicio anterior, el valor de XZ está compl' nd i lo litre: A) O y 10; B) 10 y 20; C) 20 y 30.

Para los datos del ejercicio 4.1, el coeficiente de contingen ia, 'omprendido entre: A) O y 0,3; B) 0,4 Y 0,7; C) 0,8 y 1.

1I \

Page 71: Libro Análisis de datos.pdf

IH

90 80 70 60

~ 50 ~ 40 "¿ 30

20 10 o

!-

'c--

1--1--

--~

Si

1 -1

No X

\tI \\11 1I "!l0 I \ 11 1II ' uIl l'IlI O I (1m

I '.la I l ' I'l.Imal', No

,--

1--

1--

--1--

0 11 's t da tos, el coeficiente de contingencia entre las dos va l' d,1 L'ol1 si I ' rada stá comprendido entre: A) ° Y 0,3; B) 0,4 Y 0,7; e) O,H \ I

y el resultado del ejercicio anterior, podemos con d fumador, no merece la pena someterse al trataml ' 111

tiene casi la misma relación con el resultado «d ,j \1

1\ 1111 11'» U 1 tratamiento; C) existe una relación media-alta l' II Il

lit Il zar 1 tratamiento y dejar de fumar.

' Oll 1 s iguientes diagramas de dispersión,

y

•• .... ... • • • •••

x

. ~ ."1· ......

Gráfica 1

• y

• • ••• • • • • * •• ••••• . .. .. ..

X

Gráfica 2

rr pondientes a dos variables cuantitativas, X e Y, ¿en qué I ría utilizarse el coeficiente de correlación de Pearson para .. l' li ar la relación entre X e Y?: A) En la Gráfica 1 porque la rela ' t

II ¡ IIV 10 111" dt' »; B) HIII, 1' 1 ti l" IIllIqll , 1, I I H I, II ( 11

) EIl lI i ll lll HI l ' las los,

Niños X Y -Amaya 92,50 100,50 -Carlos 77,50 103,50

Lucía 100,00 105,00

Inés 107,50 106,50

David 122,50 109,50

( ( n los datos del ejemplo anterior (4,7), la correlación de P ':')I'SO Il

' tllre X e Y toma el valor: A) 0,6; B) 0,8; C) 0,4.

( n los datos del ejercicio 4.7, la pendiente de la ecuación d' 1\ l ' ' \ '

I't de regresión que permite pronosticar las puntuacion 11)", ) '"

I artir de las puntuaciones en X vale: A) 2; B) 0,50; C) 0,16,

1, ordenada en el origen de la ecuación de la recta de regresi 1 I ) s bre X para los datos del ejercicio 4.7 vale: A) 20; B) 60; e) 89,

, L proporción de la varianza de Y explicada por la varianza d X r> tll '(I

I datos del ejercicio 4.7 vale: A) 0,36; B) 0,64; C) 0,80,

, Los datos de la siguiente tabla,

X Y XY

I.X = 50000 I. y = 3500

I. XY = 368000

I.XZ = 5112500 I. J12 = 290000

orresponden a las puntuaciones de 500 niños en un test d ra:t,OIlU­miento numérico (X) y en la asignatura de matemáticas (Y), El v'l lol ' de la covarianza entre X e Yes: A) 25; B) 36; C) 40.

Con los datos del ejercicio anterior, el coeficiente de correla ión l ' Pearson entre X e Yes: A) 0,8; B) 0,6; C) 0,9.

Page 72: Libro Análisis de datos.pdf

11.

, 1 , Oll Inl' 1'11 S d 1 jercicio 4.12, la ecuación de la recta d r' ' 1' l. 111 nos 1 ''I"I1 lL pronosticar las puntuaciones en matemáti as I l' ,

I " 1\ las I untuaciones en el test de razonamiento numéric ) 0,2 - 10; B) Y' = 0,16 X - 9; C) Y' = -0,16 X + 20.

1 , A I di} ' ir>i d curso, hemos pasado el test de razonamiento nU11l

'o ,.1 dmilo y ha obtenido una puntuación de 90. Si este niñ( l' 1111

1, ' \1 ' \ '1 \rf ,ti as del grupo utilizado en el ejercicio 4.12, ¿qu plll

111 I ' 1011 It. I r nosticaremos en la asignatura de matemática ti I " I ' III 'I'()(: A) ,O; B) 5,4; C) 5,6.

,11, Jl. 1I I , , I"lti 'nt gráfica:

11 10 9 8 7

Y 6 5 ¡.....---4 3 2 1 O

--V

1 Y' - 0,2X + 3 1 -V ¡....--

-V t..- f-

O 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 X

n las puntuaciones obtenidas por 5 niños en dos VG1I ' ,

Y, Y se presenta también la ecuación de regresión 1 , ( 1 r \ . ¿Cuánto vale la pendiente de la recta de regresión?: A O) 0,2; C) 3,2.

1. 1 R, '1' \111 ndo en cuenta la gráfica del ejercicio anterior (4.17), ¿qué p llll

111' i n pronosticamos en Y a un niño que ha tenido en X una pllll

IlIn ' i n de 20?: A) 10; B) 4; C) 7.

1\ ,,1, PII ' II"

I ' 0 1'1' \ , \ '1)11 1, I • II 'SOI} 1 11 ' , 'n. Ido l ,' 'j '1' ,¡ ' j( 4.17(: A) O, ; I ) O,H; ' ) 0,1,

Il iONES DE LOS EJERCICIOS DE ¡\UTOEV¡\LU¡\('ION

11: B Y variables cualitativas se aplica X2.

n:A

y

A B

~50 12 38 50 X

>50 4 46 50

16 84 100

I I • ti ncias teóricas:

y

A B

~50 16·50 = 8 84·50 = 42 50 100 100

X

>50 16·50 =8 84·50 =42 50 100 100

16 84 100

I Irl 147

Page 73: Libro Análisis de datos.pdf

50

>50 - 4

o

IJ

- 4

4

o

o O

O

2 16 16 16 16 X =- + - + - +-=2+0,38+2+0,38=4,76

8 42 8 42

"'~ , Solll -i )J : A

c = 4,76 = ~0,045 = 0,213 4,76+100

I ,, ~ , 0111 '; n: B

Sí No

Tratamiento 80 20 100

No tratamiento 30 70 100

110 90 200

JI" Ll ncias teóricas:

Sí No

Tratamiento 55 45 100

No tratamiento 55 45 100

110 90 200

ir r ncias:

Sí No

Tratamiento 25 -25 O

No tratamiento -25 25 O

O O O

I K

lIi ~5 ,5

- 11 ,. 6 II ,HH 111,j) ¡I ,HH( SO,SO

J 50, 50- = '0201 = O 45 250,506 "l/U, L. ' ,

oltll; n: e

1111.: ,' 1 que C=0,45 y C = fi = 1O,5 = 0,7l. max ~2 "l/u,:)

ohl ión: e NII I be utilizarse en ninguno de los dos casos porque n 'isl \ 1'(·1 , I e 1II lineaL

IIlu ión: A

Niños

Amaya

Carlos

Lucía

Inés

David

I

x= 500 =100 5

Y = 525 = 105 5

X Y

92,50 100,50

77,50 103,50

100,00 105,00

107,50 106,50

122,50 109,50

500,00 525,00

XY

9296,25

8021 ,25

10500,00

11448,75

13413,75

52680,00

s = 52680 (100-105)=10536-10500=36 XY 5

II

Page 74: Libro Análisis de datos.pdf

1- ~I~

- 1- 1 N (1

, 1- 1-

,25 8556,25 2,50 100,50 2 " llI \,Y \

77,50 103,50 8.021,25 6006,25

100,00 105,00 10500,00 10000,00

'107,50 106,50 11448,75 11556,25

\) Ivld 122 ,50 109,50 13413,75 15006,25

500,00 525,00 52680,00 51125,00

2 = 51125 - 1002 =225 X 5

2 _ 55170 -1052 =9 y - 5

_ Sxy =~= 36 = 0,8 rxy - S S 15·3 45 x y

L() , olu i n: e

---yA 10 1 ()( 1,

2, 107 1

1102. ,00

11 4

1199

5517

2,

0,

0,011

nLexy) - LXLY _ 5·52680 - 500·525 = 900 = 0,16 b = nLX2- (L xt - 5.51125 - 500

2 5625

'1' IIl1bl 11 :

S 3 b - r J.. = O 8·-= 0,16

- xy S ' 15 x

I 11

, I ) /)

0 111 '1 )11 : I

2

-r..:. = 1'2 = o 8 = O, 4 2 xy , y

.,llId n: B

\\ XY - (XY)= 368000 (50000.3500) = 736 _ (100.7) = 7 6 - 700 (1 n 500 500 500 .

ni" 'i n : A

o/ ión: B

S2 = 5112500 - 1002 = 225 x 500

S2 = 29000 _ 72 = 9 y 500

r = Sxy = 36 = 36 = O 8 xy S·S 15·3 45 ' x y

In IU rxy = 0,8, puntuaciones altas en X se corresponden con pLlnlllo ­" 1 s en Y y puntuaciones bajas en X se corresponden con pUl tlln

haja en y.

. ni lción: B

)" =bX +a

h = nI. (XY) - L XL Y = 500·368000 - 50000·3500 = nLX2 _(:¿X)2 500.5112500-500002

= 184000000 - 175000000 = 9000000 = O 16 2556250000 - 2500000000 56250000 '

1 ~ I

Page 75: Libro Análisis de datos.pdf

I ()I' ttl nt e :

~ O,S' iS = ,I

a = Y - bX = 7 - (0,16·100) = 7 - 16 =-9

Y'=0,16X-9

1,. l . n lll '1 )n: B

I 1/.

I,. IH.

Y' =0,16X- 9 => Y ' =0,16.90 - 9 =14,4-9=5,4

que multiplica a X en la ecuación que aparece en la g l r I

I 11 , 1 0 \ s 'r'varse directamente en la gráfica que para X == 20 el I 11'

11 )sll 'O, ILilizando la recta de regresión, es 7. También puede 'l l ' \I

I \I 'S ' '¡sí: Y'= 0,2X+3 => Y' =0,2.20 +3 = 4 +3 =7

. I . Solu n : A

Sujeto X Y Y' = 0,2X + 3 (Y')2

1

2

3

4

5

L

8 6 4,6 21,16

16 4 6,2 38,44

20 7 7,0 49,00

24 8 7,8 60,84

32 10 9,4 88,36

100 35 35 257,8

Y' = I,Y' = 35 = 7 (Obsérvese que Y' = y) n 5

Sy2, = 257,8 _ 72 = 51 56 - 49 = 2 56 5 ' '

()II : 1\

, l~ lo

2

20

4 24

5 32

L 100

x= 100 =20 5

Y= 35 = 7 5

S b=0,2=rxy ,

SY => x

~ 1

4 25

7 400 4'

8 57 6

10 1.024 l OO

35 2,320 26

/2320 2 Sx = ~-5-- 20 = .J64 = 8

Sy = ~265 _7 2 = 14 - 2 5 -

r = 0,2·Sx = 0,2·8 =~ - O o xy S 2 - ,o

y 2

I ~ \

Page 76: Libro Análisis de datos.pdf

'1' ' 111 , ,i

N s l ÚS i ' lS

1I11 md lIcción I ('()IIl'l'ptos previos

J)l'l'illición de probabilidad 1. Pl'obabilidad condicionada

l." I'egla del produclo y el teorema de Bayes (l, Rt'SlIl1lcn

7. 1·:.iL'rcicios de auloevaluación H. Soluciones a los ejercicios de auloevaluación

Page 77: Libro Análisis de datos.pdf

I 11 II IS l mas estudiados hasta ahora, el análisis estadístico se ha limitado d, \ rip ión de un conjunto pequeño de datos denominado muestra. Sin 11 ' 10, n cualquier investigación es importante poder generalizar o inferir 1 11.' r ultados a un colectivo mucho más amplio, al que hemos denomi-

111 poi lación, y al que no podemos acceder por diferentes motivos (tiempo, 1111111 a ... ). En este caso, la extensión de nuestras conclusiones requiere lle­

, l ' ti una inferencia que siempre será probabilística o formular una hipó-11II aceptaremos o rechazaremos con una determinada probabilidad. Por l ' IZ n es necesario abordar el estudio de la probabilidad.

J' 11 mos una idea aproximada de lo que significa probabilidad en nues­h. cotidiana. Así, todos sabemos que es muy poco probable que nos

'1 ' un premio de la lotería, que es muy probable que suspendamos una 11 ,Iura si hemos dedicado poco tiempo a estudiarla o que, en el naci-111 de nuestro «primer retoño» es casi tan probable que sea niño como

En ste tema, y guiados a través de ejemplos concretos, vamos a intro­I 1'1 os de una forma más rigurosa en el estudio de la probabilidad. Para 111, primero introduciremos unos conceptos fundamentales (experimento

,lorÍo, suceso ... ), posteriormente, trataremos de definir el concepto de ,habilidad, y finalmente consideraremos el estudio de las probabilidades mli ionadas.

1, objetivos que pretendemos son los siguientes:

• Conocer los conceptos de experimento aleatorio y espacio muestra!.

• Distinguir los distintos tipos de sucesos que forman parte del espacio muestral y las operaciones fundamentales que con ellos pueden realizarse.

• Adquirir un concepto de probabilidad más preciso.

157

Page 78: Libro Análisis de datos.pdf

I'l lIhl 111 I 11 qlll ' \1 0 pI '

.. UN ' ..... TOS I»REVIOS

V 11110 ,' '} ¡ni ia r 1 tudio de la probabilidad recordando alguno, \ 1111

,,'pi e),' 1, Hi ' )S , n ces arios para definir el concepto de probabilidlll' , 1111 0 ,IHI " r! n un ejemplo.

111 m plo .1. Imaginemos que lanzamos al aire, una vez, un eh \"

, ' II V I ' I\'tIS 's lán numeradas dell al 6 .

JI I IH ' l lO, '1 la nzamiento de un dado, constituye un «experimenlo d l i t 1 C)) p O I' 1\1 l·', r senta un proceso mediante el cual podemos obten ' 1' \111

11 11 11 I lo " ' 1'Í1 1ento) y es aleatorio porque interviene el azar. Todo' \1

111 ' 1\ t ( ni ti Lori presenta tres características:

resultados posibles son conocidos con anterioridad ti

No H' pu de predecir con certeza el resultado que vamos a obt n ',

1 U 'xp rimento puede repetirse, todas las veces que se desee, en id ' t i

ti '18 ondiciones

Por VII l ,

U n experim ento aleatorio es un proceso, que se puede repelÍÍ' nte en las mismas condiciones, cuyo resultado no se pu .

on certeza.

HI 'OIlJlI nL d todos los resultados posibles de un experimento alea lll 1 () , I 'nomi na espacio muestral y se representa, habitualmente, por 1, 1, 11 ' I 111 l'yI'IS ' Id a . A í , el espacio muestral para el lanzamiento del dado '

E = {I.ll:l ~ r."l DO fTIl} u , ~, ~J u,· -1li.!J

A = {O} B = {[TI, O, [TI]} e = {[S] , [IT]}

SOS } • «01 1 ' " ' 1' 111\

, S 0 11, lL v Io :

IlIdo 1 espacio muestral de un experimento se le denomina la l I i ' 11

11 ' ('guro ~orque siempre ocurre. Al suceso que no puede ocurrir 11111 1

1 1\ nomma Suceso Imposible ' . y se representa por (jJ o conJun lo vnr n,

""( , a d~finir ahora algunas operaciones con sucesos, ba ' éI las ' 1\ I I )()lldencIa con la teoría de conjuntos, que nos resultarán útil •

111 1' : ' 111'

11111 remos unión de dos sucesos A y B, Y lo representaremos por J\ u IJ d i onjunto de E formado por los sucesos elementales que perten ' n '1

11 () ambos a la vez:

11 ,1 ejemplo: A uB = {Q], O, [TI]}

Iln aremos ~ntersección de dos sucesos A y B, Y lo representarem S p OI'

I , al subconjunto de E formado solamente por los sucesos elem I VI I ·s I ¡'I'tenecen a A ya B.

AnB {O} \I,ando la int~rsección de dos sucesos no contiene ningún el m nto

I que son mcompatibles o excluyentes y, por tanto, no pu d Il

Page 79: Libro Análisis de datos.pdf

IIIItlt 111 1' "" ' 111 I \\ I 11111 plll dI 11 • \llldll • dI , l' dI '

'C 1M PI,EMENTARIO:

1.I1111 11' ' 1

I dI 'o I 1.1 I 111 t

111plementario de un suceso A, y lo representaremo pOI' I d [ rmado por los sucesos elementales que no perten c I \ , \

1"11 ' I Sil l' \pr ntación podemos utilizar los diagramas de V, '111/

11111 1 \11\ ' 111 \ ulilizados en la Teoría de Conjuntos. En la figura 5.1 s l ' ' 111 1

1\1 \11 I \' r ' \ n ' 1 t los sucesos anteriores .

E B

D [S]

~ . .

E A B

[TI D [TI]

[S] .. .. ~ . .

E A

[TI D D [S] ..

[TI] .. .. ~ . .

Figura 5.1. Representación gráfica de la unión . intersección y complementario de sucesos.

d ,

I IoINI IÓN DE "I~()B¡\BIIJJ)AI)

11 111 '0 1'1 pl S pr vi ñalado nl Ji J"111 1 l ,vam " ) ¡ni ' j ' \I ' ,1 1110 I 1" IIml ' bilidad. Expondremos b- S d finicion dir r nt d I ' 0 11 ' '1 lo 1, 111 d \ I (la d finición clásica, la stadí tica y la axiom ti a) n " llllill \ I l. 1

It 111 I'In: alcular b «posibilidad» de ocurrencia de un su s. V \1' '1l10S 111 '

IIlIlqllÍ ' 1' de estas tres definiciones, la probabilidad s uan ti/'i <l ' (l ll 1111

C I 'on pI" ndido entre cero y uno: cero para el suceso imposibl y I P ltll _1

I '¡ 'llr. Cualquier otro suceso tendrá asignado un número nlr O I ' 11

CIII d ' la cuantía de su probabilidad de ocurrencia.

, tlt{lnición clásica, formulada por Laplace, indica que: «La probabilid(/d /11 //('('so es igual al cociente entre el número de casos favorables de q/l ' 01 '1/1/1/

IIII'W el número de casos posibles en el supuesto de que todos los 'OSOS /I ' /I

/tI I/llsma oportunidad de ocurrir (es decir, sean igualmente probabh) ) ,

ti \ ir:

Probabilidad de un suceso = Número de casos favorables Número de casos posibles

I ti os un ejemplo:

5.2. Retomando el ejemplo 5.1, lanzamos un dado impar i vez. ¿Cuál es la probabilidad de obtener un 2? ¿Cuál es la p

de obtener un número par?

que calcular la probabilidad de obtener el suceso A = {[I]], muestra!, conjunto de todos los resultados posibles, es:

E = {D [TI [S] D r::; fITl} , , , , u ,B

Id

Page 80: Libro Análisis de datos.pdf

6' «obt n r un num ro par», La probabilid

3 1 P(B) =-=-= O,5

6 2

tellernos, en este caso, tres resultados favorables sob 'bl s,

J, 1 \ ti r 111 '1)[ d probabilidad, y su aplicación, requiere que los su ' \ l' , 1\ q \ll, t'o I 1 I s ( osa que no siempre ocurre) y, en muchos casos, 1 \ 1 ti

11 ' 1111 ti ' I n 'í! la I ificación de los sucesos como favorables y posibl s,

I I" P 'Un) s un experimento aleatorio (por ejemplo lanzar un da 1(1 ,1 \ 1" ) 11111 ' h ' lS V s, y anotamos las frecuencias relativas de un su ' \ 11

pl/II IIIOS 01 s 'rvar que tienden a estabilizarse en un valor comprel d 1, I \111 ' () Y l. L valor se denomina probabilidad del suceso. Por L'wlll po I ' 1lIOS I ' rinir la probabilidad de un suceso A como:

4 I I 1II11 ' ., I qu tiende la frecuencia relativa de aparición de un suc SI I

' \1 III lo ,1 I '1m ro de ensayos, n, tiende a infinito»:

. n P(A)=hm~

n~= n

":. t' \ I fi ni i.6n de probabilidad, denominada estadística, aunqut' '111 1' ' In , r S nta un grave problema: muchas veces no es posible repetíl' lIlI

111'1 ' i1\ ' Ilto a l atorio un gran número de veces y, si lo es, no es prácti ' (1

1,0. p l' lV 'S I f' )bl mas con las definiciones de probabilidad presenta 1\ (, 1, I , Y .. 1\ 1 s ti a) llevaron a los matemáticos a establecer una ni "

011 , ti ' 1)()lll in da axiomática:

1), lo lItl '. '1 "lo IllIl .. 11 ' d H, 11 I/I/(/I/ws IJlul (/IJ//lt/(/(I di ' 1/11 "1/(" 11

• dl'/II/ido ' 1/ ,1 's¡Joc/( l/1111's /m I Il' IU ' (/eSllJ,1I0llWS IJOI I ( ) , (1 "111

11111/1 '1') r ~c¡/ que C/sif.il/ II/IOS o/ Sil "SO A, / ¡/ qlle' (, II/I/pl J /0 .... ' SIJ.!, I/It ' IIII ',\

//1 tll i('dad 's:

$; P CA) $; 1

P CE) = 1

peA) = 1 - CA)

L 1,' d primeras propiedades indican que la probabilidad ::; ' W.\111 in 1I ' Ill1mér~camente ~~n un número comprendido entre c r y un . OIlIO

I n n la mtroducclOn de este tema, asignamos un cero a un u so 111 ' 1" 'cJ o~ur~ir nunca y un uno al suceso que se produce con s ud Ind , t ' 1'(' ra, mdIca que la probabilidad de un suceso A puede obt n 'rs ' U\ 111

1I I ,'s,tando de u~o la probabilidad de su complementario, A, pu 's lo 1" I eJ , son exhaustIvoS y mutuamente excluyentes (si no ocurr !\ 11 'v \ 1

1I\' lIt lo hará su complementario).

'stas propiedades, podemos añadir el denominado «Teorema ti" /"

I " I ' teorema establece que la probabilidad de que ocurra el su so A I

IH '(" B es igual a la probabilidad de que ocurra A más la probab ili lud 11" curra B menos la probabilidad de que ocurran ambos, A, y , Es

peA u B) = peA) + P(B) - peA n B)

II:H do los sucesos A y B son incompatibles, es decir, no pueden lIlTi l '

IIltaneamente o la ocurrencia de uno implica la no ocurrencia d 1 )tI 'O,

.1:\ de la suma se simplifica a:

peA u B) = peA) + P(B)

I () que su intersección es vacía: (A íI B) = cp.

III"IOS a comprobar que estas propiedades se mantienen utiliza I cJo ·1 Ipl del lanzamiento de un dado que presentamos anteriormenL :

1 11

Page 81: Libro Análisis de datos.pdf

I ¡, ClI 'd"IIIO, 111 ' \ ' 1\ '1 1 CI I {[ 1, 1 ' 1.1··1, 1 1, 1 • 1, l. 11 It d I 1111 el I \ n 11 j I () In,' ,' ti • () : \, ( , h 11 1\ l' t 11 t », l « () t l 'n \ l' 11 n 1\ t IIIt

1 1 P 11 ',) Y « >ll ' 11 ' 1' un I1lltltlplo I h,

11.1 tI ' 'so ;\ - {D I:l [S] ~ [TI]} ,~, , ,

1'\1\" \)1 'n, ILiliJ(;ando la definición de probabilidad como el () ' ' 111 1111 ' ' \ 'o, I'lV r bl s y casos posibles, tenemos:

I 3 3 1 - 5 /'(;\) = - , P(B) = - , P(AuB) = - , P(AnB)= -6' peA) = -6 666

1.11 jI do ' los ' élS tenemos valores comprendidos entre O y 1 y, '1"1

I IIldll I \ pi opl ' lad d 1 complementario:

131 3 P(AuB) = - + - --=-

6 6 6 6

Al I ' \11 lo ,1 T rema de la Suma tenemos:

131 3 P(AuB) = - + ---=-

6 6 6 6

• J I OHABILIDAD CONDICIONADA

iones, muy frecuentes en la vida cotidiana, donde la apari j I11

A depende de la aparición de otro suceso B. Diremos en es ltl ucesos A y B son dependientes porque la probabilidad Q \

lá condicionada, al suceso B .

1. \ I I'Obabilidad de A condicionado a B, o dependiente de la apari i 111

11 , s s ribe P(A/B) donde B es la condición requerida . .

,ollsi 1 r mos el ejemplo siguiente:

atonamente uno de ellos,

la probabilidad de que sea varón?

la probabilidad de que estudie psicología?

la probabilidad de que estudie psicología y sea varó ?

la tabla, y considerando la probabilidad como el co favorables y casos posibles, tenemos:

= 2500 =05 5000 '

rlV)= 1200 = 024 5000 '

lio .. UJ'~V'" ahora que hemos elegido al azar un alumno y ha r ul ¿cuál es la probabilidad de que estudie psicología?

i~..uJ"V'" preguntando por la probabilidad P (PsIV), es decir: su (V) ¿cuál es la probabilidad de que estudie psicología (P )?

de la tabla, y considerando nuevamente el cocient y casos posibles tenemos, tenemos que:

P(Ps/V) = 1200 = O 6 2000 '

de los resultados anteriores, podemos comprobar que:

P(Ps /V) = P(Ps n V) = 0,24 = O 6 P(V) 0,4 '

Page 82: Libro Análisis de datos.pdf

Ih l' 1\ 1"1111 \, 1"'11111 l' plI lo 1 1111

1, '111 ' 1\ I ' 1\ ' j,,,I, 'OIIICI

1'(AIU)'y " 1

l' \1 ' \ dmi su ual qui ra A y B, la probabilidad de A ('olltl mulo ti B - de A upuesto B- es igual a la probabilidad d ' /1/ //1' / • 'I'('f'i 11 dividido por la probabilidad de la condición B. E el' il':

peA lB) = peA n B) siempre que P(B) 7: O P(B)

D(I 1 I n isma forma:

P(B lA) = P(B n A) siempre que peA) 7: O , peA)

Noll . l' qtl - s i los sucesos A y B son independientes:

peA lB) = peA) Y P(B lA) = P(B)

• 1,/\ REGLA DEL PRODUCTO Y EL TEOREMA DE BAYES

IJll s l ahora, hemos considerado la realización de un único experil1l ' 111 d - Ilodo h mos considerado una sola extracción, o ensayo, en un pl'(1(

l' -1 lll ' interviene el azar (lanzar un dado al aire una sola vez, exll ' \ ' 1

(,1 ' ¡ n r una persona dentro de un grupo ... ). Podemos extender lo I ~I h¡l , Itl ah ra al caso en que realizamos varios experimentos simultánealtl ' 111 (pllI ' -j 1 pIo, lanzar un dado y una moneda al aire), repetimos un p '1

III! 111 ) v'lria veces (por ejemplo, lanzar una moneda al aire en varias tll

1M

nsayos) o, en general, al caso en que realizamos un proceso VHII

r jemplo, extraer de una en una varias bolas de una urna).

11 111 visto, en el epígrafe anterior sobre la probabilidad condicionada,

p(B IA) = peA n B) peA)

/1 r IJ) I'{ ).II( 1m ' ()J1( ,- ' (111) «regla o 'feo". '1IU1 tlt·' /', Odllt"lI , •

urr n ia de A y B e igual a la pI' babili h 1 ti . 1 I !\ P r la probabilidad de ocurr ncia de B, dad ~ 1 \ !\ hu

111 pl'i.'v iam nte. Es decir:

peA n B) = P(A)·P(B lA)

e lee como «la probabilidad de que ocurra B dad qu' 111 ' loA».

ucesos A Y B son independientes:

peA n B) = P(A).P(B)

Supongamos una urna con cinco bolas de las cual y dos son rojas. Introducimos la mano en la urn

'Una bola (primera extracción). Sin devolver la bola q a la urna, volvemos a introducir la mano y extra

\."''''.F> ............. extracción); o sea la extracción es «sin rep

la probabilidad de que las dos bolas extraídas sean verd ? Va «bola verde». La probabilidad pedida será igual a «1

,",UJlU.UU. de que en la primera extracción la bola sea verd p " v."<n' ....... ' ...... de que en la segunda extracción la bola sea v d

que en la primera también lo ha sido».

I 7

Page 83: Libro Análisis de datos.pdf

I "

",~)lj;ndlicE~S 1 Y 2 hacen referencia a la extracción tes'oec1:ivalnen.te) .

.rb1:j'~bi1iclad de que las dos bolas extraídas sean

«bola roja», y por un razonamiento análogo al

2 1 2 ~) = P(~).p(RzI~)=5·¡= 20 =0,1

~15¡rOll)al'ilí.d.aa de que las bolas sean de distinto color?

1D!l)~aCl de que las bolas sean de distinto color es la que una sea verde y la otra roja (VyR) pero esto dos maneras: que la primera sea verde y la

la primera sea roja y la segunda verde (R 1 V2)·

(lV2

) = [P(V¡).P(Rz Iv¡) ]+[ P(R¡).p(V2 1R¡)] =

4 )+(~.!)= ;0 + ;0 = ~~ =0,6

suma de las tres probabilidades anteriormente

, • (111 ti • II lI'pl.I dt I PI Cldtll lo, I IlIlIe ' V I " ' 11111 ' 1 d "ICI ,

P(A n B) = P(A).P(l )

.Y /1 011 11 I '1II'1Idl 111

11 '1 ' 1611 () 110 1,' nll 'o), II

i.IoIo~"'.lU"~ «C» a «salir cara», la probabilidad d

P(C (1 C) = P(C)·P(C) = 0,5·0,5 = 0,25

la probabilidad de obtener cara en el segundo lanzami del resultado obtenido en el primer lanzamiento (son

' .h''''JL.l ...... V.ln'_.,) .

5.6. En una planta psiquiátrica hay 5 pacientes de los cu psicosis, 2 neurosis y 2 esquizofrenia. Se sabe además qu

'.l.l.L,,'''' .... de que un paciente responda favorablemente al tr t es 0,6 si padece psicosis, 0,9 si padece neurosis y 0,8 si pad

aleatoriamente un paciente, hemos observado que ha resp blemente al tratamiento ¿cuál es la probabilidad de qu

Llamemos P a ser psicótico, N a ser neurótico y E a ser esquiz f'r '"i ,· Llamemos también F a responder favorablemente al tratamien Lo y ,,'

10 responder favorablemente Los datos de los que disponem s, () mos calcular a partir de la información que se nos ofrece, n los

Page 84: Libro Análisis de datos.pdf

1'(11 ) ti , I

I (N) = ~ = O, 5

2 P(E ) =-= 0,4

5

l ' "' 1/ 1) O,

I (FIN) = 0,

P(F ¡E ) = 0,8

" b r" e cuánto vale la probabilidad P(NIF) , 1" (\ 11 ' '1 \1 ' l ' 1 os ~

V , III \( )": I nI' I d finición de probabilidad condicionada:

, d 111 11 111

P(NnF) P(N¡F) = P(F)

P(F ) = P(PnF)+P(N nF)+P(E nF)

I I I () 1\ I r l mas puede representarse gráficamente median l ' 1111

" I I á l · l mo el de la figura 5.2. donde los números corres! (l it I ti ''''''1(1 (l! r'Jo . edi 1\ , 1" 11 1 h . I ro l l il¡dades condicionadas al suceso que aparece mm 11 11\ (' lI\ l 's ('\ 1 izquierda en el árbol).

p

N

0,8 F

~-F

F 111 '(\ 5.2. Representación gráfica de las probabilidades condicionadas.

l/O

I ni' t nto:

I P(N nF) P(N).P(FIN) P(N F) = P(F) = P(F)

. denomina fórmula o Teorema de Bayes.Y, puesto que:

s:

P(F) = P(PnF)+P(N nF)+P(E nF) =

= P(p).p(Flp)+ P(N).P(FIN)+ P(E).P(FIE ) =

= 0,2·0,6+0,4·0,9 +0,4·0,8 = 0,8

p(NIF)= P(NnF) = P(N).P(FIN) = 0,4·0,9 = 0,36 =045 P(F) P(F) 0,8 0,8 '

1, 1'111

II p ll

ni . rvese que inicialmente P (N) = 0,4 y que cuando hemos añadid LI Jl \

\ información (ha respondido favorablemente al tratam iento) la ! m _ Il lad ha subido a 0,45.

l . I importancia de esta regla no está en su formulación, puesto qu I s I

1\ obtener a partir de las probabilidades condicionadas de A sobr ' I Y I s bre A para dos sucesos cualesquiera A y B.

I ' pejando P (A nB) a partir de las fórmulas de probabilidad c I di ' lo_

11 1

Page 85: Libro Análisis de datos.pdf

l ' 111) 1'( i',I//)

1'( 1 · l'( I r 1/) I'(H).P

1 (EnJ\) = P(A).P(B IA)

1,, " 10 ~11 \ P(BnA) = P(AnB),podemosigualarlassigui nl 's ': 1'1

011 1, :

P(B).P(A IB) = P(A).P(B IA)

l nelTIOs:

I P(A).P(B IA)

peA B)= P(B)

1"1' I ,,11 0, ,1 Teorema de Bayes podemos expresarlo de la sigull'l\h

111 IIH ' I ' , :

I - P(A).P(B IA)

peA B) - P(B)

Sil 11111 rtancia radica en los trabajos que ha generado y en la «COl I'i ' 11

I l )) 1' 11 01"1 inada bayesiana, que tiene amplias aplicaciones y cuyo eS lud 11

01 I'l', oS'\ I objetivos de este texto .

. I FSLJMEN

I ~ 'l s l ' t ma se han definido los conceptos básicos de experimento al Ilodo, S I ' S Y algunas operaciones con sucesos (unión, interseción", )

nl e han dado algunas definiciones de probabilidad (clá il' 1,

Y axiomática) . En cualquier caso, estas definiciones no se ex -111 ' 1\ " l ' h ho, el cociente entre los casos favorables y los posibles no t

111 , 111' llna [1 cuencia relativa de aparición de un suceso que se va apl'(1 111 11\ lo " un val r constante a medida que el número de ensayos aum 11

I 1 (el -1' 111 1 >1) ':-i ladí tica). Por otra parte, la probabilidad de un suc su, Ilbl 11 1111 Pl)t ' ' 111\1 ~ui 'ra de estos dos procedimientos tiene que cumplir lo

1/

,1 T' r '''"1'' c.I la LIm a y, 1 osl '¡,I( 1'111 ni " h ' lit O. 11·1.

ncli i nada: p(A IB) = P(J\ n B) o l1 si 1 ' I'ulldo ,1 " (l P(B) .

h • n,' I.,d p ndi nte h 1110 vi to qu la L y c.l 1 Produ lo 1'1' 'st 1\1 \ 11

, l' /1 nB) = P(A)·P(B) Y hemo finalizado, pI' s nlad ,\ I '01' 111' I aso concreto.

JI '.RCICIOS DE AUTOEVALUACIÓN

1111 un experimento aleatorio: A) no conocemos su espaci mu '. ' 11 ' ti : Ji n interviene el azar; C) no podemos predecir con cert za ,1 1'( ' \11 t I 1 que se va a producir

HII la siguiente figura, donde A y B representan dos su ' 'so,' y 11 I l ,'p cio muestral, '

E A B

I zona coloreada representa: A) la unión de A y B; B) el compl '11} ' 11

I rio de la interseción de A y B; C) el complementario de B.

n la definición clásica, la probabilidad de un suceso es: A) I () ' I ' 1\

t entre casos favorables y casos posibles; B) la suma entre ca s rovo rabIes y casos posibles: C) la resta entre casos favorables y ca os I (),' bIes.

la frase «En una serie larga de tiradas (o realizaciones de un 1'1 mento), la frecuencia relativa observada de un suceso se ap1" in \ ,

I ~

Page 86: Libro Análisis de datos.pdf

1 (A) =0,40,qu'P(B) = O,30yqu P(A(lB) = O,I ~ : A) 0,55; B) 0,85; C) 0,70.

I ~ II un pa i mue tral E hay dos sucesos A y B tales qu P (A " J (13) = 1/2; P (A (l B) = 1/5, ¿cuál es la probabilidad d (A U /l),' 1 /30; B) 17/30; C) 19/30.

~. 7 . 1\ s ucesos AyBsonindependientes:A)P(AnB) =P(A) 1/'(11 B) P (A (lB) = P (A) - P (B); C) P (A nB) = P (A) . P (B) .

• 1'1, 1. IIl Znl11 imultáneamente un dado y una moneda ¿cuál s il 1"'1 h d 1I hcl d obtener un número par en el dado y una can ('" \ 111011 "'?: A) 0,5; B) 0,25; C) 0,75.

, " , 1 . 11 \ \ Inl la e recoge la composición de un colectivo pr-.?fesi 1111 I

,1 ,

174

\ , 'str 's .

V

M

] exo (varón y mujer) y de si padece (S) o no (S) algúll I 1'"

s S

10 30 40 Donde: V = «varón», M = «mujer»,

20 40 60 S = «estrés» y S = «no estrés».

30 70 100

a probabilidad de que escogida una persona al azar padezca 'sil

va l : A) 0,70; B) 0,30; C) 0,10.

n los datos de la tabla del ejercicio anterior, elegida una pers n 1 ti 'z r, ¿cuál es la probabilidad de que sea «varón»?: A) 0,10; B) 0, 111

) 0,20.

nlinuando con los datos de la tabla del ejercicio 5,9, elegida lIll l

1 'rs na al azar ¿cuál es la probabilidad de que «padezca estrés y , . 1

vn !' 11 »?: A) 0,40; B) 0,70; C) 0,10.

( n los datos de la tabla del ejercicio 5.9, elegida una persona al al'. 11

h 1 ultado ser varón. La probabilidad de que padezca estrés val : Al 0,2 ; B) 0,67; C) 0,25.

11 \0 1110. 1I 11 1 d l \1 ti -\ I', II ' \' 1I I , '), I~ I)( H I ' 111 11 d I 1 1111 \11

P Id~ (' ," ,,' 11 ' , )) .Y «, '1 ' 1 1'(lI 1» , (111 11 1 '1 'lit! ' 111 - ': 1\) No: Il 1, ( No ,' l ' ptI \ \ , 1 '1 ' \ '1111 11 u' ' 011 lo,' 1110 101 \ , I \ 1 ti 11.

1I11!ln ¡ando con el ejercicio anterior, ¿cuál es la probabilida \ <.1 ' 111 ' l' ult'z a la enfermedad B dado que ha sido positivo el an á li s is?: A) 0,077; B) 0,247; C) 0,532.

1, 11 un experimento de detección de estímulos, presentamos In 111 f 111 \¡ . v \ s el estímulo A y la otra mitad el estímulo B. El A 's el -1 • 1 1

ItI 1 80% de las veces y el B el 70 %. En un ensayo determ i 11 ti lo ti 1110 ' que se ha presentado el estímulo A. ¿Cuál es la probal ¡II 11 1 d '1 11 ' J o sea detectado?: A) 0,80; B) 0,53; C) 0,20.

011 los datos del ejercicio anterior, cuando un estímulo no s 1'1 '(' I 1 1 ¿cuál es la probabilidad de que sea el estímulo B?: A) O, O; 13) 0,3 ; C) 0,25.

('onlos datos del ejercicio 5.16, ¿cuál es la probabilidad d qu ' 1111

\\ ' Ifmulo sea detectado o sea el estímulo B?: A) 0,90; B) 0,35; ) 0,70,

f re 500 alumnos, 100 pertenecen al Plan Antiguo y el re t ' 1 Phlll N l vo . Del Plan Nuevo aprueban 240 y del Plan Antiguo apru t '111 0, El gido un alumno al azar, la probabilidad de que haya apr b'l 1< A) 0,1; B) 0,6; C) 0,4.

n los datos del ejercicio 5.19, son independientes los su ' '. (1 ,

«aprobar» y «pertenecer al Plan Antiguo»?: A) si; B) no; e) n po I -. 11 os saberlo.

17

Page 87: Libro Análisis de datos.pdf

ION

, 1, olu '1 11 : IJ ll ' 1 I'ÍI1\ 'filo ,:\1 ,' tlol'i(

'vl 'l ''/, 1 ,1 r 'sld L d

,'o lu '1 )11 :

1II 's l qu AIlB s:

E A B

I 'Ollll 1'111 ntario es:

E B

0 11 i n: A Hn la d [inición clásica, la probabilidad de un suceso es el coci -;\11

a o favorables y casos posibles.

En h d finición estadística, la probabilidad de un suceso A se con ' p O li 1\ on la frecuencia relativa observada cuando el experiment \. I '~ ' , li z:1 n un gran número de ocasiones.

oh, '1 n:A

/1 u B) = P(A) + P(B) - peA nB) = 0,40 + 0,30 - 0,15 = 0,55

l' u n) 1)(/1) 1/'(1 P( ( / ) 1 1 1)( ) 1 1 I'(ln /'( 1/)

(1_ 2) + 1_ 1_ 1 1 1 101 15 2 S 1 2 - 5 = O O

,, 111 ,1 n: e 1'111 ' ,1 t r ma d 1 producto, si dos suc os '[ inc.l' , 'n 1I '111 .. 1, pi 111 'lb i lidad de u inter ección es igual al produ l d ~ sus I1ml JI 1I Illd 's.

, 1,1u i n: B \ P = «número par» y C = «salir cara»

lución: B

olución: B

I l . Solución: e

,12. Solución: e

3 1 P(P) = (; = 0,5 P(C) = 2 =,05

P(Pn C) = P(P).P(C) = 0,5·0,5 = 0,25

(Son independientes»

P(S)= 30 = 030 100 '

P(V) = 40 = O 40 100 '

10 P(SnV)=-= O,lO

100

p(S lv) = P(SnV) = 0,1 =0 25 P(V) 0,4 '

171

Page 88: Libro Análisis de datos.pdf

, 1 \, 11111 ClII : 1\

, I I

I 11 ' t 111 1' lo. , 11 ' . 11, 11 11 11 1I t 11 t 11 1 ' ) , 11 . '1 ' VllI ' )11 » (V) 1'11 ' 1' 111 III

11 ' 11 1I ' lIt 's 1 ' 11dl ' 11 111 ' ' \lllIpl 1'. 1 111 ' 1/ (8 n V) s ' ti i 'lI t" " l l' (. ') 1/' ti 1I110S:

1'(S n V) = O,IO

1'(8),¡>(V) = 0,3·0,4 = 0.12

1111 s lo ~ l ' 0,10::f:. 0,12 no podemos decir que sean ind p ndl 1111

'J' 1 mi i n:

Si S .Y V fueran independientes tendría que ocurrir: P (S IV) I'! ( ' 01110 J olmo comprobar: 0,25 ::f:. 0,30.

0111 '1 )11 :

J. lit I l ' 's 'nla ión gráfica de los datos de los que disponem

A 0,4

0,6

B

S ' • , ..

P(AnP) P(A)·p(p IA) P(A)·p(p IA) 1 (/\ Ip) = P(P) = P(AnP) + P(BnP) =-P(-A-).-p-(p ..... IA- ) -+P- (-'--B-).-P(-p..-IB)

= 0,4·0,9 = 0,36 = 0,36 = 0,923 (0,4·0,9)+(0,6·0,05) 0,36 + 0,03 0,39

. 1 , Solll ' j I : A

p(B lp)= P(BnP) = 0,03 =0 077 P(P) 0,39 '

1/

'" IIlIhl 11 :

· o lllci 1:

· olu ión: A

l' Ul/ ' ) I 1' 111) I () , l O,O !7

1 (A) = O,5 j (D I/\) = O,80

P(B) = 0,5 p(D IB) = 0,70

p(.i5 IA) = 1- p(D IA) = 1- 0,80 = 0,20

1'

/\) = 0,5 p(D IA) = 0,8=> p(.i5IA) = 0,2

l' 8)=0,5 p(D IB)=O,7=>P(.i5 IB )=O,3

_ P(B n i5) P(B).p( i5 IB ) P(B).P(i5 lB)

II(B ID)= P(D) = P(AnD) + P(BnD) = P(A).PCD IA)+P(B).P(I 1m 0,5·0,3 = 0,15 = 0,15 = ° 60

0,5·0,2+0,5·0,3 0,10 + 0,15 0,25 '

· lución: A

1'(DuB) = P(D)+P(B)-P(D nB) = [P(DnA)+P(DnB) J+ P(B) - P(D n 1 )

= P(DnA) + P(B) = P(A).PCDIA) + P(B) = 0,5·0,8+0,5 = 0,40+0, 5 = O, O

\ lución: B PA = Plan Antiguo

PN = Plan Nuevo

pePA) = 100/500 = 0,2

P(PN) = 400/500 = 0,8

También:

p(A lpA) = 60 =0,6 100

p(A lpN) = 240 = ° 6 400 '

os datos que tenemos son:

171

Page 89: Libro Análisis de datos.pdf

NI I 11111": l ' 1'1 \ II \ 111 11 \ lO

l ' (1) . ~() IIIU fIN 1'1 \1\ IItI ·vo IIN 240 I () 00 A 1\1 I 'o l tll'

O 200 00 NA . No tl l I'obol'

Notu: ' 11 lu Tabla a.pare en en negrita los datos que n s tan en ,1 ',¡ '1' ' 11'10 ,Y 11

11111 » l o~ qu ' han completado.

A parlir de la tabla, tenemos:

P(A) = 300 = ° 6 500 '

I (l . olu ' i n: A

I 1;\ = 0,2

IHO

I ( 1/>;\) = 0,6

11( ;\) 0,6 (ver ejercicio anterior)

P(AnPA) = P(PA)·P(A IPA) = 0,2·0,6 = 0,12

P(PA) ,P(A) = 0,2·0,6 = 0,12

Si son independientes

T'1111 bién:

datos que tenemos son:

A

PA 60

PN 240

300

NA

40

160

200

100

400

500

Donde: PA = Plan antiguo PN = Plan nuevo A= Aprobar NA = No aprobar

N La.: en la tabla aparecen en negrita los datos del enunciado.

A partir de la tabla, tenemos:

P(A) = 300 = ° 6 500 '

P(PA) = 100 =02 500 '

l' l ' ) () , I

I Itl ,' l() q I ':

1 ( liPA) = P(A)· P(PII) = 0, ·0,2 = 0, \2, I . I s su 'liOS son 111 l '

1"'1) li nt .

I i! 1

Page 90: Libro Análisis de datos.pdf

'1 'tllll , (,

11 S

Illdllll i()11

1I Ihle :tlv<llol'ia: dcl'inición y tipos

II ¡ Illle" "kalorias discretas I'lIl1t: i6n de probabilidad

. FlIllción de distribución 1. Media'y varianza de una variable aleatoria

I 1 1I I hllciones discretas de probabilidad liLa distribución binomial I J. Otras distribuciones

.\ 111 H':O

Il'I' 'idos de autoevaluación oh Iciones a los ejercicios de autoevaluación

iJ i I

Page 91: Libro Análisis de datos.pdf

('IÓN

lo, n 1 tema anterior, que un experimento cuyo resultado no 1"1 I ' ir con certeza se denomina aleatorio. Si el experimento ale-11 diz una sola vez se obtendrá un único resultado del espacio

1. 1'1 '1 a medida que aumenta el número de ensayos irán apare­I Ic 1, I resultados posibles, cada uno de ellos con su correspon­

,uh d ilidad.

Ilc I ' n este tema que, para cada experimento, podemos definir una 1 I'i bIes que pueden ser de naturaleza discreta o continua (de

1 los mismos conceptos vistos en el tema 1, referidos a las varia­I , ti as) y que denominamos variable, o variables, aleatorias. En

1 !lO limitaremos a una variable aleatoria discreta, dejando para el 11 1'1 L el caso de las variables continuas.

11 ' 11 ' 'mos también como, para una variable aleatoria discreta, pode-11 t I'uir su función de probabilidad y de distribución.

11 I 'nte paso será describir su función de probabilidad mediante la 11 11 le unos valores numéricos que representen su tendencia central 1ll'1' ión o variabilidad. Estos conceptos son similares a los ya vistos

I rin eros temas cuando se estudiaban variables estadísticas.

ti m nte, dedicaremos especial atención a la distribución binomial () el caso en que una variable aleatoria presenta solamente dos I Iv s. Analizaremos sus características fundamentales y veremos II aplicación a la práctica es muy sencilla utilizando las tablas del

bjetivos a conseguir con el estudio de este tema son los siguientes:

'r capaz de definir correctamente una o más variables aleatorias obre los resultados de un experimento aleatorio y determinar los

185

Page 92: Libro Análisis de datos.pdf

I dlll\ qtll 111111 \ 1111 I d ' 1" 1111 11 ,,1, \1 'I,hl dI 11111

d '1' 11 ti \,

( ni 'ulnl' ' int rpr lar la m dia y la varianza de una varj 'lll ~. ti 11 ,

I " l' ' tao

OliO • ' 1' I ondiciones de aplicación de la distribución bi !l O"1

111 • I h .Y s 1 varianza.

M \11 '.in l' n oltura las tablas de la distribución binomia l oltl '1 )J1 d problemas concretos.

I IABI.I ~ ALEATORIA: DEFINICIÓN

'011 ' "t ya conocidos de espacio muestral y probabi}jdtl I ' 11 -1 l ' ma anterior, vamos a añadir el de «variable a l '11 101 1

( ' (1 111 ' 11 í', ' 11' ' 11 ' definiendo qué es una variable aleatoria y, a contil 1I11

I p Oli 11' ' 1 )S Igunos ejemplos.

I J 1I \ variable aleatoria es una función que asigna un número r " 1 1, 010 lIIlO, a cada uno de los resultados de un experimento aleatorio,

N )[ 's' qu sobre un experimento aleatorio, podemos definir una 11

111 · 1, In 1 anera que consideremos oportuna. Así, por ejemplo, sohl , p l'im nto de danzar una moneda al aire en tres ocasiones» p ti ' 11 11

ti n 11 ¡ l ' U variable aleatoria como «número de caras obtenidas», ' tllI

' 1111111 'I'( d cruces obtenidas», o también como una variable que« t 111 1

tlOI ' 1 ' lia ndo el número de caras obtenido es mayor que el número d' 1

Y loma 1 valor O en otro caso». Pues bien, definida la variable y un \ "bl 111 lo m resultado en el experimento aleatorio, la función asigl 1 11

¡dlll ' IIUI rico inequívoco a ese resultado. Lo que es aleatorio, en 'lo 111

111 ' 1 vi ' 11 ' 1 azar, es el resultado que obtenemos al realizar el experim ' 111

II! Ilodo y no la variable o función.

111 11 pll1 11'11' 111 ' VII' 111 I

1 I '

11 ¡\ I 's [ a l da I í d (jnid 'ollllnuas. Cuando la variabl al at ri

l ' I

1 I IIl'Init y numerable de valor (por j l11pl , nJl11 lo d • 11 ltur 1 ) o finito de valores (por ejemplo, la variabl ~

1 . 1I(1l r de caras obtenidas al lanzar una mon da impar h l ' 11

011 \ '» ólo puede tomar los valores O, 1, 2 Y 3) decim S qu \ '" A lo ' valores concretos que puede tomar una variable al at !'ia 111' mos por Xl' X b ""Xn y, en general, por Xi' Si una variabl pu '.

I infinitos valores (o un conjunto de valores «no num l'a ll '») continua.

11' t ma nos limitaremos exclusivamente al caso «discret »'y d ',11 I ,'.'ludio de las variables continuas para el tema siguient '.

Definimos la variable aleatoria X como «el nUlm1c:n;J '1Ii al lanzar al aire una moneda imparcial en tre

caso la variable X puede tomar los valores O, 1, 2 Y 3.

O si no sale ninguna cara

X = 1 si sale una cara

2 si salen dos caras

3 si salen las tres caras

=O · X =1'x =2yx = 3 '2 '3 4'

IH,

Page 93: Libro Análisis de datos.pdf

HII ,1 'sllllio l ' hsvarhbl's'lI 'llorÍ'lS Ji ' r 'laS,vam s pr'sl r '. " I

l ' " 11 l u [un i.r d pr babilidad y d di lri bu ' IIJII ,

11 111( ' Ii \ Y Sil varia l z.a. A lo largo de todo el t ma vamo a d arrollal ' 1111

l. \) Illll y S ' 1 ill , I pi ntado en el Ejemplo 6.1, para facilitar 1 cá l '1111. 1, I1 1 \ l' n !'ijar I n ptos fundamentales .

, , l. Fu ndún de probabilidad

LId ' S ' l'ip i n del comportamiento matemático de una variable al <1 11'

1 ,d ( ' 1' '1'\ lo I aremos de forma similar a como se hizo, en los temas i ll l

I ti eI ·1 1 • 1 ), n las variables estadísticas. En ese caso su distribu ' 1111

l ' 111 1 1, I I 1 () r 1 valores que tomaba la variable y su correspondient 1'1

1 11 111 ' 1 l' 1 \1 iv:.l proporción. En el caso de una variable aleatoria dis l' '11 \ , Illd l' ti \ Il P r los valores que puede tomar la variable (que denom 1 11 1

1 ( 1\1 11. h ti Itualn nte por Xl' Xz, ... , X'" una vez ordenados) y su corre 1 \111

11 ' 111 ' I mi bjlidad. Siempre que sea posible, y de aquí en adelante, p I"

I 111 Ii l' ' 11 os d los subíndices para una mayor claridad.

IHH

, 11 ma función de probabilidad de una variable aleatoria dis ' 1' ta, ,y e representa por f(x), a aquella función que asocia a caclll rdo!' d la variable la probabilidad de que ésta adopte ese valor . .l.

1, ' ir:

f(x) = P (X =x)

V ' [.1 m algún ejemplo:

6.2. Consideremos un experimento aleatorio consistente una moneda al aire en tres ocasiones. Si defin imos una

X como «número de caras obtenidas» obtenemos la "~i". '.u .... ,u

3/8 = 0,375

1/8 = 0,125

columna recoge el espacio muestral del experim nt valores que puede tomar la variable X anteriorm nt

~.~"" .... ,. sus correspondientes probabilidades.

función de probabilidad de X es:

x ° 1 2 3

{(x) 0,125 0,375 0,375 0,1 25

x {(x)

° 0,125

1 0,375

2 0,375

3 0,125

l'un ión de probabilidad de una variable aleatoria discreta pu ' 1 1

IIl arse mediante un diagrama de barras donde se recogen] S vnlo loma la variable en el eje de abscisas y, en el eje de ordena h s, 111.

Page 94: Libro Análisis de datos.pdf

0,5

0,375

:E 0,25 -0,125

O 2 3 O x

l' ~I II 1/) , 1. R '1 l ' '8 n tación gráfica de la función de probabilidad del ejem l lo tI

1. 1,' los I r p i dades fundamentales que debe cumplir la función d \ 11111

¡, d, II h 1 SOl :

P'l l" l ualquier valor de x, siempre toma valores positivos o nu lo .

I ' i 1':

VXEX f(x)"20

• La suma de todas las probabilidades correspondientes a cada va lol d , \s igual a uno:

l.. f(x) = f(xl

) + f(x2 ) + ... + f(xn ) = 1

( I s 'rvará, también, que estas propiedades no son más que una a<.lt\ 1'1 ' ¡O ll 1\ I d finición axiomática de la probabilidad al caso de variabl 's d

\ lol'ias.

. . . FUNCIÓN DE DISTRIBUCIÓN

I,u !'UI ión de distribución, o función de distribución de probabilida I 1111 ' \ vnri bl aleatoria X, se representa con la misma letra que su funci )11

I m i n ~ ilid d, pero en mayúscula: F(x) , y nos indica cuál es la probabil ld

I lO

d" ll clIll 111 11 11 1111 d CI! 11 11'1111 1 11 p ll d qt h' 1111 V d CII I CIII O lt " li \ , Ip lI 1' 111 :

F (x ) = P (X '.5, x)

IIn 1 otra m anera: si ordenamos de menor a mayor 1 v'll )1' s ' 1, ti 1, al atoria discreta , la función de distribución e obli 1 ' ' \ ' lI ll ltl

(o sumando) los valores de la función de probabilidad, d r rl1lL\ q" ' 1 ' 111 0 la siguiente expresión:

F(x) = P(X ~ x) = f(x1)+ f(x2

)+ .... + f( x )

Con los mismos datos del ejemplo 6.1, dond . consistía en lanzar una moneda al aire en tr

definido la variable X como «número de caras» función de distribución .

F(O), F(1), F(2) Y F(3). Comenzamos por F(O) qu de que la variable aleatoria X: «número de caras» tom

o igual a cero, esto es:

F(O) = P(X ~ O) = P(X = O) = 0,125

similar, F(1) es la probabilidad de que el «número d o igual al, esto es que sea cero y uno:

~ 1) = P(X = 0)+ P(X = 1) = f(O) + f(1)= 0,125+0,375 = 0,5

la probabilidad de que el «número de caras» sea m

111

Page 95: Libro Análisis de datos.pdf

3) = P(X = O)+P(X = 1)+P(X = 2)+P(X = 3) + f(1)+ f(2)+ [(3) = 0,125+0,375+0,375+0,125

se suelen presentar resumidos en un

o 1 2 3

0,125 0,500 0,875 1

a las variables estadísticas:

x F(x)

3 1

2 0,875

1 0,500

O 0,125

1: \ r pr sentación gráfica de la función de distribución anterior '\l 11

¡' t' " , gida en la figura 6,2.

que F(x) va «dando saltos» precisamente en los valores l · Id III (O, 1,2 Y 3) Y el círculo «blanco», de la gráfica, no incluye eso ' V tic

" '. As1, por ejemplo F(2) = 0,875 pero F(1,9999 ... ) = F(1) = 0,5.

01 s rvando la gráfica de la figura 6.2 se deducen, sin necesidad "\' ' \1 I'l'i r a demostraciones matemáticas, las propiedades fundam ; 1\1 1 • 1 I d. be cumplir la función de distribución de probabilidad. I I

1111 :

Pll

/(x)

I

0,87

0,7

0,625

0,5

0,375

0,25

•• ----0

0,125 __ ---()

o 2 3 x

R 'presentación gráfica de la Función de Distribución d 1 ej I11plo 6, "

l'clllo!oi lo valores que toma la función de distribución de pl 'ol ll l I ti ,,1 11\ I itivos o nulos, es decir:

Vx F(x)20

nula, vale 0, para todo valor inferior al menor valor d 1'\ V 11 ,

toria, Xl :

F(x) = ° si x < x ¡

i"( \) igual a uno para todo valor igualo superior al mayor va lo l' I \ 1\ Ilriable aleatoria, Si llamamos «xe al mayor valor de la varh l I ':

F(x) = 1 si x 2 Xk

1 fLlnción F(x) es no decreciente ya que es una acumulaciór SlIllll

I I r babilidades que son siempre positivas o nulas,

. 1 I robabilidad, P, de que la variable aleatoria X tome val 1 S '() /I1

Im'/ldidos entre x, y x2 (Xl S X S x 2) es la diferencia entre lo va lo l' '. ti ' 1, función de distribución correspondientes a su valor superio l' 111 ' 11 0 .

11 V lor inferior. Es decir:

P(x, S x S x 2 )= F(x2 ) - F(x,)

Page 96: Libro Análisis de datos.pdf

I I tor qu para una variable discreta X podíamos cal ul" 11 1\1(\ IIn H 'n illam nte obteniendo el sumatorio del producto de cada lIllIl I • I )¡ ' v'd l' ' 5 d la variable por su frecuencia relativa o proporción. PI!

" ' 11 , I 11" \ 'al ular la media, que designaremos por la letra griega «!L», 1, 1 111 1 V \ I'i di , '11 a toría discreta X calcularemos el sumatorio de cada uno 11

111 dOI ' " I l ' l ma la variable por su correspondiente función de pr ol \

" 1 el Id . H' l ' ir:

I • \ I 4 ti la , P, d una variable aleatoria discreta X viene definida por \'\ 1' 111 Ill ' pi ' ión:

!L = Lxf(x)

1,11 I d ia de una variable X, también se denomina esperanza mal ' ", Il'a, o valor esperado de X y se representa por E(X). Este término I 1I • ,' liS 1"lf en los juegos de azar y fue introducido con el fin de po I I ( . tllll'\I ' la ganancias esperadas, si se repitiese el juego un elevado nll 11 \

1'( ' I \ V s. Referido a una variable aleatoria representa el promedie- I '" I 'o lll ' l maría la variable aleatoria si se repitiese el experimento al ' \ I ClI ' () ¡ 11 fj I ila veces.

¡JI.

- - . , .(~ ..... ,(,...'

JII .. t JI, lJ~' C.

f( ) If( )

° 0,1 25

1 0,375 0,375

2 0,375 0,750

3 0,125 0,375

1,5

J.l = E (X) = Lx{(x) = X/(X¡)+x2f(x2)+ x/( x3)+ xl(x4) =

= O -0,125+ 1-0,375 + 2·0,375+ 3·0,125 = 1,5

\1' I btener la varianza de una variable aleatoria X, que d si ]1 ' 11'(' 111 4 I

, I lra griega «sigma» elevada al cuadrado) ó V(X), deb n os ' ti ' 11111

IIllIt rio del producto de cada uno de los valores que toma lu v \1 d,l , su media elevados al cuadrado por su correspondienl vu lo l I 1\ "11 d probabilidad. Es decir:

L I varianza u 2, de una variable aleatoria discreta X viene d n n i 1 \

11 I t iguiente expresión:

,11 : Una fórmula alternativa, que puede resultar muy útil en div nns , ¡ nes, para calcular la varianza es:

(J2 = E(X2) -[ E(X) J

E(X2) = L x2f (x) Y [ E(X) J es la media de la variable el vad '\

\ludrado. Por tanto, la varianza puede definirse también como ItI I"mza de los cuadrados de X, E (XZ), menos el cuadrado de la SI '.

' 1',11 de X, [E(X»)2.

1"

Page 97: Libro Análisis de datos.pdf

( _¡.¡,)a. f( )

2,25 0,28125 ° - 0,5 0,25 0,09375 1

0,5 0,25 0,09375 4

1,5 2,25 0,28125 9

0,75

(J2 = I,(x- J1i . ((x) = 0, 75

0'2 = E(X2) -[ E(X)r = 3 - (1,5)2 = 3-2,25 = 0,75

.4. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

n i 't n algunas distribuciones discretas que, por utilizarse fr ' (' 111

111l' l1t \ omo modelo o por su interés como instrumento estadísti 'O,

\ , \ \ ' jaJI11 nte importantes. De muchas de ellas se han elaborado 1..1l'l1l

I ' 111 I que facilitan su aplicación a problemas concretos.

En Ciencias Sociales y de la Salud se trabaja, en muchas ocasion '. , II V \t'i abl aleatorias discretas que sólo pueden tomar dos valores (dicollll ' IS y que habitualmente representaremos por 1 y O. En estos caso , l ' I t 11 Iy útil la utilización de la distribución binomial que analizamos ,' I,'ui nte epígrafe.

11)6

Illl le' ll to binomial consiste en repetir «n » veces, y de forma in I 'P ' 11

11, I,Y Bernouilli. Una variable aleatoria X sigue una disLril1l IO Jl

Cl JI ,nrámetros n y p ) si expresa el número de éxitos en «/1 » IV " '/, I

pl lldi ntes de un experimento con probabilidad «p» d ob ll' 1I ' 1' (

11 111 0 , ( l - p ) de obtener fracaso. Esta distribución sueJ \ n.' pl ,(" (' 11111

11\ / 1 B(n, p) donde B indica «binomial», n (número d ' ' 11 IVII II 1'1' , il un experimento Bemouilli) y p (probabilidad d «' 1111 )

• Si lanzamos una moneda imparcial al aire en tres o la variable aleatoria X como «número de caras obt

seguirá el modelo de distribución binomial con p y p = 0,5. Diremos que X sigue un modelo B(3; 0,5). E t

cada lanzamiento sólo son posibles dos resultados: «

y «fracaso» (salir cruz); los ensayos son independi nt tado en un ensayo no depende de lo que haya salid

'''''' ,.'''rr~" anteriores) y la probabilidad de «éxito» (en est ) se mantiene constante a lo largo de los ensayos ( n

ti 'n, una variable X que sigue un modelo de distribución binolll/IL III tros «n» y «p», y que simbolizamos por X -¿ B (n , p), PI S " 1 \ 111, t kas fundamentales recogidas en el siguiente recuadro:

Page 98: Libro Análisis de datos.pdf

( ' /1 (/( '11'/ (", I t 'tI , /111 11 /11 1111'/1 1(111'. /" 1/1/(/ " ", II IIJI! 'h " 11 (/111')

1"1111 ' )11 \ I ro \ \ \ tl i 1 \ 1:

j"( ) = P( = ) = ( : ) p q'

11' \\11 -I)n 1 \ di tribu ión:

M 1 \: 1' np

= npq

le 11111 : ( ,1'" '14 \ «número de aciertos», «n» es el número de ensayn I

l \ \ 1 rol ub ilidad de éxito en cada uno de los ensayos, «q» es I ,

\ d fracaso (1-p) y el número combinatorio ( : ). qu '

I • « 1/ • bl" x » es igual a n! x ! (n - x ) !

AUIl lLl relativamente fácil deducir las características anteriore n 1I 1I1l0 S a h cer aquí formalmente, sino que recurriremos a su aplicaci 11 I

I ( ' IIIJ los ncretos.

[!:' 'lll1lml;Jl0 6.8. Siguiendo con el experimento aleatorio de lanzar n tres ocasiones, presentado en el ejemplo 6.1, y definida X

~_Imlero d caras» se pregunta: A) ¿cuál es la probabilidad de o 2 caras?; B) ¿cuál es la probabilidad de obtener dos caras

y C) ¿cuál es la probabilidad de obtener más de dos caras?

ha indicado en el Tema 5, podemos responder a estas d sarrollando el espacio muestral y aplicando, en cada caso,

2) (2 JO,s2 ·0,5' 2 -m·0,s2 ·0,5 - (21.~JO,52. ,5

5= 3.0, 25·0,5 = 0,375

S 2) = f(O)+ f(1)+ f(2) = 0,125+0,375 + 0, 375 = 0,875

P(X= 0)=(3).O,50 .0,53-

O =(3),1,0,53 =(~).1.0 53 = O O 0!·3! '

,125 = 0,125

= 1)= (3).0,51.053-1 = (3).05.052 = (~).O 5·0 5 1 ' 1" 1! ·2! ' ,

5·0,25 = 0,375

P (X = 2) = 0,375 (Véase el apartado A).

P(X > 2) = 1-P(X ~ 2) = 1- F(2) = 1-0,875 = 0,125

que ya lo hemos calculado en el apartado B)

también que la media y la varianza coinciden en los Ejemplos 6.4 y 6.5, respectivamente:

J1 = np = 3·0,5 = 1,5 2

O' = npq = 3·0,5·0,5 = 0,75

11)1)

Page 99: Libro Análisis de datos.pdf

" 11

1.11 In 'rubia J, p ra la función de probabilidad binomial, la I l ' III1 1

011111111 1 'n 'lb zada con la letra «n» se refiere al número d III'III ,Y los v~do l' S d de 1 hasta 20. La segunda columna recog I 11\1111

le I I lO' «( r») q 1 speramos obtener para ese número de ensayos, 1111

" 11\ 111 l · l ' O I 'ls la ese número de ensayos. La primera fila d 1.1 I del 111 CI " P ililO,' vn l r de la probabilidad de «éxito» (<<p») que van l · d 11 ,111 ,O , • 1111 I In 1 Ti r de la tabla se encuentran las probabilidade ' 0 111

pi 111111 1111 • L ' I PI'O bilidad buscada, para unos valores concretos d ' (( 11

" • ' 11 ' 11 ' 1111"\ '11 la intersección de su fila con la correspondiente oh 1111 , 1\ \ (h p ll, As , I (r j mplo, la probabilidad de obtener dos éxitos en I1 1

11. babilidad de éxito de 0,3 se encuentra en la tabla 111 , ge en la figura 6.3 y vale 0,1890 . .

Probabilidad de éxito ''p'' 001 o,os 0,10 0,30 0,45 o so

-------------------------.~ ~ 0,3341 0,3750

l ' I 111 ' I ,3, Oblención de las probabilidades a partir de la tabla de la funci n de probabilidad binomial.

1. \ 111 ¡ Ii Z'l i n de la tabla n, función de distribución binomial, es idén I , , I1 11111 ri r. Unicamente resaltar que las probabilidades que apare ' 11

\1 I I 111 (. ri r d la tabla son acumuladas. Veamos un ejemplo de la utili z 1

1111 l · 's t ' dos tablas.

' 00

- p (X :5; 2) = 0,875 Utilizando la tabla 11 y recogi ndo 1 v en la intersección de la fila n = 3 x = 2 con la column p

> 2) = 1- P (X:5; 2) = 1 - F (2) = 1 - 0,875 = 0,125

que F (2) ya lo hemos obtenido en el apartado an terior utili la tabla n.

\1 mbargo las tablas 1 y n sólo contienen valores de p d 'd \ 0,1 11 \ f~, ntonces ¿qué hacer cuando tengamos unap > 0,5? En " I SO, ( 'CIIIIII

, lo que haremos será «intercambiar» las condiciones de« xi[O ))'y 1I 1

In, Veámoslo con un ejemplo.

6.10. Sabemos, por la experiencia de años anteriores n I de Psiquiatria y Psicología Clínica, que un 60% de los paci n

tratados con Técnicas de Modificación de Conducta. Si un det día acuden 5 personas a consulta ¿Cuál es la probabilidad d sean tratadas con Técnicas de Modificación de Conducta?

caso, si la probabilidad de ser tratado con Técnicas de Modifl de Conducta es p = 0.6, la probabilidad de no ser tratado n

técnicas es q = 1 - p = 0,4. Por otro lado, que tres personas, d u de cinco, sean tratados con Técnicas de Modificación d o

es lo mismo que dos personas, de las cinco, no sean tra t d tales técnicas. Por tanto, el valor correspondiente, en la tabla 1, nt(~rSeC(::lOn de la fila n = 5 y x = 2 con la columna p = 0,4 nos d

a la pregunta planteada. El resultado es 0,3456.

'01

Page 100: Libro Análisis de datos.pdf

11 11 tlllI ' IIII' pllll\ 1\111 111 \'1 1I '1" , 11 11 Ilhll 1 11 , ,1 1111111 111 I 11 I \1 (1), . 010 11 I t h t. I 1 O, H 11 ' It Ito 11 ) I 1\111 ' 1 11111 1('11\ I 101.1 111 111" 1 \l ' t V dol' . ,'UI dOl',' ' \ \" 10 1 '1\10, ha ' \1' un'\ . 1" Ill ll Il ' 11 11

1, B II()\II ti 11" lislt"illl ' i n Normal , . 1T1() V ' 1' ' ITI S ' 11 1 J r 11110 I 111

. Oh, di la ¡huciones discretas

I l' ·UMI .... N

l ma hemos introducido el concepto de variable alea ((II 1 '\I(). li sUn uido entre variables aleatorias discretas y continuas y h '11

I 11,1 , '1 lo 1 paralelismo entre la función de probabilidad de una va l'! ti d, Ilol'in li r la y la distribución de proporciones (o frecuencias relal 1 1111 \ v'tri bl stadística. El mismo paralelismo se produce entre la ( d

1 I 1'1111 i 11 d distribución y la tabla de proporciones acumuladas.

1I ' rnos ludiado la función de probabilidad de una variable a l • 111 1 I ¡ l' ,t y ] hemos descrito haciendo uso de su media y su varÜtl1

I 11 tllIl \1\1 " h mos comprobado la sencillez de manejo de las tabhl 1 ,1 1" 1 11 i n binomial y la utilidad para resolver los problemas I

' (1

ti 'ti d las sigui ntes afirmacion s es una propi dad bá ' i ·tl l ' tod \ 11111 '1 >n l probabilidad de una variable aleatoria X di r la?: A) I nI' \

11111 lui r valor de la variable aleatoria, su [unción d pr I I ¡Ji In 1 I \1( d l mar valores negativos; B) la función de probabilidad s, s i 'm­I 1 \ , n decreciente; C) para cualquier valor de la variable a l a lori a I t r\ln ión de probabilidad siempre toma valores positivos o nul s '

1' 11 I iguiente tabla:

2 3 4 5

{(x ) ° 10/60 24/60 20/60 4/60

, muestra la función asignada a una variable aleatoria djs ' ," ' 111 " 1" 11111 'ión: A) es una función de probabilidad porque f(x) 2: O; B) no " 1111 1 IlIn Ión de probabilidad porque f(1) es nula; C) no es una fundóI l ' ,,1'0 1 "ilidad porque no cumple alguna de las propiedades fundam nla l 'H .

I l\ r el diseño de un experimento de discriminación dispone m s d . 11' '5 cuadros grises y dos azules. Seleccionamos de forma suc siva y in reposición dos de estos cinco estímulos y definimos la variab l" d toria X: «número de estímulos grises seleccionados». La f m i6. ti probabilidad de esta variable aleatoria es:

A) B) C)

x 1 2 x ° 1 2 3 x 01 2

f(x ) 1/3 1/3 1/3 ((x) 0,2 0,3 0,3 0,2 {(x) 0,1 0,6 0,

En un experimento aleatorio cualquiera para denotar la expre i n « h I robabilidad de que una variable aleatoria, X, tome valores 111 TI r 's O iguales que 4» utilizamos: A) f(4); B) F (4); P (4).

11 \

Page 101: Libro Análisis de datos.pdf

e ,n, I 11, 11111

U A I l\ 1'1 i l' I la tabla, con la ["unción de probabilidad d 0 ,0 , 1\ ~ l lll \

d 'nlori'l X di reta, la media es:

11)

)

x

-1 2

4

((x)

0,2 0,4 0,4

, ( , ljlm vUI'i'lbl aleatoria discreta X toma los valores 0;.1 Y 2, 1.' 011 l' 1 ' I ¡Ii lad ' 0,7; 0,2; 0,1, respectivamente. La medIa o '~ p ' 1,111

Ill 'lt 'm li a de X vale: A) 0,2; B) 0,24; C) 0,4.

( , I () ,

, 12,

'O I

VI Y una variable aleatoria discreta con valores 0, 1, 2, 3 Y 4, 1I ' in ' valores de Y son equiprobables, su media es: A) 1,2; ) ,11

1,5.

Lu va riable aleatoria X toma dos valores (cero y uno). Sabi ' 11 1" ti P( ) = 0,2 ¿Cuánto vale la probabilidad de que X tome el valor It

A) 0, ; B) 0,2; C) 0,5.

T 1 indo en cuenta los datos de la tabla, la media de la variahl nI ri aX vale:

A) 2,7

I ) 7

2,4

x

1 2 3 4

F ex)

0,2 0,5 0,9 1

111 dllll d , lIllhll1 ' ,1 , '" (I"H, II 1I I IIIZ It!¡ 11 11 d,ll ) \, : IJ) . , ~; () 1, 1 "

d 'qu un 10% de la población española padec a lgú n 11 J () 1, 11 , 1 1 gimos aleatoriamente una muestra de 8 per onas, h I 1'0

h 11 hd de que sólo una de ellas padezca estrés vale: A) 0,2 38; B) ,00 1; ) 0,3826.

out J uando con los datos del problema anterior, la prot a l IlId Id I 1\1' más de una de ellas padezca estrés vale: A) 0,1869; B) O, \H 1: ) O, 05.

11', 1m n de PIR (Psicólogo Interno Residente) consta d· ,¡ ' 11111 ti 1I '~ tlnlas tipo test con 5 alternativas cada una de la qu uníl 'ni I

1111 " tao Si un aspirante a la admisión en el PIR contesta 1 ' \ :1, 11 ' ()

1 ' 1'!1 , la probabilidad de que acierte más de 5 vale: A) 0, 2( ; B) 1, 1\ 58; C) 0,9133.

IIlltinuando con el ejercicio anterior (6.18) ¿Cuál sería el nún ' l'O 1, , '!L'rlos más probable, en esas 20 preguntas?: A) 5; B) 4; C) 2.

linIos mismos datos del Ejercicio 6.18 ¿Cuál sería la pr b bili In 1 1, {le falle 13 o más preguntas?: A) 0,9679; B) 0,8265; C) 0,41 14.

) _UCIóN A LOS EJERCICIOS DE AUTOEVALUACIÓN

1. \ . xpresión {(x) se utiliza para representar la probabilidad 1, lIll \

ariable aleatoria X tome un valor concreto que representam s I 0 1' \',

', ' decir: ((x) = P(X = x).

,¿o

Page 102: Libro Análisis de datos.pdf

, , , ) .. , 1

, 1, oh, " 1\ :

( , 1. olu ' !)!:

1 qu f() = 1, q 1 S lIl1l\ I 11

d la [un i n d pr babilidad. En ' 1'(\ lit

10 24 20 4 58 L',{(x) = 0+ - + - + - + - = - :;é: 1

60 60 60 60 60

lO 110 l' ' OIT ta porque X no puede tomar el valor 3.

1'1 1 I Hilo, p r exclusiÓn, la respuesta correcta es C. (Pued ' 1111

plI,l \1 ' ·1 1 • ' l r que efectivamente esta es la solución correcta ." 1I11I1d( lo.' 'Cd ulos oportunos).

(' , , Holu '1 )11:

1. I I l ' b b.ilidad de que una variable aleatoria, X, tome «valol1 111 ' 11 01' S iguales que 4» o, lo que es lo mismo, P(X::; 4) se repr s ' 1\1 11

1 0 1' Ji (4).

Solu i n: A

I ( = 4) = F(4) - F(3) = P(X::; 4) - P(X::; 3) = 0,974-0,963 = 0,01'1

( .7, S >lu ión: A

Por lanto:

224 f(O)=P(X = 0) = - .- = - = 0,25

4 4 16

f(1) = P(X = 1) = 2.(~.~) = 2'(-±-) = ~ = 0,5 4 4 16 16

2 2 4 f(2) = P(X =2) =-·- = - = 0,25

4 4 16

F(O) = feO) = 0,25

F(1) = f(O) + f(1) = 0,25 + 0,5 = 0,75

F(2) = feO) + f(1)+ f(2) = 0,25 + 0,5 + 0,25 = 1

Cllw 111 : B

11 1),0, I ,() , I ,(J , O, I O,H I 1,

11 111 j 11 :

1/ = I.::() = -re ) = 0,0,7 + 1·, 2 2· ,1= 0 . ,2+ 0, 2 O,

olll i n: B l. , ru 1 i n d probabilidad

x ° 1 2 3 4

f'(x) 0,2 0,2 0,2 0,2 0,2

Por lanto,

l/v = Lyf(y) = 0·0,2+ 1·0,2 + 2·0,2 + 3-0,2+ 4·0,2 = O +0,2+ 0,4 +0,6+0,8 = 2, 0

olución: A

¡;'(X) = 0,2 es la Esperanza o Media de la variable X (tambi '11 " • l ' pi \ .' nta por J.1). Su fórmula es:

E(X) = L x.[(x)

1 \ función de probabilidad de la variable X es la siguiente:

x ° 1

fCx) fCO) f(1)

) uesto que los valores que toma la variable X son O y 1 y, d ni " /t \' r presenta las probabilidades asociadas a esos valores. Por la nlo, / O

la probabilidad de que X tome el valor O y f(1) es la probal ili In I de que X tome el valor 1.

~ ntonces:

E(X) = LX.[(X) = 0.[(0)+ 1.[(1) = O + f(l) = f(l) = 0,2

Al tratarse de una función de probabilidad:

L',f(x) = 1

20!

Page 103: Libro Análisis de datos.pdf

( ,12,

V, ¡Ie' , t \I!l II, 1(0) I I 1)

1. I pl'O! ti il i l Id 1, 111

I (()) I (j, I () IOIl H I v dlll' () O,H,

bilidad s q \l ' 1\ 11 "\' 11 11 I

x F(x ) f(x )

1 0,2 f(1 ) = F(l) - 0,2 =

2 0,5 f(2) = F(2) - F(1) - 0,5 - 0,2 .. O,

, 0,9 f(3) = F(3) - F(2) - 0,9 - 0,5 - 0,4

-1 . f(4 ) = F(4) - F(3) = 1 - 0,9 - 0, 1

E(X) = I,x·f(x) = 2,4

, 1 , 1 U i6n: B 11 ay do fórmulas equivalentes para calcular la varianza

bl al atoria X:

a 2 = V(X) = I, (x - ,u)2 -{(x )

a 2 = V( X ) = E(X2) - [ E(X) J

Vamos a utilizar las dos en la siguiente tabla:

x f(x ) x . f(x) (x - JL) (x - JL)2 (x - JL}2 • f(x)

- 1 0,2 - 0,2 - 3,2 10,24 2,048

2 0,4 0,8 - 0,2 0,04 0,016

4 0,4 1,6 1,8 3,24 1,296

2,2 3,36

POI' l'1I lo:

X2

1 4

1

a 2 = V(X ) = I,(x - ,urf(x) = 2,048+ 0,016 + 1,296 = 3,36

ti

ti

11

a 2 = V(X) = E(X2 )-[E(X)J = 8,2 - (2,2)2 = 8,2 - 4,84 = ,\,

l O!!

uLi lizal" la bin I11jal:

/'(2) = P(X = 2) = U }0,62.0,40 = ¡·O, 36·1 = 0,

111 111 0 I uItado lo podemos obtener mirando 1 v'l lol' 1, 1, 1 (>ll '11 r 2 cuadros grises conp = 0,6 es lo mism qu ' )11 ('IIt ' I'

I \1 h nI' azul con p = 0,4. Mirando la tabla para n = 2, = O .Y l' " hl 11 0,36.

1" este ejercicio podemos aplicar la fórmula 1, 111 1'11111 ' 1111

1,,, 11 d i1idad de la binomial. Lo más práctico, sin cml tll 'I"(), t 11I I I \ Tabla r.

" Inl 0,3826 que se encuentra en la intersección de la fih 1/ H 1 1111 h olumnap = 0,1 es la solucción correcta.

1111 pid P(X > 1) y sabemos que P(X > 1) = 1 - P(X $, 1).

111 11 ' ) lado: P(X$, 1) = P (X = O) + P(X = 1).

I IIldn la Tabla I, comprobamos que P(X = O) = 0,4305 Y qu ' 1)( • () , 26. Por tanto:

P (X> 1) = 1 - (0,4305 + 0,3826) = 1 - 0,813 1 = 0,18

t ' ue P (X $, 1) podemos obtenerlo directamente a partí l' l · 1 \ 1 I \ 11 (fila n = 8, x = 1 Y columnap = 0,1) haciendo más ó n 0 1 \ 11

,111 ' i n del ejercicio.

P (X > 1) = 1 - P (X $, 5)

2( 1)

Page 104: Libro Análisis de datos.pdf

IJI 1/, IIldn I \ I ,11 , 11 IlI lIpl ll ll 1111 11 pll ' I /I (),I IJ (),

P ( ' 5) O,HO , 1 0 1' I 11 1(0, l' • 5) O,HO 2 0, I ( 5H.

6.19. Solu i n: El número de r spue ta ac r tadas má pr bab] . '1" ltl 11 1 1 01

esperanza matemática de la variable para n = 20 Y P = 0,2. 1 0 1' I 111

J1 = np = 20 . 0,2 = 4.

(Nota: Obsérvese que en la tabla 1, para n = 20 Y P = 0,2, '1 111\

valor de la probabilidad corresponde, efectivamente, a x = 4 ,

6.20. Solución: A

210

La probabilidad de fallar 13 o más preguntas es la m isma 111 1 1\ acertar 7 preguntas ó menos. Por tanto, se trata de obten l ' 11 .1 p (X ~ 7) para n = 20 Y P = 0,2. Utilizando la tabla II obt resultado 0,9679.

Page 105: Libro Análisis de datos.pdf

T 1111 7

011 ti n l 'l S cl PI b bilidad

7.1. Introducción 7.2. La dislribución normal

7.2.1. Características y propiedades 7.2.2. Utilización de las Tablas 7.2.3. Histograma y distribución Normal 7.2.4. Aproximación de la binomial a la Normal

7.3. La Dislribución "Chi-cuadrado» de Pearson

7.4. La Distribución "t» de Student

7.5. La Distribución "F» de Snedecor 7.6. Resumen 7.7. Ejercicios de auloevaluación 7.8. Soluciones a los ejercicios de autoevaluación

Page 106: Libro Análisis de datos.pdf

I \ I 'Ina vamos a estudiar los modelos de distribución de una varia-le 11 " , [ tinua más ampliamente utilizados en el área de las ciencias

d h. alud. Conviene distinguir entre aquellos modelos a los que " \111 nL se ajustan las variables con las que trabajamos y, aquellos I 1/11 ' Lienen una gran aplicación como instrumentos estadísticos. le I I rim ros, se encuentra el modelo normal y, entre los segundos,

I , 11 ' I 1 de Pearson, t de Sudent y F de Snedecor.

In I ) ' los modelos seguiremos, aproximadamente, el mismo esque­I 1\ te. r veremos su definición, posteriormente su media y su varianza 11Ilt'llt - , veremos la forma práctica de trabajar con ellos utilizando las

I andarizadas existentes que incluimos en el Apéndice.

I m r mos especial atención a la distribución normal porque, además I I ·1 'vancia como instrumento estadístico, responde al tipo de distribu-11' ' sigue la mayoría de variables físicas y psicológicas (la estatura, el 1, traversión, el CI -Cociente Intelectual-... son algunas de ellas).

, . , omo señalábamos al final del tema anterior, las tablas I y 11 del I 11 ) nos permiten resolver un problema binomial con más de 20 ensa-1'(' 'urririamos a la aproximación de la binomial a la normal.

II objetivos que se pretender alcanzar son los siguientes:

<mocer las características de la distribución normal como distribu­l'i n de probabilidad de una variable y la aproximación de la binomial \ dicha distribución.

U tilizar las tablas de la distribución normal para obtener probabili­dades.

onocer las características de las distribuciones t, chi-cuadrado y F: su media y varianza.

213

Page 107: Libro Análisis de datos.pdf

1, cid ' 11 Idl ' Hin , /1', ji \1 IIIItI 11I l' p,'ol d Id I I ,' ll. () ' ' ldllH , 11110, d · t é.'I ' lnillll<.!O,' vu lo l'(\ 1, \, 11 I1

1I1 ' l1t , ohl ' 11 ' 1' los valol' 's 1, 'sl'tS v'u' i't11 's ' tSO 'hdos '1 IllItl. 11'1 1

ItI JI I 11. ' I I'oly,bili h 1 s.

7. . ,,1\ UISTIU BUCI()N NORMAL

HIl ,1 t 'n a ant rior hemos tratado las variables aleatorias di s ' 1' 11

ti IlIdo tilla valiabJ aleatoria puede tomar infinitos valores direm s (11 '

11 ' ,t, 1 \ 11 11'\ v'ariable aleatoria continua. En este caso no tiene s ' 111 dlt 11 d 11 11 ' l · In ( !'Ob bilidad de que la variable tome un valor concreto ("111

Iln 111 1 1I -ha variable se encuentre en un determinado interva lo,

I I 1/, 111/1/ 'í /1 normal, campana de Gauss o, sencillamente, curV'l 11111

111 " 11111111 111111 In ' conoce a esta distribución fue definida por D M Ili ' 11 I 11 1111 1111 11 t o ncontrar las probabilidades acumulas en una di. t 1I

\t" 1111 h 1I(llllh l li ando «n» (el número de ensayos) es grande. Noso l!'!. 11110 ' t s ' \1 l' su características fundamentales, la utilización d· 1,

I ,hll. I I () ' l 'ri nnente veremos una aproximación intuitiva desde J h Inl '1 "un has la la curva normal.

7. .1. Cal"é.,dcristicas y propiedades

(, , sig ti nt fórmula recoge la función, que para variables continua:-: ti '1Iomina i densidad de probabilidad, para una variable X que tiene lI il l

ti 11'11 II i 11 normal:

1(X-IlJ2 f( ) __ 1 _ - 2: ~

x - r:::- e (J,,2n _

para - 00 < x < 00

d,," 1, ¡J y. (J, media y desviación típica, son sus parámetros, n = 3,1416 Y /7 18 Y (base de los logaritmos neperianos).

• 111 a variable X tiene una distribución que se ajusta a la fórmula anl • I e 11'/ I i l' 1110 que se distribuye normalme~'-Y lo expresaremos por: X -7 N (/', ), lndi ando que tiene una distribución noim~l (N) con parámetros «¡J II

y 1 ( 1,

' 11,

(JI

111 112

I 111 , , 7. 1. Curva normal o campana de Gauss en función de sus parám ' ¡I'O"

11 figura nos indica que la puntuación de la mayoria de lo ' in 1I Idl! I I

111111 variable que sigue esta distribución, se encuentra entol"l 0 '11 I 111 I , 111 'dida que nos alejamos de esa puntuación, por su lado iZql1 ,,111

'c h ,va disminuyendo la frecuencia.

I I.'gún una de sus propiedades fundamentales, si a una variabl \ <¡III

11'1 uye normalmente, con media Ji y varianza d, le aplicamos u mIli' \ I t

IlIln ión lineal de la forma Y = bX +a la nueva variable Y tambi 1 s I d IlIlrá normalmente pero con media bJix + a y desviación típica IhIO'" \ lamos la media y dividimos por la desviación típica obtenemo una IHl t ­

v triable que designamos por «Z». Esta nueva variable «Z» se distribu ll' ,

z -¿N (O,l)

y su función de probabilidad vendrá dada por:

2

1 - ~ f(z)=--e 2 para -oo <z<oo

0'&

2 \

Page 108: Libro Análisis de datos.pdf

11111'11 · "t\l.'II ~ ld(Ii

o, O 0,4 0,40 0,35

((z) 0,30 0,25 -0,20 0,15 0,10 0,05 0,00 -I----r""'~__r___--,---+_-r___¡-----'",,-,

- 4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00 z

11 1 t ' \ 72 DJ' tribución normaltípificada o estándar, N(O,l) . r 11 ,. .

11. t I li .' ll'lb 1 i n se denomina normal tipificada o normal os lrllll 1 ,(/( In , N)s tr . n vamos a trabajar directamente con su fun '1 11 I I 11 , i 1\ I 1 pr babilidad. Para la aplicación a problemas COI ' " 111

ta distribución, recurriremos a las tablas III y I ti I

, ,1 S "V 1110S la figura 7.2, entre las propiedades fundamentale d ' 1111

di,' I L1 ' ¡ n TI rmal podemos destacar las siguientes:

Hs sim trica en torno a su media, f.l, que coincide con su median '\ , ti m l. 1, I Irva normal tiene dos puntos de inflexión, es decir, dos punto Ion 1 la curva pasa de ser cóncava a convexa. Estos puntos eS L~ '1

I It lI 'l 1 a una distancia de una desviación típica de la media.

11. ,' (/ sintótica en el eje de abscisas, se extiende desde -00 hasta +00 sill 11 ' 01' nunca a tocar el eje.

1111 d · I 11 11111 1111 111 111 ( 1I (CI Id, 11 1, Ip ll ' 111\ 1 /' 11" 1,

1,0 0,9 0,8 0,7 0,6

r () 0,5 0,4

./

/ 7

-~ /

/ /

0,3 0,2 0,1 0,0

- 3,5 - 3,0 -2,5 -2,0-1,55 -1,0 -0,5 -0,0 -0,5 1,0 1,5 2,0 2,5 3,0 3,5

Figura 7.3. Función de distribución.

lllllización de las tablas

" I tS tablas III y IV se recoge la función de distribución d la ti 11 1111 lIol 'mal estándar. En ellas se presentan todas las puntua in ' t 111 1

~,59 hasta +3,59 con intervalos de 0,01. La primera col m1l\1I ' 111 ,

, . nla letra z consta de un número con un decimal qu , '1' " pOli

I , I LLntuación típica y la primera fila (a la derecha de la letr z) o, ',' ni egundo decimal de la puntuación Z. Todos los valore inl 'do\'

l'lHan probabilidades y llevan, obviamente, un cero delant 1, 1\ \. La tabla III corresponde a las puntuaciones típicas negativa ' (pOI' lo l la media) y la tabla IV a las positivas (por encima de la m Ih ,

Tabla III del Apéndice

11

Page 109: Libro Análisis de datos.pdf

1, pOI '1 IlIplll 1, 1'1111111 H 1111 IIp o, (I"bl, 111) ti l' 1111

1" 1I 1111 \ IImh \1>11 d HI ti (l , Io(lI t

II~ ' , am "!lO 011' tillOS as s ncr to :

I C'alto",o de la probabilidad para valores menores o i~"tll . 1" I 1IIU1 dt'Iamhzada puntuación típica

I I1 ' 1,'0 S' bu ca directamente en la tabla.

variable se distribuye normalmente, ¿ .~~~b'btEme~r valores menores o iguales que z = - 0,25

egativo se encuentra a la izquierda de la ....... ~ ... !ll!11I_"-'_ . gráfica). En la tabla lII, buscamos en la primera

0,2 y en la primera fila el valor 0,05.

• 1!Jm.aaa que deja por debajo de sí esa puntuación es or que se encuentra en la intersección de esa fila

rt este caso 0,4013.

0,4013

- 0,250

1/11 I

11 1 \ I ,bl , I \ Pl 'oh d lId, I )11 ' '0 '1\ I 1111111 I ' 011 el '1 , 1.

i una variable se di tribuye nOrmaJllnerlte, de obtener valores mayores que z = O,50?

n la tabla IV, la puntuación típica 0,50 deja po ~!JClLU.u.~U(;l~U de 0,6915.

1-0,6915-0,3085

o 0,5

nos interesa la probabilidad que queda por encim restaremos de 1 (probabilidad total incluida en la u"ou.'" "

1 - 0,6915 = 0,3085 .

'álculo de la probabilidad entre dos puntuaciones determitllltlfl~

te caso se restan las probabilidades que dejan por debajo d s h. ' I 111 tuaciones típicas.

7.4. Si una variable se distribuye normalmente, ¿cuál es la p de obtener valores comprendidos entre z = - 0,25 y z = 0,50?

determinarlo a partir de las puntuaciones típicas y la ya obtenidas: bastará con restar a 0,6915 (probabilidad

Page 110: Libro Análisis de datos.pdf

-0,25 0,50

111 rO(.RAMA y DISTRIBUCIÓN NORMAL

1111 ' /' 11 ' 111 s q 1 disponemos de los datos de una muestra en lIll \ l '

li t, X l'I P; lIl " \ 7.4.A) . Si hacemos los intervalos más pequeños (H 'lII ' \ '/ I y 1 1 UJ' 1I1 l< S I p ligono de frecuencias (figura 7.4.C) llegamos a un 1 di hlJ( ' 111 s imil ar a la normal.

A rh. A B

F¡ lIl'a 7.4, Representación gráfica desde el histograma a la curva n

ti f'i gura nos indica también que la puntuación de la mayor itl d, ¡ , .' ( s, J una variable que sigue esta distribución, se encuentra en!OIII 1, 111 ' li tl y, a medida que nos alejamos de la media, por su lado izqu! 'Id It'I" 'h , va disminuyendo la frecuencia de casos.

Es! h cho nos va a permitir aplicar las propiedades de la curva 11<1111

datos y utilizar las tablas de la misma forma que hemo. 1111 'd 1'n1 nte.

1 IlI d ll ,, 1 1 'j I! Ihlt \ , tI! 111 " p .\ l ' li t ' 01 , ' 1' d 1, 1

,-x Zi =---!.../--

Sx

ar las tablas de la curva normal a caso concr l s qu ' s iPII ' 11

ión normal vamos a considerar tres ejemplo prá li ' s:

7.5. Imaginemos que las puntuaciones en una det rmi X, de un grupo de 500 niños se distribuyen normalm

6 y desviación típica 2, ¿cuántos niños no han aleanz 1 5?

UU"UJLV.:l la puntuación directa 5 en puntuación típi '

5 - 6 - 1 -=-=-05

2 2 '

en la tabla 111, que esta puntuación deja por debaj ,.. ... n .. '~l de 0,3085.

0,3085 . 500 = 154,25 == 154 niños

0,3085

-0,5 O

I I

Page 111: Libro Análisis de datos.pdf

o 0,67

en el interior de la tabla la ......... '..,. ...... r\ ... ~'I "' ... ás próxima (en este caso 0,7486), y ver

!l'lmCQj~sD'Dn,de: 0,67 (lógicamente se trata de ~c~sitiva porque el percentil 75 deja por debajo d

~eorreSP(mdle a la media).

sta puntuación típica calculamos el P75 de la

p. -x P - 6 z;= 75

S =>0,67= 75

2 =>P7s = (0,67·2)+6=7,34

x

7.7. El peso de un grupo de 1.000 niños se distri con un Coeficiente de variación de 10 (CVx = 10) ellos no supera los 33 kg. ¿Cuánto vale la media y la de la distribución?

CV.= 10

0,8413

o 33

IMACIÓN DE LA BINOMIAL A LA NORMAL

I '/, 11 ' 1 tema anterior nos habiamos preguntado qué hacer tI ' l!!

I II s lribución binomial, tenemos un «n» superior a 20 (las l ,bln. IlIlId no recogen valores superiores a éste). La opción, para v'\lo­

ti «n», es aproximar la distribución binomial a la nonTI 1. 1.11 111 de la binomial a la normal mejora a medida que «p» (1 a pro-

l · xito) se aproxima a 0,5 y «n» (número de ensayos) es' gran 1', observar en la figura 7.5:

liS que para una variable, X, que sigue una distribución bin I h l

s ~L = np y su desviación típica es (J = ~npq. Por tanto, pod n os 1 \1' U función de probabilidad, que es discreta, a la normal d \t I

P(X = X) = p [ (X-O,5) - .u::; x-.u::; (x +o,S)-.u ] (J (J (J

22

Page 112: Libro Análisis de datos.pdf

11.11 ,¡ 11,111 11,11 \

0,1111 o 1 1

l'

p- 0,1 n- lO

1 3 4 5

l' 0,1 n 20

X

1') l' ( \ 0 ,1:\ )

]," (/

8 9 10

IL. . . .._ e - e - e-e--_e_. e-1 S 6 7 8 9 10 11 12 13 14 15 16 17 1819· 20

X

0,50 0,45 • 0,10 0,35 0,30 0,25 0,20 0,1 s 0,10 0,05 0,00

0,50

0,45 0,40 0,35

. 0,30

0,25

0,20 0,15 0,10

( \' I () , )

JIII)(I

....... .

6 7 o X

11 11

11 111

I

n,', n ?Il

1

/.

0,05 000 - e •• ~ • , 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 11 11 ,.

X

istribución binomial para distintos valores de p (0,1 Y 0,5) Y n (1 ()

A1i.lIlpILU 7.8. Supongamos que lanzamos una moneda al aire Ij40.JDC.Lllc:mc~s ¿cuál es la probabilidad de obtener 12 caras?

t tar a esta pregunta tenemos ql:le recurrir a la y buscar la probabilidad de que la variable aleatori ,

'cn,lln'ler'o d caras» tome el valor 12 (x = 12) con n = 20 Y P = 0,5. M t bla 1 obtenemos el valor 0,1201

sponder a la pregunta haciendo una aproximación la normal.

la desviación típica de esta distribución binomial son:

,5 = 10 Y (j = ~npq = ~20.0,5.0, 5 = .Js = 2,24.

P [(12 - 0,5) S x S (12+0,5)

transformamos las puntuaciones en típica :

p[ (12 - 0, 5)- ,u 5: x- ,u 5: (1 2 +0,5)-,u ] (j (j (j

[(12-0,5) - 10 5: 5: (12 + 0,S) - 1O] = p(0 675: <112)

2,24 z 2,24 ' z- ,

las tablas de la distribución Normal:

P(0,67 5: z 5: 1,12) = 0,8686 - 0,7486 = 0,1 2

observarse en este caso, la aproximación es «muy bu n » diferencia de solo una diezmilésima) para n = 20. A m did

aumenta mejora la aproximación.

111 ar y restar, en el caso anterior, el valor 0,5 se llama «correcci /1 flO,.

/I/Lidad» y nos va a permitir utilizar las puntuaciones discre tas, si fuesen continuas. Para ello, interpretamos cada puntuaci 11,

) si fuesen los puntos medios de sus intervalos. Con este proc dil ¡ ' 11

lumos de asegurar que el intervalo incluya los valores discr t s il, 111 ial.

Page 113: Libro Análisis de datos.pdf

( ; 1' d \1111 111 ':

0,20 0,18 0,16 0,14 0,12

ª O,10 0,00 0,06 0,04 0,02 -

0,00 0----1 ....... 2..-.-.3~41=-5-l-64-7 l-0-l-9 -l-1--.JO f-ll+-1 2tl.....j3 f-1 4+-15-t=1~6 ~17~10~1:-'9 ~20 11 ,512,5

x

111 11) n i l'O 'j mplo:

.uI~II'" 7.9. De todas las preguntas del examen para el PIR n ta de cinco alternativas de la que sólo una es

t desconoce completamente 40 de ellas y las ~~" .... ", •• III

la probabilidad de que acierte entre 1 O Y 12 de esas

s la probabilidad de que acierte más de 1 O?

distribución binomial:

y (J' = ~npq = ~40 ·0,20·0,SO = 2,

[ (9 S- S) ( 12,5 - 8)] P(9,5~X~12,5)=P ;,53 sz s 2,53 =

= P(0,59 ~ z s 1,78) = 0,9625 - 0,7224 = 0,2401

0,1611

I ISTRIBUCIÓN «CHI CUADRADO» DE PEARSON

111 0 . 'ln aJizado, en las páginas anteriores, la distribuc i I 11 0l'l tl ti . IIdn ' n las distribuciones continuas, en este epígraf ollsid ,,' 11'

1\ di Iribución chi-cuadrado (X2) de Pearson íntimament l' ,lo ' ()IIII I ,

11,

1I .\1/ X2, ·· · , Xn , un conjunto de n variables aleatorias ind I II 1 ' 11 t 111 una distribución N(O,1), entonces una nueva variable ,,1 Hllo l \ \ I 1- 1 + .. . X~ sigue una distribución X~ (chi-cuadrado I 1/ p'l' I

11 ' lib r tad) y se representa así: X ~ X~ . Su media y u vaJ'Í'l Il l',1I II1 111 ~L = n y d- = 2n, respectivamente.

I pl"ldos de libertad (n) indican que cada una de las n variab l 's ni ' , 111 de tomar cualquier valor, de sus posibles valores, sean ' 1I I d '

111, v lores tomados por las n - 1 restantes. Su análisis má d ' 1 'dl n In ,1 objetivos de este texto.

t , di tribución se usa fundamentalmente en pruebas de bon In I (pma contrastar si la distribución de una variable se ajusta a 1I 11 n ti 1. 01\ determinada, por ejemplo la normal) . En realidad, al igutl l tll '

II s lribuciones, es una familia de curvas, en función de los grados d ' , omo las presentadas en la siguiente figura 7.6:

221

Page 114: Libro Análisis de datos.pdf

0,1

/ "1 ' 17 .. R pI" entación gráfica de la distribución Chi- u '\ 11' Id l' ' 11 I'un ión de sus grados de libertad (5 y 15).

1.1\11\ I1 I mi i' lad s, ver figura 7.6, podemos señalar las s igll ' 1111

N 111\ \ t\ 101 la valores menores de O.

H. lIsll\) lri p itiva pero a medida que aumentan sus gl' \dl ' 111 ' rla 1 s va aproximando a la distribución normal.

• 1'1I1't\ /1 > ° la podemos aproximar a una distribución N(n, 2/1) ,

L \ Id h V no permite obtener las probabilidades asociadas a 1 '1 111

dOI 's 1 l da la familia de distribuciones X2, entre los que se en

1) 111 " lI S'l 1 habitualmente.

L, I I' in 1 a fila recoge las probabilidades o proporciones y la p l'illl I

, (11111)1) , lo ' grados de libertad correspondientes. En el interior de la I d,1 ' 1\ ' 11 'nlran los valores de la variable. ASÍ, por ejemplo, para una va l'! d,1

'11 1 1 ¡ 111 11 a distribución chi-cuadrado con 5 grados de libertad, X -7 X' I I ti )1 ' 11,07 1. ja por debajo de sí una proporción de 0,95. Es decir, 1 (\

11 /( 7) O, 5. Esta puntuación se corresponde, por tanto, con el per ' 11111 1) . \1 ,1 ' I r entarse de la siguiente manera: O,95X~ = 11,07. En la sigui ' 111

I 1 1 r . \ I ti 'd observarse su situación en la tabla:

'1 ,hl. .1 I l' 11,1

11111 \ 1 j ' n, i interesara hallar P (X > 11,07) haríamo ]

P(X > 11,07) = 1-P(X<;;; 11,07) = 1 - 0,95 = 0,05

DJSTRIBUCIÓN «t» DE STUDENT

1\ h ra de d~finir este tipo de distribución de probabiJid ', 1,: 11 I 11 ti h l'im s antenormente con chi-cuadrado, lo haremos en fllll ' 101\ d di stribuciones ya conocidas.

11\ e.:- dos variables aleatorias independientes, donde X sigu ' tlll ,

Il'ibuclOnN(O, 1) e Y una distribuciónx~. Entonces, la variabl ' '\1 , \

I in T = k sigue una distribución «t» con n grados de lib rl 'H.1 y

l \ presa por: T -¿ t"

11 media siempre vale ° (J.! = O) Y su varianza a2 = _n_ n - 2

I odemos definir una distribución «t» como el cociente entre una v'\l'h N (0,1) y la raíz cuadrada de una variable X~ dividida por sus grad s i ,

' ~ d. Su nom~re se. debe a su descubridor, el matemático Gos l/ }II '

I ó sus trabajOS baJO el seudonimo de «Student».

[In la figura 7.7 se representa la distribución «t», con dos grados 1\ I'tad, junto a la distribución normal estándar.

1I1

Page 115: Libro Análisis de datos.pdf

0,4

0,3

0,2

0,1

-2 o

1' "11 I 1, I ~ '11' 's ' n Lación gráfica de la distribución «t» con 2 grados d i 11 11 11

111

p" ,d 101 l' ualquier valor entre - 00 y + oo.

1\ ll1 'c.1 i d qu aumentan los grados de libertad, la distribu ' 111\

1\ re xi n a m ás y más a una distribución normal.

asintótica al eje de abscisas.

S' IIlili:!:l., fundamentalmente, en estadística inferencial en las J 1'11 'h 1 I COllll"lS1 ' . En la tabla VI se presentan los valores positivos para es l 1 1I

1\ hu ,¡ )n . , n la primera columna se presentan los grados de libertad V 1 ,pdlll ra fil a las distintas probabilidades o proporciones de valore 111 ' 111

1' .. () i¡ 1I I que un valor positivo dado. Como se trata de una distriblll 1, 11I [ 11'i 'u p demos hallar las probabilidades asociadas a valores negH I ,

, P \ 1'1 ir d 1 valores positivos de la tabla VI. Veámoslo con un ejen ¡¡l tI

Sea X una variable que se distribuye según t con 5

probabilidad de obtener valores menores o ~"'u".u ... ...,

$ 2,015).

(X> 0,9195).

$ - 2,571).

2.015

P(X~ 0,9195) = 0,80

P(X> 0,9195) = 1 - 0,80 = 0,20

0,20

0,9195

2 I

Page 116: Libro Análisis de datos.pdf

2,571) P( > 2,571) Y P( > 2,571)

1 - P(X ~-2,571) = 1 - 0,975 = 0,025

P(X~ 2,571) = 0,025

0,025 0,025

- 2,571 2,571

7. . LA DISTRIBUCIÓN «F» DE SNEDECOR

;\1 Ig la l que con las distribuciones anteriores, nos limitaremos a pr '1-1 ' 11 1

11 I ' \'in i ión, algunas de sus propiedades y la utilización de las tablas.

' /'jI ición :

Si I Y X2 son variables aleatorias independientes, con distribu 10 11

l·hl . · ladrado con ni Y n 2 grados de libertad respectivamente, enton '

1111 ' 1 I U va variable F definida por F = X l / n1 sigue una distribu j 111 X

2 / n2

l i . 11 n i y n 2 grados de libertad (F nj, nJ

2

11

2" "1 I " - 2) "1 (112 - 4)( 112 _ 2)2

(')' 11" 1 1/ > 4

noce habitualmente como F de Fisher o de Sn d r, s' ' Illp l ' 1

111 'n talmente en el contraste de hipótesis (Análisis de Varia l Z' l. .. ), . ' 11

tll 'a 7.8 aparece su representación según distintos grado d lil 'I'( \ 1.

0,95

1,910

F120,120

0,95

1,352

Fig. 7.8. Distribuciones F con distintos grados de libertad.

1I características más importantes son:

~ s asimétrica positiva por lo que nunca toma valores menor S qu ' O.

Una importante propiedad de esta distribución es la llamada prOI I • dad recíproca y dice que si X es una variable con distribución FOIl 1/,

.Y n2 grados de libertad, entonces la variable Y = l/X es tambj n 1111 \

Page 117: Libro Análisis de datos.pdf

d I lh ' tI,,\, E 1\ pH 11 l d 1111 \ 1 ' 111 • rOl'llI \ !

I F =---

1 ¡I /1, , 1/2 F ¡J 1/2 , 1/,

dO\l I I 'S I pr babilidad a ociada al valor d la val i bl '. E I \ pI

P tI In I ' d norme importancia para obtener algunos 1 '1' ' ( 111 1 !lm l 'd ili dad que no aparecen en la tabla , tal y com

-¡' llIl los po teriores.

ge solamente la probabilidad de que X s a 11 1 ' 111 ti

50; 0,975 Y 0,990 que son los valores utiliza I ~) . I1II pr nder el manejo de esta tabla, vamos a consl I ' 1 11

0,95

una variable que se distribuye según y B) Determinar el valor del percentil 5

3,33 8,00

tabla VII vemos que: O.9SFIO.S es igual a 4,74.

1 1 0,osFs.10 = F. = 4 74 = 0,211

0.95 10.5 '

gráficamente en la siguiente figura:

I 474 = 0,211 , 0,50

0,25 0,95

o.oo+-----=~---...... 8,00 0,00 4,74

I ESUMEN

Il l'mos visto, en este tema, algunas de las distribuciones conlinu '\s 1-Ibilidad: la distribución normal, la distribución chi-cuadrado, la diH

Id n t de Student y la distribución F de Snedecor.

han definido cada una de estas distribuciones. La distribución hi- ' lI O

() e define en función de otras con distribución normal. La dis lr ibu ' i H\

ha definido en función de otras dos: una normal y otra chi-cuadn.\uo y, l'dtimo, la distribución F se ha definido en función de dos chi- uudmdo, \ u vez se definen en función de la normal. Por tanto, no d b SO I'JW'II III todas ellas convergan, en algún momento, en la distribu iÓI \1 ( H'III 1I

Page 118: Libro Análisis de datos.pdf

n q u xim a ión 'l la L1 I mal, 11

7. ), JI,'I{CICIOS DE AUTOEVALUACIÓN

/ 1.

I ,

'/ .1.

f . ~ .

7.5.

l . .

, \/1

I tl l (11 11 \ li lribución normal: A) la media es mayor que la 111 ' 1111111 1, 11\ \ 11 0 . m enor que la mediana; C) media y mediana Oi ll ' 1, 11

I 11 "": \ li s tribución normal ¿entre qué puntuaciones 1(1 1 1

1 11 (' 11 ' 11( 1"1 160 % de los casos centrales de la distribución?: !\}

.Y () ,H; ) - 1,96 y 1,96; C) -1,64 y 1,64.

Las pun luaciones de 1.000 niños en un test de inteligencia, I

(ri 1 uy n normalmente con media 100 y desviación típica I ~ I

vs ) probabilidad de obtener puntuaciones menores o igu d RS? : A) 0,8413; B) 0,1587; C) 0,6826.

0 1 lo datos del ejercicio anterior (7.3.) ¿Cuántos niños 01 I 111

I 1I luaciones superiores a 115?: A) 115; B) 200; C) 159.

nlinuando con los datos del ejercicio 7.3 ¿Cuánto vale III 75 de la distribución?: A) 110,05; B) 75,00; C) 89,95 .

L . calificaciones obtenidas en I xamen en una asignatura

( , de un grupo de 500 alum-1 , se distribuyen normalmen-( '. Como se muestra en la figu-1" \ d ellos 125 no alcanzan la , I lI! luación 4,32 y otros 125 .'UI ran la puntuación 9,68 . ¿ u nto vale la media de X?: 1\) 7,00; B) 5,00; C) 6,00.

125 250

I 1" 1 , , I 11 111 ti v" lid, Il 011 I JI

' 1111 . ' 1' 1 ,1 P ' I 'C \111 11 r: 1\) , 1:

Ip'lli >1 do n i ' dal j ' 1" j j 7.6 y n ' i 1 '1"0 11 lo S il ,' , 'lid ,\(m ' qu 110 alumno qu no alcanzan la punlua i n 5. ¿ 11 í"ln du mn s han suspendido?: A) 250; B) 200; C) 154,

\l i ndo que X se distr ibuye normalmente, que X = 60 Y qu . In 1 11 11

lila i n directa 40,8 es superada por el 89,97 % d la d islribu '1 )11, I \ ti sviación típica vale: A) 15; B) 1,28; C) 17,87.

1) n variable X se distribuye normalmente, con desviación l pi '" 5, . nb i ndo que la puntuación 45 deja por encima de sí el 84, 1 fr,¡ l . IOH asos, su media valdrá: A) 40; B) 50; C) 60.

L l puntuaciones de 10.000 niños españoles en una pru I ni , 1111 • II ncia (X) se distribuyen normalmente con m edia 100. S d H' lll ll

11I 668 niños no alcanzan la puntuación 85 y otros 66 111 (l , !lhl 11 1 puntuaciones superiores a 115. Su varianza vale: A) ' O; Il) (111 , () 100. "

I ~ l 20% de los niños en edad escolar presenta problema 1 n al Colegio. Si en un determinado centro hay 225 ni os, . ' \1 ,1

l'S la probabilidad de que 30 o menos presenten algún p[ bl II \[\ ti ' \ laptación?: A) 0,0080; B) 0,3026; C) 0,0263.

11 los datos del ejercicio anterior, ¿cuál es la probabilidad 1, ql lt'

má de 55 presenten algún problema de adaptación?: A) 0,1040; B) 0,0401; C) 0,4010.

11 los mismos datos del ejercicio 7.13, ¿Cuál es la probabi lida I dt. lU entre 40 y 50 niños presenten problemas de adapta in?: 1\)

0,4642; B) 0,2446; C) 0,6424.

En una distribución chi-cuadrado con 28 grados de libertad, 1 vu lOl' 1,34 es: A) el percentil 5; B) el percentil 90; C) el percentil 95.

I ~n una distribución F con lOgrados de libertad en el num r 'l Icl!' y

O grados de libertad en el denominador , ¿cuál es el valor d ' 1 P ' 1" ntil 90?: A) 2,20; B) 2,35; C) 1,94.

Page 119: Libro Análisis de datos.pdf

1, 1 K,

1, I .

7. O. El va l r 0,86 Ir spond con: A) 1 per nlil 80 1, unn I 1111. lud nl con 20 grado d lib rtad; B) 1 p r nI iI "

2 8

liSlribu ión chi-cuadrado con 19 grados de libertad; 20 cl • . ma distribución t de Student con 20 grados d

OI.l J('I()NES A LOS EJERCICIOS DE AUTOEVALU¡\(;1()N

l . l . ni I ' jón: C

v ' 1' 111 'litado 7.2.1).

7.2. olución: A 20% 60%

(v r Tabla de la Curva Normal). -0,84 0,84

7. . Solución: B

x -x 85 - 100 z--- - --1 . - S - 15 -

x

Tabla IU: 0,1587.

7.4. Solución: C

Tubla IV: 0,8413

I - 0,8413 = 0,1587

0,1587 x 1000 = 158,7,= 159

1111 : 1\ , . , , 0,,7 '1'11 II1

11,11/ IJ/~ 100

O, 7, 15 - " i~ lOO 15

}

,II~ (0,7.1 5)+100 = 110, 5

11 111 '1 1 : A

x= 4,32+9,68 = 14 = 7 2 2

" In ión: C

- 0,67= 4,32-X Sx - O, 67Sx =4,32-X} _

- => - => X=7 S 067- 9,68-X O,67Sx = 9,68-X \

, - Sx

nlu ión: A

n!lción: C

o lución: A

P - 7 - 0,44 = 33 => P = 7 - 1 76 - 5 24 4 33 ' - ,

5 - 7 -4- = - 0,5 =>(Tablas) 0,3085

0,3085·500 = 154,25 =154

1- 0,8997 = 0,1003 => z = -1,28

- 1,28 = 40,8 - 60 =>S = 40,8-60 _ Sx x - 1,28 - 15

Page 120: Libro Análisis de datos.pdf

~ . I l .• !11tH 10 11 : 11

I O,tHI

5-- 1= 5

O,!. ~ 7 >z

= 5 -1 4S = 50

7.1 . Solu ¡ 11:

I II 's lo qu la puntuacione son simétricas, su 111 dj" vII I .:

11 1 svi ión típica:

x= 85+115 =100 2

-1,5= 85-100 ~S = - 15 = 10 S x - 15

x '

I (lI' l'trlt , Ll varianza es 102 = 100.

7.1 . o lu i 11: A

n = 225 p = 0,2 q = 1 - P = 0,8

P(X:S; 30) = p(z:s; 30,5-np J = p(z:s; 30,S - (225,0,2)) ~npq ~225.0,2.0, 8

( 305 - 45) =P z:S; '6 = P(z:S; - 2,41) = 0,0080

(Utilizando la tabla III de la curva normal).

7. l . lu ión: B

>5S)= P(Z> 55,5-npq J = p(z> 55,5 - (225,0,2))= ~npq ~225.0,2.0,8

( 55,5 - 45) = P z> 6 =P(z>l,75) =1- P(:S;l,75)=1-0,9599 =O,OI

( titizando la tabla IV de la curva normal).

I lO

,,1 \1 ( 111 :

I '{ O ~ 50) II( ~( , 11/ / () ,~ 11111/]

JI/IN/ JIII ) I

= p(3 ,5- (225·0, 2) S z S 50, 5- (225.0, 2 ] 225·0,2·0,8 --:rus.0/ 2.0,8

= p(39,56-45 :S; z:S; 50,5

6- 45) =

= P(-O,92:S; z:S; 0,92) = 0,8212 - 0,1788 = O, 424

(IJlilizando las tablas III y IV de la curva normal).

nlu ión: e (V r tabla V)

olución: e (V r tabla VII)

)lución: e 1 1

o 10F¡0 20 = = -- == 0,455 . . o 90 F20 10 2,20

lución: B

Las distribuciones N(5,2) y t lO son simétricas

olución: A

(Ver tablas correspondientes)

24 1

Page 121: Libro Análisis de datos.pdf

/1' 111 I H

IIIII ( )tI 1 I eL' i (¡ 11

( tllll'l' P( OS previos

. ) . 1. Población y muestra

H.".2. Muestreo 1111'l' J'c llcia estadíslica I ~s( i Il lación de la media HA.I. Distribución muestral de la media

HA.2. La media como estimador

Esti mación de la proporción H.5.1. Distribución muestral de la proporción 8.5 .2. La proporción como estimador

6. Intervalos de confianza

8.6.1. Concepto 8.6.2. Tamaño de la muestra

8.6.3. Aplicaciones 8.6.3.1. Intervalo de confianza para la media 8.6.3.2. Intervalo de confianza para la proporción

H 7. Resumen H.8. Ejercicios de autoevaluación H.9. Soluciones a los ejercicios de autoevaluación

Page 122: Libro Análisis de datos.pdf

INTRODUCCIÓN

te tema, iniciamos el estudio de la parte del análisis de datos deno­I 11 I h inferencia estadística que básicamente consiste en estimar, con cier­

I IlI'obabilidad, un parámetro desconocido a partir de una muestra aleatoria 11 ' I I de una población. Así, a partir de las características (media, propor­

Cl II , .. ) de una muestra inferiremos esas mismas características a la pobla-1 proceso a seguir, en cinco fases, aparece recogido en la figura 8.1.

Especificación de la población

Jj.

Obtención de la muestra

Medición de la variable

Análisis descriptivo y verificación de los datos Jj.

Inferencia estadística sobre un parámetro

Proceso estadístico para inferir un parámetro a partir de una muestra.

Consiste en una especificación clara de la población de interés, dado que el procedimiento permite realizar inferencias únicamen­te a la población de la que procede la muestra. La población que se utilice dependerá de los objetivos de la investigación.

La muestra es el conjunto de elementos en el que se realizará la investigación. Se obtiene mediante un método de selección y el

245

Page 123: Libro Análisis de datos.pdf

11,1111 ' \/ (mi

1.11 01 ,1 '11 vos 111 e pretenden en este tema son:

, Ih ' 1' l ' In ' ion r los conceptos de población, 111 , SII 'II, 111111

11. ti 'o I 's I'ipLivo y análisis estadístico inferencia l.

I , 1111 ti j r los ' l1ceptos de muestra aleatoria y mu 's il ' \ I 1" ' 01 I características fundamentales d -11 1' 111111 I

11I1I 's il' 'o.

0110 ' ' 1' lo ' a pectos básicos de la inferencia estadísli ' 1\ (11 II\U \S II ·~\J...).

I ,{ti i z' 1" ¡Ir r ncias con intervalos de confianza para r '1' PI IIld 1

II ' 111 ' d investigación. Dos aspectos fundamentalc 1" 1I 1'1 I1IÍ 1 I s 11 el error de estimación y el tamaño de la mil', I1 I

EI1 's i ' apartado pretendemos estudiar, en primer lugal', lo, poi la - j n y muestra y su relación con el análisis estadís Li 'o

1 td ' ," ' 11 ' jal, yen segundo lugar, el de muestreo.

l . .'ohlación y muestra

Hit ,1 llLexto estadístico, el término población se refi Inl" l ' '1 m ntos en el que se quiere estudiar una o más l ' \ \11 1> I \ s lar laramente definida (por ejemplo, los pacientes d \111 I

I In

1, 11111 tll'l ' 111111 I1 I 1111111

i " 1, la pobla i)11 's i . r01 '11t I

111 \ , di spone de un censo de la población, es decir , de un lislu lo In I !TI ntos de la población, se puede estudiar a todo Ilos, HII

111 I nI' \ ional es común trabajar con la población entera: 11 m/' ' I Inl r sado en conocer la opinión de sus alumno , I I sic >11l/1I

1 , lidiar la evolución de sus pacientes, el directivo d 1I1H1 \' 11 11'1

' 1' \ tudiar la satisfacción laboral de sus emplead s, ,\ '( 11 1 l .

I 11 l , no siempre es factible estudiar a la poblaciól ' 11 , 11 1(11 d I I rque la población a estudiar es muy grande, por mollvo 1111

I I 01' 1 riesgo que implica (por ejemplo, aplicar un nu 'vo 11 ' \ 1 I ,llId los enfermos de una determinada enfermedad para 'H IlI I 11 '

ti dría tener consecuencias muy graves si el tratamienl l' sllIl \ 1:1,) para una mayor rapidez en la recogida de los datos. ~ 1

, ludia sólo un subconjunto del total de los elementos, s d' 11 ',

ra de la población. Llamaremos n al número de los elemcl Los 1, Il'n, Así, si la muestra está formada por 50 elementos, n = 50,

I 111\ ,nos encontramos con dos contextos diferentes:

,'. 'Iigar la población entera.

's ligar una muestra extraída de la población y luego inf rir '\ 1\ I In ión.

la diferencia entre ambas estrategias de investigación y u j ' ,h· nálisis estadístico descriptivo e inferencial.

'icólogo desea conocer la efectividad de una terapia qu 's i \ ndo a los pacientes depresivos de su consulta, por lo qu ', 11

247

Page 124: Libro Análisis de datos.pdf

1 \ d , 1 I JlII'1 IIH 1111 dI 1 H

n s itnl'

Jl II • l ' 1 ' n'l n tu di aremos la segunda estrategia d' ill v' 1 '( 11'/ IPI ' ' 11 1 '1" '111 a inferir un parámetro de una pobl<.l ' j )11

1111 I IlItI s ira '11, L f ia extraída de la población,

•• Mucstrco

P 11 '1\ ti ' las inferencias de la muestra a la población teng'ul ' 1\11

" , ' tI ' lI Jui 1 muestra. El muestreo es el proceso mediante ,/ 111 \

() II \ tll a muestra de una población con el fin de obtener un 'l IlIlh I 11\ 1, S '11 jant posible a la población y así obtener estimaciolH . 1'1

Il ny ¡lI t n r en cuenta que una muestra debe ser lo su fi ' 1( ' 111 11

IIlIplh pal a representar adecuadamente las propiedades de la poltl " lo ,'ul'i i nl mente reducida para que pueda ser examinada en 1\ 1" PI l' lo tanto, el tamaño es una característica esencial de una 111 11 ' 1I 1

II ' I,Y d tipos de muestreo: el probabilístico y el no probabUl, I , ,1 1 ro l abilístico se conoce, o puede calcularse, la probabilidad 11 . 111 1I

1111 I I l rminada muestra y cada elemento de la población ti n' 111111

1 " 11 lad conocida, o calculable, de pertenecer a la muestra. En I 11

11 ' () 1\ -probabilístico se desconoce, o no se tiene en cuenta, la prol 1"11 1, () 'hda a cada una de las muestras posibles y se selecciona la mu ' 1I

111 IS r presentativa le parece al investigador o aquella que puede 0\ 1 ,

xtraído una muestra aleatoria il11pl ' 1It11l lo:

IlIl ' h ' llI ' nl de la población tiene la misma probabilidad el 's ' 1' ,1 'pido

1 ' 111 1 l e seleccionan de uno en uno, y con repo i i 11 , 10 1' léI 1\ 1 ( Il ación permanece idéntica en todas las extra 'io t) vs , No

I t 1111', uando el tamaño de la población (N) es grand' 's 111 I /, IIIt 1" ' I muestreo sea con o sin reposición.

1\1 ' Iimi nto suele ser el siguiente: primero se asigna lIl l 11 \111\ 111 I

I IlIl' lIt de la población y después mediante algún 111 ' l/o 111 ' I11 1 ti

I I ' 11 un cajón, bolas en una bolsa, tablas de núm TOS 11 , 11111 el,

I "'nt rios generados en un ordenador. .. ) se elijen l'lnlo,' ' 11 1111'11

111 , " \ n ces ario para completar el tamaño de la mue ta\.

IIdo l s elementos de la población están ordenados o pu 'd ' 11 ()t ' 1, 1111 ' .i mplo, los alumnos de un determinado centro) pod 11 os 111111 IIIIi',t;treo sistemático en lugar del muestreo aleatorio simpl " S UPOIl

, P 11 ' simplificar, que la población tiene un tamaño N = 100'y I

11 t ' 11 I una muestra de n = 5 entonces el muestreo se realiz'lrfu d 11 11 r

1, ionamos al azar un elemento entre el primero y I qll~' o 'lIp I

I lugar N = 100 = 20. Imaginemos que obtenemos el nlU1 'l'O 15, n 5

o l1pletamos la lista sumando de 20 en 20, al valor obl nido 11111 '

Ilormente (15) hasta completar la muestra. Así, el rest d' los ,1, 111 'ntos de la muestra serían: 35, 55, 75, 95.

I 1.' go de este tipo de muestreo está en aquellos casos 'idades en la población ya que, al elegir con una peri

111

Page 125: Libro Análisis de datos.pdf

L( I 111 'Iouos nteriores requieren disponer de un listad tI' ti 1, pobln ' ión o poder elaborarlo fácilmente. Cuando sto 111'.

1,1, , !,lIt! ' 1110H ulilizar el muestreo por conglomerados. Si quis l "1' 111111

11I1'1u, ' 1m ' 1' lOa muestra de los universitarios españoles po \ ' 11111 I d, l' ti ' 1, s i 'ui l. l manera: seleccionaríamos al azar pril ' )'0 d 1

l' 'Id I 1 's, lu 'g algunas facultades dentro de cada univ I's ld ,,1 1'11 dl"lIll ) ' ' 11" y, finalmente, todos los alumnos de los lIl '. lI

(111 Idos, 1 r . amos «conglomerados» a estas unidades en qu s' ('1 I 11 lo ,1 ' 111 ' lll s d la población. Si los conglomerados son hetero r '1111" ,

111 lo lo 1 II ' d Jl varnos a muestras poco representativas puesto qu IIIt

II1 di :t,1I1l 'llgl.lnos de ellos.

Ilny 11"0 tipo de muestreo, denominado polietápico, que es uno 11 I ' 1)11 1\ 1 dos anteriores (estratificado y por conglomerados) .

En () a ' iones, el muestreo probabilístico resulta demasiado 0 . 1(1 I

~ ' \ ' 11 1 a métodos no probabilísticos. Entre ellos se encuenll ' I I I I

• O

• El I11LL streo por cuotas (o accidental): se basa en un buen 'UIIII

mj 'nto de los estratos o individuos «más representativos» o a l , 11

los para los fines de la investigación a realizar. Es por tanto, . ' 111

.lo nl al muestreo estratificado pero carece del carácter aleal l ' 1I ti l ,' l .

El 11111 streo opinático (o intencional): se caracteriza por el inL l' \ I 1!1 luir en la muestra a grupos supuestamente típicos. Su uso . 1I 'u nte, por ejemplo, en sondeos preelectorales de zonas que en \11 1

I' ¡ r ocasiones han marcado la tendencia de voto.

, 111111

, 'VI \

It 1110, h 'mos d s fialar qu la nodon d muestra rwrt!.'~(''''lI . "w· ... l ra aleatoria se refieren a asp cto di tint aUl q I • ~ \ 11 ¡\ ()

I ti un muestra. Una muestra es representativa i cxhib • iut ' 1'11 \

I IllI s l grado de diversidad que la población y una 111U sLra ' S II It

In.' 'J mentos han sido extraídos al azar de la población.

IIIOS btenido una muestra aleatoria de una población. Ahol ' \ 1, 11 ,

II a ión interesa estudiar ciertas características de los ·1 ' 11 H \111 (1 .11 lId n , como puede ser la inteligencia emocional, la a. T )' 's i ti ,,1 , ·1

1, reacción a un estímulo, el nivel de colesterol, 1 niv 'l 1, 1,\ l 1 sistema inmunológico, la opinión (sí/no) sobr Ig(1I1 t ' 111 \ ,

didas de estas características obtenidas en una muesLr 1 u \ I 11

lIlil's mediante estadísticos como la media (por ejemplo, el ti 1 1 o 1, I medio), la proporción (por ejemplo, la proporción de r spu 's I l-

1\ 'llivas), etc.

una muestra es sólo un subconjunto de la población pOl 1 <.1\1 I ,1 1 estadístico obtenido en la muestra (como la media) no s r i fll l\ l,

neral, al valor del parámetro de la población. Para inferir un p \1 '

partir de un estadístico hay que aplicar herramientas eS la d fs l i ' l

III inferencial como la estimación por interoalo (intervalo ' I ' ' 011

1":1) o el contraste de hipótesis.

2~ 1

Page 126: Libro Análisis de datos.pdf

( W ' I' ' JllOS S' alal qu la distribución muestral de un 'stad , ( I C 111 • I lo . ' Illral d la infer ncia e ladí lica, lanl I

111\ ' 1 do '01 o d I onlra le de hipótesis.

1.lhllci6n mucstral de la media

1111 11 ' 1I ' IIIOS on un ejemplo sencillo, de carácter exclusiva m ' 111 ' elld I CJl IICI 011 ' 11 '1' 1:1 di sll ibución muestral de la media y las principal .. 11 1

1 ( I dI' eli ·hl1 distribución: su media, varianza (y desviación típj 'u) .v 1I 1111

a una población formada por 5 sujetos (N = 5) n las siguientes puntuaciones: 1, 2,3,4 y 5. L la tabla de frecuencias, la representación gráfic a variable en la población, su media (Jl) y su

ni f(X) 0,25

0,2

0,2

1 0,2 f (X)

1 0,2

1 0,2 0,05

2 3 4 X

l' 1 111"l 8.2. Tabla de frecuencias y distribución de la variable X en la pobhll 1111

I ( 111 111 1 hablemos de media en este tema, nos referiremos siempre a la media arilm 11\'11

2,3 3,3 4,3 5,3

2,4 3,4 4,4 5,4

2,5 3,5 4,5 5,5

de estas muestras podemos calcular su media. E t distintas muestras, como puede observarse en la

se recoge también la probab!lidad de cada una d

Valores deX X en la muestra

1,1 1 1/25

2 1,2 1,5 1/25

3 1,3 2 1/25

4 1,4 2,5 1/25

5 1,5 3 1/25

6 2,1 1,5 1/25

7 2,2 2 1/25

8 2,3 2,5 1/25

9 2,4 3 1/25

10 2,5 3,5 1/25

11 3,1 2 1/25

12 3,2 2,5 1/25

13 3,3 3 1/25

14 3,4 3,5 1/25

15 3,5 4 1/25

16 4,1 2,5 1/25

(Conlln .. 1)

Page 127: Libro Análisis de datos.pdf

( '. I h 1111 l. 11)

, ,1,

3

4

s 4

3

2

1

4,5 4,5

5,1 3

5,2 3,5 1/25

5,3 4 1/25

5,4 4,5 1/25

5,5 5 1/25

pClae:mc)s considerar el estadístico media como una una serie de valores, cada uno de ello

obabilidad. Pues bien, la distribución orrespondiente función de probabilidad (Figur

f(X)

0,04

0,08

0,12

0,16

0,2

0,16

0,12

0,08

0,04

f1x =3

(ji =1

0,25

0,2

f (X) 0,15

0,1

0,05

° 1,5 2 2,5 3 3,5 4 4,5 X

1'1 ~ura 8.3. Tabla de frecuencias y distribución muestral de la media (X) para n = 2.

I '111 lia d la di ' lribu j I I l ' ·tral l ' I , m li (Px) 'H Il'lIld \ 1\ 1" dio d la población (p}

1. I VlIl'Í nza de la distribución muestral de la media I " ~

, ' i n típica de la distribución muestral de la media, d

I mr típico de la nredia, es " x ~ ~: ~ J;. . 1" r rma de la distribución muestral de la media (figura 8,. ) , ' f P 11" ce» a una distribución normal (estudiada en el tema ')111 ' 1'1(11')

\llnque la distribución original de la variable en la pobla ' i )JI 1\0 I

normal (figura 8.2).

11\) jercicio, comprueben a partir de las tablas de frecu ' 1 ' itl , I 1, lit, y de laX que:

I .' t media, la varianza y la desviación típica de la población SOIl l' • I tivamente: f1 = 3, (j2 = 2 Y (j = 1,41.

1.:1 media, la varianza y la desviación típica de la distribución 11l1l 'H

11' 1 de la media son respectivamente: f1x = 3, (j 1 = y (j x = 1.

tanto, hemos verificado las dos primeras propiedades:

f1x = f1 = 3

"i=: ~~~I-->"x ~ J;.~ Jz~H~1 'I 'a ilustrar mejor la tercera propiedad, supongamos que tenemos u I ti

IIe ión grande cuya distribución no es normal y extraemos mu hUH

Iras al azar de tamaño n = 30. Observen en la figura 8.4, que aunqu \ Iribución de la variable X en la población no es normal (es unif01 n ' ), t ribución muestral de la media (X ), para n = 30, es muy próxima a ItI

1[\ l. •

Page 128: Libro Análisis de datos.pdf

111111111111111111111111111111

l ' '111 ' \ 8.4. I)islribll ' ión el la variable X y liSlribu i [ITILI lra l el ' la 111 Id I (

para mu tras de tarnafio 11. = 30.

Vnlvi 'n I al ejemplo 8.1, hemos obtenido empíricamente la di 1\

, 1111 11'" 's i mI d la media para una población N = 5 siendo n = 2. r 'l l I

I ,el 1\ I 01 '" i ne son mucho más grandes y las muestras lam\1 ' 11 1I

111 I 1 \11 I 'S, I r lo que en la práctica no es posible (ni es necesario 1111\ 111 ' 1 1\ 1 1!'I1t! j n muestral como en el ejemplo expuest02

• De he hOJ p 111 11111 'CI liO ' ' l' hs aracterísticas de la distribución muestral de la 111 ti I

1) \, I " 1, I 'rl s t oremas que resumimos a continuación.

1 :\ lo ,\ n Ll treo aleatorio simple:

• j I di lribución de X en la población es normal con media p y via i 11 típica (j, entonces la distribución muestral de la X e IHU '"

• i la distribución de X en la población no es normal con medl \ l' \ "vi ación típica (j, entonces la distribución muestral de la X ti ' 1111

la normal (¡1, ¡) a medida que n crece (Teorema Central del 1, "

te), siendo la aproximación buena para n :2: 30.

11 estudiado la distribución del estadístico media. Su cono i 1I \

In I ' 1'1 itirá realizar inferencias sobre la media poblacional, con cierl'\ ¡t"

I d Illdad, a partir de la media muestral. Veremos más adelante c "l' dl z'ln las inferencias mediante intervalos de confianza.

ni propósito del ejemplo es que el estudiante comprenda qué es y cómo se origina la di '11'111111

11111 ' Inl de un estadístico, en este caso, la media.

Población

11 J.L =LX N

11:1.1 2 LCX - Ji. )2 O' =

N

"'Ión típica O"=JL(X~ Ji. )2

'1 ,n Ilpl 'O d la vurtabl ' U 1111 I ,11 , . la dfstl'Jbuci6n muestral d Iu III .111 (. ).

-Muestra

- LX x=-n

S2 =LCX-x)2 17-1 n-l Cuasivarianza 3

S =JLCX _X)2 n-l n-l

Cuasi desviación típica

Distribución 111

de ItI In ti

I-i x =¡¡

2 0'2 O' =-

X 1/

lit h, .1 l.

O'x=f? 1/ 0'

Error lfpi '0 ti ' I \

)11 ... rven la diferencia entre desviación típica de la pobla i)l1 , 1, , , t I I .a de la muestra (cuasi~esviación típica) y desviación lfpi ' \ dl' 1, I hll 1ón muestral de la medIa (error típico de la media).

1.' , 1 viación típica de la población es una medida de la var iab ilidud 1, IIldble X en la población.

11 " 1,1 svi~ci~~ típica de la muestra (cuasidesviación típica) e una 111 -d a Va~Ia?Ihdad de la variable X en la muestra. Como verem s '1' 11 ,

In s pagmas, cuando desconozcamos (jutilizaremos S,,_I'

I ,d svia~ión típica de la distribución muestral de la media ( I'rOl ' I I I 1 medIa) representa el grado de variabilidad entre los val r 's l · I I 1 IS muestrales Cuanto mayor es 1 ,. di' . ,

1 . .. e errortIpIco e amedla m1s ¡11l1)I '\

l''''; a estImaCIón. '

'\ utiliza S;H en lugar de la varianza (S2) por u S2 ,. . . I I 1 (

-") . q e ,,- 1 es un estimador Ins sgndo d . 1I vlllltlll/ll 1)1 n u- mIentras que S2 no lo es.

I '/

Page 129: Libro Análisis de datos.pdf

' \1 Illdo • "lIll ", \ 1\1

¡', , 111 mIo 1', HI! 1I11 I 1I1 ti

VIIlIO,' 11 ,1 apar tado ant r ior qu la m día d la di lrn LI ' í ," 111 11

1, 1\ 111 Il n" igual a la media poblacional (J.1x = J.1). E la ir unHI \ 111 1 11 I I \ 111 ' I l 111 di muestral X es un estimador insesgado d 1" nI -d I 1'1111 \ ' (111 ti 11 .

1. I I Hv h i n típica de la distribución muestral de la m dia, " I '11

'11 fiI I ,,/too d la media es un indicador de la precisión de la 'S( lit"

,1,· lit 111;·(/1(1 : ' LI nto menor es el error típico mayor es la pre i i 11 , P 1111

tlltH !I 'lO d , \t )ri imple,esiguala:

P OI' I l' 1 t ,el error típico de la media depende de la desvia I I n ti i n (J y del tamaño de la muestra n. Observen:

ti '11'\ l menor es la desviación típica de la población, men l'

' 1'1' r típico de la media.

W11 t mayor es n, menor será el error típico de la media.

H ..• ':STJMACIÓN DE LA PROPORCIÓN

Lo pI' porción muestral es una variable aleatoria que toma un v 11 111

1(1 ' ) S gln la muestra concreta que se obtenga. Por ello, podríamos l! ' 11

11 nte la distribución muestral de la proporción de una 1'111 111

IIdlnl' la que hicimos para la media, pero lo omitimos porque no DI 1111

11 \ I I IlU vo en cuanto al procedimiento. Presentaremos, en el si :ru ' 111

\1 tI ' l ni, únicamente las principales características de dicha distribu ' " tll IcJJ ,varianza (y desviación típica) y forma.

(111 n lo!n lll I () I , I I I l ' 1)(' ) 1\ I I I 11111

' )1110 :

} =

I lo 1 muestreo aleatorio simple (por lo que re p rman , t r cción), el estadístico proporción (P) se distribuy

2 re(1 - re) J.1 p =reyap = .

n C)I n P es la media de los valores de X en la muestra (d

101 'H O Y 1), entonces según el Teorema Central del Límite, a m o de la muestra crece, la distribución muestral de la pr I )1' ' Iol!

1 1 d· . re(1- re)

a norma con me la re y varIanza . . n

nto más alejado esté re de 0,5, más elementos debe l alizar la aproximación a la normal (figura 8.5) .

n=5

I1 ~ n =10

0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05

'1 ' l ' 111 111 11 11 1

11 O

0,00 o 0,2 0,4 0,6 0,8

l •• ~I II , 0,00 o

0,00 0 0,01 0.1 1,1\0,'0,11 ""11 , , ,,1\1\11 U \1111 11111111111111

~III 1111. I 0,00 o 0,2 0,4 0,6 0,1

0,''' ••

0,55 0,50

Il. 111 •. 0,00 o

0,1 0,2 0,3 o,~ 0,5 0,6 0.1 0,8 0,9 I

I.I II~~~~~~~~~~ oo,Ooo'- ~:¡~. , 1114 1, , 0,00

o 0,2 0,4 0,6 0,8 1 o 0,1 0,70,30,40,50,60,70,80,9 1

P

Figura 8.5. Distribución muestral de la proporción en función d n y IC,

f 1

Page 130: Libro Análisis de datos.pdf

(C tIl IlI Plucl" ll lI l t 1' 1 ' 11 , 1111'1 111 1111 11 11 111111 1111111 ,

/1 (J , HII 11 1" HI , 1, 111·1 Ipll ' 11 ·1 '11 ' 11" • t i ' ttl

111 ' ,111111110 11111 (\ 11 ' " 111 II h ll l) l' ' 1" '1' do , • 0\)1 1' 1\ '

/l () ,. ,

:; /1 - (0,50)(0, 50)

20

' 0 1111 1'11 ,1 ' 1\ ltl \ S ' g (111 -1 v ' l lo l' d - n, \1 1' \l1H 1

1 \1 1 1'(' !I lzol' ItI 'I !,>roxima ión la n I'mal 's ttl l 'L

11

'1' Iltll 8,2. Relación entre n y 1t para la apro 1m ",1011

() , I ()

~ 1

0,20

~2

0,30

24

0,40

21

0,50

20

0,60

21

1, La In 'd ia d la distribución muestral de la pl'OpOl" 1111 (/' ,

h 1 I'Op r ión de la población (n).

, L'I v'lrianza de la distribución muestra! de la pr

3, Ln I ' sviación típica de la distribución mueslt al l · I I 111111"11

Ill '\da error típico de la proporción, es () = [;( I 11) p ~- 11

' 1.,111. '1 n Mil", h ' .

re p = 1/," 1/ N /?

Ion I ' X: 0, 1 dond ' X: 0,1

• 1t' ( ' - 1t') 2 = P( ' _ P) 2 re( , le) (j"

11

a" = { lC('oll' ) a = ~1t'(l - n) S = ~P(1-P) /1

E rro r' tfpl ('o d la pro, 0 1'1'1 011

I :1 p a r lado anterior que la media de la distribu ' j )1 I 111 11 I1 ti . igual a la proporción poblacional (PI' = n), pOI' lo IIl t ' I ,

s U'al (P) es un estimador insesgado de la 1 l 'OpO I C 11 1

() n típica de la distribución muestral de la pl' pOI"1 )1\,

, " Upico de la proporción, es un indicador de la preci.<'/óll d,' f "tI la proporción: cuanto menor es el error típi 1I111y Ol"

I Da 1 el muestreo aleatorio simple, es igual a :

() =~n(1 - n) P n

I 1 1 ¡ o de la proporción depende de la desviación típi a <.1 ' I I

J ¡r( 1 - n) Y el tamaño de la muestra n . Observen:

1 lo IJ nor es la desviación típica de la población, m enor s ' 1' I -1 1(1 i o de la proporción.

110 11 ayor es n, menor será el error típico de la propor i n,

Page 131: Libro Análisis de datos.pdf

plo

1 '" I ' 1\1 ' 1) " 1' -, ne pto d intervalo de con/1,ItI"fI, 1" Ipl ' 1 In 1 1\ 1 'dia, dado lo igui nt up 1 'slo,: 111111 11 11

1I1J11 I 11 '1(\ 11 - ' 1 ntitativa, distribución d I v'\d 11,1, 11 I 11111111 d, ' O li O ' ith.

1. \ 1'11\(111 In 1 1, un intervalo de confianza tilll 11 ' 1111 l' 1I

0110 ' lo 1, UIl '] P blación a partir de una muestr')o

Al 's i 1 111 al' h 1 dia d la población a partir de una n II .. ,( l' 1./ 1" 111 I

11 ' 1' III1 ('rror de estimación que se define como I.X - .u l. ti ,,1., 1" ' 110 n mos .u, que es lo que precisam nL qu '1 ' ' 11111

t. 1 's lin C.'I i n por intervalo consiste en acotar 1 ' lI 'nl d ( '111111 \ nlVI pi babilidad 1- ex (llamada nivel de conficlII't,(I) 1

ti II I pila superior a un error de estimación ni . 11111 (/

pOI' " illv s Li gador: IX -.u l ::; Emáx'

11,\ 'rror de estimación máximo (Emáx) es función d In v \1 ,bllll [1 ' Ibl· '11 la población, del nivel de confianza (n.c.) y deltam I (l d, I

(5

Emáx = z¡ _a/2 .¡;¡

1 () Il 1 : Z I (1/2 f mción del n.c. = 1 - ex y se obtiene en la tallu 1 I I I ' i 11 normal tipificada (tabla IV). Los valores más ' (1111111

11. ' . on: 0,95, 0,99 y 0,999.

la desviación típica de la distribución muestra I . decir, el error típico de la media: (5 x·

11 (111 II P (' 1 ti (' I 1 pu/¡l 11 11 11 If 11 I (1 11 II( ti" 1111111111" '111111 \ 11 ' 1.

tI" .

11111\,111 ', ':1 -'tamaño d la mu s tra, may r rá la pI' ' 1.IlI1 I 11111 ' ' , 1 parámetros. No obstante, hay raz n 's 'OIlH) I I I ,1 " Il't d 8.2.1, que imponen límites al tamafí d \ In 11\11 •

I IIIt l' 'S't ab r cuál debe ser el tamaño de la mu stra P'U' 1 1111

Ilm,,"P¡o de la muestra se obtiene despejando n d la . ' 11 H' 111 :

(5 Z2 (52 E - Z -'>. l- a/2

máx - l -a /2 I --, n = 2

"\In Emáx

pIo:

investigador quiere conocer el tiempo d u .u . .lUC,,"~.lVU (en la que hay que elegir entr

en niños de 12 años. La variable tiempo discriminación se distribuye normal m nt

3. Decide realizar una estimación por int ~VJL.lV'~.lUV (el tiempo de reacción medio en la t

la población) y fija un error de estimación lUClJ\lJ~tll~t1 un n,c. = 0,95. ¿Cuál debe ser el tamaño d 1 media?:

= Z ¡-0,0512 = ZO,975 = 1,96 (Tabla IV)

Page 132: Libro Análisis de datos.pdf

('1 11 ' ' 11 '111 '11 11111111 111111 1 11 ti 111111111111 JI 11 11111

'j' 1, 1111 1111 11 O,I' Ií, 1111

Lo /111 (/', 111/4" 01 (/,,) . ",",)4" m (1, ) ti,' 1,,1,', ",tlo "hl I 11 ' 11 \ P 11111 ' Ipl ' '' '"1 ,:

(d

I • 1 l'Il',

1" h'II' ~ " 1 I ' i,," X

I..lu.u.a.uu.v con e] ejemplo ant al atorla simple de n = 35 i cción medio en la tarea de

"JlWlalt:>S, ¿ uál es el intervalo de confianz

la siguiente información de 1 IIritéiaclci6,n medio de su muestra) y quier

.a:lreacci.ón medio si se aplicara la tarea d I ... ,¡¡¡ ... U .. 'Q de 12 años.

t~¡,:sl,.bl[aIlno:s, el error de estimación máximo

G 3 Emáx = zl-a/2 ¡;¡ = 1,96 Fs = 0,99 "" 1

del intervalo de confianza son:

- G Ls = X + zl -a/2 ¡;¡ = 4 + 1 = 5

CllIl'hllZ, probabilidad 1 - a asociado al jnt 1'V' l lo 1, '(lit

\ III s i xtrajésemos todas las muestra p ibles 1, 1111 1

d 1111 ' I11Ll streo aleatorio simple, calculásem s la lIll'di I ' 11

111 . (1" u rde la distribución muestral de la 111 ' lin) . ji 11 1

dI 1 ti II"H110S el intervalo de confianza, una propol' ,¡ )11 1 p' d 1 dos I confianza contendrá la media pobla iomd'y lit 1 I JlI t I

11 1., 'OIÜ ndrá.

H ( . Di tribución muestral de la media y dos posibles inl 'I'vtdo/ol

I dl,l 5%, uno que contiene el parámetro Ji y otro que no lo '01111 ' 11 "

11 In figura 8.6. que el intervalo de confianza asociado 'l ,,'O"

111 '1 ro J1 y el intervalo de confianza asociado a.KE no lo () 1111 ' 1 H •

111 ' t' presentáramos en la figura todos los posibles int rVLl los el 111 's bien, 1 - a = 0,95 significa que el 95% de los int I'vnlo, 1

Ollt 'ndrá el parámetro J1 y el 5% no lo contendrá.

Page 133: Libro Análisis de datos.pdf

l o

IV' '1'\ la figura 8.6. que la amplitud del in'", v"l" 1 1'111 el ' .. I ¡ 111 i n máximo (2Emáx) y es constan l . Es 1

IlIpi ' 1 \ mism independientemente del int rva l ohl ' ''1' \, Lo ~ I V ría es el valor de la media y es lo u II 1,1 ¡nl ' 1 vid confianza pero no su amplitud.

la precisión de la estimación, es fá il illl 1/' 1111

Ro " III ll anto menor es el error de estimación máxiJ 0 , 1111 11111

lud el I inL rvalo y más precisa es la estimación, dad qll ' g el intervalo es más estrecho.

visto el concepto de intervalo de confianza l ' , \

'Ol"l plo puede generalizarse a otros parámetros.

H. .2. Tamaño de la muestra

m vimos en el apartado anterior, el tamaño d 1\ 1111 H ,

ión por intervalo de la media dada una variabl ' III ' dl 'nt con (}conocida, se obtiene despejando n d la ' 11\ "

,( j mación máximo de la media:

Z2 (}2

E - () l -a /2

máx - Zl-a/2 I ~ n = 2 \jn Emáx

V '1110S que n depende de tres factores:

• La desviación típica de la población. • El nivel de confianza. • El error de estimación máximo.

111(1 1\ 11,,11111 '

al atorlo imple, varlabl u la población normal, (J conocid .

ZOo97S = 1,96 (tabla IV)

1,962 .42

n = = 9 84 ~ 10 2,52 '

1111 III i~tervalo de confianza sea lo más estr ho 1 ( \ 111 · 11" I 1,,1 I l. mtervalo sea la más alta posible. Lam nl 'lbl 11\ ' 1\1 I

I1 1' )1 r~anzamayoreselerrordeestimación máxin 0, 1 0 1 In'lll

l' \ Imtervalo y menos precisa será la estima j n, tl, 10 1111

I 1111 ' ... or de estimación máximo dado (por eJ' mpl 1/ 1

I " In l\

11 , ' " es aumentando n.

t-''"'UI''. .'"H.IV''' que en el ejemplo 8.4. el nivel d

= 0,99 ~ ZI-al2 = ZO,995 = 2,58 (Tabla IV)

2 582 .42

n = ' =17 2,52

para un mismo E máx = 2,5, es necesario un si el nivel de confianza es 0,99 que si es 0,95,

Page 134: Libro Análisis de datos.pdf

I 11 111 ti

ZO,975 1,96 (

2 42 _ 1,96 · = 39,33 ~ 40

n- (2,5 / 2)2

ducir Emáx, el tam afio .... _~··· ..... ··do en el ejemplo 8.4.

m interactúan el tamaño mue lI" ~ I , ,1 11

limación máximo. Otro factor qu 1111 ' 1 11 I

a ión es la variabilidad de la variabl , ' 11 H 11 (l 111 ,

a d la población mayor debe ser n pam ni 111; 11

Supongamos que en el ejemplo 8.4, (J h

95 ----" Z = Z 975 = 1,96 (Tabla IV) , --, 1- 0/2 o,

n=1,962

,52

=15,37---716 2,52

D1lill«;;15 que el tamaño muestral requerido es ~ mplo 8.4. donde a valía 4.

It' )jI 1 pi 'o

ion como é ta u otra má

I H 111 :-; lnleriores hemos visto el concepto de i11lcl'vlI l() II II11

1/11/1101 I obtener el tamaño de la muestra y sus l ' 1" . (111 1111/

1I 1. I n iv 1 de confianza y el error de estimación 1111 t 11111 I 1111

" 1 ¡ 11 la aplicaciones del intervalo de confianz'\.

I I 11 ' I plicar un intervalo de confianza son los igl.l i ' 111 v. :

11 1"" 1111 error de estimación máximo para un niv I 1, ' ()II 1 (X.

I \-1 lamaño de la muestra n para el error de lil1l ,t -¡ 111 ificado.

I 1III ' t muestra aleatoria de tamaño n y medir la vari'lbl '.

1111 / t' l stadístico (el estimador del parámetro) con hH fl1 1I 111 la .

1" los límites del intervalo de confianza.

1 1 11 In ()cuación, n (lo que queremos calcular) aparece en t,,_I. I_OI2 ' Es el ' ' 11', PII I' 1 1II I 1I

1, " 11 esitamos conocer n , que es precisamente 10 que queremos al ' Id lll ', UIII 11111 " 1" 11 ' ti proximaciones sucesivas.

Page 135: Libro Análisis de datos.pdf

111 :1. \ P 11 ' \ I 1 11I( \d

' 1IIO ' dl.

o aleatorio simple, variabl cu 1 bl normal en la población, O' con

- = 1,96 (Tabla IV) , 5 -+ ZI aJ2 = Z I- O,05/2 - ZO,975

Z2 0'2 1 962 32 l -a/2 =' . = 34,57 ~ 35

n = 2 f Emáx

tigador extrae una muestra aleatoria simpl d 1 s mide el tiempo de reacción en la tarea d .

' - 4 dos 'Cuál es el intervalo de confl ob1~le[Le = segun . <.

t' gador tiene la siguiente información ~e la b:m'Clo d reacción medio de su m~estra) y qUIere 'I'.1ImtlO d reacción medio si se aplicara la tarea d

1 nifios de 12 años.

sabíamos, el error de estimación máximo

- ~=1,96-3_=0,99 ,::d Errún - Zl-a l 2 ¡;; J3s

'lO

. ' '''",''JL1CU1.c.Cl. d 1 95%, s tim qu todo los nifios de 12 afios,

3 y 5 segundos.

n no fuera normal (pero con n ~ 30) con (j J () '1 11, 1" ItI IV .. I de confianza se obtendrían de la misma 111 ' 1/1 ' 1' 1 lI tl ti 1I nmos de exponer.

II\()S ahora el intervalo de confianza para la m diu, I I \111 ' distribuida normalmente y O' desconocid .

Un investigador quiere conocer el nivel de d e I"v~v¡,:.n_u de los varones españoles sometidos a

la variable nivel de defensas se distribuye norm tanto la media como la desviación típica d la

el intervalo de confianza para el nivel m un error de estimación máximo de S uni

de confianza del 99%. Calcula el tamaño de la mu

.~~ .. _~.~ aleatorio simple, variable cuantitativa, di t normal en la población, O' desconocida.

, I

Page 136: Libro Análisis de datos.pdf

mdJt tI 2 099!~ 3,05S~ I ' ..Jn \jl J

t m nt 5 por 1 r dond

lo d onfianza son:

L¡ = X - t I2;0.99S1n = 25 - 5 - 20

L - X + t I2;O.99S1n = 25 + 5 = 30

confianza del 99%, si todos los var IOlmelti' dos a risoterapia, se estima que el niv 1

t ma inmunológico estaría entre 20 y 30

l' \I 'H lalqui r distribución (normal o no normal) , ' 011 di , d VHl0)10 ida, podemos calcular el intervalo de conn",, :t. , l' 11

PIII' " 1'() ¡l a ión de la distribución t de Student a la nOI 11' ti 11 1'11 pmnd (n ~ 30).

_ tlO 8.10. Un investigador quiere estimar el ti primero de Psicología de la UNED dedi sconoce la forma, la desviación típica y 1

d la variable tiempo diario de estudio en 1

al atorio simple, variable cuantitativ , di t n la población desconocida, (j desconocid ,

- ZI-o.0l/2 = Z O.995 = 2,58 (Tabla IV) ~ Aproxima ..., .... ' ... ~U'H t de Student.

tnt1onnad. ión de la muestra, X = 7 Y Sn_1 = 2,2, el tIempo medio diario de estudio de tod de Psicología de la UNED.

, el error de estimación máximo es 1:

E - Sn_l 2 58 2,2 máx - 20,995 Fn = , .J3O = 1

intervalo de confianza son:

- S L¡ =X - ZI-a /2ln =7-1=6

- S L = X +z ----2:cl - 71 8 s l-a/2 Fn - + =

''''''',UH.IUa,U de 0,99, se estima que el tiempo medio di i los estudiantes de primero de Psicología está nt

Page 137: Libro Análisis de datos.pdf

1111 \1 e 111 , "PI 11 111 11II1

11111 111 IIjlll(

'1' Ihl K .. .. tlllt ,It,· lo 11,,- ,11 llllll

lo

111 11 I)(I ~' lí l) i\OI'I1I l\ l 11 11 nu 1 n 11 ~ 30 ( 11" 11 , 1 11 1IIl I'm 'I I) ,

MIli 11 '11 d ' I(ol' o si" pi lid !l111il 11 , 1I1 1111111 '

0\

• 11 d 'OllO 1 11. 1I1 1 dhu '1 11 11 rmaJ no norma) con n ;::: 30 (Ipl 'O , \ lo n rmaJ) .

l. h11 1 1 ti

1JI · - 'I n l " ~ I II I

(1'

L¡ = X - '" 1;1 11 128 ,

' " 1;1 /t I

\~,\

L¡ = X - Z I_1l 12 '~'\ ZI- 1l12

\~A

, 1 \ ' U Isk l 'svia ión típica calculada en la muestra,

H ... '"It'Yvalo de confianza para la proporción

'1' dll ll l

.¡;; 1,

'1' IIdll ,

'J, 1 11

'I' lhlll ,

' 11

JII

\ 1) 1 mu streo aleatorio simple, una variable di (l )1' t

'1. ,d t, I ' 1 r r de estimación máximo de la proporción 's:

~n(l - n ) Emáx = z l-al2 n

\ ( 'tl IIlO [\ porllr de n = 30 podemos realizarla aproximación de la distribll l' lt 11 / d. 111 d , 1 ,, 11 ~' I o, p I' tic , 610 utilizaremos la distribución t de Student para 11 \1)

/1

111111 1111 ti 1 1\ t" l 1, ' (lId ' III Z \ 1 fX '1' d 1 \ I ) ,

1 I 11 '( l ' I I 1 'o l · In 1 1'01 01 ' ,¡ ) 11 : 0'",

'S '0]10 '1 ItI,

'1 ' \ 1,

11 r 'ri r y uperior del intervalo de confianz '01 1I 1 \ ' 1\ 1

ti 's timación máximo, Como desconocemo n, qu' 's lo '11 1 •

1/11 ' 1' 'm estimar, operamos con la proporci n 1'l111 ',' 11 ' " l' '111'1 tl s li luimos n por la proporción muestral P, Jo Hmil 's I ld'I'1 (1 1

It I IlI t ' !'valo de confianza son:

~P(1 - P) L.=P - Z1 /2 = P - E ! -a n máx

~P(1 - P) L =P +Z1 /2 = P +E s -a n m áx

lohn l i1idad de obtener un intervalo de confianza qu '0 111 1I t " t

( , t (1-P) ~P(1-P)J I - z l- a/2 n ~ n ~ P + zl-a /2 n = 1- ex

Se ha propuesto un tratamiento para curar una d t Y la comunidad científica quiere estimar la prop,nr,,,,,,,1"I

que se curarían si se aplicara el tratamiento a t d !CC:Luen aplicar un intervalo de confianza para la pr p'(Jror' ,ron

, y fijan un error de estimación máximo d 0,20 . Empiezan por calcular el tamaño de la muestra P

:uU' ..... U 'H máximo y obtienen n = 24. A continuación, eXlrra8ft

, I

Page 138: Libro Análisis de datos.pdf

pI I ndi ión par 1 24 (0,54) (0,46) = 5,96.

llame, • • , ...... ,.~_ido n por P en la ecuación nn ( M .. ms:ación de la muestra, P = 0,54, 1

uál sería la proporción de pac::teIUI. I tratamiento a la población nt

sal:)1amc)s, 1 error de estimación máxim

(0,54)(0,46) =0,20 Emáx = 1,96 24

H''''''IfN~. d 1 intervalo de confianza son:

L = 0,54 - 0,20 = 0,34 , Ls = 0,54 + 0,20 = 0,74

iv 1 de confianza del 95%, la proporció~ d urarían con el tratamiento propuesto SI s d pacientes está entre 0,34 y 0,74.

I .' 'UMEN

11, 11 li l ' L ma, hemos empezado tratando el ~:pel d . I 1 I :.: I I ¡ 1 Y 1, la estadística inferencial en relaclOn co Il I I I I I

I I JI . ' / hemos estudiado diverso 111(' 1111 ti 11 Il"lS A contlnuaClOn, I I I

111 ' '' ' . d ' d los conceptos de muestra a 1 1'1 l' I 11 h '1 lntro UCI o

I I I

10 HE AUTOEVALUACr()N

los ~ i g lli ntes tipos de muestreo NO es probabilfs Li 'o ?: 1\) ,1 I 11 'n s ls t 'l11ático; B) el muestreo casual o incid n lal; ) e l 11111 ('.

I 111' 'ollgl 111 rados

I 11 11 ti 'S ' nocemos el número de ancianos de las r si 1{'1Iv! 1 pi 1, I 'po la, deseamos realizar un estudio sobr h [1 1 '111' 1111 11 1 I II Ii 'h ancianos. ¿Cuál de los siguientes lipos dl' 1111 11

hl,,"oS ulilizar?: A) muestreo aleatorio simple; B) 11111 ', ' 11 '( ' (1

) I11U streo por conglomerados

I l'o log mide una variable cuantitativa al conjll l lo 101 d 11

1111 IlII. 1 psicólogo: A) puede conocer el valor del p'~r11)1 ' 11 '" 11 1, .bl I '1 n in recurrir a técnicas inferenciales; B) sólo pu 'd ' ('11 110

1'" I 'sLlmación del parámetro J1 de la población; C) 1' 1) 11 ' 1 1'1( ' 111 " ('1 parámetro J1 con técnicas inferenciales.

, 1, nfirmación correcta: A) una muestra aleatoria s SlVI11PI" , ' IIl tHiva de la población; B) un parámetro de una p bh ' 1)11 '

I Il'inble aleatoria; C) una muestra aleatoria simple garanLiZII (1111 '

los lementos de la población tienen la misma pr babi li Ind I I dd

1/ m dor: A) es un estadístico; B) es un parámetro; C) N 's III1 1 Ihll' leatoria.

1, afirmación correcta: A) una estimación es igual a l P'II 'L I1H' II'O ;

, II nte el análisis descriptivo de una muestra pod m s inl' '1'11 ' I

I In ión; C) la estimación por intervalo es un proc di 111 i ' 11 I o /111 ' , d,

"

Page 139: Libro Análisis de datos.pdf

H,/ , II IIbl

11"1111 ' 11 ' 1 , 111 1: 1\ )/.y , 1\) )/ ,'y r : (') . '" l' Vl/

K.H. 111 " " 1' IIII (). I1lHl 1 (J I I \ .¡ )11 p'l'tl ll 1 ' () II

~,I. l. , '1' ' Ih nlU 'str J, (l 1l d (/1 P( I'q , : A) • /-1,\'

M. I (l . s útil calcula l un j¡ l 'I'vn l(l ti

• 1 1.

H. I ,. H I1 tllI 'l 1 II tra, hemos obtenido los límites 3,5 y , ti ' 1111 I ti ' ' )1 n n z para la media. La amplitud del inl ' I'vllln 11

1\ 's 2 ¡ 1116x ; B) NO es 3; C) es 3 ·2 = 6.

H. I \. EII ,1 'j r jeio anterior, ¿cuánto vale el error máximo ti 1\ ) 3/2 = ] ,S . B) 3; C) 3·2 = 6.

H. I '. SUI n amos que en una investigación, la variabl . l ' ti III ' tln nt en la población con (j = 4 Y quer -I os 11 1

I1w y r qu 2 con un nivel de confianza de 0,99 ¿ \1 1 1111 t ' 1) r 1 muestra para estimar la media? A) 15; B) 20; ( ) I

K. I ,. tigador quiere inferir la auto estima In' li \ 1 iarios. En este estudio, (j = S, n.c. = 0,95, 1/

ti l ' on los límites del intervalo de confianza ' j 111

': 1'11 '1' , t la autoestima media de todos los recluso, \1 ' 1111

1\) 8,5 Y 10; B) 8,5 Y 11,5; C) 10 y 11,5.

H. I l . Lo ' 1 1 it del intervalo de confianza para la m diu 11 I 1 11' 1 1I ' i n normal y varianza conocida son 5,85 y 10, 1 , ,

¡ . \1 IIH vale la media de la muestra? A) 4; B) 5; ) H.

111.

di ·1 11 ' ( 1 d, '(II d 111 1', ' 1)1 •

",. ¡ ,i 8.18., los límites del intervalo de confianza pOlI" 1 h 1 I'()

1111 d (11 0 on: A) 0,15 Y 0,85; B) 0,20 Y 0,60; C) 0,4 y 0:7 .

IONES A LOS EJERCICIOS DE AUTOEVAUJI\CH N

hl\ 011:

I 1111 t S 11' casual porque se seleccionan los elemen los , It s que se tiene fácil acceso.

1111 I( 11 C

1111111 utilizar el muestreo por conglomerado da 1 • /1I1t -I" un listado de los elementos de la población ba t' 'll¡1 I 1,111 1 1 ' G a UI1 • , " • I 01 g omerados. El muestreo aleatorio simple y el In 1 sI r 'O

11 I ' C) f lo requieren. .

hl,l( : A

l. I ll-l el psicólogo trabaja con toda la población no d b ." I 1 r . 1 B ' lI S" 1 '.

1 r:nCla es. asta calcular la media con todos lo d los l.. I I 1 rametro J1. y ,

hlll 1: C

Inda ' las muestras aleatorias son representativas d la pol h -/ 111

1 \l ' metro tiene un único valor, no es una variable al atad:" .

11 ' n: A

I i~l1ador es un estadístico, no es un parámetro y I()I'! .

UIl'I vId Ibl •

Page 140: Libro Análisis de datos.pdf

H . ~ .

son l' 111 lia y 1, d svi a

Illltw lml I h 111 dia,

H.H • • ' n llt '1 )11 :

l . Ipl 'O Imac.l a n nt normal (ver Teorema Ccnln" d ,1 1) III \ 1< HA, !.)

K.' . ' ,llId In : B

H. 10.

1.\ 111 • Ih Illll 'stral, X, es un estimador insesgado d ' 1\ 11 11

' 1011 " (J.l) p rqu J-l == J-l , X no es igual a J-l ni a J-l '

1 parámetro, no hay nada que inr ril ' 1 " 1 1 .. I 11 " 's iVl n o calcular ningún intervalo de con Cian :t,tI . I JII 1111

1, ( I1n nza es útil cuando se quiere estimar un p '" 1111 11

' Oli O ic.l , Cuando se estudia a toda la población no "1 l ' l'il ' n ' c.l a , e calcula el parámetro sin recurrir a L 'l' " I I

-inl 's ,

H, 1 \ . So III i 11: B

~ E, = 35 - 30 =5 max

E , = 40 - 35 = 5 max

H. \ , Solu i n: A l .tI H n I li tud del intervalo de confianza es dos vec S

IIH\ ' j n máximo: 6,5-3,5 == 3,

H. \ l . Solll -i )11: A

h ' 11 ,

JI. 1 ' 1'1' r d estimación máximo es la mitad de la ami I I 11 ti ,do l ' nfianza: 3/2 == 1,5,

. 1 1'" '11.1'1'1

Iltll 011 : B

, H ('1 ' \ 111 \ I

,5H I , ~ I

2 7

ti 1 ' 0110 ' , la r 1'111 41 1, la listribu ' i I 1, h a ulo '1'i lill ltl ' 11 I 1 I)()hl I

1I I 1\ l' c!U S01'i P ' 1' - 43 ' I I

n - , p 1 qu ' p el ' l OS hu " I ' I ~ I Upl 'O I II1 \ \ \ !lOI'l 1<1 1. ¡

11 , O,, S Z , fJ.I2 == ZO.975 == 1,96 (Tabla IV)

1,"

1,

5 ." (x/2aX = 1, 96 J.:: "" 1,5

,,43

10. 1,50 == 8,50 Ls == 10 + 1,50 == 11,50

I -- máx ~ X = L¡ + E , max ~ X=5,85+2,15 =8

" ' 11 ,

I +E áx ~X = L - E ~ l11 c: S máx X = lO,15-2,15 =8

11", x = zl_a/2sX ~ ax = 51136 = 0,833 ~ 2 15 = z 0833 , J-a l2 '

= 2,58 ~ n_c, = 0,99 (Tabla IV)

j n:A

0,95 ~ ZI-fJ.I2 == ZO,975 == 1,96 (Tabla IV)

I IIbnbilidad de aciertos: Paciertos == 20/50 == 0,40

E 0,40(1- 0,40) máx = 1,96 = 0,14

50

,1\1 ión: C

,40 - 0,14 == 0,26 Ls == 0,40 + 0,14 == 0,54

'M I

Page 141: Libro Análisis de datos.pdf

H, () 1,1111 1' 11 (

( 1 111 ()/1"IIi,~ 1 II I I 1 I 1111 ' () I I JIII 1, 11".' 111 \¡ II II~ ,

1 - 0,5 1, 1 O, , () • 1, ' 1111 ' () , ~ .Y () ,t~,

lH2

(IIJIJI)) : Il'sltlc!fs lica para psi ·óLogos. 1:;sladfsli '(1 el '8 'riplivo . Vol. 1, M Idll 111 111 d ~ \ 1:; ," 'd j j i ).

1, !.\lON, . y AN MARTfN, R. (1993): Anális i d , Oc/ los (' /1 / ).\' /('(//111' 111 I'd II,d 10I·j.¡1 Pirámide.

1I 111 (1 , A. ; A UILERA-GENICIO, F. (2005): Olfactory S n iti vity m '(INIII " (' 1

I I flllI!llv impairment: A parametric and non-para m tri HI I "OIll'lI , 1 IINAl IA N, . M. SHEFFERT & J . T. TOWNSEND (eds .) Fechn 'r 1 oy 2 ()(). (p

1(11) 'l'I'IV rs City, MI: Central Michigan University Prin lin r S ' 1 (' ," I

11111,0, A.; ACUILERA-GENICIO, F. (2007): Predicting cogni llv' IlI ' jI 1111111

1111 / \I ' (o\'ys nsitivitymeasures: Acontinuous anddisc I1linll<HI . II'PII'I 1 1 I Hln i\-TRILLO (Ed.) Converging research on predictors oj' c:()gll llll'/' 11/11111/

I/l/tll/l'urodegenerative diseases (pp. 15-28). Sevilla : Publi cliNtl.

tatistics (4th ed.) New York: Holt Rinehart & WinSl011.

tras (2007): Análisis de datos en Psicología l. Macl rid : UNII""

i\N MARTíN, R. (1998) : Análisis de datos en Psicología 11. M ~\dr¡ 1: I ,d I 1'It, n ideo

, •. (1946): On the theory of scales of measurement. Science, 10 , 77 (1

( 1 \)< 4): El problema del método científico en Psicología. An/lario (// ' ".' /1/, . 0,3-12.

H

Page 142: Libro Análisis de datos.pdf

1II ' IId

T'" h

I l . 1'1I11t'iOIl lit' proh'lbilid"l<.I (TAIJLA 1) I , Fllllt iOIl dc d isl ri buci6n (TA 13 LA 11)

IRIIIl JCION NORMAL TIPIFICADA

, l . I'lllllllacioncs típicas negativas (TABLA 111) .. Pllntuaciones típicas positivas (TABLA IV)

1>1 IRIBUCIÓN CHI-CUADRADO de Pearson (TABLA V)

I JI I RIIHJC IÓN l de Sudent (TABLA vI) !JI 'TRIIHJCrÓN F de Snedecor (TABLA vII)

Page 143: Libro Análisis de datos.pdf

II ,IJ II ~ () ,B IOO 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 1I , lI lt~O 0, 1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 11 ,1111 11 0,0 100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500

lI ,ti'l'l 0,7290 0,6141 0,5 120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250

0, 1 \ ~'" 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750 0,()()7 1 ,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750 0,0001 0,00 10 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250

0,ti 145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 0, 17 15 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 0,01 35 0,0486 0,0975 0,1536 0,2 109 0,2646 0,3105 0,3456 0,3675 0,3750 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 O,()()OO 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625

(1 ,77 8 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 0,2036 0,3281 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563 0,02 14 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125 0,00 11 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 0,0000 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 n,Oooo 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313

0,735 1 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938 0/0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,ü205 0,0369 0,0609 0,0938 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156

0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078

1111 'riores de la tabla indican la probabilidad de obtener «x » éxitos en «n» ensayos Ihn nto binomial, donde «P» es la probabilidad de éxito en un ensayo.

Page 144: Libro Análisis de datos.pdf

0,0 117 O,OI IH 0,110 , / 0 ,1) 1/ O,M I I 0 , 100 1 0,01 111 0, 1 (1 1 0,0 71 O,OI M

O,O! 1>11 0, 71 1 O. IH (1 n, 1 \ "\~ 0 , ó70 0, 1 1/ 1 O, { 1 0, 1 7H O, IOHH

0,00 (1 0,0 111 O, 1 i~HH O, \ 7h O, ()\11 0 , \ 11 e; 0, 1)(1 0, IIH7 O, ~ H 1 0, \)7 O, 11 ~

0,000 1 0,00 11 o , o ~ \ 1 O,OH 3( O, II\,6H O, 07tl 0,254 1 0, 7H(1 0, 1 1) ~ 6 0,2,1 11 O, M7 O, IO.U n,1. H!'i 0,20.1 1 O, I1

0,0000 0,0004 0 ,004 1 O,O IH!'i O,045() O,OH6,'i O,Uó l O, IH7 0,040 1 0,0792 (J , 12HI 0, 1 11 0,0000 O,()OOO O,(lOO4 0,0026 0,009 0,02 1 0,0467 O,OHOH 0,0 11 5 0,02' 1 O,05~ 1 O, I,I,H') O,()OOO 0,0000 0,0000 0,0002 0,00 11 0,0038 0,0 100 O,(l2 17 0,0024 0,0078 0,0 1 9 0,07 ) 0 ,0000 0,0000 0,0000 0,0000 0,000 1 0,0004 0,00 12 0,00 \ \ 0,(0 71) 0,111 I1 1 0,0004 0,00 15 0,0048 0,0 71 O,()OO() 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 1 O,(lOO O,0()O7 0,11111 / 0,0000 0,0002 0,0008 O,OO6i'!

0 ,111 \~ O,ó. 02 0,3874 0,23 16 0, 1342 0,075 1 0,0404 0,0207 0,010 1 0,001 , 0,0000 0,0000 0,000 1 O,O() IO 0,0000 0,0000 0,0000 0,000 1

O,OH lO O, 85 0,3874 0,3679 0,3020 0,2253 0, 1556 0, 1004 0,0 1111 0,00 \' \ O,()Ó2' 0, 1722 0,2597 0,3020 0,3003 0,2668 0,2 162 O, I1 111

O, 1 0,2542 0, 1209 0,0550 0,0238 0,0097 0,0037 0,00 1 0,0004 0,1. 12 0, 672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0 11 3 O,OOiJ'I

0,0001 0,0077 0,0446 0, 1069 0, 1762 0,2336 0,2668 0 ,27 16 O, I 1 PI 0, 1 lO 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,045 0,0 O

0,0000 0,000(1 0,0074 0,0283 0,066 1 0,1 J68 0,1715 0,2 194 0,0 14 0,0997 0,1900 0,2457 0,25 17 0,2 181 0,1 65 1 0, 11 07 O,06(JO 0,0000 O,O()OO 0,0008 0,0050 O,OJ 65 0,0389 0,0735 0, 11 8 1 1),1 1 '11 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0, 1845 O, 1 ~Ii O O,()OOO 0,0000 0,000 1 0,0006 0,0028 0,0087 0,02 10 0,0424 0, 11 111 O,O()03 0,0055 0,0266 0,0691 0,1 258 0,1803 0,2154 0,22 14 O, III MI ) 0 ,0000 0.0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,00' 8 0,0111 1 0,0000 0,0008 0,0063 0,0230 0,0559 0,1 030 0,1 546 0, 1 '6H O, 1r,1)

0,0000 0 ,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,00 13 O,IIIIIí 1 0,0000 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0, 1 12 0, 17 7~

0 ,0000 0 ,0000 0.0000 0,0000 0,0000 0,0000 0,0000 0,000 1 0,111111" 0,0000 0,0000 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 O, IOH') 0,0000 0,0000 0,0000 0,0001 0,0009 0,0034 0,010 1 0,0243 O,OIj.lI'l

0,9044 0,5987 0,3487 0,1 969 0,1074 0,0563 0,0282 0,01 35 O,OllóO 0,110 I 0.0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0022 0,00 5 O,OI Ci 0,(1) 14 O, 15 1 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,040,1 0,11 ' 11 : 0.0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,00 12 O,OO I() 0,0042 0,0746 O, l 937 0,2759 0,3020 0,2816 0,2335 0, 1757 O, I20IJ O,II /!,1 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 1 0,000 0,000 1 0,0 105 0,0574 0,1 298 0,2013 0,2503 0,2668 0,2522 O,2 1:iO 0, 1 " 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 O,()OOO

0,0000 0,0010 0,011 2 0,0401 0,088 1 0,1460 0,2001 0,2377 0,250M 0, 1M 1 0,""'1 I 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,000 0 ,0000 0,000 1 0,0015 0,0085 0,0264 0,0584 0,1029 0,1 536 0,2007 O, 1I1 1 O, 1 I 11) O, 593 0,3559 0,2539 0,1539 0,0832 0,0407 0,01 81 0,0073 0,0027 0,0000 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0, 111 , 0, 1 IJ, O,III1 H 1 0, 1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0 14 1

0,0000 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 O,02J 2 0,042 .~ 0,0 / 1 0,11110 \ 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 O,041í

0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0 106 0,11 '111 O,IHIOO 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0, 1040

O,()OOO 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,00 16 11 ,11111 ' f 0,11000 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0, 170 1 0 ,11000 0,0000 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088

0 ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 1 11 ,111111 1 11 0 ,0000 0,0000 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1 574 0, 1952 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,003ó 0 ,11000 0,0000 0,0000 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0, 13 !!

0,0 '5 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,02M 0,01 ' . 11 ,0000 0,0000 0,0000 0,0000 0,0003 0,0018 0,0066 0,0183 0,0408 O,071í2

0,0050 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0, 1395 O,08!!7 O,II , I ! 11 ,11000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0014 0,0049 0,0136 0,0 12

0,0002 0,01 37 0,0710 0,1517 0,2215 0,2581 0,2568 0,2254 0, 1774 11 ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0033 0,009

0,0000 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 1I,lIl1no 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,00 19 11 ,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002

0,0000 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 11 ,01100 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0, 147 1 O,()OOO 0,0000 0,0000 0,0003 0,0017 0,0064 0,0173 0,0379 0,Q70 1 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,000 1

O,O()OO 0,0000 0,0000 0,0000 0,0002 0,0011 0,0037 0,0102 0,0234 0,3658 0,3432 0,2312 0,1319 0,0668 0,ü305 0,0126 0,0047 0,001 6 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,021 9 0,0090

0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 0,0052 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,03 18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,111111 0,0006 0,Q105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0, 1404

Page 145: Libro Análisis de datos.pdf

O,llIIOU U,Ollllll 0,001 11 0,01 \ 0,0110 0,0111 7 0,1'11 1 O, (lfln O, jlJI 1 1111111111 11 ,01100 0,00 10 0,0091 0,0350 0,0820 0,1376 0,1792 0,1892 0,1657 0, 12 /11

0,1111110 11 ,110110 O,OOO! 11 ,00 \0 0,01 ~H O,O!II.! O,OH 11 o,lm O, '111 \ 11111111 II ,OOO() 0,0002 0,0022 0,0120 0,0376 0,0811 0,1327 0,1734 0,1864 0, 11\(\1)

11,1111110 0,0111111 11 ,11000 O ,OOO ~ 11,110 , ~ 0,01 \ 1 O,OIIH II , II H 1 11, 1 d i 11111111 II,OIlO() 0,0000 0,0004 0,0033 0,0139 0,0386 0,0794 0,1284 0,1694 0,1 H

11 ,110110 1I ,1I0()0 O,OO()O 0,0001 0,0()07 0,011 M O,Ollh II ,Otl l 0, 1111 0111111 O,1I0()() 0,0000 0,0001 0,0008 0,0042 0,0149 0,0385 0,0771 0,1248 0,1/1111)

0,00110 11,0000 0,0000 O,()O()O () ,()OOI O,()()()7 O,()(),HI (),O ,1 0,0 1 0111111 O,()OOO 0,0000 0,0000 0,0001 0,0010 0,0046 0,0151 0,0374 0,0742 0,1 11

11,11111111 0,0000 0,0000 O,OOO() O,()()()() O,()O() 1 O,()()O() 0,00 / 1 0,111' 1 0111111 0,0000 0.0000 0,0000 0,0000 0,0002 0,0012 0,0047 0,0145 0,0354 O,O/OH

0,00110 11 ,011011 O,OO()() O,OO()() O,OO()O O,()()O() () ,OOOI O,OOlfl 11 ,011 ' 11111111 () ,()OOO 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0045 0,0134 0,0 I

0,0000 (l,O()O() O,OO()O O,(JOOO O,OO()O 0,0000 0,0000 0,000 \ 0,1111111 011111 1 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0039 0,011 '/

O,(lO()() O,()O()O () ,OOOO 0,0000 0,0000 0,0000 0,0000 0,0000 0,1111111 1111111) O,O()OO 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,00. I

0,0000 O,OOO() 0,0000 0,0000 0, 000 0,0000 0,0000 0,0000 0,11111111 I 0111111 (l ,OOOO 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006

O,H 1 0, · 01 0, 185 0,074 0,0281 0,0100 0,003 0,00 10 0,000,\ 0,011111 1111111111 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 1

0,1 \7() 0,,\706 O, 294 0,2097 0,11 26 0,0535 0,0228 0,OOS7 O ,OO~O 11,001111 11,110110 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 O,OODO

II , OIO~. 0,146 0,2745 0,2775 0,2 111 0,1 36 0,0732 0,035 0,01 ~O 11,011 1 11 ,11 '(1 O, 774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001 0,0000 0,0000

0,000 O,O\ 'i9 0, 1423 0,2285 0,2463 0,2079 0, 1465 0,0888 O,046H 0,0 1 11 1 H(I O, 774 0,2852 0,1529 0,0685 0,0268 0,0093 0,0029 0,0008 0,0002 0,0000

0,0000 O,OO( 1 0,0514 0, 1311 0,2001 0,2252 0,2040 0,155 O, IOI!\ 0,0 l' 11111 1I 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 o,ooo~

0,111100 0,0001'1 0,01 7 0,0555 0, 1201 0,J802 0,2099 0,2008 0 , 1 62~ 0,11 ' \ II,IIIIIIH 0,0533 0,1796 0,2428 0,2182 0,1517. 0,0869 0,0422 0,0175 0,0062 0,00 11'1

II ,O()()O O,O!)OI 0,0028 0,0180 0,0550 0,1101 0,1649 0,1982 0,1 t SJ 0,1 ,M 1 11,1111110 0,0 11 2 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074

0,11000 O,()OOO 0,0004 0,0045 0,0197 0,0524 0,1010 0,1 524 0, 1 HHt 0,11),,1) 11,111 11111 0,00 18 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222

0,0000 0,0000 0,00 1 0,0009 0,0055 0,0197 0,0487 0,092 0,1417 0,1 H 1 ' 11,1111110 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,05 1H

0,0000 O,OO()O 0,0000 0,0001 0,0012 0,0058 0,0185 0,0442 0,OS40 0,1 \1 11,111100 0,0000 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961

0,0000 o,oono 0,0000 0,0000 0,0002 0,0014 0,0056 0,0167 0,0392 0,11 1 lI,flIIOO 0,0000 0,0002 0,0032 0,0166 0,0487 0,0981 0,1489 0,1797 0,177] 0, 1442

O,(lOOO n,()OOO 0,0000 0,0000 0,0000 0,0002 0,0013 0,0049 0,0 142 0,0 \ \ I 0,111100 0,0000 0,0000 0,0007 0,0051 0,0198 0,0514 0,0980 0,1464 0,177] 0,1 76

(),OOOO O,()()OO 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0040 0,011 O,flOO!) 0,0000 0,0000 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1449 0,176

O,OOO() 0,0000 0,0 00 0,0000 0,0000 0,0000 0,0000 0,0002 0,000 1'1 0,00 "1 11,110011 0,0000 0,0000 0,0000 0,0003 0,0018 0,0077 0,0233 0,0532 0,0970 0,144

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,000 1 0,(11)(1 11,111100 0,0000 0,0000 0,0000 0,0000 0,0004 0,0022 0,0083 0,0237 0,0529 0,0961

o,O(lOO o,nooo 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,01101 11,111100 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0024 0,0085 0,0233 0,05 1 H

11 ,0(100 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 (1 ,1)(11111 0,111100 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0082 0,02 11,111100 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0022 0,007'1

O,H 1) 0,4 18 1 0,1668 0,0631 0,0225 0,0075 0,0023 0,0007 0,0002 0,1)(11111 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 O,OOIH

(1 , 1447 O, 74 1 0,3150 0,1893 0,0957 0,0426 0,0169 0,0060 0,001 0,11011 0,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,000\

0,011 7 0, 1575 0,2800 0,2673 0,1914 0,1136 0,0581 0,0260 0,0102 (1 ,001 0,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

O,OOO() 0,04 15 0,1556 0,2359 0,2393 0,1893 0,1245 0,0701 0,034 1 0,0111 fI ,O(lOO 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 O,OOO!)

O,O()O() 0,0076 0,0605 0,1457 0,2093 0,2209 0,1868 0,1320 0,07 6 0,0111

0,0000 O,OOJO 0,0175 0,0668 0,1361 0,1914 0,2081 0,1849 0,1 79 O,IIHI II,H I7 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000

0,0000 O,OOOl 0,0039 0,0236 0,0680 0,1276 0,1784 0,1991 0,1839 0,11 \' 11,1 , ~2 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001 0,00011

O,()O(lO 0,0000 0,0007 0,0065 0,0267 0,0668 0,1201 0,1685 0,1927 0,11\ 11 0,111 1)9 0,1887 0,2852 0,2293 0,1369 0,0669 0,0278 0,0100 0,0031 0,0008 O,OO()

0,0000 0,0000 0,0001 0,0014 0,0084 0,0279 0,0644 0,1134 0,1606 0,1 Hit \ 11,0010 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 O,O() 1 1

0,0000 ,0000 0,0000 0,0003 0,0021 0,0093 0,0276 0,0611 0,1070 0,1 lO 11,111100 0,0133 0,0898 0,1821 0,2182 0,1897 0,1304 0,0738 0,0350 0,0139 O,OOil/l

0,0000 0,0000 0,0000 0,0000 0,0004 0,0025 0,0095 0,0263 0,057 1 O, ((IIIH (1 ,0000 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 O,OlilH

0,(1000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0026 0,0090 0,0242 0,0 ; 11,0000 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0. 70

0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0081 () ,O'I (1 ,0000 0,0000 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1 22 1 O,(l7 W

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0021 0,011, fI ,OOOO 0,0000 0,0004 0,0046 0,0222 0,0609 0,1144 0,1614 0,1797 0,1623 0,1 01

O,()OOO 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 O,Olllr, fI,OOOO 0,0000 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1771 0,1/,0

o,nooo 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0011\ 11,(1000 0,0000 0,0000 0,0002 0,0020 0,0099 0,ü308 0,0686 0,1171 0,1 593 O, 17C1

0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,11111111 lI ,flOOO 0,0000 0,0000 0,0000 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 O, IIlO

(l ,OO ° 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0111111 II,!)OOO 0,0000 0,0000 0,0000 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1 01

0,3972 0,1501 0,0536 0,0180 0,0056 0,0016 0,0004 0,0001 O,!)OOO 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0045 0,0146 0,0 66 O,()7 \11

0,3763 0,3002 0,1704 0,0811 0,0338 0,0126 0,0042 0,001 2 0,(1000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0049 0,01 50 o,lm!)

0,1683 0,2835 0,2556 0,1723 0,0958 0,0458 0,0190 0,006' 11,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0049 O,OI ·IM O,!)OOO 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,001 3 0,00 (1

0,0473 0,1680 0,2406 0,2297 0,1704 0,1046 0,0547 0,0246 0,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0093 0,0700 0,1592 0,2153 0,2130 0,1681 0,1104 0,061 4

0,0011

0,0014 0,0218 0,0787 0,1507 0,1988 0,2017 0,1664 0,1146 0,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 O,O!)O

0,0002 0,0052 0,0301 0,0816 0,1436 0,1873 0,1941 0,1655 0,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 O,Ollfl!) 0,11000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,011011

Page 146: Libro Análisis de datos.pdf

0,1)0 S O,H 1 00 0,1225 0,6400 O,<J1 7; O,e 900 0,'775 0,9600 1,0000 1,0000 1,0000 1,0000

O,36()O O , ,~ O O,' 1111 0,8400 0,7117 U,I ,1111 I,OO()O I,OUOO 1,11111 111

O,Hlj7 O,ne ° 0,6 141 0,5 120 0,42 19 0,3430 0,2746 0,2 160 0, 111(\ O,I) \)2H 0,9120 0,9393 0,8960 0,8438 0,7840 0,7 183 0,6480 O,.'i7¡IH O,I)e)91 O,, ° 0, 966 0,9920 0,9844 0,9730 0,957 1 0,9360 D,' OH') I,OOO() 1,0000 1,0000 1,0000 .1,0000 1,0000 1,0000 1,0000 1,0000

O,H I "i 0,656 1 0,5220 0,4096 0,3164 0,2401 0,J785 0, 1296 O,()() 1 O,I)H60 0,9477 0,8905 0,8192 0,7383 0,6517 0,5630 0,4752 0,, 1) 10 O,1)90S O, 6 0,9880 0,9728 0,9492 0,9163 0,8735 0,8208 O,7SH 1,0000 O, "9 0,9995 0,9984 0,9961 0,9919 0,9850 0,9744 O,9S')O

1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0,77 8 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 O,O.'iO \ O, 774 0,9 185 0,8352 0,7373 0,6328 0,5282 0,4284 0,3370 0, 56 () ,~ 988 0,99 J 4 0,9734 0,9421 0,8965 0,8369 0,7648 0,6826 0,,)1).1 1 1,0000 0,9 95 0,9978 0,9933 0,9844 0,9692 0,9460 0,91 30 0,H6HH

1,0000 0,9999 0,9997 0,9990 0,9976 0,9947 0,9898 O,IJH 1 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 I,()()OO

0,7 5 1 0,5314 0,377 1 0,2621 0,1780 0,1176 0,0754 0,0467 0,0271 ,9672 0,8857 0,7765 0,6554 0,5339 0,4202 0,3191 0,2333 0,16\0

0, 78 0,9842 0,9527 0,9011 0,8306 0,7443 0,6471 0,5443 0,44 1 ~ 0,9999 0,9987 0,9941 0,9830 0,9624 0,9295 0,8826 0,8208 0,7441 1,0000 0,9999 0,9996 0,9984 0,9954 0,9891 0,9777 0,9590 O,, , OH

1,0000 1,0000 0,9999 0,9998 0,9993 0,9982 0,9959 O,\N 11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0 1 ~ ,

0, 556 0,8503 0,7166 0,5767 0,4449 0,3294 0,2338 0,1586 0,10 ,1 0,99620,97430,92620,85200,75640,64710,5323 0,4199 O,~ I I, I

0,9998 0,9973 0,9879 0,9667 0,9294 0,8740 0,8002 0,7102 O,óOH \ 1,0000 0,9998 0,9988 0,9953 0,9871 0,9712 0,9444 0,9037 0,H47 1

1,0000 0,9999 0,9996 0,9987 0,9962 0,9910 0,981 2 O,c (v i \ 1,0000 1,0000 0,9999 0,9998 0,9994 0,9984 0,9% \

1,0000 1,0000 1,0000 1,0000 1,0000

II 111 111 1' ', ' 111 1 riores de la tabla indican las probabilidadades acumuladas el ohl ' 11 1 , 1

I lo ' 11 «/1 » ensayos ele un experimento binomial. donde «P» es la probabilld Id ti

O,O/JI' 0,')1) · 0,96 1IJ O,7e 1) 0( 7H 0 55 1u

,1 , " . " 0,.1 1 iI O, 01 O,\J ')' 6 O,u SO 0,9786 0,9437 O,H8 12 0,80S' 0,S941 O,117m I,OO()O 0, 6 O, 71 O, 896 0, 727 0, 420 0,8 O,82 () ,~ 0,7 \ell,

1,0000 0,9998 0, 988 0,9958 0,9887 0, 747 0,150 O,e) 11 "i

1 ,0000 0,9999 0,9996 0,9987 0, 964 O, , 9 15 O,I)H 1 ')

1,0000 1,0000 0,9999 0,9 98 0,99' 3 O,IJI)H.l O,I¡e) ,1

l ,OOOO 1,0000 1,0000 1,0000 1,00110

0,6 02 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,010 1 0,()0411 O,()() JO

0,9288 0,7748 0,5995 0,4362 0,3003 0,1960 ° 12J 1 0,0705 , . . . (), O lH ,~ 0,(1 1)

0, 9 16 0,9470 0,8591 0,7382 0,6007 0,4628 0,3373 0,23 1 H O, I¡J') O,OMIJH 1,0000 D,9994 0,9917 0,9661 0,9144 0,8343 0,7297 0,6089 0,40 (,

o , 0, \1, 1/1 O,' ['1 1,0000 0,9991 0,9944 0,9804 0,9511 0,9012 0,8283 0,7,':\, I O,!I 11 1 O, 1111111

0,9999 0,9994 . 0,9969 0,9900 0,9747 0,9464 ° ,900 (1 O,M \ l ' 11, 1I1 t ,OOOO 1,0000 0,9997 0,9987 0,9957 0,9888 0 ,97 ,~ O O,U 10 ' 0,'/ 111

1,0000 0,9999 0,9996 0,9986 D, ~«(J 0,1111( 1) 11 1/111

1,0000 1,0000 0,9999 0,9997 O,, 1)1) I II ,'MHI I

] ,0000 I,nooo 1,0000 1,0111111

0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,00 0,00 'O 0,9139 0,7361 0,5443 0,3758 0,2440 0,1493 0,0860 0046 , 4 0,023.1 0,010 1 0,9885 0,9298 0,8202 0,6778 0,5256 03828 , 0,2616 0, 1673 O,O(()1'1 0,0 11 0,9990 0,9872 0,9500 0,879] 0,7759 06496 , 0,5138 0,382 O, 6(iO 0, 1711) 0,9999 0,9984 0,9901 0,9672 09219 08497 ° , , ,7515 0,633 1 0,';044 O, mo 1,0000 0,9999 0,9986 0,9936 0,9803 0,9527 0,9051 0,8338 O,7JH4 O,!, I!I

1,0000 0,9999 0,9991 0,9965 09894 0 9740 ° , , ,94';2 O,HI HO O,M 'M I 1,0000 0,9999 0,9996 0,9984 0,9952 0, 877 0,1)7 Il 0,1) 1, \

1,0000 1,0000 0,9999 0,9995 0, 983 () ,() I)~~

1,0000 1,0000 0,9 e IJ O,e)C)l)7

1,0000 1,0000

0,5688 0,3138 0,1673 0,0859 0,0422 0,01 98 0,0088 0,00,'16 0,001 4 0,8981 0,6974 0,4922 0,3221 0,1971 0, 1130 0,0606 0,0302 0,0 1.1')

Page 147: Libro Análisis de datos.pdf

0, 2HH 0,0\ 1O O,Ol7H O,OO(lH O,OO'¿ I O,()()O!l O,OOt) O,!lM4(1 O,IW/! 0, 10 10 0,0 1' " 0,0 O O,UOM 1 0,00 1)

O,\jI)H I omo 0 ,114 16 0, 1 MI 0, Mil 0, 160M O,OM. l) O,()~liH 0,01 YO

O,!)!)I)!) O,III? O,! M 1 O,l)/I()() O,MM 1I 0,( 1M ~ o, lIm 0,955( 0, " 82 0,5 13 0,3552 0,2205 0,124 0,0(\ \

1,0000 O,l)1)1 7 0 ,(( 7 ~ () ,t)íl8~ 0,1 57 O ,M!1I I .~ (} ,7!1 ,' ~ O,I\! 11 0, e 08 0,8702 0,74 15 0,5842 0,4227 0,2793 0, 1117

O,, \) 7 O,, 80 0,'(24 0,( 7H4 0,( « 0,( 00(1 O,M ( I O, 985 0,956 1 0,888 0,7805 O, 405 O,4M, l) O , ,~ '7.1 1,0000 0,9998 0,9884 0,96 17 0,9067 0,8 164 0,6925 0,541, 1

1,0000 O,, 8 0, 88 0 ,( 57 O,, 878 n,1707 0,1)\1)0 1,0000 0,9976 0,9897 0,9685 0,9247 0,84 t 0,74 14

1,0000 0,9 99 0,9' 4 0, '80 0,« 1 O,IIM 0,9996 0,9978 0,99 17 0,9757 0,94 17 O,BHI I

1,0000 1,0000 O, 98 n, 9 3 O,I)IJlM 1.0000 0,9997 0,9983 0,9940 0,9825 0, 574

1,0000 1,0000 O,')(lqH 1,0000 0,9998 0,9989 0,996 1 O,9HH6

1,0000 1.0000 0,9999 0,9994 0, 97M 1,0000 0,9999 O,, ('7

0,'1 04 O, H24 0, 1422 0,0687 0,03 17 O,OJ 38 0,0057 0,0022 O,OOOH J,OOOO 1,0000

O,HH 1, 0,6590 0,4435 0,2749 0, 1584 0,0850 0,0424 0,0 196 O,OOM!

O,!IHO O,H8 1 0,7358 0,5583 0,3907 0,2528 0,1513 0,0834 0,0 I 1

0,6488 0,4925 0,3467 0,2253 0,1 VI~ 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,00 16 0,0005 O,I)()?8 O,, 744 0,9078 0,7946 0,8290 0,5490 0,3186 0,1671 0,0802 0,0353 0,0 142 0,0052 0,11 IK 0,< 957 0,9761 0,9274 0,8424 0,7237 0,5833 0,4382 0, , 0411

0,9638 0,81 59 0,6042 0,3980 0,2361 0,1268 0,0617 0,027 1

I ,ooon 0,< ( S 0,9954 0,9806 0,9456 0,8822 0,7873 0,6652 n, !I (11) 0,9945 0,9444 0,8227 0,6482 0,4613 0,2969 0.1 727 0,0905

O, 0, 993 0,996 1 0,9857 0,9614 0,9154 0,8418 0,7 1)\ 0,9994 0,9873 0,9383 0,8358 0,6865 0,5155 0,3519 0,2 173

1,0000 0,9999 0,9994 0 ,9972 0,9905 0,9745 0,9427 O,HHH \ 0,9999 0,9978 0,9832 0,9389 0,8516 0,7216 0,5643 0,40 2

0,9999 0,9996 0,9983 0,9944 0,9847 0,1 (, '1 1,0000 0,9997 0,9964 0,9819 0,9434 0,8689 0,7548 0,60 8 O, \lllr, 1,0000 1,0000 0,9994 0,9958 0,9827 0,9500 0,8868 0,7869 tI , 1II111

1,0000 1,0000 0,9998 0,9992 0,9972 0,\)1) 1 0,9999 0,9992 0,9958 0,9848 0,9578 0,9050 tI,tI')nl

1,0000 0,9999 0,9997 O,l)I)HI) 1,0000 0,9999 0,9992 0,9963 0,9876 0,9662 O,Il )lJI

1,0000 1,0000 n,(1)1)1) 1,0000 0,9999 0,9993 0,9972 0,9907 D,I) IIIH

1,0000 1,0000 0,9999 0,9995 0,998 1 O,IIM I 1,0000 0,9999 0,9997 0,1)11(1 \

0,5 1 3 0,2542 0.1 209 0,0550 0,0238 0,0097 0,0037 0,00 13 O,OOO~ 1,0000 1,0000 0,9 C( 0,1)1)1

0,8646 0,62 13 0,3983 0,2336 0,1267 0,0637 0,0296 0,0126 0,0041) 1,0000 1,0000 1,()(lOO

O, 755 0,8661 0,6920 0,5017 0,3326 0,2025 0,1132 0,0579 0,0 (¡I)

0,9969 0,9658 0,8820 0,7473 0,5843 0,4206 0,2783 0, 1686 O,O( () 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003

O, 997 0,9935 0,9658 0,9009 0,7940 0,6543 0,5005 0,3530 0,2 71) 0,8108 0,5147 0,2839 0.1407 0,0635 0,0261 0,0098 0,0033

1,0000 0,9991 0,9925 0,9700 0,9198 0,8346 0,7159 0,5744 0,4 (1M 0,9571 0,7892 0,5614 0,3518 0,1971 0,0994 0,0451 0,01 83

0,9999 0,9987 0,9930 0 ,9757 0,9376 0,8705 0 ,77 12 0,64\7 0,9930 0,9316 0,7899 0,5981 0,4050 0,2459 0,1339 0,0651

1,0000 0,9998 0,9988 0,9944 0,9818 0,9538 0,9023 0,82 1 0,9991 0,9830 0,9209 0,7982 0,6302 0,4499 0,2892 0,1666

0,9998 0,9990 0,9960 0,9874 0,9679 on O 0,9999 0,9967 0,9765 0,9183 0,8103 0,6598 0,4900 0,3288 1,0000 1,0000 0,9995 0,9944 0,9733 0,9204 0,8247 0,6881 0,5272

1,0000 0 ,9999 0,9993 0,9975 0,9922 0,t7117 0,9999 0,9989 0,9930 0,9729 0,9256 0,8406 0,7161

1,0000 0,9999 0,9997 0,9987 O, t) ~I ) 1,0000 0,9998 0,9985 0,9925 0,9743 0,9329 0,8577 0,744 1

1,0000 1,0000 0,9999 O,' l){)~ 1,0000 0,9998 0,9984 0,9929 0,977 1 0,941 7 0,8759 1,0000 I,OOO() 1,0000 0,9997 0,9984 0,9938 0,9809 0,95 14

1,0000 0,9997 0,9987 0,9951 0,985 1

Page 148: Libro Análisis de datos.pdf

O, I , ' ~ I 0,000" 0,000 1 0,0000 O,7~47 0,120" 0,0 10 , 0 ,00, I O,OOOX 0,000 0,93. !i O,70S4 0,0 162 0,0 170 O,OO!') !') O,OOI '! 0,( 8 8 0,8850 0, 1 2 0,059 1 O,()2~O 0,0077 O,u80 0, 48 0,67 0,2822 0, 1500 0,06' 6 0,0 xo

0,4 1 X 1 0,06 1 0,0225 0,0075 0,002 0,0007 O,()()() 0,0000 0,9998 0, 9 14 0,9463 0,8 6 0,47 9 0,2968 0, 162( 0,0777 0,71) 2 0,2525 0, 1182 0,050 1 0,0 19 0,0 67 0,00 I O,OOOr 1,0000 0,9983 0,9837 0,9324 0,6655 0,48 12 0,30BI 0, 1727 O,( 4t7 0,5 198 0, 096 0, 16 7 0,0774 0,0 27 O , O I 2 ~ 0,0011 0,9997 0,9959 0,9767 0,9225 0,8 180 0,6656 0,4878 0,. 1 (jI) O,()') 1 0,7556 0,5489 0,3530 0,20 19 0, 1028 0,0464 O,OI H 1 1,0000 0,9992 0,9933 0,9713 0,9161 0,8145 0,6675 0,11!J40 O,I IJHH 0,901 3 0,7582 0,5739 0,3887 0,2348 0, 1260 0,0 lin 0,9999 0,9984 0,9911 0,9674 0,9 125 0,8 1 9 0,671 0 O,I)I)!)I 0,968 1 0,8943 0,7653 0,5968 0,4 197 0,26 O 0,1111 1 1,0000 0,9997 0,9977 0,9895 0,9653 0,9 11 5 O,H I!'i! 1,0000 0,99 17 0,9623 0,8929 0,7752 0,6 188 0,447H O, IJO J 1,0000 0,9995 0,9972 0,9886 0,9648 0,9 1 !J

0,9983 0,989J 0,9598 0,8954 0,7872 0,6405 OA7 1 \ 0,9999 0,9994 0,9969 0,9884 O,%SH 0,9997 0,9974 0,9876 0,9597 0,9006 0,80 11 O,M 1I 1,0000 0,9999 0,9993 0,9969 0,1 H'I I 1,0000 0,9995 0,9969 0,9873 0,9617 0,908 1 O,H IMI 1,0000 0,9999 0,99 4 n,!)117

0,9999 0,9994 0,9968 0,9880 0,9652 0,11 1/1 1,0000 0,9 9' 0,(11)11 O,llII 1M J,OOOO 0,9999 0,9993 0,9970 0,9894 O,I)(II)(¡

1,0000 0,1)1)1)1) O,II¡)IJr, 1,0000 0,9999 0,9994 0, 9975 0,1)1) 1'1

1,0000 1,11111111 1,0000 0,9999 0,9995 O,')I)H 1 1,0000 0,9999 O,()I)II/

1,0000 1,0000 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 O,OO()O 0,0000 0,11111111 0,7358 0,3917 0,1756 0,0692 0,0243 0,0076 0,0021 0,0005 0,0001 0,0111111 0,9245 0,6769 0,4049 0,2061 0,0913 0,0355 0,01 2J 0,0036 0,0001 0,111111 '

0, 972 0, 1501 0,0536 0,0180 0,0056 0,0016 0,0004 0,0001 0,0000 0,9841 0,8670 0,6477 0,4114 0,2252 0, 1071 0,0444 0,0 160 O,O()4I) 0,0111 \ 0,7735 0,4503 0,2241 0,0991 0,0395 0,0142 0,0046 0,0013 O,O()O \ 0,9974 0,9568 0,8298 0,6296 0,4148 0,2375 0, 1182 0,0510 O,OI HI 0,94 19 0,7338 0,4797 0,2713 0,1353 0,0600 0,0236 0,0082 0,00 0,9997 0,9887 0,9327 0,8042 0,6172 0,4164 0,2454 0,1256 O,O!'i ,i .3 O,989 L 0,901 8 0,7202 0,5010 0,3057 0,1646 0,0783 0,0328 0,01 11 1,0000 0,9976 0,9781 0,9133 0,7858 0,6080 0,4166 0,2500 0, 1201 0,9985 0,9718 0,8794 0,7164 0,5187 0,3327 0,1886 0,0942 0,04 1 I 0,9996 0,9941 0,9679 0,8982 0,7723 0,6010 0,4159 0,2520 0, 9 98 0,9936 0,9581 0,8671 0,7175 0,5344 0,3550 0,2088 0,107/ 0,9999 0,9987 0,9900 0,9591 0,8867 0,7624 0,5956 0,4 14.1 1,0000 0,9988 0,9882 0,9487 0,8610 0,7217 0,5491 0,3743 0, H 1,0000 0,9998 0,9974 0,9861 0,9520 0,8782 0,7553 o,S' 14

0,9998 0,9973 0,9837 0,9431 0,8593 0,7283 0,5634 0, . '> 1 1,0000 0,9994 0,9961 0,9829 0,9468 0,8725 0,7507 1,0000 0,9995 0,9957 0,9807 0,9404 0,8609 0,7368 O,57'/X 0,9999 0,9991 0,9949 0,9804 0,9435 0,86 t

0,9999 0,9991 0,9946 0,9790 0,9403 0,8653 0,74" \ 1,0000 0,9998 0,9987 0,9940 0,9790 0,9420 1,0000 0,9998 0,9988 0,9939 0,9788 0,9424 0,H7 O 1,0000 0,9997 0,9985 0,9935 O,97H6

1,0000 0,9998 0,9986 0,9938 0,9797 0,9 11\ 1 1,0000 0,9997 0,9984 1,0000 0,9997 0,9986 0,9942 O,OH 1/ 1,0000 0,9997

1,0000 0,9997 0,9987 0,(1) ~ I 1,0000

1,0000 0,9998 O/I)I JO O,I)I)IJM

1,0000 0, ')1)1)1) 1,0000 I,OO()()

Page 149: Libro Análisis de datos.pdf

111 I I 11

" 1. .)

o, z 0,0 0,04 0,05 O, , , O, 0/0002 0,0002 0,0002 0,0002 0/0002 0/0002 0/O()02 0/(01) O/508O 0/5,1 0/5 19 0, 27 0/53 111 0,0003 0/000 0,000 0,000 0,000 0,0003 0,000 0,000\ 0,54 8 0,5478 0,5517 0/5557 0,55 6 0,56 6 0/5675 0/ 57 111 O/O()O5 0/0005 0,0004 0,0004 0,0004 0,0004 O,0()O4 0/000 I 0,5832 0,5871 0,59 10 0,5948 0,5987 0,6026 0,6064 0,6 10\ 0,nOO7 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,000 0,62 17 0,6255 0,6293 0,6331 0,6368 0,6406 0,644 O,64HO O,O()O 0/0009 0,0009 0,0008 0,0008 0,0008 0,0008 0/0110'/ O/M¡. 4 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6 08 0/6H44 O/O()1 3 0,001 0,0012 0,0012 0,001 1 0,0011 0,00 11 0,0010 0/(1) 15 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,71 57 0/7 1<) 0 0/001 H 0,0018 0,0017 0,00J 6 0,001 6 0,001 5 0,001 5 0,0011 0,7 7 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,75 17 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,002 1 0,00 O O/758O 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7H23 0,00. 4 ,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,00 ~ O/7H8 1 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8 106 0,0045 ,0044 0,0043 0,0041 0,0040 0,0039 0,00 8 0,00 17 O/!l 159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,836; 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,005 1 0,00411 0,84 13 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 O,H51)1) O,(10HO 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 O,OOill1 0/8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 O,HH IO 0/0 104 0,0 102 0,0099 0,0096 0,0094 0,0091 0,0089 O,OO W/ 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 O/Hi lO 7 0,0 136 0,0 132 0,0129 0,0125 0,0122 0,011 9 0,0116 0/011 I O/ ° 2 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9 147 0/1)1 11' 0,0 174 0,0 170 0,0166 0,0162 0,0158 0,0154 0,01 50 O,OI II!1 O, 192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,1) IOn 0,0222 0,02 17 0,0212 0,0207 0,0202 0,0197 0,0192 0,0 1 HH n, 332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,94 18 O/'JI 1I 0,028 1 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0 \11 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,95 15 0,9525 O ,IJ ~ \

0/0\ 111) 0,0 SI 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0. 0 1 0/9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,961 6 0,911 0,0 16 0,0436 0,0427 0,04J 8 0,0409 0,0401 0,0392 0,0384 0,0:\7'1 0/9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,969 O,9(jl)11 O,OIlIIH 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,046 1!j 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,<)7 (11 O/O(MI 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,057 1 0/9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,< HI O/OH08 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0( 1)11 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9H .~ 1 O/OI 6H 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 O , () H .~H 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,<JHR7 O/ II S I 0, 1 J 31 0,1112 0,1093 0.1075 0,1056 0.1038 0,1020 O, I()O \ 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,991 1 0,99 1,1 0,1 357 0,1335 0,1314 0,1292 0,1271 0,1251 0.1230 0, 1210 0,1 lOO 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9 34 O/ IS87 0,1562 0,1539 0,1515 0.1492 0,1469 0,1446 0,1423 0,1401 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,995 1 O, I/l4 1 0,1814 0.1788 0,1762 0,1736 0,1711 0,1685 0,1660 0, 16. ~ 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9c :3 O/2 11 ( 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0, IS94 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2 177 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0, 9( SO 0/2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,248 , 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,99/l6 O/I)I)HII O/ ~ ()8 5 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2/l 10 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,99' O 0,1)1)110 O , .~446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0, 15(, 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9 '3 0,1)111) \ 0,. R2 1 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0, 520 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 O ,I)I I I ) ~

0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0/1)1)1)1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,42H6 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9 7 O,I)I)IJH O, SOOO 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,468 1 0,9998 0,9998 9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,1) 1)1 ti

I 11 \' d OI ' 's ¡ nteriores representan la probabilidad de obtener valores de Z m i1 0 1 'l' 11 1 " res interiores representan la probabilidad de obtener valores de Z meno!" s () I 1I l. It IJIII I1 puntuación típica, «Z», definida por el cruce de la fila con la columna IlId I 111 llll la puntuación típica, «Z», definida por el cruce de la fila con la columna illd il' 11 1 dll ~ llIld() I ¡mal. Así, por ejemplo, la probabilidad de obtener puntuacion :; 111 ' 11111 • undo decimal. Así, por ejemplo, la probabilidad de obtener puntuacion s !TI ' 1101 I 11111 II1 1- 1/05 es 0,1469. Es decir peZ ~ - 1,05) = 0,1469. It's que 1,05 es 0,8531. Es decir peZ ~ 1,05) = 0,8531.

IJH

Page 150: Libro Análisis de datos.pdf

¡I('I' f ) uf

10 0,00 9 0, 158 ,84 15 0,3 5 0,5 10 0,727 1,000 1, 76 1,96 ,078 6,3 14

0,0506 0,1026 0, 2 107 4,6052 5,99 15 0,28 0,445 0,6 17 0,816 1,061 1,386 1,886 2, 20 4,30.1

0,2 158 0,35 18 0,5844 6,25 14 7,8 147 ( ,. 4H , 0, 277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 , 182

0,4844 0,7107 1,0636 7,7794 9,4877 11 ,14. ] 0, 27 1 0,414 0,569 0,741 0,94 1 1, 190 1,533 2,132 2,776

0,831 2 1,1455 1,6103 9,2364 11 ,Q705 12,8:125 0,267 0,408 0,559 0,727 0,920 1,1 56 1,476 2,0 15 2,57 1

1,2 73 1,6354 2,2041 10,6446 12,59 16 14,44 \14 0,265 0,404 0,553 0,71 8 0,906 1,134 1,440 1,943 2,447

1,6899 2,1673 2,8331 12,0 170 14,0671 16,O l 2H 0,263 0,402 0,549 0,711 0,896 1,11 9 1,415 1,895 2,365

2, 1797 2,7326 3,4895 13,3616 15,5073 17,5 45 0, 262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306

2,7004 3,3251 4,1682 14,6837 16,9 190 19,022H 0,261 0,398 0,543 0,703 0,883 1.100 1,383 1,833 2,262

,2470 3,9403 4,8652 15,9872 18,3070 20,4832 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,22/l

3,8 157 4,5748 5,5778 17,2750 19,6751 2 1,9200 1I , 1 2~ 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,20 1

4,4038 5,2260 6,3038 18,5493 21,0261 23,3367 11 , 1 H 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,1 79

4, 10 5,0088 5,8919 7,0415 19,8119 22,3620 24,7356 1I , I2H 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2, 160

4,6604 5,6287 6,5706 7,7895 21,0641 23,6848 26, 11 89 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2, 145 ,h 1

5,22 3 6,262 1 7,2609 8,5468 22,3071 24,9958 27,4884 0, 128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2, 1. 1 ,nO)

5,8 122 6,9077 7,9616 9,3122 23,5418 26,2962 28,8454 3 1,\)\)1)1) 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2, 120 2,IIH \

,4078 7,5642 8,67 18 10,0852 24,7690 27,5871 30,1910 . ,40H I 0, 128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,1 lO ,~CI 'I

7,0 149 8,2307 9,3905 10,8649 25,9894 28,8693 31,5264 34,HO I n, 127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2, 10 1 2,~

7,6327 8,9065 10,1170 11,6509 27,2036 30.1435 32,8523 36, l llOI) I n, 127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,0' ,.~ II I

8,2604 9,5908 10,8508 12,4426 28,4120 31,4104 34.1696 37,5M' n, 127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,!i H

8,8972 10,2829 11 ,5913 13,2396 29,6151 32,6706 35,4789 3H,\) \ 0, 127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,5 1H

H,M27 9,5425 10,9823 12,3380 14,0415 30,8133 33,9244 36,7807 40,.2HI)11 0, 127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,50H

1),2M)4 10,1957 11,6886 13,0905 14,8480 32,0069 35.1725 38,0756 4 I ,(1 .~H 1 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2.50()

1).HH62 10,8564 12,4012 13,8484 15,6587 33.1962 36,4150 39,3641 42,971)H 0, 127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,4(

1 () , .~ 197 11 ,5240 13,1197 14,6114 16,4734 34,3816 37,6525 40,6465 44,. 1I1 0, 127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485

11 , 1602 12,1981 13,8439 15,3792 17,2919 35,5632 38,8851 41 ,9232 45,64 17 0, 127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,47\)

II ,H076 12,8785 14,5734 16.1514 18.1139 36,7412 40,1133 43.1 945 46,' (1 1) 0, 127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473

12,46 1 13,5647 15,3079 16,9279 18,9392 37,9159 41,3371 44,4608 48,27H 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467

13, 12 11 14,2565 16,0471 17,7084 19,7677 39,0875 42,5570 45,7223 49,5H71l 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,46

13,7867 14,9535 16,7908 18,4927 20,5992 40,2560 43,7730 46,9792 50,89 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457

20,7065 22 .1643 24,4330 26,5093 29,0505 51,8051 55,7585 59,3417 63,690 I 0,126 0,255 0,388 0,529 0,681 0,851 1.050 1,303 1,684 2,02 1 2,42.

7,( '07 29,7067 32,3574 34,7643 37,6886 63.1671 67,5048 71,4202 76,1 5"1) 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,40

~~,5 45 37,4849 40,4817 43.1880 46,4589 74,3970 79,0819 83,2977 88,371)11 0,126 0,254 0,387 0,527 0,679 0,848 1.045 1,296 1,671 2,000 2, t o

'13,2752 45,4417 48,7576 51,7393 55,3289 85,5270 90,5312 95,0232 1 00,42~ 11II 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2, 8 1

51,17 19 53,5401 57.1532 60,3915 64,2778 96,5782 101.8795106,628611 2, HH 11 I 0,126 0,254 0,387 0,526 0,678 0,846 1,043 1,292 1.664 1,990 2,374

6l.7541 65,6466 69.1260 73,2911 107,5650 113,1453 118,1359124, 1 1 (l ~ 1 '11 0,126 0,254 0,387 0,526 0,677 0,846 1,042 1.291 1,662 1,987 2,368

70,0649 74,2219 77,9295 82,3581 118,4980 124,3421129,5612135,80/l / 1111 1 0,126 0,254 0,386 0,526 0,677 0,845 1,042 1,290 1,660 1,984 2, 64 ,(1 (,

1) 1111111 'I'OS interiores representan valores de la variable chi-cuadrado para una IlIlllllIlll lI(¡meros interiores representan valores de la variable T para una probabilidad I1IVIIOI 11

hllllll ' 1I (j 1' igual que la especificada, con g.l. grados de libertad. Por ejemplo, 0 11 10 1 I lue la especificada, con g.l. grados de libertad. Por ejemplo, con 10 g.l. la probu l 111 1, I

11111 ti IId n I de obtener valores menores o iguales que 15,9872 es 0,900. ob! ner valores menores o iguales que 1,372 es 0,900.

lOO 101

Page 151: Libro Análisis de datos.pdf

=

2 3 4 5 6 7 8

9 ¡.o

11 12 13 14 15 16 17 18 19 20

8,526 5,538 4,545 4,060 3,776 3,589 3,458 3,360

3,285 3,225 3,177 3,136 3,102 3,073 3,048 3,026 3,007 2,990 2,975 2,881

3,257 3,113 3,006 2,924 2,860 2,807 2,763 2,726 2,695 2,668 2,645 2,624 2,606 2,589 2,489 1393

9,162 5,391 4,191 3,619 3,289 3,074 2,924 2,813 2,728 2,660 2,606 2,560 2,522 2,490 2,462 2,437 2,416 2,397 2,380

2,961 2,806 2,693

2,605 2,536 2,480 2,434 2,395 2,361 2,333 2,308 2,286 2,266 2,249 2,142

57,240 9,293 5,309 4,051 3,453 3,108 2,883 2,726 2,611 2,522 2,451 2,394 2,347 2,307 2,273 2,244 2,218 2,196 2,176

58,204 9,326 5,285 4,010 3,405 3,055 2,827 2,668 2,551

2,461 2,389 2,331 2,283 2,243 2,208 2,178

5,266 3,979 3,368 3,014 2,785 2,624 2,505 2,414

2,342 2,283 2,234 2,193 2,158 2,128 2,102 2,079 2,058 2,040 1,92 1.S19

<~ -= - ~~

5,252 3,955 3,339 2,983 2,752 2,589 2,469 2,377 2,304 2,245 2,195 2,154 2,119 2,088 2,061 2,038 2,017 1,999 1,88-l L - -

5,240 5,230 5,184 3,936 3,920 3,844 3,316 3,297 3,207 2,958 2,937 2,836 2,725 2,703 2,595 2,56 1 2,538 2,425 2,440 2,416 2,298 2,347 2,323 2,201 2,274 2,248 2,123 2,214 2,188 2,060 2,164 2,138 2,007 2,122 2,095 1,962 2,086 2,059 1,924 2,055 2,028 1,891 2,028 2,001 1,862 2,005 1,977 1.83 1,984 1,956 1,814

2,555 2,383 2,255 2,155 2,076 2,011 1,958 1,912 1,873 1,839 1,809 1.783

5,160 3,8M 3,151 2,181 2,535 2.361 2,23 2,132 2,052 1,986 1,931 1,885 1,!H5

1,811 1,781

1.75 1,730 1.-

3,795 3.1';-

1,91S !.'JO.!

1.569 l.S2S 1.193

~--'~~

3.TI3

199,500215,707224,583230,162233,986236,768 238,883 240,543 241,882 248,013 250,095 25 1,143 25 1,774 252,196 ::=32=~

18,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371 19,385 19,396 19,446 19,462 19,471 19,476 19,

9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,660 8,617 8,594 8,581 8.5=

6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,803 5,746 5,717 5,699

6,608 5,786

5,987 5.143

5,591 4,737

5,318 4,459

5,117 4,256

5,409

4,757

4,347

4,066

3,863

4,965

4,844

4,747

4,667

4,600

4,543

4,494

4,451

4,414

4,381

4,351

4,171

4,001

3,920

4,103 3,708

3,982 3,587

3,885 3,490

3,806 3,411

3,739 3,344

3,682 3,287

3,634 3,239

3,592 3,197

3,555 3,160

3,522 3,127

3,493 3,098

3,316 2,922

5,192

4,534

4,120

3,838

3,633

3,478

3,357

3,259

3,179

3,112

3,056

5,050 4,950 4,876 4,818

4,387 4,284 4,207 4,147

3,972 3,866 3,787 3,726

3,687 3,581 3,500 3,438

3,482 3,374 3,293 3,230

4,772

4,099

3,677

3,388

3,179

4,735

4,060

3,637

3,347

3,137

3,326

3,204

3,106

3,025

2,958

2,901

3,217 3,135 3,072 3,020 2,978

3,095 3,012 2,948 2,896 2,854

2,996 2,913 2,849 2,796 2,753

2,915 2,832 2,767 2,714 2,671

2,848 2,764 2,699 2,646 2,602

2,790 2,707 2,641 2,588 2,544

4,558 4,496

3,874 3,808

3,445 3,376

3,150 3,079

2,936 2,864

4,464 4,444

3,774 3,754

3,340 3,319

3,043 3,020

2,826 2,803

2,774 2,700 2,661 2,63

2,646 2,570 2,531 2,507

2,544 2,466 2,426 2,401

2,459 2,380 2,339 2,314

2,388 2,308 2,266 2,241

2,328 2,247 2,204 2,178

~.29i

,lOO

3,007 2,852

2,965 2,810

2,928 2,773

2,895 2,740

2,866 2,711

2,690 2,534

2,741 2,657

2,699 2,614

2,661 2,577

2,628 2,544

2,591

2,548

2,510

2,47

2,447

2,538

2,494

2,456

2,494 2,276 2,194

2,450 2,230 2,148

2,151

2,104

2,063

2,026

1,99

1,792

1,594

1.~95

2,1 24 2,106

2,077 2,058

2,035 2,01 -

1,999 1,980

1,966 1.9-;6

1,761 l.i..;n

2,5 14

2.33-1 ,.26ó

2,412

2,378

2,348

2,165

1,993

1.910

2,191

2,155

2,1 24

1,932

1,748

1.659

2,107

2,071

2,039

1,841

1,649

1.5S-!

Los ~ imeriores c.orrespoOOen a)os valores Ge ~ Cd nm:;:;a-d.tr Y S

1,-

1 =~~ .--1,,~6-¡

I...E2

Page 152: Libro Análisis de datos.pdf

:::::

..JI

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

30

60

120

1

8,813

8,073

7,571

7,209

6,937

6,724

6,554

6,414

6,298

6,200

6,115

6,042

5,978

5,922

5,87 1

5,568

98,503

34,116

21,198

16,258

13,745

12,246

11,259

10,561

10,044

9,646

9,330

9,074

8,862

8,683

8,531

8,400

8,285

8,185

8,096

7,562

7,077

6,851

$ :

2 3 4 5 • , 39,355 39,373 39,381 39,398 39,

16,044 15,439 15,101 14,885 14,735 14,624 14,540 14,413 14,419 14,167

10,649 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,560

8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,329

7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,168

6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,467

6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 3,999

5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,667

5,456

5,256

5,096

4,965

4,857

4,765

4,687

4,619

4,560

4,508

4,461

4,182

4,826

4,630

4,474

4,347

4,242

4,153

4,077

4,011

3,954

3,903

3,859

3,589

4,468

4,275

4,121

3,996

3,892

3,804

3,729

3,665

3,608

3,559

3,515

99,000 99,1 66 99,249

30,817 29,457 28,710

18,000 16,694 15,977

13,274 12,060 11 ,392

10,925 9,780 9,148

9,547 8,451 7,847

8,649 7,591 7,006

8,022 6,992 6,422

7,559 6,552 5,994

7,206 6,217 5,668

6,927 5,953 5,412

6,701 5,739 5,205

6,5 15 5,564 5,035

6,359 5,417 4,893

6,226 5,292 4,773

6,112 5, 185 4,669

6,013 5,092 4,579

5,926 5,0 10 4,500

5,849 4,938 4,431

5,390 4,510 4,018

4,977 4,1 26 3,649

4,781 3.949 3.480

3,779

3,588

3,436

3,312

3,209

3,123

3,049

2,985

3,717

3,526

3,374

3,250

3,147

3,060

2,986

2,922

4,236

4,044

3,891

3,767

3,663

3,576

3,502

3,438

3,382

3,333

3,289

3,026

4,072

3,881

3,728

3,604

3,501

3,415

3,341

3,277

3,221

3,172

3,128

2,867

3,950

3,759

3,607

3,483

3,380

3,293

3,219

3,156

3,100

3,051

3,007

2,746

3,855

3,664

3,512

3,388

3,285

3,199

3,125

3,061

3,005

2,956

2,913

2,929 2,866

3,419

3,226

3,073

2,948

2,844

2,756

2,681

2,616

2,559

2,509

2,464

2,1 95

1,944

99,299

28,237

15,522

10,967

8,746

7,460

6,632

6,057

5,636

5,3 16

5,064

4,862

4,695

4,556

4,437

4,336

4,248

4,171

4,103

3,699

3,339

99,333

27,911

15,207

10,672

8,466

7,191

6,371

5,802

5,386

5,069

4,82 1

4,620

4,456

4,318

4,202

4,102

4,015

3,939

3,871

3,473

3,119

2,880 2,817

2,837 2,774

2,575 2,511

2270

2.1 57 1,825

99,356 99,374 99,388

27,672 27,489 27,345 27,229

14,976 14,799 14,659 14,546

10,456 10,289 10,158 10,051

8,260 8,102 7,976 7,874

6,993 6,840 6,719 6,620

6,178 6,029 5,911 5,8 14

5,6 13 5,467 5,351 5,257

5,200 5,057 4,942 4,849

4,886 4,744 4,632 4,539

4,640 4,499 4,388 4,296

4,441 4,302 4,191 4,100

4,278 4,140 4,030 3,939

4,142 4,004 3,895 3,805

4,026 3,890 3,780 3,691

3,927 3,791 3,682 3,593

3,841 3,705 3,597 3,508

3,765 3,631 3,523 3,434

3,699 3,564 3,.157 3,368

3.3(» 3,1 J3 3,067 2,979

~.953 1..S.!3 L,Ii! 2,632

... ::::=; 1~'; "2

Los números interiores corresponden a los valores rarl c:ieI denominador.. pO!'" ejempio. P F JC: $ 3,.3.';'':

8,461

6,227

5,065

4,362

3,894

3,560

3,311

3,118

2,963

2,83

2,732

2,644

2,568

2,502

2,-M5

2,394

2,349

2,OH

99,449

26,690

14,020

9,553

7,396

6, 155

5,359

4,808

4,405

4,099

3,858

3,665

3,505

3,372

3,259

3,162

3,077

3,003

2,938

2,549

2.198

"',033

1-1,Or

8,411

6,175

5,OL

l,309

3,840

3,505 3 - --

3,061

2,906

2,780

,67

,585

2,509

~~

2,333

2.2Si 7 ,009

99,466

g.mo 00,.3S1

3,soí

3.--.. _

3

rus :;,.;s

-~

1.%5

26,505 26.411

13,838 13,145 13~

9,379 9,291 '238

,229 7,143

5,992 5,908

5,1 98 5,116

4,649 4,56- ~.51 -

4,247 4,165 - ~.3

3,941 3,860 3..5

3,701 3,619 3, -

3,507 3,42- 3~

3,348 3,266 3~c

3,2 14 3,132 3.

3,101 3,018

3,003 2,91lJ

2,919 2.835 ~

2,844 2,.61 1.hl5

7m 1..IBS '" ~ :.,:..;;:

~-¿I -

~

- '''1:_ .

.:s...:...:c

~~

~

:E

.... =--

Page 153: Libro Análisis de datos.pdf

~ TABLA VII: DISTRIBUCIÓN F o.

PCFn n ~fn n )=0,995 l' 2 l' 2

Grados de libertad del numerador (n.)

2 3 4 5 6 7 8 9 10 20 30 40 50

16210,723 19999,500 21614,741 22499,583 23055,798 23437,111 23714,566 23925,406 24091 ,004 24224,487 24835,971 25043,628 25148,153 25211 ,089 25lli.U: :c:._¡ =:=:

2 198,501 199,000 199,166 199,250 199,300 199,333 199,357 199,375 199,388 199,400 199,450 199,466 199,475 199,480 199"'-r.

3 55,552 49,799 47,467 46, 195 45,392 44,838 44,434 44,126 43,882 43,686 42,778 42,466 42,308 42,213

4 31,333 26,284 24,259 23, 155 22,456 21,975 21,622 21,352 21,139 20,967 20,167 19,892 19,752 19,667 1'1 -

5 22,785 18,314 16,530 15,556 14,940 14,513 14,200 13,961 13,772 13,618 12,903 12,656 12,530 12.454

6 18,635 14,544 12,9 17 12,028 11,464 11 ,073 10,786 10,566 10,391 10,250 9,589 9,358 9,241 9,170

7

8

9

10

11

12

13

14

15

16

17

18

16,236 12,404 10,882 10,050 9,522 9,155 8,885 8,678 8,5 14 8,380 7,754 7,534 7,422 7.354

14,688 11,042 9,596 8,805 8,302 7,952 7,694 7,496 7,339 7,211 6,608 6,396 6,288 6,2n

13,614 10,107 8,7 17 7,956 7,471 7,134 6,885 6,693 6,541 6,4 17 5,832 5,625 5,519 5,454

12,826 9,427 8,081 7,343 6,872 6,545 6,302 6.116 5,968 5,847 5,274 5,071 4,966 4,902

12,226 8,912 7,600 6,881 6,422 6,102 5,865 5,682 5,537 5,418 4,855 4,654 4,551 4,488

11,754 8,5 10 7,226 6,521 6,071 5,757 5,525 5,345 5,202 5,085 4,530 4,331 4,228 4.165

11,374 8.186 6,926 6,233 5,791 5,482 5,253 5,076 4,935 4,820 4,270 4,073 3,970 3,908

11,060 7,922 6,680 5,998 5,562 5,257 5,031 4,857 4,717 4,603 4,059 3,862 3,760 3,698

10,798 7,701 6,476 5,803 5,372 5,071 4,847 4,674 4,536 4,424 3,883 3,687 3,585 3,513

10,575 7,514 6,303 5,638 5,212 4,9 13 4,692 4,521 4,384 4,272 3,734 3,539 3,437 3.3TI

10,384 7,354 6, 156 5,497 5,075 4,779 4,559 4,389 4,254 4,142 3,607 3,412 3,311 3.2~

10,218 7,215 6,028 5,375 4,956 4,663 4,445 4,276 4,141 4,030 3,498 3,303 3101 3.B

19 1 10,073 7,093 5,916 5,268 4,853 4,561 4,345 4,177 4,043 3,933 3,402 3.208 3,106 3,M'

20 9,944 6,986 5,818 5,174 4,762 4,472 4,257 4,090 3,956 3,847 3,318 3,113 3,021

30

60

120

9,180 6,355 5,239 4,623 4,228 3,949 3,742 3,580 3,450 3,344 2,823 2,618 131 ..

8,495

8,179

5,795

5.539

4,729

4,497

4,140

3,921

3,760

3.548

., 4-=.-

1-

.3

.i.L:E

~ ~

33:3::