61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

Embed Size (px)

Citation preview

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    1/27

    1

    - Ritchey, Ferris (2001) Estadstica para las ciencias sociales. El potencial de la

    imaginacin estadstica (Mxico D.F.: McGraw-Hill/Interamericana Editores) Captulo3: Grficos: una imagen dice ms que mil palabras y Captulo 4: Estimacin depromedios.

    CAPTULO 4ESTIMACIN DE PROMEDIOS

    Introduccin

    Todos estamos familiarizados con el concepto general de promedio, en situaciones talescomo una calificacin promedio, un ingreso promedio, una puntuacin promedio en elboliche o un promedio de bateo. Si alguien tiene un "promedio" de alguna manera-altura, peso, inteligencia, etctera- esta persona no es atpica. Poseer un promediosignifica ser como la mayora de las personas.

    En una distribucin de puntuaciones, un promedio caer entre las puntuacionesextremas -en alguna parte del rea media de la distribucin de puntuaciones-. Porejemplo, la mayora de los hombres no son demasiado altos o bajos; estn "sobre elpromedio". Llamamos a esta puntuacin tpica, promedio la tendencia central de lavariable. Un estadstico de tendencia central proporciona una estimacin de la

    puntuacin tpica, comn o normal encontrada en una distribucin de puntuaciones enbruto. Por ejemplo, las alturas de los hombres estadounidenses tienden a agruparsealrededor de cinco pies con ocho pulgadas, y los pequeos saludables pesan alrededor desiete libras al nacer. Si Bob tiene un promedio de 165 en el boliche, no esperamos que

    obtenga esa puntuacin exacta en cada juego, pero conseguir cercanamente esapuntuacin la mayora de las veces.

    Estadstico de tendencia centralEstadstico que proporciona una estimacin de la puntuacin tpica, comno normal encontrada en una distribucin de puntuaciones en bruto.

    Existen tres estadsticos de tendencia central comunes: la media, la mediana y lamoda. Por qu tres? Porque cada uno tiene fortalezas, pero tambin debilidadespotenciales, dependiendo de la forma particular de la distribucin de puntuaciones de

    una variable. Segn sea la forma de una distribucin, una medicin del promedio puederesultar ms exacta que otra, y, en ocasiones, informar cualquier estadstico detendencia central solo conducira a errores o no proporcionara informacin suficiente.

    La media

    La media aritmtica de una distribucin de puntuaciones (o, simplemente, la media)consiste en un estadstico de tendencia central que es familiar a cualquier estudiante quehaya calculado el promedio de las calificaciones en un examen para algn curso. Lamedia es la suma de todas las puntuaciones dividida entre el nmero de puntuacionesobservadas (es decir, el tamao de la muestra). Para calcular la media de una variable,

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    2/27

    2

    simplemente sumamos todas las puntuaciones y dividimos el resultado entre el tamaode la muestra.

    La mediaSuma de todas las puntuaciones dividida entre el nmero de puntuacionesobservadas (es decir, el tamao de la muestra).

    La media es el estadstico de tendencia central ms til. Con un clculo matem-tico rpido, ofrece un resumen de las puntuaciones tpicas o promedio en una distri-bucin. Puesto que emplea la operacin matemtica de divisin, la media se aplica a lasvariables de intervalo/ razn. Tambin puede calcularse para variables ordinales de tipointervalo; pero se debe tener cuidado en la interpretacin de los resultados.

    En frmulas matemticas, el smbolo convencional utilizado para representar el

    nombre de una variable es una letra mayscula. Las letras X y Y se emplean confrecuencia. Por ejemplo, podramos emplear X para simbolizar la edad, y Y para la altura.A menudo, Y se usa para la variable dependiente; y X, para la variable independiente. Porejemplo, pondramos Y = calificacin promedio (CP) de la universidad con el siguienteconjunto de variables predictoras: X1= calificacin promedio (CP) de la preparatoria, X2=puntuaciones en el examen de admisin a la universidad, X3 = habilidad en lacomprensin lectora, y X4= ao de escolaridad.

    Para una variable X, cualquier cosa que definamos, el smbolo para la mediacalculada con datos de la muestra es , que se llama "X barra". Por ejemplo, si X = edad,y la edad media de la clase de estadstica es 20.5 aos, decimos, "X barra es igual a 20.5aos". Recuerde especificar las unidades de medicin de la variable, en este caso, aos.

    La media se calcula como sigue ( se lee como "la suma de").

    Si hay 12 nios en una muestra, cuyas edades son 6,12, 5,10, 9,10, 8, 7, 9,11, 8 y10 aos, su edad media es

    6+12+5+10+9+10+8+7+9+11+8+10= ___ = ______________________________

    n 12

    105 aos= _________ = 8.75

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    3/27

    3

    aos12

    Tcnicamente, la media es 8.75 aos por nio; pero omitimos la unidad deldenominador. Conceptualmente, el valor de la media nos dice cules seran laspuntuaciones X en una muestra si cada sujeto de la muestra tuviera la mismapuntuacin. En el ejemplo anterior, 8.75 aos (es decir, ocho aos, nueve meses) sera laedad de cada nio si todos los nios tuvieran exactamente la misma edad. Es til,entonces, pensar en la media como una medicin de "partes iguales". Por ejemplo, siquisiramos saber la cantidad media de dinero en efectivo que llevan consigo los estu-diantes de un saln de clases, pondramos todo el dinero en efectivo en un recipiente y lodividiramos equitativamente. (Algn voluntario?) La cantidad que cada personarecibira sera el valor medio del dinero en efectivo. La media tambin puede serconsiderada como un punto de equilibrio, es decir, el punto en el cual se equilibran lasdiferencias entrela media de X y las puntuaciones individuales X en la distribucin. Enel captulo 5 ampliaremos esta nocin.

    Por ltimo, al calcular los estadsticos de tendencia central, particularmente lamedia, debe tenerse cuidado para no incluir las puntuaciones codificadas como casosperdidos. Al determinar la media slo se incluyen los casos "vlidos". Por ejemplo, si enuna muestra de 49 personas 2 no informaran sus edades, la suma de edades se dividiraentre 47 -el nmero de puntuaciones vlidas- en lugar de dividirla entre el tamao de lamuestra (49). Es ms, con archivos de computadora, debe tenerse cuidado de no sumarlos cdigos de "valor perdido" (como 99) a la suma de las puntuaciones.

    Pensamiento proporcional sobre la media

    Combinacin de las medias de dos muestras de tamao diferente. La media es elestadstico de tendencia central ms ampliamente usado. As, es importante quetengamos un buen sentido de proporcin respecto de su clculo. Primero, examinemosuna situacin donde se comete un error comn: combinar las medias de dos grupossumando las dos medias y dividiendo el resultado entre 2. [El nico momento en que noes un error es cuando los dos grupos tienen los mismos tamaos de muestra (es decir,cuando las n son iguales).] Por ejemplo, observe el nmero medio de das de vacacionespor ao (X) para el grupo 1, las ocho secretarias de un banco local, y para el grupo 2, lostres vicepresidentes. Para las ocho secretarias:

    X (grupo 1) 7 + 10 + 7 + 12 + 16 + 7 +14 + 10

    (grupo 1)=

    __________ =____________________________

    n (grupo 1) 8

    83 das= _______ = 10.38 das de

    vacaciones8

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    4/27

    4

    Para los tres vicepresidentes:

    X (grupo 2) 60 + 30 +30

    (grupo

    2)

    = __________ = ___________

    n (grupo 2) 3

    120das

    = _______ = 40.00 das devacaciones

    3

    Si calculamos incorrectamente la media de la oficina completa sumando estas dosmedias y dividiendo el resultado entre 2, obtendramos la respuesta errnea de 25.19das de vacaciones. El clculo correcto para esta media combinada es:

    X(grupo 1) + X(grupo2)

    (grupo 1 ms 2

    combinados)

    = __________________

    n(grupo 1) + n(grupo2)

    83 + 120 203= ________ = ____ = 18.45 das de

    vacaciones8 + 3 11

    Analizando un poco veremos que esta formulacin es equivalente a tratar a los 11empleados como una muestra. Para ejemplificar casos al "promediar" errneamente lasmedias de un grupo vase el apartado de "Insensatez y falacias estadsticas" al final deeste captulo.

    Encerrado en un promedio. Todos encontramos situaciones en las cuales nuestropromedio para un desempeo parece dirigirse a cierto nivel. No importa cuntomejoremos, el promedio parece estar encerrado. Por ejemplo, la media sirve para calcularpromedios en el boliche, las cuales van desde cero hasta 300. Brian practica bolichesemanalmente en una liga. Despus de 100 juegos su promedio es de 150 pinos porjuego. Qu puntuacin debe obtener en el prximo juego para subir su promedio 1punto?

    El pensamiento proporcional sobre un "promedio mvil" gua nuestros clculos dela media. Primero enfoqumonos en el denominador, n. Despus del juego 101, habr

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    5/27

    5

    aumentado de 100 a 101. El numerador, X, aumentar por la cantidad de lapuntuacin de Brian en el juego 101. La pregunta es: cunto debe aumentar X paraelevar su media a 151 pinos por juego?

    Quizs Brian se sienta defraudado al saber que debe alcanzar una puntuacin de251 en el juego 101, para levantar su promedio slo un punto! Por qu tanto?Determinemos la puntuacin total que Brian ha acumulado hasta el juego 100 con supromedio de 150. Esto se calcula resolviendo X en la ecuacin para la media:Puesto que

    X

    = ____ Entonces X =

    (n)( )n

    Puntuacin total de Brian despus de 100 juegos es:

    X(hasta el juego 100) = (n) ( ) = (100) (150) = 15.000 pinos

    Si su promedio debe incrementarse a 151, su X despus del juego 101 debe ser

    X(necesaria despus del juego 101)= (n) ( ) = (1001) (151) = 15.251 pinos

    La puntuacin que requiere en el juego 101 es la diferencia entre estas dos sumas de X:La puntuacin que Brian necesita para subir su promedio a 151 despus de 101 juegos

    = X(necesaria despus del juego 101) X(hasta el juego 100)= 15.251 15.000 = 251 pinos

    Esto significa que para que Brian eleve 1 punto su promedio, debe aumentar 1 punto enel juego 101 ms un punto extra para todos los 100 juegos previos. De hecho, si slorestan unas cuantas semanas de juego en la liga, el promedio de Brian est bastanteencerrado en este momento.

    Con un promedio mvil, el tamao de la muestra (n) aumenta regularmente con eltiempo en pequeos incrementos, tanto como tres juegos de boliche por semana, o tresturnos al bat por juego para los jugadores de la liga de bisbol profesional. Para elevar unpromedio, un jugador necesita igualar su promedio anterior ms algn valor. Conformela temporada contina, la cantidad de este ms algn sigue creciendo. De la mismaforma, sin embargo, es fcil mejorar un primer promedio en la temporada. Por ejemplo, siBrian obtiene 150 en el primer juego de la temporada, cunto tendr que conseguir enel segundo juego para elevar su promedio a 151? Por ltimo, esto resalta un puntoimportante respecto de la evaluacin exacta del desempeo de alguien en un puntodeterminado: es ms apropiado usar la media de juegos recientes en lugar de la de latemporada entera.

    Debilidades potenciales de la media:

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    6/27

    6

    situaciones en las que reportarla sola puede conducir a errores

    Cuando se reporta un estadstico de tendencia central, tendemos a suponer que su valores representativo de puntuaciones tpicas en la parte central de una distribucin. Enocasiones, sin embargo, cuando se informa la media puede conducir a errores alrespecto. ste es el caso porque el clculo de la media puede inflarse (aumentar) odesinflarse (disminuir) debido a puntuaciones o valores extremos. Puntuaciones muyaltas, o valores extremos positivos, inflan el valor de la media "agrandando" la suma de X(es decir, X) en el numerador de la frmula. Puntuaciones sumamente bajas en unadistribucin, o valores extremos negativos, desinflan el valor de la media "encogiendo"X. Por ejemplo, suponga que calculamos la cantidad media del dinero en efectivo quellevan 10 estudiantes. Idealmente, esta media debe indicarnos cul es la cantidad tpica.Pero suponga que un estudiante cobr un cheque por $400 y nuestro clculo es elsiguiente, donde X = la cantidad de dinero en efectivo de cada estudiante (parasimplificar, se redondea al dlar ms cercano):

    X 5+26+10+8+2+9+11+5+400= ____ = _________________________

    n 10

    $ 459= ________ = $ 45.90 = $

    4610

    Por obvias razones, esta media de $46 no representa la cantidad de dineropromedio tpico, o la tendencia central que los alumnos suelen portar en efectivo. Lamayora de los estudiantes tiene menos de $10, y reportar una media de $46 esengaoso.

    El clculo de la media se distorsiona por la presencia de un valor extremo. Paraobtener un sentido de proporcin sobre cmo se calcula la frmula de la media, examinela relacin entre el numerador (X) y el denominador (n). Cuando X es grande y n espequea, la media ser grande. Si X es grande debido a la presencia de uno o dosvalores extremos de alto valor, la media se "inflar" hasta un valor grande.

    Tenga presente que nuestro objetivo es usar estadsticos de muestras para estimar

    los parmetros de una poblacin. Si se reporta una media muestralinflada o disminuida,se presentar un resumen distorsionado de las puntuaciones que obtienen los sujetos enuna poblacin. Esta limitacin de la media es un problema especial con muestraspequeas; cuanto menor sea la muestra, mayor ser la distorsin que genere un valorextremo. Por ejemplo, calcule la edad media de la siguiente muestra de cinco estudiantesde la universidad local, donde un estudiante en la muestra tiene una edadextremadamente alta: 19, 19, 20, 21 y 54 aos. La respuesta dejar la impresin de queesta muestra est bastante arriba de la edad tpica en la universidad, cuando, de hecho,cuatro de los cinco estudiantes tiene la edad tpica. Tambin observe lo que sucedecuando existe una puntuacin sumamente baja, como con esta muestra de edades: 8,19, 19, 20 y 21 aos. En tales casos, los valores extremos deben eliminarse, y la media

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    7/27

    7

    debe calcularse de nuevo sin ellos. Al informar esta "media ajustada", notamos por quse realiz el ajuste.

    En cualquier momento que calculamos una media, en especial con una muestrapequea, primero examinamos la distribucin de frecuencias de la puntuacin en brutopara los valores extremos. Un recurso prctico para esto es un grfico de caja (captulo3). Ya que la media es ms til que la mediana y la moda, ajustamos a menudo laspuntuaciones en una distribucin para reducir los efectos de los valores extremos en suclculo. Los efectos distorsionantes de los valores extremos se mencionan a lo largo deltexto.

    La mediana

    La mediana(Mdn) es la puntuacin de la mitad en una distribucin ordenada-aquel valorde una variable que divide la distribucin de las puntuaciones por la mitad, la

    puntuacin por arriba de la cual queda la mitad de los casos y por debajo queda la otramitad-. Por ejemplo, si la media del ingreso de los hogares en la ciudad Combelt es$26.000, la mitad de los hogares en esta ciudad tienen ingresos mayores a $26.000; y laotra mitad, ingresos menores a $26.000. Conceptualmente, la mediana es un punto delocalizacin -la puntuacin de la mitad-. La mediana trae a colacin una posicingeogrfica entre reas iguales, como la mediana de una carretera. La puntuacinmediana tambin es igual al percentil 50, el punto en el que 50 por ciento de lasobservaciones caen debajo. Entre los tres estadsticos de tendencia central, la mediana esms til cuando una distribucin est sesgada (es decir, tiene pocas puntuaciones haciaun lado). Por ejemplo, la mediana del precio de las ventas recientes de viviendas es

    preferible a la media del precio, porque unas cuantas ventas de alto precio incrementarael valor de la media.

    La medianaPara una variable ordinal o de intervalo/ razn, la puntuacin de la mitaden una distribucin ordenada, la puntuacin por arriba de la cual queda lamitad de los casos y por debajo queda la otra mitad.

    Para calcular la mediana de una distribucin, primero deben ordenarse laspuntuaciones para una variable X; es decir, las puntuaciones deben colocarse en orden

    de tamao, de menor a mayor o de mayor a menor. Divida el tamao de la muestra nentre 2 para acercarse a la puntuacin de la mitad en la distribucin. Si n es un nmeroimpar, la mediana ser un caso real en la muestra. Suponga, por ejemplo, que tenemosuna muestra de cinco familias con los siguientes ingresos mensuales (X):

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    8/27

    8

    El ingreso mediano es $7 350, el valor de X para la tercera puntuacin ordenada.Si n es un nmero par, la mediana se localiza entre las dos puntuaciones de la

    mitad y se calcula tomando la media de esas dos puntuaciones. Por ejemplo, si una sextafamilia, con un ingreso de $20.000, se inserta en la muestra anterior,

    La mediana se sita entre el tercero y cuarto casos. Se calcula sumando laspuntuaciones de $7 350 y $9 860 y dividiendo entre 2.

    Con una muestra pequea, localizar la mediana se vuelve una tarea directa. Conuna muestra grande (y con la ayuda de un programa de cmputo), la mediana se localizamatemticamente dividiendo el tamao de la muestra entre 2 y sumando .5. Observe queeste resultado da la ubicacin ordenadade la mediana, no la mediana en s. Ordene laspuntuaciones, y luego cuente hasta esta posicin. La puntuacin X en esta posicin es lamediana. Despus de encontrar la mediana, vuelva a revisar verificando si su respuesta,de hecho, divide los casos por la mitad. La mediana puede usarse con variables deintervalo/ razn, as como con variables ordinales. Finalmente, no confunda la mediana

    con otro estadstico llamado rango medio, que es el punto a la mitad entre los valoresmnimo y mximo de X.

    Clculo de la mediana (Mdn)1. Ordene la distribucin de puntuaciones de menor a mayor.2. Ubique la posicin de la mediana. Divida el tamao de la muestra, n,entre 2 para ubicarse cerca de la puntuacin que est a la mitad en ladistribucin. Si n es un nmero impar, la mediana ser un caso real en lamuestra. Si n es un nmero par, la mediana se localizar entre las dospuntuaciones que estn a la mitad, y se calcular tomando la media de esas

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    9/27

    9

    dos puntuaciones.(Matemticamente, la posicin de la mediana se encuentra dividiendo eltamao de la muestra entre 2 y sumando .5.)

    Debilidades potenciales de la mediana:situaciones en las que reportarla sola puede conducir a errores

    La mediana se basa en la ubicacin ordenada de puntuaciones en una distribucin. Esinsensible a los valores de las puntuaciones en una distribucin; es decir, sin tener encuenta los valores de X que la rodean, la mediana es la puntuacin de la mitaddeterminada por el nmero de puntuaciones (n) en la muestra. Por ejemplo, lassiguientes dos distribuciones de puntuaciones en un examen tienen la misma mediana;aunque estn compuestas de puntuaciones muy diferentes.

    Afirmar que la calificacin promedio del examen en ambas clases es 77 seraimpreciso porque sugiere que las dos tuvieron igual desempeo. (De hecho, el aula 2 lohizo mucho mejor, con una medio de 83.6, comparado con una media de 65.2 para el

    aula 1.) La mediana no se afecta por los valores de X.Mientras es insensible para valores de las puntuaciones, la mediana es sensible a(o afectada por) cualquier cambio en el tamao de la muestra. Por ejemplo, suponga queen el aula 1 dos estudiantes hacen el examen tarde; lo realizan mal, que es tpico deestudiantes que llegan tarde a una evaluacin. Cuando sus puntuaciones se incluyen enla distribucin, la mediana cambia drsticamente de 77 a 51:

    Aula 1(incluye las puntuaciones tardas):

    34, 36, 39, 51, 77,78, 81

    Mdn

    La mediana, entonces, tiene dos debilidades potenciales: l) es insensible a losvalores de las puntuaciones en una distribucin, y 2) es sensible a (o afectada por)cualquier cambio en el tamao de la muestra. Antes de reportar la mediana asegrese deque ninguna de estas debilidades potenciales lo llevar a conclusiones errneas.

    La moda

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    10/27

    10

    La moda (Mo) es la puntuacin que ocurre con mayor frecuencia en una distribucin.Conceptualmente, la moda es la puntuacin "ms popular". La tabla 4-1 presenta ladistribucin de edades para una muestra de estudiantes universitarios. La moda es 19aos porque la mayora de las personas (49 de ellas) tiene esta edad. Note que la moda esuna puntuacin X (19 aos), nouna frecuencia,f(49 casos).

    La modaPuntuacin que ocurre con mayor frecuencia en una distribucin.

    Clculo de la moda (Mo)1. Compile las puntuaciones en una distribucin de frecuencias.2. Identifique la moda, que es el valor de X con la mayora de los casos (esdecir, la mayor frecuencia,f).

    TABLA 4-1La distribucin de edades para una muestra de 125 estudiantes universitarios

    Especificaciones ClculosEdad f Porcentaje18 31 24.8%

    Mo 19 49 39.220 20 16.021 18 14.422 7 5.6

    Total 125 100.0%

    Una nota precautoria. No confunda la moda (la "puntuacin que ocurre con mayorfrecuencia") con la "mayora de las puntuaciones". Una mayora simple sera "ms de lamitad" 0 50 por ciento de los casos en una muestra ms por lo menos, uno. Observe queen esta distribucin, aunque la puntuacin que ocurre ms frecuentemente es 19 aos,la mayora de la muestra no tiene 19 aos, slo 39.2 por ciento de la muestra tiene esaedad. Ninguna edad en esta distribucin tiene una mayora.

    La moda es til con variables de todos los niveles de medicin. La moda es fcil dereconocer en grficos. En un grfico de pastel, es la categora con la rebanada msgrande; en un grfico de barras, la barra ms alta; en un histograma, la columna ms

    alta; y en un polgono, la puntuacin del punto ms alto, o el pico.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    11/27

    11

    Debilidades potenciales de la moda:situaciones en las que reportarla sola puede conducir a errores

    En general,por s mismala moda es el estadstico de tendencia central menos til porquetiene un alcance informativo limitado. Mientras identifica la puntuacin que ocurre msfrecuentemente, no sugiere nada sobre las puntuaciones que ocurren alrededor de este

    valor de la puntuacin. As, la moda es muy til cuando se presenta en conjuncin con lamediana y la media. Como veremos ms adelante, reportar los tres estadsticos detendencia central es bastante informativo.

    La moda puede ser engaosa cuando se usa sola porque es insensible tanto a losvalores de las puntuaciones en una distribucin como al tamao de la muestra. Estosignifica que usted puede tener cualquier nmero de distribuciones con formastotalmente diferentes, y aun todas podran tener la misma moda, como se ilustra en lafigura 4-1.

    Existe al menos una situacin en la cual la moda es un estadstico de tendenciacentral apropiado por s mismo e informar la media y la mediana es confuso. Esto ocurrecuando las puntuaciones de X son en esencia del mismo valor para todos los casos,

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    12/27

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    13/27

    13

    Puesto que cada uno de los tres estadsticos de tendencia central tiene debilidadespotenciales, vale la pena observarlos como un conjunto de estadsticos que se van ainterpretar juntos. Estos tres estadsticos son especialmente tiles cuando se examinande manera grfica. Una forma imaginativa de entender la relacin entre estos tresestadsticos consiste en localizar los valores de cada uno en una curva de distribucin defrecuencias.

    Una curva de distribucin de frecuencias es un sustituto de un histograma defrecuencias o polgono, donde reemplazamos estos grficos con una curva suavizada. Estasustitucin es apropiada porque la curva suavizada no se ve tanto como una ilustracinde la distribucin de la muestra, sino ms bien como una estimacin de la manera enque se distribuyen las puntuaciones en la poblacin. Como con un histograma, laspuntuaciones de una variable se ilustran de izquierda (el ms bajo) a derecha (el msalto); es decir, las puntuaciones se ordenan sobre el eje horizontal. El rea bajo unacurva de distribucin de frecuencias representa el nmero total de sujetos en la poblaciny es igual a una proporcin de 1.00 o a un porcentaje de 100 por ciento. Nuestra

    preocupacin est en evaluar la forma de una distribucin y examinar las ubicacionesrelativas de la media, la mediana y la moda, para estimar la forma de una distribucin de

    frecuencias.

    Curva de distribucin de frecuenciasUn sustituto de un histograma de frecuencias o polgono dondereemplazamos estos grficos con una curva suavizada. El rea bajo la curvarepresenta el nmero total de sujetos en la poblacin y es igual a una

    proporcin de 1.00 o a un porcentaje de 100 por ciento.

    La figura 4-2 presenta tres formas muy comunes de curvas de distribucin defrecuencias de puntuaciones. Como con nuestros histogramas, el eje horizontal de lascurvas representa las puntuaciones de una variable X. El eje vertical (el cual a menudono nos molestamos en dibujar) representa la frecuencia proporcional o frecuenciaporcentual; as, la altura de la curva en cualquier valor de X representa la proporcin deuna muestra o poblacin con esa puntuacin.

    La distribucin normal

    Una distribucin normal es aquella donde la media, la mediana y la moda de unavariable son iguales entre s y la distribucin de las puntuaciones tiene forma de campana.Tambin nos referimos a esto como una "curva normal". La figura 4-2A ilustrapuntuaciones de CI, que estn normalmente distribuidos con una media de 100. Unadistribucin normal es simtrica (es decir, equilibrada en cada lado). Su media, medianay moda se localizan en el centro de la distribucin. La presencia de la mediana aquasegura la simetra porque, por definicin, la mediana divide por la mitad unadistribucin ordenada de puntuaciones. Puesto que la moda est en el punto central deuna distribucin normal, el pico de la curva se localiza all.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    14/27

    14

    Distribucin normalCurva de distribucin de frecuencias donde la media, la mediana y la modade una variable son iguales entre s y la distribucin de las puntuacionestiene forma de campana.

    Distribuciones sesgadas

    Una distribucin sesgadaes aquella en la cual la media, la mediana y la moda de unavariable son desiguales y muchos de los sujetos tienen puntuaciones sumamente altas obajas. Cuando ste es el caso, la distribucin se alarga hacia un lado, como la hoja deuna espada o de una brocheta (skewer); de ah el nombre de sesgada (skewer) (figura4-2B y C).

    Distribucin sesgadaCurva de distribucin de frecuencias aquella en la cual la media, la medianay la moda de una variable son desiguales y muchos de los sujetos tienenpuntuaciones sumamente altas o bajas.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    15/27

    15

    Las posiciones de la media, la mediana y la moda son predecibles para las curvasde distribucin sesgadas. Un sesgo a la derecha (o positivo) tiene puntuacionesextremas en el final alto o positivo de la distribucin de puntuaciones (figura 4-28). Porejemplo, el ingreso familiar en Estados Unidos est sesgado positivamente; la mayora delas familias ganan bastante dinero; pero pocas son sumamente ricas. Las puntuacionesextremas altas inflan la media, "jalndola' en direccin positiva. La moda es la medida detendencia central con la menor puntuacin calculada. La mediana ser igual a la media ola moda o, ms probablemente, caer entre stas.

    El sesgo a la izquierda (o negativo)tienepuntuaciones extremas en el final baja onegativo de la distribucin de puntuaciones (figura 4-2C). Por ejemplo, las puntuacionesdel examen en un curso del ltimo ao en la universidad tienden a estar sesgadas a laizquierda. La mayora de los estudiantes de ltimo ao obtiene altas puntuaciones; peropocos se quedan en la direccin negativa. Estas pocas puntuaciones extremas bajasdesinflan la media, jalndola en la direccin negativa. La moda es la mayor puntuacincalculada, y la mediana cae entre la media y la moda.

    Ya sea con un sesgo a la izquierda o la derecha, si la mediana no cae entre lamedia y la moda, esto sugiere que la distribucin est singularmente formada. Unadistribucin as es una distribucin bimodal, la cual tiene dos modas o picos.

    Por ejemplo, la variable peso para una muestra que incluye a hombres y mujeresproducira una distribucin bimodal, con la moda ms alta que resulta del hecho de queen promedio los hombres son ms pesados que las mujeres (figura 4-3).

    Uso de datos de una muestra para estimar la forma de una distribucin de

    puntuaciones en una poblacin

    Al calcular estadsticos de tendencia central e histogramas para datos de una muestra,los datos para una variable con frecuencia aparecen ligeramente sesgados. Esto nogarantiza, sin embargo, que las puntuaciones de la variable estn sesgadas en la

    poblacin de la que se tom la muestra. El sesgo en los datos de la muestra puededeberse al error muestral. En otras palabras, una segunda muestra de la poblacinparecera normal o ligeramente sesgada en la otra direccin.

    Los estadsticos de sesgo se emplean para determinar si los datos de la muestraestn tan sesgados que sugieren que las puntuaciones de la poblacin estn sesgadas.No vamos a calcular un estadstico de sesgo a mano. Los programas de cmputo, sin

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    16/27

    16

    embargo, proporcionan estadsticos de sesgo, y uno comn est disponible con lasaplicaciones de cmputo opcionales que acompaan este texto. Cuando el valor absolutode este estadstico de sesgo (su valor ignorando el signo de ms de menos) es mayor que1.2, la distribucin podra estar significativamente sesgada, dependiendo de la forma dela distribucin, as como del tamao de la muestra. Unos pocos valores extremos en unamuestra grande tendrn poco efecto en los estadsticos. Si el valor absoluto de esteestadstico de sesgo es mayor que 1.6, sin embargo, sin importar el tamao de lamuestra, la distribucin probablemente est sesgada; entonces informar la media de X dela muestra como un estimado de la media de la poblacin sera engaoso, a causa de ladistorsin potencial de la media por las puntuaciones extremas. Aparte de la cuestin dedescribir con precisin la forma de una distribucin, el sesgo es una preocupacin con laestadstica inferencial. Como veremos en captulos posteriores, al probar una hiptesissobre la relacin entre dos variables, una variable sesgada exige trabajo adicional paraevitar conclusiones incorrectas. Se identificarn tales casos conforme se encuentren.

    Como veremos en el captulo 5, cuando una distribucin no est sesgada o de otramanera tenga una forma particularmente extraa, la media es el estadstico de tendenciacentral a elegir. Esto es especialmente vlido para reportes dirigidos al pblico engeneral, cuyos miembros pueden sentirse abrumados con ms de una estadstica. Sinembargo, si una distribucin est sesgada, la mediana es el estadstico que debereportarse. La mediana minimiza el error al describir una distribucin sesgada, porquecae entre la media y la moda, como se ilustra en la figura 4-2B y C. Como la ms centralde los tres estadsticos, la mediana es el mejor de las tres pobres opciones para unadistribucin sesgada, cuando slo un estadstico debe reportarse.

    Para audiencias cientficas, las distribuciones sesgadas se registran informando los

    tres estadsticos de tendencia central y quizs incluyendo una grfica para transmitir conprecisin la forma de la distribucin. A veces una distribucin sesgada es muyinformativa. Por ejemplo, las estancias en el hospital estn positivamente sesgadas. Enun ao dado, la mayora de las personas no pasan algn da o pasan muy pocos en elhospital. Pero un porcentaje sustancial pasa mucho tiempo, y unos pocos "se sesgan" alpermanecer semanas o meses en el hospital. Tal sesgo estimula la reflexin sobre lospredictores de estancias largas. Puede pensar en hiptesis que expliquen el sesgo deestancias en el hospital?

    Como veremos en el captulo 5, en general, la media es el estadstico de tendenciacentral ms valioso, ya que permite mayor flexibilidad en los clculos matemticos.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    17/27

    17

    En la mayora de los casos, la mediana y la moda representan callejones sin salidaporque no ofrecen operaciones matemticas adicionales que valgan la pena. Se gana pococon informarlas. Siempre que es posible, la media es la medicin sumaria que debeusarse, sobre todo, con estadsticas inferenciales. Debido a esto, a menudo ajustamosdistribuciones sesgadas para "hacerlas normales", de manera que podamos usar lamedia. Se discuten las especificaciones de este tipo de control del error ms adelante eneste texto. La tabla 4-3 resume las propiedades de los tres estadsticos de tendenciacentral.

    Organizacin de los datos para calcularestadsticos de tendencia central

    Existen dos formatos comunes para organizar datos y calcular estadsticos de tendenciacentral en tales datos. Un formato es una tabla desglosada de la distribucin depuntuaciones en bruto. Como se indic en el captulo 2, un formato de tabla desglosada,por lo comn se utiliza para la captura de datos en la computadora, pero dichos formatoscomnmente tambin son usados por las empresas, los gobiernos y grupos comunitariospara mantener los registros de la organizacin. Los programas de cmputo de hoja declculo, como Lotus 1-2-3.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    18/27

    18

    Excel y Corel Quattro Pro, estn diseados especialmente para tal propsito. Estosformatos de hoja de clculo evolucionaron a partir de la manera lgica como resolvemosproblemas a mano -simplemente listando las puntuaciones de una variable en unacolumna.

    El segundo formato comn para realizar clculos es un formato de distribucin defrecuencias. En ste, se listan las puntuaciones de una variable en una columna, y lafrecuencia de cada puntuacin en otra (como las distribuciones de frecuencias en elcaptulo 2). Este formato es tpico de los listados de resultados de computadora. Ahoraresolvamos un problema simple utilizando ambos formatos.

    Formato desglosado para calcular los estadsticos de tendencia central

    Suponga que estamos interesados en saber qu tan a menudo los estudiantes decinematografa en un departamento de comunicaciones de la universidad estudian sudisciplina asistiendo a pelculas de estreno. Recolectamos una muestra aleatoria de 19estudiantes. Le pedimos a cada uno nombrar las nuevas pelculas que vieron en cines enel ltimo mes y registramos los siguientes resultados: 2, 6, 4, 5, 2, 3, 4, 3, 6, 4, 3, 3, 5, 4,5, 2, 3, 4, 3. La tabla 4-4 presenta estos datos en un formato desglosado con los clculosnecesarios para calcular la media. Las puntuaciones se ordenan para facilitar el clculode la mediana y la moda.

    Primero, calculamos la media:

    fX 72

    = _____ = ____ = 3.79pelculasn 19

    TABLA 4-4Datos organizados en un formato desglosado:nmero de pelculas de estreno vistas en el ltimo mes (X)

    Nmero delsujeto

    Iniciales delsujeto

    X

    1 BH 22 KP 23 JN 24 TW 35 JD 36 WA 37 KM 38 BC 39 CR 410 ML 411 MW 4

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    19/27

    19

    12 MF 413 JS 414 BY 415 LL 516 WF 517 CM 518 BL 619 SH 6N = 19 X = 72

    pelculas

    Segundo, calculemos la mediana. Ya ordenamos las puntuaciones, ya que esnecesario para calcular la mediana. El tamao de la muestra (n =19) dividido a la mitades de aproximadamente nueve casos, y como n es impar, determinamos que el dcimocaso es la mediana. En la tabla desglosada contamos hacia abajo al dcimo caso ydescubrimos que la mediana son cuatro pelculas:

    Mdn = 4 pelculas

    Por ltimo, calculamos la moda. La observacin de los datos ordenados en la tabla4-4 revela que la puntuacin que ocurre con mayor frecuencia es 4:

    Mo = 4 pelculas

    Obviamente, emplear una tabla desglosada para hacer clculos a mano con ungran nmero de casos sera difcil de manejar. Una manera ms fcil de organizar losdatos es usar un formato de distribucin de frecuencias.

    Formato de distribucin de frecuencias para calcular estadsticos de tendenciacentral

    La tabla 4-5 presenta los mismos datos de los 19 estudiantes de cinematografa, pero usaun formato de distribucin de frecuencias. Trabajando a partir de la tabla desglosada dela tabla 4-4 (como lo hara una computadora), en la tabla 4-5 observamos que hay unafrecuencia de tres estudiantes que reportan dos pelculas, cinco reportan tres pelculas, y

    as sucesivamente.Primero, calculemos la media, para hacerlo, multiplicamos cada puntuacin por sufrecuencia. Esto es equivalente a sumar las puntuaciones individuales listadas en elformato desglosado de la tabla 4-4. En ambos formatos, la suma de puntuaciones es 72pelculas, y as la media resulta 3.79 pelculas:

    fX 72= _____ = ____ = 3.79

    pelculasn 19

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    20/27

    20

    Segundo, calculemos la mediana. Las puntuaciones en la distribucin de frecuen-cias ya estn ordenadas. La posicin se determina de la misma manera como en elformato desglosado y sigue siendo el dcimo caso. Para localizar el dcimo caso,calculamos la frecuencia acumulativa, que es el nmero de casos en o debajo de unapuntuacin de la distribucin (captulo 2). Vemos que el dcimo caso en la distribucines uno de los seis estudiantes que reportaron cuatro pelculas. As:

    Mdn = 4 pelculas

    Por ltimo, el clculo de la moda es bastante fcil con el formato de distribucin defrecuencias. En la tabla 4-5 simplemente observamos la columna que lista lasfrecuencias (es decir, la columna f) y notamos qu puntuaciones ocurrieron con lafrecuencia ms alta. Ms estudiantes (seis de ellos) vieron cuatro pelculas que cualquierotro nmero de pelculas durante el ltimo mes:

    Mo = 4 pelculas

    TABLA 4-5Datos organizados en un formato de distribucin de frecuencias:nmero de pelculas de estreno vistas el ltimo mes (X)

    Especificaciones ClculosX f f(X) f

    acumulativa2 3 6 3

    3 5 15 84 6 24 145 3 15 176 2 12 19

    n = 19 f(X) = 72 pelculas

    INSENSATEZ Y FALACIAS ESTADSTICASMezcla de subgrupos en el clculo de la media

    Debido a que la media es susceptible de distorsin por valores y puntuaciones extremos,

    debemos describir claramente qu casos o qu sujetos se incluyen en su clculo.Organizaciones tales como empresas e instituciones escolares, intencionalmente o no,por lo comn informan medias que son irreales. Por ejemplo, el vocero de un distritoescolar pblico puede informar que el sueldo medio de sus maestros es $45.000. Cuandoesto ocurra, los maestros probablemente se reunirn en el aula de descanso de lafacultad y se preguntarn entre s: Quin entre nosotros gana tanto dinero? Porsupuesto, los maestros no son tontos. Ellos saben de inmediato que quien realiz losclculos "mezcl los rangos de estatus", incluyendo al personal de mayor salario -comoconsejeros acadmicos, auxiliares de los directores y directores- todos ellos estncertificados como docentes pero rara vez dan clases. Estos administradores quiz hayan

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    21/27

    21

    sido incluidos porque el "estadstico" simplemente pidi a la computadora calcular elsueldo medio para todos los maestros certificados sin tener en cuenta el rango. Cuandose incluy este personal bien pagado, sus altos sueldos sesgaron la media. Para evitar talinsensatez estadstica, deben informarse por separado las medias para subgruposdistintos.

    Mezclar rangos de estatus en ocasiones resulta en una media que no se ajusta aningn grupo. Por ejemplo, una compaa puede tener slo dos rangos de empleados:obreros que promedian cerca de $30.000 dlares al ao, y gerentes que promedian cercade $70.000 dlares al ao. Si estos dos grupos son aproximadamente del mismo tamao,el sueldo medio para la compaa entera estara cercano a $50 000. Curiosamente,ningn empleado en la compaa gana un sueldo cercano a esa cantidad.

    Otro ejemplo es la edad media de asistentes en una clase nocturna de tercer gradoen una escuela primaria. La edad media se calcular en 20 aos ms menos, aunquetodos ah tendrn ocho o nueve aos (los nios) o alrededor de treinta (los padres). Lamedia es ciertamente impropia para resumir esta distribucin de edades.

    Frmulas en el captulo 4

    Clculo de la media:Para trabajar con una tabla desglosada:

    X= ___

    n

    Para trabajar con una distribucin de frecuencias:

    fX= ____

    n

    Clculo de la media combinada de dos grupos (a partir de puntuaciones individuales):

    X(grupo 1) + X(grupo 2)

    (grupo 1 ms 2

    combinados)

    = ___________________

    n(grupo 1) + n(grupo 2)

    Clculo de la media combinada A-4

    X

    Ya que=

    ____ X = (n) ( )

    n

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    22/27

    22

    Sustituya para obtener:

    n(grupo 1) (grupo 1)+ n(grupo 2) (grupo2)

    (grupo 1 mas 2

    combinados) =______________________________

    n(grupo 1) + n(grupo 2)

    Clculo de la mediana:

    1. Ordene la distribucin de puntuaciones de menor a mayor.2. Localice la posicin de la mediana. Divida el tamao de la muestra, n, entre 2

    para obtener la puntuacin cercana a la puntuacin de la mitad en la distribucin. (Si

    trabaja con una distribucin de frecuencias, calcule la frecuencia acumulativa paracalcular la ubicacin de la mediana.) Si n es un nmero impar, la mediana ser uncaso real en la muestra. Si n es un nmero par, la mediana se ubicar entre las dos

    puntuaciones de la mitad y se calcular tomando la media de estas dospuntuaciones. (Matemticamente, la posicin de la mediana se encuentra dividiendoel tamao de la muestra entre 2 y sumando .5.)

    Clculo de la moda:

    1. Recabe las puntuaciones en una tabla desglosada de puntuaciones brutasordenadas o en formato de distribucin de frecuencias.

    2. Identifique la moda (Mo), que es el valor de X con la frecuencia mayor.

    Preguntas para el captulo 4

    1. Para cada estadstico de tendencia central, qu nivel de medicin de variableses apropiado?

    2. Defina la media, la mediana y la moda. Especifique las limitaciones potencialesde cada una.

    3. Por qu es mejor calcular las tres mediciones -la media, la mediana y la moda-que confiar slo en una?

    4. Como regla general, es incorrecto calcular la media para dos grupos combinados

    dividiendo simplemente sus medias separados entre 2. Cul es la excepcin a estaregla?5. Si una distribucin de puntuaciones est sesgada, qu estadstico de tendenciacentral es el ms apropiado para presentarse al pblico en general? Por qu?6. En general, la moda de una distribucin es el estadstico de tendencia central

    menos til. Bajo qu circunstancias, sin embargo, es el estadstico de tendenciacentral que informa de manera ms apropiada?

    7. Si la edad modal de una distribucin es de 22 aos, significa que la mayora delas personas en esta poblacin tiene 22 aos? Explique.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    23/27

    23

    8. Cmo se localiza la moda en un histograma, un polgono y una curva dedistribucin de frecuencias?9. Qu representan los ejes horizontales y verticales en una curva de distribucin

    de frecuencias?10. Describa las caractersticas de una curva normal de distribucin de

    frecuencias.11. Explique en trminos generales cmo un sesgo a la izquierda en una

    distribucin de frecuencias afecta los tres promedios comunes: media, mediana ymoda.

    12. Explique en trminos generales cmo un sesgo a la derecha en unadistribucin de frecuencias afecta los tres promedios comunes: media, mediana ymoda.

    13. Suponga que una distribucin de edades tiene una media de 55 aos, unamoda de 28 aos y una mediana de 34 aos. Cul es la forma probable de la curvade distribucin de frecuencias para esta variable?

    14. La puntuacin ms alta que una persona puede obtener en el boliche es 300.Fred ha llevado su promedio durante 310 juegos y actualmente tiene 179. Sin hacer

    clculos, explique por qu es imposible para Fred subir su promedio a 180 en unsolo juego.

    15. Como se ilustr en Insensatez y falacias estadsticas en este captulo, lamedia de una variable puede ser una pobre medida de tendencia central cuando existeuna mezcla de rangos de estatus dentro de una poblacin. Proporcione un ejemplo decmo la mezcla de rangos de estatus resulta en una media que no entra en ningnrango.

    Ejercicios para el captulo 4

    Recuerde incluir la frmula, estipular las unidades de medicin y contestar la pregunta.

    1. Dado lo siguiente, calcule la edad modal, la edad mediana y la edad media. X = edad.

    X Y14 1415 1719 19

    19 2222 28

    2. Los siguientes datos son para la variable Y = distancia del centro de trabajo (en millas)para los empleados de un comercio de mquinas copiadoras. Calcule la moda, lamediana y la media de Y.

    Y Y13 109 116 14

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    24/27

    24

    3 512 7

    3. Ese individuo fastidioso que anda con patines en lnea alrededor del estacionamientotambin participa en una competencia de patines en lnea. En las ltimas 11 carreras haquedado en los lugares 2, 4,1, 5, 3, 3,1, 3, 2, 3 y 4.

    a) Encuentre la moda, la mediana y la media de su posicin final tpica.b) Aunque la posicin final es una variable ordinal, por qu es razonable calcularestadsticos de tendencia central en sta?

    4. El equipo de boliche de la universidad particip en ocho competencias el ao pasadocon las siguientes posiciones finales: 4, 3, 2, 2, 3, 1, 2, 1.

    a) Encuentre la moda, la mediana y la media de la posicin final del equipo.b) Aunque la posicin final es una variable ordinal, por qu es razonable calcularestadsticos de tendencia central en sta?

    5. Siete oficinistas entraron a una competencia para perder peso. Despus de unascuantas semanas de dieta sus prdidas de peso (en libras) fueron como sigue: 5, 7, 3, 0,2, 4 y 3. Calcule la prdida de peso modal, mediana y media.

    6. Las puntuaciones en la seccin analtica del examen GRE (Graduate Records

    Examination) de cinco candidatos a un programa para graduados fueron los siguientes:700, 625, 640, 590 600. Calcule las puntuaciones media y mediana.

    7. Paul conduce muy rpido. El es famoso por su velocidad incluso en paseos cortos ygasta cerca de la mitad de su ingreso en neumticos y frenos. Por lo menos en viajescortos, su hermano, Terry, deambula lentamente. Ambos salen de casa de su madreconduciendo a un bar local a slo dos millas a travs de las calles de la ciudad. A Terry letoma cuatro minutos llegar all.

    a) En millas por hora (mph), cul fue el promedio de velocidad de Terry durante eltrayecto de dos millas?

    b) Qu tan rpido tendra que manejar Paul para llegar al bar en dos minutos y"ahorrar tiempo" en comparacin con Terry?c) Tiene sentido intentar ahorrar tiempo conduciendo deprisa en viajes cortos?

    8. Al llegar al juego de liga de esta semana, Lisa ha jugado 56 juegos de boliche y tieneun promedio global de 163 pinos por juego.

    a) Cunto tendra Lisa que promediar esta noche en sus tres juegos paraincrementar su promedio global a 165?

    b) Dado su desempeo anterior, es probable que Lisa incremente su promedioglobal en dos puntos esta noche?

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    25/27

    25

    9. Los demgrafos estudian las poblaciones de varios estados, comunidades y pases. Unasunto de inters es el crecimiento o disminucin en el tamao de una poblacin, la cuales afectada por la rapidez de los nacimientos, cunto tiempo viven (es decir, longevidad) ya qu edades comnmente mueren. Una variable es la edad de mortalidad (es decir, edadde muerte). Suponga que en la nacin A, la edad modal de mortalidad es 55; la mediana,60; y la media, 65. En la nacin B, la media tambin es 65; pero la moda es 75, y lamediana, 70.

    a) A partir de esta informacin, construya las curvas de frecuencia para cadanacin.

    b) Qu nacin parece mejor en trminos de longevidad?

    10. Al evaluar las tasas de delito entre dos ciudades un criminlogo calcula que X =nmero promedio de vehculos robados por da (durante un periodo de seis meses). Parala ciudad A, la moda de X es 15 vehculos, la mediana es 20 y la media es 25. Para laciudad B, la media tambin es 25, pero la moda es 35, y la mediana, es 30.

    a) A partir de esta informacin, construya curvas de frecuencia para cada ciudad.b) En qu ciudad se sentira ms seguro al estacionar su automvil en la calle?

    11. Los cinco miembros de una familia trabajan. Sus sueldos por hora son $30, $10.50,$5.15, $12 y $6.

    a) Calcule la media y la mediana.b) Comparado con las otras puntuaciones, cmo llamaramos a la tasa de $30?c) Cul es su efecto en el clculo de la media?d) Realice un ajuste para esta peculiaridad volviendo a calcular la media sin sta.

    12. Los siguientes son promedios (PROM) de estudiantes en un programa tutelar: 1.7,2.6, 2.3, 3.9, 2.2, 1.9, 2.1. Sea Y = PROM.

    a) Calcule la media y la mediana.b) Comparada con las otras calificaciones, cmo llamaramos a un promedio de

    3.9? c) Cul es su efecto en el clculo de la media?

    d) Realice un ajuste para esta peculiaridad volviendo a calcular la media sin sta.

    13. La edad media de 47 hombres en el Club de Bridge Sparkesville es 54.8 aos. Laedad media de las 62 mujeres en el club es 56.4 aos. Cul es la edad media de los 109miembros?

    14. Las siguientes son las edades medias de pacientes con adiccin a sustancias en uncentro de tratamiento local, clasificados de acuerdo con el tipo de adiccin primaria(datos ficticios). Calcule la edad media de todos los pacientes con adiccin a sustanciasen el centro.

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    26/27

    26

    Adiccin primariaCocana(n=44)

    Crack(n=29)

    Herona(n=24)

    Alcohol(n=69)

    Edad media(aos)

    29.8 23.4 34.6 42.9

    15. En un experimento para observar si los pollos pueden distinguir colores, se lespremia con granos de maz cuando uno de ellos pica una almohadilla con el colorcorrecto. Los tiempos de reaccin se miden a la centsima de segundo ms cercana. Lostiempos de reaccin de Flossy son como sigue: 1.32, 1.45, 1.21, 1.05, .97, .91, .93, .93,.96, .93, .88, .94, .98.

    a) Organice los datos en una tabla de distribucin de frecuencias.b) Calcule los tiempos de reaccin medio, mediano y modal de Flossy.c) Describa la forma de la distribucin de tiempos de reaccin de Flossy.

    16. Los promedios de bateo del equipo de bisbol infantil, Fastball Dodgers, son comosiguen: .360, .200, .350, .355, .230, .345, .360, .380 y .400.

    a) Organice los datos en una tabla de distribucin de frecuencias,b) Calcule los promedios de bateo medio, mediano y modal del equipo.c) Describa la forma de la distribucin.

    17. Dados los siguientes estadsticos y lo que sabemos sobre cmo se relacionan dentro

    de una distribucin de puntuaciones, indique la forma de la distribucin para cadavariable listada.

    Variable Mdn Mo Forma decurva

    Edad (aos) 30 35 39Tamao de lafamilia

    1.1 3.0 2.0

    Aos deempleado

    11 8 7

    Peso (en libras) 160 132 134

    18.Dados los siguientes estadsticos y lo que sabemos sobre cmo se relacionan dentrode una distribucin de puntuaciones, indique la forma de la distribucin para cadavariable listada.

    Variable Mdn Mo Forma decurva

    Altura (pulgadas) 70 68 66Exmenes este semestre 10 43 15Puntuacin deespiritualidad

    30 30 30

  • 7/25/2019 61-Ritchey-F.-2001-Estadstica-para-las-ciencias-sociales.-Captulo-4.pdf

    27/27

    27

    Presupuesto paracomestibles

    $130 $109 $104

    Aplicaciones opcionales en computadora para el captulo 4

    Los ejercicios opcionales en computadora para el captulo 4 se encuentran en el discocompacto Computer Applications for the Statistical Imagination. Estos ejercicios incluyenla generacin de estadsticos de tendencia central utilizando el SPSS para Windows yestadsticos de tendencia central para obtener un sentido de proporcin respecto de lasformas de distribuciones de puntuaciones.