13
1º BAC CCSS TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES. PARÁMETROS ESTADÍSTICOS TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES. PARÁMETROS ESTADÍSTICOS 1.-INTRODUCCIÓN Aunque las tablas estadísticas y las representaciones gráficas contienen toda la información relativa a un problema, muchas veces interesa simplificar ese conjunto de datos por uno o varios parámetros que caractericen de la mejor forma posible esa distribución de frecuencias y que, además nos permita comparar unas distribuciones con otras. En este sentido hay unos parámetros de centralización, que tienden a situarse en el centro de la distribución, unos parámetros de dispersión cuyo valor indica si los datos están concentrados o dispersos alrededor de un valor prefijado; y unos parámetros de posición que tienden a situarse en un determinado lugar de la distribución. 2.-MEDIDAS DE CENTRALIZACIÓN A) MEDIA ARITMÉTICA O MEDIA La media aritmética de un conjunto de N valores x 1 , x 2 , x 3 , ..., x N es el cociente entre la suma de todos los valores observados (valores de la variable) y el número total de observaciones (tamaño poblacional); se representa por y su expresión aritmética es: Si tenemos la tabla de frecuencias absolutas, la media se calcularía así: Cuando tenemos datos agrupados en intervalos, consideraremos como valor de variable x i al punto medio de cada intervalo, es decir, la marca de clase. El valor calculado, evidentemente no es el valor real de la media, pero compensa con la reducción de operaciones que hay que realizar. Además si los datos dentro del intervalo están distribuidos de un modo más o menos uniforme la media calculada se aproxima mucho a la real. Ventajas: - La media es el valor medio o promedio de las observaciones. - La media es el parámetro de centralización más utilizado - Es un valor situado entre los valores extremos de la variable. - Su cálculo sólo tiene sentido cuando la variable es cuantitativa. - Presenta rigor matemático - Es sensible a cualquier cambio en los datos Desventajas: 9 También a veces se representa por

DISTRIBUCIONES UNIDIMENSIONALES

Embed Size (px)

DESCRIPTION

distribuciones

Citation preview

1 BAC CCSSTEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.PARMETROS ESTADSTICOSTEMA 2: DISTRIBUCIONES UNIDIMENSIONALES. PARMETROS ESTADSTICOS1.-INTRODUCCINAunquelastablasestadsticasylasrepresentacionesgrficascontienentodalainformacinrelativa a un problema, muchas veces interesa simplificar ese conjunto de datos por uno o variosparmetros que caractericen de la mejor forma posible esa distribucin de frecuencias y que,adems nos permita comparar unas distribuciones con otras. En este sentido hay unosparmetr! "e #e$tra%&'a#&($, quetiendenasituarseenel centrodeladistribucin, unosparmetr! "e "&!per!&($cuyo valor indica si los datos estn concentrados o dispersosalrededor de un valor prefijado; y unosparmetr! "e p!&($que tienden a situarse en undeterminado lugar de la distribucin. 2.-MEDIDAS DE CENTRALI)ACINA* MEDIA ARITM+TICA O MEDIAa me"&a ar&tm,ta de un conjunto de ! valores "#, "$, "%, ..., "! es el cociente entre la suma detodos los valores observados &valores de la variable' y el n(mero total de observaciones &tama)opoblacional'; se representa por"y su e"presin aritm*tica es+ ,i tenemos la tabla de frecuencias absolutas, la media se calculara as+-uandotenemos"at! a-r.pa"! e$ &$ter/a%!, consideraremoscomovalordevariable"ialpunto medio de cada intervalo, es decir, la mar#a "e #%a!e. El valor calculado, evidentemente noes el valor real de la media, pero compensa con la reduccin de operaciones que hay que reali.ar.Adems si los datos dentro del intervalo estn distribuidos de un modo ms o menos uniforme lamedia calculada se apro"ima mucho a la real.0e$ta1a!+- a media es el valor medio o promedio de las observaciones.- a media es el parmetro de centrali.acin ms utili.ado- Es un valor situado entre los valores e"tremos de la variable.- ,u clculo slo tiene sentido cuando la variable es cuantitativa.- /resenta rigor matemtico- Es sensible a cualquier cambio en los datosDe!/e$ta1a!+- !o siempre es posible calcular la media e incluso a veces *sta carece de significado. Enestos casos se utili.an otras medidas de centrali.acin.- Es sensible a los valores e"tremos- !o es recomendable emplearla en distribuciones muy asim*tricas9!"!" ... " ""!# ii! $ #==+ + +=!f "ff "f .... f ff " .... f " f ""n# ii in# iin# ii in $ #n n $ $ # #==== =+ + ++ + +=0ambi*n a veces se representa por 1 BAC CCSSTEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.PARMETROS ESTADSTICOS- ,i seemplean variables discretas ocuasi1cualitativas, lamediaaritm*ticapuedenopertenecer al conjunto de valores de la variableC.e!t&($ 1:23u* ocurrir con el valor de la media si a todos los datos de la distribucin se lessuma &o resta' la misma constante4 25 si se multiplican o dividen por esa constante4C.e!t&($ 2+ En un grupo de$6alumnos sehacalculado la nota media en un e"amen dematemticas y nos ha quedado 7,8. ,i se incorpora al grupo un nuevo alumno y saca un 8,% en elmismo e"amen, 2cul ser la nueva media de la clase4C.e!t&($ 2+ /ensar alg(n caso en el que no pueda calcularse la media, o en el que el valor de *stacare.ca de sentidoE1er#&: 1.1 -alcular la media para las siguientes distribuciones de datos+a' Ca! 1+ /ocos datos!otas de los alumnos de #9 :achillerato+ ;, , $, #, ;, 8, 7, ' @>,#6'!9 de alumnos >6 86 ;6 76 %6B* MEDIANAa me"&a$a de una distribucin es un valor Me que divide a la distribucin en dos partes iguales;es decir, deja tantas observaciones a la i.quierda como a la derecha.1 /ara calcularla mediana en#a! "e p#! "at! 3 !&$ a-r.parse colocan estosen ordencreciente de magnitud. ,i el n(mero de datos es impar la mediana coincide con el valor central.,i el n(mero de datos es par, cualquier valor comprendido entre los dos valores centrales es unamediana, pero se suele tomar el valor medio de los dos valores centrales.1 ,i tenemos m.#4! "at! 3 !&$ a-r.par, se construye la tabla de frecuencias acumuladas Ai, yse toma la mediana como aquel valor de la variable "i para el cual Ai sea igual o supere $!1 En caso de "at! a-r.pa"! e$ &$ter/a%! primero buscaremos el &$ter/a% me"&a$, que es elprimer intervalo de clase cuya frecuencia acumulada es igual o superior a la mitad del n(mero deobservaciones,$! . -omo primera apro"imacin puede tomarse la mediana como la marca de clase de dicho intervalo;sin embargo podemos calcularla de forma ms e"acta con el siguiente ra.onamiento+ sisuponemos que los datos dentro de cada intervalo estn distribuidos uniformemente, y llamamos&"i1#, "i' al intervalo mediano; fi a la frecuencia absoluta de dicho intervalo y Ai1# a la frecuenciaabsoluta acumulada en el intervalo anterior al mediano, el clculo de la mediana es+101 BAC CCSSTEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.PARMETROS ESTADSTICOSAl igual quesucedaconlamedia, el valorcalculadonoesel valorreal delamediana, perocompensa con la reduccin de operaciones que hay que reali.ar. Adems si los datos dentro delintervalo estn distribuidos de un modo ms o menos uniforme el valor obtenido se apro"imamucho al real.E1er#&: 2.- -alcular la mediana para las siguientes distribuciones de datos+a' Ca!1: !otas de los alumnos de #9 :achillerato+ ;, , $,#, ;, 8, 7, ,#6'!9 de alumnos >6 86 ;6 76 %6C*MODAa m"a M

es el dato que ms se repite, es decir el valor de la variable con mayor frecuenciaabsoluta. Es la (nica medida de centrali.acin que tiene sentido estudiar enuna variable cualitativa, pues no precisa la reali.acin de ning(n clculo. amodanotienepor qu*ser (nica, sinoquepuedehaber distribucionesmultimodales.,i los datos estn agrupados en intervalos elegimos el intervalo modal, quees aquelcon mayor frecuencia absoluta.Aunque hay una frmula para unclculo ms ajustado del valor de la moda, slo vamos a estudiar su clculogrfico. /ara ello se unen los e"tremos del intervalo modal con los contiguoscomo se muestra en la figura. El punto de corte de dichas lneas nos da elvalor apro"imado de la moda.E1er#&: 2.-,e ha preguntado a un grupo de alumnos de #9 de :achillerato sus pesos y losresultados obtenidos se han colocado en la siguiente tabla. -alcula la media, mediana y moda dela distribucin de datos+/eso &"i' @ #$ = 8 ' @>,#6'!9 de alumnos > 8 ; 7 %;.- SIMETRA < ASIMETRAJayconjuntodedatos dondelas tres medidas decentrali.acin&media, medianaymoda'coinciden. En este caso se dice que la distribucin de datos es !&m,tra.Engeneral paraestudiarlasimetraonodeunadistribucindedatospodemosestudiarsugrfica, su tabla o los valores de estas medidas de centrali.acin.a representacin grfica sim*trica por e"celenciacorrespondeaunaD&!tr&=.#&($ Nrma%yrecibeelnombre de Campa$a "e 8a.!!.Enestacampana, el valorm"imocorrespondealamedia aritm*tica, siendo los valores centrales msfrecuentes que losalejados, y setiene que+ En el intervalo & " K E, " L E' se encuentra el;=,$ M de los datos En el intervalo & " K $E," L $E' se encuentra el>7,7 M de los datos En el intervalo & " K %E," L %E' se encuentra el >>,8 M de los datosEn general las distribuciones de datos no se adaptan totalmente a una campana de Nauss, sinoque presentan asimetra. Estudiemos la asimetra de una distribucin con un ejemplo.E1emp%+ ,ean las estaturas &en cm' de $6 alumnos las siguientes+1#!1 BAC CCSSTEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.PARMETROS ESTADSTICOS#78, #;6, #;6, #;#, #; " =y s F =,%$/odemos observar adems que+ En el intervalo & " K E," L E' F #,$=, #88,>$', hay #< datos, lo que corresponde al 86Mde los datos En el intervalo & " K $E, " L $E' F $,>;, #=;,$@#=7 , #>7B # $6! F $6%% , #;% #6 C;6 1 7#77 ' " &"fA. As G#deja por debajo el #6M de los valores de la distribucin, G$deja pordebajo el $6M de los valores de la distribucin, y as sucesivamente. El valor de G7 coincide conla media./aracalcularlosehacelomismoqueenloscuartilesparadatossinagrupar, yparadatosagrupados se utili.a la frmula+C* PERCENTILES,on los valores que dividen la serie de datos en cien partes iguales. os denotamos por /#, /$,/%, ...., />>. As /# deja por debajo el #M de los valores de la distribucin, /$ deja por debajo el $Mde los valores de la distribucin, y as sucesivamente. Es claroque /76 coincide con la mediana./ara calcularlo se hace lo mismo que en los cuartiles para datossin agrupar, y para datos agrupados se utili.a la frmula+1%' " &"fA.1-alcular 3%, G#, /,#6'!9 de alumnos > 8 ; 7 %CUESTIONES DISTRIBUCIONES UNIDIMENSIONALES#.1 a nota media de #6 alumnos es de ;T7. ,i le preguntamos su nota a otros tres alumnos ms,resultando ser estas notas+ 7, 8 y >, 2cul es la nueva media de estos #% alumnos4$.1 ,e eligen al a.ar tres n(meros del 6 al > y se forma con ellos un n(mero de tres cifras. ,esabe que la media de las tres cifras es7 y la moda e"iste y es 8. 2-ul es el mayor n(mero quese pudo formar de esta manera4%.1 /oner un ejemplo de distribuciones de varian.a nula

:+ #, 7, #6, #7 y %6,in necesidad de hacer ning(n clculo 2-ul de los dos tiene mayor dispersin47.1 El peso medio de 7 chicas es 7;,$ Ug y el peso medio de 8 chicos es ;$,= Ug. Jallar+a' /eso total de las chicasb' /eso total de los chicosc' /eso medio de todo el grupoE?ERCICIOS:INALES ESTADSTICA UNIDIMENSIONAL#.1 -alcular la media, moda, varian.a, desviacin tpica y coeficiente de variacin de la siguientedistribucin de datos+!ota de ?atemticas $ % < 7 ; 8 = > #6!9 de alumnos 7 8 < ; 7 % % $ #$.1 Pellenar la siguiente tabla con las frecuencias relativas, porcentuales y absolutas acumuladas+HifihipiAi$ ;%