22
Problemas de Distribución de Frecuencias Estadística Descriptiva o Metodológica. o conjunto de datos. (cuadros) y gráficas. pocas cifras que se consideran que representan el conjunto o serie de datos. datos en general respectos de las medidas de tendencia central o de posición. Distribución de Frecuencias. frecuencias de un conjunto o serie de datos. 1.- Recopilar los datos originales 22 41 35 45 32 37 30 26 34 16 31 33 38 31 47 37 25 43 34 36 29 33 39 31 33 31 37 44 32 41 19 34 47 38 32 26 39 30 42 35 40 baterías para automóviles N = 40 2.- Ordenar la información 3.- Identificar el Mayor y el menor valor 22 16 M = 47 34 19 m = 16 25 22 4.- 33 25 R = M - m 47 26 R = 31 41 26 5.- 16 29 43 30 31 30 número tentativo de Clases o Categorías que podríamos tener en una 38 31 Distribución de Frecuencias. La Estadística Descriptiva es la parte de la estadística que describe y resume una serie Para realizar este proceso la “Estadística Descriptiva” hace énfasis en tres aspectos: 1. La forma de la distribución. Para describir como están distribuidos los datos utiliza una llamada “Distribución de Frecuencias” y presenta los datos o información por medio de t 2. Las medidas de tendencia central y/o de posición . Estas medidas resumen la información a 3. Las medidas de variabilidad . Estas medidas nos indican que tan variables o diferentes son Una distribución de frecuencias es la disposición tabular en clases o categorías y las correspon Pasos para la construcción de una Distribución de Frecuencias Datos que representan el número de meses de duración de una muestra de Determinar el Rango Total ó Recorrido: variabilidad de la variable Determinar el Número Tentativo de Clases o Categorias Existen al menos tres (3) métodos utilizables para la determinación de

140101 Construcción de Una Distribución de Frecuencias

Embed Size (px)

DESCRIPTION

.

Citation preview

Sheet1Problemas de Distribucin de FrecuenciasEstadstica Descriptiva o Metodolgica.La Estadstica Descriptiva es la parte de la estadstica que describe y resume una serieo conjunto de datos.Para realizar este proceso la Estadstica Descriptiva hace nfasis en tres aspectos:1. La forma de la distribucin. Para describir como estn distribuidos los datos utiliza una herramientallamada Distribucin de Frecuencias y presenta los datos o informacin por medio de tablas(cuadros) y grficas.2. Las medidas de tendencia central y/o de posicin. Estas medidas resumen la informacin a unaspocas cifras que se consideran que representan el conjunto o serie de datos.3. Las medidas de variabilidad. Estas medidas nos indican que tan variables o diferentes son losdatos en general respectos de las medidas de tendencia central o de posicin.Distribucin de Frecuencias.Una distribucin de frecuencias es la disposicin tabular en clases o categoras y las correspondientesfrecuencias de un conjunto o serie de datos.Pasos para la construccin de una Distribucin de Frecuencias1.-Recopilar los datos originales22413545323730263416313338314737254334362933393133313744324119344738322639304235Datos que representan el nmero de meses de duracin de una muestra de40 bateras para automvilesN =402.-Ordenar la informacin3.-Identificar el Mayor y el menor valor2216M =473419m =1625224.-Determinar el Rango Total Recorrido: variabilidad de la variable3325R = M - m4726R =3141265.-Determinar el Nmero Tentativo de Clases o Categorias16294330Existen al menos tres (3) mtodos utilizables para la determinacin del3130nmero tentativo de Clases o Categoras que podramos tener en una3831Distribucin de Frecuencias.3531A.-A travs de la experiencia del investigador3131B.-Utilizando la potencia de 2; es decir 2NIC, me indica el nmero3431mximo deseable de datos asociados con el NIC = nmero de3732intervalos de clases3232C.-Utilizando la Regla de Sturgess que dice que K = nmero tenta-4532tivo de intervalo de clases, se puede determinar con la expresin3333K = 1 + 3.3 x log10 N, donde N = al nmero de datos observados3633o por evaluarRegla de Sturgess4433Nmero de clasesNmero mximo de datosN =402634nic2niclog10 N=1.6020603234532K =NTIC3834664K =6.2867982935712832358256393695123737101024313733376.-Determinar el tamao del intervalo de clases = tic4138tic = R / nic30383039Luego tic = 31/ 6 =5.1666666667redondeamos la cifra y tendremos que el tic =5473939417.-Determinar cul ser el Primer Lmite Inferior de Clase = LIC1941Existen al menos dos (2) mtodos para la determinacin del primer lmite inferior4242A.-El lmite inferior del primer intervalo de clase es un mltiplo del tamao del2643intervalo de clase (tic) igual o menor que el ms pequeo de los datos3744tic =5m =16mltiplo de 5 = 153145esto implicaLic =153447B.-El lmite inferior del primer intervalo es el menor valor observado3547m =16Lic =161,365Ahora podemos proceder con la construccin de dos (2) distribuciones de frecuencia8 A.-Tomando en consideracin el resultado 7.A donde Lic = 15ticClasesLiLsXiFrecuencia51519172LS = Li siguiente -1 =1952024221Li siguiente = Li anterior + tic =2052529274530343215Dados los lmites de cada clase o categora procedemos535393710a agrupar los datos de acuerdo a la clase a la cual correspondan54044425Para ello iremos a la columna de datos ordenados y realizaremos54549473dicho conteo550Construiremos clases hasta el mximo valor observado408 B.-Tomando en consideracin el resultado 7.B donde Lic = 16ticClasesTambin podemos determinar los Lmites Superiores de ClaseLiLsXiFrecuenciaTomando en consideracin el tic; es decir, el tamao del intervalo5162018236de clase. Para ello utilizaremos la siguiente expresin:521252324652630285140LS = Lic + tic - A* donde A es un factor de ajuste y depender531353315495de la forma de expresar cuantitativamente la variable que se est53640388304evaluando.A*54145436258Si la variable est en unidades15465048296Con un dgito dcimal0.1551con dos dgitos decimales0.01401375con tres dgitos decimales0.001y as sucesivamente9.-Determinar los Puntos Medios o Marcas de Clase.El Punto Medio o Marca de Clase de Cada Clase o Categora es el valor ms representativo de dicha clase.Es la Semisuma de los lmites de clase de cada clase o categoria, y se representa por Xi y se calcula as:Xi = (Li + Ls) / 2En el punto 8.-A, el primer punto medio es (15 + 19) / 2 =17En el punto 8.-B, el primer punto medio es (16 + 20) / 2 =1810.-Determinacin de los Lmites Reales de Clase o Fronteras de ClaseDados los lmites de clases, podemos determinar los lmites reales de clase o fronteras de clase. Se consideraque los lmites anteriores son nominales. Los lmites reales son el punto medio o la semisuma entre dos lmitesnominales adyacentes. El lmite real inferior de una clase es la semisuma entre el lmite inferior de esa clasey el lmite superior de la clase anterior; y el limite real superior ser la semisuma entre el lmite superior de esaclase y el siguiente lmite inferiorLIRi = (LIi + Ls(i-1) anterior) / 2LSRi = (LSi + Li(i+1) siguiente) / 2LSR 1 = lmite superior real de la 1 clase =19.5Primera Distribucin 8.- ALSR 2 = lmite superior real de la 2 clase =24.5LSR 1 = lmite superior real de la 1 clase =20.5Segunda Distribucin 8.- BLSR 2 = lmite superior real de la 2 clase =25.5Recordar que el Lmite Superior Real o Frontera Superior Real de una clase es Lmite Inferior Real de lasiguiente clase.11.-Construir Histograma y Poligono de FrecuenciasEstas grficas sern explicadas en clase12.-Ojivas Ascendentes y Ojivas DescendentesA los efectos de la construccin de estas grficas necesitaremos las columnas de frecuencias acumuladas ascendentesy las frecuencias acumuladas descendentesAgregaremos informacin adicional a nuestra tablaticClasesFrecuenciaLiLsXififaafadfirfaarfadr515191722400.0500.0501.000520242213380.0250.0750.950525292747370.1000.1750.92553034321522330.3750.5500.82553539371032180.2500.8000.450540444253780.1250.9250.200545494734030.0751.0000.07555000.000401.00012.-Promedios Simples y Promedios PonderadosMedia Aritmtica = Mx =Promedios Simples:Son aquellos en los que a los distintos trminos de la serie o conjunto de valores, se le atribuye la mismaimportancia; es decir, la misma participacin.Promedios Ponderados:Son aquellos en los que a cada trmino de la serie o conjunto de valores, se encuentra influido por un factor cuanti-tativo que modifica totalmente su participacin en dicho clculo. Este factor se le denomina peso o ponderacinMedia Aritmtica = Mx =Es el valor ms representativo de un conjunto de valores, es el puntode equilibrio, el centro de gravedad de la serie.Dados un conjunto de valores X1, X2, , Xn de la variable X, decimos que la Media Aritmtica resulta de lasuma de todos estos valores, divididos entre el nmero de ellos; y se representa as:.Media Aritmtica = Mx == (X1 + X2 + + Xn) / N = (xi) / N, donde N = al nmero de valoresticClasesFrecuenciadidi =LiLsXifiXi * fi(Xi - Mx)di * fi(Xi - A)(Xi - A) * fi5151917234-17.125-34.250-15-305202422122-12.125-12.125-10-1052529274108-7.125-28.500-5-20530343215480-2.125-31.875005353937103702.87528.750550540444252107.87539.37510505454947314112.87538.6251545550401,3650.00085Mtodo GeneralMedia Aritmtica = Mx == (X1 + X2 + + Xn) / N donde N = al nmero de valoresMX =( Xi )/ N Xi =1,365y N =40MX =34.125Media Aritmtica en una Distribucin de Frecuencias.Mx = Media o Promedio Aritmtico = (Xi * fi) / fi=34.125MX =34.125PRIMER MTODO ABREVIADO O DE LOS DESVIOS CUALESQUIERAVeamos la definicin de DESVIOSDados un conjuntos n de valores de la variable Xi; es decir, X1, X2, , Xn y un valor arbitrario A cuales-quiera, definimos el desvio cualesquiera y lo denotamos por di, como la diferencia entre cada uno delos Xi y A; es decir, di = Xi - A.Luegod1 =X1 - Ad2 =X2 - ASumando a ambos miembros de la igualdaddn =Xn - Ad1 + d2 ++ dn =X1 + X2 + + Xn - ( A+ + A)o lo que es lo mismo:di = Xi - nAa.-Para datos no agrupadosMx ==A + di / ndonde:A = al valor arbitrario cualesquieradi = Xi - Ayn = al nmero de valoresc.-Para datos agrupados en distribuciones de frecuencias=Mx = A + { (Xi -A)*fi} / fi = {(di * fi )} / nya que fi = nSi A = 32, entonces( (Xi -A)*fi) / fi =2.125(ver tabla anterior)Mx = 32 + 85 /40 =34.125SEGUNDO MTODO ABREVIADO O DE LOS DESVIOS UNITARIOSEste mtodo solo se aplica a "Distribuciones de Frecuencias"Deben satisfacerse dos (2) condiciones:1.-La distribucin a evaluar debe de tener los tic (tamao de intervalo de clase o amplitudde clase) iguales entre si. Es decir, los tic deben tener el mismo valor.2.-El valor A a seleccionar tiene que ser ahora el valor de un punto medio o marca de clase delconjunto de valores por evaluar; es decir, A ser igual a un Xi, donde Xi es un punto medio.Nos damos cuenta que A no es ahora un valor arbitrario cualquiera, sino uno de los valores delos puntos medios o marca de clase del conjunto de valores que se est evaluando.La expresin para determinar los desvios unitarios, y lo denotamos por ui, es:Ui = (Xi - A )/ tico lo que es lo mismoUi = di / ticya que di = Xi - A como vimosanteriormente.Ui puede asumir los valores Ui = {0, 1, 2, 3, 4, ...}y entoces nuestra expresin para la Media Aritmtica es:=Mx = A + [( {((Xi -A) / tic)*fi} / fi] * tic = A + [{(Ui * fi )} / n] * ticticClasesFrecuenciadi =LiLsXifiXi - 32Ui = di / ticUi * fi51519172-15-3-652024221-10-2-252529274-5-1-4530343215000535393710511054044425102105454947315395504017Seleccionamos 32 como nuestro valor de punto medioresolviendo la ecuacin, tenemos:=32 + (17 / 40) * 5 =34.125c.q.dPROPIEDADES DE LA MEDIA ARITMTICA

Sheet12.7610.15712.25537.9511

Puntos MediosFrecuenciasPuntos MediosFrecuenciasPoligono de Frecuencias

Sheet267511

FrecuenciasClasesFrecuenciasHistograma de Frecuencias

Sheet3023722323740

Lmites de ClasesFrecuencias AcumuladasOjiva Ascendente

Sheet44038373318830

Lmites de ClasesFrecuencias AcumuladasOjiva Descendente

Sheet5ClasesticLiLsXiFrecuencia515191725202422152529274530343215535393710540444255454947350400617253112.7610.15712.25537.951115020222531307435221540321045375504031540220381253743033153518104085453350040

Sheet5

Puntos MediosFrecuenciasPuntos MediosFrecuenciasPoligono de Frecuencias

FrecuenciasClasesFrecuenciasHistograma de Frecuencias

&APage &PLmites de ClasesFrecuencias AcumuladasOjiva Ascendente

Lmites de ClasesFrecuencias AcumuladasOjiva Descendente

LiLsXiFrecuenciaX * Fdidi * fiXi - Mx(Xi - Mx) * fi162018236-15-30-3-6-16.375-32.750212523246-10-20-2-4-11.375-22.7502630285140-5-25-1-5-6.375-31.8752222313533154950000-1.375-20.62534343640388304540183.62529.0002525414543625810602128.62551.750333346504829615303613.62527.25047475141414013755511016164343Mx =34.37534.37534.37531313838353531313434373732324545333336364444262632323838292932323939373731313333414130303030474739391919424226263737313134343535

Data Original en ColumnaData ordenadaticCLASES O CATEGORASfrecuenciasLICLSCfi51519222321634M =4752024134381934m =1652529425292235530341533322535RT = M - m =3153539104739263654044541372637NIC =6545493163129375043333037tic = RT / NIC =5.17403141303838303138Luego35303139tic =53147313934393141Mltiplos de tic = 5371932415, 10, 15, 20. 324232424526324333373344363133454434334726353447

2 a la potencia NICData Original en ColumnaData ordenadaNmero de ClasesNmero Mximo de datosNIC2NICValor de la variableA*53222321634M =47664En unidades enteras134381934m =167128un decimal0.1252922358256dos decimales0.0133322535RT = M - m =319512tres decimales0.001473926361010244137263716312937tic = RT / NIC =5.1743333037Regla de Sturgess3141303838303138N =403530313931473139log10 N =1.60206343931413.3 x log10 N =5.2873719324132423242K =6.28745263243K =633373344363133454434334726353447