Laminas 1 Estadística Descriptiva

Embed Size (px)

Citation preview

REGLAS BSICAS DE LAS OPERACIONES CON SUMATORIA Estadstica Descriptiva Temas 1 y 2: Repaso sobre Sumatorias 1)LaSumadelosvaloresdedosvariablesesigualala suma de los valores de cada variable sumada = = =+ + =niiniinii i Y X Y X1 1 1) (2)LaSumadeladiferenciaentrelosvaloresdedos variables es igual a la diferencia de los valores sumados de las variables = = = =niiniinii i Y X Y X1 1 1) (3) La Suma de una constante multiplicada por una variable es igualalaconstantemultiplicadaporlasumadelosvalores de la variable constante una es c donde1 1 = ==niinii X c cX4) Una constante sumada n veces es igual a n veces el valor de la constante constante una es c donde1nc cni==Observacin:sienlasumatoriadeunaconstanteellimite inferiory/oellimitesuperiorsondiferentesde1y/oden,la sumatoria se expresa como: constante una es c donde ) 1 ( c m k ckm i+ ==nnii X X X X X + + + + == 3 2 11ElSmbolodeSumatoriaseutilizaparaindicarquese debensumardesdeelvalorihastaelvalorndela variable o variables indicadas en la sumatoria. 2 2 2 2 23 2 11nnii X X X X X + + + + ==212|.|

\|= =niinii X XSumatoria de n valores de una variable: Sumatoria de los cuadrados de n valores de una variable: Observacin: La Sumatoria de los cuadrados de n valores de una variableesdiferentealcuadradodelaSumatoriadenvalores de una variable: Sumatoriadelosproductosdelosnvaloresdedos variables: n nnii i Y X Y X Y X Y X Y X + + + + == 3 3 2 2 1 11Observacin: La Sumatoria de los productos de n valores de dos variablesesdiferentealproductodelassumatoriasdelosn valores de dos variables: |.|

\| |.|

\|= =niiniinii i Y X Y X1Estadstica Descriptiva Temas 1 y 2: Repaso sobre Sumatorias Estadstica Descriptiva Temas 1 y 2: Conceptos Introductorios Universo Estadstico Conjuntoocoleccindepersonasocosasalasquese refiereunainvestigacinestadstica.Puedenserpersonas, cosas, actos, reas geogrficas, etc. Elementos del Universo Estadstico Personas o cosas que integran el Universo Estadstico Pueden ser: Reales o Abstractos Naturales o Artificiales Entidades Simples o Entidades Complejas Tamao del Universo EstadsticoConstituye el Nmero de elementos que integran el Universo Estadstico. Segn su tamao el Universo Estadstico puede ser: Finito: Cuando el nmero de elementos que lointegran es finitoInfinito:Cuando el nmero de elementos que lointegran es infinito. CaracteresPropiedades,rasgos,caractersticasocualidadesque poseenloselementosdelUniversoEstadsticoyqueson observados para la realizacin de anlisis estadsticos. Pese aqueunelementopuedeposeermasdeuncarcterque puedeserobservado,enelanlisisestadsticosedefine previamentecualessernlosobservadosodeobjetode estudio. Estadstica Descriptiva Temas 1 y 2: Conceptos Introductorios Conceptos de Estadstica ComoColeccindeDatosNumricos:esunconjunto coherentededatosestablecidodeformasistemtica segn determinados criterios de ordenacin. ComoCiencia:consisteelestudiodelcomportamientode fenmenosenmasaporlocualestudiaconjuntoso gruposy no se detiene en el estudio de casos aislados. Como Herramienta del Mtodo Cientfico de Investigacin: Estudiayanalizalaregularidadoestabilidaddeun fenmenodentrodeungrupodemaneraqueestas conclusionespuedanserutilizadasparafinesde prediccin. Estadstica Descriptiva- Estadstica InductivaEstadsticaDescriptiva:Sededicaadescubrirydescribir lascaractersticasoregularidadespresentesenun grupo o conjunto. EstadsticaInductiva:tambenselellamaInferencia Estadsticayseencargadeutilizarlainformacin suministradaporlaEstadsticaDescriptivaenla prediccin. Importancia de la EstadsticaSuimportanciaradicaenqueesunafuenteconfiablede informacin en diversos campos y niveles, proporcionando informacinyprediccionesquesonutilizadasenlos procesosdetomadedecisionesyresolucinde problemas de individuos, organizaciones y pases. Estadstica Descriptiva Temas 1 y 2: Conceptos Introductorios Dato Estadstico u Observacin Eselresultadodelaobservacindeloscaractereso caractersticas de los elementos del Universo Estadstico. Poblacin Estadstica Eselconjuntodetodoslosdatosobtenidosalobservara los elementos del Universo Estadstico. Clasificacin del Dato Estadstico Cualitativo: se describen mediante palabras y al observarse se obtienen modalidades. Son considerados como atributos. No son susceptibles de ser ordenados objetivamente. Cuantitativo: se describen mediante nmeros. Al observarse seobtienenvalores.Sonsusceptiblesdeserordenados objetivamente y se clasifican en: Constantes:todosloselementosposeenlamisma caracterstica. Variables:lascaractersticasentodosoalmenosdos elementossondistintas.LasVariablesse clasifican en:Discretas:solopuedentomardeterminadosvalores previamente asignados o conocidos. Continuas:puedentomarcualquieradelosvaloresentre los infinitos dados en un intervalo. Estadstica Descriptiva Temas 1 y 2: Conceptos Introductorios Observacin o Medida de los DatosSisetratadeundatocualitativo(atributo)sedebe ubicar la modalidad correspondiente. Sisetratadeundatocuantitativosedebeobservaro medir el valor numrico que toma el carcter en funcin de un determinado Nivel de Medicin. Niveles de Medicin Nominal: se utilizan nombres o clases para organizar los datos en categoras separadas y distintas. Ordinal:sejerarquizanlosdatosencategoras ordenadas en virtud de un criterio determinado. Deintervalos:lamedicinserealizarespectoauna escala numrica en la cual el valor del cero es arbitrario pero la diferencia de valores importante. DeProporcin:serealizanmedicionesenlascualesel ceroesunvalorfijoencualquierescalayladiferencia de valores es importante. Estadstica Descriptiva Temas 1 y 2: Conceptos Introductorios Formas de Observar el Universo Estadstico Observacin Exhaustiva SeobservantodosloselementosdelUniversoEstadstico. TambinseledenominaCENSO.Lasmedidasdescriptivas queseobtienencorrespondenatodalapoblacinyseles denomina PARAMETROS.Observacin Parcial Se observa solo una parte del Universo Estadstico es decir aunaMuestraylamedidadescriptivaqueseobtienese llama Estadstico. Muestra: Consisteenelegirunsubconjuntooporcin representativa de todo el Universo Estadstico, a travs de mtodos aleatorios o no aleatorios Losmtodosaleatoriosestninspiradosenelazary garantizan la representatividad de la muestra, es decir, que posealascaractersticasrelevantesdelUniversodedonde fue tomada. Losmtodosnoaleatoriossebasanenelcriteriodela persona que elige la muestra de acuerdo a reglas prefijadas Observacin Mixta: Esunacombinacindelasformasdeobservacin anteriores,enlacualatodoelUniversoseleestudian algunas caractersticas bsicas y luego a una parte de l se le estudia otras caractersticas adicionales. TABLAS ESTADISTICAS Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos ELEMENTOS DE UNA TABLA ESTADISTICA 1.- Para hacer una presentacin organizada de los datos. 2.- Para simplificar la presentacin de los datos. 3.- Para facilitar la visualizacin y anlisis de los datos. 4.-Parahacerunarregloordenadodedatosquepuede ser: Cronolgico, Geogrfico, Cualitativo o Cuantitativo. 5.-Parafacilitarlacomparacinentreconceptosoentre cifras. VariableElementos 1.- Titulo 2.- Encabezado 3.- Concepto o Columna Matriz 4.- Cuerpo o Datos 5.- Fuente POR QU SE CONSTRUYE UNA TABLAESTADISTICA? 1.- Titulo:constituyeunadescripcindelcontenidodela tabla. 2.- Encabezado: contiene el titulo de cada columna. 3.-ConceptooColumnaMatriz:seubicaenellado izquierdo de la tabla y contiene las descripciones numricas o categricas de la variable en hilera (fila). 4.-CuerpooDatos:estaconstituidoporlainformacin estadsticaodatosarregladosdeacuerdoconlas descripcionesoclasificacionesdelosencabezadoso conceptos.5.- Fuente: Indica el origen de los datos. TABLAS ESTADISTICAS Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos PRESENTACION DE DATOS CUALITATIVOS O CATEGORICOS Categoras:Consistenenlaorganizacinoarreglodelas modalidades o cualidades, de acuerdo a cierta importancia, orden o simplemente en orden alfabtico si la importancia de clases individuales no se va a enfatizar. Frecuencias: es el numero (si la frecuencia es ABSOLUTA fi-)olaproporcinoporcentaje(silafrecuenciaes RELATIVAhi-),queindicalasvecesqueunacategorao valornumricoestarepetido,esdecir,serefierenal nmerooporcentajedeelementosquecorrespondena cada categora, de esta manera se tiene que: Titulo Fuente Tabla Resumen o de Distribucin de Frecuencias Cualidado Atributo Elementos: Frecuencias fi hi m1 f1h1 m2 f2h2 m3 f3h3 mn fnhn n 1 100% = == =ninihi n fi1 1% 100 1GRAFICOS Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Un Grfico es una expresin plstica de la informacin, el cual constituye una importante herramienta en la descripcin de los datos, especialmente al divulgar los resultados del estudio. PARTES DE UN GRAFICO 1.-Titulo:constituyeunadescripcindelcontenidodel grficoypuedeserelmismodeladistribucinotablaque representa. 2.- Diagramas: constituyen en si la representacin plstica de los datos. 3.- Escalas: indican las escalas y las unidades en las cuales se miden los datos. 4.- Fuente: Indica el origen de los datos. TIPOS DEGRAFICOS DIAGRAMA DE BARRAS TITULO CATEGORAS FUENTE DIAGRAMA DE PASTEL TITULO FUENTE Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Fi:FrecuenciaAbsolutaAcumulada(BaseMenoroigual queLs)delaclasei-sima:Sedefinecomoeltotalde observaciones con valores menores o iguales a los de la clase i-sima. Se obtiene de las siguientes formas: n fm f f f fi F cf F F bF f f f aMiMn ni= + + + + = =+ == + + + + ===.. 3 2 1 )).. f f )13 2 3n13 2 1 iFi*: Frecuencia Absoluta Acumulada (Base Mayor o igual que Ls)delaclasei-sima:Sedefinecomoeltotalde observacionesconvaloresmayoresoigualesalosdela clase i-sima. Se obtiene de las siguientes formas: m i i i ii if f f F bF F a+ + + + ==+ +.. f * )- n * )) 2 ( ) 1 () 1 (Hi:FrecuenciaRelativaAcumulada(BaseMenoroigual que Ls) de la clase i-sima: Se define como la proporcin o porcentajedeobservacionescuyosvaloressonmenoreso igualesalosdelaclasei-sima.Seobtienedelas siguientes formas: i 1) - (in13 2 1 ih H H )).. h h )+ === + + + + ==i cnFH bH h h h aiii niHi*: Frecuencia Relativa Acumulada (Base Mayor o igual que Ls) de la clase i-sima: Se define como la proporcin o porcentaje de observaciones convalores mayores o iguales alosdelaclasei-sima.Seobtienedelassiguientes formas: m i i i ii ih h h ba+ + + + ==+ +.. h * H )H - n * H )) 2 ( ) 1 () 1 (FRECUENCIAS ACUMULADAS Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Recorrido de la Variable: LSeconsiderarcomocontinuo y se debe dividir en un determinado nmero de clases. R X X L = = min maxTablas Estadsticas Caso Nro 3: La Variable Tiene Muchos Valores Distintos Nmero de Clases: MIndicaencuantasclasessedividir el recorrido. Para definirlo se debe tener en cuenta: a) Depende de la cantidad de datos. b) El nmero de clases deseadas generalmente es entre 5 y 15 o mximo 20. c) Se puede recurrir a las siguientes frmulas: Intervalo de Clases: icIndicaelanchoquetendrcada clase.Puedenserigualesparatodaslasclases(eslo masrecomendable)yenesecasodedicequela Distribucinesdeicconstanteysecalculande acuerdo a la siguiente frmula:ic= R/M Sinosonigualesentodaslasclasesdedicequela Distribucin es de ic variable, en este caso la formula de Sturges no permite calcular M. Nota: se recomienda que el ic sea un nmero entero. Sturges M = 1 + 3.3 log n Donde M es el numero de clases Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos LimitesdeClases:Sonlascotas,fronterasovalores mnimosymximosdecadaclase,esdecir,cadaclase tendrunvalormnimodondeseiniciayunvalormximo queindicahastadondellegaelrecorridodelavariable dentro de cada clase. De esta manera se definen: li= limite inferior de la clase i, valor mnimo de la clase ls= limite superior de la clase i, valor mximo de la clase Los Limites de Clases deben ser Mutuamente Excluyentes y no presentar ambigedades. Sedebeevitarexpresarellimitedeclaseencifras decimalesparaevitarcomplicacionesenelmanejodela informacin. Las Clases Abiertas son aquellas en las cuales no se define o el primer limite inferior o el ltimo limite superior o ambos a la vez. No se aconseja su uso ya que dificultanel manejo de los datos una vez agrupados. Tablas Estadsticas Caso Nro 3: La Variable Tiene Muchos Valores Distintos Marca de Clases: XiEsunvalorquerepresentaatodos losvaloresdesuclase.Eselpuntomediodecada clase. Se calcula a travs de la siguiente frmula: 2's iil lX+=Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Histograma: Diagrama de barras verticales en el que se construyen barras rectangulares en los limites de cada clase. Caractersticas de construccin: Las frecuencias de clase (fi) se representan en el eje de las ordenadas (Y) y los intervalos de clase (ic) se representan en el eje de las abscisas (X). Cuando ic es variable, es necesario calcular la densidad de la frecuencia de clase (di) con el fin de poder comparar en las mismas unidades las diferentes clases. di = fi/ic Grficos de Distribucin de Frecuencia (Variable Continua) Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Grficos de Distribucin de Frecuencia (Variable Continua) Ojivas: Son grficos de distribucin de frecuencia acumulativa que se forman sobre una base o criterio menor que o mayor que Caractersticas de Construccin: El eje de las abscisas esta representado por los limites (inferior o superior) de los intervalos de clase segn sea el caso, y el eje de las ordenadas por la frecuencia acumulada (Fi). En el caso del criterio menor que se trabaja con los limites superiores de cada clase. En el caso mayor que se trabaja con los limites inferiores. Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Grficos de Distribucin de Frecuencias (Variable Continua) Polgono de Frecuencia: Es un grafico que se obtiene a partir de la unin de una serie de puntos, cuyas coordenadas son la marca de la clase (eje X) y la frecuencia (eje Y) para cada clase. Caractersticas de Construccin: Se determinan las marcas que estarn representadas en el eje de las abscisas, y se conecta cada marca de clase con su correspondiente frecuencia ubicada en el eje de las ordenadas. Se unen los puntos. Siempre se parte de una marca de clase imaginaria a la primera marca de clase real y a la ultima, para poder completar y cerrar el rea debajo del polgono de frecuencia. Se puede construir un polgono partiendo de un histograma de frecuencia. Estadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Tabla de contingencia paraX: cualitativa Y: cualitativa Tablas Estadsticas: Tablas de Contingencia Donde: A1, A2, A3, ... , An son las modalidades de XB1, B2, B3, ... , Anson las modalidades de Y f11 : es la cantidad de observaciones para la modalidad 1 de X y la modalidad 1 de Y f1n : es la cantidad de observaciones para la modalidad 1 de X y la modalidad n de Y fn2 :eslacantidaddeobservacionesparalamodalidadndeXyla modalidad 2 de Y f1. : es la cantidad total de observaciones para la modalidad 1 de Y f.1 : es la cantidad total de observaciones para la modalidad 1 de X En General: fij:eslacantidadtotaldeobservacionesparalamodalidadideXyla modalidad j de Y fi. : es la cantidad total de observaciones para la modalidad i de Yf.j : es la cantidad total de observaciones para la modalidad j de X Titulo Fuente YX A1 A2 A3 . . . An f i .B1 f11f12f13.. . f1nf1.B2 f21f22f23.. . f2nf2.B3 f31f32f33.. . f3nf3.. .. . .. . .. . .. . .. . .. .. . .. . .. . f i j.. . .. .. . .. . .. . .. . .. . .Bn fn1fn2fn3.. . fnnfn.f . jf.1f.2f.3.. . f.nnEstadstica Descriptiva Tema 3: Descripcin de los Conjuntos de Datos Permitenagruparlosdatoscorrespondientesala observacin de dos caractersticas de la poblacin en forma conjunta. Para ello se definen: X: Variable 1 Y: Variable 2 Lascualespuedencorresponderavaloresdedatos cualitativosocuantitativos,tantodiscretoscomo continuos. Alrealizarlaobservacindelosdoscaracteresenuna poblacin o muestra de tamao n se obtienen n pares de observaciones de la siguiente forma: (X1,Y1) , (X2,Y2) , (X3,Y3) , (X4,Y4). . .. . . (Xn,Yn) Estosparessepresentanenunatabladecontingenciade acuerdoalacombinacindelostiposdedatosquese estudian, pudiendo ser: X: cualitativa Y: cualitativa X: cualitativa Y: cuantitativa viceversa X: cuantitativa Y: cuantitativa viceversa Encualquiercasolatabladecontingenciapresentauna seriedecolumnasconlasmodalidades,valoresoclasesde lavariableYyunaseriedefilasconlasmodalidades, valores o clases de la variable X Tablas Estadsticas: Tablas de Contingencia