139
Prof. Eliana Guzmán U. S Semestre U2014

Unidad 1 Esta Di Stica

  • Upload
    conny

  • View
    229

  • Download
    8

Embed Size (px)

DESCRIPTION

Estadistica Descriptiva

Citation preview

  • Prof.ElianaGuzmnU.S SemestreU2014

  • ConceptodeEstadsticay Serefiereaunconjuntodemtodosparamanejarlaobtencin,presentacin yanlisis deobservacionesnumricasobservacionesnumricas.

    Tema 1.. Introduccin

  • ConceptodeEstadsticay Susfinessondescribir alconjuntodedatosobtenidosytomardecisiones orealizargeneralizaciones acercadelascaractersticasdetodaslasobservacionesbajolascaractersticasdetodaslasobservacionesbajoconsideracin.

    Tema 1.. Introduccin

  • reasqueconformanalaEstadsticaE d i D i i (D d i ) l y EstadsticaDescriptiva(Deductiva):eslaencargadadelaorganizacin,condensacin,presentacin delosdatosentablasygrficosypresentacin delosdatosentablasygrficosydelclculo demedidasnumricasquepermitanestudiarlosaspectosmsimportantesdelosdatos. Tem

    a 1.. Introdu

    DESCRIBIRDESCRIBIR

    ccin

  • reasqueconformanalaEstadsticaE d i I f i l I f i E d i y EstadsticaInferencialoInferenciaEstadstica:estdefinidaporunconjuntodetcnicas,mediantelascualessehacengeneralizacionesomediantelascualessehacengeneralizacionesosetomandecisiones enbaseainformacinparcialobtenidamediantetcnicasdescriptivas.

    Tema 1.INFERIRINFERIR . Introdu

    INFERIRINFERIR

    ccin

  • reasdeAplicacindelaEstadsticay ElusodelaEstadsticaesmu amplio Resultadifcily ElusodelaEstadsticaesmuyamplio.Resultadifcilnombrarunreaenlacualnoseemplee.y Losmtodosestadsticoshanencontradoaplicacinen:y Gobiernoy NegociosCi i S i ly CienciasSociales

    y Ingenieray CienciasFsicayNaturalesC t ld C lid d

    Tema 1.y ControldeCalidad

    y ProcesosdeManufacturay Muchosotroscamposdelaactividadintelectual.

    . Introduccin

  • reasdeAplicacindelaEstadsticaE d b l i f ilid d l ly Estosedebealacrecientefacilidadconlacualsepuedenmanejargrandescantidadesdedatosnumricos debidoalusodenumricos,debidoalusode

    Tema 1.. Introduccin

  • ConceptosdePoblacinyMuestray Poblacin:eslacoleccindetodas lasposiblesmedicionesuobservacionesquepuedenhacersedeunavariablebajoestudiodeunavariablebajoestudio.

    Tema 1.. Introduccin

  • ConceptosdePoblacinyMuestray Seclasificaendoscategoras:y Finita:esaquellaqueincluyeunacantidadlimitada

    t bl d b i i di id did contabledeobservaciones,individuosomedidas.Siemprequeseaposiblealcanzar(contar)elnmerototaldetodaslasposiblesmediciones,seconsideracomofinitalapoblacin. Tem

    a 1.. Introduccin

  • ConceptosdePoblacinyMuestray Infinita:esaquellaqueincluyeungranconjuntodeobservacionesomedicionesquenopuedenalcanzarseporconteo Almenos hipotticamente noexistelmiteporconteo.Almenos,hipotticamente,noexistelmiteencuantoalnmerodeobservacionesqueelexperimentopuedegenerar.

    Tema 1.. Introduccin

  • ConceptosdePoblacinyMuestraM y Muestra:y esunconjuntodemedicionesuobservacionestomadasapartirdeunapoblacintomadasapartirdeunapoblacin.y esunsubconjuntodelapoblacin.

    Tema 1.. Introduccin

  • ConceptosdePoblacinyMuestray Muestraaleatoria:seconsideraaleatoriasiempreycuandocadaobservacin,medicinoindividuodelapoblacintengalamismaprobabilidaddeserpoblacintengalamismaprobabilidaddeserseleccionado.

    Tema 1.. Introduccin

  • Definicindevariableydatosy Variables:y sonlascaractersticasoloqueseestudiadecadaindividuodelamuestra.Ej:sexo,edad,peso,estatura,colordeojos,estadocivil,temperatura,cantidaddenacimientos,presin,grosor,dimetro,...p g

    y Datos:y sonlosvaloresquetomalavariableencadacaso.

    Tema 1.. Introduccin

  • Tiposdedatosy Cualitativos:sondatosquesolotomanvaloresasociadosalascualidadesoatributos,clasificndolosenunadevariascategoras esdecir nosonvaloresnumricos Ej:variascategoras,esdecir,nosonvaloresnumricos.Ej:y Sexo:f/m.y Hbitodefumar:Fumador/Nofumadory Colordeojos:negro,azul,marrn,y Religin:catlica,evanglica,y Estadocivil:soltero casado divorciado

    Tema 1.y Estadocivil:soltero,casado,divorciado, . Introduccin

  • Tiposdedatosy Cuantitativos:provienendevariablesquepuedenmedirse,cuantificarseoexpresarsenumricamente.Ejemplos:Ejemplos:y Pesoy Edady Estaturay Presiny Humedad

    Tema 1.y Humedad

    y Intensidaddeunsismoy Cantidaddehermanos

    . Introduccin

  • Escalasdemediday Tiposdevariablescuantitativas:y Discretas:esaquellaquesolopuedetomarunnmerofi it i fi it bl d l Ej l tid dfinitooinfinitonumerabledevalores.Ejemplo:cantidaddehermanos.y Continuas:eslavariablequepuedetomarcualquierq p qvalorenunaescalacontinua.Ejemplo:cantidaddelquidocontenidoenunrecipiente.

    Tema 1.. Introduccin

  • Escalasdemediday EscalaNominal.y EscalaOrdinal.

    Variables Cualitativas

    y EscaladeIntervalos.y EscaladeRaznoProporcin. Variables

    Cuantitativasy EscalaAbsoluta.

    Cuantitativas Tema 1.. Introduccin

  • Escalasdemediday Escalanominal:losdatossepuedenagruparencategorasquenomantienenunarelacindeordenentresi porlotantonoestndefinidasordenentresi,porlotantonoestndefinidaslasoperacioneslgicas(>,
  • Escalasdemediday Escalaordinal:existeunciertoordenojerarquaentrelascategoras(>,
  • Escalasdemediday EscaladeIntervalos:valoresnumricosdelasvariablesyademsdelasrelacionesdeorden(>,

    ) d bl di i d i

  • Escalasdemediday Ejemplo:temperatura,nivelderuido,movimientosssmicos.

    Tema 1.. Introduccin

  • EscalasdemedidaE l d i l l t y Escaladeraznoproporcin:eslamscompletaygeneraldetodaslasescalas.Secaracterizaporquelosvaloresdelavariablesonnmerosentreloscuales,ademsdelasrelacionesdeorden(>,
  • Escalasdemediday EscalaAbsoluta:secaracterizaporquelosvaloresquetomalavariablesonelresultadodecontar yporlotanto,estconstituidaporlosenterospositivosyeltanto,estconstituidaporlosenterospositivosyelcero.y Ejemplos:nmerodehermanos,cantidaddeautos

    did id dd id i i vendidos,cantidaddeaccidentesenunainterseccin,cantidaddehijos,

    Tema 1.. Introduccin

  • DatosUnivariantesyMultivariantesy Univariantesounidimensionales:slorecogeninformacinsobreunacaracterstica(Ej:edaddelosalumnosdeunaclase).alumnosdeunaclase).y Bivariantesobidimensionales:recogeninformacinsobredoscaractersticasdelapoblacin.(Ej:edady

    d l l d l )estaturadelosalumnosdeunaclase). Tema 1.. Introduccin

  • DatosUnivariantesyMultivariantesy Multivariantesopluridimensionales:recogeninformacinsobretresmscaractersticas.(Ej:edad,estaturaypesodelosalumnosdeunaclase)estaturaypesodelosalumnosdeunaclase).

    Tema 1.. Introduccin

  • AbusosquesepuedencometerconlaEstadstica

    y Conclusioneserrneasdebidoaquelosdatossonnumricamenteinsuficientes.y Representacionesgrficasengaosas(escalas).y Datosmuestralesnorepresentativos:y Muestraquenoincluyeaelementosdetodalapoblacin.y Ciertascategorasdepersonasnorespondencorrectamente.

    Tema 1.

    y Respuestasvoluntarias(sesgadas).

    . Introduccin

  • TEMA2.ESTADSTICADESCRIPTIVA

  • Organizacindelosdatosy Unavezqueseharealizadolarecoleccinderealizadolarecoleccindelosdatos,seobtienendatosenbruto,loscuales

    f

    Tema 2.

    raravezsonsignificativossinunaorganizacinytabulacin.

    Estadstitabulacin. ca Descrriptiva

  • Organi acin de los datosOrganizacindelosdatosd l dy Formasdeorganizarlosdatos:

    y Unarreglo:eslaformamssencilladeorganizarlosdatosenbruto,consisteencolocarlasobservacionesen,ordensegnsumagnitud:ascendenteodescendente.

    y Pocoprcticacuandosetieneunagrancantidaddedatos.

    Tema 2. datos. Estadstica D

    escrriptiva

  • Organi acin de los datosOrganizacindelosdatosU di t ib i d f i l y Unadistribucindefrecuencias:esunarreglodelosdatosquepermiteexpresarlafrecuenciadeocurrenciasdelasobservacionesencadaunadelasclases mostrandoelpatrndeladistribucinlasclases,mostrandoelpatrndeladistribucindemaneramssignificativa.

    Tema 2.

    Clase Pto.Medio

    fi Fi fri FRi

    Estadstica Descrriptiva

  • Organizacindelosdatosy LaDistribucindeFrecuencias:y Serecomiendasuusocuandosetienengrandes

    tid d d d t ( )cantidadesdedatos(n).y Suconstruccinrequiere,enprimerlugar,laseleccindeloslmitesdelosintervalosdeclase.

    Tema 2.

    y Paradefinirlacantidaddeintervalosdeclase(k),sepuedeusar:y LaregladeSturges:k=1+3.3log(n)

    EstadstiLaregladeSturges:k 1+3.3log(n)y k=n

    ca Descrriptiva

  • Organizacin delosdatosy Lacantidaddeclasesnopuedesertanpequeo(menosde5)otangrande(msde20),quelaverdaderanaturalezadeladistribucinseaverdaderanaturalezadeladistribucinseaimposibledevisualizar.y Laamplituddetodaslasclasesdeberserlamisma.Serecomiendaqueseaimparyquelospuntos

    Tema 2. Serecomiendaqueseaimparyquelospuntos

    mediostenganlamismacantidaddecifrassignificativasquelosdatosenbruto.y Loslmitesdelasclasesdebentenerunacifra

    Estadstiy Loslmitesdelasclasesdebentenerunacifrasignificativamsquelosdatosenbruto.

    ca Descrriptiva

  • Organizacindelosdatosy Determinar:y Puntomedio=(Li+Ls)/2.y Frecuenciaabsolutadelaclase(fi).y Frecuenciaacumuladadelaclase(Fi).y Frecuenciarelativadelaclase(fr ):

    Tema 2. y Frecuenciarelativadelaclase(fri):

    y fri =fi/n

    y Frecuenciarelativaacumuladadelaclase(Fri).

    Estadsti( i) ca Descrriptiva

  • EjemplodeDistribucindeFrecuencias

    Acontinuacinsepresentanlaslifi i d 6 t di t calificacionesde60estudiantes

    quepresentaronlaPINAenel

    Tema 2.

    ao2010:

    Estadstica Descrriptiva

  • EjemplodeDistribucindeFrecuencias2360793257745270823680778195416592855576

    6 8 8 88 6521064757825809881674171835464728862744360788976844884901579

    Tema 2.

    34671782697463808561

    a)Construyaunadistribucindefrecuencias.

    Estadstia)Construyaunadistribucindefrecuencias.b)Qupuedeconcluirdeestosdatos?

    ca Descrriptiva

  • EjemplodeDistribucindeFrecuenciasAntesdeconstruirladistribucindefrecuencia,sevaaobtenerelarreglodeestosdatos,enestecaso,ordenadosdemenoramayor:demenoramayor:

    10 15 17 23 25 32 34 36 414143 48 52 52 54 55 57 60 606143 48 52 52 54 55 57 60 606162 63 64 64 65 67 67 69 707172 74 74 74 75 76 76 77 787872 74 74 74 75 76 76 77 787879 79 80 80 80 81 81 82 828384 84 85 85 88 89 90 92 959884 84 85 85 88 89 90 92 9598

  • EjemplodeDistribucindeFrecuencias1) Determinarlacantidaddeclases(k)aemplear:

    y LaregladeSturges:k=1+3.3log(n)=6.86 7clases.y k=n=60=7 75 8clasesy k=n=60=7.75 8clases.Qucantidaddeclaseusar,7u8?

    2) Calcularlaamplitud(A)delasclasesausar:

    Tema 2.

    y Calcularelrangodelosdatos(R):R=ObsermayorObsermenor,R=9810=88puntos.

    y A=R/k,aproximaraunvalorunpocomayorqueelobtenido

    Estadsti

    paraasegurarquelasclasesvanaabarcaralconjuntocompletodelosdatos.A=88/7=12,57 12.6

    ca Descrriptiva

  • EjemplodeDistribucindeFrecuencias3. Determinarellmiteinferiordelaprimeraclasea

    usar.Li=9.9D i ll i i d l i l 4. Determinarellmitesuperiordelaprimeraclase,sumanalLihalladoenelpasoanteriorlaamplituddelaclases Ls=9 9+12 6=22 5

    Tema 2. delaclases.Ls=9.9+12.6=22.5

    Setienelaprimeraclasecomo9.9 22.53. Determinarelrestodelasclases,usandocomolmite

    Estadsti3. Determinarelrestodelasclases,usandocomolmiteinferiordecadauna,allmitesuperiordelaclaseanterior.

    ca Descrriptiva

  • Clase Pto.Medio

    fi Fi fri FRi9.9-22.5

    22.5-35.1

    35.1-47.7

    47 7-60 3

    Tema 2. 47.7 60.3

    60.3-72.9

    Estadsti

    72.9-85.5

    85 5 98 1

    ca Descr

    85.5-98.1

    riptiva

  • EjemplodeDistribucindeFrecuencias4. Calcularelpuntomediodecadaclase:Puntomedio=

    (Li+Ls)/2.Determinarlafrecuenciaabsolutadelaclase(f ) 5. Determinarlafrecuenciaabsolutadelaclase(fi),contandolacantidaddedatosquepertenecenacadaclase.

    Tema 2.

    6. Determinarlafrecuenciaacumuladadelaclase(Fi).7. Determinarlafrecuenciarelativadelaclase(fri):

    f f /

    Estadsti

    y fri =fi/n

    8. Determinarlafrecuenciarelativaacumuladadelaclase(Fri)

    ca Descrclase(Fri). riptiva

  • a)

    Clase Pto.Medio

    fi Fi fri Fri9.9-22.5 16 3 3 0.05 0.05

    22.5-35.1 29 4 7 0.07 0.12

    35.1-47.7 41 4 11 0.07 0.19

    47 7-60 3 54 8 19 0 13 0 32

    Tema 2. 47.7 60.3 54 8 19 0.13 0.32

    60.3-72.9 67 12 31 0.2 0.52

    Estadsti

    72.9-85.5 79 23 54 0.38 0.90

    85 5 98 1 92 6 60 0 1 1

    ca Descr

    85.5-98.1 92 6 60 0.1 1

    riptiva

  • EjemplodeDistribucindeFrecuenciasb) EnestaPINAlomasfrecuenteesquelosestudiantes

    obtengancalificacionesentre60y85puntos,ymenosfrecuentescalificacionesmayoresa85omenosfrecuentescalificacionesmayoresa85omenoresa35puntos.Un38%delosestudiantesobtuvieronentre72y85

    Tema 2. Un38%delosestudiantesobtuvieronentre72y85

    puntos.Un81%delosestudiantesaprobaronestaPINA,

    Estadstipsiendounporcentajemuybueno.

    ca Descrriptiva

  • Representacingrficadelosdatos

  • Representacingrficadelosdatosy Losgrficospermitenvisualizarenformaglobalyrpidaelcomportamientodelosdatos.P d t tit ti d l y Paradatoscuantitativosagrupadosenclases,comnmenteseutilizantresgrficos:y Histogramas.

    Tema 2. g

    y Polgonodefrecuencias.y OjivaoPolgonodefrecuenciasacumuladas.

    Estadstica Descrriptiva

  • HistogramaSeobtienegraficandoenelejedelasX,loslmitesdelasclases,yenelejedelasY,lafrecuenciaabsolutadecadaclase(fi)cadaclase(fi).

    Losrectngulosqueseobtienensedebengraficarunidos

    Tema 2. unidos. Estadstica D

    escrriptiva

  • Representacingrficadelosdatos

    Histograma

    Tema 2. Estadstica D

    escrriptiva

  • Polgonodefrecuencias:SeobtienegraficandoenelejedelasX,lospuntosmediosdelasclases(mi),yenelejedelasY,lafrecuenciaabsolutadecadaclase(fi)frecuenciaabsolutadecadaclase(fi).

    Lospuntosobtenidosseunenusandosegmentosdelneasrectas

    Tema 2. lneasrectas. Estadstica D

    escrriptiva

  • Representacingrficadelosdatos

    Tema 2. Estadstica D

    escr

    Histograma y Polgono de Frecuencias

    riptiva

  • OjivaSeobtienegraficandoenelejedelasX,ellmitesuperiordelasclases,yenelejedelasY,lafrecuenciasrelativasacumuladasdecadaclase(Fri)acumuladasdecadaclase(Fri).

    Lospuntosobtenidosseunenusandosegmentosdelneasrectas

    Tema 2. lneasrectas.

    EstagrficoiniciadesdeelejedecoordenadasX.

    Estadstica Descrriptiva

  • Representacingrficadelosdatos

    Ojiva

    Tema 2. Estadstica D

    escrriptiva

  • Representacingrficadelosdatosy Paradatoscualitativosseusan:y Barras:seusaparavariablescualitativasquesemiden

    d l t t i l di lusandounaescala,tantonominalcomoordinal.SeobtienegraficandoenelejedelasX,lascategorasdelavariableenestudio,yenelejedelasY,lafrecuencias

    Tema 2. , y j ,

    absolutadecadacategora(fi).Lasbarrassedibujanseparadas.

    Estadstica Descrriptiva

  • Representacingrficadelosdatos

    Barras

    Barras

  • Representacingrficadelosdatosy Curvas:seusaparavariablescualitativasquesemidenusandounaescalaordinal.SeobtienengraficandoenelejedelasX lavariableSeobtienengraficandoenelejedelasX,lavariabletiempo,yenelejedelasY,losvaloresdelavariableenestudio.

    Tema 2.

    Algunosautoresdenominanaestetipodegrficocomoseriesdetiempooseriescronolgicas.

    Estadstica Descrriptiva

  • Representacingrficadelosdatos

    Tema 2.

    Curvas

    Estadstica Descrriptiva

  • Representacingrficadelosdatosy Sectores,tortaocircular:seusaparavariablescualitativasquese

    midenusandounaescala,tantonominalcomoordinal.Seobtienedividiendoauncrculoensectores,cuyotamaoesSe obt e e d d e do a u c cu o e secto es, cuyo ta a o esproporcionalalafrecuenciadecadacategoradelavariable.Seemplealasiguienteexpresinparacalculareltamaodecadasector:Sector=fri*360

    Tema 2. sector:Sector=fri 360 .

    Algunosautoresprefierenpresentarestegrficousandoporcentajes:Sector=(fi*100)/n.

    Estadstica Descrriptiva

  • Representacingrficadelosdatos

    Sector torta o circular

    Tema 2. Sector, torta o circular Estadstica D

    escrriptiva

  • Ejemplodeconstruccindegrficos

    Tema 2. Estadstica D

    escrriptiva

  • Para el ejemplo de las calificaciones de laParaelejemplodelascalificacionesdelaPINA2010:Histograma:

    22

    24

    fi

    16

    18

    20

    Tema 2.

    10

    12

    14

    Estadsti

    2

    4

    6

    8

    ca Descr

    2LmitesdeClase(calificacinenpuntos)9.9 35.122.5 47.7 60.3 72.9 85.5 98.1

    riptiva

  • Para el ejemplo de las calificaciones de laParaelejemplodelascalificacionesdelaPINA2010:Polgonodefrecuencias: 22

    24

    fi

    14

    16

    18

    20

    Tema 2.

    8

    10

    12

    14

    Estadsti

    2

    4

    6

    8 ca Descr

    Puntomediodeclase(calificacinenpuntos)2916 41 54 67 79 92

    riptiva

  • l h l dEscomnpresentarelhistogramaypolgonodefrecuenciasenunmismogrfico:

    22

    24

    fi

    14

    16

    18

    20

    Tema 2.

    8

    10

    12

    14

    Estadsti

    2

    4

    6

    8 ca Descr

    LmitesdeClase(calificacinenpuntos)9.9 35.122.5 47.7 60.3 72.9 85.5 98.1

    riptiva

  • Para el ejemplo de las calificaciones de laParaelejemplodelascalificacionesdelaPINA2010:Ojiva:

    1

    Fri

    0.7

    0.8

    0.9

    Tema 2.

    0.4

    0.5

    0.6

    Estadsti

    0.1

    0.2

    0.3

    Lmitesuperiordeclase

    ca Descr

    (calificacinenpuntos)35.122.5 47.7 60.3 72.9 85.5 98.1

    riptiva

  • MedidasdeTendenciaCentral

  • Medidasdetendenciacentraloposiciny Correspondenavaloresquegeneralmenteseubicanenlapartecentraldeunconjuntodedatos.F l d d d l y Formacomolosdatospuedencondensarseenunsolovalorcentralalrededordelcualtodoslosdatosmuestralessedistribuyen

    Tema 2. muestralessedistribuyen. Estadstica D

    escrriptiva

  • Medidasdetendenciacentraloposiciny Lasmedidasdetendenciacentralmsimportantesson:

    M di A i i A i i d dy Media:AritmticayAritmticaponderada.y Mediana.y Moda

    Tema 2. y Moda. Estadstica D

    escrriptiva

  • MediaAritmticay Eslasumadetodaslasobservacionesdivididaentreelnmero

    totaldeobservaciones.y Expresadadeformamsintuitiva,podemosdecirquelamediaExpresadadeformamsintuitiva,podemosdecirquelamedia

    aritmticaeslacantidadtotaldelavariabledistribuidaapartesigualesentrecadaobservacin.(wikipedia)

    y Porejemplo,sienunahabitacinhaytrespersonas,lamedia

    Tema 2. j p , y p ,

    dedineroquetienenensusbolsillosseraelresultadodetomartodoeldinerodelostresydividirloapartesigualesentrecadaunodeellos.Esdecir,lamediaesunaformaderesumirlai f i d di t ib i (di lb l ill )

    Estadsti

    informacindeunadistribucin(dineroenelbolsillo)suponiendoquecadaobservacin(persona)tendralamismacantidaddelavariable.(wikipedia)

    ca Descrriptiva

  • ClculodelamediaaritmticaP d dy Paradatosnoagrupados:

    xnn

    xX i

    i== 1

    Tema 2.

    fmk

    ii{ Para datos agrupados:

    Estadsti

    n

    fX i

    ii== 1

    Donde: mi: punto medio de la clase i

    ca DescrDonde: mi: punto medio de la clase i

    fi: frecuencia absoluta de la clase ik: cantidad de clases

    riptiva

  • Medianay Eselvalorqueocupalaposicincentraldeunconjuntodeobservaciones,unavezquehansidoordenadosenformaascendenteodescendenteordenadosenformaascendenteodescendente.y Dividealconjuntodedatosendospartesiguales.

    Tema 2. Estadstica D

    escrriptiva

  • Clculodelamedianay Paradatosnoagrupados:y Sinesimpar:posicindondeseubicalamedianaesi l ( )/iguala(n+1)/2.y Sinespar:(n+1)/2noesentero,porlotantolamedianaserigualalpromediodelasdosposicionescentrales.

    Tema 2. g p p Estadstica D

    escrriptiva

  • Clc lo de la medianaClculodelamedianaD d l di l y Datosagrupados:clasemedianaeslaquecontienealaobservacinqueocupalaposicinn/2.p /

    CxFn

    LMdm )(2

    11+

    Tema 2.

    Cmxf

    LmMdm )(

    2+=

    Donde: Lm: lmite inferior de la clase mediana.

    Estadstio de te e o de a c ase ed a aF(xm-1): frecuencia acumulada de la clase

    anterior a la clase mediana.f(xm): frecuencia absoluta de la clase mediana.Cm: amplitud de la clase mediana

    ca Descr

    Cm: amplitud de la clase mediana.

    riptiva

  • Moday Observacinoclasequetienelamayorfrecuenciaenunconjuntodeobservaciones.U j d d d i d l bi d l y Unconjuntodedatospuedeserunimodal,bimodalomultimodal.y Eslanicamedidadetendenciacentralquesepuede

    Tema 2. y Eslanicamedidadetendenciacentralquesepuede

    determinarparadatosdetipocualitativo.

    Estadstica Descrriptiva

  • Clc lo de la modaClculodelamodaP d d i l l y Paradatosnoagrupados:essimplementelaobservacinquemsserepite.y Paradatosagrupados:y Paradatosagrupados:

    CmLimMo 1+=

    Tema 2.

    21 +Donde: Lim: lmite inferior de la clase modal.

    dif i t f d l l d l l

    Estadsti1: diferencia entre fi de la clase modal y la anterior.

    2: diferencia entre fi de la clase modal y la posterior.

    ca Descrposterior.

    Cm: amplitud de la clase modal (clase de mayorfrecuencia).

    riptiva

  • Relacinentrelamedia,lamedianaylamoda

    Tema 2. Estadstica D

    escrriptiva

    Cuando los datos son sesgados es mejor emplear la Md

  • Ejemplodelosclculosdelasmedidasdetendenciacentral:medidasdetendenciacentral:XMedia

    Tema 2.

    XMedianaM d

    EstadstiXModa ca Descrriptiva

  • Media:datosNOagrupados

    xn Tem

    a 2.

    puntosn

    xX i

    i

    48,6560

    392960

    618560231 ==++++=== L

    Estadstica Descrriptiva

  • Media:datosagrupados

    692237912678544414293161 ++++++ fmk

    iii Tem

    a 2.

    60692237912678544414293161 ++++++== =

    nX i

    k Estadstipuntosnfm

    X iii

    55,6560

    39331 ====

    ca Descrriptiva

  • Mediana:datosNOagrupadosParadeterminarlaposicinqueocupalamediana,sedebenordenarlosdatosdeformaascendenteodescendente Enestecasolosordenamosdeformadescendente.Enestecasolosordenamosdeformaascendente:

    10 15 17 23 25 32 34 36 414110 15 17 23 25 32 34 36 414143 48 52 52 54 55 57 60 606162 63 64 64 65 67 67 69 707162 63 64 64 65 67 67 69 707172 74 74 74 75 76 76 77 787879 79 80 80 80 81 81 82 828379 79 384 84 85 85 88 89 90 92 9598

  • Mediana:datosNOagrupadosSedebedeterminarsinesparoimpar,enestecasonespar,porlo

    tantoalbuscarlaposicincentralsetiene:

    1601 5.302160

    21 =+=+n

    Porlotanto,sedebeobtenerelpromediodelosdatosqueocupanlasposicionescentrales30y31:

    puntosMd 5,7127271 =+=

  • Mediana:datosagrupadosSedebedeterminarlaclasemediana,quecorrespondealaclase

    quecontienealaobservacinqueocupalaposicinn/2:Ennuestroejemplolaobservacinqueocupalaposicin30es71Ennuestroejemplolaobservacinqueocupalaposicin30es71

    puntos,porlotantolaclasemedianasera:

    6 6

    Alaplicarlafrmulasetiene:

    60,372,9 67 12 31 0,2 0,52

    Alaplicarlafrmulasetiene:

    puntosCmxFn

    LmMdm

    387261219

    2160

    360)(

    21

    1 =+

    +=+

    += puntosCmxf

    LmMdm

    38,726,1212

    3,60)(

    ++

  • Moda:datosNOagrupadosLamodacorrespondealdatouobservacinquemsvecesserepite.

    E j l l b i Enesteejemplolasobservaciones:74puntosy80puntosserepiten3vecescadauna,porestaraznsetieneunconjuntodedatosbimodalconjuntodedatosbimodal.

    Mo1=74puntos.Mo2=80puntos.Mo2 80puntos.

  • Moda:datosagrupadosSedebedeterminarlaclasemodal,quecorrespondealaquetenga

    lamayorfrecuenciaabsoluta(fi).Ennuestroejemplolaclasemodalsera:Ennuestroejemplolaclasemodalsera:

    72.985.5 79 23 54 0.38 0.90

    Porlotanto,aplicandolafrmula:

    )1223(

    tM

    CmLimMo

    8577

    6.12)623()1223(

    )1223(9.7221

    1 ++=+

    +=puntosMo 85.77=

  • Qu informacin se puede obtener deQuinformacinsepuedeobtenerdelasmedidasdetendenciacentral?y Media:lamediaaritmticadeestas60calificaciones,fuede65,55puntos,loqueindicaqueenpromediolosestudiantesobtuvieronbuenascalificacionesquelesestudiantesobtuvieronbuenascalificacionesquelespermitiaprobarlaPINA.y Mediana:lamedianafueiguala71,5puntos,loquei di l d l di b indicaquelamayoradelosestudiantesobtuvounabuenacalificacin.y Moda:esteconjuntodedatosesbimodal,tieneunaModa:esteconjuntodedatosesbimodal,tieneunamodade74puntosyotrade80puntos,peroestosvaloresnoesquetuvieranunafrecuenciamuchomayorquecualquierotrodato mayorquecualquierotrodato.

  • D b di d d l di i i 8 Debenestudiarporsucuenta,desdeladiapositiva83hastala93.Cualquierdudapuedenconsultarla.

  • Propiedades,ventajasydesventajasdelamediaPropiedades:y Lasumadelasdiferenciasentrelasmediamuestralyelvalordecadaobservacinescerovalordecadaobservacinescero.y Lamediadeunaconstanteeslaconstante.y Sitodaslasobservacionesxi semultiplicanporuna

    Tema 2. i

    constantea,laXtambinsedebemultiplicarporesemismovalorconstante.

    Estadstica Descrriptiva

  • Propiedades,ventajasydesventajasdelamediay SisesometeaunavariableestadsticaXauncambiodeorigenyescala,Y=a+bX,lamediaaritmticadedichavariableXvaraenlamismaproporcin dichavariableXvaraenlamismaproporcin.y Lamediadelasumadedosvariablesesigualalasumadesusmedias

    Tema 2. desusmedias. Estadstica D

    escrriptiva

  • Propiedades,ventajasydesventajasdelamediaVentajas:y Empleaensuclculotodalainformacindisponible.S l i id d l i bl y Seexpresaenlasmismasunidadesquelavariableenestudio.y Eselcentrodegravedaddetodaladistribucin,

    Tema 2. s e ce t o de g avedad de toda a d st buc ,

    representandoatodoslosvaloresobservados.y Esunvalornico.

    Estadstica Descrriptiva

  • Propiedades,ventajasydesventajasdelamediay Setratadeunconceptofamiliarparalamayoradelaspersonas.E il ll b di i d i y Estilparallevaracaboprocedimientosestadsticoscomolacomparacindemediasdevariosconjuntosdedatos

    Tema 2. datos. Estadstica D

    escrriptiva

  • Propiedades,ventajasydesventajasdelamediaDesventajas:y Seveadversamenteafectadaporvaloresextremos,perdiendorepresentatividadperdiendorepresentatividad.y Sielconjuntodedatosesmuygrandepuedesertediososuclculomanual.

    Tema 2.

    y Nosepuedecalcularparadatoscualitativos.y Nosepuedecalcularparadatosquetenganclasesdeextremoabierto tantosuperiorcomoinferior

    Estadstiextremoabierto,tantosuperiorcomoinferior. ca Descrriptiva

  • Ventajasydesventajasdelamediana

    Ventajas:y Fcildecalcularsielnmerodeobservacionesnoesmuygrande.y Noseveinfluenciadaporvaloresextremos,ya

    l i fl l l l

    Tema 2.

    quesoloinfluyenlosvalorescentrales.y Fcildeentender.

    Estadstica Descrriptiva

  • Ventajasydesventajasdelamedianay Sepuedecalcularparacualquiertiposdedatoscuantitativos,inclusolosdatosconclasedeextremoabiertoabierto.y Eslamedidadetendenciacentralmsrepresentativaenelcasodevariablesquesoloadmitenlaescala

    Tema 2. enelcasodevariablesquesoloadmitenlaescala

    ordinal.

    Estadstica Descrriptiva

  • VentajasydesventajasdelamedianaDesventajas:y Noutilizaensuclculotodalainformacindi ibldisponible.y Noponderacadavalorporelnmerodevecesqueseharepetido

    Tema 2. harepetido.

    y Hayqueordenarlosdatosantesdedeterminarla.

    Estadstica Descrriptiva

  • VentajasydesventajasdelamodaVentajas:y Norequiereclculos.P d d t t t tit ti y Puedeusarseparadatostantocuantitativoscomocualitativos.y Fcildeinterpretar.

    Tema 2. c de te p eta .

    y Noseveinfluenciadaporvaloresextremos.y Sepuedecalcularenclasesdeextremoabierto.

    Estadstica Descrriptiva

  • VentajasydesventajasdelamodaDesventajas:y Paraconjuntospequeosdedatossuvalorno

    i i ilid d i d h h i S l tienecasiutilidad,siesquedehechoexiste.Solotienesignificadoenelcasodeunagrancantidaddedatos.

    Tema 2.

    y Noutilizatodalainformacindisponible.y Nosiempreexiste,silosdatosnoserepiten.

    Estadstica Descrriptiva

  • Ventajasydesventajasdelamoday Enocasiones,elazarhacequeunasolaobservacinsenorepresentativaseelvalormsfrecuentedel

    j d dconjuntodedatos.y Difcildeinterpretarsilosdatostiene3omsmodas.

    Tema 2. Estadstica D

    escrriptiva

  • Medidas de dispersin, variacinMedidasdedispersin,variacinovariabilidad

  • Medidasdedispersin,variacinovariabilidad.y Sonvaloresnumricosqueindicanodescribenlaformaenquelasobservacionesestndispersasodi i d l l ldiseminadas,conrespectoalvalorcentral. Tem

    a 2. EstadstiX ca Descrriptiva

  • Medidasdedispersin,variacinovariabilidad.y Sonimportantesdebidoaquedosmuestrasdeobservacionesconelmismovalorcentralpuedentenerunavariabilidadmuydistintaunavariabilidadmuydistinta. Tem

    a 2. Estadstica Descrriptiva

  • Medidasdedispersin,variacinovariabilidad.y Rango.y Varianza.y DesviacinTpica.y Coeficientedevariacin.

    Tema 2. Estadstica D

    escrriptiva

  • Medidasdedispersin:RangoRango(amplitudorecorrido):y Estdeterminadoporlosdosvaloresextremosd l d l i l l delosdatosmuestrales,essimplementeladiferenciaentrelamayorymenorobservacin.y Esunamedidadedispersinabsoluta,yaque

    Tema 2. Esunamedidadedispersinabsoluta,yaque

    dependesolamentedelosdatosypermiteconocerlamximadispersin.

    Estadstica Descrriptiva

  • Medidasdedispersin:Rangoy Casinoseempleadebidoaquedependenicamentededosvalores.N i did d i bilid dd l y Noproporcionaunamedidadevariabilidaddelasobservacionesconrespectoalcentrodeladistribucin

    Tema 2. distribucin.

    y Notacin:R

    Estadstica Descrriptiva

  • Medidasdedispersin:Varianzay Esunvalornumricoquemideelgradodedispersinrelativaporquedependedelaposicindelosdatosx x x conrespectoalamediax1,x2,,xn conrespectoalamedia.y Eselpromedioalcuadradodelasdesviacionesdecadaobservacinconrespectoalamedia

    Tema 2. observacinconrespectoalamedia.

    y Notacin:s2,2,var(X)

    Estadstica Descrriptiva

  • Medidasdedispersin:Varianzay Silavarianzadeunconjuntodeobservacionesesgrandesedicequelosdatostieneunamayorvariabilidadqueunconjuntodedatosquetengavariabilidadqueunconjuntodedatosquetengaunvarianzamenor.

    ( )2n

    Tema 2. ( )

    1

    2

    2

    n

    xxs

    n

    ii

    ==

    EstadstiPara datos NOagrupados:

    21

    2

    2x

    nn

    ii

    =

    ca Descr

    agrupados:

    12 xn

    s i = = riptiva

  • Medidasdedispersin:VarianzaParadatosagrupadosenunadistribucindefrecuencias:

    ( )1

    2

    2fxm

    k

    iii

    =

    2

    12

    f

    ns

    k

    i=

    =

    ( )212

    2 xn

    fms i

    ii

    ==

  • Medidasdedispersin:DesviacinTpica

    E l d d d l iy Eslarazcuadradadelavarianza.y Notacin:s,.

    2ss =

    Tema 2. Estadstica D

    escrriptiva

  • Medidasdedispersin:CoeficientedeVariacin

    y Esunamedidadedispersinrelativaquepermitecompararelniveldedispersindedosmuestrascompararelniveldedispersindedosmuestrasdevariablesestadsticasdiferentes.y Notienedimensiones.

    Tema 2.

    y Notacin:CV

    Estadsti

    %100=xsCV

    ca Descrriptiva

  • Ejemplodelosclculosdelasj pmedidasdedispersin:

    RX Rango.X Varianza.

    Tema 2.

    X DesviacinTpica.

    Estadsti

    X CoeficientedeVariacin.

    ca Descrriptiva

  • Rango:RR=Observacinmayor ObservacinmenorR=98 10R 88puntosR=88puntos Tem

    a 2. Estadstica Descrriptiva

  • Varianza(S2):DatosNOagrupadosRecuerdequesepuedeusarcualquieradeestasdosexpresiones:

    ( )2

    2221

    2

    2 18.43960

    98.2635060

    )48.6561()48.6560()48.6523( puntosn

    xxs

    n

    n

    ii

    ==+++=

    == L

    2222221

    2

    2 62.43963.428725.472763.428760

    28363548.6560

    616023 puntosxn

    xs

    n

    ii

    ===+++=== L

  • Varianza(S2):DatosagrupadosRecuerdequesepuedeusarcualquieradeestasdosexpresiones:k ( )

    2

    2222

    1

    2

    2 51.40960

    6)55.6592(4)55.6529(3)55.6516( puntosn

    fxms

    k

    k

    iii

    =+++=

    =

    = L

    ( )22

    22222

    21

    2

    2

    52.409

    80.429660

    282379)55.65(60

    692429316

    puntoss

    puntosxn

    fms i

    ii

    ==+++=

    == L

    p

  • DesviacinTpica(S):DatosNOagrupados

    puntosss 96.2018.4392 === p

  • DesviacinTpica(S):Datosagrupados

    puntosss 24.2051.4092 === p

  • Coeficiente de Variacin (CV): Datos NOCoeficientedeVariacin(CV):DatosNOagrupados

    %01.32100*3201.0%100486596.20%100 ====

    xsCV

    48.65x

  • Coeficiente de Variacin (CV): DatosCoeficientedeVariacin(CV):Datosagrupados

    %87.30100*3087.0%100556524.20%100 ====

    xsCV

    55.65x

  • Qu informacin se puede obtener deQuinformacinsepuedeobtenerdelasmedidasdedispersin?y Rango:ladispersinmximadeesteconjuntodedatoses88puntos,queesunvalorsignificativamentegrandesisecomparaconlosvaloresquetomaestagrandesisecomparaconlosvaloresquetomaestavariable.Estoindicaquehayvaloresmuydistanciados,enestecasonotasdelaPINAmuybajasyotrasmuyaltasaltas.y Varianza:lavarianzacalculadaesde439.18puntos2,aunquesusunidadesestnalcuadrado,nosindicaqueq qesteconjuntodedatostieneunadispersinovariacinelevadaconrespectoalvalorcentral(media),loquesignificaqueestasnotasvaranmucho,esdecir,nosignificaqueestasnotasvaranmucho,esdecir,noestnconcentradasalrededordelvalorcentral.

  • Qu informacin se puede obtener deQuinformacinsepuedeobtenerdelasmedidasdedispersin?y Desviacintpica:tomaunvalorde20.96puntos,loqueindicaquelavariacindeestasnotasenlaPINAeselevada,yqueexistenestudiantesqueobtuvieronelevada,yqueexistenestudiantesqueobtuvieronnotasmuypordebajoymuyporencimadelamedia.y CoeficientedeVariacin:tomaunvalorde32.01%,i di d i i i l d indicandoqueexisteunavariacinelevadaenestasnotasdelaPINA.

  • D b di d d l di i i 6Debenestudiarporsucuenta,desdeladiapositiva116hastala122.Cualquierdudapuedenconsultarla.

  • VentajasyDesventajasdelRangoVentajas:y tilcuandosequiereconocerlaextensindelas

    i i ( l i d l di i )variacionesextremas(valormximodeladispersin).y Fcildecalcular.

    Tema 2. Estadstica D

    escrriptiva

  • VentajasyDesventajasdelRangoDesventajas:y NoesunaMDconrespectoalcentrodeladi ib idistribucin.y Soloempleadosvaloresensuclculo.N d l l di ib i d l i d

    Tema 2. y Nosepuedecalcularendistribucionesdelmitede

    claseabierto.

    Estadstica Descrriptiva

  • d d d lPropiedades,VentajasyDesventajasdelaVarianzaPropiedades:1. Siempreesmayoroigualaceroymenorqueinfinito.2. Lavarianzadeunaconstanteescero.3. SiaunavariableXlasometemosaY=a+bX,la

    i d Y V (Y) b2V (X)

    Tema 2.

    varianzadeYserVar(Y)=b2Var(X)

    Estadstica Descrriptiva

  • d d d lPropiedades,VentajasyDesventajasdelaVarianzaVentajas:y Estilcuandosecomparalavariabilidaddedosomsconjuntosdedatosconjuntosdedatos.y Utilizatodalainformacindisponible.Desventajas:

    Tema 2. j

    y Noproporcionaayudainmediatacuandoseestudialadispersindeunsoloconjuntodedatos.y Difcildeinterpretarportenersusunidadeselevadasal

    Estadstiy Difcildeinterpretarportenersusunidadeselevadasalcuadrado.

    ca Descrriptiva

  • VentajasyDesventajasdelaDesviacinTpicaVentajas:y Estaexpresadaenlasmismasunidadesquelavariable

    dienestudio.y Utilizatodaslasobservacionesensuclculo.F ild i

    Tema 2. y Fcildeinterpretar.

    Desventajas:y N ti

    Estadstiy Notiene. ca Descrriptiva

  • d l f dVentajasyDesventajasdelCoeficientedeVariacinVentajas:y EslanicaMDquepermitecompararelniveldedi i d d d i bl difdispersindedosmuestrasdevariablesdiferentes.y Empleatodalainformacindisponibleensuclculo.F ild l l

    Tema 2. y Fcildecalcular. Estadstica D

    escrriptiva

  • d l f dVentajasyDesventajasdelCoeficientedeVariacinDesventaja:y NoesunaMDconrespectoalcentrodeladistribucind l ddelosdatos.

    Tema 2. Estadstica D

    escrriptiva

  • MedidasdeForma

  • MedidasdeFormay Sonmedidasnumricasquepermitendeterminarlaformaquetienelacurvadelosdatos,porlotanto,sirvenparacorroborarloquelosgrficosmuestransirvenparacorroborarloquelosgrficosmuestran. Tem

    a 2.

    Medidasde forma

    -Asimetra

    -Kurtosis o apuntamiento

    Coeficiente de PearsonCoeficiente de Fisher

    Estadstica Descrriptiva

  • MedidasdeForma:Asimetray Permitenestudiarlaformadelacurva,dependiendodecmoseagrupanlosdatos.

    Tema 2. Estadstica D

    escrriptiva

  • MedidasdeForma:AsimetraC fi i d A i d PCoeficientedeAsimetradePearson:y Fcildecalculareinterpretar.y Cl ly Clculo: ( )

    sMdXASP = 3

    Tema 2. s

    9 Interpretacin:= 0, X=Md Simtrica

    Estadsti

    ASP

    ,

    > 0, X>Md Asimtrica Positiva

    < 0 X

  • MedidasdeForma:AsimetraC fi i d A i d Fi hCoeficientedeAsimetradeFisher:y Noesdefcilclculo,perosisuinterpretacin.

    Tema 2. ( )3Xxn i Estadsti

    ( )( )3

    31

    fM

    nsASF

    k

    ii

    == Datos NO agrupados

    ca Descr

    ( )3

    1

    ns

    fxMASF i

    ii=

    = Datos Agrupados

    riptiva

  • MedidasdeForma:Asimetra

    9 Interpretacin:

    ASF

    = 0, Simtrica

    > 0, Asimtrica Positiva

    Tema 2.

    < 0, Asimtrica Negativa

    Estadstica Descrriptiva

  • MedidasdeForma:Kurtosisy Midensilosvaloresdeladistribucinestnmsomenosconcentradosalrededordelosvaloresmediosdelamuestra(zonacentraldeladistribucin).y Sedefinentrestiposdedistribucinsegnsugradod K t i

    Tema 2.

    deKurtosis:

    Estadstica Descrriptiva

  • MedidasdeForma:Kurtosisy Mesocrtica:gradodeconcentracinmedioalrededordelosvalorescentralesdelavariable.L i d d i l dy Leptocrtica:gradodeconcentracinelevado.y Platicrtica:gradodeconcentracinreducido.

    Tema 2. Estadstica D

    escrriptiva

  • MedidasdeForma:Kurtosis( )

    341

    4

    ==

    ns

    XxCK

    n

    ii

    Datos No Agrupados

    ( )34

    1

    4

    ==

    fXMCK

    nsk

    iii

    Datos Agrupados

    Tema 2.

    4nsDatos Agrupados

    9 Interpretacin:

    Estadsti

    CK

    =0 Mesocrtica

    >0 Leptocrtica

    ca Descr

  • Ejemplodelosclculosdelasj pmedidasdeforma:

    A i t X Asimetra:X CoeficientedePearson.

    Tema 2.

    X CoeficientedeFisher.K t i

    EstadstiX Kurtosis. ca Descrriptiva

  • Medidas de forma: Coeficiente deMedidasdeforma:CoeficientedePearson.y DatosNOagrupados:

    ( ) )5714865(33 MdX( ) 8616.096.20

    )5.7148.65(33 ===sMdXASP

    y Datosagrupados:

    ( ) )38725565(33 MdX( ) 0124.124.20

    )38.7255.65(33 ===sMdXASP

  • Medidas de forma: Coeficiente deMedidasdeforma:CoeficientedeFisher.y DatosNOagrupados:

    ( )3n ( )3

    333

    31

    3

    96.2060)48.6561()48.6560()48.6523(

    +++=

    == L

    ns

    XxASF i

    i

    9281.084.552490191.512769 ==

  • Medidas de forma: Coeficiente deMedidasdeforma:CoeficientedeFisher.y Datosagrupados:

    ( )3k ( )3

    333

    31

    3

    24.20606)55.6592(4)55.6529(3)55.6516(

    +++=

    == L

    ns

    fxMASF i

    ii

    9342.019497488885.464760 ==19.497488

  • Medidas de forma: Coeficiente deMedidasdeforma:CoeficientedeKurtosisy DatosNOagrupados:

    ( ) 4444 Xxn i( )3

    96.2060)48.6561()48.6560()48.6523(3 4444

    41

    +++=== L

    ns

    XxCK i

    i

    1172.031172.3309.1158020897.36097814 ===

  • Medidas de forma: Coeficiente deMedidasdeforma:CoeficientedeKurtosisy Datosagrupados:

    ( )4 fXMk ( )3

    24.20606)55.6592(4)55.6529(3)55.6516(3 4

    444

    41

    +++=

    == L

    ns

    fXMCK i

    ii

    0298.030298.3395.1006916036.30507377 ===

  • Qu informacin se puede obtener deQuinformacinsepuedeobtenerdelasmedidasdeforma?y CoeficientesdeAsimetra:alsersusvaloresmenoresquecero,indicanqueparaestascalificacionesdelaPINA,laasimetraesnegativa,porlotanto,laPINA,laasimetraesnegativa,porlotanto,lafrecuenciadelascalificacionesbajasesmenorquelafrecuenciadelascalificacionesaltas,esdecir,lamayoradelosestudiantessacaronbuenasmayoradelosestudiantessacaronbuenascalificaciones.y Kurtosis:alsersuvalormayoracero,indicaqueestasy qcalificacionestienenuncomportamientoleptocrtico,esdecir,existeunintervalodecalificaciones,quetieneunafrecuenciamuchamayorqueelrestodeposiblesunafrecuenciamuchamayorqueelrestodeposiblesvalores.

  • Referencias:yWikipedia(http://es.wikipedia.org/wiki/Wikipedia:Portada)W l l M P b bilid d E d i M GyWalpoleyMyers.ProbabilidadyEstadstica.McGrawHill.y Triola MarioF Estadstica Pearsony Triola,MarioF.Estadstica.Pearson.