Unidad 5 La Curva Normal

  • View
    38.545

  • Download
    7

Embed Size (px)

DESCRIPTION

Unidad 5 del curso "Una mirada a travs del lente estadstico".

Transcript

  • 1. 5. Distribucinnormal:Diosamalacurvanormal.Laestadsticaesunacienciasegnlacualtodaslasmentirassetornancuadros. Pitigrilli,escritoritaliano. ObjetivodelaUnidad: Identificar el comportamiento y distribucin de los datos a travs delosconceptosbsicosdelacurvanormalysusderivados. Introduccin. Antesdepodercomenzarconestaunidadtepedimosquerealicesdosejercicios. Resuelveelejercicio1antesdecontinuarleyendo 5.1.Quesladistribucinnormal? Cuando graficamos una variable en forma de histogramas o polgonos de frecuencias y observamos que los datos parecieran asemejar o tener una forma de campana entonces podramos pensar que la distribucin de dicha variable se aproxima a una distribucin matemticaprecisaeimportantedenominadadistribucinnormalo,simplemente,curvanormal.

2. Ladistribucinnormalsedefinecmo:Ladistribucindedatosdecualquiervariablequeasemejenlaformadeuna curvanormal. Lacurvanormalsedefinecmo:Unadistribucintericadelosdatosdeunapoblacin(Pagano,2008).Esuna curvaenformadecampanaquepuedeserdescritaconlasiguienteecuacin: /1 2Importante!Te presentamos la ecuacin nicamente para que conozcas que existe una base matemtica. No te preocupes tratando de descifrar qu significa (al menos para estecurso).Lacurvanormalpuedeserrepresentadacomo: 3. Ahorareflexionaunmomento.PorquelttulodelaunidadsetitulaDiosamalacurvanormal? Para qu estaremos estudiando la unidad? Porque casi todas las variables que puedan ser graficadasenunhistograma(enlanaturalezayenelcomportamientodelhombre)sedistribuyen deestaforma!Peroporqulacurvanormalestancomnenlanaturaleza?Larespuestaaesapreguntaquiznoexista.Sinembargoescuriosocmoesqueprcticamente cualquiercosaquepuedasermedidatieneestatendencia:Laestaturadelaspersonas,supeso,su IQ,lascalificacionesdeunexamen,eltamaolosrbolesdelacuadra,lacantidaddenubesque observo al da, el nmero de hojas de un arbusto, el nmero de cabellos de una persona, las graduacionesdeloslentesdelaspersonas,etctera(ylalistapodracontinuar).Paratratardeexplicarloadetalletomemos,porejemplo,lacantidaddeletraselegidasalazarque determinadapersonapuederecordar.Enalgunaspruebas,lacantidaddeletrasrecordadaspuede seralta,enotras,baja,yenlamayora,lascantidadessernintermedias.Esdecir,esprobableque la cantidad de letras elegidas al azar que una persona pueda recordar en diversas pruebas siga aproximadamentelaformadeunacurvanormal.Sin embargo, en alguna prueba en particular, el nmero real recordado se ver afectado por diversascircunstancias,talescomoruidoenlahabitacin,estadodenimodelapersonaenese momento,unacombinacindeletrasconfundidasinconscientementeconalgnnombrefamiliar, unasecuenciadeletraselegidasalazarqueresultasercasisiemprelamismaletra,etc.As, en general, la persona recuerda una cantidad media, una cantidad en la que todas las circunstancias contrapuestas se cancelan entre s, y por eso son mucho menos comunes las cantidadesmuyaltasomuybajasdeletrasrecordadas.Estocreaunadistribucinqueesunimodal,esdecir,lamayoradeloscasosestncercadelmedio y los menos estn en los extremos. Tambin crea una distribucin que es simtrica, porque cualquiervalorpuedeestartantoporarribacomopordebajodelmedio(lapodemosdoblarporla mitadyambosladosseranidnticos). 4. Lascaractersticasquedebeposeerunadistribucindedatosparaformarunacurvanormales:a. Unimodalidad:Sloexisteunasolamoda.Nohaymsdeunapuntuacinmsfrecuente. b. Simtrica:Sipartisemosalamitadlacurva,ambosladossonidnticos. 5. c. Mesocrtica:Lacurvanoesnimuyaplanadanimuypuntiaguda. d. Asinttica: Los dos extremos de la curva jams tocan el eje de las X. Esto permite quesiempreexistelaposibilidaddetoparnosconunvalormsaltoomsbajo. 6. e. Lamedia,lamedianaylamodaposeenlosmismosvaloresyseencuentranalcentrodelacurva(ladividenendos). Resuelveelejercicio2antesdecontinuarleyendo 7. 5.2. Ladesviacinestndarylavarianza. Imaginemosunmontculodearena: Ahorapensemosenlacantidad dearenaque existe.Conforme msnosacercamosalcentrode estemsaltoesy,mientrasnosalejamosmsdelcentroynosvamosalasorillaslacantidadde arena disminuye y tiene menor altura. Si dijramos que el montculo de arena mide de punta a punta1metropodramosafirmarlosiguiente:Siextrajsemos30centmetrosdearenadelcentro del montculo y extrajramos 30 centmetros de un extremo del montculo y pesramos ambas muestras, veramos que la cantidad de arena sera muy diferente; la arena del centro pesara muchomsquelapocaarenaextradadelaorillas.De igual forma que con la arena, la altura de una distribucin de datos indicara la cantidad de casosqueobtuvieronundeterminadovalor.Entremsnosacerquemosalcentrodelacurva,ms 8. casos encontraremos y viceversa; entre ms nos alejemos del centro de la curva, menos casos existirn.Sin dejar a un lado la analoga de la arena podramos decir que en lugar de hablar de centmetros, para la distribucin de datos existen desviaciones estndares. Las desviaciones estndaresseranloscentmetrosapartirdelcentrodelmontculodearena Ladesviacinestndarsedefinecmo:Lamedidaempleadaparaindicarqutanlejosesteldatoenbrutocon respectoalamediadesudistribucin(Pagano,2008).Ladesviacinesrepresentadaporunasenelcasodequeseacalculadaparala muestrayunasigma()enelcasodeunapoblacin.Lafrmuladeladistribucinestndar(paramuestras)es: 1Dondeneseltotaldesujetosyxeselvalordeunavariableparacadasujeto.EnSPSSladesviacinestndarsecalcula: a. Ingresarlosdatosdeunavariableydarformato.b. Darclicenanalizar,estadsticadescriptiva,frecuencias.c. Seleccionarlasvariablesenlasquesecalcularladesviacinestndar alcuadrodevariables.d. Darclicenelsubmenestadsticasyseleccionardesviacin estndaryvarianza.e. Darclicenaceptar. 9. Observalasiguientefigura:Enlaimagenanteriorsehadibujadounacurvanormal.Enestecasosetratadeunacurvaque representadatosobtenidosdeunapoblacin1.Lamediaestubicadaalcentrodelacurva()ylas lneasdibujadasacadaladosonloscentmetrosconrespectoalamedia.Esposibleafirmarque lalneadelextremoizquierdoeslamediamenosunadesviacinestndarylalneadelextremo derechoeslamediamsunadesviacinestndar.AhorasurgelapreguntaParaqusirveesto? 1Estolosabemosporquelossmbolossongriegosyportantoaludenaparmetrosynoaestadsticos, recuerdalaunidadsobrelosconceptosbsicosdelaestadstica. 10. Resuelveelejercicio3antesdecontinuarleyendo Observalassiguientesimgenes: Sinuevamenteempleramoslaanalogadelmontculodearenaeimaginramosquetodalaarena pesa100gramosentoncespodramosdecirqueaunadesviacinestndaraladerechadelcentro delmontculoencontraramos34gramosdearena(observalosporcentajesdelaimagenanterior), sipesramoslaarenadeunaadosdesviacionesestndaresencontraramos14gramosdearenay 11. si pesramos la arena de dos a tres desviaciones estndares encontraramos 2 gramos aproximadamente.Sirecordamoslapropiedaddesimetradelacurvanormal(unladoesidnticoalotro)podramos pensarquedelladoizquierdodelmontculodearenahabralasmismasdistribucionesdelaarena. Notacomosisumamoslosporcentajesdeunsololadodelmontculodearenaencontramos50 gramosdelaarenadeunladoy50gramosdelotrolado(entrelosdosladossuman100gramos queesloqueoriginalmentepesabanuestromontculo).Si lo trasladramos a cualquier distribucin de datos diramos algo similar A ms o menos 1 desviacin estndar se encontraran el 34% de los casos; de ms o menos 1 a 2 desviaciones estndar estaran cerca del 14% de los datos y de ms o menos 2 a 3 desviaciones estndar estaranaproximadamenteel2%deloscasos.Deigualformapodemoshacercombinacionesconlosporcentajesqueconocemos: 68% 12. 72% 84% 13. 98% Asimismosernecesariodefinirdosconceptosquesonmuymencionadosentrelosinvestigadores delascienciassocialesquerespondenalassiguientespreguntas:Entrequrangodelaescalaes fcilqueencuentrealossujetosdemimuestra(sujetostpicosonormales)?Entrequrangode laescalaesdifciloinfrecuenteencontrarasujetosdemimuestra(casosatpicosoanormales? Loscasostpicossedefinencmo: Loscasosqueseencuentranaunadesviacinestndardelamedia. Elrangodecasostpicosseobtienendesumaryrestarunavezladesviacin estndaralamedia. Loscasostpicossonaquellosqueseencuentranenunrangoqueabarqueal68%se lossujetos(1s). 14. Loscasosatpicossedefinencmo: Loscasosqueseencuentranmsdetresdesviacionesestndardelamedia. Elrangodecasostpicosseobtienendesumaryrestartresvecesladesviacin estndaralamedia.Todosloscasosqueseencuentrenafueradeesterangoson casosatpicosononormales. Loscasosatpicossonaquellossemuestranfueradeunrangoqueabarqueel 99.9%deloscasos(3s)(recuerdaquelacurvaesasinttica,siemprehay posibilidaddeunvalormenoromayorenlaescala;apesardequelosporcentajes delasgrficasmostradassumen100%siemprepuedeescaparsealgnsujeto).Resuelveelejercicio4antesdecontinuarleyendoY qu es eso de varianza? Generalmente no se encontrarn en los reportes de cualquier investigacin el trmino de varianza (cuando se trata de medidas de dispersin). La varianza simplementeeselresultadodeelevaralcuadradoladesviacinestndar. Importante!Lavarianzanopuedeserinterpretadacomomedidadedispersindelosdatos. Laexistenciadelavarianzasedebeadosmotivosprincipales: a. Permite que algunas frmulas estadsticas sean ms exactas (cosa de matemticos).b. La varianza es til en anlisis estadsticos ms complejos que buscan explicarunavariableAatravsdeunaB. 15. 5.3.NocionesdelteoremadeChevichev. Pafnuti Chebyshov, Tchebychev, Tchebycheff, Tschebyscheff o ebiev era el nombre del personajequeobservamosenlaimagenanterior.Elhechodequetengatantosnombressedebea quecadaunoesunintentodetraduccindesuapellidodelruso(). Sin embargo, la complejidad del apellido no es lo que nos interesa. Lo interesante de este matemticoeselteoremaquepropusoqueenresumendicelosiguiente: ElteoremadeChevichevindicaquecuandolosdatossecomportancomouna distribucinnormal: a. Aproximadamenteel68%delapoblacinestdentrode1s.b. Aproximadamenteel95%delapoblacinestdentrode2s.c. Aproximadamenteel99%delapoblacinestdentrode3s.El fin de mencionar este teorema es nicamente el hacer notar que existen diferentes teoras y propuestassobreelnmerodedatosqueseencuentranandesviacionesestndarcuandostos (losdatos)secomportandecmounadistribucinnormal.Sicomparramoslosporcentajesantes estudiadosylosdelteoremadeChevichevveramosquesonmuysimilares. 16. 5.4