Estadistica aplicada

Embed Size (px)

DESCRIPTION

Diversos temas investigados sobre estadistica aplicada

Citation preview

UNIDAD NMERO 5PROBABILIDAD Y ESTADSTICA

ESTADISTICA APLICADA

INTRODUCCINPregntate si lo que ests haciendo hoyte acerca al lugar en el que quieres estar maana.

La Estadstica es por tanto un potente auxiliar en muchas ciencias y actividades humanas, pues es un lenguaje basado en resultados cuantitativos y grficos que permite comunicar informacin, resolver problemas de diseo experimental y ayudar a la toma de decisiones, en base al anlisis de la informacin muestral y en situaciones de incertidumbre.La palabra estadstica se origina, en las tcnicas de recoleccin, organizacin, conservacin, y tratamiento de los datos propios antiguamente de un estado, con que los antiguos gobernantes controlaban a sus sbditos y dominios econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las matemticas, utilizando sus herramientas en el proceso del anlisis e interpretacin de la informacin.Con este trabajo se pretende formarnos una idea de los conceptos bsicos de la estadstica aplicada; para facilitar nuestra induccin al curso.Ya que en nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos.Son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de observaciones muestrales o histricas, crean modelos lgico-matemticos que se "aventuran" a describir o pronosticar un determinado fenmeno con cierto grado de certidumbre medible.

INDICEContenidoINTRODUCCIN21 Inferencia Estadstica4MUESTREOS5Tipos de Muestreo5PRUEBA DE HIPTESIS6Conclusiones de una Prueba de Hiptesis72 Estimacin puntual7Propiedades de un estimador8Estimacin por intervalo9Estimacin puntual10Estimacin por intervalos10Intervalos de confianza11Poblacin normal de varianza desconocida.15Intervalo de confianza para la diferencia entre medias16Intervalo de confianza para una proporcin17Aproximacin asinttica17Intervalo exacto18Intervalo de confianza para razones de dos varianzas213 Prueba de Hiptesis25METODOLOGIA PARA LA PRUEBA DE HIPOTESIS25HIPOTESIS NULA25HIPOTESIS ALTERNATIVA25ERROR TIPO UNO Y TIPO DOS26ERROR TIPO 126ERROR TIPO 226PRUEBA DE HIPOTESIS PARA LA MEDIA26PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS26EJEMPLOS DE HIPTESIS NULA Y ALTERNATIVA27ERROR TIPO UNO Y TIPO DOS28ERROR TIPO 128ERROR TIPO 228PRUEBA DE HIPTESIS PARA LA MEDIA28MUESTRAS GRANDES28EJEMPLO28MUESTRAS PEQUEAS29EJEMPLO29PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS30EJEMPLO31PRUEBA DE HIPOTESIS PARA PROPORCIONES32EJEMPLO32PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE PROPORCIONES33EJEMPLO33PRUEBA DE HIPTESIS PARA UNA VARIANZA34EJEMPLO35PRUEBA DE HIPOTESIS PARA LA RAZON DE VARIANZAS36EJEMPLO364 Correlacin y Regresin38DISTRIBUCIONES BIDIMENSIONALES38COVARIANZA40CORRELACIN40COEFICIENTE DE CORRELACIN LINEAL42RECTA DE REGRESIN43Bibliografa44Conclusin46

1 Inferencia Estadstica

La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del estudio de los mtodos para la obtencin del modelo de probabilidad, que sigue una variable aleatoria de una determinada poblacin, a travs de una muestra (parte de la misma) obtenida gracias a las pruebas correctas.Se ocupa de predecir, sacar conclusiones, para una poblacin tomando como base una muestra (es decir, una parte) de dicha poblacin. Como todas las predicciones, siempre han de hacerse bajo un cierto grado de fiabilidad o confianza. Ser esta ltima vertiente de la estadstica la que estudiemos en este tema.MUESTREOSHay muchas maneras de elegir una muestra de una poblacin. Antes de pasar a analizar dichas formas de extraccin de muestras, lo que si hemos de dejar claro es que todas las muestras han de cumplir varias condiciones indispensables. Es evidente que para que el estudio a realizar sea fiable, hay que cuidar mucho la eleccin de la muestra, para que represente en la medida de lo posible a la poblacin de la que se extrae. Si la muestra est mal elegida, diremos que no es representativa. En este caso, se pueden producir errores imprevistos e incontrolados. Dichos errores se denominan sesgos y diremos que la muestra est sesgada.Tipos de MuestreoMuestreo no probabilstico: El investigador no elige la muestra al azar, sino mediante determinadosMuestreo probabilstico: Cuando la muestra se elige al azar. En este caso podemos distinguirVarios tipos:a) Muestreo aleatorio simple: Aquel en el que cada individuo de la poblacin tiene las mismasPosibilidades de salir en la muestra.b) Muestreo sistemtico: En el que se elige un individuo al azar y a partir de el, a intervalosConstantes, se eligen los dems hasta completar la muestra.c) Muestreo estratificado: En este muestreo se divide la poblacin en clases o estratos y seEscoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato.d) Muestreo por conglomerados: Si no disponemos de la relacin de los elementos de la poblacin, o de los posibles estratos, no podemos aplicar los muestreos anteriores.PRUEBA DE HIPTESISUna prueba de hiptesis comprende cuatro Componentes principales:-Hiptesis Nula-Hiptesis Alternativa-Estadstica de Prueba-Regin de RechazoLa Hiptesis Nula, denotada como H0 siempre especifica un solo valor del parmetro de la poblacin si la hiptesis es simple o un conjunto de valores si es compuesta (es lo que queremos desacreditar)

La Hiptesis Alternativa, denotada como H1 es la que responde nuestra pregunta, la que se establece en base a la evidencia que tenemos. Puede tener cuatro formas:

Como las conclusiones a las que lleguemos se basan en una muestra, hay posibilidades deQue nos equivoquemos. Dos decisiones correctas son posibles: Rechazar H0 cuando es falsaNo Rechazar H0 cuando es verdadera.Dos decisiones incorrectas son posibles:Rechazar H0 cuando es verdaderaNo Rechazar H0 cuando es falsa.

TAMAOS DE ERRORESH 0 VerdaderaH 0 Falsa

Rechazamos H 0Error Tipo I P(error Tipo I) = P(error Tipo I) = Decisin Correcta

No Rechazamos H 0Decisin CorrectaError Tipo II Error Tipo II P(error Tipo II) = P(error Tipo II) =

Conclusiones de una Prueba de HiptesisSi rechazamos la Hiptesis Nula, concluimos que hay suficiente evidencia estadstica para inferir que la hiptesis nula es falsaSi no rechazamos la Hiptesis Nula, concluimos que no hay suficiente evidencia estadstica para inferir que la hiptesis nula es falsa

2 Estimacin puntualEstimacin puntual consiste en utilizar el valor de un estadstico para inferir el parmetro de una poblacin. La media de la poblacin se puede estimar puntualmente mediante la media de la muestra:

La proporcin de la poblacin se puede estimar puntualmente mediante la proporcin de la muestra:

La desviacin tpica de la poblacin se puede estimar puntualmente mediante la desviacin tpica de la muestra, aunque hay mejores estimadores:

EstimadorUn estimador de un parmetro es un estadstico T=T (X1,..., Xn)Usado para estimar el valor del parmetro de una poblacin.El valor observado del estadstico t = T(x1,..., xn) es la estimacin de , y la representamos por puede ser un solo parmetro o un conjunto de parmetros desconocidos, = (1, ..., k )Propiedades de un estimador Insesgado: Un estimador es insesgado cuando la media de su distribucin muestral asociada coincide con la media de la poblacin. Esto ocurre, por ejemplo, con el estimador , ya que y con estimador p ya que De varianza mnima: La variabilidad de un estimador viene determinada por el cuadrado de su desviacin estndar. En el caso del estimador , su desviacin estndar es , tambin llamada error estndar de .En el caso del error estndar de Se observara que cuanto mayor sea el tamao de la muestra n, menor ser la variabilidad del estimador y de p, por tanto, mejor sern nuestras estimaciones.

Diferencia entre un estimador y una estimacinExiste una diferencia entre estimador y estimacin. El estimador es un estadstico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra concreta () ser la estimacin puntual. El estimador tendr su distribucin muestral.

ParmetropoblacionalEstimadorEstimacin

Media

Varianza

Proporcin

Estimacin por intervaloEl objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con una alta probabilidad de que el parmetro se encuentre en su interior. As pues, elegiremos probabilidades cercanas a la unidad, que se representan por 1- y cuyos valores ms frecuentes suelen ser 0'90, 0'95 y 0'99.

Ejercicio Dada una poblacin X, que sigue una distribucin cualquiera con media y desviacin estndar . 1. Sabemos (por el TCL) que, para valores grandes de n, la media muestral sigue una distribucin aproximadamente normal con media y desviacin estndar 2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estndar de la media. De lo anterior se deduce que: Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad de que la media de la poblacin est contenida en l es de 0.95.Este tipo de intervalos se llaman intervalos de confianza de un parmetro poblacional. El nivel de confianza (1 - ) del intervalo es la probabilidad de que ste contenga al parmetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% ( = 0,05). Estimacin puntualConsideremos el estimador T(X1, ..., Xn) = Max{X1, ..., Xn} = X(n) para estimar el extremo superior del intervalo. Queremos determinar si es un estimador insesgado. Necesitamos conocer su distribucin para calcular su esperanza... La densidad de una uniforme en (0, ) es f (x) = 1/ , para 0 < x < , y su funcin de distribucin es F(x) = P(X x) = , para 0 < x < . La distribucin de X(n) es, para 0 < x < : y por tanto, la funcin de densidad de la v.a. X(n) es Finalmente, calculamos su esperanza: es sesgado

Estimacin por intervalos

La estimacin por intervalos es un procedimiento de la estadstica inferencial mediante el cual se realizan calculos con los datos de muestra cuyo resultado son dos datos numericos que defnen un rango, intervalo o conjunto numrico que servir para estimar el parmetro poblacional.Por ejemplo, si se desea estimar el promedio de edad de la poblacin estudiantil de una universidad y para ello elegimos una muestra, utilizando la estimacin por intervalos se obtienen dos valores, por ejemplo 22.5 y 24.5, lo que quiere decir que el verdadero valor del promedio de edad de esa poblacin estudiantil se encontrar dentro del rango de 22.5 a 24.5 aos de edad, aunque nunca se sabr con exactitud su verdadero valor. Una manera de expresar formalmente este resultado es utilizando corchetes: [22.5, 24.5].

La estimacin por intervalos tiene varias ventajas; una es que no ofrece un valor nico, sino un rango donde es muy posible o muy probable que el parmetro poblacional se encuentre incluido. De esta manera se supera la limitacin de los estimadores puntuales de que su resultado nico vara de muestra en muestra; es decir, con la estimacin por intervalos tenemos ms probabilidad de acertar al verdadero valor poblacional.La principal ventaja de la estimacin por intervalos es que su resultado ofrece un nivel de confianza que permite conocer en cunto le podemos creer o tenerle confianza al resultado obtenido de la estimacin. Por esta razn, la estimacin por intervalos tambin es conocida como estimacin por intervalos de confianza, pues su nivel de confianza seala qu tan posible o qu tan probable es que el parmetro poblacional se encuentre incluido dentro del rango definido.

Intervalos de confianza

En los mtodos de estimacin puntual se utiliza una funcin de los valores de la muestra (estadstico) para dar la estimacin del parmetro en estudio. Si en vez de esto, se utilizan dos funciones y se da el valor de dicho parmetro a partir del intervalo que tiene por extremos los valores de dichas funciones para una muestra, se dice que se est dando una estimacin por intervalos del parmetro, o un intervalo de confianza.

En la construccin de estos intervalos, hay dos elementos fundamentales. La amplitud del intervalo que dar la precisin de la estimacin, y que por lo tanto deber ser la menor posible, y la probabilidad de que el intervalo contenga al verdadero valor del parmetro a estimar, que se llama nivel de confianza o coeficiente de confianza, y que deber ser lo mayor posible. Est claro que se puede ganar en precisin a base de perder confianza en la estimacin.

Ejemplo En el caso de que se seleccione una muestra aleatoria simple de una poblacin descrita por la funcin f (x;) dependiente del parmetro que pretendemos estimar. El problema se plantea como sigue: se fija un nivel de confianza, que se denota por 1 , en donde 00.5. La hiptesis alternativa a la hiptesis nula se denota .

ERROR TIPO UNO Y TIPO DOSERROR TIPO 1Se presenta cuando se rechaza la hiptesis nula siendo cierta y no debera rechazarse. La probabilidad de que se presente un error tipo 1 es .ERROR TIPO 2Se presenta cuando no se rechaza la hiptesis nula siendo falsa y debera rechazarse. La probabilidad de que se presente un error tipo 2 es .PRUEBA DE HIPOTESIS PARA LA MEDIACuando se conoce la desviacin estndar, , y si la poblacin tiene una distribucin normal, usted utiliza la prueba Z. si el tamao de la muestra es lo bastante grande como para que tenga efecto el teorema del lmite central. La ecuacin define al estadstico de prueba de Z para determinar la diferencia que existe entre la media maestral y la media poblacional cuando se conoce la desviacin estndar .PRUEBA DE HIPOTESIS PARA LA MEDIA ( CONOCIDA)

El denominador es el error estndar de la media, por lo que Z representa la diferencia que existe entre la en unidades de error estndar.PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIASSe tienen dos poblaciones y se toman muestras aleatorias independientes de tamaos n 1 y n 2, se puede comparar el comportamiento de dichas poblaciones a travs de los promedios.Se tienen dos tipos de concretos. Se toma una muestra de tamao 42 de cada uno y se obtiene un promedio muestral de la conductividad trmica para el primero de 0.486 con una desviacin estndar de 0.187 y un promedio de 0.359 de conductividad trmica con una desviacin estndar de 0.158 para el segundo.Esta informacin sugiere que el promedio verdadero de conductividad trmica del primer concreto es mayor que la del segundo, con 0.01. EJEMPLOS DE HIPTESIS NULA Y ALTERNATIVAEstablezca las hiptesis nula y alternativa.a.Las millas por galn (mpg) promedio de un nuevo modelo de automvil es 32.b.Ms del 65% de los empleados de un colegio aportan a Fondos Unidos.c.En promedio, los empleados de cierta compaa viven a no ms de 15 millas de la misma.d.Al menos un 60% de la poblacin adulta de una comunidad votar en las prximas elecciones Presidenciales.e.El peso promedio de un pollo para asar es de al menos cuatro libras.Solucin:a.H0: = 32b.H0: p .65c.H0: 15H1: 32H1: p < .65H1: > 15d.H0: p .6e.H0: 4H1: p < .6H1: < 4Si se rechaza la hiptesis nula y no hay otra opcin, el experimento puede ser invlido. Por esta razn, la ciencia utiliza una serie de procesosdeductivos e inductivospara asegurar que no existan errores en las hiptesis.Para probar si la hiptesis nula es cierta, se toma una muestra aleatoria y se calcula la informacin, como el promedio, la proporcin, etc. Esta informacin muestral se llama estadstica de prueba.Estadstica de Prueba: Una estadstica de prueba se basa en la informacin de la muestra como la media o la proporcin.ERROR TIPO UNO Y TIPO DOSERROR TIPO 1Se presenta cuando se rechaza la hiptesis nula H0 siendo cierta y no debera rechazarse. La probabilidad de que se presente un error tipo 1 es .Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H0, denotada por . A sta se le llama nivel de significancia. Nivel de Significancia: La probabilidad ( ms alta de rechazar H0 cuando H0 es cierto se llama nivel de significancia.Comentario:Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeo de .ERROR TIPO 2Se presenta cuando no se rechaza la hiptesis nula H0 siendo falsa y debera rechazarse. La probabilidad de que se presente un error tipo 2 es .PRUEBA DE HIPTESIS PARA LA MEDIAMUESTRAS GRANDESCuando se conoce la desviacin estndar, , y si la poblacin tiene una distribucin normal, se utiliza la prueba Z solo si el tamao de la muestra es lo bastante grande. Procedemos a utilizar la siguiente formula.

EJEMPLOUna muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar poblacional de 8.9 aos. Queremos probar si la vida media hoy en da es mayor a 70 aos con base en esa muestra. La muestra parecera indicar que es as pero Cul es la probabilidad de que la media de la muestra no refleje la verdadera media de la poblacin? Utilizar un nivel de significancia de 0.05.Solucin:Se trata de una distribucin muestral de medias con desviacin estndar conocida.Paso nmero 1. Datos. =70 aoss = 8.9 aos= 71.8 aosn = 100 = 0.05Paso nmero 2. Establecemos la hiptesis.H0; = 70 aos.H1; > 70 aos.Paso nmero 3. Nivel de significancia. = 0.05, = 1.645Paso nmero 4. Regla de decisin.Si z 1.645 no se rechaza H0.Si z > 1.645 se rechaza H0.Paso nmero 5. Clculos del valor de z para los datos.

Paso nmero 6. Decisin y justificacin.Como 2.02 > 1.645 se rechaza H0 y se concluye con un nivel de significancia del 0.05 que la vida media hoy en da es mayor que 70 aos.

MUESTRAS PEQUEASPara el caso de muestras pequeas (n -1.796, por lo tanto no se rechaza H0, y se concluye con un nivel de significancia del 0.05 que el nmero promedio de kilowatt-hora que gastan al ao las aspiradoras no es significativamente menor que 46.

PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIASEn la prctica, se presenta una diversidad de problemas en la industria y en las ciencias sociales que nos sugieren confrontar cual de dos procesos es mejor que el otro a la luz de la media que arroja cada uno de ellos. Se nos podra ocurrir por ejemplo: a) verificar si el consumo de gasolina entre dos marcas de vehculos se puede considerar idntico o por el contrario una marca es ms econmica que otra. b) Verificar si los salarios de la industria metalrgica se pueden considerar o no superiores a los salarios de la industria textil en una regin c) Verificar si el contenido de determinada sustancia en una artculo fabricado por una compaa A es inferior o no al contenido de dicha sustancia en el mismo artculo fabricado por una compaa B de la competencia. etc.

Con el fin de resolver las pruebas de hiptesis para la diferencia de medias, debemos tener en cuenta el mismo procedimiento y las mismas reglas que seguimos para las pruebas de hiptesis para la media. Las frmulas para el clculo de los estadsticos z y t, son las mismas empleadas en el clculo de los intervalos de confianza para la diferencia de medias.

En cuanto a la distribucin en el muestreo de la diferencia de medias, recordemos los siguientes tres casos:

1) Si las dos poblaciones son normales, las diferencias de las medias muestrales tambin se distribuirn normalmente cualquiera sea el tamao de las muestras. No obstante, si no se conocen las desviaciones estndar poblacionales (1 y 2), stas pueden ser reemplazadas por las desviaciones estndar de las muestras (S1 y S2), si los tamaos de las muestras son mayores que 30 (n1 >30 y n2 >30 o n1 +n2>60).

2) Segn el teorema central del lmite, si las dos poblaciones no son normales o no sabemos si se cumple o no ste comportamiento, las diferencias de las medias muestrales se distribuirn aproximadamente como una distribucin normal, si los tamaos de las muestras son mayores que 30 (n1 >30 y n2 >30 o n1 +n2 >60)

3) Si las dos poblaciones son normales o estn muy cerca de ste comportamiento y por otra parte no conocemos la desviaciones estndar poblacionales y adems los tamaos de las muestras son menores que 30 (n1 0 H1: P1 - P230 y n2=300>30, por lo cual segn el teorema central del lmite, las diferencias de las proporciones muestrales se distribuirn aproximadamente como una distribucin normal.

Paso numero 1: Plantear Hiptesis nula e hiptesis alternativa. H0: PA=PB, H1: PAPB. La prueba es bilateral, puesto que el especialista en mercado no est afirmando que ciudad tiene ms proporcin que la otra.

Paso numero 2: Nivel de significacin. 0.05

Paso numero 3: Criterio de decisin.Como las diferencias de las proporciones muestrales se distribuyen normalmente y la prueba es bilateral, entonces, segn las tablas el valor de z es: 1.96. Por lo tanto, el criterio de decisin ser el siguiente: Si el valor de Z calculado es mayor que +1.96 o menor que 1.96, se rechaza la hiptesis nula de que la proporcin es idntica en ambas ciudades.

Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.n1=500, p1=0.596, n2=300, p2=0.50. En la distribucin el muestreo de la diferencia de proporciones, correspondiente al valor de z ser:

Paso numero 5: Tomar la decisin.Como el valor de Z calculado (+2.65) se encuentra en la zona de rechazo, entonces, con un nivel de significacin del 5%, debemos rechazar la hiptesis nula de que las proporciones en ambas ciudades son iguales.

PRUEBA DE HIPTESIS PARA UNA VARIANZAPara una prueba de hiptesis relativa a una varianza debemos tener en cuenta que la distribucin Ji-cuadrada se da siempre y cuando se trate de poblaciones normales y el estadstico de prueba es la variable Ji-cuadrada con (n-1) grados de libertad y que se expresa como:

Una prueba de hiptesis para la varianza debe tener una hiptesis nula que ser: H0: =A, siendo A un valor hipottico, por lo cual la hiptesis alternativa podra ser: H1: A, H1: < A H1:>A, segn la prueba sea bilateral en el primer caso o unilateral en los dos casos siguientes. Dado que la varianza mide el grado de variabilidad de un conjunto poblacional, una prueba de hiptesis para la varianza puede ser til para comprobar por ejemplo el grado de variabilidad que presenta un proceso productivo, despus de que ste ha sido objeto de algunos cambios tcnicos. El proceso que sigue una prueba de hiptesis para la varianza.

EJEMPLOSe sabe que el contenido en gramos de un producto fabricado por una compaa, no rene las especificaciones si la varianza de un lote de produccin se aleja demasiado hacia arriba o hacia abajo de 6.5. Comprobar si un gran lote de produccin rene las especificaciones, si una muestra aleatoria de 20 unidades extrada aleatoriamente de dicho lote arroj una varianza de 7.3. Utilizar un nivel de significacin del 5%.

Solucin:Se sabe que el contenido del producto se distribuye normalmente.

Paso numero 1: Hiptesis nula e hiptesis alternativa.H0: = 6.5, H1: 6.5. La prueba es bilateral, puesto que el problema es claro en el sentido de que un valor diferente a 6.5 no rene las especificaciones.

Paso numero 2: Nivel de significacin. 0.05

Paso numero 3: Criterio de decisin.Como la poblacin se distribuye normalmente y la prueba es bilateral, entonces, segn las tabla para 19 grados de libertad el valor de = 8.9065 y el valor de =32.8523. Por lo tanto, el criterio de decisin ser el siguiente: Si el valor de calculado es menor que 8.90652 o mayor que 32.8523, se rechaza la hiptesis nula de que la varianza sigue siendo de 6.5, con un nivel de significacin del 5%.

Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.n=20, =7.3. Segn la frmula tenemos:

Paso numero 5: Tomar la decisin.Como el valor de calculado(21.34) se encuentra en la zona de aceptacin, entonces, con un nivel de significacin del 5% se acepta la hiptesis nula de que la variabilidad en el contenido sigue siendo la misma, es decir = 6.5.

PRUEBA DE HIPOTESIS PARA LA RAZON DE VARIANZASSe define como la razn de dos variables Ji-cuadrada independientes, provenientes de dos poblaciones normales, dividida cada una de ellas por sus respectivos grados de libertad. En stas condiciones la razn de varianzas se puede expresar como sigue:

El numerador representa a la varianza muestral mayor, mientras que el denominador representa a la varianza muestral menor. Si el valor de F segn la frmula anterior es igual a 1, entonces, podemos afirmar que las dos varianzas poblacionales son iguales, pero si es diferente de 1, dicha diferencia puede ser no significativa y podra deberse a problemas aleatorios o del azar. Tambin podra suceder que si la razn es diferente de 1 dicha diferencia sea significativa como para pensar que las dos varianzas poblaciones son diferentes.Las pruebas de hiptesis para la razn de dos varianzas sigue el mismo proceso visto en las secciones anteriores y el criterio de decisin F debe buscarse en las tablas correspondientes.Recordemos adems que para buscar el valor de F en las tablas, debemos localizar los grados de libertad del numerador en la primera fila de la tabla y localizar los grados de libertad del denominador en la primera columna de la tabla

La hiptesis nula ser siempre H0: = = 1.

EJEMPLOSe quiere comprobar si la variabilidad en la duracin de unas lmparas marca A es igualmente variable que la duracin de otra marca B de la competencia. Para tal fin, se toma una muestra aleatoria de 13 lmparas tipo A y se encuentra que la desviacin estndar muestral es S=8, mientras que en otra muestra aleatoria de 13 lmparas tipo B se encuentra que la desviacin estndar muestral es de S=4. Se pide probar la hiptesis nula de que la variabilidad es igual en ambas poblaciones con un nivel de significacin del 5%.

Solucin: Se supone que la duracin de las lmparas se distribuye normalmente para ambas marcas.

Paso numero 1: Hiptesis nula e hiptesis alternativa para prueba bilateral.H0: = y H1: .

Paso numero 2: Nivel de significacin. 0.05.

Paso numero 3: Criterio de decisin.Si el valor de F calculado se encuentra fuera del intervalo sealado por los dos valores de F segn la tabla, entonces rechazamos la hiptesis nula de que las dos desviaciones estndar poblacionales son iguales. Es decir, si el valor de F calculado est fuera del intervalo F(0.025,12,12) =3.28 y F(0.975,12,12) = = 0.305, entonces se rechaza la hiptesis nula.

Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.n1=13, S1=8, n2=13, S2=4F= = 4

Paso numero 5: Decisin.Como 4 se encuentra fuera del intervalo segn el criterio de decisin, entonces, con un nivel de significacin del 5%, se rechaza la hiptesis nula de que la variabilidad sea igual para ambas marcas.

4 Correlacin y Regresin

DISTRIBUCIONES BIDIMENSIONALESDos variables x e y estn relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda.Dos variables x e y estn relacionadas estadsticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda.Una variable bidimensional es una variable en la que cada individuo est definido por un par de caracteres, (X, Y).Estos dos caracteres son a su vez variables estadsticas en las que s existe relacin entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.Son aquellas en las que a cada individuo le corresponden los valores de dos variables, las representamos por el par.

Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin.

MatemticasFsica

21

33

42

44

54

64

76

74

86

107

109

1010

COVARIANZALa covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.La covarianza se representa por sxy o xy.

La covarianza indica el sentido de la correlacin entre las variables

Si xy > 0 la correlacin es directa.

Si xy < 0 la correlacin es inversa.La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.

Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares.

CORRELACINLa correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional.Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.1 Correlacin directaLa correlacin directa se da cuando al aumentar una de las variables la otra aumenta.La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversaLa correlacin inversa se da cuando al aumentar una de las variables la otra disminuye.La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nulaLa correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

COEFICIENTE DE CORRELACIN LINEALEl coeficiente de correlacin lineal es el cociente entre la covarianza y el producto de las desviaciones tpicas de ambas variables.El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades

1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.Es decir, se expresa a la altura en metros o en centmetros el coeficiente de correlacin no vara.2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.Si la covarianza es positiva, la correlacin es directa.Si la covarianza es negativa, la correlacin es inversa.Si la covarianza es nula, no existe correlacin.3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1.1 r 14. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

RECTA DE REGRESINLa recta de regresin es la que mejor se ajusta a la nube de puntos.La recta de regresin pasa por el punto centro de gravedad llamado centro de gravedad.Recta de regresin de Y sobre XLa recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresin de X sobre YLa recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y.La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

BibliografaCovarianza y Complementoshttp://www.biostat.jhsph.edu/~lcollado/Courses/MEyAdDG/day2/Pruebas%20de%20Hip%C3%B3tesis.pdfGua documentos Unidad 5http://www.cecyt11.ipn.mx/Documents/estudiantes/guia_estudio/probabilidad%20y%20estadistica.PDFRegresin y correlacinhttp://probyestfjad.blogspot.mx/2008/12/desarrollo-de-la-unidad-5-regresin-y.htmlLibro de Probabilidad y Estadsticahttp://www.mate.unlp.edu.ar/~maron/MaronnaHome_archivos/Probabilidad%20y%20Estadistica%20Elementales.pdfLibro de Probabilidad y Estadsticahttp://www.x.edu.uy/inet/EstadisticayProbabilidad.pdf2 Estimacin Puntualhttp://www.est.uc3m.es/esp/nueva_docencia/getafe/ciencias_estadisticas/TecnicasInferenciaEstadistica/doc_grupo1/Intervalos-Grado%20en%20Est.%20y%20Empr_9.pdfhttp://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t11.htm http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un3/cont_307_85.htmlhttp://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t17.htmhttp://www.geociencias.unam.mx/~ramon/EstInf/Clase11.pdf

3 HiptesisDevore, J. (2005). Probabilidad y Estadstica para ingeniera y ciencias Sexta edicin. Mxico, D. F.: Thomson.Walpole, R. (1999). Probabilidad y estadstica para ingenieros. Mxico, D. F.: Prentice Hall.Alvarado J., Obagi J. (2008). Fundamentos de inferencia estadstica, Primera edicin. Bogot, D.C.: Editorial Pontificia Universidad Javeriana.

Explorable, Hiptesis nula. (s.f.). Recuperado el 15 de mayo del 2015, de https://explorable.com/es/hipotesis-nulaPruebas de hiptesis para una muestra. (s.f.). Recuperado el 15 de mayo del 2015, dehttp://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf

Pruebas de hiptesis para dos muestras. (s.f.). Recuperado el 15 de mayo del 2015, dehttp://es.slideshare.net/domingodelacerda/prueba-de-hipotesis-para-dos-muestra

Prueba de hiptesis para medias. (s.f.). Recuperado el 15 de mayo del 2015, dehttp://www.monografias.com/trabajos91/prueba-hipotesis-medias-excel-y-winstats/prueba-hipotesis-medias-excel-y-winstats.shtml

Formato con autor del documento consultado:Giraldo, Hugo. (Fecha de revisin o copyright, no disponible). Estadstica. Recuperado el 15 de mayo del 2015, del sitio Web de la Universidad Nacional de Colombia de la URL: http://www.bdigital.unal.edu.co/2010/1/hugogomezgiraldo.2009.pdf

Conclusin

A continuacin presentamos nuestro trabajo de investigacin y por consecuencia de estudio didctico de la unidad nmero cinco de probabilidad y estadstica, sabemos que no solo basta con leer la unidad completa, sino que llevarla a cabo con ejercicios, es por eso que el equipo decidi llevarlo en prctica y saber realmente lo que estamos estudiando.Somos conscientes de nuestras capacidades de estudio por eso, hay que estar bien preparados para un futuro y ejercer nuestra especialidad y comportarnos realmente como Ingenieros, de manera que somos capaces de analizar y comprender loes elementos de la unidad 5 a fondo.

1