apuntesclaseestadisticaiitsz-090603183802-phpapp01

Embed Size (px)

Citation preview

Estadstica I

Estadstica IMII. ING. EDGAR JAVIER SILVAForma de calificar:

Examen. 70%Practicas, tareas, avance proyecto final 30%

Para poder aprobar, necesariamente debes pasar los tres parciales con calificacin mnima de 70, en caso de reprobar alguno se registra cero de calificacin en el parcial correspondiente.Unidades aprobadas necesarias para presentar examen de NIVELACION / REGULARIZACION2Unidades aprobadas necesarias para presentar examen de EXTRAORDINARIO4

Probabilidad y Estadstica Douglas C. Montgomery Mc Graw Hill Probabilidad y Estadstica para Ingeniera y Ciencias Mendenhall Prentice Hall Estadstica para Administradores Levin Rubin Limusa http://mathworld.wolfram.com/classroom/classes/ProbabilityandStatistics.html

BibliografaHaber aprobado, necesariamente las materias de :Calculo IntegralCalculo diferencialProbabilidad.Requisitos para llevar esta materiaDistribuciones de probabilidad de una variable aleatoria continua.Media y varianza de una variable aleatoria continua.Distribucin de probabilidad t-student.Distribucin de probabilidad tipo Gamma.Distribucin de probabilidad tipo Beta.Distribucin de probabilidad X2 y FDistribucin de probabilidad Weibull

Unidad 1Distinguir entre las variables aleatorias continuas y discretas y sus respectivas distribuciones de probabilidad; presentar algunas distribuciones de probabilidad continuas tiles y mostrar cmo se pueden utilizar para resolver problemas prcticos.Objetivo:

Distribucin de probabilidadQu es una distribucin probabilstica?7

Distribuciones discretas.Son aquellas en las que la variable puede pude tomar un nmero determinado de valores:Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un nmero de 1 al 6; en una ruleta el nmero puede tomar un valor del 1 al 32.Distribuciones continuas.Son aquellas que presentan un nmero infinito de posibles soluciones:Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 Kg., 42,3764 Kg., 42, 376541kg, etc.); la esperanza media de vida de una poblacin (72,5 aos, 7,513 aos, 72, 51234 aos).Distribucin BinomialLa distribucin de probabilidad de este tipo de distribucin sigue el siguiente modelo:

Ejemplo (distribucin binomial)Cul es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

" k " es el nmero de aciertos" n" es el nmero de ensayos" p " es la probabilidad de xito

Solucin" k " es el nmero de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6)" n" es el nmero de ensayos. En nuestro ejemplo son 10" p " es la probabilidad de xito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5La frmula quedara:

Solucin:

Ejemplo 2Cul es la probabilidad de obtener cuatro veces el nmero 3 al lanzar un dado ocho veces? Solucinn = K =p = Solucin" k " (nmero de aciertos) toma el valor 4" n" toma el valor 8" p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666)

P (x = 4) = 0,026

Distribucin de Poisson Las distribucin de Poisson parte de la distribucin binomial:Cuando en una distribucin binomial se realiza el experimento un nmero "n" muy elevado de veces y la probabilidad de xito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribucin de Poisson:Se tiene que cumplir que:" p " < 0,10" p * n " < 10La distribucin de Poisson sigue el siguiente modelo.

Percentil: por ejemplo, si su calificacin en un curso de ingeniera industrial estuvo en el 84 percentil, entonces el 84% de las calificaciones fueron inferiores a la suya y el 16% fueron mayores.

Cuartil inferior: Ql, de un conjunto de datos es el 25 percentil.

Cuartil superior: Qu, de un conjunto de datos es el 75 percentil

Rango intercuartilico: es la distancia entre los cuartiles superior e inferior. (IQR)

Recordando (Percentil, quartil, rango intercuartilico (IQR) )

La funcin de densidad normal (o gausiana) fue propuesta por C. F. Gauss (1777-1855) como modelo para la distribucin de frecuencia relativa de errores, como los errores de medicin. Resulta sorprendente que esta curva con forma de campana sea un modelo adecuado para las distribuciones de frecuencia relativa de datos recabados de muchas reas cientficas diferentes.Distribucin de probabilidad normal

Distribucin NormalEsta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio nombre indica su extendida utilizacin, justificada por la frecuencia o normalidad con la que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin.

La nueva variable z se distribuye como una NORMAL con media = 0 y desviacin tpica = 1-3 -2 -1 0 1 2 3zUna regla emprica indica que en cualquier distribucin normal las probabilidades delimitadas entre : 1 68 % 2 95 % 3 99 %68%99%95%23La importancia de la distribucin normal se debe principalmente a que hay muchas variables asociadas a fenmenos naturales que siguen el modelo de la normal

Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras, dimetros, permetros,... Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o de una misma cantidad de abono. Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen. Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a un medio,...

Casos de la vida realEn un saln de clases la media del grupo es de 29 aos y su desviacin estndar es de 4 aos Cul es la probabilidad de encontrar alumnos de mas de 34 aos?Qu se necesita para hacer esto?Primero entender que la distribucin normal se asemeja a la distribucin de las edades.Para esto hay que convertir los valores que te dan a valores estndar. Cmo hacemos esto?Z = ( X - ) /

Formula para convertir a valores estndarZ = ( X - ) /

X = valor dado a convertir = media = desviacin estndarAplicacinEn un saln de clases la media del grupo es de 29 aos y su desviacin estndar es de 4 aos Cul es la probabilidad de encontrar alumnos de mas de 34 aos?

X = valor dado a convertir = = media = = desviacin estndar =

Media = 29 = 4

29Aplicacin 2Despus de cometido un delito la media en horas de encontrar al responsable del delito es de 45 hrs. Con un desviacin estndar de 10 hrs.Encontrar la probabilidad de encontrar al responsable del delito a mas tardar 24 hrs. despus de realizado este?X = valor dado a convertir = media = desviacin estndar

Media = 45, = 5

45Aplicacin 3El tiempo promedio que emplea un empleado para atender una demanda es de 42 minutos, suponga que la desviacin estndar es de 16 minutos, y que los tiempos de atencin tienen una distribucin normal. Cul es la probabilidad de que una persona tarde cuando menos 1 hora en poner su demanda?Cul es la probabilidad de que una persona no tarde mas de 30 minutos en poner su demanda?Suponga que y es una variable aleatoria de distribucin normal con media de 10 y desviacin estndar de 2.1Calcule P (y11)Calcule P(7.6 y 12.2)Aplicacin 4Un tubo fluorescente estndar tiene una duracin distribuida normalmente con una media de 7,000 horas y una desviacin estndar de 1,000 horas. Un competidor ha inventado un sistema de iluminacin fluorescente compacto que se puede insertar en los receptculos de lmparas incandescentes.El competidor asegura que el nuevo tubo compacto tiene una duracin distribuida normalmente con una media de 7500 horas y una desviacin estndar de 1200 horas.Cul tubo fluorescente tiene mayor probabilidad de tener una duracin mayor de 9000 horas?Cul tubo tiene mayor probabilidad de tener una duracin de menos de 5000 horas?Aplicacin 5

Calcule el intervalo intercuartilico IQR y la desviacin estndar, s, para la muestra, y luego calcule el cociente IQR/s. Si los datos son aproximadamente normales, IQR/s 1.3Como determinar si los datos provienen de una distribucin aproximadamente normal

Variables aleatoriasVariable aleatoria discretaVariable aleatoria continuo38Muchas variables aleatorias que se observan en la vida real no son variables aleatorias discretas porque la cantidad de valores que pueden asumir no se puede contar.Por ejemplo, el tiempo de espera y (en minutos) para completar un trabajo de procesamiento de datos 0 < y < infinito.Variables aleatorias continuas.La funcin de densidad para una variable aleatoria continua y , que modela alguna poblacin de datos de la vida real, por lo regular es una curva continua como lo que se muestra la siguiente figura:

Funcin de densidad de una variable aleatoria continua.

El rea acumulativa bajo la curva entre menos infinito y un punto y0 es igual a F(y0)f(y) 0

Propiedades de la funcin de densidad

Donde a y b son constantes.Ejemplo 1: Sea c una constante y consideremos la funcin de densidad.

a.- Calcule el valor de cb.- Calcule P (0.2 < y < 0.5

C=2= 0.21Ejemplo2: Obtenga la funcin de distribucin acumulativa para la variable aleatoria y. Despus, calcule F(0.2) y F(0.7)

EntoncesF(0.2) = P(la integral es de cero a y , porque el problema as lo plantea y>0Ejercicios 1:1.- Sea c una constante y consideremos la funcin de densidad

a.- Calcule el valor de c.b.- Obtenga la funcin de distribucin acumulativa F(y)c.- Calcule F(1)d.- Calcule F(0.5)e.- Calcule P (1 y 1.5)Ejercicio2Sea c una constante y consideremos la funcin de densidad

a.-Calcule el valor de cb.-Obtenga la funcin de distribucin acumulativa F(y)c.-Calcule F(0.4)d.-Calcule P (0.1 y 0.6)Ejercicio3Sea c una constante y consideremos la funcin de densidad

a.-Calcule el valor de cb.-Obtenga la funcin de distribucin acumulativa F(y)c.-Calcule F(2.6) =d.-Calcule P (1 y 5)En estudios anteriores se inicio el estudio de las pruebas de hiptesis. Se utilizo la distribucin normal estndar, la distribucin z, como estadstico de prueba. Para emplear dicha distribucin la poblacin debe ser normal y conocerse la desviacin estndar poblacional. En muchas situaciones del mundo real, la poblacin es aproximadamente normal, pero se desconoce la desviacin estndar de la poblacin. En este caso s se utiliza la desviacin estndar muestral en vez de .

Si el tamao de la muestra es de al menos de 30, los resultados se consideran satisfactorios. (Tamao de muestra de menor o igual a 30, n30)Distribucin t de studentEsta distribucin tiene la caracterstica de que puede ser usada en aquellos casos en los que el tamao de muestra esta limitado, debido a las caractersticas del experimento a realizar. Por ejemplo. En la industria es comn encontrarse con productos que debido a los materiales y/o proceso son sumamente caros y para realizar la prueba es necesario destruirlos. En estos casos el tamao de la muestra debe ser pequeo cinco a ocho partes. Una limitacin en la aplicacin de este estadstico es que la poblacin de la que se toma la muestra tiene una distribucin normal.

Para estos proyectos de investigacin , la distribucin z no es el estadstico de prueba adecuado. La t de Student, o la distribucin t, como se denomina comnmente se utiliza como estadstico de prueba.Qu sucede si el tamao de muestra es de menos de 30 observaciones?La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen funcin de los grados de libertad gl.Si deseas, la probabilidad de dos colas, multiplica por dos esta filaComo la distribucin z, es una distribucin continua.Como la distribucin z, es de forma de campana y simtrica.No hay una distribucin t, sino mas bien una familia de distribuciones t, todas tienen la misma media igual a cero, pero sus desviaciones estndares difieren de acuerdo con el tamao de muestra (n). Hay una distribucin t para un tamao de muestra 20, otra para un tamao de muestra 22, y as sucesivamente.La distribucin t es ms extendida y menos aguda en el centro que la distribucin normal. Sin embargo, a medida que aumenta el tamao de la muestra, la curva de la distribucin t se aproxima a la distribucin normal estndar.Caractersticas de la distribucin t de student

La experiencia en la investigacin de demandas por accidente en una institucin aseguradora revela que en promedio cuesta $60 dlares la realizacin de todos los trmites. Este costo se considero exorbitante comparado con el de otras compaas aseguradoras y se instauraron medidas para abatir los costos. A fin de evaluar el impacto de estas nuevas medidas se selecciono aleatoriamente una muestra de 26 demandas recientes y se realiz un estudio de costos. Se encontr que la media muestral de $57 y una desviacin estndar de la muestra de 10. En el nivel de significacin 0.01, hay una reduccin en el costo promedio, o la diferencia de $3 ($60 -$57) puede atribuirse al azar?AplicacinPaso 1: plantear la hiptesis nula y la hiptesis alternativa. . hiptesis nula, Ho, es que la media poblacional es 60. La hiptesis alternativa, H1 es que la media poblacional vale menos de 60. Esto se expresa como sigue:Ho: =60H1: 0Donde

La media y la varianza de una variable aleatoria tipo gamma son, respectivamente:

= 2 =2

Algunas propiedades

Cuando es un entero positivoEjercicio para laboratorio

Dibujar la funcin de distribucin Gamma, para para valores enteros de Considera los valores de y, a partir de 1 en adelante.

Realizarla con formula, para que cuando cambie el valor de alfa o beta, cambie automticamente la grafica.yf(y)== =Investigadores han descubierto que el nivel creciente mximo (en millones de pies cbicos por segundo) durante un periodo de cuatro aos para el Rio Susquehanna, Pennsylvania, sigue aproximadamente una distribucin gamma con =3 y =0.07

Calcule la media y la varianza del nivel creciente mximo durante un periodo de cuatro aos para el Rio Susquehanna.Los investigadores llegaron a sus conclusiones acerca de la distribucin de nivel creciente mximo observando los niveles de creciente mximos durante 20 periodos de cuatro aos, desde 1890 hasta 1969. Suponga que durante el periodo de cuatro aos 1982-1985 se observo que el nivel de creciente mximo fue de y=0.60 millones de pies cbicos por segundo. Esperara usted observar un nivel tan alto en una distribucin gamma con =3 y =0.07 Qu puede usted inferir acerca de la distribucin del nivel de creciente mximo para el periodo de cuatro aos 1982-1985?Aplicacin 1 (distribucin Gamma)La media y la varianza de una variable aleatoria tipo gamma son, respectivamente:

= =3(0.07)= 0.21

2 =2 =3(0.07)2 =0.0147=0.1212

+ 3 =0.21 +3(0.1212)=0.57

Se puede inferir que 0.60 es un valor que se sale del modelo matemtico.Por experiencia anterior, un fabricante sabe que la distribucin de frecuencia relativa del tiempo (en meses) que transcurre entre dos quejas de clientes importantes insatisfechos con sus productos se puede modelar mediante una funcin de densidad gamma con =2 y =4. Quince meses despus de que el fabricante hizo ms estrictos sus requisitos de control de calidad, llego la primera queja. sugiere esto que el tiempo medio entre quejas de clientes importantes podra haber aumentado?Aplicacin 2 = = (2)(4)

2 =2 =(2)(4)2 =32=5.7Puesto que y =15 meses queda un poco ms de una desviacin estndar de la media (8 + 5.7=13.7), no podemos considerar a 15 meses como un valor desusadamente grande de y.Conclusin, no hay suficientes pruebas que indiquen que el programa de control de calidad de la compaa ha logrado incrementar el tiempo medio entre quejas.Una variable aleatoria tipo gamma que desempea un papel importante en estadstica es la variable aleatoria ji cuadrada.Una variable aleatoria ji cuadrada (X2) es una variable aleatoria tipo gamma con =v/2 y =2

Distribucin de probabilidad ji cuadrada.

La media y la varianza de una variable aleatoria ji cuadrada son, respectivamente.=v 2=2v

El parmetro v es el nmero de grados de libertad de la distribucin ji cuadrada. Aplicaciones:

Ji cuadrada como prueba de independencia.Ji cuadrada como prueba de la bondad de ajuste: prueba de lo apropiado de una distribucin.Esta distribucin se aplica en los anlisis de fiabilidad, para establecer, por ejemplo, el periodo de vida de un componente hasta que presenta una falla. La ecuacin para la funcin de distribucin acumulada de Weibull es:

La funcin de densidad de probabilidad es: Cuando = 1 la distribucin de Weibull devuelve la distribucin exponencial con:

La funcin de densidad Weibull contiene dos parmetros y .. es parmetro de escala, , refleja el tamao de las unidades en que se mide la variable aleatoria y el parmetro , es el parmetro de forma. Si se cambia el valor del parmetro , es posible generar un conjunto con una amplia variedad de curvas que modelan distribuciones de tiempo hasta falla de la vida real.

A dems de proporcionar un buen modelo para las distribuciones del tiempo hasta falla de muchos componentes fabricados, la distribucin Weibull es fcil de usar.

Distribucin de Weibull

Si 0y0 ; >0En cualquier otro punto

La funcin de densidad Weibull contiene dos parmetros, y , el parmetro de escala , refleja el tamao de las unidades en que se mide la variable aleatoria y.

El parmetro es el parmetro de forma. Si se cambia el valor del parmetro de forma , es posible generar un conjunto con una amplia variedad de curvas que modelan distribuciones de tiempo hasta falla de vida real.y es el tiempo entre fallas, cuanto tiempo transcurre de una falla a otra.Tarea.

Dibujar en Excel

1.- La funcin de densidad Gamma2.- La funcin de densidad Weibull3.- La funcin de densidad Beta

Para entregar va mail la prxima clase.

La duracin (en horas) de una broca de taladro que se emplea en una operacin de fabricacin tiene una distribucin de Weibull con =2 y =100. Calcule la probabilidad de que una broca de taladro fallar antes de 8 horas de uso.Aplicacin 1 de Weibull

Integrar esta funcin haciendo el siguiente cambio de variable z = y

Ya que la integras te debe quedar lo siguiente:

Resp: 0.473Un fabricante de lavadoras garantiza sus productos contra cualquier defecto durante el primer ao de uso normal. El fabricante ha estimado un costo por reparacin de 75$ durante el periodo de garanta.

Con base en la experiencia, se sabe que el tiempo en que ocurre la primera falla es una variable aleatoria de Weibull con parmetros de forma y escala iguales a 2 y 40, respectivamente. Si el fabricante espera vender 100 mil unidades y si para una misma unidad, se descuenta el valor de las reparaciones, se determina el costo esperado de la garanta para el fabricante. Sea X la variable aleatoria que representa el tiempo que transcurre hasta que se presenta la primera avera.

Aplicacin 2 (Weibull)Por hiptesis, la funcin de densidad de probabilidad de X es:La probabilidad de que la primera avera ocurra durante el periodo de garanta es igual a la probabilidad de que X sea menor o igual a 12. Mediante el empleo de la frmula cerrada de distribucin:

Por lo tanto, si se supone que la operacin de las lavadoras es independiente entre s, se pueden esperar (100.000)(Probabilidad) = n fallas durante el perodo de garanta con un costo total de n por el costo de reparacin

Para el problema anterior, calcule la vida media de las brocas para el taladro y la varianza de la distribucin del tiempo hasta falla.

Capsula culturalAnteriormente dijimos que la funcin de densidad gamma proporciona un modelo para la distribucin de frecuencia relativa de una variable aleatoria que tiene un limite inferior fijo pero que puede hacerse infinitamente grande.La funcin de densidad beta, tambin caracterizada por dos parmetros, tiene limites inferior y superior finitos (0 y 1)

Distribuciones de probabilidad tipo beta

Si 0y1; >0; >0

La media y la varianza de una variable aleatoria beta son, respectivamente:

Los sensores de infrarrojo de un sistema robtico computarizado envan informacin a otros sensores en diferentes formatos. El porcentaje y de las seales que se envan y que son directamente compatibles para todos los sensores del sistema sigue una distribucin beta con ==2a.- Calcule la probabilidad de que ms de 30% de las seales de infrarrojo enviadas en el sistema sean directamente compatibles para todos los sensores. b.- Calcule la media y la varianza de yAplicacin 1 (Distribucin de probabilidad Beta)

Aplica esta formula e intgrala de 0.30 a 1

Media =0.5

Varianza= 0.05Aplicacin 2 (Distribucin de probabilidad beta)Se determino que datos recabados a lo largo del tiempo sobre el aprovechamiento de un ncleo de computadora (como una proporcin de la capacidad total) tenan una distribucin de frecuencia relativa que se poda aproximar mediante una funcin de densidad beta con =2 y =4. Calcule la probabilidad de que la proporcin del ncleo que se utiliza en un momento dado sea menor que 0.20.

p=0.20NombreFuncin de densidadMediaVarianzaCaracterstica, o cuando se aplica.En que situaciones se aplica.BinomialNormalPoissonGammat studentBetaJi cuadradaWeibullCuadro comparativo de distribuciones de probabilidad, te ayudar, a conocer los usos. (realiza esto como tarea)IntroduccinTeorema de combinacin lineal de variables aleatorias y teorema del limite central.Muestreo: introduccin al muestreo y tipos de muestreo.Teorema del limite centralDistribucin Muestral de la media.Distribucin Muestral de la diferencia de medias.Distribucin Muestral de la proporcin

Unidad 2 (Distribuciones muestrales)

Distribucin muestral de la diferencia de proporciones.Distribucin muestral de la varianza.Distribucin muestral de la relacin de varianzas.

Unidad 2 (Distribuciones muestrales)En estudios pasados de Estadsticas centramos nuestra atencin en tcnicas que describen los datos, tales como organizar datos en distribuciones de frecuencias y calcular diferentes promedios y medidas de variabilidad. Estbamos concentrados en describir algo que ya ocurri. Tambin comenzamos a establecer los fundamentos de la estadstica inferencial, con el estudio de los conceptos bsicos de la probabilidad, las distribuciones de probabilidad discretas y continuas. Distribuciones que son principalmente generadas para evaluar algo que podra ocurrir. Ahora veremos otro tipo de distribucin de probabilidad, que se llaman distribuciones muestrales.

Por qu muestrear? Muestrear es una forma de evaluar la calidad de un producto, la opinin de los consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es una parte de la poblacin. Poblacin es el total de resultados de un experimento. Hacer una conclusin sobre el grupo entero (poblacin) basados en informacin estadstica obtenida de un pequeo grupo (muestra) es hacer una inferencia estadstica. A menudo no es factible estudiar la poblacin entera. Distribuciones Muestrales.Algunas de las razones por lo que es necesario muestrear son:

1. La naturaleza destructiva de algunas pruebas2. La imposibilidad fsica de checar todos los elementos de la poblacin. 3. El costo de estudiar a toda la poblacin es muy alto.4. El resultado de la muestra es muy similar al resultado de la poblacin.5. El tiempo para contactar a toda la poblacin es inviable.

Distribucin Muestral de las Medias El ejemplo de los ratings de eficiencia muestra como las medias de muestras de un tamao especfico varan de muestra a muestra. La media de la primera muestra fue 101 y la media de la segunda fue 99.5. En una tercera muestra probablemente resultara una media diferente. Si organizamos las medias de todas las posibles muestras de tamao 2 en una distribucin de probabilidad, obtendremos la distribucin muestral de las medias. Distribucin muestral de las medias. Es una distribucin de probabilidad de todas las posibles medias muestrales, de un tamao de muestra dado, seleccionadas de una poblacin.

Continua Muestreo Aleatorio

Si se seleccionan n elementos de una poblacin de modo tal que cada conjunto de n elementos de la poblacin tenga la misma probabilidad de ser seleccionado, se dice que los n elementos constituyen una muestra aleatoria.Distribuciones de muestreo

La distribucin de muestreo de una estadstica es su distribucin de probabilidad

El error estndar de una estadstica es la desviacin estndar de sus distribucin de muestreo.

Aplicacin 1

Suponga que la variable aleatoria y tiene una funcin de densidadSi 0yN, si denotamos la media y la desviacin tpica de la distribucin de muestreo de medias por x , x y las de la poblaciones por y

Si la poblacin es infinita o si el muestreo es con reposicin, los resultados anteriores se reducen a:

x = x =/N Para valores grandes de N ( N 30) la distribucin de muestreo de medias es aproximadamente normal con media x y la desviacin tpica x , independientemente de la poblacin (en tanto en cuanto la media poblacional y la varianza sean finitas y el tamao de la poblacin sea al menos el doble que el de la muestra)

Distribucin de muestreo de medias (comprobacin)

Una poblacin consta de los nmeros 2,3, 6, 8 y 11. Consideremos todas las posibles muestras de tamao 2 que pueden tomarse con reposicin de esa poblacin. HallarLa media de la poblacin.La desviacin tpica de la poblacinLa media de la distribucin de muestreo de mediasLa desviacin tpica de la distribucin de muestreo de media.Antes de ver la respuesta intntalo.Para el primer inciso , sumas los valores y los divides entre el numero de datos que tienes.Para la desviacin tpica

Para datos aisladosS = ( (xj x-)2 / N )j = 1,2,N

Xj = cada dato x- = mediaN = total de datosPara N 30 se sustituye N por N-1

Para las muestras de tamao dos , toma todas la combinaciones que puedas (2,2 ) (2,3) (2,6) (2,8) (2,11) luego le siguen con el 3 y as sucesivamente, son 25 muestras en total, de estas 25 muestras obtn la media 4. x =/N

Aplicacin.Estamos interesados en una poblacin de 20 compaas textiles del mismo tamao, todas estas fbricas experimentan una produccin excesiva de trabajo. Nuestro estudio indica que la desviacin estndar de la distribucin de la produccin anual es igual a 75 empleados. Si muestreamos cinco de estas compaas textiles, sin reemplazo, y deseamos calcular el error estndar de la media:

Np tamao poblacin 20N tamao de la muestra 5 desviacin estndar de la poblacin 75Aplicacin 2

Las alturas de 3000 estudiantes varones de una Universidad estn normalmente distribuidas con media de 68 in y desviacin tpica 3 in. Si se toman 80 muestras de 25 estudiantes cada una, cules sern la media y la desviacin tpica esperada de la resultante distribucin de muestreo de medias, si el muestreo se hizo:a.-) Con reposicinb.-) Sin reposicinNo seas tramposoNo veas la respuesta hasta que le intentes primero.El nmero de muestras de tamao 25 que podran elegirse de un grupo de 3000 estudiantes con y sin reposicin son 300025Y la combinacin de 3000 tomados de 25 3000C25

Aplicacin 3

500 bolas de cojinete tienen un peso medio de 5.02 gramos cada una y una desviacin tpica de 0.30 g. Hallar la probabilidad de que una muestra al azar de 100 bolas de este conjunto tengan un peso total:

a.-) Menor a 5 gramos.b.-) Menor a 4.96 gramos.c.-) Ms de 5.10 gramos.d.-)Entre 4.96 y 5 gramos.e.-) Ms de 5.10 g.

4.96 en unidades estndar z= (X )/

z=(4.96-5.02)/0.027 =-2.22

5.00 en unidades estndar z=

=0.027Distribucin de muestreo de proporciones

Supongamos que una poblacin es infinita y que la probabilidad de ocurrencia de un suceso, su xito es p, mientras que la probabilidad de que no ocurra es q=1-p.Por ejemplo, la poblacin puede ser la de todas las posibles tiradas de una moneda, en la que la probabilidad del suceso cara es p=1/2. Consideremos todas las posibles muestras de tamao N de tal poblacin, y para cada una de ellas determinemos la proporcin de xitos P

Estas ecuaciones son validas, tambin para una poblacin finita en la que se hace un muestreo con reposicin.

Aplicacin 1

En unas elecciones uno de los candidatos obtuvo el 46% de los votos. Hallar la probabilidad de que en un muestreo de:200 votantes elegidos al azar, saliera la mayora a su favor.1000 votantes elegidos al azar, saliera mayora a su favor.Utiliza, 4 decimales, para este problema.Nota: de una muestra de 200, la mayora sera, la mitad mas 1 esto es la proporcin sera 101/200p =p = 0.46

p = 0.46x0.54/200 = 0.0352

La mayora se obtiene cuando la proporcin es 101/200 =0.505

z= (0.505-0.46 )/0.0352 = 1.27

1.27Probabilidad de que sea mayora, el rea que esta a la derecha.9.68%Distribucin de muestreo de diferencias y sumas

Sean dadas dos poblaciones. Para cada muestra de tamao N1 de la primera, calculamos un estadstico S1; eso da una distribucin de muestreo para S1, cuya media y desviacin tpica denotaremos por s1 y s1.

Del mismo modo para cada muestra de tamao N2 de la segunda poblacin, calculamos un estadstico S2; eso nos da una distribucin de muestreo para S2, cuya media y desviacin tpica denotaremos por s2 y s2.

De todas las posibles combinaciones de estas muestras de estas dos poblaciones podemos obtener una distribucin de las diferencias, S1-S2, que se llama distribucin de muestreo de las diferencias de los estadsticos.La media y la desviacin tpica de esta distribucin de muestreo, denotadas respectivamente por:

Damos por supuesto que las muestras escogidas no dependan en absoluto una de otra(o sea que sean independientes)

Si S1 y S2 son las medias mustrales de ambas poblaciones, cuyas medias denotamos por :

Respectivamente, entonces la distribucin de muestreo de las diferencias de medias viene dada para poblaciones infinitas con medias y desviaciones tpicas (1,1) y (2,2)El resultado es valido tambin para poblaciones finitas si el muestreo es con reposicin.Anlogos resultados pueden alcanzarse para poblaciones finitas en que el muestreo sea sin reposicin.Aplicacin

Las lmparas de un fabricante A tienen vida media de 1400 h con desviacin tpica de 200 h, mientras que las de otro fabricante B tienen vida media de 1200 h con desviacin tpica de 100 h. Si se toma una muestra de 125 lmparas de cada clase, cul es la probabilidad de que las de A tengan una vida media que sea al menos a.- de 160 horas, ms que las de B?b.- de 250 horas, ms que las de B?

a.- 160-200/20b.- 250-200/20Aplicacin:

Las bolas de rodamientos de cierto fabricante pesan 0.50 g de media, con desviacin tpica de 0.02 g. Cul es la probabilidad de que dos lotes de 1000 bolas cada uno difieran en peso en ms de 0.002 g?

IntroduccinCaractersticas de un buen estimador.Estimacin puntualMtodosMxima verosimilitudMomentos.Intervalo de confianza para la media.Intervalo de confianza para la diferencia de medias.

Unidad 3 (Estimacin de parmetros)Intervalo de confianza para la proporcin.Intervalo de confianza para la diferencia de proporciones.Intervalo de confianza para la varianza.Intervalo de confianza para la relacin de varianzas.Determinacin del tamao de muestra.Basado en la media de la poblacin.Basado en la proporcin de la poblacin.Basado en la diferencia entre las medias de la poblacin.Unidad 3 (Estimacin de parmetros)Anteriormente vimos cmo se puede emplear la teora del muestreo para recabar informacin acerca de muestras aleatorias tomadas de una poblacin conocida. Desde un punto de vista practico, no obstante , suele resultar ms importante ser capaz de inferir informacin sobre la poblacin a partir de muestras suyas. Con tal situacin trata la inferencia estadstica, que usa los principios de la teora del muestreo.

Un problema importante de la inferencia estadstica es la estimacin de parmetros de la poblacin, o brevemente parmetros (tales como la media o la varianza de la poblacin) de los correspondientes estadsticos mustrales, o simplemente estadsticos (tales como la media y la varianza de la muestra)Teora de la estimacin estadstica.

Si la media de las distribuciones de muestreo de un estadstico es igual que la del correspondiente parmetro de poblacin, el estadstico se llama un estimador sin sesgo del parmetro, si no se llama un estimador sesgado. Los correspondientes valores de tales estadsticos se llaman estimaciones sin sesgo y sesgadas, respectivamente.Estimaciones sin sesgoEjemplo: La media de las distribuciones de muestreo de medias , la media de la poblacin. Por tanto la media muestral es una estimacin sin sesgo de la media de la poblacin

Si las distribuciones de muestreo de dos estadsticos tienen la misma media (o esperanza), el de menor varianza se llama un estimador eficiente de la media, mientras que el otro se llama un estimador ineficiente. Los valores correspondientes de los estadsticos se llaman estimacin eficiente o estimacin ineficiente, respectivamente.Si consideramos todos los posibles estadsticos cuyas distribuciones de muestreo tienen la misma media, aquel de varianza mnima se llama a veces estimador de mxima eficiencia o sea el mejor estimador. Estimacin eficienteSi el estadstico S es la media de la muestra, entonces los limites de confianza.

Intervalos de confianza para las medias.

+/- Zc * /N Si el muestreo es de una poblacin infinita o de una finita con reposicin.Si el muestreo es sin reposicin de una poblacin finita de tamao Np

+/- Zc* (/N)*((Np-N)/(Np-1) A la segunda parte de la formula, despus del +/- , se le llama error de la estimacinAplicacin:

Las medidas de los dimetros de una muestra aleatoria de 200 bolas de rodamientos producidas por una maquina en una semana, dieron una media de 0.824 cm y una desviacin tpica de 0.042 cm. Hallar los limites de confianza.a.- 95%b.- 99% para el dimetro medio de todas las bolas. los limites de confianza 95% son:

0.824 +/- 1.96* 0.042/200

el valor de 1.96 lo encuentras con la tabla de distribucin normal, como es 95% y es de dos colas, entonces se busca un rea de 0.95 + 0.05/2=0.975, este valor lo buscas en la tabla y su correspondiente valor de z es igual a 1.96

Por qu es dos colas?Ya que es un intervalo de confianza, buscas el valor hacia arriba y abajo.

LS = 0.8298 limite superiorLI =0.8181 limite inferior

Aplicacin

Al medir el tiempo de reaccin, un psiclogo estima que la desviacin tpica es 0.05 segundos. De qu tamao ha de tomarse una muestra de medidas para tener una confianza del :

a.- 95% yb.- 99% de que el error de la estimacin no supera 0.01 segundos (o sea que sea menor a 0.01 segundos).

+/- Zc * /NEsto se considera como error de estimacin(1.96)(0.05)/N < 0.01

Mismo caso para el 99% donde z=2.58Aplicacin:

Una muestra al azar de 50 calificaciones de matemticas de entre un total de 200, revela una media de 75 y una desviacin tpica de 10.a.- Cules son los limites de confianza 95% para estimaciones de la media de las 200 calificaciones?b.- Con qu grado de confianza podramos decir que la media de las 200 es 75+/-1?

Como la poblacin no es muy grande comparada con el tamao de muestra, debemos tenerlo en cuenta.

75 +/- (1.64*(10)/50)((200-50)/(200-1)

+/- 1.23Zc

1.23Zc =1

Encuentra el Zc y luego encuentras el rea con la tabla de distribucin normal Si el estadstico S es la proporcin de xitos en una muestra de tamao N sacada de una poblacin binomial en la que p es la proporcin de xitos (o sea, la probabilidad de xitos), entonces los limites de confianza para p vienen dados por:

p +/- Zc p , donde p es la proporcin de xitos en la muestra de tamao N. Si el muestreo es de una poblacin infinita o finita con reposicinp +/- Zc (pq/N)

Si el muestreo es de una poblacin finita de tamao Np y sin reposicin.p +/- Zc (pq/N) * (Np-N)/(Np-1)

Intervalos de confianza para proporcionesAplicacin:

Un sondeo de 100 votantes elegidos al azar en un distrito indica que el 55% de ellos estaban a favor de un cierto candidato. Hallar los limites de confianza.a.- 95%b.- 99%c.- 99.73% para la proporcin de todos los votantes favorables a ese candidato.

0.55 +/- 1.96(0.55)(0.45)/100Aplicacin:

En 40 lanzamientos de una moneda, han salido 24 caras. Hallar los lmites de confianza.a.- 95%b.- 99.73% para la proporcin de caras que se obtendran en un numero ilimitado de lanzamientos de esa moneda.

Si el muestreo es de una poblacin infinita o finita con reposicinp +/- Zc (pq/N)

P=24/40N=40Zc buscar en la tabla.Si S1 y S2 son dos estadsticos mustrales con distribuciones de muestreo aproximadamente normales, los lmites de confianza para la diferencia de los parmetros de poblacin correspondientes a S1 y S2 vienen dados por:Intervalos de confianza para diferencias y sumas

Mientras que los limites de confianza para la suma de los parmetros de poblacin vienen dados por

Los limites de confianza para la diferencia de dos medias poblacionales, en el caso de poblaciones infinitas, se calculan como:

Los limites de confianza para la diferencia de dos proporciones poblacionales, con poblaciones infinitas, estn dados por:

Tienda en el centro de la ciudadTienda en el centro comercialTamao de muestraN1=36 N2=49 Media muestral40 aos35 aosDesviacin estndar poblacional9 aos10 aos

AplicacinEl margen de error es de 4.06 aos y la estimacin por intervalo de 95% de confianza de la diferencia entre las medias poblacionales va de 5-4.06=0.94 aos a 5+4.06=9.06 aos.En promedio los clientes del centro de la ciudad son 5 aos mayores que los del centro comercial, pero con un 95% de confianza esta la diferencia entre 0.94 y 9.06 aos.Aplicacin:

Una muestra de 150 lmparas del tipo A ha dado una vida media de 1400 hrs. Y una desviacin tpica de 120 hrs. Una muestra de 200 lmparas del tipo B dan vida media de 1200 h y desviacin tpica de 80 horas. Hallar los lmites de confianza:a.- 95% yb.- 99% para la diferencia de las vidas medias de las poblaciones de ambos tipos.

1400-1200 +/- 1.96(120)2/150 + (80)2/100Aplicacin:

En una muestra aleatoria de 400 adultos y 600 jvenes que vieron un cierto programa de televisin, 100 adultos y 300 jvenes reconocieron que les haba gustado. Determinar los limites de confianza a.- 95%b.- 99% para la diferencia en proporciones de todos los adultos y jvenes que vieron con agrado el programa.

P1=300/600 =0.50P2=100/400=0.25

0.50-0.25 +/- 1.96(0.50)(0.50)/600 +(0.25)(0.75)/400

Intervalos de confianza para desviaciones tpicas

Los lmites de confianza para la desviacin tpica de una poblacin normalmente distribuida, estimados con una muestra con desviacin tpica s, vienen dados por:

Aplicacin

La desviacin tpica de las vidas medias de una muestra de 200 bombillas es de 100 horas. Hallar los lmites de confianza.a.- 95%b.- 99% para la desviacin tpica de ese tipo de bombillas.

100 +/- 1.96(100)/400Inferencias acerca de la diferencia entre medias poblacionales:1 y 2 desconocidas (desviaciones estndar poblacionales desconocidas)

La inferencia sobre la diferencia entre dos medias poblacionales se extiende al caso en el que las dos desviaciones estndar poblacionales, 1 y 2 no se conocen .En este caso para estimar las desviaciones estndar poblacionales desconocidas se emplean las desviaciones estndar mustrales, s1 y s2. Cuando se usan las desviaciones estndar mustrales en las estimaciones por intervalo y en las pruebas de hiptesis, se emplea la distribucin t en lugar de la distribucin normal estndar.

Ejemplo: Encontrar el valor de la t student, con un 95% de confianza y 7 grados de libertad. (2 colas)

t=2.36Ejemplo:

Bancomer, realiza un estudio para identificar diferencias entre las cuentas de cheques de sus clientes en dos de sus sucursales; toma una muestra aleatoria simple de 28 cuentas de la sucursal Sauz y otra muestra aleatoria simple e independiente de 22 cuentas de cheques de la sucursal Patria. A continuacin se presenta un resumen de los saldos en esas cuentas.SauzPatriaTamao de la muestran1=28n2=22Media muestralx1=$1025x2=$910Desviacin estndar muestrals1=$150s2=$125El banco desea estimar la diferencia entre el saldo medio en las cuentas de cheques de clientes del Sauz y el saldo medio en las cuentas de cheques de la sucursal Patria.

Grados de libertad: distribucin t , con dos muestras aleatorias independientes.47.8 se redondea a 47

115 +/- 78Estimacin por intervalo de la media poblacional: Se puede considerar que se conoce la desviacin estndar poblacional ?

SINOUse la desviacin estndar muestral s para estimar Aplicacin:Las primeras semanas del 2004 fueron buenas para el mercado de acciones. En una muestra de 25 fondos abiertos se encontraron las siguientes ganancias obtenidas desde el principio del ao al 24 de enero del 2004.7.03.21.45.48.52.52.51.95.41.61.02.18.54.36.21.51.22.73.82.01.22.64.02.60.6a.-Cul es la estimacin puntual de la media poblacional de las ganancias en fondos abiertos desde principio del ao hasta esa fecha?

b.-Puesto que la poblacin tiene una distribucin normal, calcule un intervalo de confianza de 95% para la media poblacional de las ganancias en fondos abiertos desde el principio del ao hasta esa fecha.

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen funcin de los grados de libertad gl.Si la prueba es de dos colas, el valor de lo divides entre dos y lo buscas en esta fila

Si deseas, buscar el valor de la t student en Excel, puedes usar la funcin DISTR.T.INV, te pedir la probabilidad esto es el nivel de significancia, tu se lo pones dependiendo si es una cola o dos colas, acurdate que si es dos colas, divides el valor de entre dos.Repaso:

La media y desviacin tpica de las cargas mximas soportadas por 60 cables, son 11.09 y 0.73 toneladas, respectivamente. Hallar los limites de confianza.a.-95%b.-99% para la media de las cargas mximas soportadas por los cables de este tipo.

Repaso:

Se espera que una eleccin entre dos candidatos sea muy reida. Cual es el mnimo nmero de votantes a sondear si se quiere tener un 95% de confianza sobre la decisin a favor uno de otro?IntroduccinErrores tipo I y tipo IIPotencia de la prueba.Formulacin de hiptesis estadsticas.Prueba de hiptesis para la media.Prueba de hiptesis para la diferencia de medias.Prueba de hiptesis para la proporcin. Prueba de hiptesis para la diferencia de proporciones.Prueba de hiptesis para la varianza.Prueba de hiptesis para la relacin de varianzas.

Unidad 4 (Prueba de Hiptesis)La prueba de hiptesis comienza con una suposicin, llamada hiptesis, que hacemos con respecto a un parmetro de poblacin. Despus recolectamos datos de muestra, producimos estadsticas de muestra y usamos esta informacin para decidir qu tan probable es que sea correcto nuestro parmetro de poblacin acerca del cual hicimos la hiptesis. Digamos que suponemos cierto valor para una media de la poblacin.

Para probar la validez de nuestra suposicin recolectamos datos de muestra y determinamos la diferencia entre el valor real de la media de dicha muestra.

Despus juzgamos si la diferencia obtenida es significativa o no. Mientras mas pequea sea la dicha diferencia, mayor ser la probabilidad de que nuestro valor hipotetizado para la media sea correcto. Mientras mayor sea la diferencia, ms pequea ser la probabilidad. Elaboracin de las hiptesis nula y alternativa

En algunas aplicaciones no parece obvio cmo formular la hiptesis nula y la hiptesis alternativa. Se debe tener cuidado en estructurar las hiptesis apropiadamente de manera que la conclusin de la prueba de hiptesis proporcione la informacin que el investigador o la persona encargada de tomar decisiones desea.Prueba de una hiptesis de investigacin

Considere un determinado modelo de automvil en el que el rendimiento de la gasolina es 24 millas por galn. Un grupo de investigacin elabora un nuevo sistema de inyeccin de combustible diseado para dar un mejor rendimiento en millas por galn de gasolina. Para evaluar el nuevo sistema se fabrican varios de stos, se instalan en los automviles y se someten a pruebas controladas de manejo. En este caso, el grupo de investigacin busca evidencias para concluir que el nuevo sistema aumenta la media del rendimiento.

La hiptesis de investigacin es, entonces que el nuevo sistema de inyeccin de combustible proporciona un rendimiento medio mayor a 24 millas por galn de combustible; es decir, >24. Como lineamiento general, una hiptesis de investigacin se debe plantear como hiptesis alternativa.

Ho: 24Ha: >24 (la hiptesis que tu quieres probar la pones como alternativa)Prueba de la validez de una afirmacin:

A manera de ejemplo de la prueba de validez de una afirmacin, considere una situacin en la que un fabricante de refrescos asegura que los envases de dos litros de refresco contienen en promedio, por lo menos 67.6 onzas de liquido. Se selecciona una muestra de envases de dos litros y se mide su contenido para confirmar lo que asegura el fabricante. En este tipo de situaciones de prueba de hiptesis, se suele suponer que el dicho del fabricante es verdad a menos que las evidencias mustrales indiquen lo contrario.

Ho: 67.6Ha: 895 (la hiptesis que tu quieres probar la pones como alternativa)

La diferencia en tamao entre muestras grandes y pequeas es importante cuando no se conoce la desviacin estndar de la poblacin y se hace necesario estimarla a partir de la desviacin estndar de la muestra. Si el tamao de la muestra n es de 30 o menor y se desconoce, debemos utilizar la distribucin t. La distribucin t apropiada tiene n-1 grados de libertad. Estas reglas tambin se aplican a la prueba de hiptesis.

Aplicacin 3

Una empresa sostiene que el salario medio por hora de sus trabajadores es de 500 pesos. El sindicato sospecha que la empresa exagera el valor del salario medio por hora. En una muestra de 400 trabajadores, el sindicato encuentra que el salario medio por hora es de 490 pesos con una desviacin estndar de 60 pesos.Plantear la hiptesis nula y alternaLlegar a una conclusin respecto a la afirmacin de la empresa, con un 5% de nivel de significacin.

Ho: media=Ha: media < 500Aplicacin 4 (Tarea)

El departamento de control de calidad de Tigre Toi especifica que el peso promedio por paquete de cereal debe ser de 20 onzas. Peridicamente se selecciona una muestra de cajas llenas, que se pesan para determinar si estn faltas o sobradas de llenado. Si los datos de la muestra llevan a la conclusin de que les falta o sobra cereal, se debe parar la lnea de produccin y hacer los ajustes necesarios para que el llenado sea correcto.a) Formule las hiptesis nula y alternativa que ayuden a decidir si es conveniente parar y ajustar la lnea de produccin o no.b) Cul es el error de tipo I en este caso? Cules son las consecuencias de cometerlo?

Aplicacin 5 (Tarea)

En una encuesta, un investigador obtuvo la estimacin de que la media del nmero de horas de ver TV por familia es de 7.25 horas diarias. Suponga que en esta encuesta participaron 200 familias y que la desviacin estndar de la muestra fue de 2.5 horas diarias. Hace 10 aos, la media de la poblacin de horas de TV era de 6.70 por familia. Si =la media de la poblacin del nmero de horas de ver TV por familia hace 10 aos, pruebe la hiptesis

Use =0.01.

Cul es el valor crtico del estadstico de prueba y cul es la regla de rechazo?Calcule el valor del estadstico de prueba.cul es su conclusin?

Pruebas de hiptesis para proporciones:

Ejemplo:En aos anteriores 20% de los jugadores del campo eran mujeres. Para aumentar la proporcin de mujeres se realiz una promocin especial. Un mes despus de realizada la promocin, el administrador del campo solicita un estudio estadstico para determinar si la proporcin de jugadoras ha aumentado.

Aplicacin 2

En un estudio acerca de la rotacin de puestos, un investigador entrevista a una muestra aleatoria de 200 empleados de alto nivel que cambiaron de trabajo el ao anterior. Treinta afirman haberlo hecho a causa de la ausencia de perspectivas de ascenso en sus anteriores trabajos.a) Empleando un nivel de significancia de 0.05, ofrecen estos datos suficiente evidencia que indique que menos del 20% de esos empleados cambian de trabajo por ese motivo?b) Cul es el valor p-value?

El p-value, es el valor del rea de la colitaPruebas de hiptesis acerca 1 - 2

Estadstico de prueba para pruebas de hiptesis acerca de 1 y 21 y 2 desconocidas.

Nota: considerar a Do=0, esto quiere decir que no hay diferencia entre las medias poblacionales.Tecnologa existenteSoftware nuevo300274280220344308385336372198360300288315321258376318290310301332283263Tamao de muestran1=12n2=12Media MuestralX1=325X2=286Desviacin estndar muestrals1=40s2=44El investigador encargado de la evaluacin del nuevo software espera poder demostrar que con el nuevo software se necesita menos tiempo para el proyecto del sistema de informacin. De manera que el investigador tratar de hallar evidencias que le permitan concluir que 2 es menor que 1

Ho: 1-20Ha: 1-2>0Nivel de significancia =0.05

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen funcin de los grados de libertad gl.Nivel de significanciaInferencias acerca de la diferencia entre dos medias poblacionales: muestras pareadas.TrabajadorTiempo para realizar la tarea con el mtodo 1 (minutos)Tiempo para realizar la tarea con el mtodo 2(minutos)Diferencia entre los tiempos (di)(di Media de las diferencias)^216.05.40.6(0.6-0.30)^2=25.05.2-0.237.06.50.546.25.90.356.06.0066.45.80.6Media de las diferencias=0.30

Estadstico de prueba para pruebas de hiptesis con muestras pareadas.

t calculada=2.20Para el problema anterior:

Ho: d=0Ha: d0=0.05Para dos colas /2 = 0.025n-1= grados de libertad=6-1

t= ?t critica=2.571Conclusin, se acepta Ho que no hay diferencia entre las medias.Regla de decisin, usando el mtodo de p-value.

p-value nivel significacin, se rechaza la hiptesis nula, caso contrario se acepta la hiptesis nula.

Prueba de hiptesis acerca de p1-p2

Error estndar:

Estadstico de prueba para pruebas de hiptesis acerca de p1-p2

Aplicacin:

Una empresa se dedica a elaborar declaraciones de impuestos, suponga que la empresa desea realizar una prueba de hiptesis para determinar si las proporciones de errores de las dos oficinas son diferentes.Ho: p1-p2=0Ha: p1-p20=0.10p1=0.14n1=250p2=0.09n2=300Aplicacin:Durante el partido Chivas, Atlas, un comercial de la cervecera, conocido como las Chicas Sol, fue uno de los tres ms efectivos televisados durante el evento. Una encuesta para ver la efectividad de los comerciales, emple muestras por grupos de edades para ver el efecto de la publicidad en el partido Chivas, Atlas sobre los distintos grupos de edades. A continuacin se presentan los resultados mustrales respecto del comercial de la marca cerveza.

EdadTamao de muestraLe gust mucho el comercialMenos de 30 aos10049De 30 a 49 aos15054a.- Formule una prueba de hiptesis para determinar si las proporciones poblacionales de los dos grupos de edades difieren.b.-D la estimacin puntual de la diferencia entre las dos proporciones poblacionales.c.-Realice la prueba de hiptesis y d el valor-p. Con =0.05, cul es su conclusin?d.-Analice la forma en que el comercial llama la atencin del grupo de menor y de mayor edad. Le parecer a la empresa cervecera que los resultados de esta encuesta le son favorables?Ho: p1-p2=0Ha: p1-p20=p1=n1=p2=n2=Inferencias acerca de varianzas poblacionales

En los temas de los captulos anteriores se vieron mtodos de inferencia estadstica para medias y proporciones poblacionales. Ahora se extiende dicho estudio a las varianzas poblacionales. Un ejemplo en que la varianza brinda una informacin importante para tomar una decisin es el caso de un proceso en el que se llenan recipientes con un detergente lquido. La maquina de llenado se ajusta de manera que logre un llenado medio de 16 onzas por envase. Aunque la media de llenado es importante, la varianza en los pesos de llenado tambin es relevante.

Es decir, aun cuando la mquina de llenado tenga un ajuste adecuado para una media de llenado de 16 onzas, no es de esperar que todos los envases tengan exactamente 16 onzas.Para calcular la varianza muestral de la cantidad de onzas en cada envase se toma una muestra de envases llenos. El valor de la varianza muestral sirve como una estimacin de la varianza en la poblacin de envases que estn siendo llenados en el proceso de produccin.

Si la varianza muestral es moderada, el proceso continua. Pero si la varianza muestral es grande, puede estar ocurriendo por exceso o defecto de llenado, aunque la media sea correcta, en este caso habr de reajustar la maquina.

Estimacin por intervalo para la varianza poblacional:

Donde los valores de X2 estn basados en una distribucin chi-cuadrada con n-1 grados de libertad y donde 1- es el coeficiente de confianza.Prueba de la cola inferiorPrueba de la cola superiorPrueba de dos colasHiptesisHo: 2 2oHo: 2 2o

Ho: 2 =2oHo: 2 2o

Estadstico de pruebaX2=(n-1)s2/2oX2=(n-1)s2/2o

X2=(n-1)s2/2o

Regla de rechazo: mtodo del valor-pRechazar Ho si valor-pRechazar Ho si valor-p

Rechazar Ho si valor-p

Regla de rechazo: mtodo del valor crticoRechazar Ho si

X2X2 (1-)Rechazar Ho si

X2X2

Rechazar Ho si

X2X2 (1-/2)

o si

X2X2 /2

Pruebas de hiptesis para la varianza poblacionalAplicacin:

En la industrial farmacutica la varianza en los pesos de los medicamentos es trascendental. Considere un medicamento cuyo peso est dado en gramos y una muestra de 18 unidades de este medicamento, la varianza muestral es s2 =0.36

a.- D un intervalo de 90% de confianza para estimar la varianza poblacional de los pesos de este medicamento.

Aplicacin 2Una pieza para automviles debe fabricarse con medidas de tolerancia muy estrechas para que sea aceptada por el cliente. Las especificaciones de produccin indican que la varianza mxima en la longitud de la pieza debe ser 0.0004. Suponga que en 30 piezas la varianza muestral encontrada es s2=0.0005. Use =0.05 para probar si se est violando la especificacin para la varianza poblacional. X2=(n-1)s2/2on= tamao de muestras2=varianza muestral=2o= varianza de poblacingl=n-1=X2calculada=x2critica=

Prueba X2Prueba de Kolmogorov SminovPrueba de Anderson Daring

Unidad 5 (Pruebas de Bondad de Ajuste)Distincin entre las pruebas paramtricas y las no paramtricasCuando se analizan datos medidos por una variable cuantitativa continua, las pruebas estadsticas de estimacin y contraste frecuentemente empleadas se basan en suponer que se ha obtenido una muestra aleatoria de una distribucin de probabilidad de tipo normal o de Gauss.

Pero en muchas ocasiones esta suposicin no resulta vlida, y en otras la sospecha de que no sea adecuada no resulta fcil de comprobar, por tratarse de muestras pequeas. En estos casos disponemos de dos posibles mecanismos: los datos se pueden transformar de tal manera que sigan una distribucin normal, o bien se puede acudir a pruebas estadsticas que no se basan en ninguna suposicin en cuanto a la distribucin de probabilidad a partir de la que fueron obtenidos los datos, y por ello se denominan pruebas no paramtricas (distribution free), mientras que las pruebas que suponen una distribucin de probabilidad determinada para los datos se denominan pruebas paramtricas Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre (distribution free). En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin. Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la normal.Las pruebas z y t son ejemplos de pruebas paramtricas. Por ejemplo en la prueba z es necesario especificar la media y la desviacin estndar de la poblacin de la hiptesis nula y, adems los datos de la poblacin deben tener una distribucin normal (la media y la desviacin estndar son parmetros).Aunque todas las pruebas de inferencia dependen en cierta medida de las caractersticas de la poblacin, los requisitos de las pruebas no paramtricas son mnimas.

Como las pruebas de inferencia no paramtricas tienen menos requisitos o supuestos relacionados con las caractersticas de poblacin, surge la duda de si no deberamos utilizarlas todo el tiempo, olvidndonos de las pruebas paramtricas.Muchas de la pruebas paramtricas son robustas con respecto a la violacin de los supuestos subyacentes.

JI-CUADRADA EXPERIMENTOS CON UNA VARIABLE

Hasta este momento, hemos presentado pruebas de inferencia que han sido utilizadas principalmente con datos ordinales, de intervalo o razn.La prueba de inferencia que se emplea ms a menudo con los datos nominales es una prueba no paramtrica que se conoce como ji-cuadrada

Aplicacin 1

Preferencia por las diversas marcas de cerveza ligeraSupongamos que usted quiere determinar si los consumidores de cerveza que viven en Guadalajara difieren con respecto a sus preferencias por las diferentes marcas de cerveza ligera. Para eso decide realizar un experimento en el cual elige al azar a 150 consumidores de cerveza y los invita a probar las tres marcas principales de esa bebida. Suponga que se han observado todas las precauciones de un buen diseo experimental, como no mostrar los nombres de las marcas a los sujetos del experimento y otros cuidados similares. Los datos resultantes se presentan en la tabla.

Marca AMarca BMarca CTotal454065150Los datos de cada celda son el nmero o la frecuencia de los sujetos que corresponde a esa celda. As, 45 sujetos prefirieron la marca A, 40 prefirieron la marca B y 65 prefirieron la marca C. Podemos concluir, a partir de estos datos, que existe alguna diferencia en las preferencias de la poblacin?

Hiptesis nula: No existe diferencia alguna en la preferencia de la poblacin por las diversas marcas de cerveza ligera.

Ecuacin para determinar la Ji cuadradafo= frecuencia observada en la celdafe= frecuencia esperada en la celda

Marca AMarca BMarca CTotal454065150frecuencia observada505050150frecuencia esperada

t critica: 5.991Buscar en la tabla con k-1 grados de libertad, donde k es el numero de grupos o categoras, para este caso k=3 y un nivel de significacin de 0.05t criticat obs= 7Zona aceptacinzona de rechazoconclusin: se rechaza nuestra hiptesis nulaAplicacin 2:Un investigador cree que la composicin tnica de la ciudad donde l vive ha cambiado durante los ltimos aos. Las cifras ms recientes (recopiladas hace unos cuantos aos) muestran que los habitantes de dicha ciudad presentaban la siguiente composicin tnica: 53% noruegos, 32% suecos, 8% irlandeses, 5% hispanos y 2% italianos. Para poner a prueba su idea, el cientfico social obtiene una muestra aleatoria de 750 habitantes. Los resultados que obtuvo se presentan en la siguiente tabla: NoruegosSuecosIrlandesesHispanosItalianosTotal399193638213750a.-Cul es la hiptesis nula?b.-Cul es la conclusin de usted? Utilice =0.05

Hiptesis nula: La composicin tnica de la ciudad no ha cambiado, Por lo tanto, la muestra de 750 individuos es una muestra aleatoria extrada de una poblacin compuesta por 53% de noruegos, 32% suecos, 8% de irlandeses, 5% de hispanos y 2% de italianos.Completa la siguiente tabla:foProporcin esperadafe(fo fe)2 / fe399399/750=0.530.53(750)=397.50.006193193/750=9.204630.1508252.80713Total 750Total:X2obt =62.43Los grados de libertad son 5-1=4con un =0.05, buscas en la tabla y te debe dar un valor de 9.488como X2obt =62.43 > 9.488 se rechaza

Pruebas de bondad del ajuste.

Antes de poder utilizar un generador de proceso en un estudio de simulacin, debe mostrarse primero que es posible representar los datos empricos a travs de una distribucin probabilstica terica conocida.Por ejemplo en los modelos de lneas de espera debe demostrarse que la tasa de llegadas tiene una distribucin Poisson y el tiempo de servicio una distribucin exponencial.

Es posible emplear diversas pruebas estadsticas para probar la bondad del ajuste de una distribucin terica a conjunto determinado de datos. Una de las que mas se usan con mayor frecuencia es la prueba Ji cuadrada X2La prueba de X2 pretende determinar si existe diferencia significativa entre las frecuencias esperadas (las que se basan en la distribucin terica) y las frecuencias reales (las de los datos). Los pasos que se utilizan en el proceso de prueba son los siguientes:

Plantear la hiptesis de prueba, Ho, que seala que los datos observados se extrajeron de una poblacin que puede describirse a travs de una distribucin terica conocida.Plantear la hiptesis alternativa, H1, que seala que los datos observados no se extrajeron de la poblacin planteada en el paso 1.Identificar el nivel de significacin, , con el que se llevar a cabo la prueba. (Recordar que 1- es el nivel de confianza de una prueba estadstica.)Utilizando la siguiente relacin matemtica.

en donde X2cal = valor calculado de X2 fo = frecuencias observadas fe = frecuencias tericas o esperadas.

Si X2cal > X2 tablas , entonces se rechaza Ho (se acepta H1)

Nota: La distribucin continua chi cuadrada puede aproximarse razonablemente a la distribucin discreta

siempre y cuando todos los valores de fe sean de al menos 5. (Hay formas para evitar el problema de una frecuencia que se espera menor que 5, como combinar categoras de manera que todas las frecuencias que se esperan sean al menos 5)Ejemplo:

Suponga que los datos que aparecen en las dos primeras columnas, corresponden al nmero de clientes que entran a un banco cada hora. Estos datos se recolectaron al azar para 204 periodos de una hora. Con base en estos datos, plantearamos la hiptesis (Ho) de que los datos pueden representarse por medio de una distribucin de Poisson.Nmero de llegadas por hora (x)Frecuencia observada (fo)07018423431244Nmero de llegadas por hora (x)Frecuencia observada (fo)Probabilidad esperada de acuerdo a PoissonFrecuencia esperada (fe)(fo-fe)2 / fe070p(x=0)=(1)(e-1)/0!=0.367880.36788 x 204= 75.05(70-75.05)2/75.05 =0.3398184p(x=1)=(1)(e-1)/1!=0.36788

0.36788 x 204= 75.05234p(x=2)=(1)(e-1)/2!=_______

312p(x=3)=________________

=0.0088 (agrupando 3 y 4, porque la frecuencia esperada de 4 debe ser al menos 5)44p(x4)=________________ojo, probabilidad mayor o igual a 4= 1- (suma de las otras probabilidades)Total= 204X2cal = 1.7461

en donde T= nmero promedio de llegadas por periodo T x = nmero de llegadas en el intervalo de tiempo

Regin de rechazoRegin aceptacinChi-critica, que se busca con las tablas = 7.815Grados de libertad= Numero de categoras 1= 4-1=3 = 0.05 95% de confianzaSi X2cal > X2 tablas , entonces se rechaza Ho (se acepta H1)

Llega Don PoissonLo atiende Doa Exponencial

Many of the distributions discussed in this chapter are related to one another in various ways. For example, the geometric distribution is related to the binomial distribution.

The geometric distribution represents the number of trials until the nextsuccess while the binomial represents the number of successes in a fixed number of trials.

Similarly, the Poisson distribution is related to the exponential distribution.

The exponential distribution represents the amount of time until the next occurrence of an event while the Poisson distribution represents the number of times an event occurs within a given period of time.Notas, tcnicas (respecto a la dualidad en las distribuciones de probabilidad http://www.elmundo.es/traductor/In some situations, as when the number of trials for the binomial distribution becomes very large, the normal and binomial distributions become very similar. For these two distributions, as the number of binomial trials approaches infinity, the probabilities become identical for any given interval. For this reason, you can use the normal distribution to approximate the binomial distribution when the number of trials becomes too large for Crystal Ball to handle (more than 1000 trials).

You also can use the Poisson distribution to approximate the binomial distribution when the number of trials is large, but there is little advantage to this since Crystal Ball takes a comparable amount of time to compute both distributions.

Likewise, the normal and Students t distributions are related. With Degrees of Freedom > 30, Students t closely approximates the normal distribution.Prueba de independencia entre dos variables:Una de las principales aplicaciones de la Ji-cuadrada consiste en determinar si dos variables categricas son independientes o estn relacionadas entre s. Para ilustrar este punto veamos el siguiente ejemplo:Afiliacin poltica y actitudSupongamos que en la legislatura local est en estudio un proyecto de ley cuyo propsito es reducir la edad legal a fin de permitir el consumo de bebidas alcohlicas a las personas de 18 aos. Un diputado (que trabaja) que vive en esa ciudad quiere determinar si existe alguna relacin entre la afiliacin poltica y la actitud frente al proyecto de ley. Para averiguarlo, este diputado enva cartas a dos muestras aleatorias, una de ellas formada por 200 miembros del PRD y la otra por 200 miembros del PAN. En la carta el diputado explica su inters por el proyecto de ley y pregunta a los destinatarios si estn a favor, indecisos o en contra de esa iniciativa de ley. Les asegura la plena confidencialidad de sus respuestas. En la carta incluye un sobre con el porte pagado para facilitar la respuesta.El diputado investigador, recibe respuesta de los 400, los resultados obtenidos se muestran en la tabla:ActitudA favorIndecisosEn contraTotal por reglnAfiliacin poltica PRD6822110200PAN921890200Total por columna16040200400Este tipo de arreglo se conoce como tabla de contingencia.Una tabla de contingencia se compone de dos vas o entradas y muestra la relacin contingente entre dos variables, cuando stas han sido clasificadas en categoras mutuamente excluyentes y cuando los datos de cada celda son frecuencias.Hiptesis nula: En la poblacin, la actitud hacia el proyecto y la afiliacin poltica son independientes.Si lo anterior es cierto, entonces los del PRD y PAN en la poblacin debern tener la misma proporcin de personas a favor, indecisas y en contra del proyecto.

ActitudA favorIndecisosEn contraTotal por reglnAfiliacin poltica PRD6822110200PAN921890200Total por columna16040200400

foProporcin esperada de la poblacin que esta a..fe(fo fe)2 / fePRD68 a favor (68+92)/400=160/400proporcin de personas en total que estn a favor(160/400)200=80(68-80)2/80= 1.8022 indecisos (22+18)/400= 40/400110 en contraPAN92 a favor(68+92)/400=160/400

indecisos90 en contraTotal 400Total:X2obt =6.00Hiptesis nula: En la poblacin, la actitud hacia el proyecto y la afiliacin poltica son independientes.grados de libertad=(r-1)(c-1)=(2-1)(3-1)=2 con un =0.05, buscando en la tabla de la ji cuadrada encuentras:

X2critica = 5.991, como la observada es mayor que la critica se rechaza la hiptesis nula.Aplicacin 3: En universidad estudia la posibilidad de implantar uno de los tres sistemas de calificaciones. Se realiza una encuesta para determinar si existe alguna relacin entre el rea de licenciatura que estudia cada alumno y la preferencia que manifiesta por algn sistema de calificacin en particular. Entonces se elige una muestra aleatoria constituida por 200 estudiantes del rea de ingenieras, 200 de artes y ciencias y 100 de bellas artes. Se pregunta a cada alumno cul de los tres sistemas prefiere. Los resultados se presentan en la siguiente tabla de contingencia.a.-Cul es la hiptesis nula?b.-Cul es tu conclusin?Sistema de calificacinSistema 1Sistema 2Sistema 3Total por renglnBellas artes265519100Artes y ciencias2411858200Ingeniera2011268200Total por columna70285145500Hiptesis nula: El rea de estudio de los estudiantes y su preferencia por algn sistema de calificacin son independientes entre s. La frecuencia obtenida en cada celda se debe al muestreo aleatorio realizado en una poblacin donde las proporciones de estudiantes de bellas artes, artes y ciencias, e ingeniera, que prefieren cada sistema de calificacin son iguales.Celda nmerofofe(fo fe)2 /fe126(70/500)x100=1410.286255(285/500)x100319456789=18.56Grados de libertad (r-1)(c-1)Aplicacin 4Un investigador esta interesado en determinar si existe alguna relacin entre el nivel de educacin de los padres y el nmero de hijos que tienen. Para averiguarlo, realiza una encuesta y as obtiene los siguientes resultados. Nmero de hijosDos o menosMs de dosSuma por renglnEducacin universitaria532275Solamente bachillerato373875Suma por columna9060150a.-Cul es la hiptesis nula?b.-Cul es la conclusin? Utilice =0.05

Supuestos subyacentes a Ji cuadradaUn supuesto bsico para utilizar Ji cuadrada consiste en que cada una de las observaciones registradas en la tabla de contingencia es independiente de las dems. Esto significa que cada sujeto puede tener slo un dato en la tabla. No se permite realizar varias mediciones con el mismo sujeto e introducirlas como frecuencia separadas en la misma celda o en otra distinta. Este error producira una N mayor que el nmero de observaciones independientes realizadas.Un segundo supuesto establece que el tamao de muestra deber ser lo suficientemente grande para que la frecuencia esperada en cada celda sea de 5, por lo menos, para las tablas en las que r o c es mayor que 2.

Si la tabla es de 1x2 o de 2x2, entonces cada frecuencia esperada tendr que ser de 10 cuando menos.LA PRUEBA DE RANGOS CON SIGNO Y PARES IGUALADOS DE WILCOXONLa prueba de rangos con signo de Wilcoxon se utiliza en combinacin con el diseo de grupos correlacionados, el cual debe contener datos que tengan por lo menos una escala ordinal. Se trata de una prueba relativamente potente que a veces se emplea en lugar de la prueba t para grupos correlacionados, cuando hay una violacin extrema del supuesto de normalidad o cuando los datos no tienen la escala adecuada.

Aplicacin 1 (Ecologa)Promocin de actitudes ms favorables hacia la conservacin de la vida silvestre:Un destacado grupo ecolgico planea realizar una campaa activa para fomentar la conservacin de la flora y la fauna silvestres en su pas. Como parte de la campaa, piensan exhibir una pelcula producida con el fin de promover actitudes ms favorables hacia la conservacin de la vida silvestre. Antes de exhibirla a todo el pblico, los promotores de la campaa desean evaluar los efectos de la pelcula. Para eso se elige al azar a un grupo de 10 sujetos y se les proporciona un cuestionario que mide la actitud individual hacia la conservacin de la vida silvestre. A continuacin, se les proyecta la pelcula y despus de la exhibicin contestan de nuevo el cuestionario de actitudes. Este tiene 50 puntos posibles y cuanto mas alta sea la puntuacin, tanto mas favorable ser la actitud hacia la conservacin de la vida silvestre. Los resultados se presentan en la tabla.a.-Cul es la hiptesis nula?b.-Cul es la conclusin? Utilice =0.05 (2 colas)

Hiptesis nula:

La hiptesis nula se enuncia sin especificar los parmetros de poblacin. Para este ejemplo establece que la pelcula no influye en las actitudes hacia la conservacin de la vida silvestre.

Voy ha comparar el despus con el antesRealizare la diferencia Despus - AntesActitudAPrimer pasoBSegundo pasoCTercer pasoDCuarto pasoEQuinto pasoFSexto pasoSujetoAntesDespusDiferencia(Despus Antes)Valor absoluto de la diferenciaOrdenar los valores absolutos de los valores de la diferencia de menor a mayor.(De la columna B al mas chico le asignas el 1 y as te vas al que sigue el 2 y as sucesivamente)Rango con signo de la diferenciaAsignar a los rangos resultantes el signo del puntaje de diferencia cuyo valor absoluto produjo ese rango.(En esta columna son los nmeros de la columna C, pero con los signos de la columna A)Suma de los rangos positivos(En esta columna colocas los nmeros de la columna D que sean positivos)Suma de los rangos negativos14044444442334077666336491313101010434362222254039-111-1-1631409988873027-333-3-3836426655592435111199910202888777=55=51

=4

Las tres primeras columnas son los datos del problema, las siguientes columnas son los pasos para llegar a la solucin. Para llegar a la conclusin determinamos Tobt calculando la suma de los rangos positivos y la suma de los rangos negativos, Tobt es la menor de esas sumas, para nuestro caso Tobt=4.Para N=10 y con =0.05 (2 colas) buscando en la tabla de Wilcoxon, vemos que Tcrit =8Si Tobt Tcrit deber rechazarse la hiptesis nula Ho

Aplicacin 2Un investigador quiere determinar si la dificultad del material que han de aprender afecta el nivel de ansiedad de los estudiantes universitarios. A cada uno de los miembros de una muestra aleatoria de 12 alumnos se le asignan ciertas tareas de aprendizaje que se clasifican como fciles o difciles. Antes de que los estudiantes inicien cada tarea, se les presentan algunos ejemplos como muestra del material que van ha aprender. A continuacin se mide el nivel de ansiedad que mostraron los alumnos, mediante un cuestionario adecuado. De esta manera, se mide el nivel de ansiedad antes de cada tarea de aprendizaje. Los datos se muestran en la tabla siguiente. Mientras mas alta sea la calificacin, mayor ser el nivel de ansiedad. Cul es la conclusin, utilizando la prueba de rangos de Wilcoxon y =0.05 (2 colas)

Hiptesis nula:---- La dificultad del material no influye en el nivel de ansiedad

Voy ha comparar la ansiedad cuando el material es difcil con la ansiedad cuando el material es fcil

Difcil - FcilAnsiedadABCDEFEstudiante nmeroTareas difcilesTareas fcilesDiferencia(Difciles fciles)Valor absoluto de la diferenciaOrdenar los valores absolutos de los valores de la diferencia de menor a mayor.(De la columna B al mas chico le asignas el 1 y as te vas al que sigue el 2 y as sucesivamente)Rango con signo de la diferenciaAsignar a los rangos resultantes el signo del puntaje de diferencia cuyo valor absoluto produjo ese rango.(En esta columna son los nmeros de la columna C, pero con los signos de la columna A)Suma de los rangos positivos(En esta columna colocas los nmeros de la columna D que sean positivos)Suma de los rangos negativos148408872332766534634121211442281414125403010109.56272433Segundo y tercero estn empatados entonces se saca la media (2+3)/2=2.5 y se asigna este valor a los empates73133-22184239332.593831776103439-5541138299981244341010Noveno y decimo estn empatados (9+10)/2=9.5Aplicaciones de repaso1:

Una investigadora cree que la estatura de las mujeres ha aumentado en aos recientes. Ella sabe que hace 10 aos, en la ciudad donde vive, el promedio de estatura de una mujer adulta joven era de 63 pulgadas. No se conoce la desviacin estndar. La investigadora toma una muestra aleatoria de 8 mujeres jvenes adultas que residen en dicha ciudad y mide sus estaturas. As obtiene los siguientes datos:

Estatura en pulgadas6466686062656663Encuentra lo siguiente:Media de los datos de muestraDesviacin estndar de los datos de muestra.Plantear la hiptesis nula:Aplicar la formula para la t studentDecidir si se acepta o se rechaza la hiptesis nula

Aplicaciones de repaso2 (Ji cuadrada):Se llevo a cabo un estudio para determinar si los habitantes de las grandes ciudades y de poblados pequeos difieren en su disposicin para ayudar a los desconocidos. En este estudio, llamaban a la puerta de personas que vivan en Nueva York o en los pequeos poblados cercanos. Los investigadores les explicaban que no encontraban la direccin de un amigo que viva cerca de ah y les pedan permiso para utilizar el telfono. Los siguientes datos muestran la cantidad de individuos que admitieron a los desconocidos (los investigadores) en sus casas y los que no los admitieron:

Admitieron al desconocido en su casaNo admitieron al desconocido en su casaHabitante de una gran ciudad6090150Habitante de un pequeo poblado7030100130120250Contesta lo siguiente:Difieren los habitantes de la gran ciudad y los habitantes de poblados pequeos en su disposicin para ayudar a los desconocidos? Utilice un =0.05 para tomar su decisin.

Grfico10.20.20.60.60.20.2

Hoja1azul0.2blanco0.6amarillo0.2

Hoja1

Hoja2

Hoja3

Grfico3110242581286200101

1920232425262728293031323336414547EdadesFrecuenciaDistribucin de edades

Hoja1azul0.2blanco0.6amarillo0.2

Hoja1

Hoja21912012302422542622752882912308316322330360411450471

Hoja2

1920232425262728293031323336414547EdadesFrecuenciaDistribucin de edades

Hoja3

Grfico4110242581286200101

1920232425262728293031323336414547Edades

Hoja1azul0.2blanco0.6amarillo0.2

Hoja1

Hoja21912012302422542622752882912308316322330360411450471

Hoja2

1920232425262728293031323336414547Edades

Hoja3