47
FACULTAD DE CIENCIAS E INGENIERÍA TEXTO INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA Autores: Escurra Estrada Cristián Iván Farroñan Santisteban José Natividad Rojas Paz, Jorge Luís. COLABORADORES: Héctor Alexis Herrera Vega Huacho – Perú 2010

INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

Embed Size (px)

DESCRIPTION

Universidad Nacional José Faustino Sánchez CarriónAutores: Escurra Estrada Cristián Iván; Farroñan Santisteban José Natividad; Rojas Paz, Jorge Luís.

Citation preview

Page 1: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

FFAACCUULLTTAADD DDEE CCIIEENNCCIIAASS EE IINNGGEENNIIEERRÍÍAA

TTEEXXTTOO

IINNFFEERREENNCCIIAA EESSTTAADDÍÍSSTTIICCAA AAPPLLIICCAADDAA AA LLAA EECCOONNOOMMÍÍAA

AAuuttoorreess::

EEssccuurrrraa EEssttrraaddaa CCrriissttiiáánn IIvváánn

FFaarrrrooññaann SSaannttiisstteebbaann JJoosséé NNaattiivviiddaadd

RRoojjaass PPaazz,, JJoorrggee LLuuííss..

CCOOLLAABBOORRAADDOORREESS::

HHééccttoorr AAlleexxiiss HHeerrrreerraa VVeeggaa

HHuuaacchhoo –– PPeerrúú 22001100

Page 2: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

2

Agradecimiento

Los autores de este Texto desean expresar su agradecimiento a todas

nuestras familias que nos han comprendido las horas dedicadas a la

elaboración de este texto que sin duda corresponde a un sacrificio

que los investigadores hacemos con el único objetivo de que se

valore lo escrito y se use con fines académicos. Agracemos también

de manera especial a los autores identificados en la parte de

bibliografía que nos ha servido de guía en la utilización de algunas

tablas estadísticas y definiciones.

Page 3: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

3

Contenido Pág.

INTRODUCCIÓN 4

CAPITULO I: DISTRIBUCIÓN DE PARÁMETROS 5

CAPITULO II: ESTIMACIÓN DE PARÁMETROS 16

CAPITULO III: PRUEBA DE HIPÓTESIS 29

BIBLIOGRAFÍA 46

Page 4: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

4

Introducción

En diversas investigaciones estadísticas el principal objetivo puede ser el estudio de determinada

característica de una población; muchas veces, por ejemplo, se desea estimar el coeficiente de

inteligencia promedio de los estudiantes, otras veces se requiere la prueba de una determinada

hipótesis respecto de un parámetro en estudio acerca del modelo que ha generado los datos. La

estadística inferencial proporciona los medios para, a través de la información contenida en

muestras aleatorias y con ayuda de la teoría de la probabilidad, resolver problemas de índole

económico como para mejorar las inversiones o pronosticar la rentabilidad de una empresa en un

tiempo determinado bajo un nivel de confianza.

En lo que sigue nos vamos a limitar a la inferencia estadística paramétrica, donde la variable

aleatoria objeto de estudio sigue una distribución generalmente normal, y sólo tendremos que

tratar de estimar los parámetros que la determinan, la media y la desviación típica.

Esta situación se presenta con frecuencia debido a que es posible a menudo conocer la forma

funcional de la distribución de probabilidad, por consideraciones teóricas, quedando únicamente

indeterminados los parámetros que determinan la función de distribución.

Los ejemplo y casos dados se corresponden a empresas o poblaciones grandes en las que se

pretende estudiar una determinada variable aleatoria, esta situación hace que resulte muy caro o

imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra.

En todos estos problemas que estudia la inferencia estadística juega un papel fundamental la

"Teoría de la Probabilidad" basándose en muestras y siguiendo sus patrones de distribución de la

variable(s) a estudiar.

Los Autores

Page 5: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

5

INFERENCIA ESTADISTICA

CAPITULO I: DISTRIBUCIÓN DE PARÁMETROS

POBLACIÓN

Se denomina población a la totalidad de personas u objetos que tienen al menos una

característica en común y las demás características varían y son medibles cualitativa o

cuantitativamente y reciben el nombre de variable estadística cuyo valor o dato es una

observación.

Si el análisis es univariante (una sola variable), a cada elemento de la población se le ha

anotado una observación (un valor), en ese sentido; al conjunto de valores posibles de la

variable se le denomina población. Y mucho más si los elementos de la población se definen en

forma aleatoria, entonces la variable estadística es una variable aleatoria cuyos valores

constituyen la población.

En este caso la distribución de la población es la distribución de la variable aleatoria que tiene

parámetros como la Media µ y la Varianza para la variable cuantitativa; la proporción p y la

varianza pq para la variable cualitativa.

Si la variable aleatoria tiene distribución de probabilidad f(x) entonces nos podemos referir

que la población es f(x).

Ejemplo.

, entonces se dice que la población está normalmente distribuida con

media µ y la Varianza

Tamaño poblacional( N).

El número de observaciones de la población puede ser finita(N) o infinita(∞). Algunas

poblaciones finitas de tamaños grandes en teoría son asumidas como poblaciones infinitas.

parámetro.

Son las medidas descriptivas que caracterizan a la distribución de la variable de la población, y

son:

La Media µ, la Varianza y el Total X=N µ. Para la una variable cuantitativa.

La proporción p y la varianza pq para la variable cualitativa.

Si la distribución de probabilidad es conocida, entonces se conocen sus parámetros y su forma

y no hay nada por investigar.

Si la distribución de probabilidad es desconocida, entonces si hay que investigar pudiendo

estar interesados en:

Page 6: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

6

1) Estimar sus parámetros, si es que se conoce su forma.

2) Probar determinada suposición, acerca de un valor determinado del parámetro.

3) Probar la suposición acerca del tipo de distribución de probabilidades de la población, es

decir; los datos siguen una distribución Normal, o los datos siguen una distribución T-

student, Binomial, exponencial, etc.

Tipos de población.

Población Finita: Denominada así, porque se conoce su tamaño poblacional N.

Población Infinita: Denominada así, porque no se conoce su tamaño poblacional N=∞

VARIABLE ALEATORIA.

Es una función “X” que describe numéricamente en “x” el resultado físico del experimento y

está acompañada de una función de probabilidad f(x)

Ejemplo:

En un experimento suponga que se observa el número se vehículos que pasan por una garita

de control cada 5 minutos y se anota numéricamente con “x” este resultado físico. El resultado

físico (ningún, el o los automóviles) es el dominio y el rango es el número “x” de vehículos

anotado.

Ejemplo:

Suponga que se tiene una población de 8 familias, de los cuales dos son de nivel Bajo, cuatro

son del nivel Medio y dos son del nivel Alto, si se selecciona al azar una por una a las familias

de toda la población y se anota numéricamente el nivel de status social; se pide:

1. Describir los resultados en una variable aleatoria.

2. Transformar la variable aleatoria acompañando su función de probabilidad en su: i)

Forma tabular.

ii) Gráfica.

iii) Representarlo en un modelo matemático probabilístico.

Page 7: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

7

Sol.1.

Asignemos a: x =1 (nivel Bajo), x=2 (nivel medio) x= 3 (nivel Alto)

Base de datos:

Código de la familia FB FM FB FM FA FM FM FA

Variable aleatoria: X Status social

1 2 1 2 3 2 2 3

Sol. 2.i)

Tabla Nº 01.

Función de probabilidad f(x) de la población de Familias según su Status social en el

BLOCK 1 de la Residencial Costa del Norte, distrito de Huacho. 2010.

X f(x)

1 0.25

2 0.50

3 0.25

Total 1.00

Fuente: Elaborado por el autor.

Se observa que la variable aleatoria X tiene forma de distribución simétrica.

Sol. 2.ii)

Gráfica Nº 01.

Función de distribución de probabilidad de la población de Familias según su Status

social en el BLOCK 1 de la Residencial Costa del Norte, distrito de Huacho. 2010.

Page 8: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

8

Sol. 2. iii)

SELECCIÓN DE UNA MUESTRA EN UNA POBLACIÓN FINITA O INFINITA PERO QUE EL

MUESTREO ES CON REMPLAZO.

De la población anterior se extrae una muestra de tamaño n=2, es decir dos familias al azar. Es

razonable que cada familia puede tomar culquiera de los tres valores de la variable X con

probabilidades iguales a la población. Entonces cada valor de la muestra respectiva genera una

variable aleatoria respectiva igual a la población.

x1 x2 Valores de la muestra

X1

f(x1)

X2

f(x2)

Variables X1 y X2 igual a la

población: X

f(x)

1 0.25 1 0.25 1 0.25

2 0.50 2 0.50 2 0.50

3 0.25 3 0.25 3 0.25

1.00 1.00 1.00

Luego;

x1, x2, ….., xn generaran “n” variables aleatorias X1, X2, … Xn que constituyen una muestra

aleatoria simple de tamaño “n” de la población f(x) de la variable X, siempre que estas

variables estén distribuidas idénticamente a la población y sean independientes.

DEFINICION DE MUESTRA ALEATORIA SIMPLE:

Dado una población f(x) con media y varianza que puede ser µ y si la variable es

cuantitativa o puede ser la proporción p y la varianza pq si la variable cualitativa; se denomina

muestra aleatoria de tamaño “n” de esa población a un conjunto de variables aleatorias X1,

X2, X3, … Xn, tales que:

1) Son independientes, que implica que la distribución de probabilidad conjunta de X1, X2, X3,

… Xn esté definida como:

f(x1, x2, x3, …, xn) = f(x1)f(x2)f(x3)…f(xn)

Page 9: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

9

2) Cada una de las variables Xi esté distribuida de forma idéntica a la variable X, es decir;

Primero:

E(Xi)= µ , V(Xi)= para la variable X cuantitativa.

E(Xi)= p , V(Xi)= para la variable X cualitativa.

Es decir; tiene la misma media y varianza de X

Segundo:

La distribución de probabilidad de cada Xi es la misma distribución de probabilidad de X,

esto es:

f(xi)=f(x)

Ejemplo:

Sea X1, X2, X3, … Xn, una muestra aleatoria de tamaño “n” de una población Normal

, se pide:

a) Escribir la función de densidad de probabilidad conjunta de la muestra.

b) Si n=6, µ=20, ; calcular la probabilidad de que:

X1+X3+X4-X6 sea mayor que 52.

Sol.

Previamente se conoce que la función de densidad de X es Gaussiana (Normal), entonces:

Luego:

a) La función de densidad de probabilidad conjunta de la muestra es:

f(x1, x2, x3, …, xn) = f(x1)f(x2)f(x3)…f(xn)

b) Y= X1+X3+X4-X6

E[y]=E[X1]+E[X3]+E[X4]-E[X6]

= 20 + 20 + 20 - 20

µy = 40.

Page 10: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

10

V[y]=V[X1]+V[X3]+V[X4]+V[-X6]

= 25 + 25 + 25 + 25

.

Por la propiedad reproductiva de la Normal, la variable aleatoria Y tiene distribución

normal N(40,100), luego la variable Normal Estándar Z es:

DISTRIBUCIÓN DE LA VARIBLE MEDIA MUESTRAL CUANDO SE CONOCE LA VARIANZA

POBLACIONAL:

Al estudiar las propiedades que se deducían de la distribución normal, la primera que

considerábamos era la referente a la distribución de una combinación lineal de variables

aleatorias normales. Así pues, sabemos que si X1, ..., Xn, son variables aleatorias

independientes distribuidas según una normal , para toda i = 1, .., n y si a1,, ..., an,

son números reales, entonces la variable aleatoria

Y = a1X1 + ….+ anXn Sigue una distribución )

Entonces la distribución de se define como:

Teorema: Sea X1, X2, X3, … Xn, una muestra aleatoria simple de tamaño “n” de una población Normal

, entonces la distribución del estadístico media muestral tendrá una

distribución normal.

Page 11: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

11

Ejemplo:

Sea X1, X2, X3, … Xn, una muestra aleatoria de tamaño “n” de una población Normal

, se pide:

a) Escribir la función de densidad de probabilidad conjunta de la muestra.

b) Si n=6, µ=20, ; calcular la probabilidad de que:

X1+X3+X4-X6 sea mayor que 52.

Solución a)

Previamente se conoce que la función de densidad de X es Gaussiana (Normal),

entonces:

Luego:

La función de densidad de probabilidad conjunta de la muestra es:

f(x1, x2, x3, …, xn) = f(x1)f(x2)f(x3)…f(xn)

Solución b)

Por la propiedad reproductiva de la Normal; la suma de variables aleatorias forman una nueva

variable aleatoria normal

Page 12: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

12

Y= X1+X3+X4-X6

E[y] = E[X1]+E[X3]+E[X4]-E[X6]

= 20 + 20 + 20 - 20

µy = 40.

V[y] = V[X1]+V[X3]+V[X4]+V[-X6]

= 25 + 25 + 25 + 25

.

Por la propiedad reproductiva de la Normal, la variable aleatoria Y tiene distribución normal

N(40,100), luego la variable Normal Estándar Z es:

DISTRIBUCIÓN DE LA VARIABLE ALEATORIA MEDIA MUESTRAL:

(El Muestreo es con remplazo).

Teorema: Sea X1, X2, X3, … Xn, una muestra aleatoria de tamaño “n” escogida de una población

f(x) Normal , entonces:

a) . también .

b) , También ,

c)

d) , La variable aleatoria Z tiene media 0 y Varianza 1.

Observación:

O1) Si n≥30 entonces, sin importar si la población es normal, tiene distribución

aproximadamente normal.

Page 13: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

13

o2) Si la población f(x) se conoce que es normal y se selecciona una muestra de tamaño n≥2,

entonces tiene distribución exactamente normal.

O3) Si la muestra es sin remplazo en una población finita de tamaño N, entonces la varianza de la

distribución de es:

Ejemplo:

Cuatro secretarias que componen una población de servicios secretarial del Vice Rectorado

Administrativo, se le pidió que dijera su tiempo de servicio, obteniéndose los siguientes datos:

Secretaria X: Tiempo serv

A 3

B 2

C 1

B 4

Se pide: determinar los parámetros de la variable X: µ, σ.

Además:

a) * En una tabla describir X con f(x).

** Graficar f(x).

*** Expresar la Variable Aleatoria X en un Modelo Matemático.

b) Si se seleccionan dos mecanógrafas con remplazo de esta población demostrar que:

i) , también .

ii)

iii)

c) Si el muestreo es sin remplazo demostrar que:

i) .

ii)

Page 14: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

14

Solución:

µ=2.5 años de servicio.

Se espera que cada secretaria tenga dos años y medio de servicio en la Vice Rectoría.

.

a)

X: Tiempo serv f(x)

3 0.25

2 0.25

1 0.25

4 0.25

Total 0.25

Modelo matemático probabilístico:

f(x)= , si x=

b) El número de muestras posibles M, seleccionadas de una población de tamaño N, con

tamaño n es: . Donde se refleja que se forma una población de muestras, de tamaño

M.

Muestra

Secretaria

Resultado de la

muestra

Media de la

muestra

1 A,A 3;3 3,0

2 A,B 3;2 2,5

3 A,C 3;1 2,0

4 A,D 3;4 3,5

5 B,A 2;3 2,5

6 B,B 2;2 2,0

7 B,C 2;1 1,5

8 B,D 2;4 3,0

9 C,A 1;3 2,0

10 C,B 1;2 1,5

11 C,C 1;1 1,0

12 C,D 1;4 2,5

13 D,A 4;3 3,5

14 D,B 4:2 3,0

15 D,C 4;1 2,5

16 D,D 4;4 4,0

Total

0

0,25

1 2 3 4

Prob

abili

dad

f(x)

Años de servicio

Page 15: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

15

.

n f(x)

1,0 1 0,0625

1,5 2 0,1250

2,0 3 0,1875

2,5 4 0,2500

3,0 3 0,1875

3,5 2 0,1250

4,0 1 0,0625

16 1

Page 16: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

16

CAPITULO II: ESTIMACIÓN DE PARÁMETROS

Estimación puntual. Estimación por intervalos. Para promedios y proporciones con una y dos

poblaciones. Ejemplos.

ESTIMACIÓN DE PARÁMETROS

La inferencia estadística nos da una idea de lo que pasa en la población objeto de estudio, pero

basándose en datos tomados de una muestra estadística.

Al utilizar varias muestras estadísticas para calcular un mismo parámetro de la población es

normal que haya diferencia entre ellos y la igualdad será solo coincidencia. La diferencia entre la

estadística de la muestra y el parámetro de la población se suele llamar error de estimación. Solo

conoceríamos dicho error si se conociera el parámetro poblacional que por lo general se

desconoce. La única forma de tener alguna certeza al respecto es hacer todas las observaciones

posibles del total de la población; en la mayoría de las aplicaciones prácticas es imposible o

impracticable.

Las inferencias estadísticas se hacen por posibilidades o probabilidades Por ejemplo de la media

de una muestra se hacen inferencias sobre la media de la población. Exactamente no sabemos

cuál es la diferencia entre ambas. Lo que si sabemos es que es pequeña la probabilidad de que

esta diferencia sea mayor que, por ejemplo 3 o 2 errores estándares.

En este capítulo estudiaremos los problemas de estimación puntual, por intervalos para

promedios y proporciones.

ESTIMACIÓN PUNTUAL

Un estimador puntual de un parámetro es cualquier estadística que nos permita a partir de los

datos muestrales obtener valores aproximados del parámetro Esencialmente son tres los

parámetros de interés:

- En el caso de que investiguemos una variable cuantitativa:

Page 17: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

17

a) Para la media de la población μ tomaremos como aproximación la media de la muestra.

=

b) Para la varianza de la población σ2 tomaremos la cuasivarianza de la muestra.

=

- Si el estudio se centra en el estudio de un carácter cualitativo el parámetro de interés será la

proporción de elementos de la población que pertenecen a cierta categoría C que lo

aproximaremos con la correspondiente proporción en la muestra.

Es muy probable que haya error cuando un parámetro es estimado. Es cierto que si el número de

observaciones al azar se hace suficientemente grande, éstas proporcionarían un valor que casi

sería semejante al parámetro; pero a menudo hay limitaciones de tiempo y de recursos y se

tendrá que trabajar con unas cuántas observaciones. Para poder utilizar la información que se

tenga de la mejor forma posible, se necesita identificar las estadísticas que sean “buenos”

estimadores. Hay cuatro criterios que se suelen aplicar para determinar si una estadística es un

buen estimador: Insesgamiento, eficiencia, consistencia y suficiencia

ESTIMADOR

Es un estadístico que se usa con el fin de estimar un parámetro desconocido de la población. Por

ejemplo, si se desea conocer el precio medio de un producto (el parámetro desconocido) se

recogerán observaciones del precio de dicho producto en diversos establecimientos y el promedio

de las observaciones puede utilizarse como estimador del precio medio.

Page 18: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

18

Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el

estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia,

convergencia y robustez (consistencia).

El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual

del valor del parámetro en estudio. En general, se suele preferir realizar una estimación mediante

un intervalo, esto es, obtener un intervalo [a,b] dentro del cual se espera esté el valor real del

parámetro con un cierto nivel de confianza. Utilizar un intervalo resulta más informativo, al

proporcionar información sobre el posible error de estimación, asociado con la amplitud de dicho

intervalo.

PROPIEDADES

Existe una propiedad que comprende conjuntamente las propiedades de insesgamiento y

eficiencia. Se trata del error cuadrático medio.

Si T es un estimador del parámetro. El error cuadrático medio de T, denotado ECM(T), se define

como el valor esperado de (T ).

ECM(T) = E[(T)2]

¿Cuál es la información que nos proporciona el error cuadrático medio?

Nos referimos al promedio de los cuadrados de las observaciones. Si éste es pequeño, debemos

aceptar que hay una tendencia para que los valores (T) sean pequeños, y así lo será también la

diferencia (T), lo que quiere decir que T tiende a producir respuestas numéricas próximas al

parámetro. El poder que tenga T para producir valores próximos depende de dos condiciones

básicas. Una es la “fuerza” o intensidad con la que tiende a dar esos valores (insesgamiento) y la

otra es la “fuerza” que tenga para no permitir que se aparte de camino que lo conduce (eficiencia).

Estas dos condiciones matemáticamente quedan establecidas y precisadas en el teorema

siguiente:

TEOREMA: Si T es un estimador del parámetro, ECM(T) = V[T] – [ -E(T)]2

Page 19: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

19

Sesgo

Es la diferencia entre el valor esperado del estimador y el verdadero valor del parámetro a

estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo

por ser igual al parámetro que se desea estimar.

Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es

un estimador insesgado de la misma, ya que su valor esperado es igual a la media de la población.

En efecto, si una muestra X=(X1,X2,...,Xn)t procede de una población de media μ, quiere decir que:

E[Xi+ = μ para cualquier i=1...n

La media aritmética o media muestral se calcula de la siguiente manera:

Con lo que, al aplicar las propiedades de linealidad de la esperanza matemática se tiene que:

Eficiencia

Diremos que un estimador es más eficiente o más preciso que otro estimador, si la varianza del

primero es menor que la del segundo. Por ejemplo, si y son ambos estimadores de θ y

,

diremos que es más eficiente que . Un estimador es más eficiente (más preciso), por tanto,

cuanto menor es su varianza.

Page 20: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

20

La eficiencia de los estimadores está limitada por las características de la distribución de

probabilidad de la muestra de la que proceden. El teorema de Cramér-Rao determina que la

varianza de un estimador insesgado de un parámetro θ es, como mínimo,

donde f(X;θ) es la función de densidad de probabilidad de la muestra

en función del parámetro θ, (denominada función de verosimilitud).

Si un estimador alcanza esta cota mínima, entonces se dice que el estimador es de mínima

varianza.

Consistencia

Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para un

estimador es que a medida que el tamaño de la muestra crece, el valor del estimador tienda a ser

el valor del parámetro, propiedad que se denomina consistencia. Existen diversas definiciones de

consistencia, más o menos restrictivas, pero la más utilizada es la denominada consistencia en

media cuadrática que exige que:

1. cuando

2. cuando

Robustez

El estimador será un estimador robusto del parámetro θ si la vulneración de los supuestos de

partida en los que se basa la estimación (normalmente, atribuir a la población un determinado

tipo de función de distribución que, en realidad, no es la correcta), no altera de manera

significativa los resultados que éste proporciona.

Page 21: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

21

Suficiencia

Se dice que un estimador es suficiente cuando resume toda la información relevante contenida en

la muestra, de forma que ningún otro estimador pueda proporcionar información adicional sobre

el parámetro desconocido de la población.

Invarianza

Se dice que un estimador es invariante cuando el estimador de la función del parámetro coincide

con la función del estimador del parámetro, .

Ejemplo.- Si para estimar la varianza poblacional utilizamos la varianza muestral, entonces para

estimar la desviación típica poblacional será razonable utilizar la desviación típica muestral.

NIVEL DE CONFIANZA; es la probabilidad de que a priori el verdadero valor del parámetro quede

contenido en el intervalo.

ERROR ESTÁNDAR

Cuando un mismo estimador ofrece diferentes valores para distintas muestras del mismo tamaño

extraídas de la misma población. Por lo tanto deberíamos tener una medida de la variabilidad del

estimador respecto del parámetro que se trata de estimar. Esta variabilidad se mide en términos

de la desviación estándar del estimador, la cual recibe el nombre de error estándar. El error

estándar de un estimador T de un parámetro es la desviación estándar del estimador.

Así por ejemplo, si tomamos como estimador de, entonces el error estándar está dado por el

error de estimación.

Error de estimación, que es el valor absoluto de la diferencia entre una estimación particular y el

valor del parámetro.

En realidad por cada valor estimado del parámetro se tiene un error de estimación por lo general

diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarán la mayoría de

los valores de error de estimación para un estimador y parámetro dados.

Page 22: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

22

ESTIMACIÓN POR INTERVALOS

Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado

con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:

Intervalo de confianza; es una expresión del tipo *θ1, θ2+ ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a

estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de

confianza.

Variabilidad del parámetro; si no se conoce, puede obtenerse una aproximación en los datos

aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el

tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de

esta variabilidad la desviación típica poblacional y se denota σ.

Valor α También llamado nivel de significación; es la probabilidad de fallar en nuestra estimación;

esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una

estimación con un nivel de confianza del 95%, el valor α es (100–95)/100 = 0,05.

Valor crítico; se representa por Zα/2. Es el valor de la abscisa en una determinada distribución que

deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza. Normalmente los valores

críticos están tabulados o pueden calcularse en función de la distribución de la población. Por

ejemplo, para una distribución normal, de media 0 y desviación típica 1, el valor crítico para α =

0,05 se calcularía del siguiente modo: se busca en la tabla de la distribución ese valor (o el más

aproximado), bajo la columna “Área”; se observa que se corresponde con −0,64. Entonces Zα/2 =

0,64. Si la media o desviación típica de la distribución normal no coinciden con las de la tabla, se

puede realizar el cambio de variable t=(X-μ)/σ para su cálculo.

Hemos visto que la media muestral es un buen estimador puntual de la media poblacional. El

inconveniente principal es que un único valor observado de generalmente no es exactamente

igual a µ; habrá cierta diferencia entre y µ . Sería conveniente tener idea de lo cerca que está

nuestra estimación del verdadero valor de la media poblacional. También sería bueno poder dar

información de lo seguros o confiados que estamos de la precisión de la estimación.

Para tener una idea, no solo del valor de la media, sino también de la precisión de la estimación,

los investigadores optan por el método de estimación por intervalo o intervalos de confianza. Un

Page 23: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

23

intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos

extremos L 1 y L 2 son estadísticos. Esto se utiliza para determinar un intervalo numérico a partir

de la muestra. Se espera que este contenga el parámetro de la población que está siendo

estimado. Si se amplía el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de

µ del 95% es tal que: . Decir que un intervalo es un intervalo de confianza del

95% de µ significa que, cuando se utiliza un muestreo repetido de la población, el 95% de los

intervalos resultantes deberá contener a µ; debido al azar, el 5% no incluirá la verdadera media

poblacional. El grado de confianza deseado es controlado por el investigador.

Ejemplo

Hallemos un intervalo de confianza, del 95%, de µ, número medio de productos vendidos por día,

sobre la base de una muestra aleatoria de tamaño 5 dada en la que se ha calculado que una

estimación puntual de µ es . Supongamos que por experiencias anteriores se sabe que ,

número de productos vendidos por día, está normalmente distribuido, con varianza .

Queremos extender la estimación puntual a un intervalo, de forma talque podamos tener una

confianza del 95 % de que el intervalo obtenido contenga al verdadero valor de µ . Es decir,

queremos determinar y de forma que Así:

Para hacerlo así, consideremos la partición de la curva normal tipificada dibujada en la siguiente

figura:

Partición de Z para obtener un intervalo de confianza de µ del 95 %

Page 24: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

24

Puede verse que

En este caso, , por tanto, podemos concluir que

Veamos que los límites superior e inferior del intervalo de confianza del 95% son:

Puesto que se supone que es 9, y y , son estadísticos. Sus valores observados por la

muestra son

Puesto que este intervalo se obtuvo usando un procedimiento que, en muestreos repetidos,

contendrá a la media en un 95% de confianza de que µ esté verdaderamente entre 58.37y 63.63:

58.37 = 61 - 2.63 61 61 +2.63 = 63.63

Dos observaciones son evidentes a partir de esta fórmula:

La primera es que cada intervalo de confianza está centrado en

La segunda es que la amplitud del intervalo depende de tres factores:

La confianza deseada. La desviación estándar El tamaño muestral

Page 25: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

25

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL Y LA DISTRIBUCIÓN DE T

En la mayoría de los casos, el estudio estadístico que interesa se hace por primera vez, por lo que

no hay una forma de conocer previamente cuál es la media o la varianza de la población en

cuestión.

Entonces, consideraremos ahora hacer inferencia sobre una media poblacional cuando se

considera que la varianza de la población es desconocida.

Donde S es la desviación entandar muestral

Z tiene como parámetros a y a

T tiene como parámetro a “v” grados de libertad

El número de grados de libertad implicados en la búsqueda de un intervalo de confianza de

cuando no se conoce es n-1.

La distribución T es el cociente entre una variable aleatoria con una Distribución normal tipificada

(z) y la raíz cuadrada de otra variable aleatoria (independiente de la anterior) con su Distribución ji

cuadrado de v grados de libertad dividida por sus grados de libertad:

t =

Esta distribución solo depende de un parámetro, los grados de libertad, y está definida entre - y

+ . Existen tantas distribuciones de “t” de student-Fisher como grados de libertad haya.

Grados de libertad: El número de maneras en que los datos pueden variar libremente.

Entre más grados de libertad tiene la curva de T se aproxima a la curva normal tipificada

Page 26: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

26

Típica relación entre una curva T y una curva normal tipificada

Ejemplo: El valor t con v =14 grados de libertad que tiene un área de 0.025 a la izquierda, y por lo

tanto un área de 0.975 a la derecha, es:

Ejemplo: Encuentre

Dado que tiene un área de 0.05 a la derecha, y tiene un área de 0.025 a la izquierda, se

tiene un área total de:

De aquí que,

ESTIMACIÓN DE UNA PROPORCION

El mejor estimador de la proporción (p) de una característica de una población es la proporción

observada (po) en una muestra, que se corresponde con la frecuencia relativa de una característica

en la muestra.

Page 27: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

27

Si obtenemos distintas muestras de tamaño “n” de una población con una proporción “p” de una

determinada característica, los distintos valores de las proporciones observadas no son todos ellos

iguales y es necesario, por lo tanto, averiguar qué distribución siguen. Se puede afirmar que la

distribución de este estimador es una distribución normal de media “p” y varianza “pxq/n”, cuando

el tamaño de la muestra es suficientemente grande. Donde q al ser el complementario de p, vale

1-p.

INTERVALO DE CONFIANZA DE UNA PROPORCION

Al seguir esta variable p una distribución normal, se puede calcular un intervalo que contenga

entre sus límites una gran proporción de los valores de la variable p:

p

Distribución de intervalos de proporciones

Ejemplo. En un estudio para una empresa, se toma una muestra aleatoria de 280 trabajadores, y

se estudia la variable edad. Se desea realizar la estimación por intervalo de confianza del 0.95 de la

proporción de trabajadores de esa empresa con 28 años o más: luego se encontró que hay 70

trabajadores con 28 años o más. La estimación puntual de p es po siendo: po = 70/280 = 0.25, que

Page 28: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

28

representa el 25% de los trabajadores con 28 años o mas. Sabiendo que: qo =1 - po = 1 - 0,25 =

0,75, y consultando la tabla de la distribución normal tipificada, se encuentra que el valor de

para una confianza del 0,95 es de 1.96, se obtiene:

De manera que, el intervalo de confianza del 0.95 de la proporción de hombres con dentición

completa esta entre 0.1933 0.3007; es decir, que existe una probabilidad del 0,95% de que este

intervalo contenga entre sus límites el valor de p.

Page 29: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

29

CAPITULO III: PRUEBA DE HIPÓTESIS

Definición de términos. Tipos. Pruebas de hipótesis para promedios y proporciones para una y dos

poblaciones.

PRUEBA DE HIPÓTESIS

Definición

Un contraste de hipótesis (también denominado test de hipótesis o prueba de significación) es una

metodología de inferencia estadística para juzgar si una propiedad que se supone cumple una

población estadística es compatible con lo observado en una muestra de dicha población. Fue

iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.

Una prueba estadística es un procedimiento para, a partir de una muestra aleatoria y significativa,

extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el

valor de un parámetro desconocido de una población.

La hipótesis emitida se designa por H0 y se llama hipótesis nula.

La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Contraste de Hipótesis

La aplicación de cálculos probabilísticos permite determinar a partir de qué valor debemos

rechazar la hipótesis garantizando que la probabilidad de cometer un error es un valor conocido a

priori. Las hipótesis pueden clasificarse en dos grupos, según:

1. Especifiquen un valor concreto o un intervalo para los parámetros del modelo.

2. Determinen el tipo de distribución de probabilidad que ha generado los datos.

Se denomina hipótesis nula a la hipótesis que se desea contrastar. El nombre de "nula" indica

que representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y

puede entenderse, por tanto, en el sentido de “neutra”. La hipótesis nunca se considera

probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que dos

poblaciones tienen la misma media puede ser rechazada fácilmente cuando ambas difieren

mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser

Page 30: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

30

"demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las medias

difieran en una cantidad δ lo suficientemente pequeña para que no pueda ser detectada, aunque

la muestra sea muy grande.

A partir de una muestra de la población en estudio, se extrae un estadístico (esto es, una valor que

es función de la muestra) cuya distribución de probabilidad esté relacionada con la hipótesis en

estudio y sea conocida. Se toma entonces el conjunto de valores que es más improbable bajo la

hipótesis como región de rechazo, esto es, el conjunto de valores para el que consideraremos que,

si el valor del estadístico obtenido entra dentro de él, rechazaremos la hipótesis.

La probabilidad de que se obtenga un valor del estadístico que entre en la región de rechazo aún

siendo cierta la hipótesis puede calcularse. De esta manera, se puede escoger dicha región de tal

forma que la probabilidad de cometer este error sea suficientemente pequeña.

Procedimiento:

1. Enunciar la hipótesis nula H0 y la alternativa H1.

Bilateral H0=k H1 ≠ k

Unilateral H0≥ k H1 < k

H0 ≤k H1> k

2. A partir de un nivel de confianza 1 − α o el de significación α. Determinar:

El valor zα/2 (bilaterales), o bien zα (unilaterales)

La zona de aceptación del parámetro muestral (x o p').

3. Calcular: x o p', a partir de la muestra.

4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis

con un nivel de significación α. Si no, se rechaza.

5. Se especifica la decisión de la prueba si se rechaza o no la hipótesis nula.

6. Se da una conclusión referente al caso que llevo a la prueba de hipótesis, la misma que tiene

que ser en un lenguaje común.

Page 31: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

31

Errores de Tipo I y II

En toda prueba de hipótesis existen dos tipos de errores, llamados Error de tipo I y error de tipo II;

el hecho de que las hipótesis, tanto la nula cómo la alternativa puedan recoger en sus

planteamientos uno o varios valores, da lugar a hipótesis de carácter simple, si el número de

valores plausibles e hipotéticos es de uno en ambas, o bien a hipótesis compuestas si dicho valor

no es único en alguna de ellas.

Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hipótesis

puede plantearse como un problema de decisión, en el que evidentemente existe la posibilidad de

fracasar o acertar en la elección o decisión a la hora de concluir que la hipótesis, bien nula o bien

alternativa, son rechazables o no.

Como es lógico para que una prueba de hipótesis o regla de decisión sea eficiente, es necesario

que ambos errores sean mínimos, esto no es tan fácil de lograr sobre todo cuando la muestra ya

esta dada. Un intento de disminuir uno de los errores aumenta el otro. La naturaleza de las

investigaciones obliga muchas veces a poner énfasis en la limitación de un error, de allí que en

muchos casos hagamos hincapié en el error de tipo I.

El problema de decisión: rechazo/no rechazo, vendría expresado en las siguientes opciones en

forma de tabla:

Hipótesis/Acción No Rechazamos Rechazamos

Es cierta Correcto Error Tipo I

Es falsa Error Tipo II Correcto

Prueba de Hipótesis sobre la Media Poblacional

Caso A: Cuando la varianza poblacional es conocida.

se distribuye normalmente y

conocemos también su varianza , o bien si nos es desconocida, el tamaño muestral es lo

suficientemente grande cómo para poder utilizar la muestral cómo poblacional.

Hemos determinado un nivel de significación para la realización del contraste y vamos a

plantearlo en el supuesto de realizar una muestra aleatoria de tamaño n.

Page 32: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

32

Así: conocemos que

n

uNx , de lo que deducimos que ]1,0[N

n

ux

de forma que

la hipótesis nula es: H0: 0.

El estadístico está dado por:

n

uxZ

0

.

Ejemplo Nº 1

De 100 observaciones de una población normal se obtiene que x = 5 y que S=2.Contrastar con

un nivel de significación del 5% la hipótesis de que la media de la población sea 7.

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0 =7 H1

2.

3.

n

uxZ

0

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística: 10

1002

75

Z

6. Dado que Z=-10 y no pertenece a la región de aceptación estamos en condiciones de

7.

Page 33: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

33

Ejemplo Nº 2

Un empresario está considerando la posibilidad de ampliar su negocio mediante la adquisición

de un pequeño bar. El dueño actual del bar afirma que el ingreso diario del establecimiento

sigue una distribución normal de media 675 soles y una desviación estándar de 75 soles. Para

comprobar si decía la verdad, tomó una muestra de treinta días y ésta reveló un ingreso diario

promedio de 625 soles. Utilizando un nivel de significación del 10 %. ¿Hay evidencia de que el

ingreso diario promedio sea menor del que afirma el presente dueño?.

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0 675 H1

2.

3.

n

uxZ

0

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística: 65.3

3075

675625

Z

6. Dado que Z=-3.65 y no pertenece a la región de aceptación estamos en condiciones de

Caso B: Cuando no se conoce la varianza poblacional y para una muestra pequeña.

Deseamo

muestral es pequeño, no podemos utilizar la muestral en su lugar.

Page 34: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

34

Hemos determinado un nivel de significación para la realización del contraste y vamos a

plantearlo en el supuesto de realizar una muestra aleatoria de tamaño n.

Así: conocemos que 1

nt

ns

ux de forma que la hipótesis nula es: H0 0.

El estadístico está dado por:

ns

uxt 0 .

Ejemplo 3

Se escoge a 17 individuos al azar y se les mide, resultando que su estatura media es de 1,71

metros con desviación típica de 0,02 .Contrastar la hipótesis de que la estatura media nacional

sea de 1.75 metros si utilizamos un nivel del significación del 5%. Se supone normalidad

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: =1.75 H1

2.

3.

ns

uxt 0

4. Establecemos la región de aceptación y de rechazo: Utilizamos la tabla T.

5. Realizamos la prueba estadística: 25.8

1702.0

75.171.1

t

6. Dado que t=-8.25 y no pertenece a la región de aceptación estamos en condiciones de

Page 35: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

35

Prueba de Hipótesis para la Proporción Poblacional: p

Se trata de efectuar una prueba de hipótesis acerca de la proporción de elementos con

cierto atributo en una población, hipótesis de la forma:

H0 0.

H1: p p0.

H0: pp0.

H1: p>p0.

H0: pp0.

H1: p<p0.

El estadístico está dado por:

n

pp

pPZ

)1( 00

0

Donde n

xP (proporción muestral)

Tiene una distribución N(0,1) cuando n 30.

Ejemplo 4.

Una empresa de publicidad desea comprobar si un determinado programa de televisión

es visto por el 30% de la audiencia potencial .Para ello se escoge al azar una muestra de

200 familias resultando que de ellas 50 lo ven asiduamente. Contrastar la hipótesis con un

nivel de significación del 5%.

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: p=0.3 H1: p

Page 36: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

36

2.

3.

n

pp

pPZ

)1( 00

0

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística:

25.0200

50P

54.1

200

)3.01(3.0

30.025.0

)1( 00

0

n

pp

pPZ

6. Dado que Z=-1.54 y pertenece a la región de aceptación estamos en condiciones

Ejemplo 5

Un fabricante de refrescos sin burbujas desea sacar al mercado una variedad de su

producto que tenga burbujas. Su director comercial opina que al menos el 50 % de los

consumidores verá con buenos ojos la innovación. Se realiza un sondeo de mercado y

resulta que de 100 consumidores encuestados 40 son favorables a la innovación.

a) Contrastar la hipótesis del director comercial frente a la alternativa de que el % de

aceptación es inferior, con un nivel de significación del 1%.

b) Si el aceptable la hipótesis de que el % de aceptación del nuevo producto es inferior o

igual al 30 % el fabricante decidirá no fabricarlo. Si es aceptable el criterio del director

comercial entonces sí fabricarán el refresco con burbujas. Y si ninguna de las 2 hipótesis

Page 37: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

37

es aceptable procederán a hacer otro sondeo. Para tomar esta decisión trabajarán con un

nivel de significación del 5 %. ¿ Por qué optarán?.

Para el punto a)

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: p0.5 H1: p

2.

3.

n

pp

pPZ

)1( 00

0

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística:

4.0100

40P

2

100

)5.01(5.0

5.04.0

)1( 00

0

n

pp

pPZ

6. Dado que Z=-2 y pertenece a la región de aceptación estamos en condiciones de

aceptar la hipótesis nula, es decir: p

Para el punto b)

Aplicando el procedimiento para probar una hipótesis tenemos:

1. H0: p0.3 H1

Page 38: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

38

2. %).

3.

n

pp

pPZ

)1( 00

0

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística:

4.0100

40P

18.2

100

)3.01(3.0

3.04.0

)1( 00

0

n

pp

pPZ

6. Dado que Z=2.18 y pertenece a la región de aceptación estamos en condiciones de

aceptar la hipótesis nula, es decir: p

refresco.

Estimación de una Diferencia entre Dos Medias de Poblaciones normales (Población 1 y 2)

Para encontrar el intervalo de la diferencia de la media de dos poblaciones se considera

que las muestras tomadas de las poblaciones son independientes.

Si se conoce las desviaciones estándar poblacionales ( 1 Y 2 ).

El intervalo de %1100 , resulta ser:

Límite inferior: 2

2

2

1

2

121

nnzxx tabla

;

Page 39: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

39

Límite superior: 2

2

2

1

2

121

nnzxx tabla

Donde:

1n : es el tamaño de la muestra tomada de la población 1

1n : es el tamaño de la muestra tomada de la población 2

1x : es la media de la muestra tomada de la población 1

2x : es la media de la muestra tomada de la población 2

1 : es la desviación estándar de la población 1

2 : es la desviación estándar de la población 2

N es el tamaño de la población

tablaz : es el valor z de la tabla N(0,1)

Si no se conoce las desviaciones estándar poblacionales ( 1 Y 2 )

El intervalo de %1100 , resulta ser:

Límite inferior: 21

2;21

11**

21 nnstxx pnngltabla ;

Límite superior: 21

2;21

11**

21 nnstxx pnngltabla

Donde:

2; ngltablat : es el valor “t” de la tabla “t” de Student, con 221 nn grados de libertad

Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales, 2

cs representa entonces la varianza común y se calcula:

2

11

21

2

22

2

112

nn

snsns p

Page 40: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

40

Page 41: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

41

Estimación de una Diferencia entre Dos Proporciones Poblacionales (Población 1 y 2).

(Caso de muestras grandes)

El intervalo de %1100 , resulta ser:

Límite inferior: 2

22

1

1121

ˆˆˆˆˆˆ

n

QP

n

QPzpp tabla

;

Límite superior: 2

22

1

1121

ˆˆˆˆˆˆ

n

QP

n

QPzpp tabla

Donde:

1n : es el tamaño de la muestra tomada de la población 1

2n : es el tamaño de la muestra tomada de la población 2

1P̂ : es la proporción en la muestra tomada de la población 1; 11ˆ1ˆ PQ

2P̂ : es la proporción en la muestra tomada de la población 1; 22ˆ1ˆ PQ

N es el tamaño de la población

tablaz : es el valor z de la tabla N(0,1)

Prueba de Hipótesis para una Diferencia de Medias de Poblaciones con distribución

normal (Con muestras independientes).

Aquí se tiene entonces: 2

111 ;~ NX y 2

222 ;~ NX

En este caso las hipótesis son de la forma:

1. 21

210

:

:

aH

H 2.

21

210

:

:

aH

H 3.

21

210

:

:

aH

H

En forma equivalente se puede plantear las hipótesis:

Page 42: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

42

1. 0:

0:

21

210

aH

H 2.

0:

0:

21

210

aH

H 3.

0:

0:

21

210

aH

H

Caso en que se conocen las varianzas poblacionales ( 2

1 Y 2

2 )

El valor calculado es:

2

2

2

1

2

1

21

nn

xxzcalc

Los valores críticos son: Hipótesis tipo 1: tablaz y tablaz , Hipótesis tipo 2: tablaz ,

Hipótesis tipo 3: tablaz

Caso en que no se conocen las varianzas poblacionales ( 2

1 Y 2

2 )

Si se considera que: 2

2

2

1

El valor calculado es:

21

21

11

nns

xxt

p

calc

Donde:

2

11

21

2

22

2

112

nn

snsns p

2

1s y 2

2s ; son las varianzas de las muestras sacadas de la población 1 y 2 respectivamente

1x y 2x ; son las medias de las muestras sacadas de la población 1 y 2 respectivamente

Los valores críticos son:

Hipótesis tipo 1: 2; 21 nngltablat y 2; 21 nngltablat

Hipótesis tipo 2: 2; 21 nngltablat

Hipótesis tipo 3: 2; 21 nngltablat

Page 43: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

43

Si se considera que: 2

2

2

1

El valor calculado es:

2

2

2

1

2

1

21

n

s

n

s

xxtcalc

Los valores críticos son los mismos anteriores, pero, los grados de libertad están dados

por:

2

1

1

1

12

2

2

2

2

2

1

2

1

1

2

2

2

2

1

2

1

n

s

nn

s

n

n

s

n

s

gl

Ejemplo 6: Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen

desviaciones estándar respectivas de 120 horas y 90 horas. Para comparar el promedio de

vida útil de estos artículos se extrae una muestra aleatoria de 60 artículos de cada

fabricante encontrándose la duración media de 1.230 horas para la marca A y de 1.190

horas para la marca B. ¿Se puede concluir a un nivel de significación del 5% que los

artículos de marca A tienen mayor duración media que los artículos de marca B?

Se tiene una prueba de hipótesis para la diferencia de dos medias con varianzas

poblacionales conocidas.

Datos: 645,1z 90 ;120 ;190.1 ;230.1 ;60 tabla

22

2

22

12121 xxnn

En este problema, si bien es cierto, no se dice que las poblaciones sean normales, se tiene

que los tamaños de muestra son grandes, por lo que la estadística de prueba:

2

2

2

1

2

1

21

nn

xxzcalc

Page 44: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

44

Tiene una distribución aproximadamente normal estándar, por lo que se puede usar lo

presentado en el punto 4.1.

0:

0:

21

210

aH

H

El valor calculado es: 07,2

60

90

60

120

190.1230.1

22

2

2

2

1

2

1

21

nn

xxzcalc

Valor critico: 645,1tablaz

La región de rechazo es entonces: ;645,1RR

Por lo tanto se rechaza Ho, se acepta Ha. Se puede decir que existen evidencias

significativas, al nivel de significación del 5%, para decir que la duración media de los

artículos de marca A es mayor a los de marca B.

Prueba de Hipótesis para una Diferencia de Proporciones (Muestras grandes).

En este caso las hipótesis son de la forma:

1. 21

210

:

:

PPH

PPH

a

2.

21

210

:

:

PPH

PPH

a

3.

21

210

:

:

PPH

PPH

a

En forma equivalente se puede plantear las hipótesis:

1. 0:

0:

21

210

PPH

PPH

a

2. 0:

0:

21

210

PPH

PPH

a

3. 0:

0:

21

210

PPH

PPH

a

El valor calculado es:

21

21

11ˆ1ˆ

ˆˆ

nnPP

PPzcalc

Page 45: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

45

Donde: 21

2211ˆˆ

ˆnn

PnPnP

Los valores críticos son:

Hipótesis tipo 1: tablaz y tablaz

Hipótesis tipo 2: tablaz

Hipótesis tipo 3: tablaz

Ejemplo 7:

Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada

población reveló que 120 hombres y 120 mujeres estaban a favor de cierto candidato. ¿Se

puede concluir a un nivel de significación del 5% que la proporción de hombres a favor del

candidato es mayor que la proporción de mujeres?

Aquí se tiene una prueba de hipótesis para diferencias de proporciones con muestras

grandes.

Si denotamos con 1 a la población de hombres y con 2 a la de mujeres, se tiene:

1° Plantear las hipótesis de interés

21

210

:

:

PPH

PPH

a

2° Calcular la estadística de prueba (valor calculado), bajo Ho:

El valor calculado es:

76,2

400

1

300

166,034,0

3,04,0

11ˆ1ˆ

ˆˆ

21

21

nnPP

PPzcalc

Donde: 34,0400300

3,04004,0300ˆˆˆ

21

2211

nn

PnPnP

3° Construir la regla de decisión y decidir

El valor crítico es: 645,1tablaz

Page 46: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

46

La región de rechazo (RR) es: ;645,1RR

Por lo tanto se rechaza Ho, se acepta Ha

Se puede decir entonces que existen evidencias suficientes, a un 5% de significación, para

decir que la proporción de hombres a favor del candidato es mayor que el de las mujeres,

en esa población.

Page 47: INFERENCIA ESTADÍSTICA APLICADA A LA ECONOMÍA

47

BIBLIOGRAFIA

1) HINES W. Y MONTGOMERY D. ”Probabilidad Y Estadística, Para Ingeniería y

Administración”. Cuarta Edición. Editorial Continental. México 2004.

2) Webster, Allen L.: “Estadística Aplicada a los Negocios y la Economía” Irwin Mc.

Graw-Hill Interamericana S.S. Tercera Edición. Colombia 2000.

3) Mason, Robert D.: “Estadística para Administración y Economía”. 10 Unid Douglas a.

Edición – Alfaomega grupo Editor S.A. de C.V. y Marchal, William G. México 2001.

4) Kasmier Leonar, J.: “Estadística aplicada a la Administración y Economía”. Edit

Shaum. Tercera edic. Mc Graw – Hill Interamericana Editores S.A. C.V.- México

1998.

5) Levin, Richard I.: “Estadística para Administradores”. Sexta Edición. Prentice – Hall

Hispanoamericana S.A. México 1996.

6) Jonson, Robert: “Estadística elemental lo esencial” Segunda edición International

Thomson editores S.A. de C.V. México 1999.

7) Stevenson, William: “Estadística para Administración y Economía”. Edit. Harla S.A.

1981

8) Newbaold, Paul: “Estadística para los Negocios y la Economía” 4ta edición

Prenticemay Madrid 1998.