1ESTADISTICA
La Estadstica se divide en 2 reas de estudio:DESCRIPTIVA : Area que se dedica a analizary representar los datos en forma bsica
Estadstica
y representar los datos en forma bsica,tratando de extraer conclusiones sobre elcomportamiento de las variables en estudio.
Este anlisis se realiza a travs de laRecoleccin, descripcin y resumen de datos.
INFERENCIAL : Encargada del anlisis e
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
INFERENCIAL : Encargada del anlisis einterpretacin de los datos que nos permiteninferir o estimar caractersticas de la poblacina partir del estudio de una muestra.
Tiene como base de anlisis, el modelamiento,la inferencia y prediccin.
Aplicacin de la tcnica de muestreo
apropiado.
REPRESENTACION GRAFICA DEL ANALISIS DE INFERENCIA
POBLACIONmuestra
apropiado.
PARAMETROSMedia Poblacional ()Varianza Poblacional(2)
ESTIMADORMedia Muestral ( )Varianza Muestral(s2)Proporcin Muestral(p)
x
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
( )Proporcin Poblacional()
Estadstica Inferencial
error muestral: - x
2DEFINICIONES IMPORTANTES
Poblacin: Es la totalidad de elementos acerca del cual sedesea informacin.
Muestra: Es un subconjunto o parte de la poblacin
La mayor parte del tiempo los investigadores trabajan con informacinlimitada de la poblacin, ya sea por tiempo, costo, disponibilidad y/ofacilidad para obtener la informacin. En este caso se acostumbra atrabajar con un subconjunto de esta, denominado Muestra
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Una buena muestra debe ser representativa y confiable, esto es, debereflejar lo ms fiel posible las caractersticas de la poblacin en estudio.
TIPOS DE MUESTRAS
Un punto clave en el proceso de inferencia es la eleccin de lamuestra, pues los resultados de la inferencia sern tanto mejorescuanto ms representativa sea sta de la poblacin de partida.
Existen varias formas de seleccionar muestras de las poblaciones:
Muestra aleatoria: cuando los elementos de la poblacin se eligende forma aleatoria, usando cualquier mecanismo de azar.
Muestra aleatoria simple (m.a.s.): Se garantiza que todos losindividuos de la poblacin tengan la misma probabilidad de ser
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
individuos de la poblacin tengan la misma probabilidad de serelegidos en la muestra y que cada uno de sus elementos se elijande forma independiente.
3Muestra sistemtica: Previamente los individuos de la poblacin seencuentran en una lista, despus se elige uno al azar (xi) y a continuacin,a intervalos constantes, se eligen todos los dems hasta completar lamuestra.
Los intervalos son seleccionados en base a un coeficiente de elevacin k= N/n= N/n .
Donde: N es el tamao de la poblacin y n el de la muestra.
La eleccin de los elementos muestrales vendrn dados por xi+k, xi+2k,.
Ejemplo: Si se va a encuestar a una muestra de tamao 50 de una poblacind 500 l i t l d l i d t 10 E t i t l d l i
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
de 500, el intervalo de seleccin es de tamao 10. Este intervalo de seleccinindica que se habr de formar cada dcimo caso de la poblacin paraintegrarlo a la muestra. El primer caso se selecciona arbitrariamente o al azar.Suponiendo que en este ejemplo el primer caso seleccionado sea el nmero13, el segundo ser el 23 y as sucesivamente hasta completar el tamao demuestra deseado.
Muestra estratificada: se dividen los elementos de la poblacinen clases o estratos (edad, renta, etc) y dentro de cada uno deellos se eligen los elementos por m. a. s. o sistemtico.
Muestra no aleatoria: Se seleccionan los individuos de formasubjetiva (opintica), lo que puede introducir cierto sesgo a losresultados obtenidos.
A partir de ahora utilizamos siempre el muestreo aleatorio simple.
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
4MUESTRA ALEATORIA SIMPLE(m.a.s)
Definicin: Sea X una variable aleatoria correspondiente a unapoblacin con funcin de distribucin f(x).p ( )
Si las variables X1, X2, .., Xn son independientes y tienen la mismadistribucin f(x) que la distribucin de la poblacin, entonces lasvariables aleatorias X1, X2, .., Xn forman un conjunto de variablesindependientes e idnticamente distribuidas, que constituyen unamuestra aleatoria simple de tamao n proveniente de una poblacincon distribucin f(x)
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
con distribucin f(x).
(X1,X2,..,Xn) muestra aleatoria simple.
Caso continuo:
Si X1,X2,..,Xn son variables aleatorias continuas, independientes eidnticamente distribuidas la distribucin de densidad conjunta ser:
FUNCIN DE DISTRIBUCIN CONJUNTA DE VARIABLES INDEPENDIENTES E IDENTICAMENTE DISTRIBUIDAS
idnticamente distribuidas, la distribucin de densidad conjunta ser:
)()().......()(),......,(1
2121 =
==n
iinn xfxfxfxfxxxf
Caso discreto:
Si X1,X2,..,Xn son variables aleatorias discretas, independientes eidnticamente distribuidas la distribucin de probabilidad conjunta ser:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
idnticamente distribuidas, la distribucin de probabilidad conjunta ser:
)()().......()(),......,(1
22112211 ii
n
innnn xXPxXPxXPxXPxXxXxXP =========
=
5Parmetro: es una caracterizacin numrica de ladistribucin de la poblacin (esperanza, varianza,).
Es un valor fijo y desconocido, puesto que paraEs un valor fijo y desconocido, puesto que paraconocerlo necesitaramos estudiar toda la poblacin.
Como los parmetros poblacionales son difciles deobtener directamente, se recurre a los estadsticos oestadgrafos para estimarlos.
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Estadstico: es una variables aleatorias que depende solamente de lamuestra observada.
Es una caracterizacin numrica de la muestra (media, varianza, ).
Su valor no es fijo, sino que depende de la muestra particularseleccionada.
Por ejemplo: Si X1, X2, ..., Xn, es una muestra aleatoria de una poblacinX, entonces :
)(1 1
2
2 =xx
syxx
n
iin
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Son estadsticos.
11
1 == = nsyxnx ii in
6Distribucin Muestral: Se llama as a la funcin de distribucin (oprobabilidad) de un estadstico.
Error Estndar del Estadstico: es la desviacin estndar de ladistribucin muestral de un estadstico.
Teoremas de aplicacin:
Teorema 1: Si X e Y son dos variables aleatorias Independientes, a yb son constantes, entonces:
E[aX bY] = aE[X] bE[Y]
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
E[aX bY] = aE[X] bE[Y]
Una consecuencia inmediata de este teorema: cuando a=1 y b=1, es:
E(X Y) = E(X) E(Y)
Teorema 2: Si X e Y son dos variables aleatorias Independientes,entonces:
a) E(XY) = E(X) E(Y)
b) Var(X+Y)= Var(X) + Var(Y)
Teorema 3: Si X e Y son variables aleatorias independientes,entonces;
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Cov(X,Y)=0
7Teorema 4: Si X e Y son dos variables aleatorias con funcin deprobabilidad conjunta y varianzas finitas, entonces:
Var(aX bY)= a2Var(X) + b2Var(Y) 2ab Cov(X,Y)
Var(X)=E(X2) ( )2
Asimismo, es importante considerar la siguiente propiedad:
X
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
SUMA DE VARIABLES ALEATORIAS DE DISTRIBUCIN DESCONOCIDA
Sean n variables X1, X2, ...., Xn independientes con esperanzay varianza finitas : iiXE =)( 2)( iiXV =y
n
n
ii XXXXS +++==
=......21
1
y sea
Entonces , utilizando propiedades de Esperanza y de Varianciaindicados en los teoremas anteriores:
=== n in in i XEXESE )()()(
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
=== i
ii
ii
i111
)()()(
y como las variables son independientes:
===
===n
ii
n
ii
n
ii XVXVSV
1
2
11)()()(
8Ejemplo de aplicacin
Consideremos una muestra de n elementos de una poblacin.
Definamos Xi como la observacin hecha al i-simo elemento.
Se dispone entonces de n variables aleatorias independientes :Se dispone entonces de n variables aleatorias independientes :
X1 ,X2 ,...., Xn idnticamente distribuidas
2)()(:...1
===
ii XVyXEni
I di l M di V i i d
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Indicar la Media y Variancia de:
n
XX
n
ii
== 1
Solucin
Hacemos =
=n
iiXS
1entonces :
nXEXESE ni
n
ii
n
ii
=======
111)()()(
RECORDANDO: X1 ,X2 ,...., Xn idnticamente distribuidas
2)()(:...1 === ii XVyXEni
iii 111
===
====n
i
n
ii
n
ii nXVXVSV
1
22
11)()()(
Definiendo :nS
n
XX
n
ii =
= =1 , entonces:
nn
SEnn
SEXE 1)(1)()( ====
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
nn
nSV
nnSVXV
22
221)(1)()( ====
Luego, X es una variable aleatoria que se distribuye con media y variancia :
nXVyXE
2
)()( ==
9X es una variable aleatoria que se distribuye con media y varianza :
nXV
XE2
)(
)(
==
Observaciones:
vemos que la esperanza de la media muestral es igual a la media poblacional, yque la variaza de la media muestral es menor que la variancia poblacional
RECORDANDO: X1 ,X2 ,...., Xn idnticamente distribuidas
2)()(:...1 === ii XVyXEni
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
que la variaza de la media muestral es menor que la variancia poblacional,disminuyendo su valor a medida que aumenta el tamao de la muestra.
Esto significa que la distribucin de la media muestral es ms concentrada que la dela propia variable, y cuanto mayor sea el tamao de la muestra ms se concentraesta distribucin alrededor de la media poblacional.
LEY DE LOS GRANDES NMEROS
Cualquiera sea la distribucin de la variable X (siempre que tengaesperanza y varianza finitas), la distribucin de la media muestral ( ) seXconcentra ms y ms alrededor de la media Poblacional , conformeaumente el tamao de la muestra.
Entonces:
La Ley de los Grandes Nmeros afirma que la media muestral de nvalores observados es aproximadamente igual a E(X) cuando n
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
10
Sea d un nmero real positivo, arbitrariamente pequeo.La probabilidad de que la media muestral diste de la mediapoblacional en una magnitud mayor que d tiende a "cero"
X
enunciando dicho concepto en trminos de probabilidad ser:
{ } 0 > ndXP Es decir:
poblacional en una magnitud mayor que d tiende a ceroa medida que el tamao de la muestra (n) tiende a "infinito"
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
X cuando nLo que significa que :
TEOREMA DEL LMITE CENTRAL
Es el teorema ms importante de toda la inferencia estadstica.
La Ley de los Grandes Nmeros trata de la convergencia enprobabilidad pero nada dice acerca de la distribucin de la mediaprobabilidad, pero nada dice acerca de la distribucin de la media(o proporcin) muestral.
El Teorema del Lmite Central trata de la convergencia endistribucin de la suma de variables aleatorias independientes, delas cuales no se requiere conocer su distribucin.
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Enunciando el Teorema:
11
Sean n variables aleatorias independientes e idnticamentedistribuidos: X1, X2,...., Xn con esperanza y varianza finitas,con n grande. Entonces la distribucin de la suma de estasvariables converge a la distribucin Normal.
Sean: X X X independientes con =)( iXESean: X1,X2,....,Xn independientes con ( ) = 02iXV
y ))(),((......211 nnnD
nn
i inSVSENXXXXS
=+++==
Entonces: ( ) )10(NSES Dnn
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
( )( )
)1,0(NV nS
nn
n
El teorema del lmite central garantiza una distribucin normal cuando n es suficientemente grande.
Aplicacin del Teorema del Lmite Central
- Hallar la Distribucin de la media , teniendo en cuenta lo siguiente:XSe considera una muestra de tamao n (n suficientemente grande)donde se define v.a. Xi con dado que lasn variables aleatorias independientes X1 ,X2 ,....,Xn se encuentran
( ) 2)( == ii XVXEp 1 2 n
idnticamente distribuidas.
Solucin:
grandementesuficientendado
SVSENXXXXS nnD
nn
iin
""
))(),((......211
+++== =
Luego por el Teorema del Lmite Central:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
===
====n
i
n
ii
n
iin nXEXESE
111)()()(
2
1
2
11)()()( nXVXVSV n
ii
n
ii
n
iin ====
===
Tenemos:
12
Por el Teorema del Lmite Central tambin se establece que:
( )
Entonces
NSESD
nS
nn
n )(
:
)1,0(
( )( )
( ) =
=
==
NXnnS
nSpero
NnnS
nnS
SVSES
Entonces
Dnn
D
n
nn
n
nn2
)10(
)1,0(
:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
==
nNXnpara
Nn
nnnpero
n
2
,~""
)1,0(
DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES
Hemos visto la distribucin muestral de la media para un tamao de
muestra grande (n30) lo que nos permita determinar su aproximacin a
la normal basados en la aplicacin del Teorema del Limite Central.la normal basados en la aplicacin del Teorema del Limite Central.
Sin embargo cuando la muestra es pequea (n
13
DISTRIBUCIN CHI-CUADRADO
Definicin:
Sean Z1, Z2, , Zr variables aleatorias independientes distribuidasnormalmente cada una con media 0 y varianza 1 La variablenormalmente, cada una con media 0 y varianza 1. La variablealeatoria:
Se dice que X es una variable aleatoria chi-cuadrado con r gradosde libertad (o que tiene una distribucin chi-cuadrado con r grados delibertad)
2).(
222
21 ~... lgrrZZZX +++=
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
libertad).
Nota:Los grados de libertad son el nmero de variables aleatoriasindependientes de la muestra.
La media y varianza de la variable aleatoria chi-cuadrado con r grados
de libertad son:
rXVarV
rXEE
2)()(
)()(
22
2
===
===
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
14
Teorema 1: Si la Variable aleatoria X es N(,2), entonces la v.a.
2.).1(2
2
~)( lgXY
=
Teorema 2: (Propiedad Aditiva o reproductiva de la Chi-cuadrado):
Sea: X12, X22, Xp2 variables aleatorias chi-cuadrados
independientes con grados de libertad r1, r2,,rp respectivamente,
entonces la variable aleatoria :
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
=
=+++=p
iilgrp rrdondeXXXX
1
2).(
222
21
2 :~...
Teorema 3: Sea: X1, X2, Xn una muestra aleatoria de variables con
distribucin N(,2). Entonces, la variable aleatoria:
21
2
~)(
n
iiX
=
Adicionalmente: Sea X1,.., Xn, con distribucin normal con
es una variable aleatoria normal N(, 2/n), por lo tanto:
).(2 ~ lgn
=
=n
iiXn
X1
1
)10(~ NX
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
Entonces:
)1,0(~/
Nn
2).1(2
2
2
22
~)()(/ lg
Xn
n
Xn
X
==
15
Definicin:
Sea Z una variable aleatoria N(0,1). Sea Y una v.a. que tiene una
DISTRIBUCIN t-STUDENT
distribucin Chi-cuadro con r grados de libertad, y si Z e Y son
independientes, entonces la variable aleatoria :
)(~/ rt
YrZ
rYZT ==
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
Se dice que tiene una distribucin t-student (o simplemente tiene una
distribucin t ) con r grados de libertad.
Esta distribucin es simtrica y su media y varianza esta dado por :
22
)(
10)(
2 >==>==rrTVar
rTE
As, la distribucin t no tiene media cuando r=1 y la varianza no existe
cuando r=1 2.
La distribucin t es muy similar a la distribucin normal estndar, ya
b l
2r
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
que ambas cumplen:
-Varan de - a -Son simtricas
-y centradas alrededor de t=0
16
En mucha situaciones estaremos interesados en comparar las varianzas de
dos variables aleatorias independientes distribuidas normalmente, en estos
casos recurriremos a la distribucin F.
DISTRIBUCIN F- FISHER
Definicin:
Sea U y V dos variables aleatorias independientes que tiene
distribuciones Chi-cuadrado, con r1 y r2 grados de libertad,
respectivamente. Entonces la variable aleatoria:
U
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
Tiene una distribucin F-fisher con r1 y r2 grados de libertad .
),(2
121
~ rrFrVrUF =
La media y varianza de la variable aleatoria F- Fisher con r1 y r2 grados
de libertad son:
4,)4()2(
)2(2)(
2,2
)(
22
221
21222
22
2
>+==
>==
rrrr
rrrFV
rrrFE
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I
17
DISTRIBUCION MUESTRAL DEDISTRIBUCION MUESTRAL DEDISTRIBUCION MUESTRAL DE DISTRIBUCION MUESTRAL DE ESTADISTICOSESTADISTICOS
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I