Como hacer una prueba de bondad de ajuste.pdf

Embed Size (px)

Citation preview

  • 7/23/2019 Como hacer una prueba de bondad de ajuste.pdf

    1/4

    Como hacer una prueba de bondad de ajuste.

    1)

    Vamos a crear un conjunto de datos que asemejen los datos tomados en nuestra muestra.

    2)

    Vamos a hacer el histograma de los datos usando 7 clases.

    3)

    Vamos a calcular los parmetros del test estadstico chi-cuadrado

    4)

    Aplicamos el test.5)

    Concluimos.

    En Scilab la funcin rexpweib(n,1,1) permite generar n valores exponenciales con parmetro

    Lambda=1 (el 1 del centro) El 1 final es para elegir exponencial en lugar de weibull. Para nuestro

    caso de inters n=100.

    Obtenemos: -->x=rexpweib(100,1,1)

    x =

    2.063672

    0.0316271

    0.0906078

    1.5094385

    0.4582976

    1.1771133

    2.3274886

    0.6029033

    1.2783436

    1.6692836

    0.6035231

    0.0071442

    0.0434224

    0.0035450

    0.0357427

    0.0328384

    1.8476121

    0.3204271

    0.0298483

    0.0190710

    0.0437775

    2.2085325

    0.7228322

    0.2255140

    0.2227930

    1.213924

    1.9527289

    5.342586

    0.8633158

    2.1851175

    0.0880277

    0.4466569

    0.2329321

    0.1296183

    0.0413509

    0.6858485

    0.4219898

    0.2257361

    3.3322775

    1.0180632

    0.1635438

    1.551526

    0.0682861

    0.3836652

    0.3875243

    0.9194494

    0.2774148

    0.3002308

    0.2968810

    0.7449486

    0.9359145

    0.8625422

    0.4223907

    1.7494752

    1.7650006

    1.197616

    0.3480748

    0.2265495

    3.4472567

    1.1502727

    1.2840159

    0.1364742

    3.0753949

    1.9030443

    2.3316867

    0.0059492

    0.1942429

    0.1961326

    0.3640901

    2.0779805

    1.1485397

    0.2695148

    0.0510596

    0.7121485

    3.3683601

    0.4100674

    0.8238384

    2.0722941

    0.9634912

    1.5596527

  • 7/23/2019 Como hacer una prueba de bondad de ajuste.pdf

    2/4

    0.2672041

    2.971695

    0.2291617

    3.3120539

    1.6773282

    0.8946976

    0.7138308

    0.7809098

    0.8083646

    0.7183236

    0.4364714

    0.2307033

    0.3433853

    0.0824312

    0.2814526

    0.2137738

    1.2872636

    0.3484598

    0.3860998

    5.8715744

    Ahora al proceder a ordenar estos datos en una frecuencia de clases con siete clases para luego hacer el

    histograma.

    -->clf() (Para prepara una ventana grfica sobre la cual se har el grfico deseado)

    -->histplot(7, x, style=2); (hace el histograma con 7 clases)

    -->x = linspace(0, max(Xmax), 100)'; (genera valores de x que se plotearn sobre el histograma)

    -->plot2d(x, lambda*exp(-lambda*x), strf="000", style=5) (hace el plot)

    -->legend(["Histograma de la muestra Exponencial" "Curva de densidad exacta"]);

    Obtenindose:

    Este grfico muestra el comportamiento claramente Exponencial, como era de esperarse.

    Para ms opciones del comando histoconsulte la ayuda de Scilab.

  • 7/23/2019 Como hacer una prueba de bondad de ajuste.pdf

    3/4

    Ahora procedemos a hacer el test de bondad de ajuste.

    Usaremos una hoja de Excel y nos apoyaremos en Wolfram Alpha y en una Tabla de Valores de la

    Distribucin Chi-Cuadrado.

    Por razones de no haber terminado la edicin de este documento en una sola sesin, los valores que

    aparecen en la tabla de datos anterior no son los mismos que los tabulados a continuacin, sin embargo,

    los principios son los mismos, y queda como un ejercicio para el lector realizar los pasos descritos a

    continuacin con el conjunto de datos mostrados anteriormente.

    Primero encontraremos el valor tabulado de Chi-Cuadrado, para ello definimos los grados de libertad de

    la prueba (g.l.) y el nivel de significancia ().

    Los grados de libertad se calculan as: Nmero de clases de frecuencias Nmero de parmetros - 1.

    En nuestro caso se manejan 7 clases, y se conoce que de la distribucin a usar solo se tiene un parmetro

    que es lambda (). As, los g.l. = 7 - 1 - 1 = 5.

    Si fuera otra distribucin diferente a la Exponencial, hay que examinar cuntos parmetros tiene y as

    cambiar dicho valor en la resta.

    El nivel de significancia los hemos establecido que sea o bien el 90% o bien el 95%. A continuacin damos

    los dos valores seleccionados de la tabla Chi-Cuadrado a los grados de libertad de 5:

    Para 90% 2= 9.24 y para el 95% 2= 11.07 Estos son los valores tabulados, contra los cuales vamos

    a contrastar el Chi-Cuadrado Calculado.

    Ahora procederemos a encontrar el Chi-Cuadrado calculado:

    Conocemos que la funcin de densidad de probabilidades Exponencial viene dada por:

    (){ > 00 .

    Adems se conoce que () 1 de all se deduce que 1()

    De los datos anteriores se encuentra que el promedio de los 100 datos es 0.97757297 (aunque fueron

    generados suponiendo un=1) de aqu que el valor de lambda de los datos de la muestra generada resulta

    ser =1.0229.

    Cuando se hizo la distribucin de clases se encontr que el Rango de los datos era 5.8680 (diferencia entre

    el mayor menos el menor). De donde se obtuvo que el ancho de clase para tener siete clases era de 0.8383

    Obtenindose la distribucin de frecuencias que se muestra ms adelante.

    El test Chi-Cuadrado viene dado por: 2 ( )

    7=1

    Vamos de 1 hasta 7 porque solo hay siete clases en cuestin. La frecuencia observada se obtiene del

    conteo de cuantos datos caen en cada clase.

  • 7/23/2019 Como hacer una prueba de bondad de ajuste.pdf

    4/4

    La frecuencia esperada se calcula usando la frmula de la funcin de densidad de probabilidades, y

    calculando para cada intervalo de clase (entre el lmite inferior y el lmite superior de cada clase) la

    probabilidad de cada intervalo y luego se multiplica dicho dato por el nmero total de datos de la muestra

    (100 en nuestro caso). Luego se hace la operacin indicada anteriormente en la frmula del test para

    obtener el2. A continuacin se muestran los resultados.

    Lmite

    inferior

    Lmite

    superior

    Frecuencia

    observada Probabilidad

    Frecuencia

    esperada

    Chi-

    Cuadrado

    0.0035 0.8417 60.00 0.573677 57.3677 0.12078231

    0.8417 1.6800 20.00 0.24341 24.341 0.77417859

    1.68 2.5183 12.00 0.10326 10.326 0.27138059

    2.5183 3.3566 4.00 0.0438052 4.38052 0.0330544

    3.3566 4.1949 2.00 0.0185831 1.85831 0.01080339

    4.1949 5.0332 0.00 0.00788339 0.788339 0.788339

    5.0332 5.868 1.00 0.00333547 0.333547 1.331625233.33016352

    La columna de probabilidad se obtuvo usando Wolfram Alpha, calculando:

    integral of 1.0229*e^(-1.0229*x) dx from 0.0035 to 0.8417

    Y as sucesivamente para cada par de Lmite inferior a Lmite superior.

    Una vez obtenida cada probabilidad se multiplica por 100 y as se obtiene la frecuencia esperada para

    cada sub-intervalo de clase. (Es por 100 debido a que son 100 datos).

    Luego verifique que en la columna Chi-Cuadrado se ha efectuado en cada fila la operacin descrita en lafrmula. As al sumar los siete valore se obtiene el Chi-Cuadrado Calculado = 3.33016352.

    Que resulta ser menor que cualquiera de los valores tanto para el nivel de significancia del 90% 2=

    9.24 como para el del 95% 2= 11.07

    Por lo que no se puede rechazar la hiptesis de que los datos siguen la Distribucin Exponencial. (Y se

    asume dicha distribucin para los datos).

    Conclusin:

    Con un nivel de significancia del 10% y cinco grados de libertad, se puede afirmar que los datos siguen

    una distribucin Exponencial, con parmetro =1.0229