12
El modelo estad´ ıstico ¿por qu´ e es importante el concepto? JC Quiroz Departamento de Evaluaci´ on de Recursos Instituto de Fomento Pesquero Marzo, 2012 El modelo estad´ ıstico

¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

El modelo estadıstico¿por que es importante el concepto?

JC Quiroz

Departamento de Evaluacion de RecursosInstituto de Fomento Pesquero

Marzo, 2012

El modelo estadıstico

Page 2: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

La estrategia de ADMB

Que es lo comun!!!

Muchos ambientes estadısticos (R, SAS, Matlab, Gauss, ...) contienenintrınsecamente numerosos modelos.

> lm(x ˜ y)function (formula, data, subset, weights, na.action,method = "qr", model = TRUE, x = FALSE, y = FALSE,

contrasts = NULL, offset, ...)

Contrariamente ADMB NO!!!, lo que es una ventaja, ya que muchosmodelos en biologıa cuantitativa se clasifican como non-standardmodel ... y por tanto, necesitan ser construidos

Por otro lado, gran parte de modelos en pesquerıas sonmulti-parametricos y presentan una reducida oportunidad de serestandarizados

El modelo estadıstico

Page 3: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

La estrategia de ADMB

Lo que no entendemos muchas veces es ...

... que la simple regresion lineal, con la pendiente y el intercepto, esel modelo del proceso!!!

La estrategia de ADMB se centra en el modelo estadıstico y laestimacion de sus parametros

El modelo estadıstico

Page 4: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Modelo estadistico y la verosimilitud

Considere el siguiente modelo:

yi = α + βxi + εı, εi ∼ N (0, σ2)

El modelo tiene tres parametros: θ = (α, β, σ) .Encontrar el valor de los parametros, tal que, yi = yi + εıPor asumir supuestos de como se distribuye ε, se obtiene:

yi ∼ N (α + βxi, σ2)

De esta forma, el modelo asigna una medida de probabilidad alas observaciones:

L =n

∏i=1

1√2πσ

exp{− 1

2σ2 (yi − (α + βxi))2}

Esta medida es llamada verosimilitud

El modelo estadıstico

Page 5: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

log-verosimilitud negativa

Es preferible utilizar `(y|θ) = − log(L(y|θ)), de esta forma:

`(y|θ) =n2

log(2πσ2) +1

2σ2

n

∑i=1

(yi + (α + βxi))2

La funcion de verosimilitud L expresa la probabilidad deocurrencia de nuestras observaciones para un conjunto deparametros θ = (α, β, σ), tal que una estimacion adecuada de losparametros es la eleccion de valores que maximizan laverosimilitud de las observaciones, o equivalentementeminimizan el negativo de logaritmo de la verosimilitud `.Esta vıa de estimacion de parametros es llamada maximaverosimilitudLa estructura de ADMB posibilita la implementacion de unamplio rango de modelos

El modelo estadıstico

Page 6: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Veamos un ejemplo

Un modelo estandar de ADMB debe contener 2 archivos ascii.

El primero es el archivo de datos, que contiene informacionobservada o parametros fijos. Es posible incluir comentarios (#) parafacilitar el orden y dimension de la informacion.

lineal.dat

# number of observations10# observed Y values1.4 4.7 5.1 8.3 9.0 14.5 14.0 13.4 19.2 18# observed x values-1 0 1 2 3 4 5 6 7 8

Sigan este ejemplo construyendo los archivos ascii

El modelo estadıstico

Page 7: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Veamos un ejemplo

El segundo, es una plantilla que incorpora los elementos (secciones,reportes, etc.) de ADMB. Esta plantilla por defecto tiene extension tpl y loscomentarios al codigo se declaran como (//).

lineal.tpl

DATA_SECTION// un comentarioinit_int Ninit_vector Y(1,N)init_vector x(1,N)

PARAMETER_SECTIONinit_number ainit_number binit_number logSigmasdreport_number sigmasqobjective_function_value nll

PROCEDURE_SECTIONsigmasq = exp(2.0*logSigma);nll = N/2.0*log(2.0*M_PI*sigmasq)

+ 1.0/(2.0*sigmasq)*sum(square(Y-(a+b*x)));

El modelo estadıstico

Page 8: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Explorando line-by-line

La primera lınea (Lınea 1) declara la seccion de datos. Por defectolos datos son llamados desde un archivo con el mismo nombre quela plantilla ADMB.

1 DATA_SECTION2 init_int N3 init_vector Y(1,N)4 init_vector x(1,N)

- Lınea 2: lee un entero y lo asigna a N=10- Lınea 3: lee N numeros y los asigna al vector Y- Lınea 4: lee N numeros y los asigna al vector x

El modelo estadıstico

Page 9: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Explorando line-by-line

1 PARAMETER_SECTION2 init_number a3 init_number b4 init_number logSigma5 sdreport_number sigmasq6 objective_function_value nll

- Lınea 1: Declara la seccion de parametros

- Lınea 2-4: Inicializa numeros reales como parametros paraθ = (α, β, log(σ))

- Lınea 5: Declara una variable real llamada σ2, que sera reportada en lasalida

- Lınea 5: Define la funcion objetivo llamada nll

El modelo estadıstico

Page 10: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Explorando line-by-line

1 PROCEDURE_SECTION2 sigmasq = exp(2.0*logSigma);3 nll = N/2.0*log(2.0*M_PI*sigmasq)

+ 1.0/(2.0*sigmasq)*sum(square(Y-(a+b*x)));

- Lınea 1: Declara la seccion de procesos

- Lınea 2: Asigna el valor a σ2

- Lınea 3: Evalua la funcion de verosimilitud normal para un modelolineal

Nota: M_PI trabaja segun compilador, sustituya por 3.1516 si su compilador falla

El modelo estadıstico

Page 11: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Seleccionando Parametros

El modelo estadıstico

Page 12: ¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6 objective_function_value nll-L´ınea 1: Declara la secci on de par´ ´ametros-L´ınea

Fase Final

- En general, los modelos de ADMB deben ser compilados yentonces ejecutados.$ admb linear

- Una vez que el modelo fue ejecutado, los resultados pueden serencontrados en:$ ‘*.par’,‘*.std’,‘*.cor’

Ejercicio: Verifique que ADMB esta bien instalado en sulaptop, por tratar de ejecutar el modelo ejercicio.

El modelo estadıstico