¿por que es importante el concepto?´ JC Quiroz · 2012. 3. 14. · 5 sdreport_number sigmasq 6...

Preview:

Citation preview

El modelo estadıstico¿por que es importante el concepto?

JC Quiroz

Departamento de Evaluacion de RecursosInstituto de Fomento Pesquero

Marzo, 2012

El modelo estadıstico

La estrategia de ADMB

Que es lo comun!!!

Muchos ambientes estadısticos (R, SAS, Matlab, Gauss, ...) contienenintrınsecamente numerosos modelos.

> lm(x ˜ y)function (formula, data, subset, weights, na.action,method = "qr", model = TRUE, x = FALSE, y = FALSE,

contrasts = NULL, offset, ...)

Contrariamente ADMB NO!!!, lo que es una ventaja, ya que muchosmodelos en biologıa cuantitativa se clasifican como non-standardmodel ... y por tanto, necesitan ser construidos

Por otro lado, gran parte de modelos en pesquerıas sonmulti-parametricos y presentan una reducida oportunidad de serestandarizados

El modelo estadıstico

La estrategia de ADMB

Lo que no entendemos muchas veces es ...

... que la simple regresion lineal, con la pendiente y el intercepto, esel modelo del proceso!!!

La estrategia de ADMB se centra en el modelo estadıstico y laestimacion de sus parametros

El modelo estadıstico

Modelo estadistico y la verosimilitud

Considere el siguiente modelo:

yi = α + βxi + εı, εi ∼ N (0, σ2)

El modelo tiene tres parametros: θ = (α, β, σ) .Encontrar el valor de los parametros, tal que, yi = yi + εıPor asumir supuestos de como se distribuye ε, se obtiene:

yi ∼ N (α + βxi, σ2)

De esta forma, el modelo asigna una medida de probabilidad alas observaciones:

L =n

∏i=1

1√2πσ

exp{− 1

2σ2 (yi − (α + βxi))2}

Esta medida es llamada verosimilitud

El modelo estadıstico

log-verosimilitud negativa

Es preferible utilizar `(y|θ) = − log(L(y|θ)), de esta forma:

`(y|θ) =n2

log(2πσ2) +1

2σ2

n

∑i=1

(yi + (α + βxi))2

La funcion de verosimilitud L expresa la probabilidad deocurrencia de nuestras observaciones para un conjunto deparametros θ = (α, β, σ), tal que una estimacion adecuada de losparametros es la eleccion de valores que maximizan laverosimilitud de las observaciones, o equivalentementeminimizan el negativo de logaritmo de la verosimilitud `.Esta vıa de estimacion de parametros es llamada maximaverosimilitudLa estructura de ADMB posibilita la implementacion de unamplio rango de modelos

El modelo estadıstico

Veamos un ejemplo

Un modelo estandar de ADMB debe contener 2 archivos ascii.

El primero es el archivo de datos, que contiene informacionobservada o parametros fijos. Es posible incluir comentarios (#) parafacilitar el orden y dimension de la informacion.

lineal.dat

# number of observations10# observed Y values1.4 4.7 5.1 8.3 9.0 14.5 14.0 13.4 19.2 18# observed x values-1 0 1 2 3 4 5 6 7 8

Sigan este ejemplo construyendo los archivos ascii

El modelo estadıstico

Veamos un ejemplo

El segundo, es una plantilla que incorpora los elementos (secciones,reportes, etc.) de ADMB. Esta plantilla por defecto tiene extension tpl y loscomentarios al codigo se declaran como (//).

lineal.tpl

DATA_SECTION// un comentarioinit_int Ninit_vector Y(1,N)init_vector x(1,N)

PARAMETER_SECTIONinit_number ainit_number binit_number logSigmasdreport_number sigmasqobjective_function_value nll

PROCEDURE_SECTIONsigmasq = exp(2.0*logSigma);nll = N/2.0*log(2.0*M_PI*sigmasq)

+ 1.0/(2.0*sigmasq)*sum(square(Y-(a+b*x)));

El modelo estadıstico

Explorando line-by-line

La primera lınea (Lınea 1) declara la seccion de datos. Por defectolos datos son llamados desde un archivo con el mismo nombre quela plantilla ADMB.

1 DATA_SECTION2 init_int N3 init_vector Y(1,N)4 init_vector x(1,N)

- Lınea 2: lee un entero y lo asigna a N=10- Lınea 3: lee N numeros y los asigna al vector Y- Lınea 4: lee N numeros y los asigna al vector x

El modelo estadıstico

Explorando line-by-line

1 PARAMETER_SECTION2 init_number a3 init_number b4 init_number logSigma5 sdreport_number sigmasq6 objective_function_value nll

- Lınea 1: Declara la seccion de parametros

- Lınea 2-4: Inicializa numeros reales como parametros paraθ = (α, β, log(σ))

- Lınea 5: Declara una variable real llamada σ2, que sera reportada en lasalida

- Lınea 5: Define la funcion objetivo llamada nll

El modelo estadıstico

Explorando line-by-line

1 PROCEDURE_SECTION2 sigmasq = exp(2.0*logSigma);3 nll = N/2.0*log(2.0*M_PI*sigmasq)

+ 1.0/(2.0*sigmasq)*sum(square(Y-(a+b*x)));

- Lınea 1: Declara la seccion de procesos

- Lınea 2: Asigna el valor a σ2

- Lınea 3: Evalua la funcion de verosimilitud normal para un modelolineal

Nota: M_PI trabaja segun compilador, sustituya por 3.1516 si su compilador falla

El modelo estadıstico

Seleccionando Parametros

El modelo estadıstico

Fase Final

- En general, los modelos de ADMB deben ser compilados yentonces ejecutados.$ admb linear

- Una vez que el modelo fue ejecutado, los resultados pueden serencontrados en:$ ‘*.par’,‘*.std’,‘*.cor’

Ejercicio: Verifique que ADMB esta bien instalado en sulaptop, por tratar de ejecutar el modelo ejercicio.

El modelo estadıstico

Recommended