60

ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario
Page 2: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario
Page 3: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

ACTAS DO SEMINARIO

DE

INICIACION A INVESTIGACION

ANO 2011

Editores:Mikel Alvarez MozosSandra Gavino FernandezAna Gomez GonzalezMarıa Jose Pereira Saez

Page 4: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

c© 2011 Seminario de Iniciacion a Investigacion.

Instituto de Matematicas da Universidade de Santiago de Compostela

Coordina:

Seminario de Iniciacion a Investigacion (SII)

[email protected]

Edita:

Instituto de Matematicas da Universidade de Santiago de Compostela

Imprime:

Imprenta Universitaria

Pavillon de Servizos, s/n

Campus Vida

15782 Santiago de Compostela

ISSN: 2171-6536

Deposito Legal: C 560-2012

Page 5: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Investir en conecementos produce sempre os melloresbeneficios.

Benjamin Franklin (1706–1790)

Os sentidos deleitanse coas cousas que tenen propor-cions correctas.

Santo Tomas de Aquino (1225–1274)

iii

Page 6: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario
Page 7: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Prefacio

Os sentidos deleitanse coas cousas que tenen proporcions correctas... sera poriso que aos matematicos nos comprace especialmente a experiencia dun problemaresolto, poner as cousas no seu sitio, medir na xusta medida, pechar os ciclos, aindaque na nosa teima botemos man de algoritmos recursivos e cando parece que che-gamos ao final, volvemos ao principio. Atrevome a dicir dende este prologo que oSeminario de Iniciacion a Investigacion (o SII) pechou un deses ciclos.

Neste tempo, os obxectivos cos que naceu o SII, tanto nas componentes cientıficacomo didactica, vıronse cumpridos cum laude, potenciando a trasmision dos novosavances no conecemento (E. Garcıa Rıo, 2010) no noso ambito. Se para todalas ver-dades existen contraexemplos (E. Vazquez Abal, 2005), o SII representa sen dubidana nosa Facultade un foro comun a todalas areas, un espazo onde os novos talentosmatematicos se someteron, e o seguen facendo, ao exame mais complicado, ao quelles fan os seus iguais. E fano sen obrigacion, con liberdade, simplemente polo pracerde buscar a verdade, con responsabilidade (I. Garcıa Jurado, 2007), querendo com-partir o seu conecemento cos demais. O SII segue a ser unha fiestra pola que entranbocanadas de aire fresco (F. Gago Couso, 2008), cada unha das contribucions cunselo persoal do seu autor (O. Lopez Pouso, 2009).

Os docentes e investigadores desta Facultade temos moito que aprender e agra-decer ao SII (J.J. Nieto Roig, 2006). Deixadenos seguir aprendendo, en especial,aos que estivemos no comezo deste primeiro ciclo do SII, aos que participamos co-mo editores e ponentes, aos que vimos como xermolaba a idea. Se alguen se senteorgulloso da vosa labor, eses somos nos. Grazas por facer de cada edicion do SII amellor.

Santiago de Compostela, 13 de marzo de 2012.

Rosa M. Crujeiras Casais

v

Page 8: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

vi

Page 9: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Indice xeral

Introducion 1

Manuel Moreira“Calculo de puntos fijos Nilceanos” 3

Bibiana Lopez Rodrıguez“Time dependent eddy current problem using realistic boundary conditions” 7

Marıa Jose Ginzo Villamayor“Indices de pobreza en Galicia” 11

Rebeca Martınez Fernandez“Simulacion numerica en modelos de remodelacion osea” 15

Manuel Oviedo de la Fuente“The R package fda.usc. Some examples for functional data analysis” 19

Esteban Calvino Louzao“Unha caracterizacion das esferas Euclıdeas” 23

Vanda Inacio“Generalized ROC curves” 27

Miguel Domınguez Vazquez“O esqueleto dun grupo de Lie” 31

Mikel Alvarez Mozos“Juegos cooperativos con estructura de niveles” 35

Marıa Jose Pereira Saez“Una funcion caracterıstica cuaternionica” 39

Paula Saavedra Nieves“Estimacion de conjuntos de nivel” 43

Eduardo Garcıa Portugues“Aplicaciones de las Funciones Copula en Estadıstica” 47

vii

Page 10: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

viii

Page 11: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Introducion

O presente volume conten os resumos das charlas que se impartiron ao longo doano 2011 no Seminario de Iniciacion a Investigacion (SII). Tal seminario, organizadopor alumnos de doutoramento, ten lugar na Facultade de Matematicas da Univer-sidade de Santiago de Compostela e encadrase dentro das actividades do Institutode Matematicas.

O SII ten a sua orixe a comezos do ano 2005, como unha iniciativa dos alumnosde Terceiro Ciclo da Facultade e como resposta as necesidades de crear un seminarioque cumprise, cando menos, os seguintes obxectivos:

1. Fomentar o intercambio de conecemento.

2. Proporcionar un lugar onde dar a conecer os campos nos que cada un centraas suas investigacions.

3. Facilitar a practica de falar en publico, mais en concreto dar charlas e afacersea escoitar e participar activamente neste tipo de eventos.

4. Proporcionar un marco onde se poidan levar a cabo as actividades necesariaspara que cada quen saiba explicar as ideas fundamentais dos seus traballosincluso a persoas non especialistas no seu campo.

Por setimo ano consecutivo o SII acadou estes obxectivos basicos e ademaisproporcionou un marco de intercambio de conecemento entre alumnos dos distintosdepartamentos da Facultade. As charlas desenvolveronse, salvo algunhas excepcions,de forma quincenal ao longo de dous perıodos: un primeiro desde marzo ata xullo,e un segundo desde outubro ata decembro.

No referente a organizacion do SII, en 2011 tivo un novo comite organizador,formado por catro estudantes de doutoramento, que se encargaron tanto da coordi-nacion do evento en si: calendario de charlas, anuncio das mesmas, reserva de aula,proporcionar o material necesario ao ponente, etc.; como da publicacion deste anua-rio, onde se recolle un resumo de cada unha das charlas impartidas. Este mesmocomite organizador encargouse da confeccion deste volume e figura nel como comiteeditorial. Ademais e importante salientar que cada un dos resumos aquı recollidospasou un proceso de revision por parte dun alumno de Terceiro Ciclo, polo xeraldun departamento distinto ao do autor, co obxectivo de que ası os resumos sexancomprensibles por aqueles que non son expertos no campo correspondente.

1

Page 12: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Os membros do comite organizador do SII deste ultimo ano queremos agradeceraos membros do comite do ano anterior os consellos que nos prestaron, o empuxepara seguir organizando este seminario e o legado que nos deixaron.

Agradecementos

Quixeramos mencionar neste apartado que a organizacion do seminario terıasido, sen dubida, moito mais difıcil de non contarmos coa colaboracion desinteresadade moita xente.

Por este motivo, desexamos dar as grazas a todos os que participaron no SIIcomo oıntes, e moi especialmente aos ponentes e aos companeiros que participaronno proceso de arbitraxe: Manuel Moreira, Bibiana Lopez, Ma Jose Ginzo, QingTang, Rebeca Martınez, Manuel Oviedo, Esteban Calvino, Vanda Inacio, MiguelDomınguez, Mikel Alvarez, Ma Jose Pereira, Paula Saavedra e Eduardo Garcıa.

Agradecemoslle de xeito moi especial a Rosa Crujeiras, secretaria do Instituto deMatematicas, a sua desinteresada colaboracion na elaboracion destas actas mediantea redaccion do prefacio.

Finalmente, queremos comentar que o comite organizador do SII vai ser renovadopara este ano 2012. Estamos convencidos de que a xente nova que asume a organi-zacion vai darlle ao SII o pulo que precisa para seguir sendo un marco formidableonde por en comun os nosos conecementos e compartir a beleza das Matematicas.Gustarıanos aproveitar a ocasion, polo tanto, para desexarlle ao novo comite moitasorte na sua tarefa de seguir levando adiante este Seminario.

Santiago de Compostela, marzo de 2012.

O Comite Editorial.

2

Page 13: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Calculo de puntos fijos Nilceanos

Manuel MoreiraDepartamento de Xeometrıa e Topoloxıa

2 de marzo de 2011

En teorıa topologica de puntos fijos uno de los teoremas mas conocidos es elTeorema de Lifschetz. El objeto de este trabajo es estudiar del conjunto de puntosfijos Φ(f) de una funcion continua f sobre un poliedro compacto y conexo X ydeterminar las condiciones geometricas y topologicas bajo las cuales existen lospuntos fijos de dicha funcion.

Definicion 1. [6] Sea f : X −→ X una funcion continua sobre el espacio poliedricoconexo y compacto X. Se define la relacion de Nielsen sobre Φ(f) del siguientemodo: dados dos puntos fijos x, y ∈ Φ(f), se dice que estan relacionados si existeun camino ω : I −→ X verificando ω(0) = x, ω(1) = y, y el camino f(ω) verificaf(ω)(0) = x, f(ω)(1) = y, y tal que, ω y f(ω) son homotopicos, es decir, existeuna homotopıa H : I × I −→ X que verifica H(t, 0) = ω(t), H(t, 1) = f(ω)(t),H(0, s) = x y H(1, s) = y.

Definicion 2. [2] El ındice de un punto fijo aislado aj de una funcion continua fse define como ind(f, aj) = deg(φ|Sn−1

ai ), donde deg es el grado de la funcion.

Definicion 3. Una clase de Nielsen se dice esencial si su ındice es diferente decero. Entonces el numero de Nielsen, N(f), de una funcion continua f : X −→ Xsobre un espacio poliedrico conexo y compacto es el numero de clases esenciales deNielsen.

Un resultado relevante en este contexto es la invariancia homotopica:

Proposicion 4. Si g es homotopica a f , entonces N(f) = N(g).

Observacion 5. La relacion anterior es una relacion de equivalencia que produceuna particion en el conjunto Φ(f). A las clases de equivalencia de esta particionlas llamaremos clases de Nielsen. El lector facilmente puede observar propiedadestopologicas relevantes como:

a) Toda clase de Nielsen es abierta en Φ(f). Esto se debe a que la relacion deNielsen es localmente constante, es decir, todo punto fijo x admite un entornoabierto V , tal que, todo punto fijo en V esta relacionado con x.

b) El numero de clases de Nielsen es finito, siendo Φ(f) cerrado y compacto.

Palabras Clave: Puntos fijos, numero de Nielsen, puntos fijos Nilceanos.

3

Page 14: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

4 SII Calculo de puntos fijos Nilceanos

Es conveniente entonces introducir herramientas eficaces en teorıa topologica depuntos fijos, como lo es el teorema de Lefschetz, en el contexto homologico y coho-mologico.

Definicion 6. Sea X un espacio topologico poliedrico y f : X −→ X una funcioncontinua. Se define el numero de Lefschetz, L(f), de f comoL(f) =

∑q(−1)qtr(f∗q : H

q(X;Q) −→ Hq(X;Q)), donde Hq(X;Q) es la coho-

mologıa racional de X.

Teorema 7. [5] Sea X un espacio topologico poliedrico y f : X −→ X una funcioncontinua. Si L(f) 6= 0, entonces toda funcion continua homotopica a f tiene almenos un punto fijo.

Ejemplo 8. Si f es constante, entonces N(f) = 1.

Ejemplo 9. Si X es simple conexo, entonces para una funcion arbitraria f , elnumero de Nielsen esta dado por:

N(f) =

1, si L(f) 6= 00, si L(f) = 0.

Definicion 10. Sea f : X −→ X una funcion continua sobre un espacio polie-drico compacto y conexo, y sea f : X −→ X un levantamiento de f . Definimos

J(f) =α ∈ Π1(X)|∃H : f ' f, H : f ' α f

, donde H es una homotopıa cıclica

y H es su levantamiento.

Proposicion 11. J(f) es un subgrupo de Π1(X).

Definicion 12. El subgrupo J(f, xo) ⊂ Π1(X, f(xo)) de trazas de las homotopıas cı-clicas se define como J(f, xo) = ξ ∈ Π1(X, f(xo))|∃H : f ' f, 〈H(xo)〉 = ξ , dondeH : I −→Map(X,X) es un camino en Map(X,X), con la topologıa compacto abier-ta, tal que H(0) = f y H(1) = f . Ademas 〈H(xo)〉 es un camino H(xo) : I −→ Xdefinido por H(xo)(t) = H(xo, t), donde H : X×I −→ X corresponde unıvocamentea H bajo la ley exponencial. Definimos entonces J(X) = J(1X , xo) ⊂ Π1(X,xo) =Π1(X).

Observacion 13. La ventaja de J(f, xo) sobre J(f) es que no envuelve el espacio derecubrimiento de una manera explıcita y, como consecuencia, es mas facil calcularnumeros de Nielsen. Ademas es independiente de la eleccion del punto base xo.

Teorema 14. [3] Si X un espacio poliedrico conexo y compacto, y f : X −→ Xuna funcion continua, tal que, J(f, xo) = Π1(X, f(xo)), entonces

i) la cardinalidad de Coker(1− f∗) iguala el numero de clases de Nielsen.

ii) si L(f) 6= 0, entonces todas las clases de Nielsen son esenciales.

iii) si L(f) = 0, entonces N(f) = 0.

Page 15: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Manuel Moreira SII 5

Teorema 15. [3] Si X un espacio poliedrico conexo y compacto, y f : X −→ Xuna funcion continua, tal que, J(1X , xo) = Π1(X,xo), entonces

i) Π1(X,xo) es un grupo abeliano.

ii) para cualquier funcion continua f sobre X, J(f, xo) = Π1(X, f(xo)) y laconclusion del teorema anterior es cierta.

La siguiente proposicion ejemplifica el uso de las herramientas matematicas ex-puestas en este trabajo con el objeto de calcular el numero de Nielsen de variedadespoliedricas compactas y conexas.

Proposicion 16. [4] Sea f : L(m, q1, ... , qn) −→ L(m, q1, ... , qn) una funcion con-tinua sobre el espacio lenticular L = L(m, q1, ... , qn) de dimension n+ 1. Entonces

N(f) =

(1− s,m), si L(f) = 1− sn+1 − km 6= 00, si L(f) = 0.

Demostracion:Para mostrar que J(1L, xo) = Π1(L, xo) consideremos el levantamiento identidad1S2n+1 como un levantamiento de la identidad 1L como se ve en el siguiente diagramaconmutativo:

S2n+1

γ

1S2n+1

// S2n+1

γ

L(m, q1, ... , qn)

f// L(m, q1, ... , qn)

donde γ : S2n+1 −→ L(m, q1, ... , qn) es la proyeccion natural.Definamos ahora la homotopıa H : S2n+1 × I −→ L(m, q1, ... , qn) definida por

la ley H(zo, ... , zj , ... , zm, t) = (zoe2πtim , z1e

2πtiq1m ··· , zje

2πtiqjm , ··· , zne

2πtiqnm ). Por lo

tanto, H : γ ' γ 1S2n+1 con lo que concluimos que J(1S2n+1 , xo) = Π1(L, xo).Para calcular el numero de clases de Nielsen asumamos que f es un levanta-

miento de f inducido por el endomorfismo f∗ : Π1(L, xo) −→ Π1(L, xo),definido por la ley f∗(γ) = γs con 0 ≤ s ≤ m. Del hecho de que los gruposΠ1(L, xo) = Zm y H1(L,Q) = Zm son cıclicos de orden m se deduce que θ(γ) el gene-rador de H1(L,Q). Entonces f1∗ : H1(L,Q) −→ H1(L,Q) es una multiplicacion pors, es decir, f1∗(θ) = sθ. Ademas (1− f1∗)(θ) = (1− s)θ y (1− f1∗)(pθ) = (1− s)pθ,donde p ∈ Zm. De la teorıa de congruencia de los numeros enteros sabemos quela ecuacion (1 − s)p ≡ 0mod(m) tiene exactamente (1 − s,m) soluciones. Portanto, la cardinalidad del grupo (1 − f1∗)(H1(L,Q)) esta dado por

|(1 − f1∗)(H1(L,Q))| =m

(1− s,m). Entonces el numero de clases de Nielsen es

(1− s,m).Finalmente, solo resta calcular el valor del numero de Lefschetz de f . Teniendo

en cuenta que L(f) = 1− deg(f), deg(f) = sn+1 + km, para k entero y f∗(γ) = γs,para 0 ≤ s ≤ m, se tiene que L(f) = 1− sn+1 − km y por lo tanto, el resultado delos teoremas anteriores. 2

Page 16: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

6 SII Calculo de puntos fijos Nilceanos

Teorema 17. [1] Sea T k un toro de dimension k y f : T k −→ T k una funcioncontinua. Entonces N(f) = |L(f)|.

Demostracion:La cohomologıa racional H∗(T k;Q) =

⊕ki=1H

i(T k;Q) es un algebra exterior ge-nerada por la base x1, x2, ... , xk, donde xi ∈ H i(T k;Q). La funcion continua finduce un homomorfismo de algebras f∗ : H∗(T k;Q) −→ H∗(T k;Q).

Sea f∗i : H i(T k;Q) −→ H i(T k;Q) la restriccion de f∗. Se tiene entoncesel sistema de ecuaciones f∗(xi) = ai1x1 + ··· + aikxk, i ∈ 1, ... , k. SeaM(f∗1) la matriz con entradas aij , i, j ∈ 1, ... , k asociada al homomorfismof∗1 : H1(T k;Q) −→ H1(T k;Q). El numero de Lefschetz L(f) viene dado por:

L(f) = Tr(f∗o)− Tr(f∗1) + ···+ (−1)kTr(f∗k)

= 1− (a11 + ···+ akk) + ···+ (−1)ka11 ··· akk = det(I −M(f∗1)).

Entonces si L(f) = 0 entonces N(f) = 0 ya que J(T k) = Π(T k). EntoncesN(f) = Coker | 1 − f∗ |, donde f∗ : Π1(T k) −→ Π1(T k) esta inducido por f .Ahora se sabe que Π1(T k) = Zk, por lo que se puede considerar el homomorfismo1 − f∗ : Zk −→ Zk y, del hecho de que T k es un toro de dimension k, se puedeconcluir que el grupo Π1(T k) esta generado por los elementos duales x′1, ··· , x′kde x1, ··· , xk. Ahora, si representamos el homomorfismo 1 − f∗ por una matrizentera 1 − F , entonces existe una matriz diagonal D = P (I − F )P

−1, donde P es

la matriz unimodular. Se tiene entonces que det(D) = det(I − F )) y, por lo tanto,el orden del cokernel de 1 − f∗ es |d1 ··· dk| = det(D) = det(I − F ). Pero comodet(I −M(f∗1)) = det(I − F ), de la dualidad, se tiene que L(f) = N(f) como sequerıa probar. 2

Bibliografıa

[1] R. Brooks, R. Brown, J. Park, D. Taylor, Nielsen numbers of maps of tori,Proc. Amer. Math. Soc. 52 (1975), 398–400.

[2] A. Dold, Lectures on algebraic topology, Springer-Verlag, Berlın, 1995.

[3] B. Jiang, Estimation of the Nielsen numbers, Chinese Math–Acta 5 (1964),330–339.

[4] T. Kiang, The theory of fixed point classes, Springer-Verlag, Berlin; SciencePress, Beijing, 1989.

[5] S. Lefschetz, Algebraic Topology, American Mathematical Society, ColloquiumPublications Series, Vol. 27, New York, 1980.

[6] J. Nielsen, Uber die Minimalzahl der Fixpunkte bei Abbildugstypen der Ringfla-chen, Math. Ann. 82 (1921), 83–93.

Page 17: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Time dependent eddy current problem using realisticboundary conditions

Bibiana Lopez RodrıguezDepartamento de Ingenierıa Matematica, Universidad de Concepcion, Chile

9 de marzo de 2011

The aim of this work is to analyze a numerical method to solve time dependenteddy current problems with input current intensities as data, formulated in termsof the magnetic field in a three dimensional bounded domain including conductorsand dielectrics (for details, see [1]).

Statement of the problem

We star introducing the transient eddy current problem

curlH = J , ∂t(µH) + curlE = 0, div(µH) = 0, J = σE (1)

in [0, T ]×R3, where E(t,x) is the electric field, H(t,x) is the magnetic field, J(t,x)the current density, µ the magnetic permeability and σ the electric conductivity.

We are interested in solving these equations in a simply connected three di-mensional bounded domain Ω, which consists of two parts, ΩC and ΩD, occupiedby conductors and dielectrics, respectively. The domain Ω is assumed to have aLipschitz-continuous connected boundary ∂Ω. We denote by ΓC , ΓD and ΓI the opensurfaces such that ΓC := ∂ΩC∩ ∂Ω is the outer boundary of the conductors domain,ΓD := ∂ΩD ∩ ∂Ω that of the dielectrics domain and ΓI := ∂ΩC ∩ ∂ΩD the interfacebetween both domains.

We assume that the connected components of the conducting domain are of twotypes: “inductors” which go through the boundary of Ω, and “workpieces” which ha-ve their closure included in Ω. We denote Ω1

C, ... ,ΩN

Cthe former and ΩN+1

C, ... ,ΩM

C

the latter. Moreover, we assume that the outer boundary of each inductor, ∂ΩnC∩∂Ω

(n = 1, ... , N), has two disjoint connected components, both being the closure ofopen surfaces: the current entrance Γn

J, where the inductor is connected to a tran-

sient electric current source, and the current exit ΓnE

. We denote ΓJ := Γ1J∪ ··· ∪ ΓN

J

and ΓE := Γ1E∪ ··· ∪ ΓN

E. Furthermore, we assume that Γn

J∩ Γm

J= ∅, Γn

E∩ Γm

E= ∅,

1 ≤ m,n ≤ N , m 6= n, and ΓJ∩ ΓE = ∅.We consider that µ and σ are time-independent and that there exist constants

µ, µ, σ and σ such that 0 < µ ≤ µ(x) ≤ µ, a.e. x ∈ Ω; 0 < σ ≤ σ(x) ≤ σ, a.e.x ∈ ΩC and σ ≡ 0 in ΩD.

Palabras Clave: Eddy current problems, time-dependent electromagnetic problems, inputcurrent intensities, finite elements.

7

Page 18: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

8 SII Time dependent eddy current problem using realistic boundary conditions

We have to complete the model with an initial condition, H(0) = H0, andsuitable boundary conditions. For the latter, we consider the following ones∫

ΓnJ

curlH(t) · n = In(t), n = 1, ... , N, t ∈ [0, T ], (2)

E × n = 0 on [0, T ]× ΓC , µH · n = 0 on [0, T ]× ∂Ω, (3)

where the only data are the current intensities In through each surface ΓnJ

.

Variational formulation

Our first goal is to give a variational formulation of the transient eddy currentproblem (1)–(3) in terms of the magnetic field. To do this, let

X : = G ∈ H(curl; Ω) : curlG = 0 in ΩD,

V : =G ∈ X : 〈curlG · n, 1〉Γn

J= 0, n = 1, ... , N

.

We denote by HV the closure of V in L2(Ω)3 and by V ′ the dual space of Vwith respect to the pivot space HV with measure µ(x) dx (which is topologicallyequivalent to L2(Ω)3 with the standard Lebesgue measure). Hence, for F ∈HV wehave

〈F ,G〉V ′×V =

∫ΩµF ·G ∀G ∈ V .

We will also use the closure of X in L2(Ω)3, which we denote by HX , and the dualspace X ′ of X with respect to the pivot space HX with measure µ(x) dx. We havethe following characterization HX =

G ∈ L2(Ω)3 : curlG = 0 in ΩD

.

Problem 1. Find H ∈ L2(0, T ;X ) ∩H1(0, T ;HX ) such that

〈curlH(t) · n, 1〉ΓnJ

= In(t), n = 1, ... , N, (4)∫Ωµ∂tH(t) ·G+ a(H(t),G) = 0 ∀G ∈ V , (5)

H(0) = H0, (6)

where the bilinear form a is defined over X ×X by

a(K,G) :=

∫Ω

C

1

σcurlK · curlG.

This is a continuous bilinear form and it satisfies the following Garding’s inequality:for each λ > 0 there exists α > 0 such that a(G,G) + λ‖G‖2L2(Ω)3 ≥ α‖G‖

2H(curl;Ω)

for all G ∈ X . For the data of this problem we assume that In ∈ H2(0, T ),n = 1, ... , N , and

H0 ∈ X and 〈curlH0 · n, 1〉ΓnJ

= In(0), n = 1, ... , N. (7)

Page 19: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Bibiana Lopez Rodrıguez SII 9

Existence and uniqueness

In order to show that Problem 1 has a unique solution, our first step is to buildH ∈ H2(0, T ;X ) satisfying (4). With this aim, we will use the unique solutionswn ∈ H1(Ωn

C), n = 1, ... , N , of the following problems:

−∆wn = 0 in ΩnC,

∂wn∂n

=

1

area(ΓnJ

)on Γn

J,

0 on ∂ΩnC∩ ΓI ,

wn = 0 on ΓnE.

Let Qn ∈ L2(Ω)3 be defined by Qn = ∇wn in ΩnC

and Qn = 0 elsewhere. Sincediv(∇wn) = 0 in Ωn

Cand ∇wn · nC = 0 on ∂Ωn

C∩ ΓI , we have that Qn ∈ H(div; Ω)

and divQn = 0 in Ω. Then, since ∂Ω is connected, there exists a vector poten-

tial Hn ∈ H(curl; Ω) such that curl Hn = Qn, which satisfies div Hn = 0 and

Hn · n = 0 on ∂Ω.Therefore, we define H(t) :=

∑Nn=1 In(t)Hn. Notice that, H ∈ H2(0, T ;X ) with

‖H‖H2(0,T ;X ) ≤ CN∑n=1

‖In‖H2(0,T ), and 〈curl H(t) · n, 1〉ΓnJ

= 〈In(t)Qn · n, 1〉ΓnJ

=

In(t)

∫ΓnJ

∂wn∂n

= In(t), n = 1, ... , N , so that H satisfies (4).

We propose to find a solution to Problem 1 of the form H = H + H. Then, Hhas to be a solution to the following problem:

Problem 2. Find H ∈ L2(0, T ;V) ∩H1(0, T ;V ′) such that

〈∂tH(t),G〉V ′×V + a(H(t),G) = 〈f(t),G〉V ′×V ∀G ∈ V ,

H(0) = H0 − H(0),

where f : [0, T ] → V ′ is defined by 〈f(t),G〉V ′×V := −∫

Ω µ∂tH(t) · G −a(H(t),G), for all G ∈ V .

By applying Lions Theorem combined with an exponential shift (since a is not

elliptic but satisfies a Garding’s inequality) Problem 2 has a unique solution H.Moreover, from the regularity of H0 and f , we have the following result.

Lemma 1. The solution to Problem 2 satisfies H ∈ L∞(0, T ;V) and

∂tH ∈ L2(0, T ;HV).

Now, we are in a position to prove that Problem 1 is well-posed.

Theorem 1. Let In ∈ H2(0, T ), n = 1, ... , N , and H0 satisfying (7). Then, Pro-blem 1 has a unique solution H. Furthermore, H ∈ L∞(0, T ;X ) and there exists aconstant C > 0, independent of In and H0, such that

‖H‖2L∞(0,T ;X ) + ‖∂tH‖2L2(0,T ;HX ) ≤ C

‖H0‖2H(curl;Ω) +

N∑n=1

‖In‖2H2(0,T )

.

Page 20: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

10 SII Time dependent eddy current problem using realistic boundary conditions

Full discretization

We assume that Ω, ΩC, and ΩD are Lipschitz polyhedra and consider regulartetrahedral meshes Th of Ω, such that each element K ∈ Th is contained either inΩC or in ΩD (h stands as usual for the corresponding mesh-size). Let

X h := Gh ∈ Nh(Ω) : curlGh = 0 in ΩD ⊂ X ,

Vh :=

Gh ∈ X h :

∫ΓnJ

curlGh · n = 0, n = 1, ... , N

⊂ V ,

where Nh(Ω) denotes the lowest-order Nedelec finite element space.

For r ∈(

12 , 1], let X r :=

G ∈ X : G|Ω

C∈ Hr(curl; ΩC) and G|Ω

D∈ Hr(ΩD)3

.

If G ∈ X r, then its Nedelec interpolant IhG ∈ Nh(Ω) is well defined. We assumethat the solution to Problem 1 satisfies H ∈ H1(0, T ;X r), which in particular im-plies that the initial condition H0 ∈ X r.

We consider a uniform partition of [0, T ], tk := k∆t, k = 0, ... ,M , with timestep ∆t := T

M .A fully discrete approximation of Problem 1 is defined as follows:

Problem 3. Find Hmh ∈ X h, m = 1, ... ,M , such that∫

ΓnJ

curlHmh · n = In(tm), n = 1, ... , N,

∫ΩµHm

h −Hm−1h

∆t·Gh + a(Hm

h ,Gh) = 0 ∀Gh ∈ Vh,

H0h = IhH0.

Now, we are in position to write the main result of this work which provideserror estimates for the physical quantities of interest, the magnetic field H and thecurrent density J = curlH.

Theorem 2. Let H be the solution to Problem 1 and Hkh, k = 1, ... ,M , that to

Problem 3. If H ∈ H1(0, T ;X r)∩H2(0, T ; L2(Ω)3), with r ∈(

12 , 1], then there exists

a constant C > 0, independent of h and ∆t, such that

max1≤k≤M

‖H(tk)−Hkh‖H(curl;Ω)+∆t

M∑k=1

∥∥∥∥∥∂tH(tk)−Hk

h −Hk−1h

∆t

∥∥∥∥∥L2(Ω)3

≤ C(∆t+hr).

Bibliografıa

[1] A. Bermudez, B. Lopez-Rodrıguez, R. Rodrıguez, P. Salgado, Numerical solu-tion of transient eddy current problems with input current intensities as boun-dary data, IMA Journal of Numerical Analysis, preprint.

Page 21: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Indices de pobreza en Galicia

Marıa Jose Ginzo VillamayorDepartamento de Estadıstica e Investigacion Operativa

23 de marzo de 2011

En este estudio se analiza el perfil de la pobreza de la poblacion gallega. Se hanutilizado los microdatos de la “Encuesta de Condiciones de Vida”(ECV) del Insti-tuto Gallego de Estadıstica (IGE), ano 2006. La ECV es una encuesta dirigida alos hogares gallegos cuyo objetivo es obtener informacion sobre sus caracterısticassocioeconomicas. Se estiman ındices de la familia Foster, Greer y Thorbecke,(vease en Foster, Greer and Thorbecke (1984)). Para analizar la pobreza, se utilizola inferencia estadıstica para estimar los niveles de pobreza de cada provincia y deGalicia en su conjunto. Concretamente, se determinaron los intervalos de confianza(IC) para distintos indicadores usando inferencia clasica basada en distribucionesasintoticas y metodologıa Bootstrap. Se obtiene un mapa de la distribucion provin-cial de la pobreza en Galicia y compara la precision de las tecnicas.

Preliminares

Para medir la pobreza se han tenido en cuenta los ingresos equivalentes de laspersonas. Para comparar ingresos hay que usar las economıas de escalas que seproducen dentro del hogar, es decir, ver como se distribuyen los recursos entre losdistintos miembros. Aparecen las escalas de equivalencia que tratan de llevar a cabouna normalizacion que permita el analisis comparativo de hogares con distintascomposiciones. El ingreso equivalente corrige el efecto del numero de personas enel volumen de ingresos del hogar, haciendo comparables los ingresos de hogares condistinto numero de miembros. Se calculan las unidades de consumo (UC) del hogarempleando la escala de equivalencia de la OCDE modificada, [1 + 0,5 ∗ (a− 1) +0,3 ∗ (b)], donde a es el numero de adultos (≥ 14 anos) y b el numero de ninos(< 14 anos) del hogar. Notar que debido a la forma de los microdatos, a se hatomado > 15 y b ≤ 14 anos. Se define ingreso equivalente del hogar como elingreso medio mensual del hogar dividido por las UC. Como ingreso equivalentede cada persona se toma el equivalente del hogar al cual pertenecen. Para medir lapobreza se puede hacer desde varios puntos de vista, uno serıa usando los ingresosy otro los gastos. La decision dependera de la fuente de datos utilizada, aquı elingreso. En el caso de las lıneas de pobreza relativas, se suele tomar una medida de

Palabras Clave: Bootstrap percentil, escala de equivalencia, ingreso equivalente, OCDE mo-dificada, tasa de riesgo de pobreza, umbral de riesgo de pobreza, Foster, Greer y Thorbecke.

11

Page 22: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

12 SII Indices de pobreza en Galicia

posicion central de los ingresos o gastos equivalentes. Se define el umbral de riesgode pobreza que se corresponde con el 60 %-50 %, (se han realizado ambos analisis)de la mediana de los ingresos equivalentes de todas las personas. (Eurostat usa el60 %). La tasa de riesgo de pobreza, es el porcentaje de personas con un ingresoequivalente inferior al umbral del riesgo de pobreza. Se entendera por hogar pobreaquel en el que viven personas pobres. Y una persona se considera pobre atendiendoa un umbral del riesgo de pobreza (fijado).

Metodologıa

Se ha empleado la familia de ındices de Foster, Greer y Thorbecke para evaluarlas distintas dimensiones de la pobreza: incidencia, intensidad y desigualdad.Se han seleccionado por la necesidad de abarcar todas las dimensiones de la pobrezay sus propiedades. Una de las principales es que son aditivamente descomponibles, loque permite determinar la aportacion de cada provincia al ındice general, ası comofacilitar la determinacion asintotica de su distribucion en la aplicacion de inferenciaestadıstica. Se definen:

FGTα(y, z) = 1n

∑qi=1

[ z−yiz

]α−1, α > 0,

donde segun el valor de α (parametro de aversion a la desigualdad) se obtienendistintos ındices. A mayores valores de α mas importancia relativa se le da a losdesniveles de pobreza relativa mayores. Si α = 1, se tiene la proporcion de pobres.Cuando α = 2 el ındice es igual al producto de la proporcion de pobres por eldesnivel de pobreza. Por otra parte, Atkinson (1987) ofrece las condiciones bajolas cuales todos los miembros de la familia FGTα dan la misma ordenacion de lasdistribuciones de renta.

1. Inferencia Clasica. Se han usado las distribuciones asintoticas de los esti-madores de las medidas de pobreza para el analisis inferencial, (Bishop, J.A., Chow,K.V. y Zheng, B. (1995) y Rongve (1997)). Sea G una medida de pobreza, G el esti-mador de esta medida para una muestra Yn = y1, y2, ..., yn de ingresos equivalentes.Por el Teorema Central del Lımite:

√n(G−G) −→ N(0, σ2(G)).

Se determinan las distribuciones asintoticas para cualquier ındice de la familiaFGTα. Se define G como: G =

∫ zα g(z, y)f(y)dy donde z es el umbral de pobreza,

f(y) funcion de densidad de los ingresos, g(z, y) = ( z−yz )α−1 funcion de la variableY y del umbral. Mediante distribuciones asintoticas y analisis inferencial se obtieneuna expresion para la varianza y para los IC de los ındices:

V ar(g) = FGT2

2(α−1)+1 − FGT2

α I =

[FGTα ∓

√FGT2(α−1)+1−FGT 2

α

1,96√n

].

2. Metodologıa Bootstrap. El metodo Bootstrap (Efron y Tibshirani 1994)es un metodo de remuestreo desde los propios datos, a partir del cual se puedenobtener medidas de precision sobre las estimaciones estadısticas realizadas, o ICpara los estadısticos objeto de estudio. En este estudio de simulacion, para cadamuestra Bootstrap se obtienen los ındices de pobreza para α ∈ [1, 3], para Galicia

Page 23: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Marıa Jose Ginzo Villamayor SII 13

y provincias. El estadıstico de interes sera la media de cada ındice. La estimaciondel estadıstico Bootstrap se realiza en modo no parametrico, ya que no se esta-blece ningun supuesto sobre la distribucion de los datos. Para la comparacion dedichas estimaciones con la inferencia clasica, se analizan IC mediante los metodospercentil, percentil-t y simetrizado. Dada una muestra Yn = y1, y2, ..., yn de ingresosequivalentes de F desconocida, el objetivo es construir un IC de nivel (1− α) paraG = G(F ) a partir de un estimador G = G(Y ).

Metodo percentil. I =[G− n−

12 y1−α

2, G− n−

12 yα

2

].

Metodo percentil-t. I =[G− ˆV ar(g)n−

12 y1−α

2, G− ˆV ar(g)n−

12 yα

2

].

Metodo simetrizado. I =[G− ˆV ar(g)n−

12 y1−α, G+ ˆV ar(g)n−

12 y1−α

].

Resultados de simulacion y conclusiones

El tamano de muestra es de 6337 hogares (17619 personas). El umbral es el60 % y 50 % de la mediana de ingresos equivalentes para personas. Se calcularon losındices para Galicia y provincias, seguidamente se comparan los resultados al aplicarla metodologıa clasica y la Bootstrap y los IC para cada ındice. Para determinarel perfil de la pobreza en Galicia se estudia el valor de los ındices en las distintasprovincias. El ındice FGT1 indica la proporcion de pobres, ası el 13.85 % (para el60 %) o el 7.24 % (para el 50 %) de las personas estan por debajo del umbral depobreza. Su distribucion a lo largo del territorio gallego no es homogenea.

Umbral al 60%

Ingreso mediano equivalente:929.64...

Umbral:557.78...

Nº pobres:2441

% pobres:13.85%

% de personas por debajo del umbral de pobreza al 60%.

13.20%

13.70%

18.10%

12.95%

Umbral:557.7...

El ındice FGT2, que ademas de la incidencia de la pobreza, tiene en cuenta laintensidad de la misma, arroja resultados similares. Al considerar FGT3, que tieneen cuenta, ademas de la intensidad y la incidencia, la desigualdad entre los pobres,nos encontramos con una ordenacion similar a los ındices anteriores. La inferenciaclasica para estos ındices, cuando se dispone de muestras pequenas, puede presentarproblemas a la hora de asumir la convergencia del estadıstico a la distribucion nor-mal. La utilizacion de Bootstrap supone una ventaja al no establecer supuestos apriori sobre la funcion de distribucion. Se comparan los resultados obtenidos con lainferencia clasica y con Bootstrap (realizandose 1000 replicas de las muestras). Losresultados tras aplicar Bootstrap son muy similares entre Galicia y las provinciaspara la incidencia de pobreza. En el caso de la brecha y severidad de pobreza losresultados son similares en cuanto al orden pero su valor no es tan proximo con en

Page 24: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

14 SII Indices de pobreza en Galicia

el caso del FGT1. Se calcularon los IC con ambas metodologıas, con el proposito dedeterminar cual de los metodos los proporciona de menor amplitud para un mismonivel de confianza. Se han representado las funciones Kernel para los ındices gene-rados por las muestras Bootstrap, para determinar en que medida las distribucionesde los ındices se aproximan a la campana de Gauss. Se observa que las distribucionesno presentan normalidad debido a la asimetrıa y/o apuntamiento, lo que implica eluso del Bootstrap para la construccion de IC, en vez de los derivados de la meto-dologıa clasica basados en la convergencia a distribuciones normales. Respecto a laamplitud de los IC, con el umbral al 60 %, se observa que no hay una reduccion conBootstrap, lo que implicarıa una mejora en la precision de las estimaciones; paraalgun indicador observamos una reduccion en la amplitud del IC con Bootstrap enel caso de Galicia. Con el metodo no parametrico nunca se obtienen resultados fueradel rango de posibles valores del indicador. Las distribuciones empıricas generadaspor el remuestreo representan de forma mas adecuada el comportamiento de los da-tos originales. Para Galicia y provincias el IC clasico es el de menor longitud para laincidencia y el de mayor se obtiene con el simetrizado. En el caso del percentil-t seobtienen tambien IC amplios comparados con el clasico o el percentil. Para las pro-vincias el IC de menor longitud para la brecha es el clasico mientras que en Galiciaes el percentil. Para la severidad en el caso de Galicia el IC de menor longitud es elpercentil. Seguido del clasico, que es ademas para las provincias el que ofrece el ICmas pequeno. En todos los casos el de mayor longitud es el simetrizado. Resultadosanalogos se obtienen con el umbral al 50 %. Concluyendo: aunque la metodologıaBootstrap no presenta IC menos amplios de manera general, sı que ofrece resultadosmas adecuados que la inferencia clasica basada en distribuciones asintoticas. Los ICcalculados con Bootstrap, debido a que se basan en las distribuciones observadas,permite adaptarlos a las asimetrıas y curtosis de las distribuciones de los ındices,por tanto, se puede decir no ofrece IC fuera del rango de los valores posibles de losındices, como es el caso de los derivados de la inferencia clasica.

Bibliografıa

[1] A. B. Atkinson, On the Measurement of Poverty, Econometrica 55(4) (1987),749–764.

[2] J. A. Bishop, K. V. Chow, B. Zheng, Statistical inference and decomposablepoverty measures, Bulletin of Economic Research 47(4) (1995), 329–340.

[3] B. Efron, R. Tibshirani, An introduction to the Bootstrap, Chapman & Hall,1994.

[4] J. Foster, J. Greer, E. Thorbecke, A class of decomposable poverty measures,Econometrica 52(3) (1984), 761–766.

[5] I. Rongve, Statistical inference for poverty indices with fixed poverty lines, Ap-plied Economics 29 (1997), 387–392.

Page 25: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Simulacion numerica en modelos de remodelacion osea

Rebeca Martınez FernandezDepartamento de Matematica Aplicada

27 de abril de 2011

El hueso es un organo rıgido que forma el esqueleto de los vertebrados. Cumplefunciones tan esenciales como proteger los organos vitales del cuerpo humano oaportar la estructura necesaria al sistema muscular. Los huesos son livianos aunquemuy resistentes y duros. Existen dos clases de tejido oseo: el cortical y el esponjoso.Los dos tejidos tienen la misma estructura y composicion pero el cortical es masdenso. Este tejido es el que recubre los huesos, proporcionandoles un aspecto solido ycontinuo. En el interior del organo encontramos el hueso esponjoso o trabecular. Estetejido se caracteriza por tener una densidad muy baja, es una estructura esponjosaen cuyos huecos se encuentra la medula osea y pequenos vasos sanguıneos.

El fluido en el cual se encuentra embolsado el hueso esponjoso esta en contactocon el plasma sanguıneo, donde se encuentran las celulas oseas, que son las encar-gadas de regular las reacciones quımicas que provocan la adicion o perdida de masadel hueso esponjoso. Dependiendo de la funcion que realicen, las celulas pueden serclasificadas en cuatro tipos: osteoblastos, osteoclastos, celulas de borde y osteoci-tos. Estas celulas son las responsables de realizar el proceso de remodelado oseo. Esun proceso lento que ocurre durante toda la vida del ser humano, aunque con masrapidez en la infancia. En la reabsorcion, los osteoclastos erosionan la superficie delhueso trabecular creando pequenas cavidades. Despues, los osteoblastos reparan lasuperficie, generando hueso nuevo, y una capa de celulas de borde cubren la nuevasuperficie. Los osteocitos son las celulas oseas mas abundantes en el esqueleto adul-to, mas del 90 %. Estas celulas son osteoblastos que se han quedado atrapados en elhueso trabecular que han secretado y tienen la capacidad de secretar o reabsorber eltejido oseo que las rodea. En el primer ano de vida de un ser humano, casi el 100 %del esqueleto es renovado por este proceso. En los adultos, cada ano se renuevaalrededor del 10 % del hueso.

En el siglo XIX, el cirujano aleman Julius Wolff establecio que no solo existe unarelacion entre la estructura del hueso y las cargas a las que es sometido, sino queademas el hueso vivo se adapta a las alteraciones en estas cargas cambiando su es-tructura interna. Esta afirmacion es conocida como la ley de Wolff. La investigacionexperimental ha confirmado a lo largo de los anos la veracidad de esta suposicion,mostrando que incluso en la edad adulta el hueso puede adaptar su estructura enrespuesta a las cargas a las que esta siendo sometido.

Palabras Clave: Remodelacion osea, elementos finitos, simulacion numerica.

15

Page 26: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

16 SII Simulacion numerica en modelos de remodelacion osea

Un modelo de remodelacion osea en elasticidad adaptativa

Cuando se intenta estudiar desde el punto de vista mecanico el comportamientode un hueso, es imposible modelar la estructura trabecular. Es por ello que se definenpropiedades continuas que nos evitan trabajar con las propiedades reales del hueso.Esto supone considerar el hueso como un material continuo. Sin embargo, cuandolo que nos interesa conocer es el comportamiento del hueso en una zona, y no enun punto concreto, esta hipotesis no supone ninguna restriccion. Habitualmente, losmodelos de remodelacion osea, como los estudiados en este trabajo, incorporan unafuncion que mide la porosidad del hueso.

El primer modelo matematico para un problema de remodelacion osea fue plan-teado en 1976 por Cowin y Hegedus (vease [2]), estableciendo la siguiente ley cons-titutiva para el tensor de tensiones:

σ = (ξ0 + e)C(e)ε(u),

donde ε denota el tensor de deformacion y C(e) caracteriza las propiedades meca-nicas del hueso. La funcion e mide el cambio en la porosidad de la matriz osea.Esta funcion se define como e = ξ − ξ0, donde ξ es la fraccion volumica de materialpresente en la matriz osea y ξ0 es la fraccion volumica de referencia. Para controlarel proceso de remodelado oseo, Cowin y Hegedus obtuvieron la ecuacion diferencialordinaria:

e = a(e) +A(e) : ε(u),

donde a(e) y A(e) son los coeficientes de remodelacion. Esta ecuacion determinala tasa de cambio en la porosidad del hueso como una funcion dependiente de lafraccion volumica y la deformacion.

Figura 1: Deformacion en el instante inicial y final, y funcion de remodelacion oseaen el instante final.

En la Figura 1 se puede observar la respuesta del hueso cuando una fuerzade compresion linealmente creciente actua en la frontera superior. La deformacionproducida por la fuerza en el instante final, es menor que la producida en el instante

Page 27: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Rebeca Martınez Fernandez SII 17

inicial, puesto que el hueso ha aumnetado su densidad para minimizar los efectosde la carga.

Remodelacion osea inducida por un estımulo local

En 1992 Weinans, Huiskes y Grootenboer (vease [1]) propusieron un modelo ba-sado en el principio de que la remodelacion osea es inducida por una senal mecanicalocal que activa los osteoblastos y osteoclastos; es decir, el hueso tiene sensores quedetectan el estimulo mecanico y, dependiendo de su magnitud, causan adaptacioneslocales en el hueso. Ademas, Weinans et al. consideran el hueso como un materialelastico, donde el coeficiente de Poisson es constante y el modulo de Young depen-de de la densidad aparente ρ, mediante la relacion E = Mργ , donde M y γ sonconstantes positivas que caracterizan las propiedades mecanicas del hueso.

En el modelo propuesto por Cowin y Hegedus, el cambio en la densidad osea seregıa por las desviaciones producidas en el tensor de deformacion. Sin embargo, lasideas de Wolff implicaban que la remodelacion no solo se producıa en respuesta ala deformacion y, por ello, en este modelo se considera como estımulo mecanico ladensidad de energıa de deformacion:

U(σ(u), ε(u)) =1

2σ(u) : ε(u).

La variacion en la densidad aparente del hueso viene determinada por la siguienteecuacion diferencial ordinaria de primer orden, no lineal:

ρ = B

(U(σ(u), ε(u))

ρ− Sr

), ρa ≤ ρ ≤ ρb,

donde B y Sr son constantes que regulan el proceso de remodelacion osea. Ademas,se impone que los valores de la densidad aparente no sobrepasen el valor ρb, corres-pondiente a la densidad del hueso cortical, ni sean menores que la densidad mınimapermitida, ρa, correspondiente al hueso reabsorbido. Esta ecuacion implica que enlos puntos en los cuales la densidad alcanza el valor maximo o mınimo, el procesode remodelacion se detiene. En los otros puntos, el sistema esta en equilibrio cuandoel estımulo alcanza el valor de referencia Sr.

La formulacion variacional de este modelo consiste en una ecuacion variacionalpara el calculo del campo de desplazamientos, y una inecuacion variacional para elcalculo de la densidad osea. Esta inecuacion se obtiene haciendo uso de las propie-dades de la subdiferencial de la funcion indicatriz del intervalo [ρa, ρb], lo que nospermite garantizar que la solucion que buscamos pertenece al intervalo. Una vezobtenida la formulacion variacional del problema, aplicando el esquema de Euler yel metodo de los elementos finitos obtenemos un problema discretizado y las esti-maciones del error para el campo de desplazamientos y la densidad osea. Ademas,bajo ciertas hipotesis adicionales de regularidad, obtenemos la convergencia linealdel algoritmo propuesto.

Page 28: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

18 SII Simulacion numerica en modelos de remodelacion osea

Para ilustrar el comportamiento de este modelo, hemos considerado la parteproximal del femur. Suponemos que la frontera inferior esta fijada (el punto izquierdoesta fijo, mientras que el resto de la frontera tiene restringidos sus desplazamientossolo en la direccion vertical). Ademas, se consideran tres casos de carga que actuande forma secuencial, cada uno de ellos consiste en unas cargas distribuidas aplicadassobre la cabeza femoral y a su vez la fuerza de reaccion distribuida que aparece enel abductor. Una clara limitacion del modelo 2D es la falta de conexion entre las doscapas corticales de la diafasis. En este caso, hemos utilizado la misma solucion queproponen otros autores: considerar una placa que une ambas partes. En la Figura2 podemos ver la densidad aparente en el instante final. El proceso de remodeladooseo se detiene cuando no ocurren cambios en la densidad. La configuracion finalpredice una razonable distribucion de las densidades con un canal intramedular, eltriangulo de Ward y la distribucion habitual de la densidad en la cabeza del femur.

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

Figura 2: Densidad osea despues de 310 dıas.

Bibliografıa

[1] H. Weinans, R. Huiskes, H.J. Grootenboer, The behaviour of adaptive bone-remodeling simulation models, J. Biomech. 25(12) (1992) 1425–1441.

[2] S.C. Cowin, D.H. Hegedus, Bone remodeling I: theory of adaptive elasticity, J.Elasticity 6 (3) (1976) 313–326.

Page 29: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

The R package fda.usc. Some examples for functionaldata analysis

Manuel Oviedo de la FuenteDepartamento de Estadıstica e Investigacion Operativa

21 de maio de 2011

This document presents the R package fda.usc which implements some utilitiesfor treatment of functional data analysis. This package carries out exploratory anddescriptive analysis of functional data analyzing its most important features suchas depth measurements or functional outliers detection, among others. The packa-ge also includes functions to compute functional regression models, that helps toexplain and model the relationship between a scalar response and functional (or non-functional) explanatory data. Methods for supervised or unsupervised classificationof a set of functional data regarding a feature of the data are also included.

Introduction

In recent years statistical computing applied to various fields has led to impor-tant technological change that replace some of the paradigms in which it is basedclassical statistics, for example, the paradigm that in a provided dataset the numberof data is greater than the number of variables. In many areas have begun workingwith large databases, which increasingly often these observations of a random va-riable taken over a continuous interval (or in increasingly larger discretizations ofthe continuous interval). For example, in fields such as spectroscopy, the measure-ment result is a curve that, at least, has been evaluated in a hundred of points,in economics, we could talk about curves intra-day stock quotes or in engineering,we could talk about electricity demand curves. Undoubtedly, package fda is a basicreference to work in R programming environment with functional data. But all thetechniques included are restricted to the space of L2 functions. The other miles-tone is the book of [1], where functional data are processed from a nonparametricpoint of view that establishes frameworks for treatment. In this case, the approachto consider normed or semi-normed functional spaces in some cases may be moreappropriate to describe the reality. Other functional data packages that can be use-ful for representing functional data as ftsa for functional time series analysis andrefund that allows computing functional penalized regression. The objective of thepackage fda.usc is to provide a framework in functional data analysis broader thanthe previous one. Therefore, we propose an integration of the work on nonparame-tric functional methods implemented by [1] and implemented by the group of the

Palabras Clave: Functional data, smoothing, regression, classification, R package.

19

Page 30: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

20 SII The R package fda.usc.

University of Santiago de Compostela (USC), complementing and extending someof the functions of package fda.

Functional Data Definition: The new R class fdata

First of all, we must define in a formal way what is a functional variable. Becauseof its generality and ease of understanding we will follow next definitions.

Definition 1. A random variable X is called a functional variable if it takesvalues in a functional space E -complete normed (or semi-normed) space-.

Definition 2. A functional dataset X1, ... ,Xn is the observation of n functio-nal variables X1, ... ,Xn identically distributed as X .

The first obstacle that we will always have when analyzing functional data isto find adequate representation for the data. Typically, the functional data setX1, ... ,Xn is evaluated on a number of discretization points t1, ... , tm that canbe observed in a non-equispaced way. The fda.usc package avoids the basis trans-formation performed by the fda package and define an object called fdata as alist of the following components: data: a set of n curves discretized in m points,argvals: locations of the discretization points, rangeval: range of discretizationpoints and names: optional list with an overall title and a title for the x and y axis.

An important choice to do when analyzing functional data is the space where thedata must be considered. For example, in left panel of Figure 1, the spectrometriccurves are plotted showing with different colors the fat content. This representa-tion which implicitly assumes a L2 space, is not related with the information offat content. So, if we are interested in the relationship between the spectrometriccurve and the fat content, probably another choice of functional space would bemore advisable as for example, that shown in right panel of Figure 1 with the firstderivative of the spectrometric curves. In this case, the distance between curves are

given by the semi-norm of the derivative(d(f, g) =

√∫T (f ′(t)− g′(t))2dt

)instead

of the norm as in the case of the L2 space.

After definition, the second step in a functional data analysis maybe the datarepresentation. In the package are implemented four procedures for this purpose. (1)Basis representation min.basis() or fdata2fd() represent the functional data in aL2 basis. (2) Nonparametric representation min.np() is based on the smoothingkernel method by k nearest neighbor, Nadaraya-Watson or Local linear regressionmethod. (3) Functional principal components basis fdata2pc(), explain a functionaldata through a combination of orthonormal variables and (4) the functional partialleast square basis fdata2pls(), that taking into account the correlation betweenscalar variable observed additionally and functional data.

Descriptive analysis of Functional Data

Any statistical study should begin with an exploratory part. In fda.usc, theusual tools for summarize functional data are included as the functional mean:

Page 31: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Manuel Oviedo de la Fuente SII 21

850 900 950 1000 1050

2.02.5

3.03.5

4.04.5

5.05.5

Wavelength (mm)

Abso

rbanc

es

850 900 950 1000 1050

−0.02

−0.01

0.00

0.01

0.02

0.03

0.04

0.05

Wavelength (mm)

d(Abs

orban

ces,1

)

Figure 1: Spectrometric curves (left) with Fat<20 % (red lines) and with Fat≥20 %(blue lines). Corresponding spectrometic curves after 1st differencing (right).

X(t) = N−1∑N

i=1Xi(t), by func.mean() function. Although, most often are othermeasures used to summarize a set of functional data such as depth measures. Thedepth is a concept emerged in the literature of robustness which measures how deepis a datum respect to a population and that can be used to measure of centraltendency or the detection of outliers, see figure 2.

850 900 950 1000 1050

2.02.5

3.03.5

4.04.5

5.05.5

Wavelength (mm)

Abso

rbanc

es

FM Mean trim25%MedianOutiler

850 900 950 1000 1050

−0.02

−0.01

0.00

0.01

0.02

0.03

0.04

0.05

Wavelength (mm)

d(Abs

orban

ces,1

)

FM Mean trim25%MedianOutiler

Figure 2: Descriptive statistics for Tecator dataset based on depth (in grayscale),15 % trimmed mean curve (green line), median (yellow line) and outliers (red lines).

Also implemented in fda.usc package

The fda.usc package has implemented other utilities for statistical computingwithin the field of Functional Data Analysis. Some useful additions included are:

Functional linear model (FLR) with basis representation. This model assumesthat the relationship between the scalar response Y and the functional cova-riate X(t) has a linear structure. Thus, the functional linear model under theparametric approach is given by the expression: yi =

∫T Xi(t)β(t)dt+εi, where

Page 32: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

22 SII The R package fda.usc.

εi are random errors. fregre.basis() function models the relationship betwe-en X(t) and Y by basis representation (using fd basis) of the X(t) and theunknown functional parameter β(t). Similarly, fregre.pc() uses a basis of fun-ctional principal components to represent the functional data X(t) and β(t).In fregre.pls() function the basic idea is to construct a set of PLS compo-nents in the linear space spanned by X(t), taking into account the correlationbetween X(t) and Y .

fregre.lm() is an extension of the previous linear models allowing includemore than one functional variable and other non-functional variables andfregre.glm() which also allows various types of the response variable.

An alternative of functional linear models is the nonparametric functionalregression studied by [1] fregre.np(). In this case, the regression model iswritten as: yi = r(Xi(t)) + εi, where the unknown smooth real function ris estimated using kernel estimation. This model is extended allowing inclu-de non-functional variables by the semi-functional partial linear regression:fregre.plm().

Among other utilities, two methods for discriminating functional data are im-plemented: supervised classification using k-Nearest Neighbor methodclassif.knn() and non parametric kernel method classif.kernel().

Conclusion

The package fda.usc presented in this document is the result of the integrationof our code with procedures from other authors, the package fda or the functionsfrom STAPH group. One major advantage of the package procedures is that avoidsthe need of basis representation of functional data and all procedures are adaptedto this new class. Finally, the fda.usc package tries to be an integrated frameworkfor FDA and is continually being developed.

Bibliografıa

[1] F. Ferraty, P. Vieu, Nonparametric functional data analysis: Theory and prac-tice, Springer Series in Statistics, Springer, Berlin, 2006.

[2] R Development Core Team, R: A language and environment for statistical com-puting, R Foundation for Statistical Computing, Vienna, 2009; http://www.R-project.org.

Page 33: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Unha caracterizacion das esferas Euclıdeas

Esteban Calvino LouzaoDepartamento de Xeometrıa e Topoloxıa

26 de maio de 2011

En Analise, buscase a existencia dunha solucion non trivial para unha ecuaciondiferencial nun certo dominio dado. En Xeometrıa, pola contra, e de especial inte-rese obter a existencia de variedades dominio para unha ecuacion diferencial ondeesta posua solucion non trivial. Por suposto, este problema e inabordable en todaa sua xeneralidade, polo que este estudo limıtase a certas ecuacions diferenciaisinteresantes, ben polo seu contido xeometrico, ou ben polo seu contido fısico. Noscentramonos nunha ecuacion ben conecida polo seu contido xeometrico, a chamadaecuacion de Obata.

Preliminares

Co fin de que este resumo sexa o mais autocontido posible mostraremos certosconceptos basicos de Xeometrıa de Riemann que nos seran de grande utilidade.Denotaremos por (M, g) unha variedade de Riemann de dimension n e TpM o seuespazo tanxente no punto p ∈ M . O tensor de curvatura, R, nunha variedade deRiemann (M, g) ven dado por

R(X,Y )Z = ∇[X,Y ]Z − [∇X ,∇Y ]Z,

onde ∇ e a conexion de Levi-Civita de (M, g) e X,Y e Z son campos de vectores.O tensor de curvatura codifica unha cantidade inxente de informacion da varieda-de. Por iso, e de grande axuda contar con obxetos mais sinxelos que nos permitenrecuperar gran parte da informacion que nos proporciona o tensor de curvatura. En-tre eles destaca, tanto por representativo como por utilizado, a curvatura seccional.Defınese a curvatura seccional sobre un plano π como

K(π) =R(X,Y, Y,X)

g(X,X)g(Y, Y )− g(X,Y )2

donde π = 〈X,Y 〉. Fixemonos que aında que na definicion da curvatura seccionalutilizamos unha base concreta do plano π, esta so depende do plano e non da baseelexida. A curvatura seccional pode interpretarse como a aplicacion

K : 2-planos en TpM −→ R.

Palabras Clave: Variedade de Riemann, ecuacion de Obata, esfera

23

Page 34: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

24 SII The R package fda.usc.

Son de grande importancia en xeometrıa aquelas variedades cunha curvatura moisinxela. Entre estas destacan aquelas con curvatura seccional constante, e dicir,aquelas nas que a aplicacion antes definida e constante. Existen tres modelos devariedades de curvatura seccional constante: Rn, as esferas Euclıdeas Sn e os espa-cios hiperbolicos Hn segundo a curvatura seccional, K, sexa constantemente nula,positiva ou negativa respectivamente (ver [2] para mais informacion sobre estes as-pectos).

Definiremos agora un operador diferencial que xogara un papel relevante noestudo da ecuacion de Obata. Consideremos unha funcion real f : M −→ R on-de (M, g) e unha variedade de Riemann, definimos enton o Hessiano de f comaHf = ∇∇f . Dito operador en coordenadas escrıbese como

(Hf )ij =∂2f

∂xi∂xj−∑k

Γkij∂f

∂xk

onde Γkij son os sımbolos de Christoffel da conexion de Levi-Civita ∇ de (M, g).Fixemonos que no espazo euclıdeo Rn a definicion dada do Hessiano coincide coausual posto que en Rn todolos sımbolos de Christoffel se anulan.

A Ecuacion de Obata

No que segue estudiaremos algunhas ecuacions diferenciais, ben conecidas, de-finidas en certas clases de variedades de Riemann, as cales determinan as esferaseuclıdeas como as unicas variedades dominio en aqueles casos de existencia de solu-cions non triviais. Estas ecuacions presentan a seguinte forma

Hf + kfg = 0, k ∈ R (1)

onde f son funcions definidas sobre variedades de Riemann (M, g) conexas e com-pletas. Co afan de caracterizar os espazos de curvatura seccional constante, Obataobtivo o seguinte resultado de caracterizacion de esferas euclıdeas de curvatura sec-cional k > 0 ou equivalentemente de radio 1/

√k.

Teorema 1. [3] Sexa (M, g) unha variedade de Riemann de dimension n, completa econexa. Enton, unha condicion necesaria e suficiente para que (M, g) sexa isometricaa unha esfera euclıdea Sn(k) de curvatura seccional k > 0, e a existencia dunhafuncion non constante f : M −→ R verificando

Hf + kfg = 0 (k > 0) (2)

en (M, g).

O Teorema 1 dinos que a Ecuacion (1), con k > 0, sobre as variedades de Rie-mann (M, g), conexas e completas admite solucion non trivial se, e so se, a suavariedade dominio e a esfera euclıdea Sn(k) de curvatura seccional k. E por is-to, que dita ecuacion diferencial proporcionanos unha caracterizacion analıtica de

Page 35: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Esteban Calvino Louzao SII 25

Sn(k) entre as variedades de Riemann, (M, g), de dimension n, conexas e completas.

Unha cuestion natural que xorde a vista deste teorema e se se poden obterresultados similares cando suponemos k ≤ 0, sendo a resposta afirmativa. Kanai[1] demostrou que unha condicion necesaria e suficiente para que unha variedadede Riemann (M, g) de dimension n, conexa e completa sexa isometrica o productoR×N , con N unha variedade de Riemann completa, e a existencia dunha funcionnon constante f : M −→ R verificando a ecuacion Hf = 0 en (M, g). Obviamenteesto correspondese co caso no que k = 0 na Ecuacion (1).

Ademais, Kanai en [1] demostrou que unha condicion necesaria e suficiente paraque unha variedade de Riemann (M, g) de dimension n, conexa e completa sexa iso-metrica a unha componente conexa do espacio hiperbolico real Hn(k) de curvaturaseccional constante k < 0 e a existencia dunha funcion non constante f : M −→ Rcon un punto crıtico, verificando a Ecuacion (1) para k < 0 en (M, g). Aında quea simple vista a parte que involucra o espazo hiperbolico real parece ser unha ca-racterizacion dunha das suas componentes conexa mediante ecuacion diferenciais, oresultado non e do estilo dado por Obata, posto que depende da existencia dunha so-lucion particular da Ecuacion (1), e dicir, a existencia dunha solucion non constantecon un punto crıtico.

Bibliografıa

[1] M. Kanai, On a differential equation characterizing a Riemannian structure ofa manifold, Tokyo J. Math. 6 (1) (1983), 143–151.

[2] J.M. Lee, Riemannian Manifolds: An Introduction to Curvature, GraduateTexts in Mathematics 176, Springer-Verlag, New-York, 1997.

[3] M. Obata, Certain conditions for a Riemannian manifold to be isometric witha sphere, J. Math. Soc. Japan 14 (3) (1962), 333–340.

Page 36: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

26

Page 37: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Generalized ROC curves

Vanda InacioDepartment of Statistics and Operations Research,

Universidade de Lisboa, Portugal

14 de xullo de 2011

Introduction

A medical diagnostic test is a procedure that classifies subjects as nondiseased(or healthy, D = 0) or diseased (D = 1) on the basis of some information about thatsubjects. For example, the glucose level in blood is commonly used as a diagnostictest for diabetes. In most of the cases, the information concerning each patientis of a continuous type (weight, glucose level, blood pressure, etc). In this case,the diagnostic procedure has to be made by comparing the test result, y, with athreshold or cut-off value c. Assuming that high values of y are more indicative ofdisease, we will classify all subjects whose test result is above c as diseased, and theones whose test result is below c as healthy. Hence, each threshold value c chosenwill give rise to a true positive rate, or sensitivity, TPR(c) = P(y > c|D = 1) (theprobability that a diseased subject has a positive test), and a false positive rate,or 1−specificity, FPR(c) = P(y > c|D = 0) (the probability that a healthy subjecthas a positive test). In such a situation, the receiver operating characteristic (ROC)curve is defined as the set of all TPR−FPR pairs that can be obtained by varyingthe threshold c

(TPR(c),FPR(c)), c ∈ (−∞,+∞),

or, equivalently, as the function of the form

ROC(t) = SD1(S−1D0

(t)), t ∈ (0, 1),

where SD1(y) = P(y > c|D = 1) and SD0 = P(y > c|D = 0) denote the survivalfunctions of y in the diseased and healthy populations, respectively. Related to theROC curve, several indexes can be used as summaries of the diagnostic accuracy.The area under the ROC curve, AUC =

∫ 10 ROC(t)dt is the most widely used. The

AUC takes values between 0,5 (useless test that classifies disease state no betterthan chance) and 1 (perfect test).

Until now, all considerations made were based on the assumption that highvalues in the test are more likely among diseased subjects. The extension to theopposite situation, that is, when lower values in the test are indicative of disease, istrivial. However, in some diagnostic situations, both low and high values of the test

Palabras Clave: Area under the curve; Bayesian inference; Neural activity; ROC curve

27

Page 38: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

28 SII Generalized ROC curves

are synonyms of disease. Hereafter, we will call these tests as bilateral tests.The ROC curve, as formulated, is not suitable to deal with bilateral tests. Mis-

leading results may be obtained if one blindly applies the ’traditional’ ROC curvefor this kind of tests. [1] present a hypothetical example where a perfect bilateraltest produces a AUC of only 0,5. This fact motivated the authors to develop twonew summary measures of the ROC curve, arguing that in such situation the useof the AUC may be misleading. However, the problem is not directly related to theAUC but to the definition of the ROC curve. An appropriate, generalized, definitionof the ROC curve is needed for these tests.

Methodology

Let (y01, ... , y0n0) and (y11, ... , y1n1) be two independent random samples drawnfrom the healthy and diseased populations, respectively. To appropriately deal withbilateral tests, the diagnosis needs to be made on the basis of two thresholds. Givenan ordered pair of thresholds (c1, c2) ∈ R2, the true and false positive rates are nowdefined as

TPR(c1, c2) = P(y1i 6 c1 ∨ y1i > c2), (i = 1, ... , n1),

FPR(c1, c2) = P(y0j 6 c1 ∨ y0j > c2), (j = 1, ... , n0).

Assuming that the healthy data was sampled from a normal population with meanµ0 and standard deviation σ0, and that the diseased data was sampled from amixture of normal distributions with means µ1 and µ2, standard deviations σ1 andσ2, and mixing parameter ω, we can write

FPF(c1, c2) = Φ

(c1 − µ0

σ0

)+ Φ

(µ0 − c2σ0

),

TPF(c1, c2) = ω

(c1 − µ1

σ1

)+ Φ

(µ1 − c2σ1

)]+ (1 − ω)

(c1 − µ2

σ2

)+ Φ

(µ2 − c2σ2

)],

where Φ stands for the cumulative function of the standard normal distribution.The above parameters are unknown in practice and we will need to estimate them,in order to compute FPF(c1, c2) and TPF(c1, c2) and thus the ROC curve.

Inference will be carried out using Bayesian techniques. The main diffeencebetween a frequentist and a Bayesian is that a frequentist thinks of unknown para-meters as fixed and a Bayesian thinks of parameters as random, and thus comingfrom distributions (just like the data). A Bayesian writes down a prior distributionfor the unknown parameters, and combines it with the likelihood for the observeddata to obtain the posterior distribution. All posterior inferences then follow fromsummarizing the posterior.

The likelihood function isn0∏j=1

φ(y0j ;µ0, τ0)×n1∏j=1

(ωφ(y1j ;µ1, τ1))z1j × ((1− ω)φ(y1j ;µ2, τ2)1−z1j

,

where τi is the precision, which is equal to σ−2i and z1j is an indicator variable

taking the value one if the j -th observation comes from the first group of the mixturedistribution and zero otherwise. We assumed independent prior distribution for allparameters

Page 39: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Vanda Inacio SII 29

µi ∼ N(aµi , bµi), τi ∼ Gamma(aσi , bσi), ω ∼ Beta(δ, δ), i = 1, 2, 3.

The posterior distribution is proportional to the likelihood times the prior distri-butions. In this case, although the posterior distribution has not a closed form, thefull conditional distributions required for the Gibbs sampler are easy to obtain. AGibbs sampler is a Markov chain Monte Carlo method that samples from the fullconditional distributions when the other parameters are fixed. In the end, we willhave at hand a sample from the posterior distribution.

For future observations, the probabilities that they belong to the healthy or tothe diseased group are, respectively, given by

P(y0n+1 6 c1 ∨ y0n+1 > c2|y0) ≈1

N −m

N∑t=m+1

FPF(θ(t)0 ),

P(y1n+1 6 c1 ∨ y1n+1 > c2|y1) ≈1

N −m

N∑t=m+1

TPF(θ(t)1 ),

where θ(t)0 and θ

(t)1 are the vector parameters simulated from the posterior distri-

bution, N is the number of simulations (we discarded the first m, burn-in period).

A ’toy’ simulation

We simulated 100 observations from a N(0, 1) for the healthy group and another100 observations from 0,5N(−6, 1)+0,5N(6, 1) for the diseased group. As can be seenfrom Figure 1 (a) the simulated data corresponds to an almost perfect test. Hence,the corresponding ROC curve should lie near the upper right corner. The estimatedROC curve based on the convential definition is shown in Figure 1 (b), and we cancheck its inappropriateness when applied to bilateral tests. The corresponding AUCis 0,5. Our method produces the estimated ROC curve presented in Figure 1 (c)which is the ROC curve that may be expected from a perfect test.

−5 0 5

0.0

0.1

0.2

0.3

0.4

test result

dens

ity

(a)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPF

TP

F

(b)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPF

TPF

(c)

Figure 1: (a) Simulated densities; (b) Estimated ’traditional’ ROC curve; (c) Estimated genera-lized ROC curve.

Application

We analyze data from an electromyography (EMG) study. EMG is used to diag-nose diseases that generally may be classified in one of the following two: neuropat-

Page 40: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

30 SII Generalized ROC curves

hies and myopathies. A myopathy is a muscular disease in which the muscle fibersdo not function for some reason, resulting in muscular weakness. ”Myopathy”simplymeans muscle disease (myo - ”muscle”+ pathos - ”suffering”). On the other hand, inthe neuropathy patologies the primary defect is in the nerves. Neuropathic diseasestend to have an increase in duration of the action potential, whereas myopathicdiseases tend to have a decrease in duration of such potential. The duration of theaction potential is thus taken as the diagnostic test.

Our sample consist of 52 diseased individuals and 46 nondiseased/healthy ones.From the diseased subjects, 15 of them are known to have a myopathic disease,while the other 37 have a neuropathic one.

From figure 2 (a) we can see that the normality assumption holds. The densitieshave a considerable overlap and so we do not expect a great performance of thetest to distinguish between the healthy and diseased ones. The estimated roc curve,using our method, is shown in Figure 2 (b) and the estimated AUC is about 0,6.

0 5 10 15

0.0

0.1

0.2

0.3

0.4

0.5

0.6

density.default(x = yd)

N = 52 Bandwidth = 1.174

Density

(a)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

FPF

TPF

(b)

Figure 2: (a) Densities of the duration of the potention in the healthy (grey line) and diseased(solid line) groups; (b) Estimated generalized ROC curve.

Conclusions

ROC curves are a widely accepted measure of accuracy of diagnostic tests thatyields continuous or ordinal test results, but in their original formulation are notsuitable for bilateral tests. However, in practice, clinicians often face situations wherea bilateral diagnostic is needed. Due to the need of a suitable tool for such diagnostictets, we have generalized the ROC curve to the bilateral context. Our methodologyhas showed to be efficient.

Bibliografıa

[1] W.C. Lee and C.K. Hsiao, Alternative summary indices for the receiver opera-ting characteristic curve, Epidemiology 7 (1996), 605–611.

Page 41: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

O esqueleto dun grupo de Lie

Miguel Domınguez VazquezDepartamento de Xeometrıa e Topoloxıa

19 de outubro de 2011

Desde os seus inicios ala a mediados do s. XIX, os grupos de Lie tenense conver-tido nunha disciplina matematica de grande influencia dentro e fora da MatematicaPura. A idea inicial do seu descubridor, o noruego Sophus Lie, era a de estendera teorıa de Galois para ecuacions alxebricas o eido das ecuacions diferenciais, coobxectivo de que as simetrıas destas ecuacions, convenientemente formalizadas me-diante a nocion de grupo de Lie, puidesen axudar a sua resolucion. Posteriormente,matematicos de altura como Elie Cartan, Wilhelm Killing, Hermann Weyl ou Euge-ne Dynkin desenvolveron os fundamentos da fermosa teorıa abstracta de grupos deLie, mentres que, paralelamente, o campo de aplicacions desta teorıa se ampliabamais e mais: mecanica clasica e cuantica, xeometrıa de Riemann, analise numerica,relatividade, mecanica do continuo, etc.

Neste traballo presentamos unha rapida introducion a un dos multiples aspectosdos grupos de Lie: a teorıa de estrutura dos grupos compactos. O noso obxectivosera o de construır, para o caso particular do grupo SU(3), duas configuracionsxeometricas que codifican a sua informacion fundamental: o seu sistema de raıcese, a partir deste, o seu esqueleto ou diagrama de Dynkin.

A bibliografıa existente sobre grupos de Lie e enorme, polo cal aquı simplementecitamos un par de referencias. Unha introducion asequible e co enfoque dirixido oestudo de ecuacions diferenciais e [3]. Unha exposicion bastante completa sobregrupos matriciais podese atopar en [1]. Unha referencia mais avanzada e [2], ondese pode atopar unha introducion a teorıa dos sistemas de raıces (Capıtulo II).

Grupos de Lie, grupos de matrices e alxebras de Lie

Un grupo de Lie e un grupo (i.e. un conxunto cunha operacion asociativa, conelemento neutro e inversos) que e a sua vez unha variedade diferenciable (recordeseque as variedades son xeneralizacions a dimension superior das curvas e das superfi-cies), e tal que a operacion de grupo e a inversion son aplicacions diferenciables. Osprincipais exemplos de grupos de Lie son os grupos de matrices, e dicir, subgruposdo grupo GL(n,K) das matrices n × n invertibles con coeficientes no corpo K dosreais R, dos complexos C ou dos cuaternios H. No caso dos grupos de matrices, aoperacion e a multiplicacion de matrices, o elemento neutro e a matriz identidade,e a inversion e a inversion usual de matrices.

Palabras Clave: Grupo de Lie, alxebra de Lie, sistema de raıces, diagrama de Dynkin.

31

Page 42: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

32 SII O esqueleto dun grupo de Lie

Asociado a todo grupo de Lie G existe un obxecto que conten a sua informacionmais relevante dun xeito mais manexable: a sua alxebra de Lie g. Esta defınese comao espazo tanxente o grupo no elemento neutro, TIG, xunto cunha certa operacioninterna anticonmutativa e bilineal denominada corchete de Lie [·, ·]. En particulartoda alxebra de Lie e un espazo vectorial. Se G ⊂ GL(n,K) e matricial, g consistenas derivadas A′(0) ∈ Mn×n(K) de todas as curvas A : t 7→ A(t) ∈ G tales queA(0) = I. Equivalentemente, tratase de todas as matrices de Mn×n(K) tales quesumadas a identidade I da un elemento de G ata orde 1. O corchete de Lie de douselementos X,Y da alxebra de Lie g dun grupo matricial e simplemente o conmutadorde ambas matrices, [X,Y ] = XY − Y X.

Por exemplo, o grupo especial unitario G = SU(n) das matrices complexas uni-tarias con determinante 1 e un subgrupo de GL(n,C). En efecto, se A,B ∈ G, pordefinicion A∗A = I e B∗B = I, co cal (AB)∗(AB) = I e (A−1)∗A−1 = (AA∗)−1 = I;e como detA = detB = 1, tamen detAB = 1 e detA−1 = 1. Calculemos a sua alxe-bra de Lie g = su(n). Sexa A : t 7→ A(t) ∈ G tal que A(0) = I. Enton A(t)∗A(t) = Ie, derivando, A′(t)∗A(t)+A(t)∗A′(t) = 0; avaliando en 0 obtemos A′(0)∗+A′(0) = 0,i.e. A′(0) e unha matriz antihermitiana. Por outra parte, como detA(t) = 1, deri-vando en 0 temos que trA′(0) = 0 (a diferencial da funcion determinante e a funciontraza). Ası deducese que

g = su(n) = X ∈Mn×n(C) : X∗ +X = 0, trX = 0 .

Observese que o corchete de Lie de duas matrices de g da unha matriz de g.Existen diversas clases de grupos de Lie. Os mais sinxelos son os abelianos.

Outros grupos xa mais ricos en estrutura son os grupos compactos. Un grupo ma-tricial G ⊂ GL(n,K) dise compacto se e pechado e acotado no espazo euclideanoMn×n(K) ≡ Kn2

. Estes grupos estan clasificados e o seu estudo basease na constru-cion do seu sistema de raıces. Na seguinte seccion faremos este estudo para o casoparticular do grupo compacto SU(3).

O grupo SU(3). Calculo do sistema de raıces e diagrama de Dynkin

Propomonos agora construır o sistema de raıces e o diagrama de Dynkin deG = SU(3). Para iso, traballaremos exclusivamente a nivel de alxebras se Lie. Polotanto, todo o que faremos encadrarase no marco da Alxebra Lineal.

Como xa vimos, a alxebra de Lie de G e o seguinte subespazo vectorial real deM3×3(C), con dimension real 8:

g = su(3) =

ia1 z12 z13

−z12 ia2 z23

−z13 −z23 ia3

: ai ∈ R, zij ∈ C, a1 + a2 + a3 = 0

.

Dado que falaremos de autoespazos e autovalores de certas aplicacions lineaisdefinidas sobre g, convira complexificar este espazo vectorial real, pois por exemplo,pode haber autovalores non reais. E doado comprobar que esta complexificacion e:

gC = g⊗ C = g + ig = X ∈M3×3(C) : trX = 0 = sl(3,C),

Page 43: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Miguel Domınguez Vazquez SII 33

que coincide coa alxebra de Lie do grupo lineal especial complexo SL(3,C) (confor-mado polas matrices con determinante un). Notese que dimC gC = dimR g = 8.

Definimos o seguinte subespazo vectorial de gC:

h =

h1 0 0

0 h2 00 0 h3

: hi ∈ C, h1 + h2 + h3 = 0

.

Comprobase facilmente que h e unha subalxebra abeliana de gC (i.e.,[X,Y ] = XY − Y X = 0 para todo X,Y ∈ h). Podese probar tamen que nonexiste unha subalxebra abeliana de gC de dimension maior ca dim h = 2. Dise entonque h e unha subalxebra abeliana maximal ou subalxebra de Cartan de gC.

Agora, para cada i, j ∈ 1, 2, 3, definimos a matriz Eij como aquela que tentodas as entradas nulas, excepto na posicion (i, j), na que ten un 1. Para cada H ∈ h,consideramos a aplicacion lineal ad(H) : gC → gC definida por ad(H)(X) = [H,X](esta aplicacion denomınase aplicacion adxunta). Se H ∈ h e a matriz diagonal conentradas h1, h2, h3, enton para cada i 6= j temos que:

ad(H)Eij = [H,Eij ] = HEij − EijH = hiEij − hjEij = αij(H)Eij ,

onde αij : h → C e o covector (ou forma lineal) definido por αij(H) = hi − hj . Asıpois, Eij e un autovector de ad(H) con autovalor αij(H). Notese que αij = −αji.Como as matrices Eij con i 6= j xeran (sobre C) un espazo complementario a h engC, deducimos que:

gC = h⊕ gα12 ⊕ gα13 ⊕ gα23 ⊕ g−α12 ⊕ g−α13 ⊕ g−α23 ,

onde g±αij e o autoespazo simultaneo para todas as aplicacions lineais ad(H) conH ∈ h correspondente o autovalor ±αij(H). Como vimos, gαij = CEij se i < je g−αij = CEji se i > j. A descomposicion anterior de gC denomınase a descom-posicion en espazos de raıces do grupo de Lie G = SU(n) (ou da alxebra de Lieg = su(n), ou da alxebra de Lie complexa gC = sl(n,C)), mentres que os covectoresou autovalores simultaneos ±αij chamanse raıces. Esta descomposicion simplifica oestudo do corchete de Lie de gC, pois verifıcase que [gα, gβ] ⊂ gα+β, para calquerapar de raıces α e β, onde asumimos que g0 = h, e gα+β = 0 se α+ β non e raız.

En gC podemos definir unha aplicacion bilineal B con valores en C median-te B(X,Y ) = trXY . Esta e a denominada forma de Killing de gC que, en xe-ral para calquera alxebra de Lie, se define como B(X,Y ) = tr [X, [Y, ·]]. Ade-mais, −B|g e un produto interior definido positivo en g = su(3). Non obstante,nos so precisaremos a restricion de B a h, que claramente ven dada medianteB(H,H ′) = h1h

′1 + h2h

′2 + h3h

′3 ∈ C, polo cal e unha forma bilineal non dexe-

nerada.Ası pois, para cada raız αij ∈ h∗ podemos definir unha matriz Hij ∈ h me-

diante a relacion: B(H,Hij) = αij(H) para todo H ∈ h. A estas matrices Hij

denomınaselles corraıces. Unha sinxela conta indica que Hij = Eii − Ejj . Ası obte-mos 6 corraıces: H12, H21, H13, H31, H23, H32, que son opostas duas a duas. Como

Page 44: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

34 SII O esqueleto dun grupo de Lie

ademais son matrices reais, podemolas ver coma 6 vectores no espazo euclideano 2-dimensional hR = h∩M3×3(R), dotado do produto escalar B|hR . Podemos debuxarenton estes 6 vectores no plano euclideano. Como B(Hij , Hkl) ∈ ±1 se Hij e Hkl

non son colineais, e B(Hij , Hij) = 2, deducimos que o angulo entre calquera dousdestes seis vectores e un multiplo de 60 graos, e tamen que os seis vectores tenen amesma lonxitude. Obtense polo tanto a configuracion xeometrica da figura de abai-xo a esquerda, conecida como sistema de raıces de tipo A2 (en xeral, An denota osistema de raıces de SU(n+ 1), e n e a dimension da subalxebra de Cartan).

H12

H13

H21

H32

H23

H31

α12 α23

Sistema de raıces de SU(3) Diagrama de Dynkin de SU(3)

A informacion contida no sistema de raıces podese concentrar aında mais. Paraiso, debemos fixar un conxunto de raıces simples, que consiste nun subconxunto deraıces tal que toda corraız se pode expresar como combinacion lineal das corraıcescorrespondentes as raıces simples, con todos os coeficientes enteiros e todos do mes-mo signo. No noso caso, comprobase que α12, α23 e un conxunto de raıces simplesxa que toda matriz Hij se pode escribir como combinacion lineal de H12, H23 concoeficientes enteiros e todos do mesmo signo. Agora asociamoslle a cada raız sim-ple un vertice (ou nodo) dun grafo, e conectamos ditos vertices mediante linas, doseguinte xeito. Se as corraıces correspondentes a dous nodos son vectores perpen-diculares, enton tales nodos non se unen mediante ningunha lina; se o angulo entreduas corraıces e de 120 graos, os nodos unense cunha soa lina; se o angulo e de 135graos, unense mediante 2 linas; e se o angulo e de 150 graos, mediante 3 linas. Po-dese demostrar que, para calquera sistema de raıces, non hai ningunha posibilidadedistinta das anteriores. Mediante este procedemento obtense o diagrama de Dynkindun grupo de Lie compacto.

No noso exemplo as corraıces simples H12 e H23 forman un angulo de 120 graos,co cal o diagrama de Dynkin de SU(3) e o que se amosa na figura de arriba a dereita.

Bibliografıa

[1] A. Baker, Matrix groups. An introduction to Lie group theory, Springer Under-graduate Mathematics Series, Springer-Verlag London, Ltd., 2002.

[2] A. W. Knapp, Lie groups beyond an introduction, Second edition. Progress inMathematics, 140, Birkhauser Boston, Inc., Boston, MA, 2002.

[3] P. J. Olver, Applications of Lie groups to differential equations, Second edition,Graduate texts in mathematics, 107, Springer-Verlag New York, Inc., 1993.

Page 45: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Juegos cooperativos con estructura de niveles

Mikel Alvarez MozosDepartamento de Estatıstica e Investigacion Operativa

2 de noviembre de 2011

La teorıa de juegos es un conjunto de herramientas matematicas para el estudiode situaciones en las que varios individuos interactuan o compiten. Por lo tanto, unjuego no es mas que una situacion de conflicto en la que hay varios agentes implica-dos. Los juegos se clasifican en dos grandes familias, por un lado tenemos los juegoscooperativos y por otro los juegos no cooperativos. Los juegos no cooperativos sonmodelos para el estudio de situaciones puramente competitivas. En consecuencia,su estudio se centra en identificar las estrategias que maximicen el beneficio indi-vidual o las estrategias que posean ciertas propiedades de estabilidad (equilibrios).En cambio, un juego cooperativo nos describe los beneficios (o costes) que puedeobtener por sı misma cada una de las posibles coaliciones de jugadores. Cuandoestos beneficios se asumen divisibles y transferibles sin perdida alguna el juego sedenomina cooperativo de utilidad transferible. En este contexto uno de los principa-les objetivos es el de proponer reglas razonables para repartir el beneficio generadoo evaluar la importancia de cada agente implicado. En este resumen trabajaremoscon juegos cooperativos de utilidad transferible, a los que llamaremos simplementejuegos. Una buena referencia introductoria a la Teorıa de Juegos es [2].

Preliminares

Formalmente, un juego es un par (N, v) donde N es un conjunto finito de ju-gadores y v : 2N = S : S ⊆ N → R es la funcion caracterıstica donde v(∅) = 0.Denotaremos por GN a la familia de juegos con conjunto de jugadores N y por G alconjunto de todos los juegos con cualquier conjunto finito de jugadores. Llamaremoscontribucion marginal de un jugador i ∈ N a una coalicion S ⊆ N \i a la cantidadv(S ∪ i) − v(S). Dado un conjunto finito N denotaremos por Π(N) al conjuntode permutaciones de N .

Un valor en G, f, es una aplicacion que asigna un vector de pagos a cada juego,es decir, f : GN → R|N |. A continuacion presentamos las definiciones explıcitas dedos de los valores en G mas estudiados en la literatura.

Definicion 1. El valor de Shapley, Sh, se define para todo (N, v) ∈ G e i ∈ N por

Shi(N, v) = 1n!

∑π∈Π(N) [v(P πi ∪ i)− v(P πi )] ,

Palabras Clave: Juegos cooperativos, Shapley, Banzhaf, niveles.

35

Page 46: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

36 SII Juegos cooperativos con estructura de niveles

donde P πi = j ∈ N : π(j) < π(i) es el conjunto de predecesores de i respecto a π.

Definicion 2. El valor de Banzhaf, Ba, se define para todo (N, v) ∈ G e i ∈ N por

Bai(N, v) = 12n−1

∑S⊆N\i [v(S ∪ i)− v(S)] .

De las expresiones de Sh y Ba se concluye que ambos valores en G son mediasde las contribuciones marginales de un jugador. En el caso de Sh, a su conjunto depredecesores considerando que todas las permutaciones son equiprobables, mientrasque para Ba, a cualquier coalicion en la que i no participa considerando que todasestas coaliciones son equiprobables. Esta serıa, a grandes rasgos, la interpretacionprobabilıstica de los valores. Pero el principal motivo por el que estos valores enG son estudiados de forma exhaustiva en la literatura son las propiedades que ve-rifican o mas aun las propiedades que los caracterizan. Decimos que un conjuntode propiedades caracteriza un concepto de solucion cuando por un lado la solucionverifica las propiedades y por otro lado no existe ninguna otra solucion que satisfagalas propiedades. La caracterizacion de soluciones a traves de propiedades es uno delos principales objetivos de la investigacion en este area.

Estructura de niveles

El modelo presentado hasta el momento asume que cualquier conjunto de juga-dores puede cooperar y formar una coalicion. En cambio, existen muchas situacionesen las que bien sea por restricciones del entorno o por las preferencias de los jugado-res no todas las coaliciones resultan factibles. En general, los modelos que consideraneste tipo de informacion adicional se los denomina juegos con cooperacion restrin-gida. En este trabajo presentaremos aquel modelo en el que la cooperacion estarestringida por una estructura de niveles. Una forma de interpretar esta situaciones mediante la idea de la formacion de grupos de presion. Supongamos que tenemosun juego y que los jugadores forman grupos de presion para mejorar sus posibili-dades cara a un posible reparto. Estos grupos corresponderıan al primer nivel, losgrupos del primer nivel, a su vez, podrıan organizarse en nuevos grupos de presionmas amplios manteniendo siempre sus estructuras de niveles inferiores. El procesopodrıa continuar hasta tener un numero finito de niveles.

Formalmente, sea P(N) el conjunto de todas las particiones de N . Una estructu-ra de niveles es un par (N,B) donde N es un conjunto finito y B = B1, ... , Bk estal que para todo r ∈ 1, ... , k, Br ∈ P(N) y para todo r ∈ 1, ... , k − 1 Br es unrefinamiento de Br+1. Dada una estructura de niveles (N,B) con B = B1, ... , Bky un jugador i ∈ N , definimos (N,B−i) como la estructura de niveles obtenida apartir de (N,B) aislando a i en todos los niveles, es decir, B−i = B−i1 , ... , B−ik donde para todo r ∈ 1, ... , k, B−ir = U ∈ Br : i /∈ U ∪ Ur \ i, i don-de i ∈ Ur ∈ Br. Un juego con estructura de niveles no es mas que una tupla(N, v,B) donde (N, v) es un juego y (N,B) una estructura de niveles. Denota-remos por GLN a la familia de juegos con estructura de niveles y conjunto dejugadores N y por GL al conjunto de todos los juegos con estructura de niveles.

Page 47: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Mikel Alvarez Mozos SII 37

Observese que dado (N, v,B) ∈ GL, de forma natural se puede definir un juegocon estructura de niveles por cada nivel de B = B1, ... , Bk, para r ∈ 1, ... , kdefinimos (Br, v

r, Br) ∈ GLBr donde Br = Br, Br+1, ... , Bk y para todo S ⊆ Br,vr(S) = v(i ∈ N : ∃U ∈ S tal que i ∈ U). Un valor en GL, f, es una aplicacionf : GLN → R|N |. Este modelo se propone en [3], donde se define y caracteriza unageneralizacion de Sh a este contexto. Para definir la generalizacion de Sh, que llama-remos valor de niveles de Shapley, vamos a definir un subconjunto de Π(N) formadopor aquellas permutaciones que“respetan” la estructura de niveles. Diremos que unapermutacion respeta una particion cuando los elementos de cada una de las unionesaparecen de forma consecutiva.

Sea (N,B) una estructura de niveles donde B = B1, ... , Bk. Definiremos losconjuntos Ω(B) = Ω1(B) ⊆ Ω2(B) ⊆ ··· ⊆ Ωk(B) ⊆ Π(N) como sigue:

Ωk(B) = σ ∈ Π(N) : ∀S ∈ Bk, ∀i, j ∈ S ∈ Bk y l ∈ N,si σ(i) < σ(l) < σ(j) entonces l ∈ S.

Y para r ∈ k − 1, ... , 1 definimos de forma recursiva

Ωr(B) = σ ∈ Ωr+1(B) : ∀S ∈ Br, ∀i, j ∈ S ∈ Br y l ∈ N,si σ(i) < σ(l) < σ(j) entonces l ∈ S.

Por lo tanto, para definir el valor de niveles de Shapley consideraremos unicamentela media de las contribuciones marginales respecto a las permutaciones de Ω(B).

Definicion 3. El valor de niveles Shapley [3], ShL, es un valor en GL definido paratodo (N, v,B) ∈ GL e i ∈ N por

ShLi (N, v) =1

|Ω(B)|!∑

σ∈Ω(B)

[v(P σi ∪ i)− v(P σi )] .

Llegados a este punto nos preguntamos como podrıamos definir una generaliza-cion de Ba para juegos con estructura de niveles. Para ello necesitamos saber comoson las coaliciones a las que dan lugar los conjuntos de predecesores de aquellas per-mutaciones de Ω(B) para ası poder tomar la media de las contribuciones marginalesa cada una de estas coaliciones. Evidentemente, estas coaliciones seran distintas pa-ra cada jugador. Sea (N,B) una estructura de niveles donde B = B1, ... , Bk, paracada jugador i ∈ N , sean i ∈ U0 = i ⊆ U1 ⊆ ··· ⊆ Uk tales que Ur ∈ Br para todar ∈ 0, ... , k. La particion inducida por B en i se define como sigue:

P (i, B) =k⋃r=0

(Br)|Ur+1\Ur ,

donde Uk+1 = N . Entonces, P (i, B) ∈ P(N \ i). Denotamos mi = |P (i, B)| yP (i, B) = T1, ... , Tmi. Por ultimo, definimos el conjunto de ındicesMi = 1, ... ,mique pueden considerarse un conjunto de representantes de las uniones de P (i, B),de forma que dado un R ⊆Mi, TR = ∪r∈RTr.

Page 48: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

38 SII Juegos cooperativos con estructura de niveles

Definicion 4. El valor de niveles Banzhaf [1], BaL, es un valor en GL definido paratodo (N, v,B) ∈ GL e i ∈ N por

BaLi (N, v,B) =∑R⊆Mi

1

2mi[v(TR ∪ i)− v(TR)] .

Diremos que un valor en GL, f generaliza un valor en G, g, si cuando considera-mos una estructura de niveles trivial, es decir, una estructura, B, cuyas particionessean bien ii∈N o bien N, f coincide con g. Es facil verificar que los valores ShL

y BaL generalizan los valores Sh y Ba. Por ultimo, vamos a presentar caracteriza-ciones paralelas de los dos valores en GL introducidos. Por paralelas entendemoscaracterizaciones a traves de propiedades comparables. Cosideremos las siguientespropiedades que un valor en GL, f, puede satisfacer:

lgp ∀(N, v,B) ∈ GL y ∀U ∈ Br ∈ B, fU (Br, vr, Br) =

∑i∈U fi(N, v,B).

slgp ∀(N, v,B) ∈ GL y ∀U = i ∈ Br ∈ B, fU (Br, vr, Br) = fi(N, v,B).

lbc ∀(N, v,B) ∈ GL con B = B0, ... , Bk y ∀i, j ∈ U ∈ B1,

fi(N, v,B)− fi(N, v,B−j) = fj(N, v,B)− fj(N, v,B

−i).

lnid ∀(N, v,B) ∈ GL con B = B0, ... , Bk y ∀i, j ∈ U ∈ B1,

fi(N, v,B) = fi(N, v,B−j).

Es facil verificar que lgp ⇒ slgp y lnid ⇒ lbc mientras que las implicacionesrecıprocas no suceden. Finalmente presentamos las dos caracterizaciones paralelasprometidas. Se han omitido tanto las interpretaciones de las propiedades como laspruebas debido al limitado espacio pero el lector interesado puede verlas en [1]. Lasdemostraciones se sustentan en resultados previos y algo de combinatoria.

Teorema 5. ShL es el unico valor en GL que generaliza Sh y satisface lgp y lbc.

Teorema 6. BaL es el unico valor en GL que generaliza Ba y satisface slgp y lnid.

Bibliografıa

[1] M. Alvarez-Mozos, O. Tejada, Parallel characterizations of a generalized Sha-pley value and a generalized Banzhaf value for cooperative games with levelsstructure of cooperation, Decision Support Systems 52 (2011), 21–27.

[2] J. Gonzalez-Dıaz, I. Garcıa-Jurado, M. G. Fiestras-Janeiro, An introductorycourse on mathematical game theory, American Mathematical Society, 2010.

[3] E. Winter, A value for cooperative games with levels structure of cooperation,International Journal of Game Theory 18 (1989), 227–240.

Page 49: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Una funcion caracterıstica cuaternionica

Marıa Jose Pereira SaezDepartamento de Xeometrıa e Topoloxıa

9 de novembro de 2011

Los cuaternios y el espacio vectorial cuaternionico

Los cuaternios de Hamilton (1843), H, forman un algebra no conmutativa sobreR, asociativa y con uno. Es un anillo de division, H = t+xi+yj+zk : t, x, y, z ∈ R,donde i2 = j2 = k2 = −1 y el producto viene dado por ij = −ji = k,jk = −kj = i, ki = −ik = j. Si q = t + xi + yj + zk ∈ H denotaremos Re(q) = t,Im(q) = xi+yj+zk las partes real e imaginaria de q respectivamente. El conjugadode q es q = t− xi− yj− zk.Definicion 1. Se dice que q, q′ ∈ H son similares si existe algun cuaternio no nulou tal que q′ = uqu−1.

Teorema 2. Dos cuaternios son similares si y solo si tienen la misma norma y lamisma parte real. En particular, todo cuaternio q es similar a su conjugado q.

En cuanto al espacio vectorial cuaternionico Hn, si queremos obtener los re-sultados habituales para matrices asociadas a una aplicacion lineal, es necesarioconsiderar Hn como un H-espacio vectorial por la derecha. El producto en Hn es〈u, v〉 = u∗v.

Forma compleja de una matriz cuaternionica. Dada M una matriz cuater-nionica puede expresarse de modo unico como M = X + jY con X,Y ∈Mn×n(C).

Definicion 3. Llamamos forma compleja de M ∈Mn×n(H) a

c(M) =

(X −YY X

)∈M2n×2n(C).

La forma compleja es muy util para trabajar con matrices cuaternionicas.

Proposicion 4. Sean M,N ∈Mn×n(H), entonces:

1. c(M +N) = c(M) + c(N);

2. c(M ·N) = c(M) · c(N); en particular, c(M) es inversible sii M es inversible;

3. c(M∗) = c(M)∗, donde M∗ = (M)T ;

4. c(M) es unitaria, hermıtica o normal sii M es unitaria, hermıtica o normalrespectivamente;

5. det c(M) ≥ 0 es un numero real no negativo.

Palabras Clave: autovalor izquierda, autovalor derecha, determinante de Study

39

Page 50: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

40 SII Una funcion caracterıstica cuaternionica

Determinante. El primero en proponer en este ambito un funcional analogo aldeterminante fue A. Cayley en 1845; propone desarrollar por la primera columnatanto la matriz inicial como los menores. En 1899 aparecio un artıculo de J.M.Pierce pero no es mas que una cuidada reelaboracion de la teorıa de Cayley. Porfin, en 1920, E. Study propone transformar una matriz cuaternionica n× n en unacompleja 2n× 2n y a esta ultima hacerle el determinante complejo.

Definicion 5. Dada M ∈Mn×n(H) se define el determinante de Study de M como

Sdet(M) := (det c(M))12 .

Se observa que no es posible generalizar a los cuaternios la nocion de deter-minante ya que, necesariamente tomara valores en R. Sin embargo, las siguientespropiedades muestran que el Sdet se comporta de modo bastante similar al deter-minante complejo; de hecho, generaliza su modulo.

Proposicion 6. 1. Sdet(MN) = Sdet(M) Sdet(N);

2. Sdet(M) > 0 si y solo si M es inversible;

3. si M y N son matrices semejantes entonces Sdet(M) = Sdet(N).

Asimismo, respeta las transformaciones de filas (por la izquierda) y columnas(por la derecha).

Teorema 7. Dada una matriz formada por cajas M,N de ordenes m y n respecti-

vamente, se verifica que Sdet

(M 0∗ N

)= Sdet(M) Sdet(N).

Corolario 8. Si T = (tij) es una matriz triangular entonces Sdet(T ) = |t11 ··· tnn|.

¿Que ocurre con los autovalores?

La dificultad a la hora de estudiar los autovalores cuaternionicos radica en que,dado q ∈ H y v ∈ Hn no nulo, las ecuaciones Av = qv y Av = vq no son equivalentes.

Autovalores por la derecha

Definicion 9. Se dice que un cuaternio q ∈ H es un autovalor por la derecha de lamatriz M ∈Mn×n(H) si existe un vector v ∈ Hn, v 6= 0, tal que Mv = vq.

Proposicion 10. Los autovalores por la derecha de una matriz M ∈Mn×n(H) sonlos cuaternios similares a los autovalores complejos de su forma compleja c(M).

Notese que para una matriz compleja del tipo c(M) =

(X −YY X

)de orden

2n×2n, cada vez que aparece un autovalor aparece tambien su conjugado, de modoque, como mucho, c(M) tendra n autovalores no conjugados. En este sentido, losautovalores por la derecha son faciles de calcular. Ademas, si M,N ∈Mn×n(H) sonmatrices semejantes, es decir, tales que N = BMB−1, entonces M y N tienen losmismos autovalores por la derecha. El problema es que, en este caso, el conjunto deautovectores asociados a un autovalor no es un subespacio vectorial.

Page 51: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Marıa Jose Pereira Saez SII 41

Autovalores por la izquierda. La teorıa de autovalores por la izquierda dematrices cuaternionicas esta muy poco desarrollada. Un resultado de R.M.W. Wood[2] garantiza su existencia pero, en general, no se sabe cuantos autovalores por laizquierda puede tener una matriz cuaternionica de orden n. L. Huang y W. Soprobaron que una matriz 2× 2 puede tener uno, dos o infinitos autovalores (perte-necientes a diferentes clases de similitud) y caracterizaron este ultimo caso [1]. Paraorden 3 W. So obtuvo polinomios cuyas raıces son los autovalores por la izquierda.

Definicion 11. Sea M una matriz cuaternionica de orden n. Se dice que λ ∈ H esun autovalor por la izquierda de M si existe un v ∈ Hn, v 6= 0, tal que Mv = λv.Denotamos por σl(M) al espectro por la izquierda de la matriz M .

El interes de esta definicion radica en que es equivalente al hecho de que lamatriz M − λI sea singular (no ası para los autovalores por la derecha).

Proposicion 12. Los autovalores por la izquierda de M ∈Mn×n(H) son las raıcesde la ecuacion Sdet(M − λI) = 0.

El conjunto de los autovectores asociados a un autovalor por la izquierda for-man un subespacio vectorial (por la derecha). Las principales dificultades para ob-tener estos autovalores son la ausencia de determinante y el hecho de que σl(M) noes invariante por semejanza, ası como la dificultad para obtener raıces de polino-mios cuaternionicos. Sin embargo, en el caso de que las matrices sean real-similaresσl(SAS

−1) = σl(A) para S ∈ Mn×n(R). De modo que podemos permutar las filasy las columnas i, j simultaneamente.

Funcion caracterıstica. No pueden extenderse de manera sencilla los metodosdel ambito conmutativo y hasta hoy no hay un modo sistematico que permita acome-ter el estudio del espectro cuaternionico por la izquierda. En el artıculo de Wood [2]el autor hace notar que “desafortunadamente, parece no haber una funcion determi-nante adecuada en el caso cuaternionico para reducir el problema de los autovaloresal teorema fundamental del algebra.” Proponemos entonces la siguiente nocion:

Definicion 13. Una aplicacion µ : H → H es una funcion caracterıstica de lamatriz M ∈ Mn×n(H) si, salvo una constante, |µ(λ)| = Sdet(M − λI) para todoλ ∈ H.

Se verifica que λ ∈ H es un autovalor por la izquierda de M si y solo si µ(λ) = 0.Como ya dijimos, σl(M) no es invariante por semejanza. Sin embargo, si P es unamatriz real inversible, Sdet(M −λI) = Sdet(PMP−1−λI). Es decir, M y PMP−1

tienen las mismas funciones caracterısticas.

Ejemplo 14. Si D = diag(q1, ... , qn) entonces µ(λ) = (q1 − λ) ··· (qn − λ) es unafuncion caracterıstica para D. Analogamente para una matriz triangular.

A partir de la condicion Sdet(A − λI) = 0, utilizando las propiedades de Sdetobtenemos las siguientes funciones caracterısticas para matrices de ordenes 2 y 3.

Page 52: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

42 SII Una funcion caracterıstica cuaternionica

Teorema 15. Toda matriz A =

(a bc d

)∈M2(H) tiene una funcion caracterıstica

polinomica µ(λ). Si b = 0 viene dada por µ(λ) = (d − λ)(a − λ). Cuando b 6= 0,µ(λ) = c− (d− λ)b−1(a− λ).

Consideremos ahora la matriz cuaternionica A =

a b cf g hp q r

∈ M3×3(H). En

general, para estas matrices obtendremos una funcion caracterıstica racional con unpunto de discontinuidad al que llamamos polo. En el caso en el que algun elementode fuera de la diagonal sea nulo (que se reduce a considerar c = 0) podemos daruna funcion caracterıstica polinomica de grado 3.

Cuando b, h = 0, la matriz es triangular ası que µ(λ) = (r− λ)(g− λ)(a− λ).

Si b = 0 pero h 6= 0 obtenemos µ(λ) =(q − (r − λ)h−1(g − λ)

)(a− λ).

Finalmente, si b 6= 0, µ(λ) = p−qb−1(a−λ)−(r−λ)h−1(f − (g − λ)b−1(a− λ)

).

Proposicion 16. Sea A una matriz de orden 3 tal que c 6= 0. Se puede definir unafuncion caracterıstica para A como

µ(λ) = (λ0 − λ)[(p− (r − λ)c−1(a− λ)

)−(

q − (r − λ)c−1b)

(λ0 − λ)−1(f − hc−1(a− λ)

)],

para todo λ 6= λ0, donde λ0 = g − hc−1b es el polo de A. En este puntoµ(λ0) =

(q − (r − λ0)c−1b

) (f − hc−1(a− λ0)

).

La ventaja de esta funcion caracterısitica es que nos permite hacer un estudiotopologico del espectro cuaternionico por la izquierda.

Entre las aplicaciones interesantes de este estudio se encuentra el calculo de lacategorıa LS de grupos de Lie, pues facilita la busqueda de abiertos contractiles quelos recubran.

Bibliografıa

[1] L. Huang, W. So, On left eigenvalues of a quaternionic matrix, Linear AlgebraAppl. 323 No.1-3 (2001), 105–116.

[2] R.M.W. Wood, Quaternionic eigenvalues, Bull. Lond. Math. Soc. 17 (1985),137–138.

Page 53: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Estimacion de conjuntos de nivel

Paula Saavedra NievesDepartamento de Estadıstica e Investigacion Operativa, Universidad de Santiago

de Compostela

23 de noviembre de 2011

Introduccion

La reconstruccion de conjuntos de nivel C(λ) = x ∈ Rd : f(x) ≥ λ, don-de λ > 0, d ≥ 1 y f denota la funcion de densidad de una variable aleatoria Xd−dimensional y absolutamente continua, constituye un problema de notable rele-vancia en el campo de la Estadıstica.

Desde un punto de vista practico, resulta util que, segun los objetivos del estudioque se desee realizar, el usuario pueda fijar la probabilidad encerrada por el conjuntoestimado. Por ejemplo, en [1] se asume que un proceso manufacturado se encuentrafuera de control si una nueva observacion no pertenece al estimador del conjunto denivel que garantiza contenido en probabilidad 1−τ , τ ∈ (0, 1). De este modo, la pro-babilidad de dar una falsa alarma queda acotada por τ . Entonces, cabe consideraruna definicion alternativa de conjunto de nivel fijado τ ∈ (0, 1),

L(τ) = x ∈ Rd : f(x) ≥ fτ

donde

fτ = ınf

y ∈ (0,∞) :

∫ ∞−∞

f(t)If(t)≥y ≤ 1− τ. (1)

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

ffτ

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

ffτ

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

ffτ

Figura 1: Conjuntos de nivel para τ = 0,5.

Palabras Clave: Conjunto de nivel, plug-in, exceso de masa, metodos hıbridos.

43

Page 54: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

44 SII Estimacion de conjuntos de nivel

Dada una muestra Xn = X1, ..., Xn de X y τ ∈ (0, 1), es necesario estimarel umbral fτ que garantice el contenido en probabilidad fijado y, posteriormente,reconstruir el conjunto de nivel, L(τ), empleando alguna de las tres metodologıasexistentes: plug-in, exceso de masa y metodos hıbridos.

A traves de un completo estudio de simulacion, hemos comparado los metodosautomaticos de estimacion de conjuntos de nivel para dimension 1, dada la limitacionpresentada por algunos de ellos en terminos de dimension. A continuacion y concaracter introductorio, nos limitaremos a presentar cada una de las tres metodologıascitadas considerando, previamente, algunas herramientas matematicas utiles en estecontexto.

Herramientas matematicas y aspectos geometricos

Las distancias entre conjuntos y la forma de los mismos juegan un papel fun-damental en la estimacion de conjuntos. Consideraremos el espacio euclıdeo Rd ydenotaremos por Br(x), la bola abierta de centro x y radio r > 0.

Definicion 1. Sean A y C dos conjuntos de Borel y f una funcion de densidad.Definimos

dµf (A,C) =

∫A4C

f(t) dt,

donde 4 representa la diferencia simetrica dada por A4C = (A \ C) ∪ (C \A).

En cuanto a las propiedades geometricas, consideraremos la familia de conjun-tos convexos y r−convexos dado que algunos de los algoritmos que presentaremosasumen que el conjunto de nivel a estimar satisface tales condiciones de forma.

Definicion 2. Un conjunto A ⊂ Rd se dice convexo si para cualquier par de puntosx, y ∈ A y todo α ∈ [0, 1], se verifica que αx+ (1− α)y ∈ A.

Definicion 3. Un conjunto A ⊂ Rd cerrado se dice r−convexo, para r > 0, si

A = Cr(A) donde Cr(A) =⋂

Br(x):Br(x)∩A=∅

(Br(x))c

denota la envoltura r−convexa de A.

Metodos plug-in

Los metodos plug-in se basan en reemplazar la funcion de densidad f por unestimador no parametrico de la misma, fn, en (1). Por tanto, el estimador propuestopara el conjunto de nivel L(τ) puede escribirse como

L(τ) = x ∈ Rd : fn(x) ≥ fτ, (2)

donde fτ = fτ (fn) denota un estimador del umbral. Como estimador de la densidadsuele considerarse el estimador tipo nucleo definido por fn(x) = 1

n

∑ni=1KH(x−Xi),

Page 55: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Paula Saavedra Nieves SII 45

donde KH(z) = |H|−1/2K(H1/2z), con K : Rd → R denotando una funcion dedensidad simetrica fija, llamada nucleo y H, la matriz de parametros ventana o desuavizado. La eleccion del parametro de suavizado conforma el principal problemaen el contexto de estimacion no parametrica de la densidad.

Por tanto, aunque desde un punto de vista intuitivo, resulta muy sencillo mo-tivar la construccion del estimador propuesto en (2), existen dos inconvenientesfundamentales: El metodo plug-in resulta poco util si deseamos asumir ciertas res-tricciones a priori sobre la forma del conjunto de nivel, L(τ), y, al igual que sucedeen el contexto de la estimacion no parametrica de la densidad, el punto clave serala eleccion del parametro ventana.

Hasta el ano 2010, la estimacion de conjuntos de nivel ha sido tratada en laliteratura desde multiples puntos de vista sin profundizar en el desarrollo de me-todos especıficos de seleccion del parametro de suavizado. En [4] se desarrollo, porprimera vez y para dimension 1, un criterio para seleccionar la ventana en esti-macion plug-in de conjuntos de nivel minimizando una aproximacion asintotica deEdµf (L(τ), L(τ)).

Metodos de exceso de masa

La metodologıa de exceso de masa fue propuesta, de forma independiente, en[2] y en [3] para estimar conjuntos de nivel C(λ). Se caracteriza por asumir que elconjunto de nivel C(λ) maximiza el funcional

Hλ(B) = P (B)− λµ(B),

donde µ denota la medida de Lebesgue y P la distribucion d−dimensional de X.Si se supone que C(λ) pertenece a una familia de conjuntos dada se puede estimarmaximizando el funcional empırico en la familia considerada:

Hλ,n(B) = Pn(B)− λµ(B),

donde Pn denota la distribucion empırica obtenida a partir de la muestra, Xn.A diferencia de la aproximacion plug-in, el metodo de exceso de masa se caracte-

riza por imponer restricciones geometricas sobre los estimadores requeridas, ademas,para garantizar la aplicabilidad del mismo ya que, de no realizarse ningun tipode restriccion, el optimo se alcanzarıa en la propia muestra, Xn. Por tanto, estosmetodos resultan verdaderamente utiles si existe informacion a priori sobre la formadel conjunto de nivel a estimar.

Metodos hıbridos

Al igual que la metodologıa de exceso de masa, los metodos hıbridos se carac-terizan por asumir restricciones de tipo geometrico sobre la clase de conjuntos queconsideran y, de modo analogo a los metodos plug-in, parten de una estimacion noparametrica tipo nucleo de la funcion de densidad f a partir de la cual estiman elumbral fτ y definen los conjuntos

Page 56: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

46 SII Estimacion de conjuntos de nivel

X+n = X ∈ Xn : fn(X) ≥ fτ y X−n = X ∈ Xn : fn(X) < fτ.

El metodo de suavizado granulometrico, propuesto en [5] para dimension d,impone como restriccion de forma que tanto el conjunto de nivel como su comple-mentario sean r−convexos. El estimador es calculado como una union de bolas deradio r con centros en los puntos de X+

n suficientemente alejados de X−n . En estecaso, el parametro r debe ser fijado de antemano por el usuario.

Los metodos de la envoltura convexa y r−convexa proponen como estimadoresla envoltura convexa y r−convexa del conjunto X+

n , respectivamente. Por tanto,suponen a priori que el conjunto de nivel es, segun el caso, convexo o r−convexocon r fijado, como antes, por el propio usuario.

0 2 4 6 8 10

02

46

81

0

χχn−

χχn+

0 2 4 6 8 10

02

46

81

0

Cr((χχn+))

0 2 4 6 8 10

02

46

81

0

χn−

χn+

Figura 2: Estimador de la envoltura convexa, de la envoltura r−convexa con r = 1y del metodo de suavizado granulometrico en R2.

Bibliografıa

[1] A. Baıllo, Total Error in a Plug-in Estimator of Level Sets, Stat. Probab. Lett.65 (2003), 411–417.

[2] J.A. Hartigan, Estimation of a convex density contour in two dimensions, Jour-nal of the American Statistical Association 82 (1987), 267–270.

[3] D.W. Muller, G. Sawitzki, Using excess mass estimates to investigate the mo-dality of a distribution, Preprint No. 398, SFB123, Univ. Heidelberg (1987).

[4] R.J. Samworth, M. P. Wand, Asymptotics and optimal bandwidth selection forhighest density region estimation, The Annals of Statistics 38 (2010), 1767–1792.

[5] G. Walther, Granulometric smoothing, Annals of Statistics 25 (1997), 2273–2299.

Page 57: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Seminario de Iniciacion a InvestigacionInstituto de Matematicas

Aplicaciones de las Funciones Copula en Estadıstica

Eduardo Garcıa PortuguesDepartamento de Estatıstica e Investigacion Operativa

14 de diciembre de 2011

Introduccion

El estudio de la dependencia y la relacion entre variables aleatorias desempenaun papel fundamental en la estadıstica. Las funciones copula permiten un enfoquealternativo al tratamiento clasico de la dependencia, con la interesante ventaja deque no se ven afectadas por el comportamiento individual de las variables aleatorias.La primera parte de este trabajo se dedica a la definicion y propiedades mas impor-tantes de las funciones copula. En la segunda parte se presentan dos aplicacionesde las copulas a la estimacion de densidades y a los contrastes de bondad de ajustecon datos circular–lineales.

Funciones copula

Antes de introducir las funciones copula, conviene recordar algunos conceptosbasicos de probabilidad. Dada una variable aleatoria (v.a.) X, la funcion de distri-bucion F nos mide la probabilidad acumulada para un valor particular de X, esdecir F (x) := PX ≤ x. Si X es absolutamente continua (a.c.), entonces a la fun-cion f tal que F (x) =

∫ x−∞ f(t) dt se le denomina funcion de densidad. La extension

de estos conceptos para vectores aleatorios de dos variables (X,Y ) es sencilla. Eneste caso, se tiene la funcion de distribucion conjunta, F (x, y) := PX ≤ x, Y ≤ yy, en caso de que (X,Y ) sea a.c., la funcion de densidad conjunta f , que satisfaceF (x, y) =

∫ x−∞

∫ y−∞ f(t, s) dsdt. El comportamiento individual de las variables viene

dado por las distribuciones marginales F1(x) := F (x,+∞) y F2(y) := F (+∞, y) y,en el caso a.c., tambien por las densidades marginales asociadas f1 y f2.

Las funciones copula son distribuciones conjuntas de dos variables aleatorias uni-formes (i.e., variables que asignan la misma probabilidad a los puntos de [0, 1]) que,aplicadas adecuadamente, permiten expresar una funcion de distribucion conjuntaa partir de sus marginales. Teniendo en cuenta esto, una definicion formal de copulaes la siguiente.

Definicion 1. Una copula es una funcion C : [0, 1]2 → [0, 1] que verifica las si-guientes propiedades:

Palabras Clave: Copulas, distribucion, dependencia estadıstica.

47

Page 58: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

48 SII Aplicaciones de las Funciones Copula en Estadıstica

1. ∀u, v ∈ [0, 1], C(u, 0) = C(0, v) = 0.

2. ∀u, v ∈ [0, 1], C(u, 1) = u y C(1, v) = v.

3. ∀u1, u2, v1, v2 ∈ [0, 1] tal que u1 ≤ u2 y v1 ≤ v2,

C(u2, v2)− C(u2, v1)− C(u1, v2) + C(u1, v1) ≥ 0.

El resultado mas importante sobre copulas y que supuso el origen de esta teorıaes el Teorema de Sklar (ver [4] para una demostracion). Aquı se presenta su versionbidimensional por razones de sencillez, pero el resultado se verifica tambien para elcaso multidimensional.

Teorema 2 (Teorema de Sklar, 1973). Sea F una funcion de distribucion conjuntacon distribuciones marginales F1 y F2. Entonces existe una copula C tal que

F (x, y) = C(F1(x), F2(y)), ∀x, y ∈ R. (1)

Si F1 y F2 son continuas, entonces C es unica. En otro caso, C esta unıvocamentedeterminada en el producto de los rangos de F1 y F2. Recıprocamente, si C es unacopula y F1 y F2 son funciones de distribucion, entonces la funcion F definida por(1) es una funcion de distribucion conjunta con distribuciones marginales F1 y F2.

Algunas propiedades

En virtud del Teorema de Sklar, es posible caracterizar muchos de los conceptosde dependencia entre dos variables X e Y a traves de su copula asociada, CXY . Noscentraremos aquı en los tres casos mas importantes: la dependencia perfecta posi-tiva, la independencia y la dependencia perfecta negativa. La dependencia perfectapositiva (resp. negativa) es equivalente a que exista una funcion creciente g (resp.decreciente) tal que Y = g(X). La siguiente proposicion recoge la caracterizacionde estos conceptos mediante copulas.

Proposicion 3. Sea CXY la copula asociada a X e Y .

1. X e Y tienen dependencia perfecta positiva ⇔ CXY (u, v) = mın(u, v).

2. X e Y son independientes ⇔ CXY (u, v) = uv.

3. X e Y tienen dependencia perfecta negativa ⇔ CXY (u, v) = max(u+v−1, 0).

4. Para toda copula C, max(u + v − 1, 0) ≤ C(u, v) ≤ mın(u, v), ∀u, v ∈ [0, 1](desigualdad de Frechet–Hoeffding).

Una buena referencia para profundizar en el estudio de las copulas es [4]. En [1] sepueden encontrar aplicaciones de las copulas a datos reales, un catalogo de copulasque han ido apareciendo en la literatura estadıstica ası como distintos metodos desimulacion.

Page 59: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

Eduardo Garcıa Portugues SII 49

Estimacion de la densidad

El Teorema de Sklar se puede expresar en terminos de densidades derivando (1):

f(x, y) = c(F1(x), F2(y)

)f1(x)f2(y), (2)

donde c representa la densidad de la copula C. Utilizando esta representacion,podemos plantear el siguiente algoritmo para estimar f a partir de una muestra(Xi, Yi

)ni=1

:

I. Obtener estimadores para las densidades marginales f1 y f2 y calcularF1(x) =

∫ x−∞ f1(t) dt y F2(y) =

∫ y−∞ f2(t) dt.

II. Calcular la muestra artificial(F1(Xi), F2(Yi)

)ni=1

y estimar c.

III. Obtener el estimador de la densidad como f(x, y) = c(F1(x), F2(y)

)f1(x)f2(y).

Este algoritmo es particularmente interesante para estimar densidades de tipo circu-lar–lineal, es decir, densidades conjuntas en las que aparece una v.a. circular (valoresen [0, 2π) con caracter periodico; por ejemplo la direccion de incidencia del viento).Un ejemplo de densidades circular–lineales es el modelo de Johnson y Wehrly [3],donde la densidad conjunta p tiene la forma

p(θ, x) = 2πg[2π(Ψ(θ)− F (x))

]ϕ(θ)f(x), (3)

donde F y Ψ (resp. f y ϕ) representan las distribuciones (resp. densidades) mar-ginales lineal y circular respectivamente, y la funcion g representa otra densidadcircular que sirve como nexo de union entre las dos variables. Una estimacion noparametrica de (3) se puede realizar usando el algoritmo anterior y tecnicas tiponucleo para las componentes lineales y circulares.

Contrastes de bondad de ajuste

Cuando tenemos una muestra de tipo circular–lineal una pregunta que sur-ge de forma natural es si es posible suponer que la densidad de estos datos esde la forma (3). Por (2) y (3), esto es equivalente a contrastar si la hipotesisH0 : c(u, v) = 2πg

[2π(u− v)

]es cierta, donde c representa la densidad de la copula

circular–lineal de nuestros datos y g es una densidad circular cualquiera. En casode que se acepte H0, entonces podremos aplicar metodos especıficos para estimar ladensidad (3). Dada una muestra circular–lineal (Θi, Xi)ni=1, el procedimiento quese propone para contrastar H0 es el siguiente:

I. Calcular (Ui, Vi)ni=1, con Ui = 1n

∑nj=1 1Θj≤Θi y Vi = 1

n

∑nj=1 1Xj≤Xi.

II. Calcular el estimador general no parametrico de c, cH , y el estimador no pa-rametrico bajo H0, cκ. Obtener la distancia L2 en [0, 1]2 de estos estimadores:

D =

∫ 1

0

∫ 1

0[cκ(u, v)− cH(u, v)]2 dvdu.

Page 60: ACTAS DO...ACTAS DO SEMINARIO DE INICIACION A INVESTIGACION ANO 2011 Editores: Mikel Alvarez Mozos Sandra Gavino Fernandez Ana G omez Gonz alez Mar a Jos e Pereira S aez c 2011 Seminario

50 SII Aplicaciones de las Funciones Copula en Estadıstica

III. Calibrar la distribucion de D mediante bootstrap:

a) Generar B remuestras bootstrap(U∗i,b, V

∗i,b

)ni=1

, b = 1, ... , B de cκ.

b) Obtener los estadısticos bootstrap:

D∗b =

∫ 1

0

∫ 1

0[c∗κ(u, v)− c∗H(u, v)]2 dvdu.

c) Obtener el p–valor aproximado como p–valor ≈ #D≤D∗b B . Si p–valor> α,

entonces se aceptaH0 con una significacion del 100α%. En caso contrario,se rechaza H0.

La estimacion cκ se realiza mediante suavizacion tipo nucleo de las componentesde (3) y la estimacion cH adaptando la propuesta de [2] al caso circular–lineal.

u

0.00.2

0.4

0.6

0.8

1.0

v

0.0

0.2

0.4

0.6

0.8

1.0

Density

0

1

2

3

c(·, ·)

u

0.00.2

0.4

0.6

0.8

1.0

v

0.0

0.2

0.4

0.6

0.8

1.0

Density

0

1

2

3

cκ(·, ·)

u

0.00.2

0.4

0.6

0.8

1.0

v

0.0

0.2

0.4

0.6

0.8

1.0

Density

0

1

2

3

cH(·, ·)

Figura 1: Comparacion de los estimadores cκ y cH de la densidad de la copula para200 puntos generados de una densidad (3). De izquierda a derecha, c, cκ y cH .

Bibliografıa

[1] E. Garcıa–Portugues, Funciones Copula en Probabilidad y Estadıstica. Aplica-ciones, Tesina de Licenciatura, Universidad de Santiago de Compostela, 2010.

[2] I. Gijbels, J. Mielniczuk, Estimating the density of a copula function, Comm.Statist. Theory Methods 19 (1990), 445–464.

[3] R.A. Johnson, T.E. Wehrly, Some angular–linear distributions and related re-gression models, J. Amer. Statist. Assoc. 73 (1978), 602–606.

[4] R.B. Nelsen, An introduction to copulas, Springer, New York, 2006.