Upload
internet
View
103
Download
1
Embed Size (px)
Citation preview
Modelo Geral, Novidades e Avaliação
Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota
Encontro do Segundo HAREMUniversidade de Aveiro, 7 de Setembro de
2008
1
Desafios HAREM clássico (seguindo genericamente
o modelo de classificação proposto no Primeiro HAREM, mas refinando algumas distinções, quer ao nível da segmentação das EM quer da sua classificação)
Pista para identificação e normalização de expressões temporais (Hagège et al., 2008)
Pista ReRelEM, para a identificação de relações semânticas entre EM
2
Calendário do HAREM (2007)
Primeira chamada para o Segundo HAREM
Data-limite para registo no HAREM
Data-limite para discussão sobre os moldes do Segundo HAREM
Versão preliminar das directivas do Segundo HAREM
3
Calendário do HAREM (2008)
Directivas finais e material de treino
Colecção HAREMPrimeira versão da Colecção Dourada
Primeira versão da mini-CD do TEMPO e a versão final CD Primeira versão da mini-CD do ReRelEM Versão final da mini-CD do TEMPO Resultados preliminares do HAREM clássicoResultados preliminares da pista do TEMPO
Versão final da mini-CD do ReRelEM
Resultados da pista ReRelEM Relatórios de desempenho
4
Caracterização do HAREM EM em contexto
5
O acordo político quanto à revisão foi obtido durante a <EM ID="aa46996-48" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Presidência Alemã</EM> , tendo cabido a <EM ID="aa46996-54" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Portugal</EM> concluir o processo de revisão.
Regressou então a <EM ID="hub-67792-106" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Portugal</EM>, onde iniciou meteórica carreira na experimentação de novas formas de expressão
Este debate passou completamente ao lado de <EM ID="H2-dftre765-8" CATEG="PESSOA" TIPO="POVO">Portugal</EM>
«o problema do <EM ID="hub-24360-322“ CATEG="ORGANIZACAO|ABSTRACCAO" TIPO="INSTITUICAO|DISCIPLINA">PSD</EM> é começar a ter só um <EM ID="hub-24360-323" CATEG="ABSTRACCAO" TIPO="IDEIA">Portugal</EM> ou dois dentro de si»
<EM ID=“Ex-1GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO">Portugal</EM> perdeu com a <EM ID=“Ex-2GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO“>Suíça</EM> por <EM ID=“Ex-3GM" CATEG=“VALOR" TIPO=“CLASSIFICACAO">2-0</EM>
Caracterização do HAREM EM vagas
6
Pela mão do <EM ID="aa66435-107" CATEG="PESSOA" TIPO="INDIVIDUAL">ministro Freitas do Amaral</EM>, e sem necessidade alguma, <EM ID="aa66435-108" CATEG="ORGANIZACAO|PESSOA" TIPO="ADMINISTRACAO|POVO">Portugal</EM> foi enxovalhado, coberto de vergonha e de cobardia, por um dos mais tristes textos políticos que já alguém escreveu.
<EM ID="hub-28874-31" CATEG="VALOR" TIPO="QUANTIDADE">Mais de 32 mil</EM> pessoas poderiam morrer se uma pandemia de gripe humana de origem aviária atingisse <EM ID="hub-28874-32" CATEG="PESSOA|LOCAL" TIPO="POVO|HUMANO" SUBTIPO="|PAIS">Portugal</EM>
os dois reinos católicos, <EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e<EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos do <EM ID="aa66435-54" CATEG="LOCAL|LOCAL" TIPO="FISICO|HUMANO" SUBTIPO="REGIAO|DIVISAO">Novo Mundo</EM>
Caracterização do HAREM Análises alternativas (ALT)
7
Ambiguidade estrutural: aproximava a <ALT> <EM ID="H2-dftre765-106" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja de Inglaterra</EM> | <EM ID="H2-dftre765-106-aa" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja</EM> de <EM ID="H2-dftre765-16" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Inglaterra</EM> </ALT> do calvinismo.
Possibilidade de uma expressão poder ser reconhecida como EM, ou não:
<EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO“ TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos;
Novidades no Segundo HAREM Uso extensivo de ALT para representação sistemática da
estrutura interna das EM constituídas por outras EM
<ALT><EM ID="aa55968-473" CATEG="PESSOA" TIPO="CARGO">presidente da Câmara de Nova Iorque</EM>
| presidente da <EM ID="aa55968-7" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara de Nova
Iorque</EM> | presidente da <EM ID="aa55968-475aa" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara</EM> de <EM
ID="aa55968-475" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="DIVISAO">Nova Iorque</EM> </ALT>
8
Novidades no Segundo HAREM ALT sistematicamente aplicados
9
CATEG ESTRUTURA EXEMPLO
PESSOA PESSOA de LOCALPESSOA de ORGANIZACAOPESSOA de ORG|LOCALPESSOA de PESSOA
Santo António de LisboaPresidente do Parlamento EuropeuPresidente dos Estados UnidosFCP de José Mourinho
ORGANIZACAO ORG de LOCALORG de ORG
Associação Académica de CoimbraConselho da UE
LOCAL LOCAL de LOCALLOCAL de ORGANIZACAO
Teatro Scala de MilãoCentro de Eventos da Fiergs
OBRA OBRA de PESSOAOBRA|LOCAL de LOCAL
Sagrada Família de GaudíMosteiro de Santa Clara-a-Velha
ACONTECIMENTO
ACONT de LOCALACONT de TEMPO
Jogos Olímpicos de BarcelonaVolta a Espanha de 1985
ABSTRACCAO ABSTRACCAO de LOCAL Blues do Delta
COISA COISA de ORGANIZACAO iPhone da Apple
Novidades no Segundo HAREM Não reconhecimento de certas palavras em maiúsculas como EM
10
Quando ocorrem no âmbito de uma unidade lexical composta que não constitui, ela própria, uma EM
pastéis de Belém; amêijoas à Bulhão Pato
Se os restantes constituintes (grafados em minúscula) dessa unidade lexical integrarem a lista das minúsculas permitidas no âmbito desta avaliação, toda a unidade lexical deverá ser reconhecida como EM
<EM ID="ric-19806-172" CATEG="ABSTRACCAO“ TIPO="ESTADO">doençadoença de Chagas</EM>
CATEGORIA TIPO SUBTIPOABSTRACCAO ESTADO, DISCIPLINA, IDEIA, NOME
OUTRO
ACONTECIMENTO EFEMERIDE, EVENTO, ORGANIZADOOUTRO
COISA CLASSE, MEMBROCLASSE, OBJECTOSUBSTANCIA, OUTRO
LOCAL
FISICO
HUMANO
VIRTUALOUTRO
AGUACURSO, AGUAMASSA, ILHA, PLANETA, REGIAO, RELEVO, OUTROCONSTRUCAO, DIVISAO, PAIS, REGIAO, RUA, OUTROCOMSOCIAL, OBRA, SITIO, OUTROOUTRO
OBRA ARTE, PLANO, REPRODUZIDA, OUTRO
ORGANIZACAOADMINISTRACAO, EMPRESA, INSTITUICAO, OUTRO
PESSOACARGO, GRUPOCARGO, GRUPOIND, GRUPOMEMBRO, INDIVIDUAL, MEMBRO, POVO, OUTRO
TEMPODURACAO, FREQUENCIA, GENERICOTEMPO_CALENDOUTRO
DATA, HORA, INTERVALO, OUTRO
VALORCLASSIFICACAO, MOEDA, QUANTIDADE, OUTRO
OUTRO13
X ESCOLA, OBRA, PLANO
X SUB
X PERIODO, CICLICO
X VARIADO
Colecção HAREM
14
Distribuição dos documentospor género na CD
DOCS: 1040Parágrafos: 15737Palavras: 670610
CD em números (1)
15
DOCS: 129Parágrafos: 2274Palavras: 147991Entidades: 7836Entidades vagas: 633 [52 classes]
Distribuição de categorias
16
CD em números (2)
Categorias associadas às entidades
Classes de vagueza(21 mais frequentes)
Processo de anotação da CDAnotação da CD, usando o Etiquet(h)arem
17
Processo de anotação da CDComparação automática das anotações, usando o
AlinhadorAnálise e discussão das diferenças encontradasValidação da sintaxe, usando o validador
desenvolvido para o efeitoRevisão manual da CDRevisão sequencial dos documentosRevisão por categoriaRevisão das análises alternativas (ALT)
18
Avaliação do HAREM clássico Melhorias em relação ao Primeiro HAREM
Contabilização de entidades parcialmente identificadas como incorrectas
Possibilidade de avaliação estrita dos ALT Casos conceptualmente distintos,
representados de forma diferente: ignorância, certeza de ser diferente, erro
Sistematização no tratamento das EM
19
Avaliação da classificação semântica
N
n
certostnsubtipos
certotntipos
certacncats1
_)1
1(_)1
1(_)1
1(1
M
n
espuriostnsubtipos
espuriotntipos
espuriacncats1
_1
_1
_1
N = número de diferentes classificações na CD de acordo com o cenárioM = número de classificações espúrias enviadas pelo sistemaα, β, γ = pesos das categorias (1), tipos (0.5) e subtipos (0.25)(c, t, st)_certo = 1, se estiver certo; caso contrário, (c, t, st)_certo = 0(c, t, st)_espuria= 1, se for espuria; caso contrário, (c, t, st)_espuria= 0
20
Programas de avaliação do HAREM clássico: entradas
<?xml version="1.0" encoding="ISO-8859-1" ?> <colHAREM versao="SegundoHarem">…<DOC DOCID="Xyz">
O <ALT> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> | <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> | <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> de <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> </ALT> vai começar no <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM>. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão.
</DOC>…</colHAREM>
CDHAREM.xmlCDHAREM.xml
<?xml version="1.0" encoding="ISO-8859-1" ?> <colHAREM versao="CD">…<DOC DOCID="Xyz">
O Tour de <EM ID="Xyz_1" CATEG="LOCAL" TIPO=“FISICO“ SUBTIPO=“REGIAO">França</EM> <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> vai começar no <EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de Fórmula 1. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão.
</DOC></colHAREM>
participacao.xmlparticipacao.xml
DOC Xyz<ALT><ALT1><EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT1><ALT2><EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]<EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT2><ALT3><EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]<EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]<EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]<EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]<EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]
Programas de avaliação do HAREM clássico: Alinhador
Alinhador
CDHAREM.xmlCDHAREM.xml
participacao.xmlparticipacao.xml
EMs na CD
EMs na participaç
ão
DOC Xyz<ALT><ALT1><EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Parcialmente_Correcto_por_Defeito(0.1; 0.9), Parcialmente_Correcto_por_Defeito(0.2; 0.8)]</ALT1><ALT2><EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Parcialmente_Correcto_por_Defeito(0.16666666666666666; 0.8333333333333334)]<EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto]</ALT2><ALT3><EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]::[Em_Falta]<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]<EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]<EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]::[Correcto]<EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]::[Em_Falta]<EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]::[Correcto]
Programas de avaliação do HAREM clássico: Avaliador de alinhamentos
Alinhador
CDHAREM.xmlCDHAREM.xml
participacao.xmlparticipacao.xml
Avaliador de alinhamentos
EM em falta
Alinhamentos classificados como: Correctos, Espurios,
Em Falta ou Parcialmente
Correctos
EMs parcialmente correctas são removidas na próxima fase
Tipos de cenário
Cenário total: elenco completo de categorias, tipos e subtipos propostos para o Segundo HAREM.
Cenário selectivo de avaliação: sub-conjunto de categorias, tipos e subtipos do cenário total que é alvo de avaliação.
Cenário selectivo de participação: sub-
conjunto de categorias, tipos e subtipos do cenário total que cada participante se propôs a utilizar.
24
#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})
DOC Xyz<ALT><ALT1><EM CATEG="ESPURIO">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Espurio]</ALT1><ALT2></ALT2><ALT3><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]
Programas de avaliação do HAREM clássico: Véus HAREM
Alinhador
CDHAREM.xmlCDHAREM.xml
participacao.xmlparticipacao.xml
Avaliador de alinhamentos
Véus(HAREM)
Dentro desta alternativa, a EM é
espúria
Alinhamentos filtrados de acordo com o cenário
pretendido
Remoção de alinhamentos
parcialmente correctos
#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})
DOC Xyz<ALT><ALT1><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]^1</ALT1></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]
Programas de avaliação do HAREM clássico: Organizador de ALTs
Organizadorde ALTs Alinhador
CDHAREM.xmlCDHAREM.xml
participacao.xmlparticipacao.xml
Avaliador de alinhamentos
Véus(HAREM)
- Remoção de alternativas vazias/duplicadas, surgidas depois da aplicação de véus- Remoção de EMs alinhadas mais do que uma vez dentro do mesmo ALT- Atribuição do peso1/total de ALT a cada EM dentro de um ALT
Peso
A EM espúria desapareceu porque alinhava correctamente com a alternativa
seguinte
Programas de avaliação do HAREM clássico: Avaliador semântico
#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})
DOC Xyz<ALT><ALT1><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875) PALT(1.0)}]</ALT1></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}]
Avaliadorsemântico
Organizadorde ALTs Alinhador
CDHAREM.xmlCDHAREM.xml
participacao.xmlparticipacao.xml
Avaliador de alinhamentos
Véus(HAREM)
Precisão
Abrangência
Medida-F
- Avaliação dos atributos semânticos.
Classificação máxima da EM na
CD
Classificação máxima da EM na
participação
Classificação efectiva
Peso ALT
Programas de avaliação do HAREM clássico: Selector de ALTs
#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})
DOC Xyz<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875)}]<EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}]
Avaliadorsemântico
Organizadorde ALTs Alinhador
CDHAREM.xmlCDHAREM.xml
participacao.xmlparticipacao.xml
Avaliador de alinhamentos
Véus(HAREM)
Selectorde ALTs
Selecção da melhor alternativa (melhor medida-F e melhor
classificação)
Ficou a única alternativa que existia
Participação no Segundo HAREM
Manifestações de interesse: 22Sistemas inscritos: 16Sistemas participantes: 10Saídas: 27 (máx. 4 por participante)
29
Cenários selectivos de participaçãoSistema CE
N PES
ORG
LOC OBR
ACO
ABS
COI
TEM VAL
Cage2 Sel2 CAT CAT F + H CAT
DobrEM Pes
PorTexTO Temp
Priberam Tot
R3M Sel3
REMBRANDT Tot
REMMA Sel4 C/T C/T
SEI-Geo Sel5 F + H
SeRELeP Tot
XIP/L2F/XEROX
Sel6 NORM
IdentificaçãoClassificação
30
CAT – apenas CATEGORIAC/T – apenas CATEGORIA e TIPOF+H – apenas locais FISICOs e HUMANOsNORM – normalização das expressões temporais
ResultadosCenário total com avaliação estrita de ALTs
31
ResultadosCenário total com avaliação relaxada de ALTs
32
ResultadosCenário próprio com avaliação relaxada de
ALTs
33
Avaliação por categorias (melhores sistemas)
34
Precisão Abrangência
Medida-F
Agradecimentos
A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.
35