10
Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Embed Size (px)

Citation preview

Page 1: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Indexação Automática e Etiquetadores parte do discurso

(POS tagger)

Equipe: Camila OliveiraCelson Farias

Maxwell Francisco

Page 2: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Linguistica Computacional Originada em meados de 1950 Buscam desenvolver sistemas com capacidade de

reconhecer e produzir informação apresentada em linguagem natural.

Preocupam-se diretamente com o estudo da linguagem voltado para a construção de softwares e sistemas computacionais específicos, como tradutores automáticos, chatterbots, parsers, reconhecedores automáticos de voz, geradores automáticos de resumos etc.

Page 3: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Indexação automática Na indexação automática, segundo Santos e Ribeiro

(2003), um programa de computador, adotando critérios de freqüência, extrai palavras, expressões ou radicais de palavras do texto para representar o seu conteúdo como um todo.

Lancaster (2004, p. 286-290) define dois tipos diferentes de indexação automática. A indexação por extração automática e a indexação por atribuição automática.

Page 4: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Indexação na Recuperação da informação

Page 5: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Etiquetadores Parte do Discurso (POS tagger)

Sistemas que exercem a função de percorrer todo o texto etiquetando todas as palavras segundo sua categoria gramatical,

Envolve uma análise da palavra segundo o contexto que a mesma se encontra, como por exemplo, definir a sua relação com as palavras adjacentes em uma frase ou em um parágrafo.

Page 6: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco
Page 7: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Exemplo do POS tagger "O meu tio é português" e observe os resultados

para as ferramentas etiquetadoras em questão: I) TreeTagger: "o/DET meu/ADJ tio/NOM

é/V português/ADJ" II) Ogma: "o/AD meu/PS tio/SU é/VB

português/AJ"

Page 8: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco
Page 9: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco
Page 10: Indexação Automática e Etiquetadores parte do discurso (POS tagger) Equipe: Camila Oliveira Celson Farias Maxwell Francisco

Conclusão As ferramentas de etiquetas POS juntamente

com suas ferramentas auxiliadoras vieram também para aprimorar a Lingüística Computacional no que diz respeito à indexação, armazenamento e recuperação de informações, pois, um dos fatores que dificultava esse processo, é a ambigüidade dos termos.