Upload
joao-mota
View
214
Download
1
Embed Size (px)
Citation preview
Indexação Automática e Etiquetadores parte do discurso
(POS tagger)
Equipe: Camila OliveiraCelson Farias
Maxwell Francisco
Linguistica Computacional Originada em meados de 1950 Buscam desenvolver sistemas com capacidade de
reconhecer e produzir informação apresentada em linguagem natural.
Preocupam-se diretamente com o estudo da linguagem voltado para a construção de softwares e sistemas computacionais específicos, como tradutores automáticos, chatterbots, parsers, reconhecedores automáticos de voz, geradores automáticos de resumos etc.
Indexação automática Na indexação automática, segundo Santos e Ribeiro
(2003), um programa de computador, adotando critérios de freqüência, extrai palavras, expressões ou radicais de palavras do texto para representar o seu conteúdo como um todo.
Lancaster (2004, p. 286-290) define dois tipos diferentes de indexação automática. A indexação por extração automática e a indexação por atribuição automática.
Indexação na Recuperação da informação
Etiquetadores Parte do Discurso (POS tagger)
Sistemas que exercem a função de percorrer todo o texto etiquetando todas as palavras segundo sua categoria gramatical,
Envolve uma análise da palavra segundo o contexto que a mesma se encontra, como por exemplo, definir a sua relação com as palavras adjacentes em uma frase ou em um parágrafo.
Exemplo do POS tagger "O meu tio é português" e observe os resultados
para as ferramentas etiquetadoras em questão: I) TreeTagger: "o/DET meu/ADJ tio/NOM
é/V português/ADJ" II) Ogma: "o/AD meu/PS tio/SU é/VB
português/AJ"
Conclusão As ferramentas de etiquetas POS juntamente
com suas ferramentas auxiliadoras vieram também para aprimorar a Lingüística Computacional no que diz respeito à indexação, armazenamento e recuperação de informações, pois, um dos fatores que dificultava esse processo, é a ambigüidade dos termos.