UNIVERSIDADE FEDERAL DE ALAGOASUNIVERSIDADE FEDERAL DE ALAGOASINSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTESINSTITUTO DE CIÊNCIAS HUMANAS, COMUNICAÇÃO E ARTESCURSO DE BIBLIOTECONOMIACURSO DE BIBLIOTECONOMIAANÁLISE DA INFORMAÇÃO IANÁLISE DA INFORMAÇÃO I
TRATAMENTO TEMÁTICO DA INFORMAÇÃO:Processos de Análise e Representação
Prof. Edivanio Duarte de [email protected]
Maceió, Alagoas2011.1
Tratamento da Informação no Sistema de Tratamento da Informação no Sistema de Recuperação da Informação (SRI)Recuperação da Informação (SRI)
� Diversos modelos, mais ou menos, similares de SRI;� “Entrada;◦ desenvolvimento da coleção [seleção e aquisição];◦ tratamento da informação [análise e representação da informação];◦ armazenamento.
� Saída:� Saída:◦ análise/negociação de questões [usuário];◦ estratégia de busca;◦ busca;◦ disseminação” (DIAS; NAVES, 2007, p. 15, grifo meu).
� Em outros modelos, por exemplo, nos de Cesarino (1985), Lancaster (2004) e Dodebei (2007), o tratamento da informação faz parte de um subsistema intermediário dedicado ao “processamento/tratamento/armazenamento” da informação.
Tratamento da Informação na Ciência da Tratamento da Informação na Ciência da Informação/BiblioteconomiaInformação/Biblioteconomia
� Expressão ou área do conhecimento (Ciência a Informação/Biblioteconomia) que abarca:◦ descrição física e temática dos documentos em uma biblioteca ou
SRI;
◦ desenvolvimento de instrumentos a serem utilizados nessas ◦ desenvolvimento de instrumentos a serem utilizados nessas descrições (códigos, linguagens, normas, padrões);
◦ concepção e implantação de estrutura físicas ou bases de dados destinadas ao armazenamento dos documentos e de seus simulacros (fichas, registros eletrônicos, etc.);
� Compreende as disciplinas classificação, catalogação, indexação e outras delas derivadas ou a elas relacionadas, tais como metadados e ontologias (DIAS; NAVES, 2007).
Tratamento da InformaçãoTratamento da Informação
� Tipos de tratamento da informação:◦ tratamento descritivo: elementos físicos extraídos do documento
(catalogação) - identificação extrínseca;
◦ tratamento temático: descreve o conteúdo (assunto) do documento (indexação, catalogação de assuntos e classificação) -identificação intrínseca.
Etapas do tratamento temático:� Etapas do tratamento temático:◦ análise de assunto (análise conceitual, análise temática, análise
documentária ou análise de informação): leitura do documento e extração dos conceitos que representam o seu conteúdo;
◦ tradução: passagem dos termos extraídos em linguagem natural para linguagem de indexação ou linguagem documentária (descritores de assunto, cabeçalhos de assunto, palavras-chave, termos de indexação ou enunciados) (DIAS; NAVES, 2007).
Os Processos de Tratamento da Os Processos de Tratamento da InformaçãoInformação
� Descrição física:◦ exame do documento (leitura técnica do documento);
◦ identificação de elementos que representamextrinsecamente/fisicamente o documento (autor, título, edição, editora, local de publicação, ano de publicação, quantidade de páginas/folhas, etc.);páginas/folhas, etc.);
◦ seleção dos elementos e forma de descrição com base num instrumento de representação/código de catalogação (AACR2).
� Descrição temática:◦ exame do documento (leitura técnica do documento);
◦ extração e seleção de conceitos que representam intrinsecamente/conteúdo o documento (DIAS; NAVES, 2007).
Atividades e Designações do Tratamento Atividades e Designações do Tratamento da Informaçãoda Informação
� Catalogação:◦ descrição dos aspectos físicos (objetivos) dos documentos (autor,
título, edição, editora, local de publicação, ano de publicação, quantidade de páginas/folhas, etc) – chamada de representação/catalogação descritiva;representação/catalogação descritiva;
◦ descrição do conteúdo do documento – catalogação por assunto (pontos de acesso ou pistas).
� Classificação:◦ descrição do conteúdo do documento:
a) lugar do documento na coleção organizada por assunto;
b) sistemas de classificação (CDD e CDU) para representar o assunto (DIAS; NAVES, 2007).
Atividades e Designações do Tratamento Atividades e Designações do Tratamento da Informaçãoda Informação
� Indexação:◦ representação do conteúdo do documento;
◦ atividade dos serviços de “indexação e resumo” (periódicos científicos).
� Metadados:� Metadados:◦ descrição física dos documentos em bibliotecas digitais;
◦ cumpre, nas bibliotecas digitais, papel semelhante ao da catalogação nas bibliotecas tradicionais.
� Ontologias:◦ organização dos recursos eletrônicos com base no conteúdo;
◦ atividade semelhante aos processos de catalogação, classificação e indexação, que são realizadas em bibliotecas tradicionais (DIAS; NAVES, 2007).
Atividades de Tratamento Temático da Atividades de Tratamento Temático da InformaçãoInformação
� Há uma tendência em considerá-las (indexação, catalogação de assuntos e classificação) sob uma única designação decorrente de suas semelhanças:◦ identificam o assunto do documento;
◦ traduzem esse assunto para uma linguagem de indexação ◦ traduzem esse assunto para uma linguagem de indexação (linguagem documentária);
� Há, porém, diferenças:◦ a classificação visa determinar um único local do documento na
coleção/estante;
◦ a indexação e a catalogação de assunto podem indicar para um documento várias entradas num índice ou num catálogo (política de indexação) (DIAS; NAVES, 2007).
Instrumentos Usados no Tratamento da Instrumentos Usados no Tratamento da InformaçãoInformação
� Tratamento descritivo:◦ Catalogação: códigos de catalogação (Instruções Prussianas, Código de
Panizzi, Código de Jewett e Código de Catalogação Anglo-Americano);◦ Referências (bibliográficas): normas de descrição (NBR 6023/ABNT);◦ Metadados: formatos de metadados (Dublin Core).
� Tratamento Temático:� Tratamento Temático:◦ Indexação: linguagens de indexação ou documentárias (Cabeçalhos de
Assunto e Tesauros);◦ Classificação: linguagens de indexação simbólicas ou sistemas de
classificação bibliográfica e documentária (Classificação Decimal de Dewey e Classificação Decimal Universal);◦ Resumo: normas de elaboração (NBR 6028/ABNT) (DIAS; NAVES, 2007).
� Dias e Naves (2007) citam as tabelas de notação de autor (Cutter e PHA) como instrumentos de representação temática, mas elas apenas auxiliam aqueles na formação do número de chamada.
Produtos do Tratamento da InformaçãoProdutos do Tratamento da Informação
� Registros bibliográficos (referência bibliográfica);
� Registros catalográficos (ficha catalográfica);
� Resumos (Abstracts e/ou Serviço de Indexação e Resumo);
� Metadados (registros bibliográficos ou catalográficos de � Metadados (registros bibliográficos ou catalográficos de documentos eletrônicos);
� Pontos de acesso de catálogos (autor, título e/ou assunto);
� Pontos de acesso de bibliografias (autor, título e/ou assunto);
� Arranjo sistemático de coleções de documentos (a própria organização da coleção) (DIAS; NAVES, 2007).
A IndexaçãoA Indexação
� O termo indexação assume dois sentidos na literatura:◦ indexação (lato sensu): construção de índices (autores, títulos e
assunto), em livros, catálogos ou bancos de dados;
◦ indexação (sticto sensu): pontos de acesso ou catalogação de assunto das informações contidas em documentos.
� Na literatura de língua inglesa:� Na literatura de língua inglesa:◦ indexação back-of-book: no final do livro (mais exaustiva);
◦ indexação acadêmica: base de dados de resumo e catálogos de bibliotecas (menos exaustiva).
� Etapas da indexação (abordagem clássica):◦ extração dos conceitos representativos;
◦ tradução (instrumentos de indexação – linguagens de indexação ou linguagens documentárias).
� Etapas da indexação:◦ análise do assunto do texto;
◦ expressão do conteúdo do assunto nas palavras dos indexadores (linguagem natural);
◦ tradução para um vocabulário de indexação;
◦ expressão do assunto em termos de índice (CHU; O’BRIEN, 1993 apud DIAS; NAVES, 2007, p. 28).
Processos da IndexaçãoProcessos da Indexação
apud DIAS; NAVES, 2007, p. 28).
� A literatura dá maior destaque ao processo de tradução, sobretudo, as linguagens de indexação e classificação/documentárias (elaboração e uso);
� Pouca literatura sobre como os indexadores decidem sobre o assunto do documento (sobre o que ele trata) – processo de análise da informação.
� Dificuldades na indexação:◦ processo subjetivo;
◦ percepções diferentes dos indexadores:� o efetivo conteúdo do documento;
� a parte desse conteúdo que poderá responder às necessidades dos usuários;
Processos da IndexaçãoProcessos da Indexação
usuários;
� os conceitos importantes que devem ser selecionados para representar esse conteúdo;
� os descritores definidos para representar esses conceitos (STREHL, 1998 apud DIAS; NAVES, 2007).
? ? ?DOCUMENTO CONTEÚDO CONCEITOS DESCRITORES
� Necessidade de política de indexação:◦ cobertura (especificidade e exaustividade);
◦ coeficientes de recuperabilidade (revocação e precisão).
� Consistência na indexação:◦ medida de similaridade (concordância) entre termos atribuídos
por diversos indexadores a um mesmo documento;
Processo da IndexaçãoProcesso da Indexação
por diversos indexadores a um mesmo documento;
◦ ponto crítico em todo o processo de indexação (subjetividade);
� Inconsistência na indexação:◦ medida de variação de termos atribuídos a um mesmo
documento por mais de um indexador (lista de indexação);
◦ diferentes indexadores atribui diferentes termos indexadores a um mesmo documento;
◦ localiza-se, principalmente, no momento da expressão (verbalização) dos conceitos (níveis de especificidade).
� Relevância na indexação:◦ julgamento feito pelo usuário diante do resultado da busca em
SRI;
◦ conexões entre as situações de usuários (questão feita pelo usuário) e informação contida nos documentos (resposta dada pelo SRI);
Processo de IndexaçãoProcesso de Indexação
pelo SRI);
◦ avaliação da satisfação do usuário em relação à representação do documento.
Questãorepresentação da necessidade de
informação
Documentorepresentação do
conteúdo do documento
Relevância
Situações de Usuários Informação dos Documentos
� A análise e a representação da informação constituem o processo de indexação;
� Análise da informação:◦ determinação do conteúdo de um documento.;◦ identificação dos conceitos centrais do conteúdo do documento.
� Representação da informação:◦ atribuição de termos representativos desses conceitos
Processos de Análise e RepresentaçãoProcessos de Análise e Representação
◦ atribuição de termos representativos desses conceitos (linguagem natural);◦ tradução desses termos em linguagem do SRI (vocabulário
controlado).
� Funções dos processos de análise e de representação da informação:◦ construção de pontos de acesso/índices /catálogos (meio);◦ recuperação da informação (fim).
Análise e Representação da InformaçãoAnálise e Representação da Informação
De que trata o documento?- determinação do conteúdo;
Análise da Informação
Como representar este conteúdo?- atribuição de termos àqueles conceitos;
Representação da InformaçãoDocumento
Esquema do Indexador
Catálogo*
conteúdo;- extração de conceitos.
àqueles conceitos;- tradução do termos em LI/LD.
- Seleção de materiais de informação;- Formação de acervos;- Desenvolvimento de acervos.
- Seleção de fontes de informação;- Formação de coleções;- Desenvolvimento de coleções.
VocabulárioControlado
*impresso ou on-line.
Análise e Representação da InformaçãoAnálise e Representação da Informação
Qual minha necessidade de informação?- determinação do conteúdo;
Análise da Informação
Como representar este conteúdo?- atribuição de termos àqueles conceitos;
Representação da InformaçãoNecessidade
de informação
Esquema do Usuário
Catálogo*
conteúdo;- extração de conceitos.
àqueles conceitos;- tradução do termos em LI/LD.
- Seleção de materiais de informação;- Formação de acervos;- Desenvolvimento de acervos.
- Seleção de fontes de informação;- Formação de coleções;- Desenvolvimento de coleções.
Controle de vocabulário(catálogo)
*impresso ou on-line.
� Linguagem de indexação/linguagem documentária: conjunto de termos e/ou símbolos usados para determinar/representar classes de assuntos em SRI;
� Componentes básicos:◦ vocabulário (termo propriamente dito): relação dos termos e/ou
símbolos empregados na representação temática do documento:� controle semântico ou de significado.
Linguagem de Indexação/DocumentáriaLinguagem de Indexação/Documentária
� controle semântico ou de significado.
◦ sintaxe (estrutura frásica): regras para a combinação de termos e/ou símbolos que representam os documentos:� estabelece regras sobre o uso dos termos indexadores;� revela relações existentes entre os conceitos e os termos da linguagem
de indexação;� controle estrutural por intermédio da coordenação conceitos simples
para representar conceitos compostos (especificar e definir ordem de citação, por exemplo).
� O uso de linguagem natural pode acarretar diversos problemas:◦ dispersão terminológica;
◦ dispersão sintática.
� O controle de vocabulário ou o uso de LI/LD diminui essa dispersão a um nível aceitável:◦ controle de relações semânticas;
◦ controle de relações sintáticas (PINTO, 1985)
Linguagem de Indexação/DocumentáriaLinguagem de Indexação/Documentária
◦ controle de relações sintáticas (PINTO, 1985)
� Classificação das LI/LD:◦ evolução histórica (conceito de coordenação):
� tradicionais (pré-coordenadas). Ex.: Os cabeçalhos de assunto , os sistemas de classificação (CDD, CDU);
� modernas (pós-coordenadas). Ex.: Os tesauros.
◦ Ordenação:� sistemas alfabéticos. Ex.: Os cabeçalhos de assunto.
� sistemas classificados. Ex.: Os sistemas de classificação (CDD, CDU) (CESARINO; PINTO, 1978).
� Indica o termo alternativo ou substitutivo na relação;
� Evidencia-se na própria definição do termo;
� Subtipos de relações semânticas:◦ Equivalências: fornecem termos substitutivos (“ver”, “use” “see” ou
“X”):� sinônimo e antônimo (adubos x fertilizantes);
� quase sinônimo (datiloscopia x impressão digital);
Relações SemânticasRelações Semânticas
� quase sinônimo (datiloscopia x impressão digital);
� grafias diferentes (contact x contato);
� abreviaturas e acrônimos (ONU x Organização das Nações Unidas);
� traduções (recall x revocação);
� ordem de citação (automação de bibliotecas x biblioteca, automação de).
◦ Hierárquicas: fornecem termos alternativos (“ver também”, “use também”, “see also” ou “XX”) – exprimem o posicionamento de um conceito em relação a outro.
◦ Hierárquicas (continuação):� gênero x espécie:a) quase-genérica (gato x animal de estimação)b) genérica (gato x mamífero)� todo x parte (aparelho respiratório x pulmão).
◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia
Relações SemânticasRelações Semânticas
◦ Afinitivas: estabelece termos indexadores que ampliam a estratégia de busca:� coordenação (porta x janelas);
� genética (pai x filho);� concorrente (educação x ensino);� causa e efeito (ensino x aprendizagem);� instrumental (medicina preventiva x vacinação);� material (esquadrias x alumínio);� similaridade de processos (catalogação x classificação) (PINTO, 1985).
Relações SintáticasRelações Sintáticas� Indica a relação entre os termos que representam o assunto;� Necessidade de se recuperar a interseção entre dois ou mais
conceitos:◦ assuntos simples (um único conceitos);◦ assuntos compostos (dois ou mais conceitos).
� As relações sintáticas são temporárias: dependem do documento;documento;
� Definem a importância dos termos numa estrutura frásica(ordem de citação):
Ex.: Uso do procedimento em cadeia para acesso aos conceitos ocultos (Ranganathan):
1 - NORMAS PARA FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO2 - FUNDIÇÃO DE ESQUADRIAS DE ALUMÍNIO – NORMAS PARA3 - ESQUADRIAS DE ALUMÍNIO - NORMAS PARA FUNDIÇÃO DE4 - ALUMÍNIO – NORMAS PARA FUNDIÇÃO DE ESQUADRIAS (PINTO,1985).
� Cutter em 1876:◦ regra: usar a ordem da linguagem natural. Ex. Biblioteca
Universitária;◦ cabeçalho invertido: quando o segundo termo do cabeçalho
composto for notoriamente mais significativo (subjetividade). Ex. Bibliotecas, Planejamento de.
Relações Sintáticas: ordem de citaçãoRelações Sintáticas: ordem de citação
“O MAIS SIGNIFICATIVO” – “O MENOS SIGNIFICATIVO”Ex. BIBLIOTECONOMIA - HISTÓRIA
� Kaiser em 1911: buscou maior consistência:
CONCRETO – PROCESSO (PINTO, 1985)Ex. BIBLIOTECA – PLANEJAMENTO.
� Coates em 1960 – teoria da concretividade decrescente:
COISA depois a AÇÃO
Ex. BIBLIOTECA – PLANEJAMENTO;
Introduzindo o elemento “material”:
Relações Sintáticas: ordem de citaçãoRelações Sintáticas: ordem de citação
Introduzindo o elemento “material”:
COISA – MATERIAL – AÇÃO e
Ex. BIBLIOTECA – LIVROS - SELEÇÃO;
Dependente da coisa: parte, tipo ou propriedade:
COISA – PARTE – MATERIAL – AÇÃO (PINTO, 1985).
Ex. BIBLIOTECA – SETOR DE PERIÓDICOS – ESTANTES – ORGANIZAÇÃO.
� Conceito: palavras ou grupos de palavras que expressam o conteúdo de um documento;
� Necessidade de controle de linguagem:◦ fatores humanos (autores, indexadores e usuários):
� diferenças de cultura;
� experiência dos autores;
Cabeçalho de Assunto: aspectos geraisCabeçalho de Assunto: aspectos gerais
� domínio da terminologia.
◦ fatores lingüísticos:� sinônimos: vários termos designam o mesmo conceitos;
� homógrafos: o mesmo termo designam conceitos diferentes;
� sintaxe: o sentido dos termos é condicionado pela posição que este ocupa na frase.
◦ fatores hierárquicos: um conceito implica em outros mais amplos e/ou mais restritos (CESARINO, PINTO, 1978).
� Funções dos cabeçalhos de assunto num SRI:◦ representar o assunto de maneira consistente;◦ permitir a coincidência entre linguagem do indexador e
linguagem do pesquisador;◦ possibilitar o indexador modular o nível de sua pesquisa do
mais geral para o mais específico, e vice-versa, segundo a necessidade do usuário.
Cabeçalho de Assunto: funções e princípiosCabeçalho de Assunto: funções e princípios
necessidade do usuário.
� Princípios de elaboração dos cabeçalhos de assunto:◦ princípio específico: os assuntos devem dar entrada por termos
específicos;◦ princípio de uso: os assuntos seguem o princípio da
conveniência do usuário;◦ princípio sindético: os assuntos devem ser interligados por uma
rede bem construída de referências cruzadas (ver e ver também) (CESARINO ; PINTO, 1978).
Características do Cabeçalho de AssuntoCaracterísticas do Cabeçalho de Assunto
FONTE: Cesarino e Pinto (1978).
Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação
FONTE: Cesarino e Pinto (1978).
Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação
FONTE: Cesarino e Pinto (1978).
Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação
FONTE: Cesarino e Pinto (1978).
Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação
FONTE: Cesarino e Pinto (1978).
Medidas das Linguagens de IndexaçãoMedidas das Linguagens de Indexação
FONTE: Cesarino e Pinto (1978).
� Pode-se adotar duas abordagens:◦ abordagem analítica:
� garantia literária;
� participação do usuário;
◦ abordagem formal:
Cabeçalho de Assunto: elaboraçãoCabeçalho de Assunto: elaboração
◦ abordagem formal: � trabalho de especialistas;
� opinião de especialistas (CESARINO; PINTO, 1978).
ReferênciasReferênciasASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 6028: informação e documentação – resumo – apresentação. Rio de Janeiro: ABNT, 2003. 2p.
CESARINO, M. A. N. Sistemas de recuperação de informação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 157-168, set. 1985. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.
______; PINTO, M. C. M. Cabeçalho de assunto como linguagem de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 7, n. 2, p. 268-288, set. 1978. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.
DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e DIAS, Eduardo José Wense; NAVES, Madalena Martins Lopes. Análise de assunto: teoria e prática. Brasília: Teshaurus, 2007. 116p.
DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002. 119p.
LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos Livros, 2004. 347p.
PINTO, M. C. M. F. Análise e representação de assuntos em sistemas de recuperação de informação; linguagens de indexação. Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14, n. 2, p. 169-186, set. 1985. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/reb/>. Acesso em: 08 fev. 2011.