View
0
Download
0
Category
Preview:
Citation preview
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
GT 2: Organização e Representação do Conhecimento
Modalidade de apresentação: pôster
ESTUDO SOBRE O USO DA TEORIA DA CLASSIFICAÇÃO FACETADA
EM BANCO DE DADOS
Márcio Bezerra da Silva Universidade Federal da Paraíba
Dulce Amélia de Brito Neves Universidade Federal da Paraíba
Resumo: Pesquisa em andamento que apresenta a Teoria da Classificação Facetada e
os Bancos de Dados (BDs) como elementos que possibilitam a estruturação do
conhecimento através da organização de conceitos e da criação de relacionamentos. São
elencadas as cinco categorias ou facetas estabelecidas por Ranganathan neste sistema, chamadas de PMEST: Personalidade, Material, Energia, Espaço e Tempo. Objetiva-se, a
partir de uma pesquisa exploratória e bibliográfica, embasada em periódicos científicos, dissertações, teses, repositórios digitais e bibliografia especializada, analisar a adoção da
teoria da classificação facetada em banco de dados para organização do conhecimento. Também se almeja definir as ações necessárias para a adoção da classificação facetada
em banco de dados e determinar a técnica de programação em banco de dados na
modelagem de dados. Apresenta como resultados parciais da pesquisa a determinação
dos elementos básicos e das etapas para a construção de um sistema facetado em BD. Acredita-se que estudos como este mostram a importância da interdisciplinaridade, entre
a Ciência da Informação (CI) e a Ciência da Computação (CC), e que ambas podem
trazer inúmeras contribuições, tanto para a sua própria área do conhecimento, como para
outras áreas.
Palavras-chave: Representação da Informação. Classificação. Teoria da Classificação
Facetada de Ranganathan. Tecnologia da Informação. Banco de Dados. Modelagem de
Dados.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
1 INTRODUÇÃO
No cotidiano social dos indivíduos, a informação pode ser considerada um bem
essencial que direciona e determina suas ações, num processo de constante mudança. A
partir das informações adquiridas, os indivíduos passam a compreender o mundo que o
cerca.
As informações adquiridas necessitam de organicidade, exigindo dos indivíduos
formas de classificá-las. Esta ação ocorre ao longo dos tempos, apresentando diversas
formas e técnicas, usadas para organizar o conhecimento humano. Dentre as áreas do
conhecimento que adotam as técnicas de organização/classificação da informação,
destacamos a Ciência da Informação (CI).
A CI é uma área de estudo interdisciplinar. Surgiu por volta da Segunda Guerra
Mundial e vem ao longo da historia dialogando com outras áreas do conhecimento como
Biblioteconomia, Matemática, Lógica, Lingüística, Psicologia, Ciência Cognitiva, Ciência
da Computação (CC), e Comunicação entre outras. A CI é conceituada, por Borko (1968),
como uma disciplina que investiga as propriedades e o comportamento da informação, as
forças que regem o fluxo informacional e os meios de processamento da informação,
Capurro (2003) ressalta que a CI essencialmente busca a produção, seleção,
organização, interpretação, armazenamento, recuperação, disseminação, transformação
e uso da informação. Estas ações não ocorrem apenas em ambientes físicos, como as
Bibliotecas Tradicionais. Ocorrem também em ambientes virtuais como a Web,
propiciadas por inúmeros fatores, especialmente a globalização que, nos últimos tempos,
vem acarretando na eliminação das barreiras de acesso ao conhecimento, produzido pela
humanidade. Fato marcado pelas Tecnologias da Informação (TIs), aos quais vêm
contribuindo para o aumento e a facilidade de acesso à informação.
Dentre as várias tecnologias, provenientes da globalização, podemos citar os
computadores e a Internet. Os citados elementos interferem na relação do homem com o
mundo que o cerca, passando a influenciar diretamente nas questões econômicas,
políticas e sociais. Como consequência de tal afirmação é possível observar que a
construção das sociedades tem se diferenciado enormemente de tempos anteriores,
exigindo maior organicidade e novas formas de classificar a informação.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
As observações apontadas, quanto à classificação da informação, propiciaram
perspectivas de estudos, entre as quais citemos A análise facetada na modelagem
conceitual de sistemas de hipertexto, de Lima (2002); e Organização e Representação do
Conhecimento, de Miranda (2005). Ambos os estudos apresentam a necessidade de um
enfoque sistemático no que tange a organização do conhecimento em ambientes digitais,
especialmente no que se refere ao aumento incontrolável de informações geradas pelas
TIs.
Tendo em vista a busca por respostas, para atender as necessidades específicas
de uma comunidade, determinou-se a criação de uma ferramenta digital para organizar e
recuperar a informação. A comunidade em pauta, que chamaremos neste trabalho de
Instituição X, está vinculada ao Governo do Estado da Paraíba, promovendo à cidadania
e capacitação por meio de cursos profissionalizantes. Dentre as formas consultadas, a
escolhida foi Banco de Dados (BD), já que permite a organização, o armazenamento e o
relacionamento entre os dados. Depois de cadastrados, os dados podem ser alterados,
removidos e consultados.
Entretanto, escolher apenas uma forma de tratar, armazenar e recuperar as
informações no âmbito digital, proveniente da CC, possivelmente não resolveria os
problemas da Instituição. Sendo assim, buscou-se, na CI, maneiras de organizar e
classificar a informação. Dentre os sistemas de classificação bibliográficos consultados, o
que se destacou foi à classificação facetada do indiano Shialy Rammarita Ranganathan
(1897-1972).
O sistema de Ranganathan permite a estruturação do conhecimento, através da
organização de conceitos e da criação de relacionamentos, permitindo o mapeamento de
uma área de assunto, assim como ocorrem em BDs. Além disso, a classificação facetada
possibilita a inclusão de novos conceitos sem que isto altere a estrutura do sistema,
característica determinante para a sua escolha.
Para a construção da ferramenta digital, a ser chamada de Sistema Facetado em
BD, objetivamos analisar a adoção da teoria da classificação facetada em banco de dados
para organização do conhecimento. Além disso, também nos preocupamos em definir as
ações necessárias para a adoção da classificação facetada em banco de dados e
determinar a técnica de programação em banco de dados na modelagem de dados.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
Com isso, no caminhar dos objetivos propostos, desenvolvemos a investigação
conforme explicitaremos abaixo.
2 A CIÊNCIA DA INFORMAÇÃO NA REPRESENTAÇÃO DA INFORMAÇÃO
A informação, nos últimos tempos, vem se tornando o elemento direcionador na
vida de todos na sociedade. Devido a esta importância, a informação precisa estar
organizada. Dentre as áreas do conhecimento, que faz uso da informação como matéria-
prima de estudo, está a CI, conhecida como um campo científico contemporâneo e que
ainda se encontra em plena formação, apresentando como grande característica a
interdisciplinaridade.
Devido à presença de áreas como a Biblioteconomia, na formação da CI, dentre
temáticas de estudo temos a organização da informação e do conhecimento, além do uso
e relação desta temática com as TIs. Levando-se em consideração tal afirmação,
Novellino (1996, p.37) afirma que:
[A CI] é uma disciplina voltada para o estudo de fenômenos subjacentes à produção, circulação e uso da informação. O estudo desses fenômenos tem como finalidade possibilitar a criação de instrumentos e o estabelecimento de metodologias que viabilizem a transferência de informações.
Buscando organizar a informação necessitamos representá-la de alguma forma. A
partir de sua representação, a informação poderá ser posteriormente recuperada. A
representação objetiva-se “permitir a recuperação de algo, no caso, a própria informação,
[...] uma vez que ela procura substituir aquilo que representa, algo que mantém
informações sobre um domínio qualquer e de forma semântica” (FURGERI, 2006, p.26).
Na CI, os estudos direcionados a esta questão se chama Representação Temática
da Informação, também chamada de análise da informação, descrição de conteúdo,
análise documentária, descrição de assunto, representação de conteúdo ou
representação de assunto. À Representação Temática da Informação atribui-se ao
conteúdo informacional dos documentos e permite identificação do tema ou do assunto a
que se refere, através de ações de indexação, elaboração de resumos, classificação,
disseminação, recuperação e busca.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
Para Miranda (2005, p.117), os processos da Representação Temática da
Informação ocorrem de acordo com as seguintes fases: “primeiro coletamos os dados e
as informações, segundo os classificamos usando um sistema de relações ontológicas, e,
finalmente os disponibilizamos para os usuários”.
O processo de Representação Temática da Informação permitirá a recuperação da
informação, ação esta intimamente relacionada às formas de armazenamento, que por
sua vez está relacionada ao tratamento/indexação e a organização/classificação da
informação, em um sistema.
A recuperação de informação engloba os aspectos intelectuais da descrição da
informação e de sua especificação para a busca, bem como qualquer sistema, técnica ou
máquina que são utilizadas para realizar a operação (MOOERS, 1951).
Cada fase da Representação Temática da Informação apresenta problemas,
entretanto, para muitos, devido à questão do excesso na quantidade e fluxo de
informação, especialmente no mundo digital, o real problema encontra-se na recuperação
da informação. Por outro lado, o ponto chave dessa problemática está na organização, ou
seja, na determinação “de um sistema de organização do conhecimento eficiente, que ao
ser adotado em SRI, em qualquer ambiente, funcione” (BERNERS-LEE, 2001, p.38).
A escolha do sistema de classificação a ser adotado pode ser considerada o ponto
chave para qualquer SRI, pois a classificação pode ser interpretada como “a principal
atividade neste processo” (MIRANDA, 2005, p.118). Veremos a seguir o sistema de
classificação bibliográfico chamado de Teoria da Classificação Facetada de Ranganathan.
3 A TEORIA DA CLASSIFICAÇÃO FACETADA DE RANGANATHAM
A classificação da informação e do conhecimento é uma das ações do processo de
Representação Temática da Informação, conforme explicitado anteriormente. Inúmeras
são as formas de classificação, criadas e adotadas até hoje. Consequentemente,
inúmeras também são as formas de definir classificação. Através dela, o homem elabora
o conhecimento necessário à sobrevivência.
De acordo com Lancaster (2004, p.21), “no campo do armazenamento e
recuperação da informação da informação, a classificação de documentos refere-se à
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
formação de classes de itens com base no conteúdo temático”. Essas relações formam os
Sistemas de Classificação. Segundo Langridge (1977), os sistemas de classificação,
também chamados de tabela, seria um mapa completo de qualquer área do
conhecimento, mostrando todos os seus conceitos e suas relações.
Entende-se, então, por sistemas de classificação um conjunto de classes,
organizado e apresentado de forma sistemática, levando-se em consideração
semelhanças e diferenças. Os elementos semelhantes ficarão na mesma classe, tomando
como base determinada organização e relação. A relação ocorre com base na união de
idéias, segundo o número de conjuntos parciais, coordenados e subordinados.
Muitos são os sistemas de classificação utilizados ao longo da história, a começar
pela Classificação Filosófica do Conhecimento. Em 1933, foi criado um sistema de
classificação bibliográfico pelo indiano Shiyali Ramamrita Ranganathan (1892-1972).
Ranganathan, matemático e bibliotecário, foi um dos estudiosos que mais contribuiu para
as teorias de classificação da Biblioteconomia, no século passado, especialmente na área
da classificação de assunto. Sua teoria objetivava garantir uma seqüência, considerada
útil, dos livros nas estantes, já que a preocupação principal era com a localização física,
dos livros em bibliotecas em relação ao tema central abordado na obra.
A enorme contribuição de Ranganathan em processos de
organização/classificação da informação sofre influência das culturas brâmane, chinesa,
além da astrologia. Ele acreditava que suas idéias abrangiam o universo como um todo.
Pensando desta forma e aliando Matemática e Biblioteconomia, Ranganathan viu-se
imerso na classificação de todo conhecimento. A partir daí, começou a se preocupar com
a forma que os assuntos estavam formados. Como resposta, verificou que ação de
organização/classificação ocorria por meio de cinco caminhos: “Dissecação, Laminação,
Desnudação, Reunião/Agregação e Superposição” (RANGANATHAN, 1967, p.351).
Dentre os caminhos apresentados, destacamos a Desnudação (Desnudation),
também chamada Desfolhamento. A Denudação provoca a diminuição progressiva da
extensão e o aumento da profundidade de um assunto básico ou de uma idéia isolada.
Ela permite a formação de cadeias e representa o núcleo específico de um assunto
básico ou de uma idéia isolada.
A partir de então, Ranganathan examinou o método da Decatomia, ou seja,
formação com dez divisões. Concluiu que, em vista do crescimento prolífico
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
multidimensional, a Decatomia não era satisfatória. A partir de sua verificação, sugeriu a
adoção da Policotomia Ilimitada, isto é, formação com número ilimitado de divisões das
áreas do conhecimento.
Os estudos de Ranganathan levaram-no a constatar a rigidez dos sistemas de
classificação do conhecimento, sendo necessária a criação de um sistema mais flexível.
Surge então uma estrutura facetada com síntese notacional, chamada de Teoria da
Classificação Facetada, também conhecida como Abordagem (classificação) Analítico-
Sintética e Classificação de Dois Pontos.
A estrutura criada por Ranganathan foi considerada inovadora na área da teoria da
classificação, vista por Campos (2001, p.31), “como o momento em que a teoria
tradicional é confrontada com a teoria moderna, ou que a teoria descritiva é confrontada
com a teoria dinâmica”.
O sistema de Ranganathan estruturou o conhecimento humano de maneira que os
assuntos compostos, sinteticamente, surgiam a partir de conceitos elementares. Para a
referida estruturação, cinco foram às categorias ou facetas estabelecidas por
Ranganathan, chamadas de PMEST. O [P] representa Personalidade (personality) como,
por exemplo, o termo bibliotecário. A categoria Personalidade é considerada, por muitos
estudiosos, como indefinível no caso do termo não se adaptar a nenhuma das outras
categorias. O [M] representa Material (material), como, por exemplo, livro. Já o [E]
representa Energia (energy), ou seja, as ações realizadas pelo item representante da
Personalidade, como, por exemplo, classificação. Quanto ao [S], este representa Espaço
(space), lugar: biblioteca central. E, por fim, o Tempo (time) [T] que representa períodos,
como o termo hoje.
Barbosa (1969) defende que analisar um assunto por facetas, significa que cada
aspecto de determinado assunto pode ser visto como as manifestações de certas
características ou facetas, sujeito à postulados pré-determinados. O sistema torna-se
assim, multidimensional e ilimitado.
Alguns autores apontam a insuficiência dessa lista sugerindo sua ampliação por
meio de estudos como o realizado pelo Classification Research Group (CRG). Criado em
1955, na Inglaterra e tendo Mills, Foskett, Farradane, Vickery e Langridge como
estudiosos. O CRG tem como objeto apresentar uma nova versão de mais fácil
compreensão do PMEST, propondo as seguintes categorias: Tipos de produto final;
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
Partes; Materiais; Propriedades; Processos; Operações; Agentes; Espaço; Tempo e
Forma de apresentação.
De acordo com Piedade (1983, p.22), nas categorias propostas pelo CRG, “a razão
de ser do estudo do assunto a classificar é o seu produto final”. O entendimento de
categorizar a produção final torna-se mais compreensível na exemplificação de Vital
(2007, p.94):
No caso de um setor de desenvolvimento de sistemas, por exemplo, o produto final é o software; suas partes são os diferentes aplicativos; seu material é o disco óptico; a propriedade, como qualidades do produto final, é, no caso do software, a portabilidade; os processos são a instalação dos programas, o gerenciamento de dados; as operações são planejar, projetar e desenhar; o agente é o programador e a forma de apresentação é o cd- rom, por exemplo.
É possível considerar como grande mérito de estudo do CRG, a utilização de uma
estrutura dinâmica, multidimensional, graças à introdução do termo faceta “que ficou
sendo, nos modernos estudos sobre teoria da classificação, o substituto de característica”
(BARBOSA, 1969, p.16).
Vital (2007, p.40) defende que na Teoria da Classificação Facetada de
Ranganathan ocorre “a contemplação das relações entre os termos, formando um todo
coerente. Pela organização hierárquica, flexível e pós-coordenada, é possível visualizar o
conceito e suas possíveis relações, que variam para cada documento”.
4 ORGANIZAÇÃO E RECUPERAÇÃO DA INFORMAÇÃO EM AMBIENTES DIGITAIS: Banco de Dados (BD)
A partir do advento das TIs, a produção e a disseminação de informações
aumentam em proporção crescente. As informações, antes presentes apenas no colo dos
livros, hoje passa a ser incorporadas a outros suportes: DVD-ROMs, Pendrives,
programas de computador em geral, Internet entre outros. Com isso, o conhecimento
ultrapassa limites, barreiras e torna-se volátil, digital.
Nos ambientes digitais, provenientes da CC, há formas de tratar, armazenar e
recuperar a informação. Dentre essas formas, Miranda (2005, p.71-72) destaca “as bases
de dados automatizadas, os hipertextos [e inteligência artificial]; a modelagem de dados; e
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
a rede de comunicação eletrônica”. No caso deste artigo, os recursos computacionais a
serem destacados serão as bases de dados automatizadas e a modelagem de dados.
A programação dos recursos computacionais citados anteriormente tem aumentado
consideravelmente nos últimos tempos. Por menores que sejam suas aplicações, sua
adoção tem estado em pauta no momento de escolha da forma computacional de
tratamento da informação a ser adotada, que neste caso, será a programação em BD.
Segundo Pazin (2007, p.1), BD pode ser definido como “uma coleção de dados
relacionados, organizados e armazenados visando facilitar a manipulação desses dados,
permitindo realizar alterações, inserções, remoções e consultas”. Já para Date (2003,
p.10), BD “é uma coleção de dados persistentes, usada pelos sistemas de aplicação de
uma determinada empresa”.
Conforme Silva (2007), os BDs informatizados podem ser usados para aplicações
de cadastro e comunicação na Internet, governos, comércio, logística, bibliotecas e
serviços cartoriais. Além disso, outra forma de aplicação dos BDs está na composição das
bases de dados. Para Yong (1986, p.18), “uma base de dados é constituída de um
conjunto de arquivos relacionados entre si”.
Incorporado a estas bases, os BDs agrupam os registros utilizáveis para um
mesmo fim, permitindo a recuperação das informações nela presentes. Um BD é
desenvolvido, mantido e acessado por meio de um software, conhecido como Sistema
Gerenciador de Banco de Dados (SGBD). São exatamente os SGBDs que realizam,
produzem, programam, compilam os BDs, adotando a modelagem de dados.
Entre o banco de dados físico – ou seja, os dados fisicamente armazenados – e os usuários do sistema, existe uma camada de software, conhecida como gerenciador de banco de dados ou servidor de banco de dados ou, mais frequentemente, como sistema de gerenciamento de banco de dados (SGBD) (DATE, 2003, p.8).
A união dos BDs com os SGBDs formam um ambiente denominado Sistema de
Banco de Dados (SBD). Segundo Heuser (2004, p.5), SGBD é “um software que
incorpora as funções de definição, recuperação e alteração de dados em um banco de
dados”.
O SBD é definido por Date (2003, p.6), como “um sistema computadorizado cuja
finalidade geral é armazenar informações e permitir que os usuários busquem e atualizem
essas informações quando as solicitar”. É o resultado final de um processo de
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
programação, ou seja, aplicações como programas para Internet, biblioteca entre outras.
Assim, com tantas nomenclaturas, torna-se comum os termos BD e SGDB serem
adotados como sinônimos pelos profissionais da computação.
Quanto aos tipos de BDs, atualmente, as possibilidades de escolhas são as mais
variadas. Dentre as opções citemos: Oracle, SQL Server, MySQL, Sybase, Jasmine,
PostgreSQL, Firebird, Microsoft Visual FoxPro, Microsoft Access, dBASE entre outros.
Cada um tem características próprias, o que os tornam vantajosos, ou não, para
determinados tipos de aplicação.
Os BDs, além dos tipos apresentados, também são classificados segundo a forma
como os dados podem ser armazenados e posteriormente acessados. Dentre as
principais formas de programação em BDs, temos a programação orientanda a objetos
(POO) e o modelo relacional.
Nesta pesquisa, após estudos com base na busca pela adaptação da Teoria da
Classificação Facetada na programação em BD, o SBD, resultante deste trabalho, será
desenvolvido na linguagem SQL, usando a plataforma do SGBD Microsoft Office Access.
Além disso, também se deve determinar a técnica de modelagem de dados, conforme
será abordado a seguir.
4.1 A Modelagem de Dados em Banco de Dados (BD)
No ambiente digital, a modelagem de dados procura representar e organizar o
conhecimento com base na criação de uma estrutura de dados eletrônicos, como os BDs,
que representam um conjunto de informações.
A modelagem de dados é outra forma de organizar a informação visando recuperá-
la em ambientes digitais. Conforme Miranda (2005, p.72), “esta técnica consiste em se
estabelecer um modelo de entrada e tratamento de dados a serem armazenados num
sistema de informação”.
A técnica de modelagem é realizada nas atividades desenvolvidas pelos analistas
de sistema e programadores em geral. Além desses profissionais, outros também
assumem interesse pela técnica, em especial, os profissionais da informação como os
bibliotecários e cientistas da informação. Tal interesse se deve à explosão da informação,
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
ocasionada pelos adventos das TIs e, conseqüentemente, suas influências provocadas na
sociedade.
Esta estrutura permite, ao usuário, recuperar dados de forma rápida e eficiente,
cujo objetivo é incluir dados em uma estrutura que possibilita transformar os dados
originais em vários tipos de saídas: formulários, relatórios, etiquetas ou gráficos
(MIRANDA, 2005).
Dentre as características da modelagem de dados e BDs, estas podem ser
classificadas de duas formas: Programação Orientanda a Objetos (POO) e Modelo
Relacional, conforme já apresentado. Segundo Ricarte (2001), “o termo programação
orientada a objetos pressupõe uma organização de software em termos de coleção de
objetos discretos incorporando estrutura e comportamento próprios”. Já o modelo
relacional é a maneira computacional de armazenar, manipular e recuperar dados
estruturados unicamente na forma de tabelas, construindo um BD.
Pazin (2007, p.3) também apresenta os seguintes entendimentos:
[POO] representam os dados como coleções (termos) que obedecem propriedades. São modelos geralmente conceituais dispondo de pouquíssimas aplicações reais. Cada objeto tem características próprias (atributos) com ações próprias (métodos). [...] O Modelo de Dados relacional representa os dados contidos em um Banco de Dados através de relações. Estas relações contêm informações sobre as entidades representadas e seus relacionamentos.
O modelo relacional é claramente baseado no conceito de matrizes, onde as
chamadas linhas (das matrizes) seriam os registros e as colunas (das matrizes) seriam os
campos a serem preenchidos pelos dados cadastrais. Os nomes das tabelas e dos
campos são de fundamental importância para nossa compreensão entre o que está sendo
armazenado, onde estamos armazenando e a relação existente entre os dados
armazenados.
Um dos grandes benefícios deste tipo de modelo é a possibilidade de as relações
não serem duplicadas, ou seja, não permitirem a existência de mais de um dado
semelhante, caso seja necessário. Esta característica ocorre devido à chamada Chave
Primária. Ao atribuir esta chave a um dado, este deverá ser único no sistema, como os
números de Identidade (registro) e do Cadastro de Pessoa Física (CPF).
Na modelagem de dados, portanto, este artigo utilizará o modelo relacional, pois,
tomando como base as palavras de Costa (1996), esta técnica consiste em estabelecer
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
um modelo para entrada e tratamento de dados a serem armazenados num sistema de
informação, a fim de se evitar a duplicação de esforços e possibilitar o acesso simultâneo
por diversos usuários, utilizando vários aplicativos. Desta forma, de acordo com Furtado e
Santos (1980, p.370), “no modelo relacional os elos são implícitos”.
Para Heuser (2004, p.94), “um modelo de banco de dados relacional deve conter
no mínimo a definição dos seguintes itens: tabelas que formam o banco de dados;
colunas que as tabelas possuem; e restrições de integridade”.
No desenvolvimento da pesquisa, tomando como base Miranda (2005),
pretendemos adotar o funcionamento da modelagem de dados da seguinte forma:
Preparar uma lista, com todos os objetos integrantes da coleção de dados e os
fatores que os mesmos possuem. Cada objeto pode ser considerado como uma
entidade única, correspondente a um assunto;
Determinar as relações entre os objetos, escolher um objeto e verificar se tal objeto
se relaciona com outro. Entretanto, se faz necessário salientar que, nem sempre
todas as relações existentes serão consideradas importantes. Aquelas que
realmente forem importantes, permitirão a modelagem do BD de forma que
correspondam às situações do mundo real.
Na modelagem de dados os relacionamentos podem ser Relação do tipo Um para
Um; Relação do tipo Um para Vários e Relação do tipo Vários para Vários. A Relação do
tipo Um para Um existe quando os campos que se relacionam são ambos únicos em suas
respectivas Tabelas. Cada um dos campos apresenta valores não repetidos. Na prática
há poucas situações onde se utiliza este tipo de relacionamento. A Relação do tipo Um
para Vários ocorre quando uma das Tabelas possui um campo considerado Dado Único,
ou seja, que não pode ser repetido, com outra Tabela, que possui um campo, cujos
valores podem se repetir várias vezes. Este tipo de relacionamento é o mais adotado. Por
fim, a Relação do tipo Vários para Vários surge quando os dois campos, de cada Tabela,
que se relacionam, podem repetir seus dados (BATTIST, 2004).
Com base na fundamentação teórica apresentada, buscamos utilizar a teoria de um
sistema de classificação bibliográfico da CI, aplicado em ambientes físicos, como as
bibliotecas, em um ambiente digital proveniente da CC. Neste caso, adotamos a Teoria da
Classificação Facetada em BD, percorrendo as etapas apresentadas a seguir.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
7 PERCURSO METODOLÓGICO
No campo da pesquisa, a metodologia científica desempenha papel fundamental. A
metodologia tem a função de mostrar como andar no “meio das pedras” da investigação,
ajudando a refletir e a instigar um novo olhar sobre o mundo: um olhar curioso, indagador
e criativo.
Para a realização desta investigação, delineou-se um percurso metodológico
formado por uma pesquisa exploratória e bibliográfica, por meio de métodos e técnicas a
fim de se atingir os objetivos propostos.
A pesquisa exploratória nos permitiu ter maior familiaridade com o problema
encontrado, com vistas a torná-lo explícito, exigindo a descoberta de práticas ou diretrizes
que pudessem ser usadas como alternativa ou apresentassem subsídios para a criação
de novos procedimentos, conforme as necessidades apresentadas neste artigo.
Também foi realizada uma pesquisa bibliográfica que abrangeu a leitura, análise e
interpretação de informações em periódicos científicos, dissertações, teses, repositórios
digitais e bibliografia especializada.
Esta pesquisa está sendo realizada para analisar a adoção da Teoria da
Classificação Facetada em BD para organização do conhecimento, por meio dos
elementos básicos e das etapas para a construção de um sistema que será denominado
de Sistema Facetado em BD. Este sistema será implantado numa Instituição vinculada ao
Governo do Estado da Paraíba que promove ações de cidadania e capacitação por meio
de cursos profissionalizantes, ao qual chamaremos de Instituição X. O Sistema Facetado
será desenvolvido para organizar a informação e permitir uma recuperação mais precisa
na respectiva Instituição.
O Sistema Facetado em BD será testado por usuários escolhidos pela Instituição,
segundo os pré-requisitos, a saber: trabalhar com necessidades de organização e
recuperação da informação; ser escolhido pelos superiores da Instituição; e possuir
conhecimentos básicos em informática.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
8 RESULTADOS PARCIAIS DA PESQUISA: elementos básicos e etapas para a
construção do Sistema Facetado em BD
Devido ao problema de recuperação da informação, ocasionado pela atual
organização da informação na Instituição, que está sendo pesquisada, buscamos adotar
um dos cinco caminhos propostos por Ranganathan: a Desnudação. O referido caminho
provoca diminuição progressiva da extensão e aumento da profundidade de um assunto
básico ou de uma idéia isolada. O citado caminho foi escolhido devido à necessidade de
tentar especificar ao máximo o conteúdo informacional presente na comunidade. Até o
momento, as informações amostravam termos representativos, considerados gerais,
dificultando a recuperação precisa.
Além da Desnudação, também serão utilizados o PMEST por meio da análise
facetada. Segundo Duarte & Cirqueira (2007), a análise facetada é usada, primeiramente,
para criar classificações para o arranjo físico de fontes originais, na tentativa de criação
de seu substituto. Em outras palavras, embora a classificação facetada seja considerada,
por muitos, como uma estrutura de características específicas, a análise é essencialmente
uma técnica, que permite diferentes modelos do mesmo universo de discurso ser
derivados, aceitando-se, desta forma, necessidades locais ou peculiaridades sistêmicas,
através de categorias e variações diferentes na sintaxe.
A análise facetada nos permite incorporar propriedades adicionais às informações
a serem organizadas na Instituição, sejam elas textuais ou multimídia, além de fornecer
dados para a análise das categorias de dados presentes no BD, afetando, assim, a
sintaxe potencial do sistema. Porém, para adicionar novas propriedades e alterar a leitura
de sintaxe dos sistemas é necessário, segundo Lima (2002, p.190), examinar “a literatura
do assunto a fim de identificar seus conceitos e termos, estabelecendo-se suas
características e facetas”. Concluída esta análise, deve-se levantar e definir a terminologia
do assunto, para que, posteriormente, os termos ou dados presentes no BD sejam
analisados e distribuídos em facetas.
Realizar a distribuição em facetas poderá ser considerada positiva no referido
ambiente, já que tais facetas são inerentes ao assunto ou campo principal. Dentro de
cada faceta, os termos que as constituírem estarão aptos a novos agrupamentos pela
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
aplicação de outras características ou classes divisionais, dando origem às facetas
menores, que chamaremos de subfacetas.
Conforme Duarte & Cerqueira (2007), os termos, nas subfacetas, são mutuamente
exclusivos, ou seja, não devem sobrepor-se à formação de assuntos compostos. Diante
disso, os elementos básicos para a construção do Sistema Facetado no BD serão os
seguintes:
1. Inicialmente, o BD precisará de uma quantidade mínima e básica de facetas para a
sua utilização. Estas facetas, que podemos chamá-las de facetas principais, serão
pré-determinadas pelos superiores da Instituição em pesquisa. Tal pré-
determinação ocorrerá logo após o primeiro momento do desenvolvimento do
protótipo. Com isso, estas facetas poderão ser consideradas fundamentais para a
utilização inicial do BD e para adaptação das atividades, anteriormente manuais,
para a forma automatizada;
2. Posteriormente, novas facetas e subfacetas poderão ser estabelecidas, tanto pelo
programador, quanto pelos usuários. No caso deste último, pretende-se permitir
que eles mesmos criem facetas, caso os termos de classificação desejados não
estejam presentes no ambiente computacional;
3. Além de criar as facetas, é importante determinar a ordem de citação em que elas
serão apresentadas no sistema de classificação, para que, posteriormente,
ordenem-se todos os elementos em ordem de arquivamento, o que permitirá
colocar o assunto geral ou campo principal antes do específico.
Após as etapas apresentadas, acreditamos que o sistema estará pronto para
receber uma notação, permitindo a inclusão de novas classes e atingindo o melhor nível
possível na recuperação da informação.
Ao final de cada etapa, as novas classificações serão somadas às existentes no
sistema formando uma classificação geral, no intitulado Sistema Facetado, cujo poderá
ser alterado futuramente para outro título, tanto por exigência dos superiores da
Instituição de implantação, quanto pelo pesquisador ou sua orientadora.
No que diz respeito à recuperação das informações presentes no sistema,
pretende-se disponibilizá-las, através da busca pelas facetas e subfacetas. Desta forma,
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
todas as informações associadas às respectivas facetas serão apresentadas para a sua
posterior recuperação.
Dentre as características dos sistemas de classificação, foi exatamente a
flexibilidade, ou seja, a possibilidade de criar e recriar novos agrupamentos entre as
facetas sem alterar significativamente a estrutura da programação realizada em
ambientes digitais, no caso deste artigo, no BD, que propiciou a escolha para este
trabalho.
Quanto à colaboração das teorias da CI na elaboração do protótipo do BD,
pretende-se apresentar uma estrutura formada pela organização e recuperação da
informação, através da classificação em facetas de Ranganathan. Acredita-se que este
sistema vai além de sua utilização em livros, ordenando e classificando os mais variados
suportes informacionais, especialmente os digitais.
Na perspectiva da CC, pretendemos apresentar um BD com inúmeros
relacionamentos entre as tabelas e dados, através da técnica de modelagem de dados. A
técnica de programação será o modelo relacional devido à criação de vínculos entre os
dados do sistema, a não duplicação de esforços na programação e o acesso simultâneo
por diversos usuários à mesma informação. Por fim, caso seja de interesse ou
necessidade do programador, segundo Barbosa (1972), é possível criar um índice com
todos os termos e suas respectivas notações.
Quanto às etapas de construção do protótipo, concluído os estudos teóricos,
iniciou-se o desenvolvimento do Sistema Facetado em BD. Este desenvolvimento divide-
se em dois momentos:
1. O primeiro momento representa a elaboração de um planejamento, para discutir a
estrutura física do BD, seus campos e facetas básicas, para iniciar a programação:
o Examinar a literatura do assunto;
o Levantar e definir a terminologia do assunto para que posteriormente os
dados sejam analisados e distribuídos em facetas;
o Relacionar campos e facetas, por meio da modelagem de dados;
2. O segundo momento ocorrerá, após conclusão da programação do BD, ou seja, o
sistema pronto, usuários selecionados, de acordo com critérios pré-estabelecidos,
testarão o BD.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
9 CONSIDERAÇÕES FINAIS
Diante do relato apresentado percebemos a importância do desenvolvimento de
estudos voltados à organização e classificação da informação em ambientes digitais,
como aqui expostos, em Banco de Dados (BD).
Entendemos que o problema da recuperação da informação não relevante pelo
usuário, numa gama informacional cada vez maior, não é uma problemática dos sistemas
de recuperação da informação (SRIs) e sim da forma como esta gama informacional vem
sendo organizada.
Buscamos nas práticas da CI, enraizadas na Biblioteconomia, mais
especificamente, nas bibliotecas tradicionais, sistemas de classificação chamados
bibliográficos, originalmente criados e usados em coleções de livros. Entretanto,
características desses sistemas como a organicidade de assuntos e as relações entre
eles são plausíveis de aplicação em ambientes digitais..
Almejamos, portanto, adotar a Teoria da Classificação Facetada em um ambiente
digital, neste caso, BD e, após estudos, muitas foram às semelhanças encontradas.
Dentre elas, percebemos que, assim como na classificação facetada, os sistemas
computacionais por modelagem de dados também objetivam a estruturação do
conhecimento, através da organização de seus conceitos e da criação de
relacionamentos entre eles, permitindo o mapeamento de uma área de assunto e a
inclusão de novos conceitos, sem que isto altere a estrutura do sistema.
As apresentadas constatações nos permitiram a definição dos elementos básicos e
das etapas para a construção do Sistema Facetado em BD. A partir deste momento, a
teoria facetada será implantada no BD. Em seguida, concluída a primeira etapa, o
protótipo será aplicado aos usuários selecionados, conforme os pré-requisitos
estabelecidos pela Instituição X.
Após a segunda etapa, com o protótipo finalizado e testado pelos usuários, dados
para a pesquisa serão coletados por meio de questionário, apresentando se de fato o uso
da Teoria da Classificação Facetada é possível de ser adotado em ambientes digitais e
quais contribuições este sistema de classificação pode oferecer ao respectivo ambiente.
Acreditamos na importância do presente estudo, que nos mostram a importância da
interdisciplinaridade entre áreas de conhecimento, como Ciência da Informação (CI) e
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
Ciência da Computação (CC), e o quanto ambas as áreas podem trazer em contribuições,
tanto para a sua própria área do conhecimento, como para outras áreas. Este artigo
apresentou o interesse de realizar testes para a aplicação de estudos da CI (sistema de
classificação), para solucionar problemas presentes em ambientes da CC (BDs).
ABSTRACT: The study presents the Theory Faceted Classification and Database as
elements that have similarities, since they share the objective of structuring the knowledge
by organizing their concepts and creating relationships between them. The five categories
established by Ranganathan and facets in this system called PMEST are cited: Person, Material, Energy, Space and Time. From an investigation exploratory and of literature, grounded in scientific journals, specialized literature and websites, this study seeks to
analyze the possibility of adoption of the theory of faceted classification in databases for knowledge organization. The necessary actions for the adoption of faceted classification in
BDs are defined. The technical programming in databases in the data modeling is
determined. As a partial result of this investigation, we have the determination the basic
elements and steps for building the system faceted into the database. Believe that studies
like this show us the importance of interdisciplinary Information Science (IC) and Computer Science (CC), and both can cause numerous contributions, both for itself and for other areas.
Keywords: Representation of Information. Classification. Theory Faceted Classification of Ranganathan. Information Technology. Database. Data Modeling.
REFERÊNCIAS:
BARBOSA, A. P. Classificações facetadas. In: Ci. Inf. Rio de Janeiro, v.1, n. 2, p. 73-81,
1972.
______. Teoria e prática dos sistemas de classificação bibliográfica. Rio de Janeiro: Instituto Brasileiro de Bibliografia e Documentação, 1969.
BATTIST, J. C. F. Treinamento: access – técnicas avançadas. Santa Maria, 2004. (CD-
ROM).
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic WEB. In: Scientific
American, New York, v. 284, no. 5, p. 35-43, May 2001. BORKO, H. Information science: what is it? American Documentation, Jan. 1968.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
CAMPOS, M. L. de A. Linguagem documentária: teorias que fundamentam sua
elaboração. Niterói: Ed. da UFF, 2001.
CAPURRO, R. Epistemologia e Ciência da Informação. In: V Encontro Nacional de
Pesquisa em Ciência da Informação - ENANCIB, Belo Horizonte, 11-2003.
COSTA, A. B. Modelagem de Dados: coisa do passado? Byte, Rio de Janeiro, jun. 1996.
DATE, C. J. Introdução a Sistemas de Bancos de Dados. Rio de Janeiro: Elsevier, 2003. Tradução da 8º edição americana.
DUARTE, E. A.; CERQUEIRA, R. F. P. de. Análise Facetada: um olhar face a modelagem
conceitual. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 39-52, jan./jun. 2007.
FURGERI, S. Representação de informação e conhecimento: estudo das diferentes
abordagens entre a ciência da informação e a ciência da computação. Campinas: PUC-
Campinas, 2006.
FURTADO, A. L.; SANTOS, C. S. dos. Organização de Banco de Dados. 2. ed. Rio de
Janeiro: Campus, 1980.
HEUSER, C. A. Projeto de Banco de Dados. 5. ed. UFRGS: Editora Sagra Luzzanato, 2004. (Série Livros Didáticos).
LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Trad. de Antonio
Agenor Briquet de Lemos. Brasília: Briquet de Lemos/Livros, 2004.
LANGRIDGE, D. Classificação: uma abordagem para estudantes de Biblioteconomia.
Tradução de Rosali Pacheco Fernandez. Rio de Janeiro: Interciência, 1977.
LIMA, G.A.B. A análise facetada na modelagem conceitual de sistemas de Hipertexto: uma revisão de literatura. In: Perspectiva em Ciência da Informação., Belo Horizonte, v. 7, n. 2, p. 189-196, jul./dez. 2002.
MIRANDA, M. L. C. de. Organização e Representação do Conhecimento:
fundamentos teórico-metodológico na busca e recuperação da informação em
ambientes virtuais. 2005, 353f. Tese (doutorado em Ciência da Informação). Curso de
Pós Graduação em Ciência da Informação – Convênio CNPQ/IBICT – UFRJ/ECO, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2005.
MOOERS, C.N. Zatocoding applied to mechanical organization of knowledge. American
Documentation, v. 2, p. 20-32, 1951.
NOVELLINO, M. S. F. Instrumentos e Metodologias de Representação da Informação. In: Informação e Informação, Londrina, v.1, n.2, p.37-45, jul./dez. 1996.
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação
Rio de Janeiro, 25 a 28 de outubro de 2010
PAZIN, A. Introdução a Banco de Dados e Structured Query Language (SQL). São
Paulo: Colégio Salesiano Dom Henrique Mourão, 2007. Parte I (apostila).
PIEDADE, M. Introdução à teoria da classificação. 2. ed. ver. e ampl. Rio de Janeiro: Interciência, 1983.
RANGANATHAN, S. R. Prolegomena to library classification. Bombay: Asia Publ. House, 1967.
RICARTE, I. L. M. Programação Orientada a Objetos com C ++. Versão preliminar
(apostila). Campinas: Universidade Estadual de Campinas, 2001.
SILVA, M. B. da. Introdução à Microinformática. João Pessoa: CENDAC, 2007. 209 p. (Apostila).
VITAL, L. P. Recomendações para Construção de Taxonomia em Portais
Corporativos. Florianópolis, 2007. 113 p. Dissertação (Mestrado em Ciência da
Informação) - Universidade Federal de Santa Catarina - UFSC, Florianópolis, 2007
YONG, C. S. Banco de Dados – Organização, sistemas e administração. São Paulo: Editora Atlas S. A, 1986.
Recommended