20
XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação Rio de Janeiro, 25 a 28 de outubro de 2010 GT 2: Organização e Representação do Conhecimento Modalidade de apresentação: pôster ESTUDO SOBRE O USO DA TEORIA DA CLASSIFICAÇÃO FACETADA EM BANCO DE DADOS Márcio Bezerra da Silva Universidade Federal da Paraíba Dulce Amélia de Brito Neves Universidade Federal da Paraíba Resumo: Pesquisa em andamento que apresenta a Teoria da Classificação Facetada e os Bancos de Dados (BDs) como elementos que possibilitam a estruturação do conhecimento através da organização de conceitos e da criação de relacionamentos. São elencadas as cinco categorias ou facetas estabelecidas por Ranganathan neste sistema, chamadas de PMEST: Personalidade, Material, Energia, Espaço e Tempo. Objetiva-se, a partir de uma pesquisa exploratória e bibliográfica, embasada em periódicos científicos, dissertações, teses, repositórios digitais e bibliografia especializada, analisar a adoção da teoria da classificação facetada em banco de dados para organização do conhecimento. Também se almeja definir as ações necessárias para a adoção da classificação facetada em banco de dados e determinar a técnica de programação em banco de dados na modelagem de dados. Apresenta como resultados parciais da pesquisa a determinação dos elementos básicos e das etapas para a construção de um sistema facetado em BD. Acredita-se que estudos como este mostram a importância da interdisciplinaridade, entre a Ciência da Informação (CI) e a Ciência da Computação (CC), e que ambas podem trazer inúmeras contribuições, tanto para a sua própria área do conhecimento, como para outras áreas. Palavras-chave: Representação da Informação. Classificação. Teoria da Classificação Facetada de Ranganathan. Tecnologia da Informação. Banco de Dados. Modelagem de Dados.

de em da Janeiro,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

GT 2: Organização e Representação do Conhecimento

Modalidade de apresentação: pôster

ESTUDO SOBRE O USO DA TEORIA DA CLASSIFICAÇÃO FACETADA

EM BANCO DE DADOS

Márcio Bezerra da Silva Universidade Federal da Paraíba

Dulce Amélia de Brito Neves Universidade Federal da Paraíba

Resumo: Pesquisa em andamento que apresenta a Teoria da Classificação Facetada e

os Bancos de Dados (BDs) como elementos que possibilitam a estruturação do

conhecimento através da organização de conceitos e da criação de relacionamentos. São

elencadas as cinco categorias ou facetas estabelecidas por Ranganathan neste sistema, chamadas de PMEST: Personalidade, Material, Energia, Espaço e Tempo. Objetiva-se, a

partir de uma pesquisa exploratória e bibliográfica, embasada em periódicos científicos, dissertações, teses, repositórios digitais e bibliografia especializada, analisar a adoção da

teoria da classificação facetada em banco de dados para organização do conhecimento. Também se almeja definir as ações necessárias para a adoção da classificação facetada

em banco de dados e determinar a técnica de programação em banco de dados na

modelagem de dados. Apresenta como resultados parciais da pesquisa a determinação

dos elementos básicos e das etapas para a construção de um sistema facetado em BD. Acredita-se que estudos como este mostram a importância da interdisciplinaridade, entre

a Ciência da Informação (CI) e a Ciência da Computação (CC), e que ambas podem

trazer inúmeras contribuições, tanto para a sua própria área do conhecimento, como para

outras áreas.

Palavras-chave: Representação da Informação. Classificação. Teoria da Classificação

Facetada de Ranganathan. Tecnologia da Informação. Banco de Dados. Modelagem de

Dados.

Page 2: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

1 INTRODUÇÃO

No cotidiano social dos indivíduos, a informação pode ser considerada um bem

essencial que direciona e determina suas ações, num processo de constante mudança. A

partir das informações adquiridas, os indivíduos passam a compreender o mundo que o

cerca.

As informações adquiridas necessitam de organicidade, exigindo dos indivíduos

formas de classificá-las. Esta ação ocorre ao longo dos tempos, apresentando diversas

formas e técnicas, usadas para organizar o conhecimento humano. Dentre as áreas do

conhecimento que adotam as técnicas de organização/classificação da informação,

destacamos a Ciência da Informação (CI).

A CI é uma área de estudo interdisciplinar. Surgiu por volta da Segunda Guerra

Mundial e vem ao longo da historia dialogando com outras áreas do conhecimento como

Biblioteconomia, Matemática, Lógica, Lingüística, Psicologia, Ciência Cognitiva, Ciência

da Computação (CC), e Comunicação entre outras. A CI é conceituada, por Borko (1968),

como uma disciplina que investiga as propriedades e o comportamento da informação, as

forças que regem o fluxo informacional e os meios de processamento da informação,

Capurro (2003) ressalta que a CI essencialmente busca a produção, seleção,

organização, interpretação, armazenamento, recuperação, disseminação, transformação

e uso da informação. Estas ações não ocorrem apenas em ambientes físicos, como as

Bibliotecas Tradicionais. Ocorrem também em ambientes virtuais como a Web,

propiciadas por inúmeros fatores, especialmente a globalização que, nos últimos tempos,

vem acarretando na eliminação das barreiras de acesso ao conhecimento, produzido pela

humanidade. Fato marcado pelas Tecnologias da Informação (TIs), aos quais vêm

contribuindo para o aumento e a facilidade de acesso à informação.

Dentre as várias tecnologias, provenientes da globalização, podemos citar os

computadores e a Internet. Os citados elementos interferem na relação do homem com o

mundo que o cerca, passando a influenciar diretamente nas questões econômicas,

políticas e sociais. Como consequência de tal afirmação é possível observar que a

construção das sociedades tem se diferenciado enormemente de tempos anteriores,

exigindo maior organicidade e novas formas de classificar a informação.

Page 3: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

As observações apontadas, quanto à classificação da informação, propiciaram

perspectivas de estudos, entre as quais citemos A análise facetada na modelagem

conceitual de sistemas de hipertexto, de Lima (2002); e Organização e Representação do

Conhecimento, de Miranda (2005). Ambos os estudos apresentam a necessidade de um

enfoque sistemático no que tange a organização do conhecimento em ambientes digitais,

especialmente no que se refere ao aumento incontrolável de informações geradas pelas

TIs.

Tendo em vista a busca por respostas, para atender as necessidades específicas

de uma comunidade, determinou-se a criação de uma ferramenta digital para organizar e

recuperar a informação. A comunidade em pauta, que chamaremos neste trabalho de

Instituição X, está vinculada ao Governo do Estado da Paraíba, promovendo à cidadania

e capacitação por meio de cursos profissionalizantes. Dentre as formas consultadas, a

escolhida foi Banco de Dados (BD), já que permite a organização, o armazenamento e o

relacionamento entre os dados. Depois de cadastrados, os dados podem ser alterados,

removidos e consultados.

Entretanto, escolher apenas uma forma de tratar, armazenar e recuperar as

informações no âmbito digital, proveniente da CC, possivelmente não resolveria os

problemas da Instituição. Sendo assim, buscou-se, na CI, maneiras de organizar e

classificar a informação. Dentre os sistemas de classificação bibliográficos consultados, o

que se destacou foi à classificação facetada do indiano Shialy Rammarita Ranganathan

(1897-1972).

O sistema de Ranganathan permite a estruturação do conhecimento, através da

organização de conceitos e da criação de relacionamentos, permitindo o mapeamento de

uma área de assunto, assim como ocorrem em BDs. Além disso, a classificação facetada

possibilita a inclusão de novos conceitos sem que isto altere a estrutura do sistema,

característica determinante para a sua escolha.

Para a construção da ferramenta digital, a ser chamada de Sistema Facetado em

BD, objetivamos analisar a adoção da teoria da classificação facetada em banco de dados

para organização do conhecimento. Além disso, também nos preocupamos em definir as

ações necessárias para a adoção da classificação facetada em banco de dados e

determinar a técnica de programação em banco de dados na modelagem de dados.

Page 4: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

Com isso, no caminhar dos objetivos propostos, desenvolvemos a investigação

conforme explicitaremos abaixo.

2 A CIÊNCIA DA INFORMAÇÃO NA REPRESENTAÇÃO DA INFORMAÇÃO

A informação, nos últimos tempos, vem se tornando o elemento direcionador na

vida de todos na sociedade. Devido a esta importância, a informação precisa estar

organizada. Dentre as áreas do conhecimento, que faz uso da informação como matéria-

prima de estudo, está a CI, conhecida como um campo científico contemporâneo e que

ainda se encontra em plena formação, apresentando como grande característica a

interdisciplinaridade.

Devido à presença de áreas como a Biblioteconomia, na formação da CI, dentre

temáticas de estudo temos a organização da informação e do conhecimento, além do uso

e relação desta temática com as TIs. Levando-se em consideração tal afirmação,

Novellino (1996, p.37) afirma que:

[A CI] é uma disciplina voltada para o estudo de fenômenos subjacentes à produção, circulação e uso da informação. O estudo desses fenômenos tem como finalidade possibilitar a criação de instrumentos e o estabelecimento de metodologias que viabilizem a transferência de informações.

Buscando organizar a informação necessitamos representá-la de alguma forma. A

partir de sua representação, a informação poderá ser posteriormente recuperada. A

representação objetiva-se “permitir a recuperação de algo, no caso, a própria informação,

[...] uma vez que ela procura substituir aquilo que representa, algo que mantém

informações sobre um domínio qualquer e de forma semântica” (FURGERI, 2006, p.26).

Na CI, os estudos direcionados a esta questão se chama Representação Temática

da Informação, também chamada de análise da informação, descrição de conteúdo,

análise documentária, descrição de assunto, representação de conteúdo ou

representação de assunto. À Representação Temática da Informação atribui-se ao

conteúdo informacional dos documentos e permite identificação do tema ou do assunto a

que se refere, através de ações de indexação, elaboração de resumos, classificação,

disseminação, recuperação e busca.

Page 5: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

Para Miranda (2005, p.117), os processos da Representação Temática da

Informação ocorrem de acordo com as seguintes fases: “primeiro coletamos os dados e

as informações, segundo os classificamos usando um sistema de relações ontológicas, e,

finalmente os disponibilizamos para os usuários”.

O processo de Representação Temática da Informação permitirá a recuperação da

informação, ação esta intimamente relacionada às formas de armazenamento, que por

sua vez está relacionada ao tratamento/indexação e a organização/classificação da

informação, em um sistema.

A recuperação de informação engloba os aspectos intelectuais da descrição da

informação e de sua especificação para a busca, bem como qualquer sistema, técnica ou

máquina que são utilizadas para realizar a operação (MOOERS, 1951).

Cada fase da Representação Temática da Informação apresenta problemas,

entretanto, para muitos, devido à questão do excesso na quantidade e fluxo de

informação, especialmente no mundo digital, o real problema encontra-se na recuperação

da informação. Por outro lado, o ponto chave dessa problemática está na organização, ou

seja, na determinação “de um sistema de organização do conhecimento eficiente, que ao

ser adotado em SRI, em qualquer ambiente, funcione” (BERNERS-LEE, 2001, p.38).

A escolha do sistema de classificação a ser adotado pode ser considerada o ponto

chave para qualquer SRI, pois a classificação pode ser interpretada como “a principal

atividade neste processo” (MIRANDA, 2005, p.118). Veremos a seguir o sistema de

classificação bibliográfico chamado de Teoria da Classificação Facetada de Ranganathan.

3 A TEORIA DA CLASSIFICAÇÃO FACETADA DE RANGANATHAM

A classificação da informação e do conhecimento é uma das ações do processo de

Representação Temática da Informação, conforme explicitado anteriormente. Inúmeras

são as formas de classificação, criadas e adotadas até hoje. Consequentemente,

inúmeras também são as formas de definir classificação. Através dela, o homem elabora

o conhecimento necessário à sobrevivência.

De acordo com Lancaster (2004, p.21), “no campo do armazenamento e

recuperação da informação da informação, a classificação de documentos refere-se à

Page 6: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

formação de classes de itens com base no conteúdo temático”. Essas relações formam os

Sistemas de Classificação. Segundo Langridge (1977), os sistemas de classificação,

também chamados de tabela, seria um mapa completo de qualquer área do

conhecimento, mostrando todos os seus conceitos e suas relações.

Entende-se, então, por sistemas de classificação um conjunto de classes,

organizado e apresentado de forma sistemática, levando-se em consideração

semelhanças e diferenças. Os elementos semelhantes ficarão na mesma classe, tomando

como base determinada organização e relação. A relação ocorre com base na união de

idéias, segundo o número de conjuntos parciais, coordenados e subordinados.

Muitos são os sistemas de classificação utilizados ao longo da história, a começar

pela Classificação Filosófica do Conhecimento. Em 1933, foi criado um sistema de

classificação bibliográfico pelo indiano Shiyali Ramamrita Ranganathan (1892-1972).

Ranganathan, matemático e bibliotecário, foi um dos estudiosos que mais contribuiu para

as teorias de classificação da Biblioteconomia, no século passado, especialmente na área

da classificação de assunto. Sua teoria objetivava garantir uma seqüência, considerada

útil, dos livros nas estantes, já que a preocupação principal era com a localização física,

dos livros em bibliotecas em relação ao tema central abordado na obra.

A enorme contribuição de Ranganathan em processos de

organização/classificação da informação sofre influência das culturas brâmane, chinesa,

além da astrologia. Ele acreditava que suas idéias abrangiam o universo como um todo.

Pensando desta forma e aliando Matemática e Biblioteconomia, Ranganathan viu-se

imerso na classificação de todo conhecimento. A partir daí, começou a se preocupar com

a forma que os assuntos estavam formados. Como resposta, verificou que ação de

organização/classificação ocorria por meio de cinco caminhos: “Dissecação, Laminação,

Desnudação, Reunião/Agregação e Superposição” (RANGANATHAN, 1967, p.351).

Dentre os caminhos apresentados, destacamos a Desnudação (Desnudation),

também chamada Desfolhamento. A Denudação provoca a diminuição progressiva da

extensão e o aumento da profundidade de um assunto básico ou de uma idéia isolada.

Ela permite a formação de cadeias e representa o núcleo específico de um assunto

básico ou de uma idéia isolada.

A partir de então, Ranganathan examinou o método da Decatomia, ou seja,

formação com dez divisões. Concluiu que, em vista do crescimento prolífico

Page 7: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

multidimensional, a Decatomia não era satisfatória. A partir de sua verificação, sugeriu a

adoção da Policotomia Ilimitada, isto é, formação com número ilimitado de divisões das

áreas do conhecimento.

Os estudos de Ranganathan levaram-no a constatar a rigidez dos sistemas de

classificação do conhecimento, sendo necessária a criação de um sistema mais flexível.

Surge então uma estrutura facetada com síntese notacional, chamada de Teoria da

Classificação Facetada, também conhecida como Abordagem (classificação) Analítico-

Sintética e Classificação de Dois Pontos.

A estrutura criada por Ranganathan foi considerada inovadora na área da teoria da

classificação, vista por Campos (2001, p.31), “como o momento em que a teoria

tradicional é confrontada com a teoria moderna, ou que a teoria descritiva é confrontada

com a teoria dinâmica”.

O sistema de Ranganathan estruturou o conhecimento humano de maneira que os

assuntos compostos, sinteticamente, surgiam a partir de conceitos elementares. Para a

referida estruturação, cinco foram às categorias ou facetas estabelecidas por

Ranganathan, chamadas de PMEST. O [P] representa Personalidade (personality) como,

por exemplo, o termo bibliotecário. A categoria Personalidade é considerada, por muitos

estudiosos, como indefinível no caso do termo não se adaptar a nenhuma das outras

categorias. O [M] representa Material (material), como, por exemplo, livro. Já o [E]

representa Energia (energy), ou seja, as ações realizadas pelo item representante da

Personalidade, como, por exemplo, classificação. Quanto ao [S], este representa Espaço

(space), lugar: biblioteca central. E, por fim, o Tempo (time) [T] que representa períodos,

como o termo hoje.

Barbosa (1969) defende que analisar um assunto por facetas, significa que cada

aspecto de determinado assunto pode ser visto como as manifestações de certas

características ou facetas, sujeito à postulados pré-determinados. O sistema torna-se

assim, multidimensional e ilimitado.

Alguns autores apontam a insuficiência dessa lista sugerindo sua ampliação por

meio de estudos como o realizado pelo Classification Research Group (CRG). Criado em

1955, na Inglaterra e tendo Mills, Foskett, Farradane, Vickery e Langridge como

estudiosos. O CRG tem como objeto apresentar uma nova versão de mais fácil

compreensão do PMEST, propondo as seguintes categorias: Tipos de produto final;

Page 8: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

Partes; Materiais; Propriedades; Processos; Operações; Agentes; Espaço; Tempo e

Forma de apresentação.

De acordo com Piedade (1983, p.22), nas categorias propostas pelo CRG, “a razão

de ser do estudo do assunto a classificar é o seu produto final”. O entendimento de

categorizar a produção final torna-se mais compreensível na exemplificação de Vital

(2007, p.94):

No caso de um setor de desenvolvimento de sistemas, por exemplo, o produto final é o software; suas partes são os diferentes aplicativos; seu material é o disco óptico; a propriedade, como qualidades do produto final, é, no caso do software, a portabilidade; os processos são a instalação dos programas, o gerenciamento de dados; as operações são planejar, projetar e desenhar; o agente é o programador e a forma de apresentação é o cd- rom, por exemplo.

É possível considerar como grande mérito de estudo do CRG, a utilização de uma

estrutura dinâmica, multidimensional, graças à introdução do termo faceta “que ficou

sendo, nos modernos estudos sobre teoria da classificação, o substituto de característica”

(BARBOSA, 1969, p.16).

Vital (2007, p.40) defende que na Teoria da Classificação Facetada de

Ranganathan ocorre “a contemplação das relações entre os termos, formando um todo

coerente. Pela organização hierárquica, flexível e pós-coordenada, é possível visualizar o

conceito e suas possíveis relações, que variam para cada documento”.

4 ORGANIZAÇÃO E RECUPERAÇÃO DA INFORMAÇÃO EM AMBIENTES DIGITAIS: Banco de Dados (BD)

A partir do advento das TIs, a produção e a disseminação de informações

aumentam em proporção crescente. As informações, antes presentes apenas no colo dos

livros, hoje passa a ser incorporadas a outros suportes: DVD-ROMs, Pendrives,

programas de computador em geral, Internet entre outros. Com isso, o conhecimento

ultrapassa limites, barreiras e torna-se volátil, digital.

Nos ambientes digitais, provenientes da CC, há formas de tratar, armazenar e

recuperar a informação. Dentre essas formas, Miranda (2005, p.71-72) destaca “as bases

de dados automatizadas, os hipertextos [e inteligência artificial]; a modelagem de dados; e

Page 9: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

a rede de comunicação eletrônica”. No caso deste artigo, os recursos computacionais a

serem destacados serão as bases de dados automatizadas e a modelagem de dados.

A programação dos recursos computacionais citados anteriormente tem aumentado

consideravelmente nos últimos tempos. Por menores que sejam suas aplicações, sua

adoção tem estado em pauta no momento de escolha da forma computacional de

tratamento da informação a ser adotada, que neste caso, será a programação em BD.

Segundo Pazin (2007, p.1), BD pode ser definido como “uma coleção de dados

relacionados, organizados e armazenados visando facilitar a manipulação desses dados,

permitindo realizar alterações, inserções, remoções e consultas”. Já para Date (2003,

p.10), BD “é uma coleção de dados persistentes, usada pelos sistemas de aplicação de

uma determinada empresa”.

Conforme Silva (2007), os BDs informatizados podem ser usados para aplicações

de cadastro e comunicação na Internet, governos, comércio, logística, bibliotecas e

serviços cartoriais. Além disso, outra forma de aplicação dos BDs está na composição das

bases de dados. Para Yong (1986, p.18), “uma base de dados é constituída de um

conjunto de arquivos relacionados entre si”.

Incorporado a estas bases, os BDs agrupam os registros utilizáveis para um

mesmo fim, permitindo a recuperação das informações nela presentes. Um BD é

desenvolvido, mantido e acessado por meio de um software, conhecido como Sistema

Gerenciador de Banco de Dados (SGBD). São exatamente os SGBDs que realizam,

produzem, programam, compilam os BDs, adotando a modelagem de dados.

Entre o banco de dados físico – ou seja, os dados fisicamente armazenados – e os usuários do sistema, existe uma camada de software, conhecida como gerenciador de banco de dados ou servidor de banco de dados ou, mais frequentemente, como sistema de gerenciamento de banco de dados (SGBD) (DATE, 2003, p.8).

A união dos BDs com os SGBDs formam um ambiente denominado Sistema de

Banco de Dados (SBD). Segundo Heuser (2004, p.5), SGBD é “um software que

incorpora as funções de definição, recuperação e alteração de dados em um banco de

dados”.

O SBD é definido por Date (2003, p.6), como “um sistema computadorizado cuja

finalidade geral é armazenar informações e permitir que os usuários busquem e atualizem

essas informações quando as solicitar”. É o resultado final de um processo de

Page 10: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

programação, ou seja, aplicações como programas para Internet, biblioteca entre outras.

Assim, com tantas nomenclaturas, torna-se comum os termos BD e SGDB serem

adotados como sinônimos pelos profissionais da computação.

Quanto aos tipos de BDs, atualmente, as possibilidades de escolhas são as mais

variadas. Dentre as opções citemos: Oracle, SQL Server, MySQL, Sybase, Jasmine,

PostgreSQL, Firebird, Microsoft Visual FoxPro, Microsoft Access, dBASE entre outros.

Cada um tem características próprias, o que os tornam vantajosos, ou não, para

determinados tipos de aplicação.

Os BDs, além dos tipos apresentados, também são classificados segundo a forma

como os dados podem ser armazenados e posteriormente acessados. Dentre as

principais formas de programação em BDs, temos a programação orientanda a objetos

(POO) e o modelo relacional.

Nesta pesquisa, após estudos com base na busca pela adaptação da Teoria da

Classificação Facetada na programação em BD, o SBD, resultante deste trabalho, será

desenvolvido na linguagem SQL, usando a plataforma do SGBD Microsoft Office Access.

Além disso, também se deve determinar a técnica de modelagem de dados, conforme

será abordado a seguir.

4.1 A Modelagem de Dados em Banco de Dados (BD)

No ambiente digital, a modelagem de dados procura representar e organizar o

conhecimento com base na criação de uma estrutura de dados eletrônicos, como os BDs,

que representam um conjunto de informações.

A modelagem de dados é outra forma de organizar a informação visando recuperá-

la em ambientes digitais. Conforme Miranda (2005, p.72), “esta técnica consiste em se

estabelecer um modelo de entrada e tratamento de dados a serem armazenados num

sistema de informação”.

A técnica de modelagem é realizada nas atividades desenvolvidas pelos analistas

de sistema e programadores em geral. Além desses profissionais, outros também

assumem interesse pela técnica, em especial, os profissionais da informação como os

bibliotecários e cientistas da informação. Tal interesse se deve à explosão da informação,

Page 11: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

ocasionada pelos adventos das TIs e, conseqüentemente, suas influências provocadas na

sociedade.

Esta estrutura permite, ao usuário, recuperar dados de forma rápida e eficiente,

cujo objetivo é incluir dados em uma estrutura que possibilita transformar os dados

originais em vários tipos de saídas: formulários, relatórios, etiquetas ou gráficos

(MIRANDA, 2005).

Dentre as características da modelagem de dados e BDs, estas podem ser

classificadas de duas formas: Programação Orientanda a Objetos (POO) e Modelo

Relacional, conforme já apresentado. Segundo Ricarte (2001), “o termo programação

orientada a objetos pressupõe uma organização de software em termos de coleção de

objetos discretos incorporando estrutura e comportamento próprios”. Já o modelo

relacional é a maneira computacional de armazenar, manipular e recuperar dados

estruturados unicamente na forma de tabelas, construindo um BD.

Pazin (2007, p.3) também apresenta os seguintes entendimentos:

[POO] representam os dados como coleções (termos) que obedecem propriedades. São modelos geralmente conceituais dispondo de pouquíssimas aplicações reais. Cada objeto tem características próprias (atributos) com ações próprias (métodos). [...] O Modelo de Dados relacional representa os dados contidos em um Banco de Dados através de relações. Estas relações contêm informações sobre as entidades representadas e seus relacionamentos.

O modelo relacional é claramente baseado no conceito de matrizes, onde as

chamadas linhas (das matrizes) seriam os registros e as colunas (das matrizes) seriam os

campos a serem preenchidos pelos dados cadastrais. Os nomes das tabelas e dos

campos são de fundamental importância para nossa compreensão entre o que está sendo

armazenado, onde estamos armazenando e a relação existente entre os dados

armazenados.

Um dos grandes benefícios deste tipo de modelo é a possibilidade de as relações

não serem duplicadas, ou seja, não permitirem a existência de mais de um dado

semelhante, caso seja necessário. Esta característica ocorre devido à chamada Chave

Primária. Ao atribuir esta chave a um dado, este deverá ser único no sistema, como os

números de Identidade (registro) e do Cadastro de Pessoa Física (CPF).

Na modelagem de dados, portanto, este artigo utilizará o modelo relacional, pois,

tomando como base as palavras de Costa (1996), esta técnica consiste em estabelecer

Page 12: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

um modelo para entrada e tratamento de dados a serem armazenados num sistema de

informação, a fim de se evitar a duplicação de esforços e possibilitar o acesso simultâneo

por diversos usuários, utilizando vários aplicativos. Desta forma, de acordo com Furtado e

Santos (1980, p.370), “no modelo relacional os elos são implícitos”.

Para Heuser (2004, p.94), “um modelo de banco de dados relacional deve conter

no mínimo a definição dos seguintes itens: tabelas que formam o banco de dados;

colunas que as tabelas possuem; e restrições de integridade”.

No desenvolvimento da pesquisa, tomando como base Miranda (2005),

pretendemos adotar o funcionamento da modelagem de dados da seguinte forma:

Preparar uma lista, com todos os objetos integrantes da coleção de dados e os

fatores que os mesmos possuem. Cada objeto pode ser considerado como uma

entidade única, correspondente a um assunto;

Determinar as relações entre os objetos, escolher um objeto e verificar se tal objeto

se relaciona com outro. Entretanto, se faz necessário salientar que, nem sempre

todas as relações existentes serão consideradas importantes. Aquelas que

realmente forem importantes, permitirão a modelagem do BD de forma que

correspondam às situações do mundo real.

Na modelagem de dados os relacionamentos podem ser Relação do tipo Um para

Um; Relação do tipo Um para Vários e Relação do tipo Vários para Vários. A Relação do

tipo Um para Um existe quando os campos que se relacionam são ambos únicos em suas

respectivas Tabelas. Cada um dos campos apresenta valores não repetidos. Na prática

há poucas situações onde se utiliza este tipo de relacionamento. A Relação do tipo Um

para Vários ocorre quando uma das Tabelas possui um campo considerado Dado Único,

ou seja, que não pode ser repetido, com outra Tabela, que possui um campo, cujos

valores podem se repetir várias vezes. Este tipo de relacionamento é o mais adotado. Por

fim, a Relação do tipo Vários para Vários surge quando os dois campos, de cada Tabela,

que se relacionam, podem repetir seus dados (BATTIST, 2004).

Com base na fundamentação teórica apresentada, buscamos utilizar a teoria de um

sistema de classificação bibliográfico da CI, aplicado em ambientes físicos, como as

bibliotecas, em um ambiente digital proveniente da CC. Neste caso, adotamos a Teoria da

Classificação Facetada em BD, percorrendo as etapas apresentadas a seguir.

Page 13: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

7 PERCURSO METODOLÓGICO

No campo da pesquisa, a metodologia científica desempenha papel fundamental. A

metodologia tem a função de mostrar como andar no “meio das pedras” da investigação,

ajudando a refletir e a instigar um novo olhar sobre o mundo: um olhar curioso, indagador

e criativo.

Para a realização desta investigação, delineou-se um percurso metodológico

formado por uma pesquisa exploratória e bibliográfica, por meio de métodos e técnicas a

fim de se atingir os objetivos propostos.

A pesquisa exploratória nos permitiu ter maior familiaridade com o problema

encontrado, com vistas a torná-lo explícito, exigindo a descoberta de práticas ou diretrizes

que pudessem ser usadas como alternativa ou apresentassem subsídios para a criação

de novos procedimentos, conforme as necessidades apresentadas neste artigo.

Também foi realizada uma pesquisa bibliográfica que abrangeu a leitura, análise e

interpretação de informações em periódicos científicos, dissertações, teses, repositórios

digitais e bibliografia especializada.

Esta pesquisa está sendo realizada para analisar a adoção da Teoria da

Classificação Facetada em BD para organização do conhecimento, por meio dos

elementos básicos e das etapas para a construção de um sistema que será denominado

de Sistema Facetado em BD. Este sistema será implantado numa Instituição vinculada ao

Governo do Estado da Paraíba que promove ações de cidadania e capacitação por meio

de cursos profissionalizantes, ao qual chamaremos de Instituição X. O Sistema Facetado

será desenvolvido para organizar a informação e permitir uma recuperação mais precisa

na respectiva Instituição.

O Sistema Facetado em BD será testado por usuários escolhidos pela Instituição,

segundo os pré-requisitos, a saber: trabalhar com necessidades de organização e

recuperação da informação; ser escolhido pelos superiores da Instituição; e possuir

conhecimentos básicos em informática.

Page 14: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

8 RESULTADOS PARCIAIS DA PESQUISA: elementos básicos e etapas para a

construção do Sistema Facetado em BD

Devido ao problema de recuperação da informação, ocasionado pela atual

organização da informação na Instituição, que está sendo pesquisada, buscamos adotar

um dos cinco caminhos propostos por Ranganathan: a Desnudação. O referido caminho

provoca diminuição progressiva da extensão e aumento da profundidade de um assunto

básico ou de uma idéia isolada. O citado caminho foi escolhido devido à necessidade de

tentar especificar ao máximo o conteúdo informacional presente na comunidade. Até o

momento, as informações amostravam termos representativos, considerados gerais,

dificultando a recuperação precisa.

Além da Desnudação, também serão utilizados o PMEST por meio da análise

facetada. Segundo Duarte & Cirqueira (2007), a análise facetada é usada, primeiramente,

para criar classificações para o arranjo físico de fontes originais, na tentativa de criação

de seu substituto. Em outras palavras, embora a classificação facetada seja considerada,

por muitos, como uma estrutura de características específicas, a análise é essencialmente

uma técnica, que permite diferentes modelos do mesmo universo de discurso ser

derivados, aceitando-se, desta forma, necessidades locais ou peculiaridades sistêmicas,

através de categorias e variações diferentes na sintaxe.

A análise facetada nos permite incorporar propriedades adicionais às informações

a serem organizadas na Instituição, sejam elas textuais ou multimídia, além de fornecer

dados para a análise das categorias de dados presentes no BD, afetando, assim, a

sintaxe potencial do sistema. Porém, para adicionar novas propriedades e alterar a leitura

de sintaxe dos sistemas é necessário, segundo Lima (2002, p.190), examinar “a literatura

do assunto a fim de identificar seus conceitos e termos, estabelecendo-se suas

características e facetas”. Concluída esta análise, deve-se levantar e definir a terminologia

do assunto, para que, posteriormente, os termos ou dados presentes no BD sejam

analisados e distribuídos em facetas.

Realizar a distribuição em facetas poderá ser considerada positiva no referido

ambiente, já que tais facetas são inerentes ao assunto ou campo principal. Dentro de

cada faceta, os termos que as constituírem estarão aptos a novos agrupamentos pela

Page 15: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

aplicação de outras características ou classes divisionais, dando origem às facetas

menores, que chamaremos de subfacetas.

Conforme Duarte & Cerqueira (2007), os termos, nas subfacetas, são mutuamente

exclusivos, ou seja, não devem sobrepor-se à formação de assuntos compostos. Diante

disso, os elementos básicos para a construção do Sistema Facetado no BD serão os

seguintes:

1. Inicialmente, o BD precisará de uma quantidade mínima e básica de facetas para a

sua utilização. Estas facetas, que podemos chamá-las de facetas principais, serão

pré-determinadas pelos superiores da Instituição em pesquisa. Tal pré-

determinação ocorrerá logo após o primeiro momento do desenvolvimento do

protótipo. Com isso, estas facetas poderão ser consideradas fundamentais para a

utilização inicial do BD e para adaptação das atividades, anteriormente manuais,

para a forma automatizada;

2. Posteriormente, novas facetas e subfacetas poderão ser estabelecidas, tanto pelo

programador, quanto pelos usuários. No caso deste último, pretende-se permitir

que eles mesmos criem facetas, caso os termos de classificação desejados não

estejam presentes no ambiente computacional;

3. Além de criar as facetas, é importante determinar a ordem de citação em que elas

serão apresentadas no sistema de classificação, para que, posteriormente,

ordenem-se todos os elementos em ordem de arquivamento, o que permitirá

colocar o assunto geral ou campo principal antes do específico.

Após as etapas apresentadas, acreditamos que o sistema estará pronto para

receber uma notação, permitindo a inclusão de novas classes e atingindo o melhor nível

possível na recuperação da informação.

Ao final de cada etapa, as novas classificações serão somadas às existentes no

sistema formando uma classificação geral, no intitulado Sistema Facetado, cujo poderá

ser alterado futuramente para outro título, tanto por exigência dos superiores da

Instituição de implantação, quanto pelo pesquisador ou sua orientadora.

No que diz respeito à recuperação das informações presentes no sistema,

pretende-se disponibilizá-las, através da busca pelas facetas e subfacetas. Desta forma,

Page 16: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

todas as informações associadas às respectivas facetas serão apresentadas para a sua

posterior recuperação.

Dentre as características dos sistemas de classificação, foi exatamente a

flexibilidade, ou seja, a possibilidade de criar e recriar novos agrupamentos entre as

facetas sem alterar significativamente a estrutura da programação realizada em

ambientes digitais, no caso deste artigo, no BD, que propiciou a escolha para este

trabalho.

Quanto à colaboração das teorias da CI na elaboração do protótipo do BD,

pretende-se apresentar uma estrutura formada pela organização e recuperação da

informação, através da classificação em facetas de Ranganathan. Acredita-se que este

sistema vai além de sua utilização em livros, ordenando e classificando os mais variados

suportes informacionais, especialmente os digitais.

Na perspectiva da CC, pretendemos apresentar um BD com inúmeros

relacionamentos entre as tabelas e dados, através da técnica de modelagem de dados. A

técnica de programação será o modelo relacional devido à criação de vínculos entre os

dados do sistema, a não duplicação de esforços na programação e o acesso simultâneo

por diversos usuários à mesma informação. Por fim, caso seja de interesse ou

necessidade do programador, segundo Barbosa (1972), é possível criar um índice com

todos os termos e suas respectivas notações.

Quanto às etapas de construção do protótipo, concluído os estudos teóricos,

iniciou-se o desenvolvimento do Sistema Facetado em BD. Este desenvolvimento divide-

se em dois momentos:

1. O primeiro momento representa a elaboração de um planejamento, para discutir a

estrutura física do BD, seus campos e facetas básicas, para iniciar a programação:

o Examinar a literatura do assunto;

o Levantar e definir a terminologia do assunto para que posteriormente os

dados sejam analisados e distribuídos em facetas;

o Relacionar campos e facetas, por meio da modelagem de dados;

2. O segundo momento ocorrerá, após conclusão da programação do BD, ou seja, o

sistema pronto, usuários selecionados, de acordo com critérios pré-estabelecidos,

testarão o BD.

Page 17: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

9 CONSIDERAÇÕES FINAIS

Diante do relato apresentado percebemos a importância do desenvolvimento de

estudos voltados à organização e classificação da informação em ambientes digitais,

como aqui expostos, em Banco de Dados (BD).

Entendemos que o problema da recuperação da informação não relevante pelo

usuário, numa gama informacional cada vez maior, não é uma problemática dos sistemas

de recuperação da informação (SRIs) e sim da forma como esta gama informacional vem

sendo organizada.

Buscamos nas práticas da CI, enraizadas na Biblioteconomia, mais

especificamente, nas bibliotecas tradicionais, sistemas de classificação chamados

bibliográficos, originalmente criados e usados em coleções de livros. Entretanto,

características desses sistemas como a organicidade de assuntos e as relações entre

eles são plausíveis de aplicação em ambientes digitais..

Almejamos, portanto, adotar a Teoria da Classificação Facetada em um ambiente

digital, neste caso, BD e, após estudos, muitas foram às semelhanças encontradas.

Dentre elas, percebemos que, assim como na classificação facetada, os sistemas

computacionais por modelagem de dados também objetivam a estruturação do

conhecimento, através da organização de seus conceitos e da criação de

relacionamentos entre eles, permitindo o mapeamento de uma área de assunto e a

inclusão de novos conceitos, sem que isto altere a estrutura do sistema.

As apresentadas constatações nos permitiram a definição dos elementos básicos e

das etapas para a construção do Sistema Facetado em BD. A partir deste momento, a

teoria facetada será implantada no BD. Em seguida, concluída a primeira etapa, o

protótipo será aplicado aos usuários selecionados, conforme os pré-requisitos

estabelecidos pela Instituição X.

Após a segunda etapa, com o protótipo finalizado e testado pelos usuários, dados

para a pesquisa serão coletados por meio de questionário, apresentando se de fato o uso

da Teoria da Classificação Facetada é possível de ser adotado em ambientes digitais e

quais contribuições este sistema de classificação pode oferecer ao respectivo ambiente.

Acreditamos na importância do presente estudo, que nos mostram a importância da

interdisciplinaridade entre áreas de conhecimento, como Ciência da Informação (CI) e

Page 18: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

Ciência da Computação (CC), e o quanto ambas as áreas podem trazer em contribuições,

tanto para a sua própria área do conhecimento, como para outras áreas. Este artigo

apresentou o interesse de realizar testes para a aplicação de estudos da CI (sistema de

classificação), para solucionar problemas presentes em ambientes da CC (BDs).

ABSTRACT: The study presents the Theory Faceted Classification and Database as

elements that have similarities, since they share the objective of structuring the knowledge

by organizing their concepts and creating relationships between them. The five categories

established by Ranganathan and facets in this system called PMEST are cited: Person, Material, Energy, Space and Time. From an investigation exploratory and of literature, grounded in scientific journals, specialized literature and websites, this study seeks to

analyze the possibility of adoption of the theory of faceted classification in databases for knowledge organization. The necessary actions for the adoption of faceted classification in

BDs are defined. The technical programming in databases in the data modeling is

determined. As a partial result of this investigation, we have the determination the basic

elements and steps for building the system faceted into the database. Believe that studies

like this show us the importance of interdisciplinary Information Science (IC) and Computer Science (CC), and both can cause numerous contributions, both for itself and for other areas.

Keywords: Representation of Information. Classification. Theory Faceted Classification of Ranganathan. Information Technology. Database. Data Modeling.

REFERÊNCIAS:

BARBOSA, A. P. Classificações facetadas. In: Ci. Inf. Rio de Janeiro, v.1, n. 2, p. 73-81,

1972.

______. Teoria e prática dos sistemas de classificação bibliográfica. Rio de Janeiro: Instituto Brasileiro de Bibliografia e Documentação, 1969.

BATTIST, J. C. F. Treinamento: access – técnicas avançadas. Santa Maria, 2004. (CD-

ROM).

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic WEB. In: Scientific

American, New York, v. 284, no. 5, p. 35-43, May 2001. BORKO, H. Information science: what is it? American Documentation, Jan. 1968.

Page 19: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

CAMPOS, M. L. de A. Linguagem documentária: teorias que fundamentam sua

elaboração. Niterói: Ed. da UFF, 2001.

CAPURRO, R. Epistemologia e Ciência da Informação. In: V Encontro Nacional de

Pesquisa em Ciência da Informação - ENANCIB, Belo Horizonte, 11-2003.

COSTA, A. B. Modelagem de Dados: coisa do passado? Byte, Rio de Janeiro, jun. 1996.

DATE, C. J. Introdução a Sistemas de Bancos de Dados. Rio de Janeiro: Elsevier, 2003. Tradução da 8º edição americana.

DUARTE, E. A.; CERQUEIRA, R. F. P. de. Análise Facetada: um olhar face a modelagem

conceitual. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 39-52, jan./jun. 2007.

FURGERI, S. Representação de informação e conhecimento: estudo das diferentes

abordagens entre a ciência da informação e a ciência da computação. Campinas: PUC-

Campinas, 2006.

FURTADO, A. L.; SANTOS, C. S. dos. Organização de Banco de Dados. 2. ed. Rio de

Janeiro: Campus, 1980.

HEUSER, C. A. Projeto de Banco de Dados. 5. ed. UFRGS: Editora Sagra Luzzanato, 2004. (Série Livros Didáticos).

LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Trad. de Antonio

Agenor Briquet de Lemos. Brasília: Briquet de Lemos/Livros, 2004.

LANGRIDGE, D. Classificação: uma abordagem para estudantes de Biblioteconomia.

Tradução de Rosali Pacheco Fernandez. Rio de Janeiro: Interciência, 1977.

LIMA, G.A.B. A análise facetada na modelagem conceitual de sistemas de Hipertexto: uma revisão de literatura. In: Perspectiva em Ciência da Informação., Belo Horizonte, v. 7, n. 2, p. 189-196, jul./dez. 2002.

MIRANDA, M. L. C. de. Organização e Representação do Conhecimento:

fundamentos teórico-metodológico na busca e recuperação da informação em

ambientes virtuais. 2005, 353f. Tese (doutorado em Ciência da Informação). Curso de

Pós Graduação em Ciência da Informação – Convênio CNPQ/IBICT – UFRJ/ECO, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2005.

MOOERS, C.N. Zatocoding applied to mechanical organization of knowledge. American

Documentation, v. 2, p. 20-32, 1951.

NOVELLINO, M. S. F. Instrumentos e Metodologias de Representação da Informação. In: Informação e Informação, Londrina, v.1, n.2, p.37-45, jul./dez. 1996.

Page 20: de em da Janeiro,

XI Encontro Nacional de Pesquisa em Ciência da Informação Inovação e inclusão social: questões contemporâneas da informação

Rio de Janeiro, 25 a 28 de outubro de 2010

PAZIN, A. Introdução a Banco de Dados e Structured Query Language (SQL). São

Paulo: Colégio Salesiano Dom Henrique Mourão, 2007. Parte I (apostila).

PIEDADE, M. Introdução à teoria da classificação. 2. ed. ver. e ampl. Rio de Janeiro: Interciência, 1983.

RANGANATHAN, S. R. Prolegomena to library classification. Bombay: Asia Publ. House, 1967.

RICARTE, I. L. M. Programação Orientada a Objetos com C ++. Versão preliminar

(apostila). Campinas: Universidade Estadual de Campinas, 2001.

SILVA, M. B. da. Introdução à Microinformática. João Pessoa: CENDAC, 2007. 209 p. (Apostila).

VITAL, L. P. Recomendações para Construção de Taxonomia em Portais

Corporativos. Florianópolis, 2007. 113 p. Dissertação (Mestrado em Ciência da

Informação) - Universidade Federal de Santa Catarina - UFSC, Florianópolis, 2007

YONG, C. S. Banco de Dados – Organização, sistemas e administração. São Paulo: Editora Atlas S. A, 1986.