ELiANE GOTHS MIORELLI
UTILIZANDO A TECNOLOGIA DE DATA WAREHOUSE NA EDUCACAo
stT~!I~~~CPNSULTA JIl'<lTERNA
/"{
Monografia apresentada ao Curso de P6s-Gradua~ao em Pedagogia da GestaoEmpresarial , da Universidade Tuiuti doParana.
Onentadora:Prof. Olga Maria Silva Mattos.
2004
RESUMO
o data warehouse, literalmente traduzindo, e um "armazem de dados" . Euma base de dados carregada de forma incremental em um periodo de tempo. 0
data warehouse organiza e armazena as dados necessarios para processamento
informatizado e analftico sabre perspectivas historicas 80 lango do tempo, tendo
como principal objetivo transformar 0 dado em informac;ao. E uma arquitetura que
utiliza banco de dad os desenvolvido para analise e tamada de decis6es em bases
sumarizadas e tambem detalhadas, com a intuito de contemplar as segmentos da
empresa ou organiZ8r;ao.
a data warehouse pode revolucionar as negocios da empresa/organiz8<;ao.
Ao ser bem elaborado e implementado, e caso seja cuidadosamente direcionado
para a chamada "inteligencia de neg6cio", ele pode tornar-se uma vantagem
competitiva. Essa ferramenta est'; fazendo surgir novas conceitos de gestao da
informac;ao , tipos de consultas e analises dos neg6cios. Os principais conceitos
basicos que norteiam 85sa tecnologia serao abordados e analisados como pre-
requisitos que, direta QU indiretamente, sao necessarios para 0 desenvolvimento do
projeto.
o enfoque principal do trabalho e reunir grande parte da fundamenta9aO
te6rica referente ao assunto data warehouse, provendo 0 conhecimento minima
necessaria aqueles profissionais que nao tern referenda alguma sabre esse assunto.
Com base no que e a tecnologia de data warehouse, apresentarei alguns
estudos de casa baseados nas necessidades educacionais estruturando-os em
bases de dados conceituais visando suprir as necessidades de informa98o das
organiz8c;oes educacionais.
iii
SUMARIO
RESUMO ..
USTA DE TABELAS .
USTA DE FIGURAS
USTA DE SIGLAS
INTRODUf;:Ao ...
. iii
. vii
................. vii
................ viii
. ..... ix
1. FUNDAMENTAc;:Ao TEO RICA ..
1.1 CONCEIT OS.
1.1.1 Dado x Informa9iio
1.1.2. Data Warehouse (Armazem de Dados) ..
1.1.3. Data Mart (Mercado de Dados) ..
.1
. 1
.... 1
. 1
. 3
1.1.4. Sistemas de Suporte II Decisiio (DSS-Decision Support Systems) .4
1.1.5. Inteligencia Do Neg6cio (Business Intelligence).. . .4
1.1.6. Modelagem De Dados ..
1.1.7. Banco De Dados Relacional
1.1.8. Banco De Dados Multidimensional. ...
1.1.9. Analise Multidimensional..
1.1.11.2. MOLAP (Multidimensional OLAP).
1.1.11.3. HOLAP (Hibrido OLAP) ..
1.1.11.4. WOLAP (Web OLAP) ..
1.1.12. Opera90es Olap .....
1.1.13. Modelagem Dimensional Dos Dados
. 5
........... 7
. 8
. 8
. 9
. 9
. 10
. 10
. 10
. 11
1.1.10. OLTP (Online Transaction Processing) ..
1.1.11. OLAP (Online Analytical Processing) ..
1.1.11.1. ROLAP (Relacional OLAP) .
1.1.13.1. Fatos .
. 11
........... 11
. 12
. 131.1.13.2. Dimensoes De Urn Cubo ..
iv
1.1.13.3. Agrega«oes.. . 13
1.1.13.4. Tecnica star schema (esquema estrela).... . 14
1.1.13.5. Tecnicasnowf/ake (flocodeneve).. . 14
1.1.14. Metadados.. . 15
1.1.15. Ferramenta CASE (Computer Aided Software Engineering).. . 16
1.1.16. SQl (Structured Query language).. . 16
1.1.16.1. Stored procedure (sp).. . 17
1.1.17. Indexa«ao.. . 17
1.2. ASPECTOS ESTRATEGICOS PARA A CONSTRUC;;iio DE UM DATA
WAREHOUSE.
1.2.1. Planejamento ..
1.2.2. Necessidades Das Empresas ....
. 17
. 18
. 19
1.2.3. Hierarquia Classica Da Informa«ao Na Empresa 21
1.2.4. Motiva«ao Da Empresa No Mercado 22
1.2.5. Necessidades e Beneficios Para 0 Usuario .. .....22
1.2.6. Perfil Do Usuario Na Empresa Que Utiliza 0 Data Warehouse 23
1.2.7. Analise Do Ambiente legado
1.2.8. Equipe De Desenvolvedores ..
............................................. 24
.....25
1.2.9. Aspectos Da Implementa«ao Fisica (Rolap/Molap) 25
1.2.10. Performance 26
1.2.11. Seguran«a 27
2. ESTUDO DE CASO: ALGUNS EXEMPLOS.. . 28
2.1. FATORES CRiTICOS DE SUCESSO. . 28
2.2. DEFINIC;;iio DA TECNICA DE DESENVOlVIMENTO DE SISTEMAS A SER
UTILIZADA.. . ..29
2.3. VISUALIZAR AS NECESSIDADES DO USUARIO.. . 29
2.4. NOVA visiio DA INFORMAC;;iio PARA A TOMADA DE DECISOES 30
2.5. ANALISE DO NEGOCIO A SER MODELADO .... .....31
2.6. ANALISE DO AMBIENTE LEGADO.. . 32
2.7. MODELAGEM DIMENSIONAL DOS DADOS.. . 33
.............. 342.7.1. Dimens5es ..
2.7.2. Fatos 35
2.7.3. Exemplo de uma analise dimensional. 35
2.7.4. Agrega~5es 37
................. 382.7.5. Metadados ..
2.7.6. Resumo das etapas para a modelagem dimensional 38
2.8. ESTUDOS DE CASOS REAIS (NECESSIDADES DO NEGOCIO E
MODELAGEM DIMENSIONAL) .. . 39
2.8.1. Data Mart Para Informa~5es Gerenciais de Matriculas de Alunos e
~-...............~
2.8.2. Data Mart Para Informa~5es Escolaridade dos Professores .41
2.8.3. Data Mart Para Informa~5es de Alunos no Ano Letivo .. . .42
ANEXOS.. . .44
SUGEST.A.O DE UMA TABELA DIMENS.A.O TEMPO DETALHADA [211 .44
FIGURAS 45
REFERENCIAS .. ...... .47
vi
LlSTA DE TABELAS
1. SUGESTAO DE UMA TABELA DIMENSAO TEMPO DETALHADA .43
LlSTA DE FIGURAS
1. EXEMPLO DE UM CUBO DIMENSONAL ,., ,." ,', ,', ..,', .44
2. EXEMPLO DE UMA ESTRUTURA STAR SCHEMA .44
3. EXEMPLO DE UMA ESTRUTURA SNOW FLAKE. .45
4. EXEMPLO DE UM MODELO DE DADOS (MER) ..45
vii
BI
CASE
DATA MARTS
DER
DM
DSS
DSS
DW
DWA
EIS
ER
FK
HOLAP
MER
MOLAP
OLAP
OLTP
ROLAP
SGBD
SGBDR
SOL
WOLAP
LISTA DE SIGLAS
- Business Intelligence
- Computer Aided Software Engenering
- Mercados de Dados
- Diagrama Entidade Relacionamento
- Dimensional Modeling
- Decision Support Systems
- Sistema de Apoio a Decisao
- Data Warehouse
- Administrador de Data Warehouse
- Sistema de Informa(foes Executivas
- Entity Relation
- Foreign Key
- Hibrido On Line Analytical Processing
- Modelo Entidade Relacionamento
- Multidimensional On Line Analytical Processing
- On Line Analytical Processing
- On Line Transaction Processing
- Relacional On Line Analytical Processing
- Sistema de Gerenciamento de Banco de Dados
- Sistema Gerenciador de Banco de Dados Relacional
- Structured Ouery Language
- Web On Line Analytical Processing
viii
INTRODU<;:Ao
Hoje canstata-s8 frequentemente nas empresas e organiZ8<;oes publicas,
que as informac;6es estao desorganizadas, pouco integradas e de difieil acesso
pelos usuarios quando as mesmas necessitam analisa-Ias para tamar decis5es. Sao
frequentes as perguntas feitas pelos executivos das empresas e altos
administradores com relac;ao as informac;6es:
• "N6s temas montanhas de dados nesta empresa mas naD temas acesso
aos mesmas".
• "Nos queremos cruzar informact0es de todas as maneiras possiveis".
• "Apenas me mostre 0 que e importante".
Estas perguntas poderao ser respondidas mais rapidamente se a empresa
passui urn data warehouse consistente e integrado porem, nao e uma tarefa simples
o desenvolvimento de um projeto desse nivel. Para tanto, as premissas abaixo
devem ser observadas:
• De que maneira agilizar 0 processo de tomada de decisao na Empresa
utilizando a Tecnologia da Infonma~ao?
• De que forma 0 data warehouse realmente possibilita agilizar 0 processo
de tomada de decisao na Empresa?
• Quais etapas basicas urn profissional da Tecnologia da Informac;ao deve
seguir para desenvolver um projeto de data warehouse?
Atualmente, a informac;ao e 0 principal patrimonio de uma empresa ou
organiza~ao e a mesma e utilizada no processo de tomada de decisoes importantes
e estrategicas. Portanto, a infonma~ao deve ser tratada como fator primordial com
rela~ao a competitividade do mercado. No entanto, muitas empresas necessitam
integrar seus dados de forma a visualizar todo 0 escopo operacional da empresa
para que analises possam ser efetuadas de uma forma rapida, confiavel e que 0
usuario possa solicitar suas consultas as bases de dados sem necessitar de ajuda
ix
do analista de informatica. A integra,ao destas bases de dados e um problema
complexo quando S8 visualizam varias tontes de informayao distribufdas na
empresa em urn mesma ambiente computacional QU em ambientes distintos.
o conceito de data warehouse surge com a finalidade de organizar a
integra<;ao das informac;oes e disponibiliz8-las atraves de varias dimens6es de
consulta, permitindo que todos as dados da empresa possam estar disponiveis em
uma (mica base para consulta e auxilio a tamada de decisao.
Quanta aD objetivo geral, enfatiza-se que nas Organiz8c;oes Educacionais,
sao necessarias varias informac;oes gerenciais e estatisticas. Para atender a estas
necessidades, a tecnologia de data warehouse possibilita a visualiza,ao e obten,ao
destas informa,oes de uma forma mais rapida. Baseado em fundamenta,ao teorica,
pretende-se sugerir modelos de dados de alguns data marts para 0 auxilio aeduc8yao. Para as objetivos especificos, foram considerados as itens abaixo
selecionados:
1) Elaborar fundamenta9ao te6rica para suportar a assunto, provendo
conhecimentos te6ricos, tecnicos e conceituais basicos referentes ao
desenvolvimento de projetos de constru,ao de data warehouse.
2) Identificar situa90es reais de necessidade de analise da informa9ao
atraves de alguns estudos de caso voltados a educa,ao que serao apresentados,
demonstrando principalmente 0 projeto do modelo de dados dimensional.
a metoda utilizado e a pesquisa bibliografica. As fontes bibliograficas
utilizadas foram Livros de Leitura Corrente, par constituirem conhecimentos tecnicos
e Publica90es Peri6dicas que proporcionam informa90es recentes e atualizadas.
Outra classifica9ao de pesquisa bibliografica utilizada e consultas a sites da Internet.
as autores William H. Inmon e Ralph Kimball nortearam a fundamenta9ao te6rica
como refen'>ncias bibliograficas principais. Para 0 detalhamento do conhecimento
adquirido atraves da pesquisa bibliografica, tambem foi utilizado 0 metodo de estudo
de caso, que permite 0 estudo de ou mais objetos de analise voltados a Educa9ao.
Basicamente, 0 trabalho esta dividido em duas partes distintas:
1a Parte: Embasamento te6rico atraves de pesquisa bibliogrilfica que dara
o suporte basieD necessaria para 0 entendimento do que e a tecnologia de data
warehouse, visualizando conceitos basicos e considerac;5es necessarias para 0
desenvolvimento do projeto.
2' Parte: Inicio do desenvolvimento do trabalho onde sera proposta a analise
do negocio e modelagem dimensional em estudos de casas reais voltados aeduca<;ao.
xi
1. FUNDAMENTA9AO TEORICA
1.1 CONCEITOS
1.1.1 Dado x Informa<;ao
Dado e urn registro de fatos, conceitos au instru90es para a comunic8<;ao,
recuperac;:ao e processamento par meios automaticos e apresentac;:ao na forma de
informa<;ao compreensivel para os seres humanos. Informa<;ao sao dados que os
seres humanos assimilam e validam para resolver problemas au tamar decis6es
[13].
Dados sao os componentes basicos, a partir dos quais a informa<;ao e
criad8. InformaC;:80 sao dados inseridos em urn contexto. Contexte e a SitU8C;:80que
esta sendo analisada. A partir da informa9ao vern 0 conhecimento, que permite
tomar decisoes adequadas, trazendo vantagem competitiva [18].
1.1.2. Data Warehouse (Armazem de Dados)
Data warehouse e uma colec;:ao de dados para suportar 0 gerenciamento
das necessidades de decisao, orientado a urn assunto, integrado, variante no tempo
e nao volatil [14].
Orientado par assunto: A primeira caracteristica de urn data warehouse eque ele esta orientado ao redor do principal assunto da organiza~ao como, por
exemplo, clientes, vend as, produtos e atividades. 0 alinhamento ao redor das areas
de assunto afetam 0 desenho e implementa<;aodo dado criado no data warehouse.
A area de assunto mais influente e a parte mais importante da estrutura chave [14].
Integrado: A melhor essencia do ambiente de warehouse e que dados
contidos dentro dos limites do warehouse estao integrados. A integra<;aomostra-se
em muitas diferentes maneiras: na cansistencia e padronizaC;8a de names, na forma
2
consistente das variaveis, na estrutura consistente de c6digos, nos atributos fisicos
eonsistente dos dados, e assim por diante [14].
Nao Volatil: Atualiza90es - inclusao exelusao, e altera9ao - sao feitas
regularmente no ambiente operacional efe urn registro basico. Mas a manipulac;ao de
dados basieos que oeorre no data warehouse e mais simples. Tem somente tres
especies de operac;6es que ocorrem no data warehouse: a carga inicial do dado, 0
acesso ao dado e atualiz8<;ao temporal (semanal, mensa I) conforme necessidades
do neg6eio [14].
Hist6rieo: Todo dado no data warehouse Eo exato em algum momenta do
tempo e em consequencia desta informaC;8o, 0 dado criado no warehouse e dito ser
"historica". as valores hist6ricos dos dados no data warehouse sao mostrados em
varias maneiras. 0 modo mais simples e que 0 dado no data warehouse representa
os dados sobre um horizonte de tempo distante - de 5 ate 10 anos [14].
Uma colec;ao de bancos de dados integrados e orientados a assuntos
projetados para apoiar as fun90es de um Sistema de Apoio de Decisao (Decision
Support Systems); onde cada unidade de dados e importante em um momenta no
tempo. 0 data warehouse contem dados atomicos e muitas vezes sumarizados [13].
Um data warehouse nao e um produto ou mesmo um conjunto de produtos,
mas processos suportados par diversas tecnologias: ele coleta dados das varias
aplic8<;oes operacionais; integra-os em urn modele logica, par areas de neg6cio;
armazena as informac;:5es de tal maneira que possam ser recuperadas par usuarios
pouco tecnicos; e entrega essas informalfoes aos tomadores de decisao atraves de
ferramentas de facil utiliza9ao, como geradores de relat6rios e de consulta [29].
A ideia de data warehouse e integrar os dados de uma organiza9ao em uma
estrutura unica provendo qualidade e melhor acesso aos dados [6].
Base de dados analitica que permite analises e simulac;6es, para suporte as
decis6es estrategicas de media e lango prazo. Geralmente e armazenada em
3
ambiente especifico, ou seja, separado do ambiente operacional. Caracteristicas:
[25].
Dadas hist6ricos: para possibilitar analises combinat6rias e simulac;oes.
Armazenam grandes quantidades de dados, podendo chegar a dezenas de anos
[25].
Sumario estatica: decorrente de atualiZ8C;8o pontual, as sumarizac;oes sao
calculadas e fixadas no momento da carga [25J.
Dados Corporativos: estrutura de dados das diversas areas da empresa
(Suprimentos, Manufatura, Vendas, Finanyas, Recursos Humanos, etc.), permitindo
as mais diversas compara~oes [25J.
Data warehouse e uma arquitetura de banco de dados com informa~oes de
can:~ter gerencial voltado para: suporte a decisao, planejamento estrategicQ, analise
do comportamento de clientes e analise da performance de vendas. Funciona como
urn provedor de informac;6es de urna empresa ou instituic;ao, pois concentra todas as
informa<;oes estrategicas e hist6ricas, extraidas dos sistemas transacionais relativos
aos clientes e produtos. A proposta principal do data warehouse e a democratiza~ao
das informac;6es para a area de negocios, atraves do facil acesso aos dados para
analise [1J.
1.1.3. Data Mart (Mercado de Dados)
Um data mart nao e uma evolu~ao de um data warehouse, mas sim parte
das estrategias deste. Um data mart e um subconjunto de dados de um data
warehouse, desenhado para suportar urna necessidade de negocio ou urna unidade
organizacional especifica. A estrategia correta e fazer 0 data mart incorporar-se aarquitetura de data warehouse, sem perder a visao de conjunto. Essa visao de
conjunto e decorrencia de um bom projeto de data warehouse [24J.
o data mart e similar ao data warehouse com algumas exce90es: [13J
• 0 data mart opera um conjunto menor de dados [13].
4
• 0 data mart visualiza 0 dados com urn enfoque departamental enquanto
o data warehouse visualiza os dados com urn enfoque corporativo [13].
• 0 data mart visualiza os dados em uma base muito mais previsivel
enquanto 0 data warehouse frequentemente faz explora9ao na base de
dados [13J.
Caracteristicas comuns ao data warehouse e data mart sao: informa9ao
estrutural, fonte de informa98o e outras informa90es encontradas ao longo do
ambiente [13].
Obedece os mesmos conceitos do data warehouse, diferenciando-se
somente no conteudo, ou seja, os dados sao organizados por assunto, permitindo
maior independencia, agilidade e ganhos de performance [25J.
1.1.4. Sistemas de Suporte II Decisao (DSS-Decision Support Systems)
Urn sistema utilizado para gerenciar decis6es. Usualmente envolve a analise
de muitos dados. Como regra, nao envolve a atualiza9ao dos dados, somente efetua
consultas. Sistemas projetactos para as executivos que caracterizam-se pela analise
de tendencias [13J.
Enquanto 0 resultado de urn data warehouse e a possibilidade de auxiliar no
suporte a decis6es. urn DSS pode existir independentemente da arquitetura de data
warehouse. Alem disso. urn DSS e uma soluc;ao isolada e que n<lo inclui
necessariamente uma arquitetura, uma infra-estrutura e nem mesma ferramentas de
administra9ao ou auditoria, ao contrario de urn data warehouse, que deve incluir
todos esses componentes [24J.
1.1.5. Inteligencia Do Negocio (Business Intelligence)
Eo urn processo de coleta, transforma9ao, analise e distribui9ao de dados
para melhorar a decisao de neg6cios; sua infra-estrutura tecnol6gica e composta de
data warehouses ou data marts, ferramentas OLAP, EIS, data mining, consultas e
5
relat6rios e software de visualiza<;ao dos dados; os bancos de dados sao a infra-
estrutura basica de qualquer sistema de business intelligence. Sao neles que VaG
estar armazenados os dados que serao transformados em informa<;oes competitivas
[17].
1.1.6. Modelagem De Dados
Modelagem de dados e uma atividade na qual procuramos construir uma
estrutura de dados que reflita a realidade e ao mesmo tempo seja facilmente
manuseada par computadores para que os sistemas construfdos a partir dela sejam
estaveis e sofram 0 minima de manutenyao passivel. A modelagem e dividida em
tres etapas ou niveis: Conceitual, Logico e Fisico [27].
Modele Conceitual: E desenvolvido sem levar em consideray80 nenhum
aspecto de representa<;ao logica ou fisica dos dados, seja software, hardware ou
visao particular de urn usuario. E baseado em como funciona 0 negocio do cliente e
ignora detalhes de implementa<;aoe performance [27].
Modele Logieo: E desenvolvido levando-se em considera<;8o a arquitetura
de dados suportada pelo sistema gerenciador de banco de dados. Exemplo: Em
Rede, Hierarquico, Relacional. Ha a defini<;aodas tabelas, colunas e chaves. A meta
e a redu<;ao de redundiincias para simplifica<;ao do gerenciamento e aumento da
integridade [27].
Modele Fisico: 0 mapeamento fisica leva em considerac;ao
caracteristicas de hardware e software (SGBD) e estimativas de espa<;o e tempo
(performance) [27].
o ponto de come<;o para 0 plano de migra<;aoe um modelo de dados. 0
modele de dados representa as necessidades de infonma<;ao da corpora<;ao.
Representa 0 que a corporac;ao necessita, nao necessaria mente 0 que a corpora<;ao
atualmente possui. Eo construido sem considera<;aode tecnologia [12].
6
o Modelo Entidade-Relacionamento (MER) sera a tecnica de modelagem de
dados utilizada para cria,ao do Modelo Conceitual de Dados [8].
Esta tecnica foi criada por Peter Pin-Shan Chen em 1975 e e usada para
descrever 0 mundo real com alto grau de abstraC;8o, em termos de entidades
(objetos de interesse), relacionamentos (forma como as entidades estao interligadas)
e atributos (caracteristicas das entidades e relacionamentos) [8].
o MER e composto por uma representa,ao grafica, 0 chamado Diagrama
Entidade-Relacionamento (DER) e um conjunto de informa,5es escritas sobre cada
conceito representado (entidades, relacionamentos e atributos) [8].
Modelo de Dados : Estruturas de dados 16gicas, providas por um sistema
gerenciador de banco de dados utilizado para a representa,ao dos dados [13].
Entidade: Anmazena os dados de uma pessoa, lugar ou objeto de interesse
em um alto nivel de abstra,ao [13]. Todo 0 objeto, coisa que tem alguma existencia
no neg6cio, na vida real. Nao sao tabelas, sao implantadas como tabelas [21].
Relacionamentos: As a,5es ou fatos que integram as entidades no mundo
real [21].
Modelo Entidade-Relacionamento (MER): Um modelo de dados que define
entidades, 0 relacionamento entre entidades e as atributos que tern valores para
descreverem as propriedades das entidades e/ou relacionamentos [13]. Um exemplo
de um modelo MER esta demonstrado na Figura 4 do Anexo.
Diagrama de Entidade-Relacionamento (DER): Um modelo de dados de alto
nivel que demonstra, esquematicamente, todas as entidades dentro do ambito de
integra,ao e a rela,ao direta entre essas entidades [13].
Chave : Um item de dado ou combina,ao de itens de dados utilizados para
identificar ou localizar uma instancia de um registro ou algum agrupamento de dados
similares [13].
Chave Primaria : Um atributo unico utilizado para identificar um registro em
um banco de dados [13].
7
Uma ou mais colunas que unicamente identificam uma linha da tabela.
Chaves primarias devem ser (micas e nao nulas [5).
Chave Estrangeira: Uma au mais colunas que referenciadas a chave
primaria de outra tabela [5).
Chave Comum: Uma au mais colunas que sao frequentemente utilizadas
para relacionar tabelas [5).
• Chaves nao sao 0 mesma que indices. Uma chave pode au nao ser urn
indice [5).
• Chaves sao definidas no projeto 16gicoenquanto indices sao definidos no
projeto fisico para garantir performance e outras raz6es [5).
1.1.7. Banco De Dados Relacional
Um Sistema Gerenciador de Banco de Dados Relacional (SGBDR) mantem
tabelas que sao compostas por colunas que descrevem linhas de dados [13).
Uma base ou banco de dados e uma cole<;ao de dados relacionados e
armazenados ( frequentemente com redundancia controlada e limitada) de acordo
com um esquema. Um banco de dados pode servir unica ou multiplas aplica<;6es
[13).
Os atuais Sistemas Gerenciadores de Bancos de Dados Relacionais
oferecem uma solur;ao poderosa e eficiente para 0 processamento de grandes
volumes de transa<;6es de uma grande variedade de aplica<;6es comerciais e
cientificas [7).
1.1.7.1. Tabelas
Tabela e uma rela<;aoque consiste em um conjunto de colunas com um
titulo e um conjunto de linhas. Coluna e uma tabela vertical onde sao selecionados
valores do mesmo dominio. Uma linha e composta de uma ou mais colunas [13).
8
Em urn banco de dados relacional, todos os dados estao em tabelas. Uma
tabela mantem dados relacionados com uma classe particular de objetos (uma
entidade). Tabelas sao compostas por linhas e colunas. Existe exatamente um
conteudode dado em cada colunade cada linha [28].
1.1.8. Banco De DadosMultidimensional
Um sistema gerenciador de banco de dados especificamente projetado para
suportar varias dimensoes de dados em uma arquitetura tres camadas. Tipicamente
nao suportam Sal (Structured Query Language) diretamente e, atualmente,
suportam um volume de dados significantemente menor que um Sistema
Gerenciador De Banco De Dados Relacional. Entretanto, esse tipo de gerenciador
de banco de dados pode ser uma excelente oP9ao para uma implementa9ao
departamental se a funcionalidade que ele prove atende a demanda do uswirio
referenteas infomna90esdo neg6cio [13].
"As pessoas falam da necessidade de separar a captura dos dados do
acesso aos dadas, em termos de bases separactas, movendo informac;5es entre si,
ao menos desde 0 inicio dos anos 80", testemunha 0 especialista da IDC em data
warehouse Henry Morris. 0 que mudou fai a maturagao de varias tecnologias-chave:
agora nao e mais 56 0 banco de dado relacional; mas SGBDR multidimensional, com
features especiais para aumento de performance, como index8g8o bitmap, e novos
esquemas para organizar e representar os dadas, visando nao somente a inser9ao
nipida de novas transa90es,mas analise e consultas complexas [2].
1.1.9. Analise Multidimensional
Analise multidimensional e a habilidade em manipular dados que foram
agregados em varias categorias ou dimens6es. A proposta da analise
multidimensional e auxiliar 0 usuario a sintetizar a informa9ao da empresa atraves de
uma visao comparativa, personalizada e projetada para a analise de dados
hist6ricos [13].
9
Algumas ferramentas de analise multidimensional possuem a habilidade em
acessar dados em urn sistema gerenciador de banco de dad os relacional; outras
requerem urn esquema estrela ("star schema") para facilitar 0 processamento
multidimensional [13].
A visao multidimensional e muito mais util para as analistas do que a
tradicional visao tabular utilizada nos sistemas de processamento de transa~ao.Ela
e mais natural, facil e intuitiva, permitindo a visao dos negocios da empresa em
diferentes perspectivas e, assim, transformando 0 analista num explorador da
informa9ao [6].
1.1.10. Ol TP (Online Transaction Processing)
• Processamento de aplica90es transacionais [13].
• Transa90es OlTP sao extremamente disciplinadas [13].
• 0 ambiente Ol TP e previsivel e regular em seu tamanho e forma [13].
Transa9ao Ol TP consome poucos recursos; pesquisa quantidade reduzida
de dados. Como resultado desta disciplina, 0 tempo de resposta de uma transa9ao e
bom (dois a tres segundos sao 0 normal) [13].
De maneira geral, um sistema aplicativo esta focado na precisao dos
processos operacionais [30].
1.1.11. OlAP (Online Analytical Processing)
Processamento Analitico Online e um importante metodo na arquitetura do
data warehouse na qual os dados podem ser transformados em informa9ao. OlAP e
urna categoria de tecnologia de software que permits a analistas, gerentes e
executivos a obterem perspicacia em dados de uma forma rapida, consistente e com
acesso interativo para urna grande variedade de possiveis vis6es da informa98o na
empresa. Mais suscintamente, OlAP e um conjunto de funcionalidades que tem,
como principal objetivo, facilitar a analise multidimensional [13].
10
OlAP representa um conjunto de tecnologias projetadas para suportar
analise e consultas ad hoc (consultas efetuadas pelo usuario de acordo com sua
necessidade momentanea) [6].
A caracteristica principal dos sistemas OlAP e permitir uma visao conceitual
multidimensional dos dados de uma empresa [6].
As bases OlAP podem ser acessadas/manipuladas atraves de aplica,oes
personalizadas ou ainda: [4].
• via Internet/Intranet [4].
• via aplica,oes pre-definidas para se fazer analises diversas [4].
1.1.11.1. ROlAP (Relacional OlAP)
Qualquer analise multidimensional efetuada em urn sistema gerenciador de
banco de dados relacional. A base de um desenho fisico ROlAP e, tipicamente,
uma combina,ao de dados apropriadamente normalizados em uma ou mais tecnicas
star schema [13].
1.1.11.2. MOLAP (Multidimensional OlAP)
Qualquer analise multidimensional efetuada em urn sistema gerenciador de
banco de dados multidimensional [13].
MOlAP e uma ciasse de sistemas que permite a execu,ao de analises
bastante sofisticadas usando como gerenciador de dados um banco de dados
multidimensional [6].
1.1.11.3. HOlAP (Hibrido OlAP)
E um produto de OLAP hibrido que pode prover analise multidimensional
simultaneamente de dados armazenados em urn banco de dados multidimensional e
em um banco de dados relacional [17].
11
1.1.11.4. WOLAP (Web OLAP)
Representa a migra,ao da tecnologia OLAP para 0 ambiente da Internet.
Tern havido urna grande divulga(fao sabre a usa de Web browsers para acesso a
OLAP, mas ainda sao poucos os sites em funcionamento com 0 uso de OLAP.
Segundo alguns institutos de pesquisa 0 OLAP baseado na Web sera a chave para
aplic8c;oes na Intranet e devera oferecer urn caminho simples e barato no acesso ao
data warehouse [17J.
1.1.12. Opera,oes Olap
Opera,oes OLAP sao as opera,oes de pesquisa e explora,ao da informa,ao
no cubo de dados. Sao elas: [21J.
Slice and Dice: Sao opera,oes de fatiamento do cuba de dados, permitindo
sua visualizac;ao em segmentos, assim como a rotac;ao do cuba buscando
novas perspectivas de visao de dados [21J.
Drill Down e Roll UP: Eo a capacidade de navega,ao aprofundando 0 nivel de
detalhamento dos dados, ou subindo este nivel de detalhe conforme a
hierarquia [21].
1.1.13. Modelagem Dimensional Dos Dados
A modelagem dimensional e a tecnica utilizada para S8 ter urna visao
multidimensional dos dadas. Nessa tecnica, os dados sao modelados em urna
estrutura dimensional conhecida par cuba. As dimens6es do cuba representam as
componentes dos negocios da empresa, tais como Ucliente", Uproduto", "fornecedor"
e "tempo". A celula resultante da intersec,ao das dimensoes e chamada de medida
e geralmente representa dados numericos como "unidades vendidas", "Iucro" e "total
de venda" [6J.
Ah§m dos componentes dimensao e medida, outro importante aspecto do
modelo multidimensional e a consolidac;ao dos dados, uma vez que para a tarefa de
12
analise sao mais ut8is e significativos a agregac;ao (au sumariZ8c;ao) dos valores
indicativos dos negocios [6].
o proprio desenho do data warehouse leva a novas perspectivas de projeto.
Nao ha necessidade de modelagem na terceira forma normal. Na pratica,
redundancia de dados e bem-vinda nesse ambiente. Para muitos projetistas, e uma
maneira diferente de modelar dados [30].
Modelagem Dimensional e urn nome novo para uma tecnica antiga usada
para criar bancos de dados simples e compreensiveis. Quando um banco de dados
pode ser visualizado como um "cubo" contendo ate tres, quatro, cinco ou mais
dimensoes, as pessoas conseguem visualizar ests esse cuba em qualquer de suas
dimens6es [19].
Dimensional Modeling (OM) e uma tecnica logica de projeto muito utilizada
nos data warehouses, diferente e oposta ao entity-relation modeling (ER). 0 OM e a
(mica tecnica viavel para os bancos de dados projetados para suportar as consultas
de usuario final de um data warehouse. 0 ER e muito util na captura de transa~6es e
nas fases de administra~ao de dados da constru~ao de um data warehouse, mas
deve ser evitado para 0 usuario final [3].
1.1.13.1. Fatos
Sao as medidas basicas de informac;oes do neg6cio. Representa as
quantidades e valores dos dados que podem ser agregados sem perderem seu
significado. A tabela fato ou fact table armazena as medidas basicas objetos de
analise do negocio. 0 dado na tabela fato e composto de elementos de dados
organizados em urn n[vel estruturado. as valores destes elementos de dados podem
ser sumarizados em uma variedade de formas sem par em risco a integridade dos
dados [13].
A chave de uma tabela fato e a composi~ao das chaves das tabelas
dimensao. 0 resultado e que existir;, uma linha na tabela fato para cada combina~ao
13
unica dos dominios de todas as chaves de todas as tabelas dimensao.
Caracteristicas: [13]
• Quantifica 0 dado que foi descrito nas tabelas dimensao [13].
• Chave composta de combina/f80 unica de valores das chaves das
dimensoes [13].
• Os valores da tabela fato sao somente aditivos [13].
• Sempre contem uma data [13].
1.1.13.2. Dimensoes De Um Cuba
Descrevem ou caracterizam as dados relacionados e organizados na tabeJa
fatos. As tabelas dimensao circundam a tabela fato. Representam as possiveis
formas de visualizar e consultar os dados.
• Chave deve ser unica [13].
• Permitir gerenciar numero de niveis de agrega,oes [13].
Caracteristicas: [13]
• Dimensao nao precisa ser uma hierarquia, pode ser uma combinaC;8o de
atributos [13].
(Exemplo demonstrado na Figura 1 do Anexo) [13].
1.1.13.3. Agrega,oes
Agregac;:oes sao sumariz890es de dados com 0 objetivo principal de
melhorar a performance de acesso. Geralmente amnazenadas em tabelas fatos
separadas [13].
Abstra,ao de dados que, aplicada a modelagem conceitual de dados,
permite que objetos venham a fomnar um novo objeto de mais alto nivel. Foi
proposto par J. M. Smith em 1977 [27].
Agrega,oes fornecem niveis multiplos de detalhes do fato [18].
as resultados das queries (au seus valores intermediarios) sao pre-
calculados, 0 que melhora muito a performance [18].
14
As agrega,5es podem ser acumuladas atraves de agrupamentos dilerentes,
Irequentemente atraves de varias dimens5es ou combina,ao de dimens5es [18].
o unico aspecto mais importante de design de urn data warehouse e 0
assunto da granularidade. Granularidade S8 refere ao nivel de detalhe contido as
unidades de dados no data warehouse [12).
Quanto mais detalhamento ha, mais baixo sera 0 nlvel de granularidade.
Quanto menos detalhamento ha, mais alto 0 nlvel de granularidade [13].
1.1.13.4. Tecnica star schema (esquema estrela)
A tecnica star schema pre-processa as dados ern uma tabela fatos central
com tabelas de dimensao relacionadas. As chaves (micas de cada tabela dimensao
comp5em uma chave combina9ao na tabela fatos. Os beneficios desta tecnica sao
que as dados esta.o pre-processados em dimensoes conhecidas e caracterizadas
em um conjunto especifico de necessidades de inlomna,ao do negocio, tornando 0
acesso pelo usuario mais eficiente (Exemplo demonstrado na Figura 2 do Anexo)
[13].
Este modelo e composto por uma tabela com chave de multiplas partes
(dimens5es) chamadas de tabela lato e de um conjunto de tabelas pequenas
chamadas de dimens5es, que fomnam as pontas das estrela. Cada tabela de
dimensao tern uma chave prima ria simples que corresponde a urn dos componentes
da chave multipla da tabela lato. A principio parece um modelo muito simples de ser
construido, pOrl§!m a determinayao das dimens6es e do fato tern necessidade de
excelente entendimento conceitual para que se obtenha sucesso em uma
implanta,ao de data warehouse [21].
1.1.13.5. Tecnica snow flake (lioco de neve)
A tecnica snow flake e uma variante do star schema com as tabelas
dimens5es nomnalizadas (Exemplo demonstrado na Figura 3 do Anexo) [21).
15
As hierarquias tern significado e importancia dentro da analise
multidimensional. No modele star, elas estao lodas em vista da desnormaliz8<;ao das
entidades, urn dos conceitos basicos de modelagem multidimensional. Urn
esquema alternativQ e a esquema snow flake, ande normalizando as hierarquias
encadeamos relacionamentos e entidades a partir das dimens6es. A utiliz8<;ao de
esquema snow flake depende da necessidade de otimiz8<;oes no projeto flsico ou
nas queries realizadas. Lembramos que sempre urn data warehouse tern como
objetivo sistemas de apaio a decisao, que necessitam das mais variadas consultas
[21],
Urn esquema snow flake e somente uma alternativa de constru~ao do
modelo de dados multidimensional .Todo modelo snow flake pode rapidamente ser
transformado em urn star, bastando para ista relacionarmos as hierarquias
diretamente as tabelas fato, desnormalizando-as completamente [21].
1.1.14. Metadados
Sao dados sobre dados. Descri~ao dos dados: estrutura, conteudo, chaves,
indices, detalhes, etc. Sem os metadados, 0 data warehouse e seus componentes
associados seriam meramente componentes nao integrados trabalhando
independentemente e com objetivos distintos [13].
Importante utilizar metadados para descrever 0 modelo dos dados e para
auxiliar na constru<fao das consultas. Dessa maneira, um analista pode executar
suas analises utilizando seus proprios termos [6].
Eo dado sobre urn determinado dado. Por exemplo: os metadados poderiam
indicar se uma base de dados existe na corporac;ao, quais atributos formam uma
determinada tabela, caracteristicas fisicas de um determinado atributo, tais como:
tamanho e formato, onde ele e utilizado, etc. As informa~6es do metadado podem
ser sobre os dados do legado, dados armazenados em data warehouse ou
informa~6es pertinentes a urn catalogo. Estas informa~6es sao armazenadas em urn
16
repasit6rio que tern 0 objetivo de documentar e administrar estes metadados e
fornecer informac;oes para reuso destes dados, melhorando a qualidade e
produtividade da empresa [16J.
1.1.15. Ferramenta CASE (Computer Aided Software Engineering)
Sao ferramentas individuais que auxiliam 0 desenvolvedor de software ou
gerente de projeto durante uma ou mais fases do desenvolvimento de software (au
manutenc;ao) [10].
Uma cambinac;ao de ferramentas de software e metodologias de
desenvalvimenta estruturada [10J.
CASE pode auxiliar diretamente no projeto e suporte do desenvalvimenta de
sistemas e tambem prove gerenciamento da infonmac;ao,documentac;ao e contrale
de como desenvolver um projeto [10].
1.1.16. SQL (Structured Query Language)
Eo uma linguagem padrao de acesso aos dadas em bancos de dados
relacionais independente de fomecedor.
Uma linguagem que habilita 0 usuario a interagir diretamente com 0 sistema
gerenciador de banco de dados para recuperar e/ou modificar dados gerenciados
pelo mesma [13J.
Caracteristicas: [28]
• Eo uma farma padrao de especificar canjuntas de dados [28].
• Eo uma forma de recuperar e manipular dados em um banco de dados
relacional [28].
• Eo utilizada para todas as func;oes de bancos de dados, incluindo
administrac;aa, criac;aode esquemas e recuperac;ao [28J.
• Pode ser utilizada na fonma de "SQL embutida" em um programa de
aplicativo [28].
17
1.1.16.1. Stored procedure (sp)
Stored Procedure e uma tecnica de projeto que permite que urn conjunto de
instru90es Sal sejam compiladas e armazenadas no gerenciador de banco de
dados. Sao rotinas chamadas por aplica90es cliente e sao armazenadas e
executadas no servidor. A stored procedure fornece uma significante melhora de
performance sobre 0 Sal utilizado diretamente na aplica9aO[27].
Uma stored procedure e uma cole9aO de comandos Sal anmazenados no
banco de dados e que pode ser executada pelo nome [5]1.1.17. Indexa9ao
E 0 conceito de indices de acesso. Sao estruturas de indexa9aO destinadas
a otimizar 0 acesso aos dados. E importante lembrar que em bancos de dados
relacionais, uma chave nem sempre tern urn indice associado a ela. Chaves sao
defini90es de nivel logico e os indices sao estruturas fisicas para melhorar a
performance no acesso aos dados. [27].
indice POr9aOda estrutura de anmazenamento de dados mantida para
prover acesso eficiente a um registro quando seu conteudo chave e conhecido [13].
indice Invertido : Uma estrutura de indice organizada por meio de uma chave
nao unica que aumenta a velocidade de pesquisa aos dados [13].
Indices: [5]
• Sao utilizados para melhorar a performance. (se nenhum indice edefinido a uma tabela, a tabela inteira devera ser pesquisada para
satisfazer uma condi9aOde consulta) [5].
• Proveem um mecanismo para garantir a unicidade [5].
1.2. ASPECTOS ESTRATEGICOS PARA A CONSTRU<;AO DE UM DATA
WAREHOUSE
18
1.2.1. Planejamento
Urn problema serio em projetos de data warehouse e um planejamento
defeituoso. 0 fato de todos concordarem que a projeto de um data warehouse nao
se baseia em requisitos bem delimitados nao significa que os projetistas nao devam
planejar minuciosamente cad a atividade do processo. E mais, tal planejamento deve
levar em considera9aO 0 fato de se tratar de um data warehousing mais que um data
warehouse: um processo sem fim para todos os efeitos praticos. Deve ser
considerado 0 longo prazo geralmente envolvido. Nao se estara projetando uma
aplica9aOoperacional, mas sim um repositorio de informa90es gerenciais [9].
A Opera9aO do negocio tende a uma estabilidade grande. Um aplicativo
voltado para gerir essas atividades tende, portanto, a ser bastante estavel, pelo
menDS quando comparado as necessidades de infonnactao para a tamada de
decisao. E aqui que a competitividade do mercado se faz sentir. As perguntas que
as executivos precisam ver respondidas hoje para tomarem suas decis6es podem
ser substancialmente as de amanha. Desse modo, um planejamento consistente
deve preyer liberac;6es parciais de dados, em curtes intervalos, de maneira que a
usuario cedo possa interagir com 0 ambiente, facilitando 85sa mudanga inevitavel de
requisitos. Os planejadores devem identificar muito cedo os alvos do projeto e seus
beneficios [9].
Recomenda-se que a data warehouse nao comece muito ambiciosamente.
a primeiro projeto nao deve levar mais que nove meses para estar operacional e
deve atingir basicamente as areas de neg6cio mais importantes e que tragam
retorno direto e tangivel. Com 0 tempo, ele sera refinado e aumentado em sua
abrangencia [29].
Um projeto de data warehouse deve ser conduzido com enfoque diferente de
um projeto de aplica90es tradicional. A primeira etapa e identificar os objetivos da
organiza9aO, sob a optica de seus executivos. A empresa pretende crescer dentro
de seu segmento de negocio? Depois, sao identificados os processos de negocio
19
diretamente relacionados com esses objetivos. A seguir, definem-se as informac;6es
que sao necessarias para suportar esses processos de decisao. Onde essas
informac;oes serao obtidas? As especific8c;oes tecnicas aparecem no final, quando
entao S8 desenham as alternativas tecnol6gicas para a sua total implementac;ao
[30].
1.2.2. Necessidades Das Empresas
No principia haviam sistemas simples de automac;ao. Entao vieram sistemas
de banco de dados e sistemas on-line. Em um tempo muito pequeno a computador
tinha achado seu modo de incorporar-se aD cotidiano das empresas. De quase
nenhum computador nos anos cinquenta para milh6es de computadores de todo
tipo e tamanho nos anos oitenta, a mundo da tecnologia explodiu al8m de qualquer
previsao a uma taxa de crescimento que parecia ser impassivel acreditar [13].
Os sistemas de computa9ao iniciais fcram projetados para processar as
tranS8c;oes diarias da corporac;8o. Decis6es imediatas eram 0 enfoque destes
sistemas pioneiros. Com 0 advento dos primeiros sistemas, veio urn subproduto de
dados. Estes dados refletiam as atividades que estavam acontecendo e cresceram
a medida que a tempo passava e de como a negocio era administrado [13].
Caso apos caso, os usuarios finais sabiam que os dados de que eles
precisavam estavam disponlveis mas dificeis de serem obtidos. Ainda, em cada
caso, 0 departamento de sistemas de informa~aodava uma ou outra justificativa do
porque de os dados nao poderem ser acessados. Usuarios finais sentiam-se
abandonados e frustrados [13].
Entao, 0 data warehouse foi criado. 0 data warehouse transferiu os dados do
ambiente transacional, armazenando-os e organizado-os de forma que 0 usuario
final poderia obter a informa<;iio pela qual tanto ansiava. Alinal, as dados estavam
disponiveis em uma base para que 0 usuario processasse suas proprias consultas
[13].
20
o data warehouse representou uma troca fundamental na concep~ao de
sistemas de infonma~aoe introduziu alguns conceitos novos importantes: [13]
• Oados devem ser integrados atraves da empresa [13].
• Oados sumarizados tem um grande valor para a organiza~ao [13].
• Oados historicos sao a chave para compreender os dados ao longo do
tempo [13].
• Metadados representam um papel muito importante na infra-estrutura do
data warehouse [13].
• Muito importante manter a precisao dos dados hist6ricos com 0 passar
do tempo [13].
Alem de resolver alguns problemas muito importantes para a corpora~ao, a
cria9ao do data warehouse aliviou 0 fardo do programador de aplica~ao em tentar
transformar 0 ambiente de sistemas legado em um sistema para a tomada de
decisao. As solicitayoes dos usuarios e a manutenc;ao das aplic8c;oes, pela primeira
vez, tornaram-se gerenciaveis [13].
o objetivo basico do data warehouse deve ser adicionar valor ao neg6cio. A
medida que as regras do negocio sao incorporadas as aplica90es, exige-se rapidez
cada vez maior nas respostas. 0 ambiente de negocios e crescentemente dinamico.
Responder com rapidez ao como, quando e quanta passa a ser decisivo para a
empresa sobreviver e crescer nesse cenario [30].
As organiz8yoes hoje em dia estao enfrentando enormes press6es para
preyer informayoes de melhor qualidade para tamada de decis6es, em formatas de
f8Cil acesso e manipulac;:8o. Em poucas palavras, as empresas precisam S8 tornar
mais ageis em sua capacidade de utilizar as enormes quantidades de dados no
esfor~o de proporcionar melhor suporte ao cliente [32].
Urn data warehouse reconhece 0 valor estrategico do gerenciamento
intencional do bem corporativo de dados. A enfase no data warehouse reflete 0
reconhecimento de que a explora~ao de dados e 0 caminho para vantagem
21
competitiva, novas oportunidades de neg6cios, e mel haria no servi90 ao cliente. Ela
tambem reconhece que as sistemas tradicionais de gerenciamento de base de
dados esUio geralmente assoberbados pelo enorme volume de dados que Ihes sao
confiados. Como resultado, os sistemas de extra~ao de informa~6es que trabalham
com a totalidade das bases de dados geralmente funcionam mal [32].
o data warehouse e a arquitetura associada a ele providencia 0 objetivo
para lutar contra as mais variados desafios confrontados nos sistemas de
informa~6es gerenciais de hoje [14].
Em outras palavras, 0 data warehouse permite 0 gerenciamento para
considerar resultados no contexto. Sem a arma~ao do data warehouse e sua
arquitetura associada e uma tarefa quase impassivel formar sentido para as diversos
resultados obtidos [14].
Data warehouse e entendido como uma "enabling technology"; uma
tecnologia-meio, que favorece a tamada de decisoes ao separar sistemas de
informa~6es para decisao dos dados de produ~ao. Essa divisao dos dados permite,
dizem as entusiastas, melhor alocac;ao e administraC;80 de recursos; enquanto que a
prolifera~ao de ferramentas sofisticadas de acesso possibilita combinar varias fontes
de dados de estruturas distintas e concretiza, assim, antigas promessas de gerencia
participativa e menor concentra~ao de poder decisorio [2].
1.2.3. Hierarquia Classica Da Informa~ao Na Empresa
Piramide com tres niveis: [9]
1° Nivel (Topo da Piramide) e 0 Nivel Estrategico: EIS-Sistema de
Informa~6es Executivas .
2° Nivel (Meio da Piramide) e 0 Nivel Tatico: DSS-Sistema de Suporte a
Decisao.
3° Nivel (Sase da Piramide) e 0 Nivel Operacional: Sistemas Operacionais
22
o patrocinio efetivo da alta administra~ao da empresa e critico. E esse
patrocinio naD pode S8 revelar apenas na hora de assinar a cheque. A empresa
precisa fornecer as analistas do negocio, aqueles tecnicos que conhecem
profundamente a informa~ao e 0 neg6cio da empresa [9].
1.2.4. Motiva~ao Da Empresa No Mercado
o verdadeiro impulso para a utiliza~ao da tecnologia de data warehouse
come~ou quando as pessoas perceberam que as informa~6es disponiveis no data
warehouse poderiam ser utilizadas para a obten~ao de vantagem competitiva. Esta
informa9ao apoiou a habilidade da corporac;ao em atrair e manter parte do mercado,
reduzir despesas e aumentar as vendas. Estes atributos elevaram 0 data warehouse
para a vanguarda de sistemas de infonma~ao, tornando-o promissor tanto para 0
profissional tecnico da informaC;:8o quanta para 0 profissional da area de negocios
[13].
Estarnos vivendo 0 inicio da era da infonma~ao. Nela os grandes desafios
sao a integraC{8odos processos operacionais entre as empresas e 0 gerenciamento
do neg6cio atraves da analise dos fatos para identifica~ao de oportunidades [25].
1.2.5. Necessidades e Beneficios Para 0 Usuario
A necessidade principal do usuario e a transfonma~ao dos dados em
informa~6es [13].
Embora 0 seu usa ainda seja incipiente, alguns resultados positivos parecem
dernonstrar que realmente 0 data warehouse produz urn alto retorno sabre 0
investimento. A grande vantagem de um data warehouse e permitir a tomada de
decis6es baseadas em fatos. Na verdade, ele busca disponibilizar Ii organiza~ao 0
grande volume de dad as que foram e estao sendo armazenados em bases de dados
operacionais, espalhadas por toda a empresa [29].
23
o principal resultado de urn data warehouse e. indiscutivelmente, a
facilidade de os gestores da empresa poderem tomar decis6es rapidas, baseados
em informa<;6esmais consistentes [29].
Levantamentos realizados junto a usuarios em ambito rnundial e local
atestam 0 sucesso dos projetos ja implantados, nos quais os primeiros resultados
apontaram para: aumento do tempo dos tomadores de decisao (decision makers)
para a analise e tamada de decisao; elimina<;ao de tarefas operacionais como
pesquisa e identifica<;iio dos dados necessarios ao processo decisorio; melhor
confiabilidade das informa<;6es devido il implanta<;iio de um elo integrador dos
dados transacionais; racionaliza<;iio do fluxo de informa<;6es da empresa;
padronizac;ao dos conceitos de negocio; democratiz8980 das informayoes sobre 0
desempenho do negocio [22].
1.2.6. Perfil Do Usuario Na Empresa Que Utiliza 0 Data Warehouse
o usuario, 0 forrnulador de perguntas, e 0 ponto mais critico nos projetos de
data warehouse. Idealmente, os usuarios devem ser membros da equipe de projeto,
desde 0 seu nascimento [9].
Cada interac;ao do data warehouse deve ter urn "Patrocinador Executivo" da
area de neg6cios da comunidade usuaria que serao as primeiros beneficiaries da
funcionalidade destas interac;oes. 0 Patrocinador Executivo e especialmente
importante para 0 data warehouse. Ele define 0 escopo e requisitos do negocio e
analisa as necessidades de informac;ao da organiza<;ao para a tomada de decisao.
EXistem, tambem, dois importantes papels adicionais na comunidade de usuarios
finais: Especialista do Assunto e Tecnico de Apoio ao Usuario [13].
a Especialista do Assunto e quem facilita a comunica<;ao entre os usuarios
finais e a equipe tecnica do data warehouse. Prove as infonna<;6es para definir 0
escopo de uma intera<;iio do data warehouse. Participa no projeto e revisiio da
aquisi<;iio e capacidade de acesso aos dados. Assiste 0 treinamento de outros
24
usuarios em seus grupos funcionais. Atua como suporte a Qutros usuarios em suas
areas [13].
o Tecnico de Apoio ao Usuario prove apoio tecnico global para as usuarios
do seu departamento, grupo, linha de negocio, etc.; entende 0 ambiente tecnico de
uma area especifica do data warehouse, presta apoio como administrador de banco
de dados local e apoio tecnico aos usuarios locais [13].
Urn ingrediente essencial para 0 sucesso do ambiente do data warehouse e 0
fator humano. 0 melhor projeto e a melhor arquitetura no mundo nao sao bem
usadas S8 nao existirem pessoas capazes e preparadas para colocarem as pianos
em a~ao [14].
1.2.7. Analise Do Ambiente Legado
Situada entre 0 ambiente operacional, 0 data warehouse e 0 deposito de
dados operacionais esta a interface de integra~ao e transforma~ao dos dados. Esta
interface e 0 local onde 0 dados nao integrados do ambiente operacional sao
integrados e enviados ao data warehouse [13].
Como todo 0 data warehouse depende dos dados disponiveis nas bases de
dados operacionais da empresa, 0 primeiro passe para sua constru~ao e 0
mapeamento dessas bases, sua limpeza e sincroniza~ao com as demais camadas.
Para isso, e extremamente necessaria conciliar em urn unico ambiente a
administra~ao de todas as bases de dados operacionais que sao fonte de
alimentay80 para a data warehouse com a administrayao do data warehouse em si
[22].
Criar um data warehouse nao e uma simples questao de escolha de banco
de dados ou ferramentas, mas envolve planejamento e modelagem (aspectos que
garantem a qualidade dos dados, fator critico para 0 sucesso do projeto), escolha de
ferramentas e atualiz8980 e refinamento continuos. E, de fato, uma arquitetura
completa e que se compoe dos seguintes elementos principais: bases de dados
25
operacionais, que sao as fontes primarias das informa~6es;processos de extrac;ao e
conversao de dados; bancos de dados especificos para data warehouse; recursos
de administra9ao e ferramentas de inteligencia de negocios, que facilitam 0 acesso,
manipulac;ao e analise dos dados contidos no data warehouse [24].
Urn armazem de dados e composto de tres areas funcionais distintas, cad a
uma das quais deve ser customizada para satisfazer as necessidades do negocio. aprimeiro componente e a aquisic;aode dad as, pedendo ser de sistemas legados ou
de outras fontes quaisquer. La 0 dado e identificado, copiado, formatado e
preparado para ser carregado no armazem. 0 segundo componente do armazem eo espa90 de armazenamento e 0 terceiro e a area de acesso aos dados [26].
1.2.8. Equipe De Desenvolvedores
o cresci menta do data warehouse criou a necessidade de disciplinar 0
gerenciamento do mesmo que e 0 papel do administrador do data warehouse
(DWA). 0 DWA e parte administrador de dados, parte administrador de banco de
dados, deve posicionar-se um pouco como usuario final, um pouco programador de
sistemas e muito de programador e projetista de aplica9ao [13].
o administrador do data warehouse e um disciplinador organizacional que
apareceu com 0 advento do data warehouse e dos sistemas de apoio a decisao. Ele
eo principal responsavel para 0 sucesso continuo do armazem de dados . Em suma,
o administrador do data warehouse e responsavel por um ambiente inteiro de
suporte a decisao que e 0 fator crucial para 0 sucesso da corpora9ao [13].
1.2.9. Aspectos Da Implementa9ao Fisica (Rolap/Molap)
Quanto a localizayao dos dados a serem utilizados na analise, atualmente
existem duas abordagens: [6]
• Um banco de dados multidimensional especializado [6].
• Um data warehouse implementado com a tecnologia de banco de dados
relacional, mas otimizado para a tarefa de analise: Nesse casa, as dados
26
sao modelados utilizando um esquema projetado para balancear
desempenho e volume de dados. Normalmente e utilizada uma
representayao desnormalizada da conhecida par esquema estrela [6].
Sistemas OLAP que implementam a primeira abordagem sao chamados de
MOlAP (Multidimensional OLAP) e aqueles que implementam a segunda sao
chamados de ROlAP (Relacional OlAP) [6].
Sistemas ROlAP fornecem analise multidimensional de dados armazenados
em uma base de dados relacional [6].
A principal vantagem de se adotar uma solu,ao ROlAP reside na utiliza,ao
de uma tecnologia estabelecida, de arquitetura aberta e padronizada como e a
relacional, beneficiando-se da diversidade de plataformas, escalabilidade e
paralelismo de hardware [6].
MOlAP ou ROlAP? Qual escolher? Atualmente existe um grande debate
sabre essa questao e, S8 passivel, esse debate deve ser deixado para os
fornecedores. Para quem utilizara a tecnologia, 0 mais importante e entender as
negocios da empresa para entao decidir pela solu,ao que melhor atende 0 volume
de dados e as necessidades de analise da empresa [6].
Provavelmente esse debate nao tera urn vencedor. Ja se percebe que existe
uma convergencia dessas duas tecnologias. Fornecedores MOlAP tem adicionado
funcionalidade ROlAP nos seus produtos e, igualmente, fornecedores ROlAP tem
ennquecido a funcionalidade e desempenho de seus servidores [6].
1.2.10. Performance
A dura,ao de tempo desde 0 momento em que um pedido e emitido ate 0
primeiro resultado recebido [13].
A maio ria das consultas dos usuarios precisam processar rcflpida e
eficientemente. 0 administrador do data warehouse e respons8vel pela performance
27
de carga de dados, criayao de indices e manutenyao de metadados, itens
importantes ao analisar a performance [13].
1.2.11. Seguranya
Proteyao dos dados em um banco de dados que gerencia os acessos com
ou sem autorizac;ao. Hil niveis diferentes de seguranya conforme 0 perfil do usuilrio
[13].
o problema de proteger as informac;6es do data warehouse e normalmente
colocado em segundo ou terceiro plano. Temos que saber quem estil acessando as
informac;oes, de onde e como S8 esta manuseando. as bancos de dados tern seus
esquemas de seguranlfa, porem eles nao conseguem resolver todos as problemas.
E necessaria procurar uma so[uc;ao que realmente consiga evitar que as intrusos e
curiosos consigam tirar proveito dessas informay6es[20].
28
2. ESTUDO DE CASO: ALGUNS EXEMPLOS
De acordo com 0 embasamento te6rico apresentado, iniciarei 0
desenvolvimento das eta pas do projeto considerando aspectos essen cia is para 0
modelo dimensional e exemplos de estudos de caso voltados as necessidades de
Organiz890es Educacionais.
2.1. FATORES CRiTICOS DE SUCESSO
Prime ira mente, e de extrema importancia elencar as principais itens que
determinarao 0 sucesso do projeto. Abaixo estao alguns itens importantes:
1. E fundamental planejar 0 projeto.
2. E importante ter 0 on;amento aprovado para desenvolver 0 projeto de
acordo com 0 plano de investimento da empresa.
3. E importante que a empresa esteja disposta a modernizar-se para garantir
o crescimento e a competitividade.
4. E importante ter 0 apoio e 0 empenho dos usuarios responsaveis e suas
respectivas ger€mcias atraves de atitudes participativas e cooperativas.
5. E fundamental ressaltar a importancia das informa<;6es para a empresa e.
em especial, 0 compartilhamento das mesmas, evitando duplicidade de
dados e informa90es proprietarias.
6. E necessaria negociar urn acordo com a alta actministraqao referente aproposta de implementa<;ao do projeto.
7. E importante primeiro analisar as areas de atua<;ao mais lucrativas da
empresa.
8. E importante analisar a conten<;ao de custos.
9. E imprescindivel que as informa90es sejam precisas, consistentes e
rapidas de obter.
10. E importante ter a capacidade de adapta<;iio as necessidades de neg6cio.
29
11 E necessario apresentar resultados entre as eta pas do desenvolvimento
do projeto.
Ap6s definir as fatares criticos de sucesso do projeto, devera S8 iniciada a
analise de qual tecnica de desenvolvimento de sistemas mais se integra aconstru9ao de um projeto de data warehouse.
2.2. DEFINI<;:AO DA TECNICA DE DESENVOLVIMENTO DE SISTEMAS A SER
UTILIZADA
E de extrema importancia utilizar uma tecnica para desenvolvimento de
sistemas para auxiliar no projeto do data warehouse. Sugiro a tecnica da Engenharia
da Informa9ao em virtude de os dados serem 0 enfoque principal desta tecnica e em
um data warehouse 0 objetivo principal e a transforma9ao dos dados em
informac;oes.
Como produto principal desta tecnica temos 0 modelo de entidades e
relacionamentos (MER). Um MER e va lido e confiavel quando consegue responder
as perguntas dos processos que serao par ele atendidos.
Tendo definida e assirnilada a tecnica de desenvolvimento de sistemas a ser
utilizada no projeto, e lmportante entender quais sao as necessidades do usuario,
diferenciando-as entre 0 ambiente analitico e 0 operacional.
2.3. VISUALIZAR AS NECESSIDADES DO USUARIO
o usuario e 0 fator chave para 0 sucesso do projeto. Sua participa9iio efetiva
durante todo 0 projeto e 0 requisito mais irnportante pO is ele e quem domina a area a
ser analisada e ira dirimir as duvidas do analista da informa9ao que implementara 0
projeto.
a usuario necessita de urn sistema que forneya informac;oes para que deci-
soes sejam tamadas de acordo com a analise destas informa90es. Ha a
30
necessidade de entender a diferen\=8 entre as sistemas de processamento
operacional e a analftico.
Sistemas de processamento operacional sao sistemas que suportam as ope-
rac;oesdo dia a dia da empresa. Sao sistemas de processamento on-line atualizados
ao longo do dia. Exemplos: Sistema de Estoque, Sistema Contabil, Folha de Paga-
mento, etc. As informac;oes refletem 0 momenta atual [15].
Sistemas de processamento analitico disponibilizam infonmac;6es usadas
para analisar urn problema au uma situag8o. E feito par meio de comparac;oes ou
atraves da analise de padroes ou tendencias. As informac;6es refletem um instante
especifico no tempo. Exemplos: mostrar como uma marca de um produto esta sendo
vendida em diferentes estados; mostrar como uma marca especifica de urn prod uta
esta sendo vendido desde que foi introduzido nas lojas; comparar as vendas dessa
marca de produto em diferentes localidades, etc. [15].
Tendo definidas e assimiladas quais sao as necessidades do usuario, eimportante entender a mudanc;a de enfoque em um projeto de data warehouse no
que se refere as infonmac;6espara a tomada de decis6es. Durante este processo, e
fundamental a participac;ao do usuario e 0 pleno entendimento dele nesse novo
processo de analise da informac;80.
2.4. NOVA VlsAo DA INFORMA<;AO PARA A TOMADA DE DECISOES
o que buscamos quando estamos modelando sistemas de informac;ao e 0
entendimento operacional do negocio que esta sendo modelado, sem pensar na
aplic8C;80em si, sem pensar na tecnologia envolvida, mas com a visao relacional de
dados. Quando vamos executar uma modelagem multidimensional, estamos dese-
nhando soluc;6es de gestao de negocios, buscando entender como os executivos e
gestores de uma organiza98o avaliam as informac;6es para adoc;ao de estrategias e
avaliac;ao de desempenho. A mudanc;ade enfoque de "entendimento operacional do
negocio para entendimento da gestao do negocio" concentra e provoca diferenc;a
31
acentuada na forma de se desenvolver um modelo de dados multidimensional. A
analise multidimensional requer urn modele de dados que permita que as dados
sejam facilmente visualizados atraves de diversas perspectivas. Mais adiante
apresentarei como aplicar a modelagem dimensional.
Abaixo cita urn exemplo de uma nova visao da informat;ao com a utiliz8C;:80
do data warehouse:
"0 data warehouse e parte fundamental da soluc;ao, que analisa 0
comportamento do cliente, informando em caso de desvio padrao. Durante testes em
um banco australiano, por exemplo, foi identificado um deposito que fugia aos
padroes do correntista. 0 banco entrou em contato com 0 cliente e descobriu que 0
deposito fora um presente de casamento - 0 valor da quitac;aode uma casa. A partir
dessa informac;ao, desenvolveu promoc;oes para aquele cliente especifico, que
conseguiu um emprestimo para acabar de montar sua casa [11]".
o passe seguinte e como analisar a area do negocio a ser modelado.
2.5. ANALISE DO NEGOCIO A SER MODELADO
Primeiramente definir os objetivos do projeto que podem ser resumidamente
descritos nos dais itens abaixo:
1. Disponibilizar as bases de dados do ambiente operacional (OLTP) para
um ambiente analitico (OLAP).
2. Permitir aos usuarios a extrac;aodos dados atraves de analise exploratoria
no ambiente OLAP.
Definir 0 escopo do projeto, observando:
• Caracterizar a problema: 0 dado deve ser representacto como informac;ao
• Definir quais processos sao mais criticos para a negocio e que precisam
de decis6es sabre ele.
o Assimilar 0 conhecimento e definic;ao da area de atuac;ao (negocio) do
cliente especifico e tomada de decisao.
32
• Definir grupo gestor da informa9ao que ira participar durante todo 0
processo de desenvolvimento do projeto. 0 grupo gestor pode ser
considerado como os usuarios que dominam a area de neg6cio e que
tomam decis6es, juntamente com 0 pessoal de informatica.
Eo extremamente importante a defini9ao do escopo do projeto pois e a base
do mesmo. No escopo deve ser descnto se a implementa9ao sera em urn data
warehouse (base corporativa que atendera teda a organiz898o) au em urn ou varios
data mart's (base de informa9aopor linha de neg6cio que contem urn sub-conjunto
dos dados corporativos da organiza9ao). Recomenda-se iniciar com data mart's
integrando-os a urn data warehouse ao longo do tempo, Isto justifica-se pelos
seguintes aspectos:
o custo e bern infenor a implantar urn data warehouse de toda a
empresa;
• 0 tempo de implementa9aoe reduzido;
Mais facil assimilar a atua9ao de uma area de neg6cio especifica a
entender todo 0 processoda empresa,
Optando-se por implementar em data mart's, deve-se ter 0 cuidado de nao
esquecer a integraC;8o entre as data mart's caSa contn3rio 0 projeto e inviabilizado.
Tendo definida a area de neg6cio da empresa a ser implementada no
projeto. deve-s8 analisar enda estao as informaf):oes que alimentarao 0 data
warehouse I data mart(s). A origem destas informa90ese comumente chamada de
"Iegado".
2,6. ANALISE DOAMBIENTE LEGADO
Partindo das necessidades de informa9ao por area de neg6cio ja estarem
definidas, nesta analise deve-s8 observar 0 seguinte:
• Analisar 0 ambiente computacional da empresa.
33
S8 as informac;:6es necessarias estao armazenadas nos aplicativQs
operacionais au, casa contrinio, manter as aplicativos operacionais para
que obtenham os dados que faltam. Verificar viabilidade deste tipo de
manutem;:8o para gerar a informac;:ao que falta no sistema analitico.
• Definir como integrar as varias fantes de informac;:ao, S8 houverem.
o grande fator de sucesso de projetos incrementais de data martsl data
warehouse est'; na transforma,ao, extra,ao, prepara,ao e limpeza dos dados.
Oefinir criteriosamente as necessidades, forma, fontes e as regras de mecanismos
de transfonma,ao como, por exemplo, a padroniza,ao do conteudo dos dados.
Supondo que, no ambiente operacional, a informa,ao sexo do cliente est.;, em
alguns sistemas, como "F/M" e em outros "1/2". Ao carregar esta infonma,ao no data
warehouse, deve-s8 definir urn unico padrao para conteudo do mesma dado
originario de fantes distintas.
A proxima etapa Ii a constru,ao da modelagem dimensional.
2.7. MODELAGEM DIMENSIONAL DOS DADOS
Utilizarei como tlicnica principal para a modelagem de dados dimensional 0
star schema que e a tecnica mais indicada para projetos de data warehouse.
Muito importante Ii documentar 0 modelo de dados em uma ferramenta
CASE onde definem-se as tabelas, atributos, dominios, enfim, todas as informa,5es
necessarias para garantir a plena documentay8.o do modele e facilitar a geraCfao dos
esquemas fisicos no banco de dados, principal mente em bancos de dados
relacionais.
Considere a seguinte afirmativa: "Nos vendemes produtos em varios merca-
dos enos medimos nosso desempenho ao longo do tempo".
o modele de dados rna is adequado para representar diversas rela90es entre
grandezas Ii 0 modelo dimensional. [15]
34
Para melhor visualizar as dimens6es, abaixo esta representado urn "cuba"
propriamente dito com 3 dimensoes:
TEMPO
vMERCADO
Cada ponto do cubarepresenta umacombinacao de
Produto, Mercado eTempo armazenado.
PRODUTO
A seguir, definirei as conceitos basicos que norteiam a modelagem
dimensional:
2.7.1. Dimensoes
Representam as possiveis formas de visualizar as dadas. Sao as entradas
para as consultas (tempo, regiao, cliente, etc). A base para entendimento de qual-
quer neg6cio e responder as quatro perguntas fundamentais abaixo:
1. QUANDO?
2. 0 QUE?
3. ONDE?
4. QUEM?
(Periodo de tempo a que se refere a analise)
(0 principal objeto de analise)
(Localiza,ao fisica ou geografica para analise)
(Um objeto especifico e detalhado para analise: opcional)
Dimensao mascarada: E aquela dimensao com pouquissimas ocorremcias.
Exemplo: Dimensaa Tipo Cliente - Ativo ou Inativo. Nao S8 cria uma tabeJa dimen-
sao com essas ocorremcias e sim usar esta dimensao como restri980 na clausula
where da consulta. No modelo pode au nao ser representada como uma dimensao
ligada a tabela fatos.
35
2.7.2. Fatos
E a tabela central que interliga as dimensoes e tern os indicadores de analise
ou metricas (quantidade, valores,etc). A tabela fato devera possuir, no minimo, as
tres primeiras dimens6es. A pergunta "QUEM?" refere-se a um nivel de analise mais
detalhado.
2.7.3. Exemplo de uma analise dimensional.
"Precisamos analisar a quantidade e valor faturado dos produtos de nossa
empresa em nossas lojas para medirmos nossa desempenho aD longo do tempo".
Partindo da premissa aeima que reflete a necessidade de informa9ao do usuario, 0
projetista do data warehouse faz 0 primeiro esbo,o da modelagem dos dados de
acordo com as 4 perguntas fundamentais:
1. QUANDO: Periodo de tempo. De acordo com a necessidade de analise do
usuario. Pode ser: dia, semana, quinzena, mes, bimestre, trimestre, se-
mestre, ana, etc.
2. 0 QUE : Produtos oferecidos pela empresa.
3. ONDE : Lojas da empresa.
4. QUEM : Opcional. No exemplo acima essa pergunta na~ se encaixaria
po is nao foi solicitada como objeto de analise. Param, case 0 usuario ne-
cessitasse saber quais as maiores clientes que efetuam compras de de-
terminados produtos, ai sim a informa<;ao Cliente S8 enquadraria na per-
gunta "quem".
Ate agora foram definidos os objetos de analise, no caso as dimensoes de
consulta. Obviamente nenhum resultado aparente sera apresentado combinando as
referidas dimensoes pois 0 que esta faltando sao os fatos ainda nao analisados no
modelo. Os fatos ou medidas sao 0 elo de liga,ao entre os varios tipos de combina-
90es de consulta entre as dimensoes. Eo que sera medido, no caso 0 faturamento e
a quantidade de produtos. Sempre sao definidos como numeros que podem ser me-
36
didos, sumarizados e calculados. No exemplo, as fatos sao: quantidade de produtos
e valor falurado.
Em seguida, projelarei 0 modele de dados ulilizando a lecnica star schema,
que consiste em uma tabela cenrrar(fatos), relacionada com as dimens5es. A
estrutura final parece uma estrela, por isso a denomina,ao da tecnica. As tabelas
dimensoes sao tabelas independentes, ou seja, possuem uma (mica chave primaria
e atributos que a identificam e que sao utilizados para a consulta. Sao tabelas des-
normalizadas. A tabela fatos e uma tabela dependente das dimens5es ou seja, sua
chave primaria e a combinayao das chaves primarias das dimensoes e os atributos
para analise sao as fates ou medidas, no nossa exemplo 0 valor faturado e a
quantidade de produtos.
Obs: No exemplo abaixo da tecnica star schema, as chaves primarias de cad a tabela
estao em negrito.
DIMENSiio TEMPODIMENSiio PRODUTO
Chave_tempo
GChave_produto
Data_Venda ,/ DescricaoDia da SemanaMeg - MareaAno
FATOS VENDAS Categoria
Chave_tempoChave_produtoChave_loja
Valor Faturado I~Quantidade_ Vend idaDIMENSiio LOJA
Chave_loja
NomeEnderecoCidadeUF
37
• As chaves primarias das tabelas padem ser, um numera sequencial au a propria
data da venda, codiga do praduta e codiga da laja, desde que esteja garantida a
unicidade da chave primaria em cada tabela dimensaa .2.7.4. Agrega90es
E um fatar impartante a analisar ja que a principal abjetiva de uma agrega9aa
e preyer urn aumento de performance no acesso aos dados e reduzir 0 volume de
dadas na tabela. As agrega90es (au sumariza90es) cansistem em gerar infarma90es
redundantes a partir da informa9aa de menar granularidade [15]. As agrega90es:
• Farnecem niveis multiplas de detalhe do fata [18].
Os resultados das queries (au seus valores intermedii'lrios) sao pre-
calculadas, a que melhara muita a performance [18].
• Podem ser acumuladas atraves de agrupamentos diferentes.
FreqOentemente atraves de varias dimens5es ou combinagoes de
dimensoes [18].
Numero da Loja'--- ~ Data da Transac;tlo
Numero de ClientesQuantidade de ProdutosValor das Vendas
Agregam-se varios fatos par Loja par Dia:
1[ Numero de clientes - Quantos clientes fizeram compras?
1t Quantidade de orodutos - Quantas unidades de orodutos foram vendidas?
38
2.7.5. Metadados
Metadados sao dados sobre dados que podem ser entendidos como
verdadeiros documentadores dos dados que compoem um data warehouse.
Os metadados armazenam diversas informa90es sabre dados armazenados
no data warehouse. Estas informa90es sao armazenadas em urn reposit6rio que tern
como abjetivo principal documentar e administrar os metadados.
Os metadados englobam a data warehouse e mantem informac;oes sabre a
estrutura dos dadas, as fontes de dados, a transforma9ao dos dados, as rotinas de
extra9aO de dados, 0 modelo de dados, relacionamentos e demais informa90es
pertinentes a dar significado ao dado.
Recomenda-se a utiliza9aOde uma ferramenta CASE para documenta9aO dos
processos, modelos de dadas, dicionario de dadas, dominios de atributos e gerac;ao
dos esquemas fisicos no banco de dados.
2.7.6. Resumo das etapas para a modelagem dimensional.
A seguir apresentarei, resumidamente, as etapas importantes a serem
seguidas na modelagem dimensional.
1. Obter a necessidade executiva: qual 0 neg6cio objeto de gestao.
2. Entender quais sao os indicadores de valor do neg6cio definindo as
metricas de controle.
3. Descrever em urn modele de dados conceitual 0 neg6cio.
4. Se houverem modelos de relat6rios do ambiente operacional: simular.
5. Definir 0 que descreve 0 neg6cio: dimensoes.
6. Definir a organiza9ao da dimensao tempo: qual a menor unidade de
tempo.
7. Trabalhar com a conceito de hierarquia nas dimens6es de consulta: Par
exemplo uma hierarquia na dimensao tempo: Dia -> Mas -> Trimestre ->
Semestre -> Ana
8. Definir a tabela fatos.
39
9. Montar 0 star schema.
A modelagem dimensional e aplicada para visualizarmos as dados
referentes as necessidades do uswirio para obtenc;aoda informac;ao em um sistema
analitico. 0 modelo de dados dimensional independe de qual banco de dados sera
implementado (ROLAP ou MOLAP).
2.8. ESTUDOS DE CASOS REAIS (NECESSIDADES DO NEGOCIO E
MODELAGEM DIMENSIONAL).
Nos estudos de caso que serao apresentados a seguir, demonstrarei
algumas necessidades basicas de analise da informac;ao sobre a area de atuac;ao
do cliente e a modelagem dimensional utilizando a tecnica star schema. Para efeito
de demonstrac;ao da modelagem de dados dimensional, as dimensoes conterao
somente informa90es principais. As mesmas poderao ser detalhadas conforme
necessidade do usuario.
Os estudos de caso que serao apresentados em seguida sao objetos de
exemplificac;ao da utilizac;aoda tecnologia de data warehouse na construc;ao de data
marts voltados a area educacinal para 0 Estado do Parana. Informac;oes detalhadas
serao incorporadas ao modele de dados de acordo com a necessidade de quem
utilizara estas informaQoes.
40
2.8.1. Data Mart Para Informa90es Gerenciais de Matriculas de Alunos e Vagas
Necessidade do usuario: "Precisamos analisar a quantidade de alunos
matriculados e quantidade de vagas preenchidas e disponiveis nas escolas do
Estado para permitir consultas par data de matricula , nucleo da secretaria,
municipio e escola.
Oimensao Tempo~aMatricula
!AnoMatriculaMesMatriculaDiaMatricula
I AnoLetivo
Fates Matriculas AlunosrDataMatricula (FK)I CodigoNucleo (FK)
-_I g~~:~~~:~~~P:~~~K).-- ---
rQtdVagasDisponivellatdVagasPreenchidas LDimensao Nucleo Secreta ria ,
~djgoNucleo
NomeNucleo
Considera90es de pesquisa: As dimensoes sao os criterios desejados de consulta as
informagoes da base de dad os. Ha varias possibilidades de consulta as informagoes
na tabela fatos como, por exemplo:
• Total de vagas preenchidas e disponiveis nurn periodo de matricula
• Quantas escolas ainda tern vagas disponiveis em urn determinado municipio
• Quais sao as escolas que rna is tiveram matriculas efetuadas
• Quais sao as escolas que tern rna is vagas disponiveis
• Total de vagas preenchidas x disponiveis por municipio,nucleo,escola
• Etc (As possibilidades de consulta sao de acordo com as combina90es de uma
ou mais ou todas as dimensoes de acordo com as necessidades do usuario)
Obs: FK - Foreign Key (Chave estrangeira) sao as chaves primarias das tabelas
Dimensao que, combinadas, formam a chave primaria da tabela Fatos Matriculas
alunos.
41
2.8.2. Data Mart Para Informa90es Escolaridade dos Professores
Necessidade do usuario: "Precisamos analisar a quantidade de professores e
sua respectiva escolaridade para podermos analisar a necessidade de realoca9ao
de professores de acordo com seu nivel de instrug80 por escola e municipio no ana
letivo.
DimensaoTempo
O F~sEscoiaridadeProfessores_JAnol.eliw~K)
!CodiQOMuniciPio(FK)CoIgoEscoa(FK)
llmensaoMunic~ CoIigoEscoiaridade(FK) Dimensao Escolaridade Pro!esSOf
Codigo~~ 'IOtdProlessaes --iCodigoEScolaridad~NOOIeMunlcipio 1 \OescricaoEscotaridade
IlocalEsc.aridade
DimensaoEscota
42
2.8.3. Data Mart Para Infonna90es de Alunos no Ano Letivo
Necessidade do usuario: "Precisamos analisar a quantidade de alunos,
turmas, aprov898o, reprov898o, frequencia , caracteristicas da matr!cula no ana
letivo nas escolas do Estado para pennitir consultas das quantidades de alunos, p~r
idade aluno, sexo, turma, turno, nucleo da secretaria, municipio e escol8.
DimensaoMunicipioCodigoMu-;;d~o - I
IN;;;Mu;;'- -
Dimell~Tempo_ FalosEsclXaridadeProfessoresiA;;;Lei;",(fK) --,-'1Coo'igoMunicipio (FK)CodigoEscola(FK)
ICodlgoNucleo (FK)COO'goTumo(fK)
_,CochgoTurma{FK)
I
Cod,go~ade(fK)CodigoSexo(FK)
Dimensiio Nutleo Secretaria OtdTotaiMatnculas -Icoo;-;~;- -=- ~ QldTolalAbandonosNameNucleo -'IQldTotaiSemFrequencla
QldTotalComFrequencla
Dimemao Tumo ~~~::=::s__ • OtdTotalReprOlooos
IO'dAlunOSNOIOSQtdAlullOSAntlgos
i::JDimensaoSexo-0DimensaoTurma
JCodiQOTUrm-;-
rDeSCritaOTurmaSi~aTurma
43
CONCLUSAO
Este trabalho forneeeu-me fundamenta9ao teoriea e embasamento sufieientes
para projetar um modelo de dados dimensional para facilitar a obten9ao de
informa90es gereneiais e estatistieas referentes a Eduea9ao. Aeredito que 0 objetivo
proposto fai amplamente atingido dando condic;6es a urn profissional, mesma nao
atuando na area de informatica, sem nenhum conhecimento em data warehouse, a
S8 familiarizar com as novos termos, planejar e desenvolver urn modelo conceitua]
para um projeto desse nivel. 0 referido trabalho demonstrou a aplieabilidade na area
edueacional e tambem pode ser aplieado para a eonstru9ao de projetos em varias
areas de atua9ao. Considera90es importantes:
• Data warehouse naD e modismo, ternaU-S8 uma necessidade para a
organiz8c;ao.
• Data warehouse naD resolve as problemas da organiz8C;8oS8 naD houver 0 fator
humano para analisar as resultados e tamar as decis6es.
• E fundamental 0 envolvimento do usuario em todo 0 proeesso (usuario que atua
na analise de informa90es para a tomada de deeisao). Sao poueos os usuarios
com este perfil.
• A tecnica mais adequada para a modelagem dimensional e a star schema.
Utilizar a modelagem dimensional.
No cenario atual onde 0$ executivos precisam tamar decis6es rapidas e
cert8iras em resposta aos diversos eventos que ocorrem a todo instante no
mercado, faz-se necessario construir todo um mecanismo de suporte H3pido e
eficiente aos processos decis6rios. 0 data warehouse e uma ferramenta apropriada
para este tipo se situa9ao. Se bem projetado, permite aos gerentes obterem
informa90es rapidas e confiilveis que Ihes servirao de suporte para a solU(iao de
seus problemas e para atingir os objetivos propostos para os negocios.
ANEXOS
SUGESTAo DE UMA TABELA DIMENSAo TEMPO DETALHADA [21].
Data da Transa~iio
Indicador de ultimo dia do mesAnoQuartil (Trimestre)MesSemanaDia da SemanaDia do MesDia do QuartilDia do AnoIndicador de FeriadoSemana do MesSemana do QuartilSemana do AnaIndicador de ultima semana do mesIndicador de ultima semana do quartilMes do QuartilAna FiscalQuartil FiscalMes FiscalSemana FiscalDia da semana fiscalDia do mes fiscalDia do quartil fiscalDia do ana fiscalIndicador de ultimo dia do ana fiscalSemana do mes fiscalSemana do quartil fiscalSemana do ana fiscalIndicador de ultima seman a do mes fiscalIndicador de ultima semana do quartil fiscalIndicador de ultima semana do ana fiscalMes do quartil fiscal
44
45
FIGURAS
Vendemos 1 Milhao de Reais !
Quando?
Oqu~?
Laranja
~.,.,. I~~,~
- ;.;; I~";;':"1. ~ -"
Onde?Tamate
Arroz
Regj;~oRegiaoRegiao
Chocolate
1996 1997 1998 1999
Tempo
[21] Figura 1 - Exemplo de um Cuba Dimensional
TERRITORIOCHAVE DE TERRITORIO
NOME DO TERRITORIO
MESCHAVE DE MES
NOME 00 MESANOTRIMESTRE
[21} Figura 2 - Exemplo de uma Estrutura Star Schema
LlEslocagem
ChaV1l_Produl0 (FK)Chave_Tipo (FK)Chave_Categoria (FI<)Chave_Tempo (FK)
Quanlidade PerdidaQuanlidade-DanificadaPreco de CUSIO
Preco=de=venda
DalaDiaNome DiaMes -Nome Mes"", -Trimestre
[21] Figura 3 - Exemplo de urna Estrutura Snow-Flake
DreameniD des esa~numereereamenlo~mes
Q diadespesat.\5I!queneiadespna
valDrDreamenlodalaoreamenlo
mes(FK)codigotipodedespesa(FK),.r,numelooleamento(FK} "fJlnomefamiliar(FK)
Ivalordadespesalipodespna
r----3 ~olcamenioportipodedespna l~codigolipodedespesa(FK) I~mes(FK)~ numerooreamento(FK) 4
~ tipode despeu
1L-__ -+,}I'~~,~"~d~igD~b~.~'d~'-d~"~.,~,,~1
I I nomedolipo Ivalor ercadovalorrealizadoperedentualorcadopercentualrealizado
(21) Figura 4 - Exernplo de urn Modelo de Dados (MER)
46
47
REFERENCIAS
[1] ASSUN<;:AO,Luis. Data Warehousing. Disponivel na Internet. http://www.luis.assuncao.eti.brlluisdwh.htm#item1. 16/11/2004.
[2] COMPUTERWORLD. Data warehouse: dep6sito de boas oportunidades. Riode Janeiro. n.173, p. 17, julho, 1996.
[3] DBMS - TOOLS & STRATEGIES FOR I.S. PROFESSIONAlS. Um Manifes-to do Dimensional Modeling. Rio de Janieiro. Ed. Mantelmedia, n. 7, p.44-50,7 novembro,1997.
[4] EXECPLAN.Disponivel na internet. http://www.execplan.com.br .16/11/2004
[5] Fast Track to Sybase - Student Guide. 1992, Sybase Inc.
[6] FIGUEIREDO, Adriana Maria C.M.. MOLAP x ROLAP: Embate de Tecnolo-gias para Data warehouse. Developer's Magazine. Rio de Janeiro: AxcelBooks do Brasil Editora Ltda. Fevereiro de 1998, nO18 p.24.
[7] FILHO, Trayahu R.Moreira. On-Line Analytical Processing Server (ServidorOLAP). Developer's Magazine. Rio de Janeiro: Axcel Books do Brasil Edi-tora Ltda. Fevereiro de 1998, n018 p.28-29.
[8] FORMA INFORMATICA LTDA. Tecnicas de Modelagem de Dados. SaoPaulo, 26 maio, 1994.
[9] GUTIERREZ, Marco Antonio. Developer's Magazine. Rio de Janeiro: AxcelBooks do Brasil Editora Ltda. Fevereiro de 1998, n018 p.7.
[10] http://osiris.sunderland.ac.uklsst/case2/welcome.htmlem 20101/2000
[11] INFORMATION WEEK. 0 Poder do Data warehouse. Sao Paulo.Ed.ltmidian.12, p. 12,20 outubro,1999.
[12] INMON, W. H. Building the Data warehouse. New York' Wiley ComputerPublishing, 1996.
[13] INMON, W. H., WELCH, J. D. e GLASSEY,Katherine L. Managing the Datawarehouse. New York: Wiley Computer Publishing, 1997.
[14] INMON, Willian H. e HACKATHORN, R. D. Using the Data warehouse.New York: J. Wiley, 1994.
[15] JAMHOUR, Edgar. Sistemas de Banco de Dados. Curitiba,Agosto de 1999.Disciplina do Curso de Especializa<;aoem Gestao da Tecnologia da Inlor-ma<;aoe Comunica<;aoda Faculdade Cat61icade Administra<;ao e Econo-mia.
[16] JORNAL BATE BYTE - CELEPAR (Companhia de Inlonmatica do Parana).Administra~ao de Metadados. Curitiba, edi<;aonO76 em junho de 1998.
48
[17J JORNAL BATE BYTE - CELEPAR (Companhia de Infonmatica do Parana).Tecnologia OlAP. Curitiba, ediyao n° 87 em junho de 1999.
JUNIOR TRONCHIN, Valsoir. Apresentayao Sybase: Data Warehousing:Aspectos Estrategicos e de Implementa9ao. Curitiba,1997.
KIMBALL, Ralph. Data warehouse Toolkit. 1.ed. Sao Paulo: Makran Books,1998. 388p.
KONDRATIUK, Edgardo Ruben. Data warehouse: Detalhes que Fazem a Di-ferenya. Developer's Magazine. Rio de Janeiro: Axcel Books do BrasilEditora Ltda. Fevereira de 1998, nO18 p.22.
MACHADO, Felipe. Modelagem de Dados Multidimensional. DBA Enge-nharia de Sistemas. Rio de Janeiro, 1999.
MANNI, Luiz Carlos & DORSA, Luiz Fernando A. Data warehouse: Gerenci-ando a Qualidade dos Dados. Developer's Magazine. Rio de Janeiro:Axcel Books do Brasil Editora Ltda. Fevereiro de 1998, nO 18 p.20.
MANZONI JR, Ralphe. A inteligencia e a Alma do Negocio. ComputerWorldBusiness Inteligence, Rio de Janeiro, n. 285, p.2, 8 maryo, 1999.
NIMER, Fernando.Analisando 0 Retorno Sobre 0 Investimento de Data ware-house. Developer's Magazine. Rio de Janeiro: Axcel Books do Brasil E-ditora Ltda. Fevereiro de 1998, nO18 p.16-17.
OLIVEIRA LEITE., Argemiro A. Informa9ao II Prova de Equivocos. Compu-terWorld Business Inteligence, Rio de Janeiro, n. 285, p.7, 8 mar90, 1999.
PALMA, Sergio. Os Componentes Funcionais de um Data warehouse. Deve-loper's Magazine. Rio de Janeiro:Axcel Books do Brasil Editora Ltda. Fe-vereiro de 1998, nO 18 p.18-19.
PORTFOLIO DE T.ECNOLOGIAS CELEPAR (Companhia de Infonmatica doParana). SQl, Indices, Modelo de Dados, Banco de Dados. Curitiba,30de junho de 1998.
Sybase System 10: Introduction to SQl- Student Guide.1993, Sybase Inc.
TAURION, Cezar. Data warehouse: Vale a Pena Gastar Milh6es Investindoem Um? Developer's Magazine. Rio de Janeiro: Axcel Books do BrasilEditora Ltda. Fevereiro de 1998, nO 18 p.10-11.
TAURION, Cezar. Data warehouse Sera Util Para a Sua Organiza<;:ao? De-veloper's Magazine. Rio de Janeiro: Axcel Books do Brasil Editora Ltda.Fevereiro de 1998, nO18 p.26-27.
VASCONCELLOS, Joao Marcos. Apresenta<;:ao Infonmix: Do Data Mart aoData warehouse, 0 Caminho para 0 Acesso as Informa4)toes Gerenci-ais Estrategicas, Curitiba,1997.
WANG, Charles B., Techno Vision II, ed. Makran Books, 1998.
[18J
[19J
[20J
[21J
[22J
[23J
[24J
[25J
[26J
[27J
[28J
[29J
[30J
[31J
[32J