29
OLAP: Modelagem Multidimensional Modelagem Multidimensional Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Modelagem Multidimensional

Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri

Prof. Dr. Ricardo Rodrigues Ciferri

Page 2: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Modelagem Multidimensional •  Análises dos usuários de SSD

–  representam requisições multidimensionais aos dados do DW

•  visualização dos dados segundo diferentes perspectivas

– permitem a identificação de problemas e de tendências

Page 3: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Arquitetura de 3 Camadas co

ncei

tual

lógi

co

físic

o

metáfora do cubo de dados

ROLAP

… … … …

MOLAP 1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

ROLAP MOLAP

estruturas e algoritmos

proprietários

Cube Álgebra

SQL MDX

...

processamento e otimização

de consultas

esquema operações

esquemas estrela e floco de neve estruturas matriciais

índices: árvores índices bitmap

Page 4: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

(Hiper)cubo de Dados Multidimensional (QualidadeAr)

visão multidimensional concentração por poluente por tempo por estação

T4 T3

T2 T1 E1

P3

P2

P1

E2

•  representação gráfica •  semântica subjacente

Page 5: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

(Hiper)cubo de Dados Multidimensional (QualidadeAr)

E2

E1 E2

T4 T3

T2 T1

T4 T3

T2 T1

visão multidimensional concentração por poluente por estação

visão multidimensional

concentração por poluente

por tempo

visão multidimensional concentração por tempo por estação

E1

P3

P2

P1

P3

P2

P1

T4 T3

T2 T1 E1

P3

P2

P1

E2

Page 6: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

T4 T3

T2 T1

(Hiper)cubo de Dados Multidimensional (QualidadeAr)

visão multidimensional concentração por estação visão multidimensional

concentração por tempo

visão multidimensional concentração por poluente

T4 T3

T2 T1 E1

P3

P2

P1

E2

E2 E1

P3

P2

P1

Page 7: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

(Hiper)cubo de Dados Multidimensional (QualidadeAr)

visão multidimensional concentração

T4 T3

T2 T1 E1

P3

P2

P1

E2

Page 8: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

(Hiper)cubo de Dados Multidimensional (QualidadeAr)

T4 T3

T2 T1 E1

P3

P2

P1

E2 T4 T3

T2 T1

P3

P2

P1

E1 E2

T4 T3

T2 T1

E2 E1

P3

P2

P1

E2 E1

P3

P2

P1

T4 T3

T2 T1

Page 9: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Modelo de Dados Multidimensional

aspectos estáticos

modelagem dos dados

dimensões (atributos) medidas numéricas

aspectos dinâmicos

operações analíticas

drill-down/roll-up slice and dice

pivot drill-across ...

Page 10: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Dimensão •  Representa uma perspectiva de análise

dos usuários de SSD •  Composta por atributos •  Exemplo: dimensão tempo

– atributos: dia, mês, trimestre, semestre, ano – semântica: dia 15/09/2015, do mês de

setembro, do terceiro trimestre, do segundo semestre, de 2015.

Page 11: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Dimensão •  Exemplo: dimensão poluente

– atributos: poluente, categoria, tipo, grupo – semântica: poluente CO, da categoria gás – semântica: poluente CO, do tipo químico, do

grupo ar •  Exemplo: dimensão estação

– atributos: estação, cidade, estado, região, país – semântica: estação E1, da cidade de São

Carlos, do estado de São Paulo, da região Sudeste, do país Brasil

Page 12: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Hierarquia de Atributos •  Definição

– permite que atributos de uma dimensão relacionem-se com outros atributos da mesma dimensão

– especifica níveis de agregação e, portanto, granularidade dos itens de dados

– especifica as dependências existentes entre as granularidades dos atributos

Page 13: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Ordenação Parcial ( ≺ ) •  Significado

– um atributo de maior nível de granularidade de uma hierarquia de atributos pode ser determinado usando um atributo de menor nível de granularidade dessa hierarquia

•  Exemplo: dimensão tempo –  (semestre) ≺ (trimestre)

menor nível de granularidade

maior nível de granularidade

semestres podem ser calculados por meio dos trimestres

Page 14: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Exemplos •  Dimensão tempo

– atributos: dia, mês, trimestre, semestre, ano –  (ano) ≺ (semestre) ≺ (trimestre) ≺ (mês) ≺

(dia) •  Dimensão poluente

– atributos: poluente, categoria, tipo, grupo –  (categoria) ≺ (poluente) –  (grupo) ≺ (tipo) ≺ (poluente) podem ser definidas

uma ou mais hierarquias de atributos

por dimensão

Page 15: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Exemplos •  Dimensão estação

– atributos: estação, cidade, estado, região, país

–  (país) ≺ (região) ≺ (estado) ≺ (cidade) ≺ (estação)

Page 16: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Definição Formal •  Lattice (Reticulado de Cuboides)

<L, ≺>, onde – L: conjunto de visões (ou agregações) – ≺: relação de dependência

•  Propriedades de L – contém pelo menos a visão do nível inferior – pode conter uma visão completamente

agregada (all/none), a qual pode ser calculada a partir de qualquer outra visão

Harinarayan, V. Rajaraman, A., Ullman, J. D. Implementing Data Cubes Efficiently. In Proceedings of the ACM SIGMOD International Conference of Management of Data, p. 205-216,1996.

Page 17: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Definição Formal •  Para três visões v, w, u, podem ser

definidas as seguintes funções:

sendo que

Page 18: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

níveis de agregação superior

inferior

all

ano

semestre

trimestre

mês

dia

Exemplo •  Dimensão tempo

(all) ≺ (ano) ≺ (semestre) ≺ (trimestre) ≺ (mês) ≺ (dia)

CIFERRI, C., CIFERRI, R., GÓMEZ, L., SCHNEIDER, M., VAISMAN, A., ZIMÁNYI, E. Cube algebra: A generic user-centric model

and query language for OLAP cubes. Journal of Data Warehousing and Mining,

v. 9, n. 2, p. 39-65, 2013.

Page 19: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

all

grupo

categoria tipo

poluente

Exemplo •  Dimensão poluente

(all) ≺ (categoria) ≺ (poluente) (all) ≺ (grupo) ≺ (tipo) ≺ (poluente)

níveis de agregação superior

inferior

Page 20: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

níveis de agregação superior

inferior

all

país

região

estado

cidade

estação

Exemplo •  Dimensão estação

(all) ≺ (país) ≺ (região) ≺ (estado) ≺ (cidade) ≺ (estação)

Page 21: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Medida Numérica •  Objeto de análise relevante ao negócio •  Definida como uma função de suas

dimensões correspondentes

Classificação Definição Função de Agregação

aditiva somada através de todas as suas dimensões

SOMA (todas as dimensões)

semi-aditivas somadas somente através de algumas de suas dimensões

SOMA (apenas algumas dimensões)

não aditivas não podem ser somadas AVG, MAX, MIN ou outra função complexa

Page 22: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Operações Analíticas Operação Definição

drill-down analisa os dados em níveis de agregação progressivamente mais detalhados, ou de menor granularidade

roll-up analisa os dados em níveis de agregação progressivamente menos detalhados, ou de maior granularidade

slice and dice

restringe os dados sendo analisados a um subconjunto destes dados

slice: corte para um valor fixo dice: seleção de faixas de valores

pivot reorienta a visão multidimensional dos dados, oferecendo diferentes perspectivas dos mesmos dados

drill-across compara medidas numéricas distintas que são relacionadas entre si através de pelo menos uma dimensão em comum

Page 23: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Station

(Sta

tion)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

(Hiper)cubo de Dados Multidimensional (QualidadeAr) visão multidimensional concentração por poluente por trimestre por estação

Page 24: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Roll-up visão multidimensional concentração

por poluente por semestre por estação

função agregação: SOMA

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

visão multidimensional concentração por poluente por trimestre por estação

Page 25: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Drill-down

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)função agregação: SOMA

visão multidimensional concentração por poluente por mês por estação

visão multidimensional concentração por poluente por trimestre por estação

Page 26: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

21

28

11

14

Q4

S4

S3

S1

Pollut

ion

(Poll

utan

t)

Time (Quarter)

P1

25

Q3Q2Q1

S2

P3P4

P2

27 26

13

323533

12 14

2324 18

10 14 12 20

35 30 32 3118 11 35 47

282033

194718

172110

Stat

ion

(Sta

tion)

Pivot

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

visão multidimensional concentração por semestre por estação por poluente

visão multidimensional concentração por poluente por trimestre por estação

Page 27: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Slice

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)função agregação: SOMA

visão multidimensional concentração por poluente por trimestre, para S1

visão multidimensional concentração por poluente por trimestre por estação

Page 28: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Dice

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

visão multidimensional concentração por poluente por trimestre por estação,

para S1 ou S2 e Q1 ou Q2

visão multidimensional concentração por poluente por trimestre por estação

Page 29: Modelagem Multidimensiona l - USPwiki.icmc.usp.br/images/7/74/SCC0245022015... · 2018-09-25 · esquemas estrela e floco de neve estruturas matriciais índices ... Quarter Year Station

OLAP: Modelagem Multidimensional

Drill-across

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

visão multidimensional concentração, qualidade

por poluente por trimestre por estação

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

visão multidimensional

concentração por poluente por

trimestre por estação

21

12

11

35

Q4

S1S2

S4

Pollution (Pollutant)

Tim

e (Q

uart

er)

P1

47

Q3

Q2

Q1

S3

P3

P4P2

10 18

30

3226

14

2014 31

12 20 24 33

24 18 28 1433 25 23 25

122017

103318

142318

Statio

n(S

tatio

n)

measure values

dimensions

35

27

Time

Day

Month

Semester

Pollution

Pollutant

Category Type

Group

Quarter

Year

Station

Station

All AllAll

dateseason

name

nameloadLimit

name name

name

month

quarter

semester

year

(b)(a)

visão multidimensional

qualidade por poluente por

trimestre por estação

21,21

14,14

35,35

31,31

12,12 25,25

28,28

33,33