22
마스터 제목 스타일 편집 다차원 프로세싱 강성욱 E-mail : [email protected] Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com

[SSAS] 다차원 프로세싱

Embed Size (px)

Citation preview

Page 1: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집

다차원 프로세싱

강성욱 E-mail : [email protected]

Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com

Page 2: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집

사 용 자

운영시스템

외부데이터

사용자입력

OLTP DW

DM

OLAP 데이터

운영시스템과 OLAP 시스템

Page 3: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집

초기 로딩

OLTP

주기적 갱신

초기 로딩과 주기적 갱신

시스템이 구축 되고 필요한 데이터가 최초로 로딩

모델 성격에 따라 일별, 주별, 월별 등 주기에 따라 갱신

Page 4: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 데이터 희박성

Page 5: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 데이터 희박성

희박성이 최소화된 테이블

스타스키마와 희박성

Page 6: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 데이터 유형

• 일반 적으로 셀에 입력되는 데이터의 유형은 수치 데이터 이다.

• 텍스트 데이터를 입력할 수 있지만 그 자체가 다차원적으로 분석된다기 보다는 수치 데이터를 보완하기 위한 부연 설명의 형태로 많이 사용

Page 7: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 계층구조와 데이터 입력

회사 전체

부서1 부서2 부서3

회사 전체

부서1 부서2 부서3

Page 8: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집

입력된 데이터

연산된 데이터

Page 9: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 연산 순서

여기에 수식을 입력하십시오.

1 2

Page 10: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 연산 시점

사전 연산 방법 장점 단점

미리 연산 최상의 응답성 제공 로딩된 데이터양에 비해 데이터 양이 심각하게 커질 수 있음.

일부 연산 불필요한 공간 절약. 많은 시스템 자원 소비

• 참조하는 셀이 많다 • 룰이 매우 복잡하다 • 계산하기에 많은 시간이 걸린다 • 사용자가 자주 요청한다 • 다른 연산에서 자주 참조 된다

사전 연산

Page 11: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 SSAS 사전 연산 영역 선택

관련 링크 : http://sqlmvp.kr/140163993051

Page 12: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 계층구조와 팽창계수

- 밀집도 = 1(8/8) - 팽창계수 = 1.375(11/8)

- 밀집도 = 1(64/64) - 팽창계수 = 1.89(121/64)

- 차원당 팽창계수 = 1.375( 1.89 )

Page 13: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 희박성의 증가와 팽창계수

• 계층구조를 구성하는 레벨이 많아지고 차원수가 증가하고 희박성이 커짐에 따라 데이터베이스의 팽창계수는 급속히 커진다.

• 폭발적이 증가를 막기 위해서 일차적으로 큐브의 설계시 큐브를 구성하는차원 수를 최소한으로 유지하고 희박성을 최소화할 필요가 있다.

- 밀집도 = 0.4(20/64) - 팽창계수 = 3.5(70/20)

- 차원당 팽창계수 = 1.5( 3.5

Page 14: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집

스타 스키마 특징 • 하나의 모델에는 하나의 팩트 테이블이 존재 한다.

• 각 차원은 하나의 테이블로 표현되며 이 테이블은 하나의 컬럼을 기

본키로 가진다.

• 각 차원테이블의 기본 키는 팩트 테이블에 대응되는 컬럼을 가진다.

물리적인 측면에서 실제 구축된 스타스키마는 복잡한 경우 수십, 수백 개의 팩트 테이블과 차원테이블을 가질 수 있다.

Page 15: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 집계(Aggregation)

• 스타스키마에서 집계는 상세수준의 데이터를 특정 애트리뷰트에 따라 미리 요약하는 작업을 말한다.

• 집계데이터를 만드는 가장 큰 이유는 질의에 대한 응답속도를 향상시키기 위함이다.

20

X 100 X 365 X 2

------------ 1,460,000

Q : 작년 매출액과 올해 매출액을 비교하면?

Fact : • 20개의 매장 • 100개의 제품 • 일별 매출액

Page 16: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집

모델

브랜드

(전제품)

제품군

매장

소권역

대권역

(전매장)

모델 브랜드 데이터 크기

1,000,000개 500,000개

1,000,000개 10,000개

집계 영역 결정

Page 17: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 분할(Partitionning)

분할의 이점 • 데이터를 논리적 단위로 쪼갬으로써 응답하기 위한 레코드 개수 줄이고 응답성 향상.

• 데이터 백업 및 복구, 폐기작업을 용이. • 병렬처리의 효과를 잘 이용할 수 있음. • 데이터 로딩과 같은 배치 작업에 유연성 제공 분할의 단점 • 유지보수 비용 발생 • 요청에 따라 다수의 테이블 검색. (JOIN, UNION 작업 필요) • 메타데이터 추가 요구. • 정형화 되지 않은 다양한 환경 속에 지속적인 조율 필요.

Page 18: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 수직 / 수평 분할

수직 분할 • 팩트 테이블의 기본키가 중복 • 전체적인 공간은 더 많이 차지

• 특성에 따른 컬럼 또는 자주 사용하지 않는 컬럼을 분할 함으로써 크기를 줄이고 검색비용이 줄어 든다

수평 분할 • 하나 이상의 비즈니스 차원에 따라 행(ROW) 수준에서 팩트 테이블을 분할.

• 분할시 안정적인 애트리뷰트(기간, 원, 분기)로 분할.

Page 19: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 슬라이싱과 다이싱

Page 20: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 드릴다운, 업, 어크로스, 쓰루

DW

OLTP

드릴업

드릴다운

드릴쓰루

드릴 어크로스

OLAP

Page 21: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 소팅과 랭킹

• 소팅과 랭킹을 사용할 경우 주의가 필요하다.

• 대부분의 보고서에는 다수의 차원이 중첩되거나 계층구조의 여러 레벨에 속하는 항목들이 함께 나타나는 경우가 일반적이다.

Page 22: [SSAS] 다차원 프로세싱

마스터 제목 스타일 편집 OLAP 조인