Upload
sungwook-kang
View
549
Download
2
Embed Size (px)
Citation preview
마스터 제목 스타일 편집
다차원 프로세싱
강성욱 E-mail : [email protected]
Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com
마스터 제목 스타일 편집
사 용 자
운영시스템
외부데이터
사용자입력
OLTP DW
DM
OLAP 데이터
운영시스템과 OLAP 시스템
마스터 제목 스타일 편집
초기 로딩
OLTP
주기적 갱신
초기 로딩과 주기적 갱신
시스템이 구축 되고 필요한 데이터가 최초로 로딩
모델 성격에 따라 일별, 주별, 월별 등 주기에 따라 갱신
마스터 제목 스타일 편집 데이터 희박성
마스터 제목 스타일 편집 데이터 희박성
희박성이 최소화된 테이블
스타스키마와 희박성
마스터 제목 스타일 편집 데이터 유형
• 일반 적으로 셀에 입력되는 데이터의 유형은 수치 데이터 이다.
• 텍스트 데이터를 입력할 수 있지만 그 자체가 다차원적으로 분석된다기 보다는 수치 데이터를 보완하기 위한 부연 설명의 형태로 많이 사용
마스터 제목 스타일 편집 계층구조와 데이터 입력
회사 전체
부서1 부서2 부서3
회사 전체
부서1 부서2 부서3
마스터 제목 스타일 편집
입력된 데이터
연산된 데이터
마스터 제목 스타일 편집 연산 순서
여기에 수식을 입력하십시오.
1 2
마스터 제목 스타일 편집 연산 시점
사전 연산 방법 장점 단점
미리 연산 최상의 응답성 제공 로딩된 데이터양에 비해 데이터 양이 심각하게 커질 수 있음.
일부 연산 불필요한 공간 절약. 많은 시스템 자원 소비
• 참조하는 셀이 많다 • 룰이 매우 복잡하다 • 계산하기에 많은 시간이 걸린다 • 사용자가 자주 요청한다 • 다른 연산에서 자주 참조 된다
사전 연산
마스터 제목 스타일 편집 SSAS 사전 연산 영역 선택
관련 링크 : http://sqlmvp.kr/140163993051
마스터 제목 스타일 편집 계층구조와 팽창계수
- 밀집도 = 1(8/8) - 팽창계수 = 1.375(11/8)
- 밀집도 = 1(64/64) - 팽창계수 = 1.89(121/64)
- 차원당 팽창계수 = 1.375( 1.89 )
마스터 제목 스타일 편집 희박성의 증가와 팽창계수
• 계층구조를 구성하는 레벨이 많아지고 차원수가 증가하고 희박성이 커짐에 따라 데이터베이스의 팽창계수는 급속히 커진다.
• 폭발적이 증가를 막기 위해서 일차적으로 큐브의 설계시 큐브를 구성하는차원 수를 최소한으로 유지하고 희박성을 최소화할 필요가 있다.
- 밀집도 = 0.4(20/64) - 팽창계수 = 3.5(70/20)
- 차원당 팽창계수 = 1.5( 3.5
마스터 제목 스타일 편집
스타 스키마 특징 • 하나의 모델에는 하나의 팩트 테이블이 존재 한다.
• 각 차원은 하나의 테이블로 표현되며 이 테이블은 하나의 컬럼을 기
본키로 가진다.
• 각 차원테이블의 기본 키는 팩트 테이블에 대응되는 컬럼을 가진다.
물리적인 측면에서 실제 구축된 스타스키마는 복잡한 경우 수십, 수백 개의 팩트 테이블과 차원테이블을 가질 수 있다.
마스터 제목 스타일 편집 집계(Aggregation)
• 스타스키마에서 집계는 상세수준의 데이터를 특정 애트리뷰트에 따라 미리 요약하는 작업을 말한다.
• 집계데이터를 만드는 가장 큰 이유는 질의에 대한 응답속도를 향상시키기 위함이다.
20
X 100 X 365 X 2
------------ 1,460,000
Q : 작년 매출액과 올해 매출액을 비교하면?
Fact : • 20개의 매장 • 100개의 제품 • 일별 매출액
마스터 제목 스타일 편집
모델
브랜드
(전제품)
제품군
매장
소권역
대권역
(전매장)
모델 브랜드 데이터 크기
1,000,000개 500,000개
1,000,000개 10,000개
집계 영역 결정
마스터 제목 스타일 편집 분할(Partitionning)
분할의 이점 • 데이터를 논리적 단위로 쪼갬으로써 응답하기 위한 레코드 개수 줄이고 응답성 향상.
• 데이터 백업 및 복구, 폐기작업을 용이. • 병렬처리의 효과를 잘 이용할 수 있음. • 데이터 로딩과 같은 배치 작업에 유연성 제공 분할의 단점 • 유지보수 비용 발생 • 요청에 따라 다수의 테이블 검색. (JOIN, UNION 작업 필요) • 메타데이터 추가 요구. • 정형화 되지 않은 다양한 환경 속에 지속적인 조율 필요.
마스터 제목 스타일 편집 수직 / 수평 분할
수직 분할 • 팩트 테이블의 기본키가 중복 • 전체적인 공간은 더 많이 차지
• 특성에 따른 컬럼 또는 자주 사용하지 않는 컬럼을 분할 함으로써 크기를 줄이고 검색비용이 줄어 든다
수평 분할 • 하나 이상의 비즈니스 차원에 따라 행(ROW) 수준에서 팩트 테이블을 분할.
• 분할시 안정적인 애트리뷰트(기간, 원, 분기)로 분할.
마스터 제목 스타일 편집 슬라이싱과 다이싱
마스터 제목 스타일 편집 드릴다운, 업, 어크로스, 쓰루
DW
OLTP
드릴업
드릴다운
드릴쓰루
드릴 어크로스
OLAP
마스터 제목 스타일 편집 소팅과 랭킹
• 소팅과 랭킹을 사용할 경우 주의가 필요하다.
• 대부분의 보고서에는 다수의 차원이 중첩되거나 계층구조의 여러 레벨에 속하는 항목들이 함께 나타나는 경우가 일반적이다.
마스터 제목 스타일 편집 OLAP 조인