Upload
romeo
View
48
Download
0
Embed Size (px)
DESCRIPTION
데이터웨어하우스. 2007.06. PowerPoint Template_Sub. Click here to add header Click to add text to your presentation Click to add text to your presentation Click to add text to your presentation. 제 3 장 데이터웨어하우스. 기업의 내부 및 외부의 데이터 (internal data) 를 주제별로 통합하여 (subject-oriented), - PowerPoint PPT Presentation
Citation preview
2007.06
데이터웨어하우스
2
Click here to add header
– Click to add text to your
presentation
– Click to add text to your
presentation
– Click to add text to your
presentation
PowerPoint Template_Sub
3
제 3 장 데이터웨어하우스
4
개념개념
기업의 내부 및 외부의 데이터 (internal data) 를 주제별로 통합하여 (subject-oriented), 여러 측면에서 (multi-dimensional) 분석을
가능케 하는 통합 시스템통합 시스템 이다 .
“Central Repository of Enterprise Data”
5
전산분야의 현 주소전산분야의 현 주소
1. ( 문제의식 )정보시스템 As a Cost Center Profit Cener
2. ( 해결방안 )데이터웨어하우스는정보시스템이 조직 경쟁력 강화를 위한 도구 로 진화하도록 현업에서 필요한 정보를 쉽게 이용하도록 도와 주는 시스템
출현배경 HardwareHardware 의 발전과 가격하락 의 발전과 가격하락 (CPU, Memory, Parallel Processing, …)(CPU, Memory, Parallel Processing, …) DB DB 기술의 발전 기술의 발전 (( 대용량대용량 , Cluster File System, …), Cluster File System, …) DW DW 도구의 발전도구의 발전 : ETL (Extraction/Translation/Loading), : ETL (Extraction/Translation/Loading),
Multi-dimensional Cube model, OLAP Multi-dimensional Cube model, OLAP 분석도구분석도구
6
OLTP(DB)OLTP(DB) 와 와 OLAP(DW, DSS)OLAP(DW, DSS) 의 의 비교비교
OLTP OLAP
목적 Transactioin procesing
Desision support를 위한 분석
사용자수 1000 이상 100 정도
Disk access mode many short I/O a few long I/O
Response time fast response
(5초이하)
fare response
(30초이내)
Data의 양 보통 100G 이하 보통 100G 이상
Data의 건수 보통 몇 백만 row 몇 천만 row 이상
History 보관 길어야 3달 보통 5년
7
데이터웨어하우스의 특징데이터웨어하우스의 특징
1. 주제지향성 ( 개체중심 ) <=> 업무처리 중심2. 통합성 <=> 일관성 없이 데이터 중복 관리 3. 시계열성 ( 일 , 월 , 분기 , 년 등 ) ; 즉 , 월 / 년 등
기간과 관련을 가짐 .4. 비 휘발성 ( 일기 전용 ) <=> 갱신작업 5. 독립성 ; 기업의 운영시스템과는 분리되어 있다 ..6. 주제 중심적 ; 기존 DB 와 근본적으로 구분 . 7. Read-only; OLTP 와 달리 삭제 , 변경 등이 일어 나지
않음 .
8
데이터의 수집 / 처리 ~ 활용에 이르는 일련의 프로세스 데이터의 추출 , 변환 , 정제 , 통합 단계 정보도출 단계 정보활용 단계 데이터의 추가 , 갱신 , 삭제
데이터 웨어하우징데이터 웨어하우징
9
1. 데 이 터 마 트 는 비 교 적 작 은 규 모 의 데 이 터 웨 어 하 우 스 이 다 . 따 라 서 데 이 터 마 트 는 데 이 터 웨어하우스의 일부분이다 .
2. 특정 사용자가 관심을 갖는 데이터를 대상으로 한다 . 따라서 구분기준 : 사용자의 기능 또는 제공범위
데이터저장범위에 따른 구분 예 : (1) DW (Data Warehouse) : 전사적 데이터베이스 (2) 데이터 마트 : 인사 (HR) 데이터베이스
데이터 웨어하우스와 데이터마트데이터 웨어하우스와 데이터마트
10
1. 실시간 기업 (RTE: Real-time Enterprise)1. 실시간 분석2. 실시간 레포팅
2. 복잡한 분석1. 다차원 분석
3. 경영 의사 결정 (EIS, SIS, …)4. 부문별 EUC
1. 영업관리팀 : Sophisticated Custom Applications 2. 생산관리팀 : Data Mining3. 고객관리팀 : Multi-Dimensional Analysis
활용
11
구축 비용구축 비용
세부 실행방법에 따라 큰 차이가 있음 .
평균기간 : 6 개월 ~1 년비용 : 10 억원 내외
12
기본 구성도기본 구성도
기간계 업무
정보계 업무
13
구성요소구성요소
Source Data 파일 DB
DW 플랫폼 DBMS Storage 서버
클라이언트 OLAP 도구 Web 브라우저
관리 도구 Meta Data SMS
14
오픈소스 데이터웨어하우스
Pentaho provides a full spectrum of open source Business Intelligence (BI) capabilities including reporting, analysis, dashboards, data mining, data integration, and a BI platform.
www.pentaho.org