14
2007.06 데데데데데데데데

2007.06

  • Upload
    romeo

  • View
    48

  • Download
    0

Embed Size (px)

DESCRIPTION

데이터웨어하우스. 2007.06. PowerPoint Template_Sub. Click here to add header Click to add text to your presentation Click to add text to your presentation Click to add text to your presentation. 제 3 장 데이터웨어하우스. 기업의 내부 및 외부의 데이터 (internal data) 를 주제별로 통합하여 (subject-oriented), - PowerPoint PPT Presentation

Citation preview

Page 1: 2007.06

2007.06

데이터웨어하우스

Page 2: 2007.06

2

Click here to add header

– Click to add text to your

presentation

– Click to add text to your

presentation

– Click to add text to your

presentation

PowerPoint Template_Sub

Page 3: 2007.06

3

제 3 장 데이터웨어하우스

Page 4: 2007.06

4

개념개념

기업의 내부 및 외부의 데이터 (internal data) 를 주제별로 통합하여 (subject-oriented), 여러 측면에서 (multi-dimensional) 분석을

가능케 하는 통합 시스템통합 시스템 이다 .

“Central Repository of Enterprise Data”

Page 5: 2007.06

5

전산분야의 현 주소전산분야의 현 주소

1. ( 문제의식 )정보시스템 As a Cost Center Profit Cener

2. ( 해결방안 )데이터웨어하우스는정보시스템이 조직 경쟁력 강화를 위한 도구 로 진화하도록 현업에서 필요한 정보를 쉽게 이용하도록 도와 주는 시스템

출현배경 HardwareHardware 의 발전과 가격하락 의 발전과 가격하락 (CPU, Memory, Parallel Processing, …)(CPU, Memory, Parallel Processing, …) DB DB 기술의 발전 기술의 발전 (( 대용량대용량 , Cluster File System, …), Cluster File System, …) DW DW 도구의 발전도구의 발전 : ETL (Extraction/Translation/Loading), : ETL (Extraction/Translation/Loading),

Multi-dimensional Cube model, OLAP Multi-dimensional Cube model, OLAP 분석도구분석도구

Page 6: 2007.06

6

OLTP(DB)OLTP(DB) 와 와 OLAP(DW, DSS)OLAP(DW, DSS) 의 의 비교비교

OLTP OLAP

목적 Transactioin procesing

Desision support를 위한 분석

사용자수 1000 이상 100 정도

Disk access mode many short I/O a few long I/O

Response time fast response

(5초이하)

fare response

(30초이내)

Data의 양 보통 100G 이하 보통 100G 이상

Data의 건수 보통 몇 백만 row 몇 천만 row 이상

History 보관 길어야 3달 보통 5년

Page 7: 2007.06

7

데이터웨어하우스의 특징데이터웨어하우스의 특징

1. 주제지향성 ( 개체중심 ) <=> 업무처리 중심2. 통합성 <=> 일관성 없이 데이터 중복 관리 3. 시계열성 ( 일 , 월 , 분기 , 년 등 ) ; 즉 , 월 / 년 등

기간과 관련을 가짐 .4. 비 휘발성 ( 일기 전용 ) <=> 갱신작업 5. 독립성 ; 기업의 운영시스템과는 분리되어 있다 ..6. 주제 중심적 ; 기존 DB 와 근본적으로 구분 . 7. Read-only; OLTP 와 달리 삭제 , 변경 등이 일어 나지

않음 .

Page 8: 2007.06

8

데이터의 수집 / 처리 ~ 활용에 이르는 일련의 프로세스 데이터의 추출 , 변환 , 정제 , 통합 단계 정보도출 단계 정보활용 단계 데이터의 추가 , 갱신 , 삭제

데이터 웨어하우징데이터 웨어하우징

Page 9: 2007.06

9

1. 데 이 터 마 트 는 비 교 적 작 은 규 모 의 데 이 터 웨 어 하 우 스 이 다 . 따 라 서 데 이 터 마 트 는 데 이 터 웨어하우스의 일부분이다 .

2. 특정 사용자가 관심을 갖는 데이터를 대상으로 한다 . 따라서 구분기준 : 사용자의 기능 또는 제공범위

데이터저장범위에 따른 구분 예 : (1) DW (Data Warehouse) : 전사적 데이터베이스 (2) 데이터 마트 : 인사 (HR) 데이터베이스

데이터 웨어하우스와 데이터마트데이터 웨어하우스와 데이터마트

Page 10: 2007.06

10

1. 실시간 기업 (RTE: Real-time Enterprise)1. 실시간 분석2. 실시간 레포팅

2. 복잡한 분석1. 다차원 분석

3. 경영 의사 결정 (EIS, SIS, …)4. 부문별 EUC

1. 영업관리팀 : Sophisticated Custom Applications 2. 생산관리팀 : Data Mining3. 고객관리팀 : Multi-Dimensional Analysis

활용

Page 11: 2007.06

11

구축 비용구축 비용

세부 실행방법에 따라 큰 차이가 있음 .

평균기간 : 6 개월 ~1 년비용 : 10 억원 내외

Page 12: 2007.06

12

기본 구성도기본 구성도

기간계 업무

정보계 업무

Page 13: 2007.06

13

구성요소구성요소

Source Data 파일 DB

DW 플랫폼 DBMS Storage 서버

클라이언트 OLAP 도구 Web 브라우저

관리 도구 Meta Data SMS

Page 14: 2007.06

14

오픈소스 데이터웨어하우스

Pentaho provides a full spectrum of open source Business Intelligence (BI) capabilities including reporting, analysis, dashboards, data mining, data integration, and a BI platform.

www.pentaho.org