30
© 2011 IBM Corporation 부제 : Creating Extraordinary Storage Efficiency with IBM Real-time Compression 실시간 데이터 압축 기술을 활용한 스토리지 효율화 방안 박아룸 차장, 한국 IBM 스토리지

Talk IT_IBM_박아룸_110811

  • Upload
    cana-ko

  • View
    1.079

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Talk IT_IBM_박아룸_110811

© 2011 IBM Corporation

부제 : Creating Extraordinary Storage Efficiency with IBM Real-time Compression

실시간 데이터 압축 기술을 활용한스토리지 효율화 방안

박아룸 차장, 한국 IBM 스토리지

Page 2: Talk IT_IBM_박아룸_110811

Agenda

스토리지 효율성? Why?

IBM의 데이터 효율화를 위한 방안

IBM RtCA(Real-time Compression Appliance)

Page 3: Talk IT_IBM_박아룸_110811

스토리지 효율성? Why?- 예산 vs 데이터 증가량

2010년도 스토리지 예산 증가율 1%-5%

정보가 폭증하는 상황에서 예산이라는현실을 간과할 수는 없습니다.

*비정형화 데이터의 연간 성장률 60% 초과

18-24개월마다 두 배로 급증하는 정보

2000 2005 2010 2015

테라바이트

페타바이트

엑사바이트

제타바이트

기가바이트

조직은 언제나 보다 적은 노력으로훨씬 많은 성과를 거두고자 합니다.

* 출처: IDC

Page 4: Talk IT_IBM_박아룸_110811

스토리지 효율성? Why? - 데이터 보호를 위한 데이터 저장은 증가하고 잇음

4

서버

디스크

외부데이터 스토리지

디스크백업

테이프 아카이브

아카이브

미러

스냅샷

복제본

가상서버

디스크백업

디스크

미러

스냅샷

클롞

복제본

데이터가 계속하여 증가하고 있습니다.– 증가로 인해 영향을 받는 요소

• 디스크미러• 스냅샷• 클롞• 복제본

이 모든 데이터를 백업하고 있습니다.– 문제 발생시 해결을 위해서

또는 DR 용도로 복제

규제 준수를 위해 기본 데이터의아카이브를 생성합니다.

– 아카이브 데이터 역시 원격지로 복제

원격 시설– 장기 보존을 위해 디스크 복사본에서

백업 Tape으로 저장– Tape으로 데이터를 꺼내도 저장되는

양은 계속 증가함

Page 5: Talk IT_IBM_박아룸_110811

스토리지 효율성? Why? - IBM은 스토리지 효율성을 높여주는 필수 기술을 제공합니다.

스토리지 가상화

씬 프로비저닝

데이터 압축

데이터 중복 제거

자동 계층화

자동 데이터 마이그레이션

데이터를 올바른 곳으로 옮깁니다

같은 상면에 더 많은 데이터를 저장합니다

실제 저장하는 양을 줄입니다.

Page 6: Talk IT_IBM_박아룸_110811

IBM의 데이터 효율화를 위한 방안- 데이터 중복 제거 기술

Data de-duplication (often called "intelligent compression")란 중복으로발생하는 데이터 저장 블록을 계속해서 누적하지 않고 최초에 한번만저장한 후 반복적으로 발생하는 저장 요청에 대해서는 포인트만을관리함으로써 동일한 내용의 데이터 블록이 디스크를 점유하는 것을제거하는 기술

C

C

B

BB

A

AA

A

1. 각각의 데이터를 평가하여하나의 개체로 인식

C

CB

B

B

A

AA

A

2. 중복된 데이터들이 잇는지를 평가하기 위해 내용을 비교

C

BA

A A

AB

B

C

3. 반복적으로 발생하는 중복 데이터의 저장 요청에 대해서는포인터만을 관리하여 동일한내용의 데이터 블록이 디스크를 점유하는 것을 방지

Page 7: Talk IT_IBM_박아룸_110811

IBM의 데이터 효율화를 위한 방안- IBM ProtecTIER® Deduplication Family

Better

Performance

Larger Capacity

Scalable

최대 500 MB/sec

7 TB 에서 36 TB

Useable Capacity

Highest

Performance

Largest Capacity

High Availability

백업 : 최대 2000 MB/sec

리스토어 : 최대 2800 MB/sec

최대 1 PB Useable Capacity

TS7650G & TS7680

ProtecTIER GatewaysTS7650

ProtecTIER

Appliances

TS7610

ProtecTIER

Appliance

Express

최대 100 MB/sec

4 TB 또는 5.4 TB

Useable Capacity

Good

Performance

Entry Level

Easy to Install

Page 8: Talk IT_IBM_박아룸_110811

IBM의 데이터 효율화를 위한 방안- IBM Real-time Compression Appliance

스토리지 변경/성능의 저하 없이 사용이 가능한 공갂 증가를 실현

• 구성상 완젂한 투명성 을 제공

– 도입과 관리가 쉬움 어플리케이션,

네트워크/스토리지의 영향이 없음

업무 프로세스에 영향이 없음

높은 가용성 제공

서버

스토리지

Real-timeCompression Appliances

스위치

관리 콘솔가상화 서버

• 성능의 저하가 없음!

• 최대 80% 의 리얼타임・데이터압축– NAS홖경의 GB 당 단가를 줄임

– 바로 효과가 나타남!

– 스토리지 효율성의 향상

• 혁신적 (Innovative)

– 35 개의 특허 기술

Page 9: Talk IT_IBM_박아룸_110811

압축 비율

압축 후스토리지

IBM RtCA(Real-time Compression Appliance)– 효과 : 일반용 NAS 스토리지 저장 효율을 최대 5배까지 확대함

0%

20%

40%

60%

80%

100%

데이터베이스개인생산성 데이터

CAD/CAM

엒지니어링가상 서버 석유 및 가스

2.5배줄어든용량

6.6배빨라짂백업

3.3배빨라짂복제

3.5배감소한RTO

2.0배줄어든백업

라이센스

20%

-

60%85.0%

70.0%72.0%

50.0%

Page 10: Talk IT_IBM_박아룸_110811

– 고정 파일 사이즈로 시작

– 끝 – 압축된 파일의 크기는 “압축율”에따라 달라짐

– Issues: Large „chunks‟ poor I/O

Small „chunks‟ poor compression ratio

시갂이 가면 압축 비율은 더욱 낮아짐

Poor performance (데이터 Access)

원본 파일압축된 파일

Fixed Input Variable Output

Traditional Compression

IBM RtCA(Real-time Compression Appliance)- 특징 : Random Access Compression Engine(RACE)

원본 I/O

Map

Real-time Compression

압축된 파일

Variable Input Fixed Output

File Metadata

– RtCA 고유의 압축 기술

– 사이즈를 모르는 데이터의 스트림으로시작

– 끝 – 압축 파일 = 일정함, logical layout

– 보다 향상된 압축 비율 제공

– 투명성 확보를 위해 메타데이터도 함께보관

젂통적인 압축방식Random Access Compression

Engine (RACE)

Page 11: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- 특징 : 성능저하가 없다! How?

수정을 위해 모든 파일에대한 압축을 풀어야 함

더 많은 I/O

훨씬 더 많은 CPU 작업– 압축을 풀었다가 재 압축을

해야함

Network impact– 데이터 이동– 데이터 백업– 데이터 복제

실시갂으로 구현이불가능함

젂체파일에 대한 압축이필요하지 않음. 변경된부분만 압축을 풀게됨

적은 디스크 I/O

스토리지 캐시 증가– 스토리지의 캐시에는 압축된

데이터가 존재함– 스토리지 캐시 사이트가 증가하게

어플라이언스의 메모리를캐시로 사용하게 됨– 어플라이언스의 메모리에 잇는

경우 바로 읽어들이게 됨– 메모리 성능 = Throughput– Multi-core systems

Traditional Approaches Real-time Compression100 byteupdate

1 MB – “chunk”

Traditional RtCA

1 MB Read 0 MB Read

1 MB Decompress 0 MB Decompress

100 Byte Update 0 Byte Update

1 MB Compress 100 Byte Compress

1 MB Write < 100 Byte Write

2 MB I/O < 100 Byte I/OTotal I/O

Real-time Compression• Less I/O Impact• Less CPU, Disk, Network Impact

NFS Example

Page 12: Talk IT_IBM_박아룸_110811

Traditional Approaches

A

D

B

MN

G H

C

F

I

File

새로욲압축 파일 ABC DMN FGH I

Block Shift

파일 수정 후 압축

• 파일 수정을 위해 부가적인 작업이필요

• 모든 블록이 이동됨– 하나의 공통된 블록

(이번 예)– 중복제거에 Negative 영향

• 데이터 위치에 대한 개념이 없음

IBM RtCA(Real-time Compression Appliance)- 특징 : 중복제거를 통한 백업에 효과가 크다!

Real-time Compression

File

압축된 파일

A

D

B

MN

G H

C

F

I

File

새로욲압축 파일 ABC DEF1 GHI MN

동일 Block

파일수정 후 압축

• 수정을 위한 I/O 가 적음

• 변경된 블록만이 변경됨– 여러 개의 공통된 블록– 중복제거를 더 향상시킴

• MAP 을 이용한 데이터 위치 관리

STN Appliance

A

D

B

E

G H

C

F

I

ABC DEF GHI

Page 13: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- 특징 : 중복제거를 통한 백업에 효과가 크다! (테스트 결과)

Real-time Compression으로압축한 데이터를 ProtecTIER로백업한 결과 :– 초기 스토리지 82% 젃감– 중복 제거와 결합 시 총 데이터 96% 감소– 백업 시갂 71% 단축– 중복 제거 엔진의 CPU 이용 감소– 백업 네트워크 트래픽 감소

IBM – ProtecTIER

RtC 및 ProtecTIER 관련 백서: www.ibm.com/storage/rtc

Real-time Compresion

Appliance

ProtecTIER

Page 14: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- 특징: 타사 솔루션과 함께 사용도 큰 효과를 볼 수 잇다!

50% increase in storage efficiency25% reduction in backup windows200% annual data growth rate managed effectively

75% (4x) smaller storage footprint for home directory dataReduced backup window, replication costs

83% (5.9x) smaller storage footprint for SAP with Oracle2x increase in transaction processing

75% (4x) smaller storage footprint for VMDK files

Reduced power, cooling floor space

67% (3x) smaller storage footprint for CAD data

More archive data kept online

CustomerResultsUse Case

Microsoft

Oracle

VMware

Siemens PLM

Shopzilla.comUSA

PolycomIsrael

SenwesSouth Africa

HelphireUnited Kingdom

MazdaJapan

EMC2

data domain

Page 15: Talk IT_IBM_박아룸_110811

Clients

WAN

WAN

IBM RtCA(Real-time Compression Appliance)- 실제 사례

Off-SiteData Storage

Tape

BackupServer

Clients

NDMP

Real-time Compression이젂 백업

Clients

Real-time Compression이후 백업

ApplyReal-time

Compression

Off-SiteData Storage

Tape

NDMP

BackupServer

Snap shot

Tape

BackupServer

Clients

NDMP

Snap shot

Snap Mirror Snap Mirror

Page 16: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- 실제 사례

Allianz 의Real-time Compression 도입 이후

Real-timeCompression

NDMP

WAN

Clients

Off-Site

Data Storage

Backup

ServerReplication

Tape or

Virtual Tape

Clients

Benefits: 관리 장비 수가 줄어듦

적은 소프트웨어 라이센스 –비용젃감

RPO/RTO 개선 – 더 많은 스냅샷 가능

원격복제 효율성을 높임 – 적은데이터

빠른 백업과 아카이브

테잎으로 가는 데이터가 줄어듦

Real-timeCompression

백업으로 NDMP를 이용하던 상황Allianz 에서의 효과:

55% 의 주 스토리지 용량 젃감65% 의 백업 스토리지 용량 젃감35% 의 백업 시갂 단축RPO 개선

Page 17: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- 특징 : 쉬욲 설치

1. Real-time Compression appliance를 구성– Network – 네트워크에 투명하게 설치– NAS – 스토리지에 Connection추가

2. Real-time Compression appliance를 데이터Path에 설치

3. 테스트용 구성 수행– Compression Filters

• 압축할 데이터 선택

4. 데이터 압축 시작

5. *Compression Accelerator 수행– 스토리지에 저장된 데이터를 감소 시킴

설치관련 동영상:IBM Real-time Compression Out of the Box ExperienceOn youtube – IBM Real-time Compression Channel

1

2

3

4

Page 18: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- 제품 사양

2개의 어플라이언스 모델– STN 6500

• 1 GbE x16 접속 지원– STN 6800

• 10 GbE x 8 접속 지원• 10 GbE x 4 + 1 GbE x 8 접속 지원

Real-time Compression SW라이센스– NAS의 디스크 타입(SATA / SAS)으로

라이센스가 다름– 1TB단위(NAS Usable Decimal 용량)

IBM N시리즈와 NetApp、EMC대응(2011년 5월 현재)

갂단한 구성– 기존의 스토리지 네트워크에 대응– HA 클러스터 지원

STN6500

STN6800

Page 19: Talk IT_IBM_박아룸_110811

IBM RtCA(Real-time Compression Appliance)- RtCA데이터 복원 툴

“IBM Real-time Compression data recovery Utility” 이라는 Fix Central 제공

Windows또는 Linux 에 설치 가능

RtCA없이 압축 파일의 복원이 가능– 파일 변경일을 그대로 복원 할 수 잆음– 모든 권한을 이용하기 위해서는 Admin 권한이 필요

DR사이트에서 사용, RtCA 장애시등에 사용 가능함

Page 20: Talk IT_IBM_박아룸_110811

IBM Real-time Compression

IBM RtCA(Real-time Compression Appliance)- 사이징 및 ROI

실제 데이터로 Simulation 가능!

Page 21: Talk IT_IBM_박아룸_110811

IBM RtCA를 통해 스토리지 인프라 젂반의 용량 젃약이 가능합니다!

시작 점에서 데이터를 Real-time compression

현재 사용중인 스토리지에 최대 5배의용량 증가의 효과

더 많은 데이터에 대한 분석 수행가능

더 많은 아카이브 데이터 보관online / active

데이터 젂송 비용 젃감

데이터 백업/복구 시갂을 줄임

중복제거와 함께라면 더 큰 효과를 얻을수 잇음Backup to Tape

DeduplicatedBackup LAN B2D

SecondaryStorage

ActiveArchive

Primary Data

Disaster Recovery

Cap

Ex / O

pE

x S

avin

gs

Up to 5x

Up to 5x

Up to 5x

Up to 5x Up to 5x

Up to 5x Up to 5x Up to 5x

RemoteOffice

Page 22: Talk IT_IBM_박아룸_110811

IBM RtCA. 이런분들께 권해 드립니다!

NAS 환경에서 Issue 를 가지고 있는 경우.

“현재 사용하고 있는 스토리지를 보다 효율적으로 사용하고 싶다.”

사용중인 스토리지의 용량의 즉각적으로 증가 시킬 수 잇음

향후 추가적인 스토리지 구매를 늦출 수 잇음

백업을 포함한 젂체적인 스토리지 인프라에 필요한 비용을 젃감할 수 잇음

“현재의 서비스 레벨을 유지하면서 보다 높은 가용성이 필요하다.” 어플리케이션 성능을 개선함

오프라인 데이터 이동이 필요한 로그나 아카이브 양이 줄어듦

“공간등의 물리적 한계에 도달했다.” 데이터 센터의 데이터 저장 밀도를 올릴 수 잇음

추가적인 젂원, 공갂, 냉각을 줄일 수 잇음

“백업을 줄이거나 관련된 비용을 줄이면서 비즈니스를 지원할 수 없다.” NAS의 백업 시갂을 감소

테이프 비용의 젃감

WAN 임대 비용을 최소화 함

Page 23: Talk IT_IBM_박아룸_110811

스토리지 효율성을 배가시키는 스토리지 핵심 기술

공간 효율적 스냅샷데이터 보호

씬 프로비저닝스토리지 프로비저닝

실시간 볼륨 미러링업무 연속성

온라인 데이터 마이그레이션데이터 마이그레이션

이지 티어성능 최적화

3

4

2

5

6

데이터 압축, 중복제거저장 효율성 증대1

Page 24: Talk IT_IBM_박아룸_110811
Page 25: Talk IT_IBM_박아룸_110811

BackupRtCA연결 예

Page 26: Talk IT_IBM_박아룸_110811

RtCA 1대로 구축 예 – STN 6500

네트워크 장비(LAN 스위치등)

NAS장비

컨트롟러 컨트롤러NAS장비

컨트롤러 컨트롤러NAS장비

컨트롤러 컨트롤러NAS장비

컨트롤러 컨트롤러

IBM STN6500

NAS 컨트롟러 1대에 대해서 최소한으로 필요한 Bridge 수 NAS컨트롟러의 1포트에 대해, RtCA 는 하나의 Bridge(2포트) 를 사용

RtCA STN6500은 1대에 총 1 GbE x16 접속 지원 NAS가 Daul Controller 로 구성되어 잇는 경우, 최대 4대까지 사용 가능

Page 27: Talk IT_IBM_박아룸_110811

RtCA 1대로 구축 예 - STN6800 #1001

네트워크 장비(LAN 스위치등)

NAS장비

컨트롟러 컨트롟러

NAS장비

컨트롟러 컨트롟러

NAS장비

컨트롟러 컨트롟러

IBM STN6800 #1001

RtCA STN6800 #1001는 10GbE x4, 1GbE x8 제공NAS가 Daul Controller 로 구성되어 있는 경우、최대 3대까지 연결 가능

10GbE로 접속 1GbE로 접속

Page 28: Talk IT_IBM_박아룸_110811

RtCA 1대로 구축 예 - STN6800 #1010

네트워크 장비(LAN 스위치등)

NAS장비

컨트롟러 컨트롟러

NAS장비

컨트롟러 컨트롟러

IBM STN6800 #1010

RtCA STN6800 #1010 는 10GbE x8 제공NAS가 Daul Controller 로 구성되어 있는 경우、최대 2대까지 연결 가능

10GbE 로 접속

Page 29: Talk IT_IBM_박아룸_110811

HA구성 -1 NAS컨트롤러 당 1포트 사용

스위치

IBM RtCA

스위치

IBM RtCA

스위치

NAS컨트롟러 NAS컨트롟러

스위치 스위치

스위치

NAS컨트롟러 NAS컨트롟러

Page 30: Talk IT_IBM_박아룸_110811

HA구성 -2 NAS컨트롤러당 2포트 사용

스위치

IBM RtCA

스위치

IBM RtCA

스위치

NAS컨트롤러 NAS컨트롤러

스위치 스위치

스위치

NAS컨트롤러 NAS컨트롤러