3
플래시 메모리 완전정복 이보다 더 좋을 순 없다 ! 플래시 메모리 완전정복 www.ibmitinsight.com 01 BIG DATA

01 이보다 더 좋을 순 없다! 플래시 메모리 완전정복 · dasd를 사용할 경우 트랜잭션 속도가 정상화되는 데 약 44초 걸렸지만, 플래시를 사용했더니

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

플래시 메모리

완전정복

이보다 더 좋을 순 없다!플래시 메모리 완전정복

www.ibmitinsight.com01 BIG DATA

www.ibmitinsight.com02 BIG DATA

플래시는 더 우수한 IOPS(I/O Operations Per

Second)로 액세스 대기 시간을 단축한다. System z

서버에서는 이러한 특성을 활용하여 프로비저닝 시

간을 단축하며 워크로드의 변화를 수용하고 덤프를

완수하면서 시스템 가용성을 높인다. 페이징 가능한

1MB 페이지 지원에 플래시를 활용함으로써 또 다른

효과도 거둘 수 있다.

이점 금융, 은행, 의료 등 여러 업종의 기업들은 점점 더 우

수한 가용성을 제공해야 하는 부담을 안고 있다. System

z 서버는 Flash Express on System z를 활용하여 애플

리케이션에 투명한 방식으로 시스템 가용성과 탄력성을

높인다. 따라서 다음과 같은 이점을 누릴 수 있다.

시간 절약, 트랜잭션 증가

성능 분석에 따르면, 플래시를 사용할 때 페이징 집약

적인 작업에서 트랜잭션 속도를 높일 수 있다. 일과 시

작 시간대에 배치 워크로드를 OLTP 워크로드로 전환

하는 시나리오를 다음과 같이 시뮬레이션했다.

1 IBM CICS와 IBM DB2를 사용하여 IBM Web-

Sphere Application Server의 인스턴스 3개를

실행했다.

2 WebSphere Application Server 인스턴스를

중지하고 OLTP 데이터를 보조 스토리지로 푸

시하는 대형 배치 워크로드를 실행했다.

3 배치 작업을 중지하고 OLTP 작업을 재시작했

다. OLTP 작업이 약 14GB를 페이징하는 데

필요한 정상 속도에 도달하기까지 걸린 시간을 측정

했다.

DASD를 사용할 경우 트랜잭션 속도가 정상화되는

데 약 44초 걸렸지만, 플래시를 사용했더니 약 10초

만에 정상 속도에 도달했다(그림1 참조).

플래시를 사용했을 때 워크로드 전환 후 최초 45초

만에 처리된 트랜잭션 수가 37% 증가했고 평균 트랜

잭션 응답 시간은 90% 감소했다.

플래시를 사용한 시스템 진단 덤프

시스템 진단 SVC(Supervisor Call) 덤프 실험도 다음

과 같이 실시했다.

1 4개의 WebSphere Application Server 인스턴스

를 시작했다가 그 중 하나를 중지했다. 그 데이터

가 보조 스토리지에 페이징 아웃되었다.

2 중지했던 WebSphere Application Server 인스

턴스를 포함하여 SVC 덤프를 시작했다. 데이터

의 페이징 인이 이루어졌다.

Flash Express를 사용했더니 덤프 자체가 더 빨리

캡처되었고 4배 빠른 속도로 트랜잭션이 정상화되었

다(표1 참조).

플래시 스토리지가 IBM System z 서버에 통합됨에 따라 외장형 디스크보다 우수한 성능

의 추가 보조 스토리지를 사용할 수 있게 되었다. 새로운 기능인 Flash Express가 PCI

Express(PCIe) 어댑터와 함께 구현되었으며, I/O 확장 드로어의 RAID 10 어레이 쌍에 SSD

가 구성되었다. 플래시의 초기 활용 형태는 z/OS의 실제 메모리를 확장하는 것으로, 메모리 계층 구

조 내에 이를 포함시켜 페이징 집약적인 작업에서 시스템 가용성과 탄력성을 높인다.

그림1: 일과 시작시의 트랜잭션 전환 결과

※ 일과 시작시 트랜잭션 전환 단계에서 Flash Express를 사용하는 워크로드는 1/4의 시간에 최고 처리 속도에 도달했다.

트랜

잭션

속도

이 시간대에

작업이 지연될 수

있다.

DASD로 페이징할

경우 워크로드가

안정화되는 데

약 44초 소요

플래시로 페이징할

경우 워크로드가

안정화되는 데

불과 10초 소요

10초 34초

트랜잭션/초 DASD

트랜잭션/초 플래시

10

9

8

7

6

5

4

3

2

1

0

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89

SVC 덤프

메트릭DASD 플래시

SVC 덤프

크기18GB 18GB

보조 스토리지로

부터 캡처한

페이지의 비율

50% 53%

덤프 경과 시간 189초 143초

최대 주소

공간 디스패치

불가

58.89초 13.74초

시스템

디스패치 불가1.34초 0.55초

시스템 안정화 60초 14초

표 1: SVC 덤프 성능 결과

www.ibmitinsight.com03 BIG DATA

주소 공간과 시스템 디스패치 불가 시간 메트릭도

향상되었다. 덤프된 시스템과 주소 공간은 SVC 덤

프 캡처 처리 상황에서는 디스패치 불가 상태가 된

다. 이 시나리오에서는 WebSphere Application

Server 주소 공간이 디스패치 불가 상태인 시간이

단축되었는데, 이는 더 빨리 시스템이 정상 가동되

었음을 의미한다.

Flash Express 구현 Flash Express 서브시스템의 주요 구성 요소 3가

지는 시스템 지원 요소(System Support Element,

SE), 주 컴퓨팅 컴플렉스(Main Compute Complex,

CEC), 플래시 어댑터이다. 플래시 관리의 상당 부분

이 SE의 새로운 패널을 사용하여 이루어진다.

플래시 증분 할당(Flash Increment Allocation) 패

널을 통해 플래시 메모리 증분을 파티션에 배정할 수

있다. 플래시 상태 패널은 플래시 어댑터, 어레이, 인

터카드 케이블의 현재 상태를 표시하는 데 쓰인다.

SE 역시 플래시 장치의 잠금 해제에 사용되는 인증

키를 저장하고 서비스한다.

플래시 기능은 z/OS와 SAP(System Assist

Processor)에서 실행되는 I/O 펌웨어로 나뉜다. z/

OS 서버는 새로운 EADMF(Extended Asynchro-

nous Data Mover) 아키텍처를 사용하여 시스템

에서 할당한 서브 채널을 통해 플래시 메모리 또는

SCM(Storage Class Memory)에 액세스한다. I/O

펌웨어는 EADMF 서브 채널을 처리하면서 SCM 요

청을 플래시 어댑터용 장치 요청으로 변환한다. 또한

I/O 펌웨어는 증분 할당, 복구와 복원 작업, 펌웨어

업데이트, 상태 추적도 관리한다.

SCM 어댑터 쌍은 2중 미러링 케이블로 연결된

다. 주 구성 요소로는 IBM에서 설계한 맞춤형 RAID

컨트롤러 칩과 4개의 플래시 SSD가 있다. 각 SSD

는 약 350GB의 데이터를 수용하고 보호하는데, 이

를 위해 각 쌍의 SSD 전체에서 RAID 10을 사용한

다. 하나의 쌍이 약 1.4TB의 어드레싱 가능 SCM을

수용하며, 하나의 시스템에 최대 4개의 어댑터 쌍을

설치할 수 있다.

특수 모드에서 가상화 관리

플래시는 16GB 증분 단위로 관리된다. 증분 하나

는 하나의 파티션에서 사용하도록 할당할 수 있으

며 어댑터 쌍 하나가 최대 60개 파티션을 서비스할

수 있다. 어댑터 소싱 PCIe 주소와 파티션 기반 시스

템 주소 간 변환은 I/O 허브 칩에서 담당하는데, 이는

FMP(Firmware Managed Partitioning) 모드라고

부르는 특수 모드에서 작동한다.

가상화 환경에서는 EADM 서브 채널로부터의 요

청을 처리할 때 I/O 펌웨어가 어댑터를 프로그래

밍하여 파티션 메모리에 액세스하게 한다. 이를 위

해 PCIe 주소의 상위 비트에 파티션 번호를 넣는다.

FMP 모드의 I/O 허브에서 업바운드(어댑터 소싱)

PCIe 주소를 처리할 때 PCIe 주소의 상위 비트가 허

브 상주 영역(Zone) 재배치 테이블에 대한 색인으로

쓰이며 파티션-절대 주소가 생성된다.

리던던시로 탄력성 실현

System z 하드웨어의 핵심적인 특징 중 하나는 시

스템 리던던시를 통한 장애 시 탄력성이다. Flash Ex-

press도 이 원칙을 따른다. 하드웨어와 소프트웨어는

애플리케이션 중단 없이 장애로부터 복구되도록 설

계되었다. 이러한 리던던시 설계 덕분에 무중단 서비

스가 가능하다.

z/OS 소프트웨어와 I/O 펌웨어는 멀티프로세싱 시

스템에 맞게 개발되었으며, 개별 프로세서 장애에 대

해 내장애성을 갖는다. 미러링된 SE 덕분에 플래시

보안 프로토콜에서 SE 중 하나를 사용하여 SSD 인증

키를 서비스할 수 있다. 다른 물리적 구성 요소는 이

중화된다. PCIe I/O 서브 시스템은 2개의 경로를 통

해 I/O 드로어에 연결된다. 플래시 어댑터와 미러링

케이블은 쌍으로 설치되고 SSD 어댑터는 미러링되며

케이블은 이중화된다. 그리고 이와 같은 전반적인 이

중화를 통해 장애, 펌웨어 업데이트, 구성 요소 교체

상황에서 시스템이 정상 작동하는 경로와 어댑터를

찾도록 설계되었다.

데이터 보호 및 수정

이 시스템은 SSD 오류를 탐지하고 대개는 해결한

다. 512바이트 블록마다 CRC 1개, 시퀀스 번호 2개

와 함께 저장된다. 이 번호는 디스크 데이터의 논리적

블록 주소, 데이터의 SCM 주소와 관련된다. 데이터

를 읽을 때 이 체크 필드를 예상 값과 비교한다. 오류

가 있으면 블록을 다시 읽거나 미러링된 SSD로부터

데이터를 가져온다. I/O 서브시스템도 이와 비슷하게

무결성 및 복구 메커니즘을 제공한다.

마지막으로, System z 메모리의 모든 데이터는

ECC(Error Correction Code)를 통해 오류를 탐지하

고 해결하면서 보호된다.

중요 데이터 보호

SSD의 데이터는 계속 유지되어야 하므로 어댑터

가 제거될 경우에 대비하여 컨텐츠를 암호화함으로

써 중요 데이터를 보호한다. 하드웨어 암호화에서는

데이터 쓰기 단계에서 인라인 256비트 Advanced

Encryption Standard 알고리즘을 사용하고, 데이터

를 읽을 때 이를 해독한다. 암호화 키는 장치 내에 안

전하게 보관되며, 장치 액세스는 인증 키를 통해 제한

된다. 이 키는 I/O 펌웨어에서 SE의 스마트 카드를 사

용하여 설정하고 관리한다.

설치 과정에서 스마트 카드는 인증 키를 생성하고

스마트 카드 내부의 개인 키를 사용하여 암호화한다.

래핑된 인증 키가 SE의 디스크에 저장되고 안전하게

백업 SE에 복사된다.

펌웨어는 SSD를 포맷하기 전에 SE에 인증 키를 요

청한다. 즉 공개-개인 키 쌍의 공개 키를 보낸다. 스마

트 카드는 키의 래핑을 해제하고 공개 키를 사용하여

인증 키를 래핑한다. 래핑된 키가 I/O 펌웨어에 보내

지고 개인 키에 의해 래핑 해제된다. 이 인증 키를 사

용하여 SSD를 포맷한다. 포맷이 끝나면 인증 키는 시

스템 전원이 켜지는 이벤트와 함께 SSD로 보내진다.

스마트 카드는 키 생성 시 사용된 것과 동일한 SE

에서만 키 파일을 래핑 해제할 수 있다. 플래시의 데

이터는 오로지 포맷 프로세스에서 사용된 스마트

카드 및 SE(또는 리던던시된 것)를 사용하여 액세스

할 수 있다.

향상된 경험Flash Express는 메인프레임급 컴퓨팅에서 플래시

메모리를 활용한다. 면밀한 시스템 소프트웨어 관리

와 리던던시 설계 원칙을 통해 업계 표준 플래시 메모

리 기술을 이용하고 패키지화함으로써 뛰어난 성능,

엔터프라이즈급 신뢰성, 가용성, 서비스 편의성까지

제공하게 되었다. Flash Express로 보조 스토리지를

확장하는 초기 활용 형태는 워크로드 전환 시간와 시

스템 덤프 시간을 단축한다. 이를 통해 당장 더 우수

한 고객 경험을 제공할 뿐 아니라, 이를 토대로 차세

대 System z 엔터프라이즈 서버에서 더 향상된 기능

을 제공할 수 있다.