25
[Network Functions Virtualization] VNF Reliability/Availability 제공을 위한 방법 2015. 10. 30 ㈜파이오링크 SDN개발실 이준 ([email protected])

20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

Embed Size (px)

Citation preview

Page 1: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

[Network Functions Virtualization]

VNF 의 Reliability/Availability 제공을 위한 방법

2015. 10. 30

㈜파이오링크

SDN개발실 이준 ([email protected])

Page 2: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Contents

Protection Schemes

- State Protection Mechanism

- Failure Detection Mechanism

- Fault Localization Mechanism

- Failure Isolation Mechanism

- Remediation Mechanism

- Recovery Mechanism

VNF Protection Schemes

- Active/Standby Method

- Active/Active Method

- Load Balancing Method

References

2

Page 3: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Protection Schemes

3

Page 4: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Protection Schemes 정의

Network Function 에서 사용하는 Protection Schemes

- Protection Scheme 은 Network Function 에 Reliability 나 Availability 보장을 위해 구현되는 Mechanism 을 의미함

- Application 또는 Infrastructure 등 Protection Scheme 이 구현되는 Level 에 따라 다음 6가지 Mechanism 으로 구분

• State Protection Mechanism

• Failure Detection Mechanism

• Fault Localization Mechanism

• Failure Isolation Mechanism

• Remediation Mechanism

• Recovery Mechanism

4

Page 5: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Protection Schemes 의 종류 (1)

State Protection Mechanism

- Application 내부나 Infrastructure 레벨에서 구현 가능 함

- State Protection Mechanism 의 대표적인 형태는 Check Pointing 임

- Check Pointing 이란!?

• Failure 발생 시 Normal 상태로 복구를 위해 Network Function (Application Process) 의 State 를 주기적으로 저

장하는 동작을 의미함

- NFVI 레벨에서 State Protection Mechanism 을 제공 할 경우 Storage Service (Block Storage and/or database

services)를 이용하여 VM State Check Pointing 을 수행 함

• NFVI 에 State Information 저장을 위한 저장소가 위치 함

• Application 에서 State Externalization 을 수행하기 위해서는 NFVI 에서 제공하는 Redundant connection

Channel 이나 Storage 가 필요 함

- Application 레벨에서 State Protection Mechanism 을 제공 할 경우 Application 내부 프로세스 간 내부/직접 연결

을 통해 Check Pointing 을 수행 함

• Application 내부에 State Information 저장을 위한 저장소 가 위치 함

• 일반적으로 NFVI 의 Reliability 가 낮을 경우 Application 레벨에 State Protection Mechanism 을 직접 구현 함

(VNF 상에 State Protection Mechanism 을 구현)

• Application 프로세스 간 Check Pointing 수행을 위해 NFVI 에서 Network Domain 형태로 제공하는 Check

Point Channel 이 필요 함

5

Page 6: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Protection Schemes 의 종류 (2)

Failure Detection Mechanism

- Application 내부나 Infrastructure 레벨에서 구현 가능 함

- Traditional 시스템은 Hardware 자원으로 직접 접근 (Direct Access) 를 통해 Failure Detection Mechanism 을 구현

하였음

- Traditional 시스템은 Device Driver Layer 에서 다양한 Detection Mechanism 을 구현 하였음

- 하지만 NFV 시스템의 경우 Traditional 시스템과 같은 접근 방법이 적용 불가능 함

• VNF (Application 프로세스) 가 기반으로 있는 Hardware 자원으로 부터 Decoupled 되어 있음

• Hardware 자원으로 직접 접근 은 Hypervisor 에 의해 Encapsulated 되어 있음

• Hardware 자원은 많은 VNF 들 사이에 공유 되어 짐

- Hardware 자원이 Abstract 되어 있는 NFV 시스템의 특징 때문에 VNF Application 의 Failure Detection 의 설계 시

Traditional 시스템과 다른 접근 방법을 가져야 함

- VNF 가 기반이 되는 Hardware 자원의 Failure Detection 이 필요 할 경우 NFVI 에서 제공하는 Failure Notification

에 대한 Subscribe 를 직접 수행 해야 함

• VNF 가 Failure Notification 에 대한 Subscribe 를 할 경우 NFVI 는 Failure 발생 시 표준화된 방법에 의해 정보

를 제공 함

- VNF/VNFC Instance 내부 적으로 Failure Detection Mechanism 이 필요 함

• Application Design 시 고려 해야 함

• e.g. VNFC Internal Health Monitoring Mechanism

- 6

Page 7: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Protection Schemes 의 종류 (3)

Fault Localization Mechanism

- Fault Localization Mechanism 이란 Failure Isolation 과 Remediation Action 을 수행하기 위한 범위를 결정하는

Mechanism 을 의미 함

- Hardware Failure Detection 시 NFVI 레벨에서 Localized 됨

- Application Failure Detection 시 Application 레벨에서 Localized 됨

7

Failure Isolation Mechanism

- Failure Isolation Mechanism 이란 Failure 가 발생한 Component Boundary 를 벗어나 번지는 것을 막는

Mechanism 을 의미 함

- e.g. Failure 가 번지는 것을 막기 위해 Node 의 전원을 끄거나, 네트워크 레벨에서 Isolation 을 수행 함

- 일반적으로 Failure Isolation Mechanism 은 Infrastructure 레벨에서 구현되어 지며 Application 에게 숨겨져 있음

Page 8: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Protection Schemes 의 종류 (4)

Remediation Mechanism

- NFV 시스템도 Traditional 시스템의 Remediation Mechanism 과 비슷하게 구현 됨

- NFV 시스템의 Remediation Mechanism 의 경우 Application Component 의 Redundancy Model 이나 State

Protection Mechanism 에 의해 결정 됨

- NFV 시스템에서 Remediation Mechanism 은 Redundancy Mechanism 과 Failure 발생 시 수행하는 Remediation

Action 을 경정하는 Decision Logic 으로 구성 됨

8

Recovery Mechanism

- NFV 시스템에서 Recovery Mechanism 은 Infrastructure Operator 와 해당 Service 에 의해 제공되어야 함

- Recovery Mechanism 의 범위는 Application 에 의한 Failure 외의 모든 범위를 포함하고 있음 (Outside of the

scope of the VNF application VNF Design)

- Traditional 시스템의 Recovery Mechanism 은 NFV 시스템에 적합하지 않으며, 새로운 환경에 적합한 New

Recovery Model 이 필요 함

Page 9: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

VNF Protection Schemes

9

Page 10: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

VNF Protection Schemes

ETSI NFV 에서 정의하는 VNF Protection Schemes

- VNF 에서 장애 발생 시 대응하기 위한 모델을 의미 함

- VNF Protection Scheme 은 VNF 의 Reliability 향상을 목표로 함

- ETSI GS REL 003 V<0.3.0> (<2015-08>) 문서에는 VNF Protection Scheme 으로 다음 3가지 Method 를 제안하

고 있음

• Active/Standby Method

• Active/Active Method

• Load Balancing Method

- Traditional 시스템 에서 사용하는 Active/Standby, Active/Active, Load Balancing Method 를 NFV 환경에 알맞게 변

경하여 적용 하였음

10

Page 11: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Standby Method

Active/Standby configuration of VNFs in the NFV architecture

- 2N Redundancy Model (N=1),

- Traditional Environment 의 Active/Standby Method 와 비교 했을 경우 VNF 가 External Network 의 Client 와 NFVI

를 통해 연결 된 다는 점을 고려하여 Traditional 시스템과 다른 Active/Standby 설계가 필요 함

- Active VNF 와 Standby VNF 는 서로 다른 Compute domain 에 위치 해야 함 (Anti-Affinity Rule 적용)

- 아래 그림은 NFV Architecture 에서 VNF 의 Active/Standby Configuration 을 의미 함

11

Page 12: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Standby Method: Recovery and Remediation Phase

Active/Standby failover in the Virtualized Environment

- 아래 그림은 Virtualized Environment 에서 Active/Standby Method 의 Recovery and Remediation Phase 를 의미

- Active VNF 에서 장애 발생 시 Standby VNF 를 통해 서비스 제공 함

- Active/Standby Configuration 시 External CP 와 Internal CP 의 Mapping 을 통해 Service Traffic 제어 함

- Virtual Router 상에서 External CP 와 Internal CP 의 Mapping 은 NFV-MANO 에서 수행 함

- Failover Mechanism 수행을 위해 Standby VNF 에서 Active VNF 에 대한 주기적인 Health check 가 필요 함

• NFV-MANO 가 주기적인 Heath Check 를 수행하는 Design 도 가능 함

Page 13: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Standby Method: Recovery and Remediation Phase

A Failover procedure of VNFs in the active/standby configuration

- Standby VNF 에서 Active VNF 로 Health Check (Heartbeat Mechanism)를 수행

- Active VNF 에서 응답이 없을 경우 Standby VNF 는 NFV-MANO 로 Fault 를 Notify 함

- NFV-MANO 에서는 CP Re-Mapping 을 통해 Service Traffic 을 Standby VNF 로 흐르도록 함

- Active VNF 에서 장애 발생 시 Standby VNF 를 통해 지속적인 서비스 제공이 가능 하도록 Active VNF 에서

Standby VNF 로 주기적인 State Replication 이 필요 함

- CP Mapping 을 변경하는 시간이 시스템의 Availability 측정에 영향을 끼침

13

Page 14: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Standby Method: State Protection

Stateful VNFs with internal storage for states in the active/standby configuration

- Failover Mechanism 을 지원하기 위해 시스템의 CP Mapping 외에 시스템의 State Information Consistent 가 필요

함 (Standby 상태의 VNF 가 Active 상태로 변경 되었을 경우 지속적인 서비스 제공이 가능 하도록 State

Replication 을 수행 함)

- 아래 그림은 Active/Standby Method 로 구성된 VNF 간 State Replication 을 의미 함

14

Page 15: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Standby Method

A failover procedure of VNFs synchronizing state information in the active/standby

configuration

15

각 VNF 는 Health Check 를 하며, State Information 을 동기화 함

Active 상태의 VNF 에서 Failure 가 발생할 경우, NFV-MANO 는 Standby 상태의 VNF 를 Active 로 변경 함

Page 16: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Active Method

Active/Active configuration of VNFs in the NFV architecture

- 동일한 Service 를 제공하는 두 개의 VNF (Virtual Network Function) instance 가 Active 상태로 구성 되어 있음

- N-way active redundancy model (N=2)

- 각각의 VNF 들은 서로 다른 Compute domain 에 위치 해야 함 (Anti-Affinity Rule 적용)

- State Protection

• 두개의 VNF Instance 모두 Active 상태 (Standby VNF 가 존재하지 않음) 기 때문에 State Protection 을 위해

NFVI 에서 제공하는 Storage 를 사용 함

16

Page 17: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Active Method: Recovery and Remediation Phase

An example of active/active method in the NFV environment

- 아래 그림은 Virtualized Environment 에서 Active/Active Method 의 Recovery and Remediation Phase 를 의미 함

- Active/Active Method 에서는 Active/Standby Method 와 같이 NFV-MANO 가 CP-Mapping 에 대해 Re –

configuration 할 필요가 없음

- External Network 에 존재하는 Client 가 우선적으로 VNF#01 을 통해 서비스를 요청하고, VNF#01에서 응답이 없

을 경우 VNF#02 로 목적지 주소를 변경 함

17

Page 18: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Active/Active Method: State Protection

Stateful VNFs with external storage for states in the active/active configuration

- Failover Mechanism 을 지원하기 위해 시스템의 State Information Consistent 가 필요 함

- 두개의 VNF 모두 Active 상태이기 때문에 NFVI (Infrastructure) 에서 제공하는 Storage 를 사용하여 State

Information Consistent 를 수행 함 (State Externalization)

- 아래 그림은 Active/Active Method 로 구성된 VNF 간 State Replication 을 의미 함

18

Page 19: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Load Balancing Method

Load Balancing configuration of VNFs in the NFV architecture

- Cloud 환경에서 Load Balancer 가 VNF 의 앞 쪽에 위치한 형태 임

- Service Traffic 들은 Load Balancer 를 통해 VNF 들로 분산 처리 됨

- N-Way Redundancy Model

- 아래 그림은 Virtualized Environment 에서 Load Balancing Method 를 의미 함

- Virtualized Environment 에서 Load Balancing Method 사용 시 두 가지의 State Protection Mechanism 이 가능 함

19

Page 20: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Load Balancing Method: Recovery and Remediation Phase

A failover procedure of VNFs synchronizing state information in the Load Balancing

configuration

20

Page 21: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Load Balancing Method: State Protection

State Information 을 Externalization 하는 방법

- 아래 그림은 NFVI 에서 제공하는 Storage 에 Storage Information 을 저장하는 방법

21

Page 22: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

Load Balancing Method: State Protection

Peer Mate 간 State Information 을 공유 하는 방법

- 아래 그림은 VNF 간 Peer Mate 를 정해 State Information 을 저장 하는 방법을 의미 함

22

Page 23: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

References

23

Page 24: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

© PIOLINK, Inc. SDN No.1

References

ETSI GS REL 003 v <0.3.0> (<2015-08>), Reliability; Report on Models and Features for E2E Reliability

24

Page 25: 20151030 jun lee_vnf 의 reliabilityavailability 제공을 위한 방법 (최종)

감사합니다. ㈜파이오링크

서울시 금천구 가산디지털2로 98

(가산동 550-1) IT캐슬 1동 401호

TEL: 02-2025-6900

FAX: 02-2025-6901

www.PIOLINK.com

25