7
Giải pháp cho hệ thống lưu trữ tài liệu số Bài viết giới thiệu một số giải pháp cho hệ thống lưu trữ tài liệu số. 1. Công nghệ lưu trữ a) DAS (Direct Attached Storage): Dùng để chỉ các thiết bị lưu trữ gắn trực tiếp vào hệ thống cần lưu trữ (server, workstation). Ví dụ đơn giản nhất của DAS là ổ đĩa cứng lắp trong hoặc các ổ lắp ngoài của máy tính. Tính đến thời điểm này, DAS vẫn là phương pháp lưu trữ phổ biến nhất cho các hệ thống máy tính. DAS được sử dụng phần lớn cho các người dùng đơn lẻ, hoặc những nơi mà yêu cầu về khả năng sẵn sàng của dữ liệu không quá cao. Khả năng mở rộng của các thiết bị DAS không cao so với các phương pháp khác. b) NAS (Network Attached Storage): Là phương pháp lưu trữ dữ liệu sử dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào trong mạng như một thiết bị mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS cũng được gắn các địa chỉ IP cố định và được client truy nhập thông qua sự điều khiển của server. Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý của server. NAS có các ưu điểm sau: Trong môi trường đa hệ điều hành với nhiều máy chủ khác nhau, việc lưu trữ dữ liệu, backup, quản lý hay áp dụng các chính sách security đều được thực hiện tập trung. Khả năng mở rộng: khi người dùng cần thêm dung lượng lưu trữ, các thiết bị lưu trữ NAS mới có thể được bổ sung và lắp đặt vào mạng. NAS tăng cường khả năng chống lại sự cố cho mạng. Trong môi trường DAS, khi một máy chủ chứa dữ liệu không hoạt động thì toàn bộ dữ liệu đó không thể sử dụng được. Trong môi trường NAS, dữ liệu vẫn hoàn toàn có thể được truy nhập bởi người dùng. Các biện pháp chống lỗi và dự phòng tiên tiến được áp dụng để bảo đảm NAS luôn sẵn sàng cung cấp dữ liệu cho người dùng. Tuy có những điểm nổi trội so với các thiết bị DAS nhưng NAS vẫn có những hạn chế nhất định. Với việc sử dụng chung hạ tầng mạng với các ứng dụng khác, việc lưu trữ dữ liệu có thể ảnh hưởng đến hiệu năng của toàn hệ thống (làm chậm tốc độ của LAN), điều này đặc biết đáng quan tâm khi cần lưu trữ thường xuyên một lượng lớn dữ liệu. c) SAN (Storage Area Network): Là một mạng riêng gồm các thiết bị lưu trữ được liên kết với nhau và liên kết với máy chủ (hoặc

Giải pháp cho hệ thống lưu trữ tài liệu số

  • Upload
    chiensy

  • View
    114

  • Download
    5

Embed Size (px)

Citation preview

Page 1: Giải pháp cho hệ thống lưu trữ tài liệu số

Giải pháp cho hệ thống lưu trữ tài liệu số

Bài viết giới thiệu một số giải pháp cho hệ thống lưu trữ tài liệu số.

1. Công nghệ lưu trữ

a) DAS (Direct Attached Storage):

Dùng để chỉ các thiết bị lưu trữ gắn trực tiếp vào hệ thống cần lưu trữ (server, workstation). Ví

dụ đơn giản nhất của DAS là ổ đĩa cứng lắp trong hoặc các ổ lắp ngoài của máy tính. Tính đến

thời điểm này, DAS vẫn là phương pháp lưu trữ phổ biến nhất cho các hệ thống máy tính.

DAS được sử dụng phần lớn cho các người dùng đơn lẻ, hoặc những nơi mà yêu cầu về khả năng

sẵn sàng của dữ liệu không quá cao. Khả năng mở rộng của các thiết bị DAS không cao so với

các phương pháp khác.

b) NAS (Network Attached Storage):

Là phương pháp lưu trữ dữ liệu sử dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào trong mạng

như một thiết bị mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS

cũng được gắn các địa chỉ IP cố định và được client truy nhập thông qua sự điều khiển của

server. Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý

của server. NAS có các ưu điểm sau:

Trong môi trường đa hệ điều hành với nhiều máy chủ khác nhau, việc lưu trữ dữ liệu, backup,

quản lý hay áp dụng các chính sách security đều được thực hiện tập trung.

Khả năng mở rộng: khi người dùng cần thêm dung lượng lưu trữ, các thiết bị lưu trữ NAS mới

có thể được bổ sung và lắp đặt vào mạng.

NAS tăng cường khả năng chống lại sự cố cho mạng. Trong môi trường DAS, khi một máy chủ

chứa dữ liệu không hoạt động thì toàn bộ dữ liệu đó không thể sử dụng được. Trong môi trường

NAS, dữ liệu vẫn hoàn toàn có thể được truy nhập bởi người dùng. Các biện pháp chống lỗi và

dự phòng tiên tiến được áp dụng để bảo đảm NAS luôn sẵn sàng cung cấp dữ liệu cho người

dùng.

Tuy có những điểm nổi trội so với các thiết bị DAS nhưng NAS vẫn có những hạn chế nhất định.

Với việc sử dụng chung hạ tầng mạng với các ứng dụng khác, việc lưu trữ dữ liệu có thể ảnh

hưởng đến hiệu năng của toàn hệ thống (làm chậm tốc độ của LAN), điều này đặc biết đáng quan

tâm khi cần lưu trữ thường xuyên một lượng lớn dữ liệu.

c) SAN (Storage Area Network):

Là một mạng riêng gồm các thiết bị lưu trữ được liên kết với nhau và liên kết với máy chủ (hoặc

Page 2: Giải pháp cho hệ thống lưu trữ tài liệu số

một nhóm các máy chủ) đóng vai trò như các điểm truy nhập trong SAN. Trong một số trường

hợp, SAN cũng được kết nối với mạng LAN. SAN sử dụng các switch đặc biệt để kết nối các

thiết bị với nhau.

Hệ thống SAN thường được chia làm hai mức: mức vật lý và logic. Mức vật lý mô tả sự liên kết

các thành phần của mạng (edge switch, core switch, Host Bus Adapter - HBA, cable, firmware)

tạo ra một hệ thống lưu trữ đồng nhất và có thể sử dụng đồng thời cho nhiều ứng dụng và người

dùng. Mức logic bao gồm các ứng dụng, các công cụ quản lý và dịch vụ được xây dựng trên nền

tảng của các thiết bị lớp vật lý, cung cấp khả năng quản lý hệ thống SAN.

Việc sử dụng một mạng riêng để kết nối các thiết bị lưu trữ với nhau có những ưu điểm nhất định

so với các phương pháp khác. Cụ thể là:

Có khả năng backup dữ liệu với dung lượng lớn và thường xuyên mà không làm ảnh hưởng đến

lưu lượng thông tin trên mạng.

Dữ liệu luôn ở mức độ sẵn sàng cao, không giống như DAS sử dụng các thiết bị lưu trữ trực tiếp

gắn với server.

Dữ liệu được lưu trữ thống nhất, tập trung và có khả năng quản lý cao. Có khả năng khôi phục

dữ liệu nếu có xảy ra sự cố.

Một số đặc điểm khác của hệ thống SAN:

Hỗ trợ nhiều giao thức, chuẩn lưu trữ khác nhau iSCSI, FCIP, DWDM.

Có khả năng mở rộng tốt trên cả phương diện số lượng thiết bị, dung lượng hệ thống cũng như

khoảng cách vật lý.

Mức độ security cao do thực hiện quản lý tập trung cũng như sử dụng các công cụ hỗ trợ quản lý

SAN.

2. Lựa chọn giải pháp lưu trữ

Với các phân tích ưu nhược điểm của các công nghệ lưu trữ phổ dụng hiện nay, kết hợp với tính

chất công việc, yêu cầu sử dụng và kinh phí đầu tư của Cục Văn thư và Lưu trữ Nhà nước, chúng

tôi đề xuất giải pháp sử dụng công nghệ NAS kết hợp với DAS dùng cho thiết bị lưu trữ.

NAS bảo đảm tính sẵn sàng cũng như khả năng an toàn dữ liệu, không phụ thuộc các server.

NAS phù hợp với các hệ thống lưu trữ với dung lượng lớn. Chúng tôi chọn giải pháp NAS dùng

cho hệ thống lưu trữ tại Trung tâm dữ liệu của Cục Văn thư và Lưu trữ nhà nước. Chi tiết về hệ

thống NAS được đề xuất sẽ được chúng tôi trình bày trong phần Hệ thống lưu trữ.

Với nhu cầu lưu trữ tại các Trung tâm lưu trữ Quốc gia I, II, III, IV chúng tôi sử dụng giải pháp

lưu trữ DAS với thiết bị lưu trữ dung lượng lớn gắn trực tiếp với máy chủ database. Mỗi máy chủ

database tại các trung tâm lưu trữ được gắn trực tiếp với thiết bị lưu trữ DAS. Chi tiết về thiết bị

Page 3: Giải pháp cho hệ thống lưu trữ tài liệu số

DAS được đề xuất được chúng tôi trình bày trong phần Hệ thống lưu trữ.

a) Lưu trữ dùng SAN

SAN là một mạng tốc độ cao có mục đích đặc biệt sử dụng để kết nối các thiết bị lưu trữ với hệ

thống máy tính. Cáp tốc độ cao sử dụng để kết nối các thiết bị trong SAN ngày nay thường là cáp

quang.

SAN được sử dụng để di chuyển dữ liệu giữa các máy chủ của bạn và các thiết bị lưu trữ mà các

máy chủ này cần. Bao gồm cả việc lưu trữ và lấy dữ liệu từ các thiết bị tủ đĩa hoặc băng từ.

Trong mô hình mạng lưu trữ, toàn bộ phần lưu trữ được tách ra khỏi mạng, tạo thành một mạng

riêng như trên, đường kết nối đến SAN sử dụng các đường cáp quang có tốc độ đến 4Gbps cho

nên đảm bảo tính khả dụng cho người dùng, không bị các sự cố về nghẽn mạng như trước. Mô

hình này ưu việt hơn hẳn các mô hình trước đó, nó giúp đảm bảo cho hệ thống cả tính bảo mật và

tính dự phòng, tính khả dụng cũng như độ tin cậy.

Tuy nhiên, có thể bạn băn khoăn, liệu phần lưu trữ riêng như vậy, thì việc bảo mật được thực

hiện như thế nào. Với các phần mềm quản lý lưu trữ, cùng với các tính năng bảo mật tuyệt vời

của các phần mềm, đảm bảo rằng hệ thống của bạn sẽ an toàn tuyệt đối.

Mặt khác, khi tách riêng mạng lưu trữ ra, ta có thể nâng cấp dung lượng của hệ thống lưu trữ một

cách dễ dàng, chỉ việc mua thêm các hệ thống lưu trữ mà không cần thiết phải nâng cấp hệ thống

Page 4: Giải pháp cho hệ thống lưu trữ tài liệu số

máy chủ lên cấu hình cao hơn để có thể thích ứng với các hệ thống lưu trữ mới.

Chúng ta sẽ có thể thấy được lợi ích từ mô hình này qua phần dưới đây :

- Tại sao lại phải sử dụng SAN

+ Sự tăng trưởng lưu trữ nhanh chóng là nguyên nhân gây ra các vấn đề mới cho người quản lý

trung tâm dữ liệu: Hạn chế về nhân lực và kỹ năng, Cung cấp khả năng bảo vệ vốn đầu tư trong

khi giảm giá thành lưu trữ tại cùng thời điểm, Hợp nhất máy chủ, thiết bị lưu trữ và dữ liệu

thường được lập kế hoạch, hoặc tệ hơn là xảy ra song song, Đòi hỏi mạng lưu trữ lớn và quản lý

lưu trữ, Sự chứng minh vốn đầu tư với nguồn tài chính hạn hẹp;

+ Khi nhu cầu về lưu trữ tăng lên, người quản trị mạng chỉ đơn giản thêm vào đó một ổ đĩa

không đắt lắm là hoàn tất, nhưng khi số máy chủ tăng lên, số tiêu đề gắn với thiết bị lưu trữ gắn

trực tiếp sẽ ra ngoài tầm kiểm soát, người quản trị sẽ không thể quản lý được hệ thống. Điều này

rất nguy hiểm cho hệ thống khi có sự cố xảy ra;

+ Một trong điểm nữa cần phải cân nhắc đó là, với các hệ thống không sử dụng mạng SAN như

DAS hoặc NAS thì khi hệ thống xảy ra sự cố, cần phải phục hồi lại hệ thống thì sẽ tốn rất nhiều

thời gian vì dữ liệu đặt rải rác trên các thiết bị lưu trữ trong toàn bộ hệ thống. một khi đã sử dụng

mạng SAN, thiết bị lưu trữ được quản lý tập trung với khả năng mở rộng kinh tế, cải thiện khả

năng sao lưu, hồi phục, tuỳ chọn DR sẽ cho phép giảm thời gian phục hồi từ vài giờ xuống chỉ

còn vài phút.

- Các lợi ích từ SAN

+ Tăng khả năng sử dụng ổ đĩa, trì hoãn việc bổ sung ổ đĩa, trì hoãn việc bổ sung thêm ổ băng từ.

Tuổi thọ của ổ đĩa được tăng;

+ Giảm không gian dành cho rack/mặt sàn cho trung tâm dữ liệu;

+ Khả năng DR được cải thiện, tuỳ chọn khả năng phục hồi on-line;

+ Tận dụng nhân công cho quản lý máy chủ;

+ Tỉ lệ TB trên mỗi DBA ngày càng giảm, Chi phí quản lý bằng một % của chi phí lưu trữ;

+ Tính khả dụng nói chung được cải tiến;

+ Giảm các máy chủ lưu trữ, Kéo dài tuổi thọ của máy chủ, Giảm tải cho CPU trên máy chủ;

+ Hiệu năng LAN/WAN, tăng hiệu năng vào ra, tăng sự di chuyển dữ liệu;

+ Việc duy tu thiết bị lưu trữ giảm, Giảm/xoá bỏ lô, cửa sổ sao lưu, Cải thiện/ bảo vệ dữ liệu

quan trọng;

Page 5: Giải pháp cho hệ thống lưu trữ tài liệu số

+ Tính mở rộng không bị ngắt quãng;

+ Tránh sự phát triển của mạng dữ liệu, Ảnh hưởng các ứng dụng mới/chuyển tiếp;

+ Ảnh hưởng đến sự phát triển và thử nghiệm của các ứng dụng;

+ Hỗ trợ Clustering;

+ Các dịch vụ bảo mật thứ cấp;

+ Hợp nhất các hãng cung cấp;

+ Lưu trữ theo yêu cầu;

+ Các lỗi thành phần (switch, HBA, server) : Đường dự phòng, Mạng dự phòng và Các dịch vụ

phân phối;

+ Các lỗi phần mềm (hệ điều hành, các ứng dụng): Các giải pháp cluster có khả năng mở rộng,

cơ sở dữ liệu, sao lưu, Cách ly lỗi qua các vùng;

+ Các lỗi do con người gây ra: Tự động cấu hình và tái cấu hình mà không cần sự tác động của

con người, Điều khiển tập trung, ít vị trí vật lý hơn;

+ Các thủ tục bảo trì không làm ngắt quãng các chức năng thương mại: Các ứng dụng rehost mà

không làm gián đoạn dịch vụ, Các dịch vụ có thể trả về một host gốc sau khi hoàn tất;

+ Sự thay đổi cấu hình có thể xuất hiện trong khi hệ thống hoạt động: Các máy chủ, các thiết bị

lưu trữ được bổ sung, nâng cấp và thay thế, Việc bổ sung và cài đặt chỉ được tiến hành khi cần;

+ SAN mang lại cơ sở hạ tầng cho tính liên tục của doanh nghiệp: Ánh xạ, Tái bản dữ liệu, Nhảy

qua băng từ điện tử, Clustering và clustering từ xa, Truy nhập ổ đĩa từ xa;

+ SAN mang đến giải pháp liên tục cho doanh nghiệp qua các khoảng cách xa: Mạng kênh quang

chuẩn: Khoảng cách xa hơn với các kênh quang cơ bản (DWDM và các phương pháp MAN

khác).

b) Lưu trữ dùng NAS

Để đáp ứng cho nhu cầu lưu trữ tại trung tâm tích hợp dữ liệu của Cục Văn thư và Lưu trữ Nhà

nước, chúng tôi sử dụng thiết bị lưu trữ NAS server.

Máy chủ NAS thực hiện lưu trữ các dữ liệu của các server trên mạng, góp phần loại trừ và giảm

yêu cầu về các thiết bị lưu trữ gắn trực tiếp vào các server đó. Khả năng này giúp tăng cường

tính sẵn sàng của dữ liệu – dữ liệu có thể được truy xuất bởi nhiều client khác nhau mà không bị

ảnh hưởng bởi tình trạng của server. Ngay cả khi server có sự cố không hoạt động được, dữ liệu

Page 6: Giải pháp cho hệ thống lưu trữ tài liệu số

vẫn sẵn sàng cho các nhu cầu sử dụng của người dùng.

NAS thực chất là một máy chủ với khả năng lưu trữ và khả năng mở rộng lớn theo yêu cầu.

Ngoài ra, các thiết bị NAS có khả năng kết hợp với nhiều thiết bị và giải pháp lưu trữ khác khi có

nhu cầu mở rộng.

c) Tủ đĩa lưu trữ

Với thiết bị lưu trữ tại các Trung tâm Lưu trữ quốc gia, chúng tôi sử dụng tủ đĩa lưu trữ gắn trực

tiếp với máy chủ cơ sở dữ liệu. Với khả năng lưu trữ dung lượng lớn, độ sẵn sàng và hiệu năng

cao, tủ đĩa lưu trữ là giải pháp lý tưởng cho công tác lưu trữ tại các Trung tâm Lưu trữ quốc gia.

Hệ thống tủ đĩa lưu trữ cần đáp ứng được một số tiêu chuẩn sau:

- Gọn nhẹ, không chiếm nhiều không gian lưu trữ;

- Hỗ trợ các chuẩn lưu trữ tiên tiến, cho phép trao đổi dữ liệu tốc độ cao;

- Có khả năng mở rộng, bảo đảm người dùng có thể bảo toàn đầu tư khi nâng cấp trong tương lai;

- Ổ cứng, nguồn, quạt có khả năng thay thế nóng. Quạt, nguồn và I/O module đều có khả năng

dự phòng;

- Hỗ trợ nhiều ổ cứng với dung lượng lớn;

c) Lưu trữ dùng băng từ (Tape)

Như trên đã trình bày, với việc lưu trữ tại trung tâm tích hợp dữ liệu của Cục Văn thư và Lưu trữ

Nhà nước, bên cạnh việc dùng NAS server làm thiết bị lưu trữ chính, chúng tôi sử dụng tape

storage để backup các dữ liệu với dung lượng lớn. Trong đề xuất kỹ thuật này, chúng tôi đề xuất

sử dụng thiết bị autoloader để backup dữ liệu từ server ra hệ thống băng từ. Hệ thống autoloader

có một đầu đọc ghi và chứa được một số tape nhất định. Autoloader có thể chứa đồng thời nhiều

tape.Khi đọc ghi dữ liệu, hệ thống chỉ có thể truy cập một tape tại một thời điểm. Với số lượng

tape lớn hơn khả năng lưu trữ của autoloader, một số tape có thể được lưu trữ ngoài và sẽ được

đưa vào autoloader khi có nhu cầu sử dụng.

Các dữ liệu lưu trên tape có nhược điểm là tốc độ truy cập chậm hơn so với trên ổ đĩa cứng

nhưng bù lại, chúng ta có thể lưu trữ được dung lượng lớn dữ liệu trên tape với chi phí rẻ, cho

phép thực hiện bảo quản lâu dài.

d) Lưu trữ dùng CD

Trong giải pháp này, chúng tôi vẫn đề xuất một giải pháp lưu trữ khác phổ biến ở Việt Nam là

thực hiện lưu trữ trên các đĩa CD. Để thực hiện được điều này, Cục Văn thư và Lưu trữ Nhà

nước và các Trung tâm lưu trữ Quốc gia được trang bị các đầu ghi CD dùng cho mục đích lưu trữ

Page 7: Giải pháp cho hệ thống lưu trữ tài liệu số

các dữ liệu đã được số hóa trên CD.

Quá trình lưu trữ có thể được thực hiện theo nhiều cách: sử dụng các ổ đĩa gắn trực tiếp vào

server cần lưu trữ, dùng các thiết bị lưu trữ ngoài hoặc xây dựng mạng dùng riêng cho việc lưu

trữ dữ liệu. Phương pháp lưu trữ dùng các ổ đĩa gắn trực tiếp đã xuất hiện và được sử dụng từ rất

lâu do tính dễ sử dụng của chúng. Cùng với sự phát triển của công nghệ, đặc biệt là yêu cầu của

người dùng về dữ liệu lưu trữ (dung lượng, tốc độ, khả năng khôi phục dữ liệu, ảnh hưởng của

lưu trữ đến hiệu năng của toàn hệ thống), nhiều phương pháp lưu trữ mới được phát triển. Mỗi

phương pháp có những ưu nhược điểm riêng và được dùng cho những mục đích nhất định. Trên

đây là một số giải pháp lưu trữ tài liệu số, chúng tôi giới thiệu để các cơ quan, tổ chức tham khảo

áp dụng./.