4

Click here to load reader

Các lĩnh vực ứng dụng của P2P

Embed Size (px)

DESCRIPTION

Các lĩnh vực ứng dụng của P2P

Citation preview

Page 1: Các lĩnh vực ứng dụng của P2P

Các vấn đề hiện đại trong Công nghệ Thông tin Peer-to-Peer Networks

Phan Anh & Nguyễn Đình Nghĩa – ĐHCN - ĐHQGHN 1

Bài 2: Các lĩnh vực ứng dụng của P2P

Sự ra đời của mạng ngang hàng đã tạo ra cách thức quản lý mới cho hàng loạt các lĩnh vực ứng dụng. Bài này đưa ra một cách nhìn tổng quát cho vấn đề các lĩnh vực ứng dụng của mạng ngang hàng như: giao tiếp (communication), chia sẻ file (file sharing), băng thông (bandwidth), vấn đề lưu trữ (storage), các chu trình xử lí (processor cycles).

3.1. Giao tiếp (communication):

+ Đóng một vai trò quan trọng trong các ứng dụng mạng ngang hàng.

+ Là nhân tố quyết định trong các mạng ngang hàng vì nó cung cấp thông tin về các Peers và các nguồn tài nguyên nào là sẵn sàng trên mạng.

+ Tạo ra khả năng cho các Peer kết nối trực tiếp với các Peer khác và yêu cầu các nguồn tài nguyên.

+ Một ví dụ điển hình về ứng dụng mạng ngang hàng trong giao tiếp là hệ thống chuyển tin nhắn trực tiếp (instant messaging).

*. Instant messaging:

- Thông thường, server trung tâm lưu trữ thông tin và danh sách người dùng đăng kí.

- Khi có sự giao tiếp giữa các node, việc tìm kiếm người dùng (node khác) được thực hiện trên server.

- Trong trường hợp người dùng không online, hệ thống sẽ phải lưu trữ các tin nhắn cho đến khi người dùng này online.

- Các dịch vụ điển hình: Napster, ICQ, Jabber.

3.2. Chia sẻ Files (File sharing)

- Có thể nói ứng dụng được sử dụng nhiều nhất của mạng ngang hàng đó là chia sẻ file.

- Theo ước tính khoảng 70% lưu lượng mạng trên Internet được cho là để trao đổi các file đặc biệt là các file âm nhạc (hơn 1 tỷ các file âm nhạc được download mỗi tuần).

- Đặc điểm của vấn đề chia sẻ file là các Peer có các file được download với vai trò là một Client làm cho chúng luôn sẵn sàng với các Peer khác trong vai trò của một Server.

- Vấn đề chủ yếu cho mạng ngang hàng nói chung và cho vấn đề chia sẻ file nó riêng là vấn đề tìm kiếm. Trong ngữ cảnh của hệ thống chia sẻ file, có ba mô hình khác nhau được phát triển: mô hình flooded request, mô hình thư mục trung tâm và mô hình hướng tài liệu. Các mô hình này được minh hoạ qua các ứng dụng thực của mạng ngang hàng sau: Gnutella, Naspter và FreeNet.

- Trong hệ thống Gnutella, không có sự tập trung hoá, các file được lưu trữ trên các Peer của hệ thống, khi có yêu cầu tìm kiếm một file máy tính sẽ gửi yêu cầu này tới tất cả các peer là láng

Page 2: Các lĩnh vực ứng dụng của P2P

Các vấn đề hiện đại trong Công nghệ Thông tin Peer-to-Peer Networks

Phan Anh & Nguyễn Đình Nghĩa – ĐHCN - ĐHQGHN 2

giềng của nó cho tới khi tìm thấy máy chứa file cần tìm. Tiếp theo là quá trình trao đổi file trực tiếp giữa hai máy tính trong mạng.

- Trong hệ thống Naspter, có sự tập trung hoá. Khi một máy tham gia vào mạng, danh mục các file sẽ được đăng ký và lưu trữ trên Server trung tâm, khi có yêu cầu tìm kiếm, máy tính sẽ hỏi Server trung tâm về vị trí của file. Sau đó việc trao đổi file được thực hiện giữa hai máy tính với nhau.

- Trong hệ thống Freenet, trong file không được lưu trữ trên đĩa cứng của các peer cung cấp chúng mà được lưu trữ ở các vị trí khác trong mạng. Mục đích của việc phát triển mạng Freenet là làm cho thông tin được lưu trữ và truy cập mà không cần biết định danh. Với các tổ chức như vậy, chủ sở hữu của một node mạng cũng không biết được tài liệu gì được lưu trữ trên đĩa cứng của máy anh ta. Vì lý do này mà các Peer và các file được cung cấp các số định danh khác nhau. Khi một file được tạo, nó được truyền qua các peer láng riêng tới các peer có số định danh gần với số định danh của file nhất và được lưu trữ ở đó.

3.3. Băng thông (Bandwidth)

Do yêu cầu về khả năng truyền dẫn của các mạng ngày càng đòi hỏi cao đặc biệt là khi một số lượng lớn dữ liệu đa phương tiện tăng nhanh, hiệu quả của việc sử dụng băng thông ngày càng trở nên quan trọng. Hiện nay, hướng tiếp cận tập trung trong đó các file được lưu trữ trên một Server và được truyền từ đó tới máy khách yêu cầu đang được sử dụng chủ yếu. Trong trường hợp này khi số lượng các yêu cầu tăng nhanh sẽ dẫn tới tình trạng nút cổ chai. Với hướng tiếp cận theo mạng ngang hàng vấn đề cân bằng tải sẽ đạt được sự tối ưu nhất vì nó tận dùng tối đa được các hướng truyền dẫn trong hệ thống mạng.

- Tăng cường khả năng cân bằng tải trong mạng: Khác với kiến trúc Client/Server các mạng ngang hàng lai có thể nhận được sự cân bằng tải tốt hơn. Với mô hình Client/Server thì cả yêu cầu truy vấn thông tin và việc truyền dữ liệu đều được thực hiện giữa máy chủ và máy khách, sẽ làm mất sự cân bằng tải khi có nhiều yêu cầu kết nối tới máy chủ. Trong mô hình mạng ngang hàng, chỉ có yêu cầu truy vấn được thực hiện giữa máy tính tham gia mạng với máy chủ, còn vấn đề truyền file được thực hiện giữa hai máy tính tham gia mạng với nhau, điều này dẫn đến việc phân bố tải đều trên hệ thống mạng.

- Chia sẻ việc sử dụng băng thông: Mạng ngang hàng có thể làm tăng khả năng download và truyền các file do cơ chế tận dụng đường truyền tới các peer tham gia mạng. Một file dữ liệu lớn được chia thành các khối dữ liệu nhỏ độc lập nhau, các khối dữ liệu này được chuyển đồng thời đến các peer khác nhau và cuối cùng đến peer yêu cầu chúng. Tại peer yêu cầu các khối dữ liệu được ghép lại thành file dữ liệu ban đâu. Các phần mềm điền hình của việc chia sẻ băng thông đó là các phần mềm download file, chẳng hạn như: BitTorrent, FlashGet…

3.4. Không gian lưu trữ (Storage Space);

Hiện nay với các hệ thống cần có yêu cầu về mặt lưu trữ dữ liệu cao người ta thường lựa chọn các giải pháp lưu trữ như:

Page 3: Các lĩnh vực ứng dụng của P2P

Các vấn đề hiện đại trong Công nghệ Thông tin Peer-to-Peer Networks

Phan Anh & Nguyễn Đình Nghĩa – ĐHCN - ĐHQGHN 3

+ DAS (Direct Attached Storage): Direct-attached storage (DAS) refers to a digital storage system directly attached to a server or workstation, without a storage network in between. It is a retronym, mainly used to differentiate non-networked storage from SAN and NAS.

+ NAS (Network Attached Storage): Network-attached storage (NAS) is file-level computer data storage connected to a computer network providing data access to heterogeneous network clients.

+ SAN (Storage Area Networks): a storage area network (SAN) is an architecture to attach remote computer storage devices (such as disk arrays, tape libraries and optical jukeboxes) to servers in such a way that, to the operating system, the devices appear as locally attached. Although cost and complexity are dropping, as of 2007, SANs are still uncommon outside larger enterprises.

Bên cạnh những ưu điểm các giải pháp đó cũng tồn tại một số nhược điểm như:

+ Kém hiệu quả trong việc sử dụng hệ thống lưu trữ sẵn có.

+ Phải tăng cường việc sao lưu dữ liệu.

+ Tăng tải trong mạng của công ty.

Tuy nhiên, băng thông mạng ngày càng được cải thiện cao, tính kết nối liên thông ngày một dễ dàng đã cho phép thay đổi cách thức quản lý vấn đề lưu trữ dữ liệu, giải quyết một cách hiệu quả vấn đề lưu trữ và không đỏi hỏi nhiều về vấn đề quản trị hệ thống. Với mạng lưu trữ ngang hàng nói chung nó được giả thiết rằng chỉ có một phần không gian sẵn có trên máy tính PC được sử dụng. Mạng lưu trữ ngang hàng là một cụm các máy tính được xây dựng trên một nền mạng máy tính tồn tại, chia sẻ tất cả các lưu trữ sẵn có trên mạng

Page 4: Các lĩnh vực ứng dụng của P2P

Các vấn đề hiện đại trong Công nghệ Thông tin Peer-to-Peer Networks

Phan Anh & Nguyễn Đình Nghĩa – ĐHCN - ĐHQGHN 4

3.5 Các chu trình xử lý (Processor Cycles):

Có thể nhận thấy rằng trong các ứng dụng đòi hỏi cần phải có sức mạnh tính toán người ta thường tìm cách xây dựng các máy tính mạnh, đắt tiền chứ chưa chú trọng vào việc tận dụng khả năng tính toán của các máy tính được nối mạng. Ngày nay do những yêu cầu đòi hỏi tính toán hiệu năng cao như các thao tác tính toán trong tin sinh học, trong tài chính, trong đo lường mà nhiều nghiên cứu ứng dụng mạng ngang hàng vào xử lý tính toán đã được đưa ra. Bằng việc sử dụng các ứng dụng mạng ngang hàng để bó cụm các chu trình xử lý có thể nhận được khả năng tính toán ngang bằng với một siêu máy tính đắt tiền. Trong một mạng mỗi máy tính là trong suốt với các máy tính khác và tất cả các node được kết nối mạng sẽ tạo thành một máy tính logic.