Luận Văn Tối ưu hóa backup dữ liệu trong mạng ngang hàng có cấu trúc

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Bích Tuyền Dương, 28/7/12.

  1. Bích Tuyền Dương

    Bài viết:
    2,590
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    Tóm tắt
    Khóa luận sẽ trình bày một giải pháp tối ưu hóa cơ chế backup dữ liệu trong mạng ngang hàng có cấu trúc. Giải pháp tập trung giải quyết vấn đề dung lượng bị tăng lên quá nhiều do việc backup và khả năng phục hồi dữ liệu khi có một nút rời mạng. Tiêu chí đánh giá sẽ là tỉ lệ giữa dung lượng của dữ liệu sau khi mạng thực thi nhiều lần backup so với dung lượng ban đầu của mạng và khả năng phục hồi của dữ liệu trên mạng. Giải pháp này đã được thử nghiệm trên chương trình mô phỏng với môi trường mạng ảo. Kết quả cho thấy, giải pháp tối ưu đã đem lại hiệu quả với việc tỉ lệ dung lượng của dữ liệu trên mạng sau khi thực thi backup so với dung lượng của dữ liệu ban đầu không quá lớn và việc phục hồi của dữ liệu khi có nút rời mạng tốt hơn. Theo đó, hiệu năng của mạng và ứng dụng cũng được nâng lên.



    Mục lục
    Mở đầu 1
    Chương 1. Tổng quan 3
    1.1 Tổng quan về việc backup dữ liệu 3
    1.1.1 Giải thuật phân tán thông tin IDA 4
    1.2 Mạng ngang hàng 6
    1.2.1 Định nghĩa 6
    1.2.2 Ưu điểm và nhược điểm của mạng ngang hàng 7
    1.2.3 Mạng ngang hàng không có cấu trúc 8
    1.2.4 Mạng ngang hàng có cấu trúc (Structured) 9
    1.2.5 Chord 10
    1.3 Backup dữ liệu trong mạng ngang hàng 14
    1.3.1 Sự cần thiết của việc backup dữ liệu trong mạng ngang hàng 14
    1.3.2 Một số giải pháp backup dữ liệu trong mạng ngang hàng 15
    Chương 2 Tối ưu hóa backup dữ liệu trên mạng ngang hàng có cấu trúc 16
    2.1 Vấn đề cần giải quyết 16
    2.2 Ý tưởng 17
    2.3 Giải pháp 17
    2.3.1 Backup dữ liệu 18
    2.3.2 Khôi phục dữ liệu 19
    2.4 Đánh giá giải pháp 22
    Chương 3 Mô phỏng và đánh giá 23
    3.1 Chương trình mô phỏng 23
    3.1.1 Dữ liệu 23
    3.1.2 Các đối tượng 24
    3.1.3 Thực thi 26
    3.2 Kết quả và đánh giá 29
    3.2.1 Khả năng tồn tại của dữ liệu 29
    3.2.2 Sự ra vào của các nút trong mạng 30
    3.2.3 Bảo mật 31
    Chương 4. Kết luận 32
    4.1 Kết luận 32
    4.2 Hướng phát triển tiếp theo của đề tài 32
    Tài liệu tham khảo 34
    Phụ lục A 35

    Mở đầu
    Việc backup dữ liệu là điều cần có trong mỗi một hệ thống , đặc biệt là các hệ thống lưu trữ,các hệ thống này có hệ thống mạng.Ngày nay khi Internet càng ngày càng phát triển , sự trao đổi thông tin càng nhiều , việc lưu trữ dữ liệu lại càng trở nên cần thiết.Do đó khóa luận này hướng tới nghiên cứu sâu hơn về cơ chế backup dữ liệu trong một hệ thống lưu trữ , một hệ thống mạng.
    Trong những năm gần đây, công nghệ ngang hàng (peer-to-peer - P2P) hay mạng ngang hàng đã trở nên phổ biến trong các nghiên cứu về lĩnh vực Internet. So với các mô hình mạng khác, mạng ngang hàng có nhiều ưu điểm như khả năng mở rộng, không tồn tại điểm chết, khả năng của hệ thống tỉ lệ với số lượng máy tham gia, Tất cả những đặc điểm trên đã tạo lên công nghệ P2P và các ứng dụng ngang hàng liên quan. Nhiều ứng dụng lớn đã và đang được xây dựng trên mạng ngang hàng như FreeNet, Napster, Gnutella, BitTorrent, eMule .Trong các loại mạng ngang hàng , mạng ngang hang có cấu trúc hiện nay được sử dụng một cách phổ biến bởi những ưu điểm của nó.
    Mạng ngang hàng có cấu trúc sử dụng giải thuật DHT (Distributed Hash Table – bảng băm phân tán) tạo nên một mạng phủ (overlay) trên mạng liên kết vật lý. Giải thuật này định nghĩa liên kết giữa các nút mạng trong mạng phủ theo một cấu trúc cụ thể, đồng thời xác định chặt chẽ mỗi nút mạng sẽ chịu trách nhiệm đối với một phần dữ liệu chia sẻ trong mạng. Mỗi nút đều được kết nối với một tập các nút khác gọi là tập nút láng giềng. Chord là một giao thức của mạng ngang hàng có cấu trúc với không gian địa chỉ một chiều dạng vòng. Mạng ngang hàng cấu trúc Chord thể hiện nhiều ưu điểm như khả năng mở rộng, cân bằng tải, định tuyến, . Giống như những giao thức trên mạng có cấu trúc khác, mỗi nút trong Chord xây dựng một bảng định tuyến giúp cho việc tìm kiếm thông tin giảm từ O(N) với N là số lượng tối đa nút trong mạng, xuống còn O(log2N).
    Trong mạng ngang hàng có cấu trúc nói chung và Chord nói riêng, việc backup dữ liệu được thực hiện thông qua giải pháp sao lưu dữ liệu đơn giản là sử dụng các bản sao của dữ liệu cần backup và các bản sao này được lưu tại các nút gần nút chứa dữ liệu cần backup.Cơ chế này chưa có khả năng khôi phục lại các mảnh backup bị mất đi do quá trình tham gia và rời đi của các nút trên mạng.
    Khóa luận này sẽ đề xuất một phương pháp mới để giải quyết hai vấn đề nêu trên xảy ra với mạng ngang hàng có cấu trúc nói chung và cấu trúc Chord nói riêng. Bằng việc sử dụng thuật toán mã hóa IDAs(Information Dispersal Algorithms) dữ liệu ban đầu sẽ được mã hóa và phân chia thằng m mảnh và chỉ cần n mảnh sẽ có khả năng khôi phục lại dữ liệu ban đầu. Sau đó m mảnh này sẽ được phân chia trên mạng một cách hợp lí . Với giải pháp này , chúng ta có thêm một cơ chế để khôi phục lại những mảnh backup của dữ liệu khi các nút chứa chúng rời khỏi mạng, và hơn nữa dữ liệu ban đầu đã được mã hóa cho nên dữ liệu đã có tính bảo mật.
    Để đánh giá hiệu quả của giải pháp đề xuất, khóa luận xây dựng một chương trình mô phỏng giả lập mạng Internet và đo thời gian trễ truyền thông báo giữa các nút trong mạng Chord. Các kết quả thử nghiệm chứng minh cho khả năng của giải pháp đề xuất trong việc giảm sự tăng dung lượng của dữ liệu cần backup trên mạng và sử dụng tài nguyên mạng hợp lí hơn.
    Khóa luận được chia thành bốn chương:
    Chương 1: Giới thiệu tổng quan về backup dữ liệu và tổng quan về mạng ngang hàng.
    Chương 2: Đề xuất giải pháp tối ưu hóa việc backup dữ liệu trong mạng ngang hàng có cấu trúc , ưu nhược điểm của giải pháp
    Chương 3: Xây dựng chương trình mô phỏng, các bước thực thi chương trình và những đánh giá từ kết quả đạt được.
    Chương 4: Kết luận, những vấn đề nảy sinh và hướng đi tiếp theo.
     

    Các file đính kèm:

Đang tải...