Đồ Án Tối ưu hóa backup dữ liệu trong mạng ngang hàng có cấu trúc

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÊN ĐỀ TÀI: Tối ưu hóa backup dữ liệu trong mạng ngang hàng có cấu trúc
    Information
    [TABLE]
    [TR]
    [TD="width: 5%"][/TD]
    [TD="width: 90%"]Mục lục
    Mở đầu 1
    Chương 1. Tổng quan 3
    1.1 Tổng quan về việc backup dữ liệu 3
    1.1.1 Giải thuật phân tán thông tin IDA 4
    1.2 Mạng ngang hàng 6
    1.2.1 Định nghĩa 6
    1.2.2 Ưu điểm và nhược điểm của mạng ngang hàng 7
    1.2.3 Mạng ngang hàng không có cấu trúc 8
    1.2.4 Mạng ngang hàng có cấu trúc (Structured) 9
    1.2.5 Chord 10
    1.3 Backup dữ liệu trong mạng ngang hàng 14
    1.3.1 Sự cần thiết của việc backup dữ liệu trong mạng ngang hàng 14
    1.3.2 Một số giải pháp backup dữ liệu trong mạng ngang hàng 15
    Chương 2 Tối ưu hóa backup dữ liệu trên mạng ngang hàng có cấu trúc 16
    2.1 Vấn đề cần giải quyết 16
    2.2 Ý tưởng 17
    2.3 Giải pháp 17
    2.3.1 Backup dữ liệu 18
    2.3.2 Khôi phục dữ liệu 19
    2.4 Đánh giá giải pháp 22
    Chương 3 Mô phỏng và đánh giá 23
    3.1 Chương trình mô phỏng 23
    3.1.1 Dữ liệu 23
    3.1.2 Các đối tượng 24
    3.1.3 Thực thi 26
    3.2 Kết quả và đánh giá 29
    3.2.1 Khả năng tồn tại của dữ liệu 29
    3.2.2 Sự ra vào của các nút trong mạng 30
    3.2.3 Bảo mật 31
    Chương 4. Kết luận 32
    4.1 Kết luận 32
    4.2 Hướng phát triển tiếp theo của đề tài 32
    Tài liệu tham khảo 34
    Phụ lục A 35

    Danh mục hình ảnh
    Hình 1: Giải thuật phân tán thông tin IDA 6
    Hình 2 : Mô hình mạng ngang hàng 7
    Hình 3 : Mô hình máy khách , máy chủ 8
    Hình 4 : Cơ chế của bảng băm phân tán DHT 11
    Hình 5 :Mạng ngang hàng Chord 12
    Hình 6 : Mạng Chord có 3 nút 14
    Hình 7 : Lưu trữ khóa trên mạng Chord 15
    Hình 8 : Cơ chế backup dữ liệu – phân chia các mảnh backup ra toàn mạng 20
    Hình 9 : Tỉ lệ dữ liệu có thể phục hồi 32
    Hình 10 : Độ ra vào của các nút churn ảnh hưởng đến tỉ lệ dữ liệu có thể phục hồi .33

    Mở đầu
    Việc backup dữ liệu là điều cần có trong mỗi một hệ thống , đặc biệt là các hệ thống lưu trữ,các hệ thống này có hệ thống mạng.Ngày nay khi Internet càng ngày càng phát triển , sự trao đổi thông tin càng nhiều , việc lưu trữ dữ liệu lại càng trở nên cần thiết.Do đó khóa luận này hướng tới nghiên cứu sâu hơn về cơ chế backup dữ liệu trong một hệ thống lưu trữ , một hệ thống mạng.
    Trong những năm gần đây, công nghệ ngang hàng (peer-to-peer - P2P) hay mạng ngang hàng đã trở nên phổ biến trong các nghiên cứu về lĩnh vực Internet. So với các mô hình mạng khác, mạng ngang hàng có nhiều ưu điểm như khả năng mở rộng, không tồn tại điểm chết, khả năng của hệ thống tỉ lệ với số lượng máy tham gia, Tất cả những đặc điểm trên đã tạo lên công nghệ P2P và các ứng dụng ngang hàng liên quan. Nhiều ứng dụng lớn đã và đang được xây dựng trên mạng ngang hàng như FreeNet, Napster, Gnutella, BitTorrent, eMule .Trong các loại mạng ngang hàng , mạng ngang hang có cấu trúc hiện nay được sử dụng một cách phổ biến bởi những ưu điểm của nó.
    Mạng ngang hàng có cấu trúc sử dụng giải thuật DHT (Distributed Hash Table – bảng băm phân tán) tạo nên một mạng phủ (overlay) trên mạng liên kết vật lý. Giải thuật này định nghĩa liên kết giữa các nút mạng trong mạng phủ theo một cấu trúc cụ thể, đồng thời xác định chặt chẽ mỗi nút mạng sẽ chịu trách nhiệm đối với một phần dữ liệu chia sẻ trong mạng. Mỗi nút đều được kết nối với một tập các nút khác gọi là tập nút láng giềng. Chord là một giao thức của mạng ngang hàng có cấu trúc với không gian địa chỉ một chiều dạng vòng. Mạng ngang hàng cấu trúc Chord thể hiện nhiều ưu điểm như khả năng mở rộng, cân bằng tải, định tuyến, . Giống như những giao thức trên mạng có cấu trúc khác, mỗi nút trong Chord xây dựng một bảng định tuyến giúp cho việc tìm kiếm thông tin giảm từ O(N) với N là số lượng tối đa nút trong mạng, xuống còn O(log2N).
    Trong mạng ngang hàng có cấu trúc nói chung và Chord nói riêng, việc backup dữ liệu được thực hiện thông qua giải pháp sao lưu dữ liệu đơn giản là sử dụng các bản sao của dữ liệu cần backup và các bản sao này được lưu tại các nút gần nút chứa dữ liệu cần backup.Cơ chế này chưa có khả năng khôi phục lại các mảnh backup bị mất đi do quá trình tham gia và rời đi của các nút trên mạng.
    Khóa luận này sẽ đề xuất một phương pháp mới để giải quyết hai vấn đề nêu trên xảy ra với mạng ngang hàng có cấu trúc nói chung và cấu trúc Chord nói riêng. Bằng việc sử dụng thuật toán mã hóa IDAs(Information Dispersal Algorithms) dữ liệu ban đầu sẽ được mã hóa và phân chia thằng m mảnh và chỉ cần n mảnh sẽ có khả năng khôi phục lại dữ liệu ban đầu. Sau đó m mảnh này sẽ được phân chia trên mạng một cách hợp lí . Với giải pháp này , chúng ta có thêm một cơ chế để khôi phục lại những mảnh backup của dữ liệu khi các nút chứa chúng rời khỏi mạng, và hơn nữa dữ liệu ban đầu đã được mã hóa cho nên dữ liệu đã có tính bảo mật.
    Để đánh giá hiệu quả của giải pháp đề xuất, khóa luận xây dựng một chương trình mô phỏng giả lập mạng Internet và đo thời gian trễ truyền thông báo giữa các nút trong mạng Chord. Các kết quả thử nghiệm chứng minh cho khả năng của giải pháp đề xuất trong việc giảm sự tăng dung lượng của dữ liệu cần backup trên mạng và sử dụng tài nguyên mạng hợp lí hơn.
    Khóa luận được chia thành bốn chương:
    Chương 1: Giới thiệu tổng quan về backup dữ liệu và tổng quan về mạng ngang hàng.
    Chương 2: Đề xuất giải pháp tối ưu hóa việc backup dữ liệu trong mạng ngang hàng có cấu trúc , ưu nhược điểm của giải pháp
    Chương 3: Xây dựng chương trình mô phỏng, các bước thực thi chương trình và những đánh giá từ kết quả đạt được.
    Chương 4: Kết luận, những vấn đề nảy sinh và hướng đi tiếp theo.[/TD]
    [/TR]
    [/TABLE]




     
Đang tải...