Luận Văn Đề xuất kết hợp đột biến BLASED với đột biến UNVIASED

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Bích Tuyền Dương, 25/1/13.

  1. Bích Tuyền Dương

    Bài viết:
    2,590
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỞ ĐẦU
    Dự báo thuỷ văn là công việc dự báo trước một cách có khoa học về trạng thái biến đổi các yếu tố thuỷ văn trong tương lai. Đây là một ngành khoa học có nhiệm vụ báo trước sự xuất hiện các yếu tố thủy văn trên cơ sở nghiên cứu các quy luật của chúng. Hiện nay có rất nhiều bài toán dự báo thuỷ văn được đặt ra như dự báo dòng chảy, dự báo mực nước, dự báo lưu lượng nước trên sông, dự báo lũ, và dự báo các hiện tượng khác trên sông ngòi và hồ . [3].
    Tùy vào quan điểm phân chia mà tồn tại một số phân loại dự báo thủy văn. Chẳng hạn, theo yêu cầu phục vụ thì có các loại dự báo như dự báo cho nông nghiệp, dự báo cho giao thông, dự báo cho chống lũ lụt; còn theo đối tượng dự báo thì có các loại dự báo mực nước, dự báo lưu lượng, dự báo bùn cát Tuy nhiên, phân loại dự báo theo thời gian là một phân loại điển hình với các loại dự báo là ngắn hạn, trung hạn, dài hạn và siêu dài hạn. Dự báo ngắn hạn với khoảng thời gian dự báo từ một đến ba ngày. Dự báo trung hạn với khoảng thời gian dự báo dài hơn dự báo ngắn hạn nhưng tối đa không quá mười ngày. Dự báo dài hạn có khoảng thời gian dự báo từ hơn mười ngày đến một năm. Khi thời gian dự báo lớn hơn một năm đó là dự báo siêu dài hạn.
    Thuỷ văn là một quá trình tự nhiên phức tạp, chịu tác động của rất nhiều yếu tố. Tính biến động của các yếu tố này phụ thuộc vào cả không gian và thời gian nên gây khó khăn rất lớn cho quá trình dự báo, tìm ra được mối liên quan giữa các yếu tố. Thêm vào đó, do thiếu các trạm quan trắc cần thiết và thiếu sự kết hợp giữa các ngành liên quan cho nên dữ liệu quan trắc thực tế thường là không đầy đủ, không mang tính chất đại diện.
    Yêu cầu chung mà tất cả các bài toán dự bảo thủy văn cần phải giải quyết là làm cách nào để có thể phân tích và sử dụng chuỗi dữ liệu có trong quá khứ để dự đoán được giá trị tương lai. Hiện nay, có rất nhiều phương pháp dự báo đã được đưa ra dựa trên mô hình vật lý và mô hình toán học. Trong nhiều trường hợp, kết quả nghiên cứu dự báo thủy văn theo các mô hình nói trên đã đạt được một số thành công đáng ghi nhận [1]. Tuy nhiên, vấn đề tìm kiếm phương pháp đủ tốt, đáp ứng các yêu cầu thực tế giải quyết bài toán dự báo thuỷ văn vẫn là nội dung nghiên cứu thời sự hiện nay. Ở trong nước, tại Viện Khí tượng Thủy văn có hàng chục công trình nghiên cứu liên quan tới dự báo thủy văn, đặc biệt có tới 4 đề tài cấp Nhà nước [3]. Trên thế giới, việc áp dụng các phương pháp của khai phá dữ liệu (đặc biệt là các phương pháp học máy mạng neuron và kết hợp với thuật toán gene) vào dự báo thủy văn đã trở thành nội dung nghiên cứu dự báo thủy văn thời sự trong thời gian gần đây [5-7,12-14, 19]. Khai phá dữ liệu là một trong những lĩnh vực nghiên cứu của khoa học máy tính hiện nay đang được phát triển rất mạnh mẽ. Nó kết hợp giữa học máy, công nghệ cơ sở dữ liệu và một số chuyên ngành khác để tìm ra những tri thức, bao gồm cả các thông tin dự báo, từ những cơ sở dữ liệu lớn.
    Luận văn này tập trung khảo sát một số phương pháp học máy tiên tiến, thực hiện việc kết hợp giữa phương pháp học máy mạng neuron [5-7,9-20] với thuật toán gene [4,8,21] và ứng dụng vào bài toán dự báo lưu lượng nước đến hồ Hòa Bình. Luận văn tập trung khảo sát một số công trình nghiên cứu liên quan trên thế giới [5-7, 12-14, 19]. Demetris F. Lekkas [12] cung cấp một khung nhìn phương pháp luận về các
    phương pháp dự báo dòng chảy. Ibrahim Can cùng các đồng tác giả [5] và Cristiane Medina Finzi Quintao cùng các đồng tác giả [19] công bố một số kết quả nghiên cứu cập nhật về dự báo dòng chảy của một số dòng sông tại Thổ Nhĩ Kỳ và Brazin. Đặc biệt, các công trình này đã cung cấp cách thức đánh giá kết quả thực nghiệm các phương pháp dự báo thủy văn được đề cập. Các công trình nghiên cứu khác về phương pháp mạng nơron, thuật toán gene và kết hợp chúng được luận văn sử dụng để làm nền tảng khoa học cho các nghiên cứu phát triển. Luận văn đã hoàn thành phần mềm thử nghiệm và tiến hành thực nghiệm trên bộ dữ liệu được thu thập tin cậy thông qua hệ thống đo đạc thủy văn dọc sông Đà, nguồn nước chính chảy vào hồ Hòa Bình. Đóng góp khoa học của luận văn là một báo cáo khoa học đã được trình bày tại Hội thảo khoa học quốc gia Một số vấn đề chọn lọc về Công nghệ thông tin và Truyền thông lần thứ X được tổ chức tại Đại Lải vào tháng 9/2007 với kết quả thực hiện cho dự báo nước trước 10 ngày có chỉ số R2 khá cao, lên tới 0.8737 [2]. Cải tiến do luận văn đề xuất kết hợp đột biến BIASED với đột biến UNBIASED trong đó đột biến BIASED sẽ đóng vai trò chủ đạo nhằm vượt ra khỏi cực trị địa phương (D. Montana and L. Davis [16]) là có ý nghĩa. Các kết quả thực nghiệm cải tiến trên cho thấy mọi tiêu chí đánh giá đều tốt lên, chỉ số R2 nâng lên 0.8742 (so với 0.8737 [2]), sai số quân phương là 72.28 m3/s (so với 76.10 m3/s [2]).
    Nội dung chính của luận văn được tổ chức thành 3 chương có nội dung được mô tả như dưới đây.
    Chương I. Mạng nơ-ron nhân tạo truyền thẳng nhiều lớp. Chương này trình bày những lý thuyết cơ bản về mạng nơ-ron nhân tạo, tập trung nghiên cứu mạng truyền thẳng nhiều lớp. Chương này cung cấp một cách nhìn tổng quát nhất, và những vấn đề về quá trình huấn luyện mạng và thuật toán học của mạng mà tập trung chủ yếu vào thuật toán lan truyền ngược sai số.
    Chương II. Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá trọng số mạng nơ-ron nhân tạo. Chương này trình bày về lý thuyết của giải thuật di truyền và khả năng ứng dụng của giải thuật này kết hợp với thuật toán lan truyền ngược sai số nhằm đạt tới một kết quả tốt hơn đối với bài toán tối ưu trọng số mạng nơ-ron nhân tạo.
    Chương III. Ứng dụng mạng nơ ron nhân tạo vào việc dự báo lưu lượng nước đến hồ Hoà Bình. Chương này giới thiệu sơ lược về bộ dữ liệu sử dụng, các phương pháp đánh giá kết quả dự báo và tập trung vào thử nghiệm các phương pháp để dự báo lưu lượng nước đến hồ Hoà Bình trước mười ngày, từ đó đánh giá được khả năng ứng dụng các phương pháp học máy đã trình bày trong dự báo chuỗi thời gian, cụ thể là dự báo lưu lượng.
    Phần kết luận tổng kết những kết quả đã đạt được của luận văn và hướng phát triển nghiên cứu tiếp theo. Phần phụ lục giới thiệu về phần mềm dự báo và hướng dẫn cách thức cơ bản sử dụng phần mềm.

    Mục lục
    Lời cảm ơn . i
    Mục lục 4
    Danh sách hình vẽ 7
    Danh sách bảng biểu . 9
    MỞ ĐẦU 10
    CHƯƠNG 1 - MẠNG NƠ-RON NHÂN TẠO TRUYỀN THẲNG NHIỀU
    LỚP 13
    1.1 Giới thiệu về mạng nơ-ron nhân tạo 13
    1.1.1 Khái niệm cơ bản 13
    1.1.2 Mô hình mạng nơ-ron nhân tạo 15
    1.1.3 Khả năng ứng dụng của mạng nơ-ron nhân tạo . 18
    1.2 Mạng nơ-ron lan truyền thẳng nhiều lớp . 19
    1.2.1 Mạng perceptron một lớp . 19
    1.2.2 Mạng perceptron nhiều lớp 22
    1.2.3 Một số vấn đề cần chú ý khi sử dụng mạng MLP 30
    Kết luận chương 33
    CHƯƠNG 2 - KẾT HỢP GIẢI THUẬT DI TRUYỀN VỚI GIẢI THUẬT
    LAN TRUYỀN NGƯỢC SAI SỐ ĐỂ TỐI ƯU HOÁ TRỌNG SỐ
    MẠNG NƠ-RON NHÂN TẠO . 34
    2.1 Giới thiệu giải thuật di truyền . 34
    2.1.1 Giới thiệu 34
    2.1.2 Tư tưởng chính của giải thuật di truyền . 35
    2.1.3 Giải thuật di truyền đơn giản 37
    2.1 Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số của mạng
    nơ-ron nhân tạo . 41
    2.2.1 Xây dựng hàm giá 42
    2.2.2 Mã hoá nhiễm sắc thể . 42
    2.2.3 Lai ghép 43
    5
    2.2.4 Đột biến 44
    2.2.5 Thử nghiệm 45
    2.2.6 Giải thuật đề xuất . 49
    2.3 Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu
    hoá trọng số mạng nơ-ron nhân tạo 51
    2.3.1 Đặt vấn đề . 51
    2.3.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số . 53
    Kết luận chương 55
    CHƯƠNG 3 - ỨNG DỤNG MẠNG NƠ RON NHÂN TẠO VÀO VIỆC DỰ
    BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ HOÀ BÌNH 57
    3.1 Điều kiện địa lý, tự nhiên, khí tượng thuỷ văn lưu vực sông Đà 57
    3.1.1 Vị trí địa lý 57
    3.1.2 Địa hình 58
    3.1.3 Điều kiện địa chất . 58
    3.1.4 Điều kiện thổ nhưỡng . 58
    3.1.5 Đặc điểm khí hậu 58
    3.1.6 Đặc điểm chế độ thuỷ văn 59
    3.1.7 Thống kê dữ liệu thu thập được 63
    3.2 Các phương pháp dự báo . 64
    3.2.1 Dựa trên mô hình vật lý 64
    3.2.2 Dựa trên mô hình toán 66
    3.2.3 Hướng tiếp cận mới 67
    3.3 Một số chỉ tiêu đánh giá kết quả dự báo 67
    3.4 Dự báo lưu lượng đến hồ Hoà Bình trước 10 ngày . 68
    3.4.1 Phần mềm xây dựng . 68
    3.4.2 Số liệu sử dụng . 69
    3.4.3 Các tham số 70
    3.4.4 Các phương án dự báo 70
    Kết luận chương 75
    KẾT LUẬN 76
    TÀI LIỆU THAM KHẢO 78
    PHỤ LỤC 80
    Phụ lục A - Giới thiệu về phần mềm dự báo . 80
    Phụ lục B - Mẫu học thử nghiệm so sánh các phương pháp lai ghép và đột
    biến 85
    Phụ lục C - Số liệu học và kiểm tra trong bài toán dự báo lưu lượng nước đến
    hồ Hoà Bình 86
     
Đang tải...