Luận Văn Bài toán nội suy và mạng nơron rbf

Thảo luận trong 'Toán Học' bắt đầu bởi Bích Tuyền Dương, 19/12/13.

  1. Bích Tuyền Dương

    Bài viết:
    2,590
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỞ ĐẦU


    Nội suy hàm số là một bài toán cổ điển nhưng quan trọng trong giải tích số, nhận dạng mẫu và có nhiều ứng dụng rộng rãi. Bài toán nội suy được mô tả như
    sau: một hàm chưa xác định cụ thể f:D(Rn)Rm nhưng đã xác định được một tập

    mẫu x k , y k N


    trong đó xkRn, ykRm (k =1, ,N) thỏa mãn f(xk)=yk, cần tìm hàm


    g có dạng đủ tốt đã biết thỏa mãn hệ phương trình nội suy g(xk) = yk  k .

    Trường hợp một chiều, bài toán đã được Lagrange (thế kỷ 18) nghiên cứu giải quyết khá đầy đủ nhờ dùng hàm nội suy đa thức. Cùng với sự phát triển các ứng dụng nhờ sử dụng máy tính trong nửa sau thế kỷ 20, sự phát triển của lý thuyết nội suy Spline và sóng nhỏ (wavelet) đã tạo nên cơ sở lý thuyết và thực tiễn khá hoàn thiện cho nội suy hàm một biến.

    Tuy nhiên, đa số các bài toán nội suy trong các ứng dụng thực tiễn lại là bài toán nội suy nhiều biến. Do các khó khăn trong xử lý toán học và nhu cầu ứng dụng trước đây chưa nhiều nên bài toán nội suy nhiều biến mới được quan tâm nhiều trong 50 năm gần đây. Thoạt tiên, người ta phát triển nội suy nhiều biến theo hướng sử dụng đa thức. Các sơ đồ chính được Franke(1982) và Boor(1987) đúc kết (có thể xem [9]). Các sơ đồ này có độ phức tạp cao và kết quả ứng dụng không tốt.

    Phương pháp k- láng giềng gần nhất được Cover và Hart (1967) đề xuất khá sớm về mặt lý thuyết, nhưng chỉ đến khi Duda và Hart (1973) đưa ra tổng quan đầy đủ thì phương pháp này mới được ứng dụng rộng rãi và được phát triển thêm theo hướng hồi qui trọng số địa phương. Cách tiếp cận này cho ra một phương pháp đơn giản dễ sử dụng. Tuy nhiên, nhược điểm cơ bản của nó là chỉ xác định thu hẹp địa phương của hàm nội suy khi biết điểm cần tính giá trị hàm, nên không dùng được cho bài toán cần xác định trước hàm nội suy để nội suy hàm số tại điểm tùy ý.

    Trong 30 năm gần đây. Mạng nơron nhân tạo là cách tiếp cận tốt để khắc phục những nhược điểm trên. Mô hình đầu tiên về mạng nơron nhân tạo được McCelland và Pit (1943) đề xuất để nhận dạng mẫu. Rosenblatt (1953) và Widrow



    (1960) đã xây dựng các perceptron một tầng theo mô hình này, với các luật học sửa lỗi và bình phương tối thiểu. Việc nghiên cứu tiếp theo bị chững lại gần một thập niên do nhận xét của Minsky và Papett(1969) về các nhược điểm của perceptron một tầng. Đến giữa những năm 1980 mạng MLP được nghiên cứu và ứng dụng lại nhờ thuật toán lan truyền ngược sai số (Rumelhart và McCelland 1986; Parker 1985) và trở thành công cụ mạnh để xấp xỉ hàm nhiều biến. Tuy vậy, mạng MLP có thời gian huấn luyện lâu, chất lượng mạng tùy thuộc vào hiệu quả giải bài toán cực trị và đến nay chưa có phương pháp tốt nào để xác định kiến trúc đủ tốt cho mạng. Hơn nữa chủ yếu nó chỉ dùng để xấp xỉ hàm chứ không bảo đảm có thể giải được bài toán nội suy.

    Powell (1987) đề xuất dùng các hàm cơ sở bán kính để giải quyết bài toán nội suy nhiều biến [49]. Kỹ thuật này được Broomhead và Low (1988) giới thiệu như là mạng nơron [16]. Mạng RBF với hàm cơ sở bán kính có thể xem là dạng lai của các phương pháp học dựa trên mẫu (k-lân cận gần nhất và hồi quy trọng số địa phương) và mạng nơron MLP. Như mạng nơron MLP, hàm nội suy của mạng xác định từ dữ liệu huấn luyện sau khi học, chất lượng mạng tùy thuộc vào thuật toán huấn luyện. Mạng RBF giống với các phương pháp học dựa trên mẫu ở chỗ hàm nội suy là tổ hợp tuyến tính của các hàm RBF, các hàm này chỉ có ảnh hưởng địa phương nên có thể xử lý chúng mà không ảnh hưởng nhiều lên toàn miền xác định.

    Mạng RBF chủ yếu dùng để xấp xỉ hàm (mà nội suy là bài toán riêng). Ưu điểm của mạng RBF là thời gian huấn luyện nhanh và luôn đảm bảo hội tụ đến cực trị toàn cục của sai số trung bình phương. Việc xác định tâm, số hàm cơ sở thế nào là tốt vẫn là bài toán mở. Trường hợp số dữ liệu huấn luyện ít (Looney khuyên là nhỏ hơn 200 [38]) thì có thể lấy các mốc nội suy là tâm hàm RBF ở tầng ẩn, mạng này có thể cho nghiệm đúng của hệ phương trình nội suy nên gọi là mạng nội suy RBF. Khi số mốc nhiều, do các hạn chế trong kỹ thuật giải hệ phương trình tuyến tính, nên các phương pháp xây dựng mạng và huấn luyện hiện có vẫn tốn thời gian và hiệu quả chưa cao. Mặc dù so với mạng MLP thì việc huấn luyện chúng vẫn nhanh và dễ hơn nhiều [38]. Đến nay cùng với mạng MLP, mạng RBF tỏ ra là một



    phương pháp hiệu quả và được ứng dụng rộng rãi để nội suy và xấp xỉ hàm nhiều biến ( xem [14,15,30]).

    Thuật toán huấn luyện mạng có vai trò rất quan trọng, nó ảnh hưởng trực tiếp đến tính hội tụ và tổng quát của mạng. Trong những năm gần đây đã có nhiều tác giả đề xuất cải tiến thuật toán huấn luyện mạng RBF. Như N. Benoudjit và các cộng sự (2002) [10] đã cải tiến bằng cách tối ưu tham số độ rộng bán kính. M. Lazaro và cộng sự (2003)[37] đề xuất thuật toán mới để tăng tốc độ hội tụ. K.Z Mao và cộng sự (2005) [41] đưa ra cách chọn số nơron tầng ẩn dựa trên cấu trúc dữ liệu để tăng tính tổng quát của mạng. Ta thấy rằng hầu hết những thuật toán này vẫn xác định trọng số tầng ra theo phương pháp Gradient hoặc biến thể của nó. Thời gian huấn luyện lâu, chưa ước lượng được sai số. Khi số lượng dữ liệu lớn sẽ gặp nhiều khó khăn.

    Một vấn đề có tính thời sự đang đặt ra trong các bài toán điều khiển học và khai thác tri thức từ dữ liệu (Data mining) là cần giải tốt các bài toán nội suy thời gian thực, trong đó việc xác định lại hàm nội suy khi có dữ liệu bổ sung phải hoàn thành kịp thời.

    Nhiệm vụ đặt ra cho tác giả luận án này là nghiên cứu và đề xuất các thuật toán huấn luyện mạng nội suy hiệu quả cho các trường hợp có số mốc nội suy lớn và tìm giải pháp cho bài toán thời gian thực.

    Trong luận án chúng tôi đề xuất một thuật toán lặp hai pha huấn luyện mạng nội suy RBF. Pha thứ nhất xác định tham số độ rộng cho các hàm cơ sở bán kính sao cho các trọng số tầng ra được tìm nhờ phép lặp xác định điểm bất động của một ánh xạ co trong pha sau. Phân tích toán học và kết quả thực nghiệm cho thấy thuật toán có những ưu điểm vượt trội so với những thuật toán thông dụng: dùng được khi số mốc nội suy lớn (hàng chục ngàn mốc), dễ ước lượng sai số huấn luyện, thời gian huấn luyện ngắn, tính tổng quát cũng tốt hơn và dễ song song hoá. Trong trường hợp bài toán nội suy có mốc cách đều, thay cho khoảng cách Euclide, chúng tôi dùng khoảng cách Mahalanobis thích hợp và cải tiến thuật toán hai pha thành



    thuật toán một pha. Phân tích toán học và kết quả thực nghiệm cho thấy thuật toán này cải thiện đáng kể chất lượng mạng so với thuật toán hai pha cả về thời gian huấn luyện và tính tổng quát. Đối với bài toán thời gian thực, đặc biệt là bài toán động, chúng tôi đề xuất kiến trúc mạng địa phương. Mạng này chia miền xác định thành các miền con chứa số mốc nội suy tương đối bằng nhau, nhờ phương pháp phỏng theo thuật toán xây dựng cây k-d quen biết. Sau đó dùng thuật toán huấn luyện hai pha để huấn luyện mạng RBF trên mỗi miền con và ghép chúng lại theo ý tưởng nội suy spline. Phân tích toán học và kết quả thực nghiệm cho thấy chất lượng mạng có nhiều ưu điểm nổi trội.

    Các kết quả trên được công bố trong tạp chí khoa học quốc tế Signal Processing và International Journal of Data Mining, Modelling and Management Science (IJDMMM). Hội nghị quốc tế của IEEE và hội thảo trong nước.

    Ngoài phần kết luận, luận án được tổ chức như sau. Chương 1 giới thiệu những điểm cơ bản của bài toán nội suy hàm số và mạng nơron nhiều tầng truyền tới cần cho nội dung chính của luận án bao gồm: nội suy đa thức cho hàm một biến, các khái niệm và tiếp cận chính đối với bài toán nội suy hàm nhiều biến, giới thiệu tóm tắt về mạng nơron nhân tạo và các mạng nơron nhiều tầng truyền tới. Chương 2 giới thiệu các khái niệm cơ bản về mạng nơron RBF và mạng nội suy với hàm cơ sở bán kính dạng Gauss. Sau đó chúng tôi mô tả các thuật toán thông dụng để huận luyện mạng. Chương 3 trình bày thuật toán hai pha mới (gọi là thuật toán HDH) để huấn luyện mạng nội suy RBF bao gồm cả phân tích toán học và kết quả thực nghiệm. Chương 4 trình bày thuật toán một pha mới áp dụng cho bài toán nội suy với mốc cách đều. Chương 5 trình bày mạng địa phương RBF áp dụng cho bài toán động, hay bài toán thời gian thực. Cuối cùng chúng tôi đưa ra một số kết luận và đề xuất các nghiên cứu tiếp theo.


    MỤC LỤC

    LỜI CẢM ƠN . 3

    LỜI CAM ĐOAN . 4

    DANH MỤC CÁC KÝ HIỆU VÀ TỪ VIẾT TẮT 5

    DANH MỤC CÁC BẢNG . 6

    DANH MỤC CÁC HÌNH VẼ 7

    MỤC LỤC . 9


    MỞ ĐẦU . 12


    CHƯƠNG 1. NỘI SUY HÀM SỐ VÀ MẠNG NƠRON 16
    1.1. Nội suy hàm số 17
    1.1.1. Bài toán nội suy tổng quát . 17
    1.1.2. Nội suy hàm một biến . 18
    1.1.3. Nội suy hàm nhiều biến . 24
    1.2. Giới thiệu về mạng nơron nhân tạo 27
    1.2.1. Mạng nơron sinh học . 28
    1.2.2. Mạng nơron nhân tạo . 30
    1.2.3. Mạng perceptron nhiều tầng MLP (Multi-Layer Perceptrons) . 37


    CHƯƠNG 2. MẠNG NƠRON RBF 43
    2.1. Hàm cơ sở bán kính RBF và bài toán nội suy 44
    2.1.1. Bài toán nội suy nhiều biến với cách tiếp cận RBF 44
    2.1.2. Kỹ thuật hàm cơ sở bán kính . 46
    2.2. Kiến trúc mạng RBF 48
    2.3. Huấn luyện mạng RBF 49
    2.3.1. Phương pháp huấn luyện một pha . 49
    2.3.2. Phương pháp huấn luyện hai pha 53
    2.3.3. Phương pháp huấn luyện đầy đủ . 54
    2.3.4. Nhận xét chung các thuật toán huấn luyện 57
    2.4. So sánh mạng RBF với mạng MLP 57
    2.5. Kết luận của chương 58





    CHƯƠNG 3. THUẬT TOÁN MỚI HUẤN LUYỆN MẠNG NỘI SUY RBF . 59
    3.1. Nền tảng lý thuyết của thuật toán . 59
    3.1.1. Các phương pháp lặp đơn giải hệ phương trình tuyến tính 59
    3.1.2. Tóm lược về mạng nội suy RBF với hàm RBF dạng Gauss . 61
    3.2. Thuật toán lặp hai pha huấn luyện mạng nội suy RBF 64
    3.2.1. Định lý cơ bản 64
    3.2.2. Mô tả thuật toán 65
    3.2.3. Đặc tính hội tụ 68
    3.2.4. Độ phức tạp của thuật toán . 69
    3.3. Thử nghiệm thuật toán 70
    3.3.1. Tốc độ hội tụ 71
    3.3.2. Tính tổng quát 73
    3.4. So sánh với phương pháp Gradient 77
    3.4.1. So sánh thời gian và độ chính xác của những điểm huấn luyện 77
    3.4.2. So sánh tính tổng quát 79
    3.5. Nhận xét chung về thuật toán lặp hai pha HDH . 81


    CHƯƠNG 4. BÀI TOÁN NỘI SUY VỚI MỐC CÁCH ĐỀU . 84
    4.1. Biểu diễn bài toán . 85
    4.2. Định lý cơ sở và mô tả thuật toán . 87
    4.2.1. Định lý cơ sở . 87
    4.2.2. Mô tả thuật toán một pha . 88
    4.3. Thực nghiệm . 89
    4.3.1. So sánh thời gian huấn luyện 90
    4.3.2. So sánh sai số huấn luyện 91
    4.3.3. So sánh tính tổng quát . 94
    4.4. Nhận xét chung về thuật toán một pha mới . 96


    CHƯƠNG 5. MẠNG RBF ĐỊA PHƯƠNG . 97
    5.1. Giới thiệu 97
    5.2. Mạng RBF địa phương 99
    5.2.1. Kiến trúc và thủ tục xây dựng mạng 99
    5.2.2. Thuật toán phân cụm nhờ cây k-d 101
    5.2.3. Độ phức tạp thuật toán huấn luyện mạng . 103





    5.3. Tính xấp xỉ tổng quát của mạng nội suy RBF địa phương . 104
    5.4. Bài toán động 106
    5.5. Kết quả thực nghiệm 106
    5.5.1. So sánh thời gian và sai số huấn luyện . 107
    5.5.2 Tính tổng quát . 111
    5.5.3. Huấn luyện tăng cường ở bài toán động 115
    5.6. Nhận xét chung . 117


    KẾT LUẬN . 118


    DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA TÁC GIẢ 120


    TÀI LIỆU THAM KHẢO . 121
     

    Các file đính kèm:

Đang tải...