Luận Văn Một số phương pháp học máy cho bài toán gán nhãn từ loại tiếng việt

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Củ Đậu Đậu, 6/4/14.

  1. Củ Đậu Đậu

    Bài viết:
    991
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    Mục lục
    MỞ ĐẦU .1
    Chương 1. KHÁI QUÁT VỀBÀI TOÁN GÁN NHÃN TỪLOẠI .3
    1.1. Khái niệm và vịtrí của bài toán gán nhãn từloại trong NLP 3
    1.1.1. Khái niệm vềbài toán gán nhãn từloại 3
    1.1.2. Vịtrí và ứng dụng của bài toán gán nhãn từloại trong NLP 4
    1.2. Các khó khăn của bài toán gán nhãn từloại .6
    1.3. Tập nhãn từloại 7
    1.3.1. Nguyên tắc xây dựng tập nhãn từloại và một sốtập nhãn từloại của các
    ngôn ngữtrên thếgiới .7
    1.3.2. Một sốtập nhãn từloại hiện được đềxuất ởViệt Nam 10
    Chương 2. CÁC HƯỚNG TIẾP CẬN BÀI TOÁN GÁN NHÃN TỪLOẠI .13
    2.1. Gán nhãn bằng phương pháp dựa trên hệluật .13
    2.2. Các phương pháp dựa vào học máy .15
    2.3. Phương pháp lai 19
    2.4. Các nghiên cứu liên quan tại Việt Nam .21
    2.4.1. Các nghiên cứu dựa trên phương pháp hệluật .21
    2.4.2. Các nghiên cứu dựa trên phương pháp học máy 22
    2.4.3. Các nghiên cứu dựa trên phương pháp lai 22
    Chương 3. BA MÔ HÌNH HỌC MÁY ÁP DỤNG CHO BÀI TOÁN GÁN NHÃN
    TỪLOẠI TIẾNG VIỆT .25
    3.1. Mô hình cực đại hóa Entropy .25
    3.1.1. Khái niệm MEM .25
    3.1.2. Nguyên lý cực đại hóa Entropy 26
    3.1.3. Mô hình xác suất .26
    3.1.4. Hạn chếcủa mô hình MEM 27
    3.2. Mô hình trường ngẫu nhiên điều kiện 28
    3.2.1. Khái niệm CRF .28
    3.2.2. Hàm tiềm năng của các mô hình CRF 30
    3.2.3. Thuật toán gán nhãn cho dữliệu dạng chuỗi 31
    3.2.4. Ước lượng tham sốcho các mô hình CRF 33
    3.3. Mô hình máy véc tơhỗtrợ .33
    3.3.1. Khái niệm và cơsởcủa phương pháp SVM .33
    3.3.2. Áp dụng phương pháp SVM cho bài toán gán nhãn từloại .36
    3.3.3. Huấn luyện SVM 37
    Chương 4. THỰC NGHIỆM ÁP DỤNG BA MÔ HÌNH HỌC MÁY CHO BÀI
    TOÁN GÁN NHÃN TỪLOẠI TIẾNG VIỆT VÀ ĐÁNH GIÁ KẾT QUẢ 39
    4.1. Mô tảthực nghiệm .39
    4.1.1. Phần cứng 39
    4.1.2. Phần mềm 39
    4.1.3. Dữliệu thực nghiệm và tập nhãn từloại .40
    4.2. Mô tảtập đặc trưng dựa trên mức từvà mức hình vị .43
    4.2.1. Các đặc trưng dựa vào thông tin từvựng và thông tin từloại 43
    4.2.2. Mẫu ngữcảnh dạng biểu thức chính quy 45
    4.3. Hệthống gán nhãn từloại cho tiếng Việt 45
    4.3.1. Gán nhãn từloại dựa vào thông tin vềtừ 47
    4.3.2. Gán nhãn từloại dựa vào thông tin hình vị 47
    4.4. Phương pháp thực nghiệm và các tham số đánh giá thực nghiệm .48
    4.4.1. Phương pháp thực nghiệm 48
    4.4.2. Các tham số đánh giá thực nghiệm .48
    4.5. Kết quảthực nghiệm 48
    4.5.1. Kết quảcủa năm lần thực nghiệm 48
    4.5.2. Tổng hợp kết quả 51
    4.5.3. Đánh giá và thảo luận .53
    KẾT LUẬN 55
     
Đang tải...