Thạc Sĩ Trích rút mối quan hệ ngữ nghĩa và áp dụng cho hệ thống hỏi đáp tự động tiếng việt

Thảo luận trong 'Chưa Phân Loại' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    Tóm tắt
    Với sự ra đời và Phát triển ngày càng mạnh mẽ trên World Wide Web đặt ra thách
    thức đòi hỏi việc khai thác thông tin một cách hiệu quả. Mặc dù chất lượng của các máy
    tìm kiếm đã được cải thiện nhưng kết quả trả về chỉ là những tài liệu có liên quan. Vì thế,
    hệ thống hỏi đáp ra đời là một nhu cầu cấp thiết, cung cấp cho người dùng câu trả lời
    ngắn gọn và chính xác nhất. Đây là một bài toán khó đối với hầu hết các Ngôn ngữ nói
    chung trên thế giới nói chung cũng như hệ thống tiếng Việt nói riêng.
    Khoá luận tập trung vào nghiên cứu các phương pháp Xây dựng hệ thống hỏi đáp
    và đề xuất đề xuất mô hình cho hệ thông hỏi đáp tự động cho tiếng Việt dựa vào phương
    pháp trích rút Quan hệ ngữ nghĩa bằng cách kết hợp hai phương pháp Snowball của
    Agichtein, Gravano [1] và phương pháp trích rút mối Quan hệ sử dụng sử máy tìm kiếm
    của Ravichandran, Hovy [25] cho tập Văn bản tiếng Việt. Thực nghiệm ban đầu của mô
    hình cho thấy hệ thống có thể trả lời chính xác được 89,1% câu hỏi người dùng đưa vào
    và khả năng đưa ra câu trả lời là 91,4%. Dựa vào kết quả trên, chúng tôi nhận thấy
    phương pháp trích rút mối Quan hệ ngữ nghĩa được triển khai cho Ngôn ngữ tiếng Việt là
    khả quan, phục vụ tốt cho việc Xây dựng hệ thống hỏi đáp.

    Mục lục
    Mở đầu 1
    Chương 1. Khái quát bài toán trích rút mối
    Quan hệ ngữ nghĩa . . 3
    1.1 Quan hệ ngữ nghĩa . 3
    1.2 Các loại Quan hệ ngữ nghĩa . 3
    1.3 Bài toán trích rút mối Quan hệ ngữ nghĩa 7
    1.4 Hệ thống hỏi đáp dựa trên trích rút Quan hệ ngữ nghĩa . 9
    1.4.1 Khái niệm hệ thống hỏi đáp . 9
    1.4.2 Một số vấn đề quan tâm khi thiết kế hệ thống hỏi đáp 10
    1.4.3 Một số hệ thống hỏi đáp tiêu biểu 10
    1.5 Tóm tắt chương một 12
    Chương 2. Các phương pháp trích rút mẫu Quan hệ ngữ nghĩa . 13
    2.1 Phương pháp DIRPE . 13
    2.2 Phương pháp Snowball 16
    2.3 Phương pháp trích xuất mẫu tự động sử dụng máy tìm kiếm . 18
    2.4 Phương pháp KnowItAll . 19
    2.5 Phương pháp TextRunner 22
    2.6 Nhận xét . 23
    2.7 Tóm tắt chương hai 25
    Chương 3. Mô hình hệ thống hỏi đáp tiếng Việt sử dụng trích rút Quan hệ ngữ nghĩa.
    26

    3.1 Mô hình trích rút mẫu Quan hệ ngữ nghĩa . 26
    3.2 Phương pháp sinh tự động thực thể từ tập dữ liệu Web lớn 28
    iv
    3.3 Mô hình hệ thống hỏi đáp tiếng Việt. 30
    3.4 Tổng kết chương ba 33
    Chương 4: Thực nghiệm và đánh giá 34
    4.1 Môi trường và các công cụ sử dụng cho thực nghiệm 34
    4.2 Xây dựng tập dữ liệu . 35
    4.3 Thực nghiệm 37
    4.3.1 Sinh tự động tập thực thể từ dữ liệu web . 37
    4.3.2 Thực nghiệm trích rút mẫu Quan hệ ngữ nghĩa trong Văn bản tiếng Việt 40
    4.3.3 Thực nghiệm phân tích câu hỏi và trích xuất câu trả lời cho hệ thống hỏi
    đáp tiếng Việt sử dụng phương pháp trích rút mối Quan hệ ngữ nghĩa. . 42
    Kết luận . 47
    Tài liệu tham khảo
    . 48
     

    Các file đính kèm:

    • 13-.pdf
      Kích thước:
      675.3 KB
      Xem:
      0
Đang tải...