Luận Văn Phương pháp nâng cao chất lượng kết quả trả lời cho hệ thống hỏi đáp danh sách tiếng việt

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Củ Đậu Đậu, 6/4/14.

  1. Củ Đậu Đậu

    Bài viết:
    991
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    Mục lục
    Lời m ở đầu 1
    Chương 1. Giới thiệu hệ thống hỏi đáp danh sách 3
    1.1. Hệ thống hỏi đáp . 3
    1.1.1. Giới thiệu chung 3
    1.1.2. Một số vấn đề cần quan tâm 4
    1.1.3. Các bước xử lý chung 5
    1.1.4. Tiêu chuẩn đánh giá . 6
    1.1.5. Phân loại 7
    1.2. Hệ thống hỏi đáp danh sách . 10
    1.2.1. Giới thiệu 10
    1.2.2. Một số hướng tiếp cận xây dựng hệ thống hỏi đáp danh sách . 10
    1.2.3. Những vấn đề cần giải quy ết khi xây dựng hệ hỏi đáp danh sách . 11
    Chương 2. Các nghiên cứu liên quan . 13
    2.1. Một số hệ thống hỏi đáp danh sách điển hình . 13
    2.1.1. Hệ thống hỏi đáp danh sách FADA . 16
    2.1.2. Hệ thống hỏi đáp Ephyra . 20
    2.2. Nâng cao chất lượng trả lời cho h ệ thống hỏi đáp danh sách 23
    Chương 3: Đề xuất mô hình nâng cao chất lượng câu trả lời cho hệ thống hỏi đáp danh
    sách tiếng Việt . 28
    3.1. Mô hình nâng cao chất lượng câu trả lời cho hệ thống hỏi đáp danh sách tiếng
    Việt 28
    3.2. Pha 1: Hỏi đáp danh sách tiếng Việt 29
    3.2.1. Tìm kiếm câu trả lời dựa vào các mẫu quan hệ thư ợng hạ danh . 29
    3.2.2. Mô hình pha 1: Hệ thống hỏi đáp danh sách 30
    3.3. Pha 2: Mở rộng thực thể 32
    3.3.1. Xây dựng các luật Wrapper 33
    3.3.2. Các phương pháp xếp hạng được sử dụng 35
    3.3.3. Mô hình pha 2: mở rộng thực thể . 35
    Chương 4. Thực nghiệm và đánh giá . 39
    4.1. Thực nghiệm pha hỏi đáp danh sách 39
    4.1.1. Dữ liệu thực nghiệm 39
    4.1.2. Kết quả thực nghiệm 40
    4.2. Thực nghiệm đánh giá kết quả mô hình nâng cao chất lượng câu trả lời cho hệ
    thống hỏi đáp danh sách tiếng việt 42
    Kết luận . 47
    Phụ lục . 49
    Tài liệu tham khảo . 51
    Tóm tắt
    Nhờ khả năng hỗ trợ người dùng trong việc khai thác các tài nguyên trên Internet
    một cách hiệu quả và dễ dàng, hệ thống hỏi đáp nói chung đ ã được quan tâm nghiên
    cứu từ khá lâu, tuy nhiên các dạng hệ thống hỏi đáp đặc biệt, trong đó có hệ thống hỏi
    đáp danh sách vẫn còn đang ở bước đầu phát triển. Hệ thống hỏi đáp danh sách là h ệ
    thống hỏi đáp, nh ận đầu vào là câu hỏi dưới dạng ngôn ngữ tự nhiên và trả về câu trả
    lời dưới dạng một danh sách. Tại Việt Nam, các nghiên cứu về hệ thống hỏi đáp nói
    chung, cũng như về hệ thống hỏi đáp danh sách nói riêng tập trung cho miền dữ liệu
    tiếng Việt còn rất nhiều hạn chế. Một trong những lý do chính là chúng ta còn thiếu
    các công cụ xử lý tiếng Việt, các tài nguyên ngôn ngữ học,
    Khóa luận Phương pháp nâng cao chất lượng kết quả trả lời cho h ệ thống hỏi
    đáp danh sách tiếng Việt tập trung nghiên cứu các phương pháp xây dựng hệ thống hỏi
    đáp danh sách đã được áp dụng trên thế giới cũng như một số phương pháp nâng cao
    chất lư ợng kết quả trả lời cho dạng hệ thống hỏi đáp này. Trên cơ sở các nghiên cứu
    nói trên, kết hợp với việc khảo sát điều kiện thực tế của các công cụ xử lý ngôn ngữ
    tiếng Việt, khóa luận đề xuất mô hình nâng cao chất lượng kết quả trả lời cho hệ thống
    hỏi đáp danh sách tiếng Việt sử dụng lu ật Wrapper và luật ngữ nghĩa. Thực nghiệm
    mô hình cho kết quả khá khả quan, đạt độ chính xác cho câu trả lời chứa 5 kết quả là
    93.87% so với độ chính xác 82.11% của pha hỏi đáp danh sách, đồng thời hứa hẹn
    nhiều tiềm năng nghiên cứu mới.
     
Đang tải...