Thạc Sĩ Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong tóm tắt văn bản

Thảo luận trong 'Chưa Phân Loại' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    167
    Điểm thành tích:
    0
    Xu:
    0Xu
    Tóm tắt nội dung

    Hiện nay, tóm tắt Văn bản là một bài toán có tính ứng dụng thực tiễn cao. Tóm tắt
    Văn bản nhận được sự nhiều sự quan tâm nghiên cứu của nhiều nhà khoa học, của các hội
    nghị Quốc tế như hội nghị DUC (Document Understanding Conference), hội nghị
    Coling/ACL (Computational Linguistics/Association for Computational Linguistics), của
    các trung tâm nghiên cứu như IBM, Microsoft
    Khóa luận với đề tài “Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong bài
    toán tóm tắt văn bản” tập trung nghiên cứu vào các phương pháp tóm tắt văn bản; độ
    tương đồng câu và các phương pháp để tính toán độ tương đồng câu. Từ đó, trên cơ sở về
    một số kết quả nghiên cứu đã có về độ đo tương đồng câu và về Hidden Topic, khóa luận
    đề xuất một mô hình tóm tắt Văn bản đơn có sử dụng Hidden Topic để tính toán độ tương
    đồng ngữ nghĩa giữa hai câu.

    Mục lục
    Tóm tắt nội dung . 4
    Mục lục . 5
    Danh sách bảng 7
    Danh sách hình vẽ 8
    Bảng ký hiệu và từ viết tắt 9
    Mở đầu 10
    Chương 1. Tổng quan về tóm tắt Văn bản và độ tương đồng câu . 12
    1.1. Đặt vấn đề . .12
    1.2. Nền tảng kiến thức 13
    1.2.1. Data Mining .13
    1.2.2. Text Mining .13
    1.2.3. Web Mining .14
    1.3. Tóm tắt văn bản . 15
    1.4. Độ tương đồng giữa hai câu 16
    Chương 2. Bài toán tóm tắt Văn bản và một số phương pháp tóm tắt Văn bản 18
    2.1. Bài toán tóm tắt văn bản . .18
    2.1.1. Định nghĩa tóm tắt .18
    2.1.2. Phân loại tóm tắt văn bản . 19
    2.1.3. Tóm tắt Văn bản đơn 21
    2.2. Các phương pháp tóm tắt Văn bản đơn . .21
    2.2.1. Phương pháp Word frequencies . 22
    2.2.2. Phương pháp của Edmundson .23
    2.2.3. Tóm tắt Văn bản tự động sử dụng trích chọn câu hai bước 26
    6
    Chương 3. Độ tương đồng câu và phương pháp tính độ tương đồng câu 32
    3.1. Độ tương đồng . 32
    3.2. Độ tương đồng câu 32
    3.3. Phương pháp để đo độ tương đồng câu .33
    3.3.1. Phương pháp tính độ tương đồng câu sử dụng WordNet corpus .33
    3.3.2. Phương pháp tính độ tương đồng câu sử dụng Hidden Topic .39
    Chương 4. Đề xuất mô hình tóm tắt và kết quả thực nghiệm . 46
    4.1. Đề xuất mô hình tóm tắt . .46
    4.2. Thiết kế mô hình thử nghiệm 47
    4.3. Kết quả thực nghiệm .47
    Kết luận và hướng Phát triển của khóa luận 50
    Tài liệu tham khảo . 51
     

    Các file đính kèm:

    • 9-.pdf
      Kích thước:
      657.5 KB
      Xem:
      0
Đang tải...