Luận Văn Trích chọn quan hệ thực thể trên wikipedia tiếng việt dựa vào cây phân tích cú pháp

Thảo luận trong 'Ngôn Ngữ Học' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    Lời cảm ơn . i

    Tóm tắt ii

    Mục lục . iii

    Danh sách các bảng v

    Danh sách các hình vẽ . vi

    Danh sách các từ viết tắt . vii

    Mở đầu 1

    Chương 1. Khái quát về bài toán trích chọn ngữ nghĩa 3

    1.1. Quan hệ ngữ nghĩa 3

    1.1.1. Khái niệm . 3

    1.1.2. Phân loại quan hệ ngữ nghĩa . 3

    1.2. Bài toán trích chọn quan hệ ngữ nghĩa 7

    1.3. Ứng dụng 8

    Tóm tắt chương một 9

    Chương 2. Một số hướng tiếp cận trích chọn quan hệ ngữ nghĩa . 10

    2.1. Học không giám sát trích chọn quan hệ . 10

    2.2. Học có giám sát trích chọn quan hệ . 13

    2.2.1. Phương pháp Link grammar 13

    2.2.2. Phương pháp trích chọn dựa trên các đặc trưng . 16

    2.2.3. Phương pháp trích chọn dựa trên hàm nhân 21

    2.3. Học bán giám sát trích chọn quan hệ . 24

    2.3.1. Phương pháp DIRPE . 24

    2.3.2. Phương pháp Snowball . 27

    2.4. Nhận xét 29

    Tóm tắt chương hai 29

    Chương 3. Mô hình trích chọn quan hệ trên Wikipedia tiếng Việt dựa

    vào cây phân tích cú pháp 30

    3.1. Đặc trưng của Wikipedia . 30

    3.1.1. Thực thể trong Wikipedia . 30

    3.1.2. Infobox . 31

    3.1.3. Mục phân loại . 31

    3.2. Cây phân tích cú pháp tiếng Việt . 32

    3.2.1. Phân tích cú pháp 32

    iv

    3.2.2. Một số thành phần cơ bản của cây phân tích cú pháp tiếng Việt 32

    3.3. Mô hình trích chọn quan hệ dựa trên cây phân tích cú pháp trên Wikipedia

    tiếng Việt . 33

    3.3.1. Phát biểu bài toán 33

    3.3.2. Ý tưởng giải quyết bài toán . 33

    3.3.3. Xây dựng tập dữ liệu học 34

    3.3.4. Mô hình hệ thống trích chọn quan hệ 36

    Tổng kết chương ba 40

    Chương 4. Thực nghiệm và đánh giá kết quả 41

    4.1. Môi trường thực nghiệm . 41

    4.1.1. Câu hình phần cứng 41

    4.1.2. Công cụ phần mềm . 41

    4.2. Dữ liệu thực nghiệm 42

    4.3. Thực nghiệm . 42

    4.3.1. Mô tả cài đặt chương trình 42

    4.3.2. Xây dựng tập dữ liệu học dựa trên Wikipedia tiếng Việt . 42

    4.3.3. Sinh vector đặc trưng 45

    4.3.4. Bộ phân lớp SVM . 47

    4.4. Đánh giá 48

    4.4.1. Đánh giá hệ thống . 48

    4.4.2. Phương pháp đánh giá . 49

    4.4.3. Kết quả kiểm thử 49

    4.5. Nhận xét 51

    Kết luận 52

    Phục lục 53

    Tài liệu tham khảo 56
     

    Các file đính kèm:

Đang tải...