Thạc Sĩ Phân lớp câu hỏi hướng tới tìm kiếm ngữ nghĩa tiếng việt trong lĩnh vực y tế

Thảo luận trong 'Chưa Phân Loại' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    Tóm tắt

    Cùng với sự ra đời của Web ngữ nghĩa và các Ontology, nhu cầu tìm kiếm ngữ
    nghĩa ngày càng nhận được nhiều sự quan tâm trong cộng đồng nghiên cứu về khai phá
    dữ liệu Web/Text. Mặt khác, phân lớp câu hỏi là một trong những thành phần cơ bản
    nhưng quan trọng nhất trong Kiến trúc tổng thể của hầu hết các máy tìm kiếm ngữ nghĩa.
    Đây cũng là thành phần chịu nhiều sự ảnh hưởng của các đặc trưng Ngôn ngữ và giữ vai
    trò nền tảng cho các bước xử lý nhằm hướng tới tìm kiếm ngữ nghĩa.
    Khóa luận này tập trung nghiên cứu phương pháp phân loại câu hỏi trong lĩnh vực y
    tế tiếng Việt dựa trên hướng tiếp cận cực đại hóa Entropy (maxent). Dựa trên việc khảo
    sát các đặc trưng tiếng Việt và các hướng tiếp cận trong phân lớp câu hỏi trên tiếng Anh,
    khóa luận đã tích hợp các đặc trưng này vào quá trình phân lớp với Maxent và thu được
    kết quả khả quan. Những nội dung này có thể coi là những nghiên cứu đầu tiên trong vấn
    đề này trên tiếng Việt.

    Mục lục
    Tóm tắt . i
    Mục lục .ii
    Danh sách các bảng .iv
    Danh sách các hình . v
    Lời mở đầu 1
    Chương I. Tổng quan về tìm kiếm ngữ nghĩa 2
    1.1. Nhu cầu về máy tìm kiếm ngữ nghĩa .2
    1.2. Cấu trúc tổng thể của một máy tìm kiếm ngữ nghĩa .2
    1.2.1. Nền tảng cho tìm kiếm ngữ nghĩa 2
    1.2.2.1. Web ngữ nghĩa 3
    1.2.2.2. Ontology .4
    1.2.2. Kiến trúc cơ bản của một máy tìm kiếm ngữ nghĩa .9
    1.2.2.3. Giao diện người dùng .10
    1.2.2.4. Kiến trúc bên trong .10
    Chương 2. Tìm kiếm ngữ nghĩa trong tiếng Việt .14
    2.1. Tổng quan về cơ sở cho tìm kiếm ngữ nghĩa tiếng Việt 14
    2.2. Một số đặc trưng của tiếng Việt 15
    2.2.1 Đặc điểm ngữ âm .15
    2.2.2 Đặc điểm từ vựng: . .15
    2.2.3 Đặc điểm ngữ pháp . 16
    2.3. Tìm kiếm ngữ nghĩa trong lĩnh vực y tế 16
    2.3.1. Ontology Y tế trong tiếng Việt .16
    2.3.2. Bộ phân lớp câu hỏi Y tế trong tiếng Việt .18
    Chương 3. Các phương pháp phân lớp câu hỏi 19
    3.1. Giới thiệu về phân lớp câu hỏi . 19
    3.2. Các phương pháp phân lớp câu hỏi .19
    3.3. Hướng tiếp cận dựa trên Xác suất 20
    3.3.2 Các hướng tiếp cận theo phương pháp học máy 21
    iii
    3.3.1.1 Support Vector Machines (SVM) . 21
    3.3.1.2 Một số phương pháp khác 27
    3.3.1.3 Thực nghiệm khi tiến hành phân lớp câu hỏi .28
    3.3.3 Hướng tiếp cận dựa trên mô hình hình Ngôn ngữ 31
    3.3.3.1 Hướng tiếp cận Entropy cực đại .33
    Chương 4. Thực nghiệm và đánh giá .37
    4.1 Dữ liệu của thực nghiệm .3 7
    4.2 Thiết kế thử nghiệm 38
    4.3 Kết quả thực nghiệm .39
    4.4 Đánh giá kết quả thực nghiệm 43
    Kết luận .45
    Tài liệu tham khảo 46
    Tiếng Việt .46
    Tiếng anh .46
     

    Các file đính kèm:

    • 8-.pdf
      Kích thước:
      724.8 KB
      Xem:
      0
Đang tải...