Thạc Sĩ Một giải pháp sử dụng cụm danh từ cho tìm kiếm trên khái niệm

Thảo luận trong 'Khoa Học Công Nghệ' bắt đầu bởi Lan Chip, 14/10/11.

  1. Lan Chip

    Lan Chip New Member

    Bài viết:
    1,976
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    Mục lục
    Trang
    LỜI CẢM ƠN .3
    Mục lục 4
    Danh mục các hình 7
    Danh mục các bảng 8
    Chương 1 : GIỚI THIỆU 9
    1.1 Lý do chọn đề tài 9
    1.2 Mục tiêu của luận văn .11
    1.3 Nội dung nghiên cứu 11
    Chương 2 : CÁC NGHIÊN CỨU VỀ LẬP CHỈ MỤC TRÊN KHÁI NIỆM .13
    2.1 Tổng quan .13
    2.2 Lập chỉ mục trên khái niệm không so khớp tài liệu với Ontology 14
    2.2.1 Hướng tiếp cận xử lý phía câu truy vấn 14
    2.2.2 Hướng tiếp cận xứ lý phía tài liệu .17
    2.2.3 Hướng tiếp cận phối hợp xử lý cả câu truy vấn và tài liệu .19
    2.3 Lập chỉ mục trên khái niệm có so khớp tài liệu với Ontology .21
    2.3.1 Xây dựng Ontology 21
    2.3.2 Lập chỉ mục – Chỉ sử dụng khái niệm 22
    2.3.3 Lập chỉ mục – Sử dụng khái niệm và Mối kết hợp giữa chúng 26
    2.4 Lựa chọn của đề tài 29
    Chương 3 : PHÂN TÍCH CÚ PHÁP 30
    3.1 Tổng quan .30
    3.2 Tách từ 31
    3.3 Gán nhãn từ loại 32
    3.3.1 Phát sinh tập luật điều chỉnh từ loại 32
    3.3.2 Bổ sung luật điều chỉnh từ loại .33
    Trang 5
    3.4 Gán nhãn ranh giới ngữ 35
    3.4.1 Phát sinh bộ luật sửa nhãn ranh giới ngữ 35
    3.4.2 Bổ sung luật sửa nhãn ranh giới ngữ 37
    3.5 Cấu trúc hóa cụm danh từ 38
    3.5.1 Cấu trúc của cụm danh từ tiếng Việt 38
    3.5.2 Giải pháp cấu trúc hóa cụm danh từ tiếng Việt 41
    Chương 4 : PHÁT SINH BIẾN THỂ .46
    4.1 Lý do phải phát sinh biến thể .46
    4.2 Các loại biến thể của cụm từ .48
    4.2.1 Biến thể hình thái 48
    4.2.2 Biến thể ngữ nghĩa 49
    4.2.3 Biến thể ngữ pháp .51
    4.3 Một số kỹ thuật phát sinh biến thể cho cụm từ .53
    4.3.1 Phát sinh bằng tài nguyên Ngôn ngữ 53
    4.3.2 Phát sinh bằng phương pháp thống kê 54
    4.3.3 Phát sinh bằng Heuristic .55
    4.3.4 Phát sinh bằng luật 57
    4.4 Một giải pháp phát sinh biến thể cho cụm danh từ tiếng Việt .62
    4.4.1 Chiến lược phát sinh biến thể .62
    4.4.2 Bộ luật phát sinh biến thể .63
    Chương 5 : ÁNH XẠ TÀI LIỆU VÀO DANH MỤC KHÁI NIỆM 73
    5.1 Tổng quan .73
    5.2 Ontology sử dụng trong luận văn .74
    5.2.1 File MRCONSO.RRF .74
    5.2.2 File MRHIER.RRF .75
    5.2.3 Phạm vi của Ontology tiếng Việt 75
    5.3 Meta-map và ứng dụng cho tài liệu Y khoa tiếng Việt .76
    5.3.1 Các mức so khớp 76
    5.3.2 Các độ đo 78
    5.4 Conann và ứng dụng cho tài liệu Y khoa tiếng Việt .83
    5.4.1 Tiền xử lý 83
    5.4.2 Lần lọc thứ 1 .84
    5.4.3 Lần lọc thứ 2 .84
    5.4.4 Lần lọc thứ 3 .86
    5.4.5 Ứng dụng cho tài liệu Y khoa tiếng Việt 87
    5.5 Kết hợp Meta-map và Conann khi ứng dụng cho tài liệu Y khoa tiếng Việt .88
    Trang 6
    Chương 6 : KẾT QUẢ THỬ NGHIỆM .89
    6.1 Mục tiêu thử nghiệm 89
    6.2 Phương pháp thử nghiệm 89
    6.2.1 Dữ liệu thử nghiệm .89
    6.2.2 Dữ liệu đánh giá 90
    6.2.3 Phương pháp tiến hành thử nghiệm 91
    6.3 Kết quả thử nghiệm .94
    6.3.1 Phân tích cú pháp 94
    6.3.2 Phát sinh biến thể 95
    6.3.3 Ánh xạ tài liệu vào danh mục khái niệm 95
    Chương 7 : KẾT LUẬN 99
    7.1 Kết quả đạt được 99
    7.2 Những vấn đề còn tồn tại 99
    7.3 Hướng phát triển .100
    TÀI LIỆU THAM KHẢO .101
     

    Các file đính kèm:

Đang tải...