Luận Văn Học xếp hạng trong tính hạng đối tượng và tạo nhãn cụm tài liệu

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỞ ĐẦU 1
    1 Xếp hạng đối tượng 2
    1.1 Giới thiệu 2
    1.2 Phương pháp PageRanK 3
    1.3 Xếp hạng đối tượng 5
    1.4 Phương pháp đánh giá xếp hạng . 6
    1.5 Tổng kết 8
    2 Học xếp hạng 9
    2.1 Giới thiệu . 9
    2.2 Phương pháp học xếp hạng . 11
    2.2.1 Hồi quy có thứ tự và Pairwise 11
    2.2.2 Học xếp hạng danh sách Listwise 13
    2.3 Tổng kết chương 15
    3 Xếp hạng trong máy tìm kiếm thực thể 16
    3.1 Máy tìm kiếm thực thể 17
    3.2 Xếp hạng thực thể 21
    3.2.1 Mô hình Impression 26
    3.2.2 Nhận xét, đánh giá mô hình Impression 27
    3.2.3 Mô hình đề xuất 29
    3.3 Thực nghiệm 32
    3.3.1 Công cụ sử dụng 32
    3.3.2 Dữ liệu 33
    3.3.3 Kết quả và đánh giá . 34
    3.4 Tổng kết chương . 36
    4 Tạo nhãn cụm tài liệu 37
    4.1 Giới thiệu . 37
    4.2 Phương pháp lựa chọn nhãn . 39
    4.3 Học xếp hạng nhãn cụm . 42
    4.3.1 Các đặc trưng 42
    4.3.2 Học hàm tính hạng 44
    4.4 Thực nghiệm 45
    4.4.1 Nguồn dữ liệu 45
    4.4.2 Dữ liệu học 46
    4.4.3 Kết quả và đánh giá 47
    4.5 Tổng kết chương 48
    Kết luận 49
    Tài liệu tham khảo 51
    A Dữ liệu
    A.1 Dữ liệu tìm kiếm thuốc 59
    A.2 Cây wiki 60
    Danh sách hình vẽ 62
    Danh sách bảng 63

    Xếp hạng các đối tượng (trang Web, tác giả, chủ đề, trường đại học, công ty .) có ý nghĩa quan trọng trong lĩnh vực khai phá dữ liệu, là trung tâm của nhiều ứng dụng
    - điển hình là máy tìm kiếm. Các phương pháp tính hạng được nghiên cứu và phát triển từ rất nhiều năm trước, nhưng khoảng 3 năm trở lại đây, hướng tiếp cận sử dụng phương pháp học máy để xếp hạng đối tượng trở thành một vấn đề thu hút được rất nhiều sự quan tâm như trong SIGIR 2007 và SIGIR 2008 đã tổ chức hội thảo chuyên đề về học xếp hạng (learning to rank: LTR)[49].
    Học xếp hạng đang được nhiều nhà khoa học trên thế giới quan tâm nghiên cứu và ứng dụng, như cải tiến hàm tính hạng trong máy tìm kiếm của nhóm Yuehua Xu tại ICML năm 2007 [59], mô hình tính hạng thực thể trong máy tìm kiếm thực thể của nhóm các tác giả Tao Cheng, Kevin Chang trong [17, 18, 19], và sử dụng học xếp hạng để đánh giá trọng số của các cụm từ [65, 53].
    Luận văn Học xếp hạng trong tính hạng đối tượng và tạo nhãn cụm tài liệu thực hiện khảo sát, phân tích các phương pháp học xếp hạng đang được quan tâm hiện nay và từ đó đưa ra mô hình xếp hạng thực thể áp dụng vào máy tìm kiếm thực thể trong tiếng Việt, cụ thể là tìm kiếm thực thể thuốc và học xếp hạng để tạo nhãn cho cụm tài liệu. Qua đó cho thấy ứng dụng to lớn và ý nghĩa quan trọng của bài toán học xếp hạng.


    Luận văn này gồm bốn chương, nội dung được mô tả như dưới đây.
    Chương 1. Tổng quan về xếp hạng đối tượng giới thiệu những nội dung cơ bản nhất về bài toán xếp hạng và đặt vấn đề học xếp hạng đối tượng.
    Chương 2. Học xếp hạng đối tượng trình bày hai phương pháp học xếp hạng cơ bản. Đồng thời, chương này cũng giới thiệu thuật toán học được sử dụng nhiều trong học xếp hạng là máy véc-tơ hỗ trợ (SVM) và hồi quy tuyến tính.
    Chương 3. Học xếp hạng trong máy tìm kiếm thực thể đưa ra mô hình học xếp hạng đối tượng và thực nghiệm tính hạng thực thể thuốc trong máy tìm kiếm thực thể.
    Chương 4. Gán nhãn cụm tài liệu phân tích, áp dụng và báo cáo kết quả thực nghiệm học xếp hạng từ/cụm từ để tạo nhãn cho các cụm tài liệu.
    Phần kết luận tổng kết và tóm lược nội dung chính của luận văn.
     

    Các file đính kèm:

Đang tải...