Luận Văn luận văn: "Xây dựng ứng dụng phân tích chữ nghĩa trong tìm kiếm tài liệu trực tuyến

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    167
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC​ 199051169" PHẦN 0: LỜI NÓI ĐẦU 9
    199051170" 1. MỤC TIÊU VÀ Ý NGHĨA CỦA ĐỀ TÀI. 9
    199051171" 2. VẤN ĐỀ GIẢI QUYẾT 9
    199051172" 3. CÁCH GIẢI QUYẾT 10
    199051173" 3.1 Phân tách tài liệu thành các từ khóa (Filter) 10
    199051174" 3.2 Phân tích ngữ nghĩa tiềm ẩn (Latent Semantic Analystic-LSA) 11
    199051175" 3.3 Phân tích lịch sử truy cập của người dùng. 11
    199051176" 4. CÁC ĐÓNG GÓP CHÍNH CỦA LUẬN VĂN 11
    199051177" 5. CÀI ĐẶT 12
    199051178" 5.1 Tách tài liệu thành các từ khóa. Tìm kiếm dựa trên từ khóa. 12
    199051179" 5.2 Mô hình tìm tư vấn dựa trên phân tích ngữ nghĩa tiềm ẩn. 13
    199051180" 6. GIAO DIỆN TRANG CHỦ CHƯƠNG TRÌNH 15
    199051181" PHẦN I: VẤN ĐỀ VÀ THỰC TRẠNG 16
    199051182" 1. ĐẶT BÀI TOÁN 16
    199051183" 2. CÁC VẤN ĐỀ VÀ CÁC GIẢI PHÁP HIỆN TẠI. 19
    199051184" 2.1 Các hệ thống gợi ý (recommender systems - RS) 19
    199051185" 2.1.1 Các khái niệm về Recommender System 19
    199051186" 2.1.2 Các hệ thống recommender tiêu biểu. 20
    199051187" 2.2 Xử lý tài liệu tiếng Việt 24
    199051188" 2.2.1 Các nghiên cứu về cấu của các nhà nghiên cứu Việt Nam. 24
    199051189" 2.2.2 Tóm tắt đặc trưng của cấu trúc ngữ pháp tiếng Việt, Anh. 27
    199051190" 2.3 Xử lý tài liệu theo ngữ nghĩa. 28
    199051191" 2.3.1 Đặt vấn đề. 28
    199051192" 2.3.2 Phân tích ngữ nghĩa tiềm ẩn (LSA) 29
    199051193" 2.3.3 Nhận xét, kết luận. 29
    199051194" 2.4 Thu thập thông tin người dùng. 30
    199051195" 2.4.1 Ưu điểm của các hệ thống tự học. 30
    199051196" 2.4.2 Phân tích logfile. 30
    199051197" 2.4.3 Phân tích dựa thông tin người dùng. 30
    199051198" 2.4.4 Kết luận. 31
    199051199" 2.5 Vấn đề lưu trữ dữ liệu. 31
    199051200" PHẦN II: CƠ SỞ LÝ THUYẾT 32
    199051201" 1. CÁC BỘ MÁY TÌM KIẾM <SEARCH ENGINE>. 32
    199051202" 1.1 Một số engine thông dụng. 32
    199051203" 1.2 Chiến lược tìm kiếm 35
    199051204" 1.2.1 Công nghệ tìm kiếm ngữ nghĩa trên thế giới hiện nay. 35
    199051205" 1.2.2 Chiến lược tìm kiếm 36
    199051206" 2. XỬ LÝ VĂN BẢN TIẾNG VIỆT 37
    199051207" 2.1 Từ và cấu trúc từ của tiếng Việt 37
    199051208" 2.1.1 Định nghĩa từ. 37
    199051209" 2.1.2 Cấu trúc từ tiếng Việt 38
    199051210" 2.1.3 Các phương pháp tách từ tiếng Việt đã được nghiên cứu. 38
    199051211" 2.2 Thuật toán, otomat tách từ. 41
    199051212" PHẦN III: GIẢI PHÁP KỸ THUẬT 45
    199051213" 1. Giải pháp đọc các định dạng tài liệu. 45
    199051214" 1.1 Giao diện Ifilter. 45
    199051215" 1.2 Chương trình EPocalipse.IFilter. 45
    199051216" 2. Giải pháp tách từ. 46
    199051217" 2.1 Giải pháp tách từ Tiếng Anh. 46
    199051218" 2.2 Giải pháp cho Tiếng Việt 47
    199051219" 3. Giải pháp LSA 48
    199051220" 4. Giải pháp phân tích lịch sử làm việc của người dùng. 49
    199051221" 5. Giải pháp công nghệ. 49
    199051222" PHẦN IV: XÂY DỰNG CHƯƠNG TRÌNH, CÀI ĐẶT CHẠY DEMO 50
    199051223" 1. Phân tích hệ thống. 50
    199051224" 1.1 Mô hình use-case và đặc tả use-case. 50
    199051225" 1.2 Về cơ sở dữ liệu. 63
    199051226" 2. Các modul 74
    199051227" 2.1 Modul đọc các định dạng tài liệu. 74
    199051228" 2.2 Modul tách từ. 74
    199051229" 2.2 Modul LSA 76
    199051230" PHẦN V: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 76
    199051231" 1. Kết luận. 76
    199051232" 2. Hướng phát triển


    DANH MỤC HÌNH VÀ BẢNG​ 199116558" DANH MỤC HÌNH VÀ BẢNG 7
    199116559" Hình 1: Hình minh họa tập tách văn bản. 14
    199116560" Hình 2: Cấu trúc giải thuật LSA 15
    199116562" Hình 3: Quy trình truy vấn. 16
    199116563" Hình 4: Giao diện chính trang chủ chương trình. 17
    199116564" Hình 5: Tìm kiếm thông tin – So sánh gợi ý của người và máy. 18
    199116565" Hình 6: Mô hình sơ đồ hệ thống gợi ý cho người dùng. 20
    199116566" Hình 7: Sơ đồ tổng quát hệ thống. 21
    199116567" Hình 8: Giao diện tìm kiếm của Amazone.com 22
    199116568" Hình 9: Giao diện kết quả trả lại 23
    199116569" Hình 10: Giao diện kết quả tìm kiếm của Amazone.com 24
    199116570" Hình 11: Sơ đồ cấu trúc từ của Nguyễn Tài Cẩn. 27
    199116571" Hình 12: Giao diện tìm kiếm của Google. 34
    199116572" Hình 13: Giao diện tìm kiếm Yahoo. 35
    199116573" Hình 14 Giao diện tìm kiếm Ask Jeeves. 36
    199116574" Hình 15: Giao diện tìm kiếm All the web. 36
    199116575" Table 1: : Tần suất xuất hiện độ dài từ tiếng Việt trên trang Vdict.com 40
    199116576" Table 2: Tần số tài liệu của một số từ thông dụng trong tiếng Việt 41
    199116577" Table 3: Ví dụ về MI của n-gram 42
    199116578" Hình 16: Xây dựng ôtômát âm tiết 44
    199116579" Hình 17: Xây dựng ôtômát từ vựng. 45
    199116580" Hình 18: Một tình huống nhập nhằng. 47
    199116581" Hình 19: Giải thuật tách từ từ câu. 50
    199116582" Table 4: Bảng một số ví dụ về cấu trúc lưu trữ từ điển. 51
    199116583" Hình 20: Biểu đồ use-case hệ thống. 53
    199116584" Hình 21: Use-case tìm kiếm Hình 22: Biểu đồ cộng tác chức năng tìm kiếm 54
    199116586" Hình 23: Biểu đồ tiến trình chức năng tìm kiếm 54
    199116587" Hình 24: Use-case quản lý tài liệu. 55
    199116589" Hình 25: Biểu đồ cộng tác. 55
    199116590" Hình 26: Biểu đồ tiến trình chức năng thêm mới tài liệu. 56
    199116591" Hình 27: Biểu đồ tiến trình chức năng sửa tài liệu. 56
    199116592" Hình 28:Biểu đồ tiến trình chức năng xóa tài liệu. 57
    199116593" Hình 29: Biểu đồ cộng tác quản lý tài liệu. 57
    199116594" Hình 30: User-Case quản lý tác giả. 58
    199116595" Hình 31: Biểu đồ tiến trình thêm mới tác giả. 58
    199116596" Hình 32: Biểu đồ tiến trình sửa tác giả. 59
    199116598" Hình 33: Biểu đồ tiến trình xóa tác giả. 59
    199116599" Hình 34: Biểu đồ cộng tác quản lý tác giả. 60
    199116600" Hình 35: User-Case quản lý NXBLớp biên:. 60
    199116601" Hình 36: Biểu đồ tiến trình thêm mới NXB 61
    199116602" Hình 38: Biểu đồ tiến trình xóa thông tin NXB 62
    199116603" Hình 39: Biểu đồ công tác quản lý NXB 62
    199116604" Hình 40: Biểu đồ usercase quản lý thành viên. 63
    199116607" Hình 42: Biểu đồ tiến trình chỉnh sửa user. 64
    199116608" Hình 43: Biểu đồ tiến trình xóa user. 64
    199116609" Hình 44: Biểu đồ cộng tác quản lý user. 65
    199116610" Hình 45: Biểu đồ cộng tác quản lý user. 66
    199116611" Table 5: Bảng các thực thể chính. 67
    199116612" Table 6: Bảng quan hệ các thực thể. 68
    199116613" Table 7: Danh sách các bảng chính. 71
    199116615" Table 8: Mô tả bảng tài liệu A01. 72
    199116616" Table 9: Mô tả bảng Catalogue A02. 73
    199116617" Table 10: Mô tả bảng tác giả A04. 73
    199116618" Table 11: Mô tả bảng NXB A05. 74
    199116619" Table 12: Mô tả bảng User A06. 74
    199116620" Table 13: Mô tả bảng subCatalogue A07. 75
    199116621" Table 14: Mô tả bảng Child A08. 75
    199116622" Table 15: Mô tả bảng A11. 76
    199116623" Table 16: Mô tả bảng A12. 76
     

    Các file đính kèm:

Đang tải...