Chuyên Đề Phát triển một Hệ thống S.E Hỗ trợ Tìm kiếm Thông tin, thuộc lãnh vực CNTT trên Internet qua từ khóa

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Nội dung
    MỞ ĐẦU . 5
    1 PH ẦN I: . 6
    TÌM HIỂU VÀ SO SÁNH MỘT SỐ S.E THÔNG DỤNG HIỆN NAY . 6
    1.1 MỘT SỐ S. E NƯỚC NGOÀI THÔNG DỤNG HIỆN NAY (xem
    Bảng Tổng hợp chi tiết trong Phụ lục 1, 2,3) 6
    1.1.1 GOOGLE 6
    1.1.2 LYCOS . 9
    1.1.3 ALTA VISTA . 10
    1.2 MỘT SỐ S. E TIẾNG VIỆT THÔNG DỤNG HIỆN NAY (xem
    Bảng tổng hợp chi tiết trong Phụ lục 4). . 12
    1.2.1 NETNAM . 12
    1.2.2 VINASEEK 16
    1.3 NHẬN XÉT – SO SÁNH VỀ MỘT SỐ S.E. 17
    1.3.1 SO SÁNH. 17
    1.3.2 NHẬN XÉT. . 19
    2 PHẦN 2: 23
    XÂY DỰNG TỪ ĐIỂN NGỮ NGHĨA THUẬT NGỮ TIN HỌC . 23
    2.1 TÌM KIẾM THEO NGỮ NGHĨA 23
    2.2 BIỂU DIỄN NGỮ NGHĨA 24
    2.2.1 ĐỒNG HIỆN (CO-OCCURRENCE) . 24
    2.2.2 HỆ THỐNG QUAN HỆ ĐỒNG NGHĨA ĐƠN GIẢN 25
    2.3 ONTOLOGY 42
    2.3.1 XÂY DỰNG ONTOLOGY 42
    2.3.2 TRAO ĐỔI ONTOLOGY 44
    2.3.3 XÂY DỰNG ONTOLOGY TỪ VĂN BẢN 45
    2.3.4 XÂY DỰNG ONTOLOGY CHUYÊN NGÀNH TIN HỌC .
    2.3.5 BIỂU DIỄN ONTOLOGY TRONG CƠ SỞ DỮ LIỆU . 55
    2.4 BIỂU DIỄN CẤU TRÚC PHÂN CẤP CỦA ONTOLOGY TRONG
    CƠ SỞ DỮ LIỆU QUAN HỆ . 62
    2.4.1 CÁC NHƯỢC ĐIỂM CỦA CÁCH BIỂU DIỄN BẰNG CON
    TRỎ. 62
    2.4.2 BIỂU DIỄN CẤU TRÚC CÂY TRONG ORACLE 63
    2.4.3 NHẬN XÉT . 71
    2.5. KẾT LUẬN . 72
    3 PHẦN III: 73
    THIẾT KẾ HỆ THỐNG S.E VÀ KẾT QUẢ THỬ NGHIỆM 73
    3.1 THIẾT KẾ HỆ THỐNG . 73
    3.1.1 Đặt tả Hệ thống: 73
    3.1.2 Thiết kế các Chức năng của Hệ thống. . 73
    3.1.3 Thuật giải nhận dạng bảng mã 83
    3.2 CÀI ĐẶT HỆ THỐNG. . 86
    3.2.1 Tổ chức Các Giao diệnModule WebRobot. . 86
    3.3 Kết quả thử nghiệm. . 95
    4. KẾT LUẬN .100
    PH Ụ L ỤC 101
    PHỤ LỤC 1. BẢNG TÓM TẮT ĐẶC TRƯNG CỦA MỘT SỐ S.E NƯỚC
    NGOÀI 101
    PHỤ LỤC 2. BẢNG TÓM TẮT ĐẶC TRƯNG MỘT SỐ META-S E NƯỚC
    NGOÀI 103
    PHỤ LỤC 3. BẢNG TÓM TẮT MỘT SỐ HỆ THỐNG DANH MỤC
    (SUBJECT DIRECTORIES) 104
    PHỤ LỤC 4. BẢNG TÓM TẮT ĐẶC TRƯNG CỦA MỘT SỐ S.E
    TRONG NƯỚC. . 105
    PHỤ LỤC 5. QUAN HỆ GIỮA ĐỘ CHÍNH XÁC & ĐỘ GỌI LẠI . 106
    PHỤ LỤC 6. THỐNG KÊ VỀ PHÂN HẠNG CỦA CÁC DOMAIN 107
    PHỤ LỤC 7. SƠ ĐỒ QUAN HỆ S.E .
    PHỤ LỤC 8: CÁC MÃ NGỮ NGHĨA CỦA LDOCE 111
    PHỤ LỤC 9. TỔNG QUAN VỀ CÔNG NGHỆ ORACLE TEXT ĐỂ PHÁT
    TRIỂN S.E. . 112
    PHỤ LỤC 10. SƠ LƯỢC VỀ THƯ VIỆN VNCONVERT: 116
    TÀI LIỆU THAM KHẢO. . 118
    CÁC TRANG WEB . 119

    MỞ ĐẦU
    Hiện nay, InterNET đã trở thành một Siêu Xa lộ Thông tin, cung cấp
    thông tin cho mọi người, ở mọi nơi, trong mọi ngành, mọi lãnh vực. Hiện nay
    trên thế giới có rất nhiều SEARCH ENGINE chẳng hạn như GOOGLE (xem
    [2], [3], [5]), YAHOO, ALLTHEWEB, ALTA VISTA (xem [4]), có khả
    năng tìm kiếm trên nhiều ngôn ngữ khác nhau, nhưng với Tiếng VIÊT vẫn có
    hạn chế. Và trong nước cũng có vài SEARCH ENGINE chẳng hạn như
    NETNAM (xem [7]), VINASEEK (xem [8]), ]), Mặc dù đã có rất nhiều
    SEARCH ENGINE, nhưng vẫn rất cần thiết có một sự nghiên cứu đầy đủ để
    phát triển một Hệ thống SEARCH ENGINE trên tiếng VIỆT có chú ý đến từ
    khóa là TỪ GHÉP và NGỮ NGHĨA trong lãnh vực Công nghệ thông tin
    (CNTT). Trên cơ sở này, có thể phát triển một Hệ thống SEARCH ENGINE
    tiếng VIỆT tổng quát cho mọi lãnh vực.
    Thời gian thực hiện Đề tài là 18 tháng từ tháng 01/2003 đến 07/2004.
    Bản báo cáo này nhằm trình bày một số kết quả bước đầu:
    PHẦN I. Thu thập và nghiên cứu tính năng của một số SEARCH ENGINE
    thông dụng. So sánh và đánh giá các SEARCH ENGINE (S.E) này.
    PHẦN II. Xây dựng Từ điễn ngữ nghĩa Thuật ngữ Tin học.
    PH ẦN III. Thiết kế Hệ thống & kết quả thử nghiệm
     

    Các file đính kèm:

Đang tải...