Đồ Án Xây dựng và làm giàu ontology tiếng việt chuyên ngành công nghệ thông tin

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    LỜI MỞ ĐẦU


    Ngày nay cùng với sự phát triển của internet thì dữ liệu của ngành công nghệ thông tin ngày càng gia tăng. Nhu cầu quản lý, chia sẻ, tìm kiếm thông tin trong ngành này cũng được đặt ra và đ áp ứng một phần nhờ các công cụ tìm kiếm. Một số công cụ tìm kiếm nổi tiếng hiện nay như Google hay Yahoo đều có thể cho phép người dùng tìm kiếm dữ liệu có liên quan bằng cách nhập từ khóa và tìm những tài liệu có chứa từ khó a đó. Với phương pháp tìm như vậy thì kết quả tìm kiếm đôi khi chẳng liên quan gì đến cái mà người dùng muốn tìm, vì các công cụ tìm kiếm này khô ng hiểu được ý nghĩa cần tìm. Việc tìm kiếm thô ng tin về từ khóa đã vậy thì việc trả lời những câu hỏi càng khô ng thể đối với những công cụ tìm kiếm này.


    Muốn cho máy tính và con người có thể hiểu được ngữ n ghĩa của từ hay câu thì chúng ta cần có một ontology hỗ trợ bên dưới cho các công cụ này. Ontology giống như một cơ sở dữ liệu về một lĩnh vực cụ thể, nó mô tả mọi thứ trong lĩnh vực đó bao gồm cả định nghĩa những thuật ngữ, những tính chất của những đối t ượng và quan hệ giữa chúng. Nó sẽ giúp cho máy tính có thể “hiểu” được ngữ nghĩa giống như con người, chia sẻ thô ng tin qua các hệ thố ng khác nhau.


    Với nguồn dữ liệu rất lớn trong ngành công nghệ thông tin hiện nay và sự phát triển của các trang web ngữ nghĩa (semantic web) thì việc xây dựng một ontology cho lĩnh vực công nghệ thông tin là một nhu cầu cần thiết. Đặc biệt là đối với ngô n ngữ tiếng Việt, vì vậy chúng em chọn đề tài “Xây dựng và làm giàu ontology tiếng Việt chuyên ngành công nghệ thô ng tin”, b áo cáo này được chia thành 5 phần chính gồ m:


    Chương 1: Tổ ng quan: Chương này sẽ cho chúng ta thấy tổng quan về đề tài, trong đó có giới thiệu đề tài, giới hạn mục tiêu và phạm vi của đề tài, cho chúng ta biết được cái nhìn tổng quan về phương pháp thực hiệ n đề tài và kết quả dự kiến thu được.





    Chương 2: Cơ sở lý thuyết: Phần này sẽ giải thích rõ về ontology và cho chúng ta thấy tình hình nghiên cứu về ontology hiện nay qua phần khảo sát các nghiên cứu có liên quan.


    Chương 3: Xây dựng và làm giàu ontology tiếng Việt chuyên ngành công nghệ thô ng tin (ITVO): Phần này sẽ nêu chi tiết quá trình xây dựng ontology và đề xuất phương pháp làm giàu.


    Chương 4: Hiện thực hệ thố ng và đánh giá: P hần này sẽ nêu chi tiết quá trình xây dựng công cụ làm giàu o ntology, thực nghiệm và đánh giá công cụ.


    Chương 5: Kết luận và hướng phát triển: Chương này sẽ tổng kết lại những kết quả đạt được và những hạn chế của đề tài, nêu ra hướng phát triển trong tương lai.


    Ngo ài ra, phần cuối của báo cáo sẽ nêu các tài liệu tham khảo và phụ l ục.
    MỤC LỤC
    CHƯƠNG 1: TỔNG QUAN 1

    1.1. Mở đầu 1

    1.2. Đặt vấn đề .1

    1.3. Mục tiêu và phạm vi đề tài .2

    1.4. Phương pháp và công cụ .3

    1.5. Kết quả dự kiến 3

    1.6. Tổ ng kết chương 3

    CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 4

    2.1. Mở đầu 4

    2.2. Tổ ng quan về ontology 4

    2.2.1. Định nghĩa .4

    2.2.2. Vì sao phải xây dựng o ntology? .5

    2.2.3. Thành phần của ontology 6

    2.2.4. Làm thế nào để xây dựng một ontology? 8

    2.3. Khảo sát các nghiên cứu có liên quan .18

    2.3.1. Các nghiên cứu trên thế giới .18

    2.3.2. Các nghiên cứu trong nước .20

    2.4. Tổ ng kết chương 22

    CHƯƠNG 3: XÂY DỰNG VÀ LÀM GIÀU ONTOLOGY TIẾNG VIỆT CHUYÊN

    NGÀNH CÔNG NGHỆ THÔNG TIN (ITVO) .23

    3.1. Xây dựng ontology tiếng việt chuyên ngành công nghệ thông tin (ITVO) 23

    3.1.1. Công cụ sử dụng .23

    3.1.2. Quá trình xây dựng o ntology 25




    3.2. Phương pháp làm giàu ontology tiếng Việt chuyên ngành cô ng nghệ thông

    tin 42

    3.2.1. Giới thiệu .42

    3.2.2. Khảo sát phương pháp làm giàu ontology .44

    3.2.3. Phương pháp thực hiện 46

    3.3. Tổ ng kết chương 53

    CHƯƠNG 4: HIỆN THỰC HỆ THỐNG VÀ ĐÁNH GIÁ 54

    4.1. Mở đầu 54

    4.2. Kiến trúc chương trình làm giàu ontology 54

    4.3. Các bước chạy chương trình .60

    4.4. Thực nghiệm và đánh giá 65

    CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 67

    5.1. Kết luận .67

    5.2. Hướng phát triển 67

    Tài liệu tham khảo .69

    Phụ lục A: Hướng dẫn sử dụng Protégé .73

    Phụ lục B: Danh sách các hư từ .85
     

    Các file đính kèm:

Đang tải...