Báo Cáo Công cụ hỗ trợ tạo ngữ nghĩa trang Web sử dụng kỹ thuật tách thông tin từ văn bản

Thảo luận trong 'Chưa Phân Loại' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    I. ĐẶT VẤN ĐỀ
    Với nhiều tỷ trang Web phân bố trên hầu hết các
    quốc gia, World Wide Web (WWW) là môi trường tốt
    cho việc biểu diễn và truy cập thông tin dạng số. Tuy
    nhiên, lượng thông tin khổng lồ đó cũng tạo ra những
    khó khăn lớn trong việc tìm kiếm, chia sẻ thông tin
    trên WWW. Hiện nay, thông tin trên WWW được
    biểu diễn chủ yếu dưới dạng Ngôn ngữ tự nhiên (các
    trang Web trên Ngôn ngữ HTML). Cách biểu diễn đó
    phù hợp với con người nhưng lại gây ra nhiều khó
    khăn cho các chương trình làm nhiệm vụ hỗ trợ tìm
    kiếm, chia sẻ và trao đổi tin. Chương trình máy tính
    không “hiểu” được thông tin và dữ liệu biểu diễn dưới
    dạng thích hợp với con người.
    Để giải quyết vấn đề này, nhiều tổ chức nghiên cứu
    và Kinh doanh đã phối hợp nghiên cứu và Phát triển
    Web có ngữ nghĩa (Semantic Web). Theo định nghĩa
    của Tim Berners_Lee giám đốc tổ chức World Wide
    Web Consortium (World Wide Web Consortium (W3C)), đồng thời là
    cha đẻ của WWW, Web có ngữ nghĩa là sự mở rộng
    của WWW hiện tại bằng cách thêm vào các mô tả ý
    nghĩa (hay ngữ nghĩa) của thông tin dưới dạng mà
    chương trình máy tính có thể “hiểu” và do vậy cho
    phép xử lý thông tin hiệu quả hơn [1]. Như vậy, Web
    có ngữ nghĩa sẽ bao gồm các thông tin (trang Web)
    được biểu diễn theo cách truyền thống cùng với ngữ
    nghĩa của các thông tin này được biểu diễn một cách
    tường minh. Việc thêm phần ngữ nghĩa cung cấp thêm
    tri thức cho các chương trình (các agent), giúp nâng
    cao chất lượng phân loại, tìm kiếm, trao đổi thông tin.
    Muốn Xây dựng Web có ngữ nghĩa cần có công cụ
    hỗ trợ. Trong bài báo này, chúng tôi mô tả bộ công cụ
    mà chúng tôi Xây dựng phục vụ mục đích này cùng
    với các giải pháp kỹ thuật được lựa chọn và sử dụng.
    Phần quan trọng của bộ công cụ là phần tách thông tin
    tự động cho phép rút ngắn thời gian tạo phần ngữ
    nghĩa cho trang Web. Để minh hoạ cho việc sử dụng
    và thử nghiệm bộ công cụ, bài báo cũng trình bầy một
    ứng dụng tìm kiếm thông tin với những trang Web có
    ngữ nghĩa do bộ công cụ tạo ra.
     
Đang tải...