Luận Văn Tìm hiểu semantic web và xây dựng ứng dụng minh họa

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Mai Kul, 28/11/13.

  1. Mai Kul

    Mai Kul New Member

    Bài viết:
    1,299
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    Đồ án tốt nghiệp
    Đề tài: TÌM HIỂU SEMANTIC WEB VÀ XÂY DỰNG ỨNG DỤNG MINH HỌA (Rút trích và chuyển đổi dữ liệu trong cơ sở dữ liệu quan hệ thành dữ liệu dạng RDF)


    MỤC LỤC
    LỜI NÓI ĐẦU . 1
    NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN . 4
    Chương 1. GIỚI THIỆU SEMANTIC WEB 8
    1.1 Web hiện tại và những hạn chế của nó . 8
    1.2 Semantic Web 8
    1.2.1 Khái niệm Semantic Web . 9
    1.2.2 Một số đặc trưng của Semantic Web 10
    1.2.3 Kiếntrúc Semantic Web . 11
    Chương 2. RDF –NỀN TẢNG CỦA SEMANTIC WEB . 16
    2.1 Các khái niệm cơ bản về RDF . 18
    2.1.1 Resources . 18
    2.1.2 Properties . 18
    2.1.3 Statements . 18
    2.1.4 Ví dụ về statements 19
    2.1.5 Reification . 21
    2.1.6 Data Types (Các kiểu dữ liệu) 21
    2.1.7 Các hạn chế của RDF . 22
    2.2 RDF: XML -Base Syntax (RDF dựa trên cú pháp XML) 23
    2.2.1 Thuộc tính rdf:resource 25
    2.2.2 Nested Descriptions (sự mô tả lồng nhau) 26
    2.2.3 The rdf:type Element (phần tử kiểu) . 27
    2.2.4 Abbreviated Syntax (cú pháp viết tắt) . 27
    2.2.5 Container Elements 28
    2.3 RDF Schema: Basic Ideas 32
    2.3.1 Classes and Properties . 33
    2.3.2 Class Hierarchies and Inheritance . 33
    2.2.3 Property Hierarchies . 35
    6
    2.3.4 RDF versus RDFS Layers 35
    2.4 Ngôn ngữ RDFS 36
    2.4.1 Các lớp cơ bản trong RDFS 37
    2.4.2 Các property cơ bản cho việc định nghĩa các mối liên hệ 37
    2.4.3 Các property cơ bản cho việc giới hạn của property . 37
    2.4.4 Container class . 38
    2.4.5 Các property tiện ích 39
    2.4.6 Ví dụ: RDFS mô tả về các giảng viên và các khóa học . 39
    2.5 Tóm tắt các lớp và các property của RDF và RDFS . 40
    2.5.1 Tóm tắt các lớp trong RDFS . 41
    2.5.2 Tóm tắt các lớp trong RDF . 41
    2.6 OWL (Ontology Web Language), ngôn ngữ mở rộng của RDF . 42
    2.6.1 Các phiên bản của OWL . 43
    2.6.2 Một số ví dụ về OWL . 44
    Chương 3. GIỚI THIỆU BỘ CÔNG CỤ MÃ NGUỒN MỞ JENA 46
    Chương 4. CHUYỂN ĐỔI DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU THÀNH DỮ
    LIỆU DẠNG RDF . 48
    4.1 Giới thiệu 48
    4.2 Ý tưởng . 49
    4.3 Sơ đồ thực hiện giải thuật: . 49
    4.4 Chi tiết thực hiện giải thuật: 50
    4.4.1 Mô tả các thuộc tính của Database . 50
    4.2.2 Phát biểu SELECT để rút trích dữ liệu . 50
    4.2.3 Tạo RDFS 51
    4.2.4 Tạo file RDF 51
    4.5 Ví dụ . 52
    4.5.1 Bảng mô tả các thuộc tính: . 53
    4.5.2 Phát biểu SELECT để rút trích dữ liệu: 53
    4.5.3 File RDFS 54
    4.5.4 File RDF 54
    7
    4.6 Đánh giá giải thuật . 55
    Chương 5. CÀI ĐẶT ỨNG DỤNG . 55
    5.1 Mô tả ứng dụng: 55
    5.2 Các yêu cầu của ứng dụng . 56
    5.2.1 Yêu cầu về giao diện 56
    5.2.2 Yêu cầu chức năng . 56
    5.3 Triển khai ứng dụng 56
    5.4 Hoạt động của hệ thống . 56
    5.4.1 Kết nối với cơ sở dữ liệu 56
    5.4.3 Tạo RDF và RDFS trực tiếp bằng câu lệnh select: 65
    KẾT LUẬN 68
    TÀI LIỆU THAM KHẢO . 68
    8
    Chương 1
    GIỚI THIỆU SEMANTIC WEB
    1.1 Web hiện tại và những hạn chế của nó
    Từ khi ra đời đến nay, Web đóng một vai trò quan trọng trong cuộc sống hàng
    ngày của con người. Nhờ có Web mà việc trao đổi thông tin trên Web dễ dàng hơn bao
    giờ hết. Cùng với sự phát triển của Web, nhu cầu của con người trên Web cũng ngày
    càng to lớn từ việc tìm kiếm thông tin đến việc chia sẻ dữ liệu giữa các ứng dụng độc
    lập .
    Tuy nhiên, khối lượng các tài nguyên trên Web là vô cùng to lớn, điều này làm
    nảy sinh vấn đề nghiêm trọng là làm thế nào để tìm kiếm chính xác tài nguyên mình
    mong muốn. Dữ liệu trong các file HTML hữu ích trong một vài ngữ cảnh nhưng vô
    nghĩa đối với những ngữ cảnh khác. Thêm vào đó HTML không thể mô tả về dữ liệu
    đóng gói trong nó. Vấn đề là hầu hết dữ liệu trên Web hiện tại đều ở dạng HTML,
    không có một hệ thống chung nào đảm bảo việc xuất bản dữ liệu theo cách mà dữ liệu
    đó có thể xửlý được bởi nhiều chương trình khác nhau cho nên dữ liệu trên Web rất
    khó trong việc sử dụng ở phạm vi rộng lớn. Vì vậy, nếu như các thành phần chính yếu
    của dữ liệu trong Web trình bày theo dạng thức thông thường, thì thật khó sử dụng dữ
    liệu này một cách phổ biến. Một thiếu sót của Web hiện nay là thiếu cơ cấu hiệu quả
    để chia sẻ dữ liệu vì các ứng dụng được phát triển một cách độc lập. Do đó cần phải
    mở rộng thế hệ Web hiện tại để máy tính có thể hiểu, tích hợp dữ liệu, cũng như tái sử
    dụng dữ liệu thông qua các ứng dụng khác nhau.
    1.2 Semantic Web
    Thế hệ Web đầu tiên bắt đầu với những trang HTML tĩnh. Thế hệ thứ hai dựa
    trên nền tảng XML và HTML để tạo nên những trang Web sống động hơn. Dữ liệu
    Web dưới dạng XML dựa vào các file CSS hay XSLT để biến đổi thành dạng HTML
    và thể hiện lên trên trình duyệt. Thế hệ thứ ba được gọi là Semantic Web với mục đích
    là thông tin sẽ do máy tự động xử lý. Theo Tim Berners-Lee đã mô tả trong cuốn sách
    "Weaving the Web" [Berners-Lee, 1999] : "Semantic Web sẽ làm cho các dịch vụ
    thông minh hơn ví dụ như môi giới thông tin, tác nhân tìm kiếm, bộ lọc thông
    9
    tin .Những dịch vụ thông minh trên hệ thống Web giàu ngữ nghĩa như thế chắc hẳn sẽ
    vượt trội hơn những phiên bản sẵn có hiện tại của các dịch vụ này."
    1.2.1 Khái niệm Semantic Web
    Semantic Web là một mạng lưới thông tin được liên kết theo phương pháp sao
    cho thông tin có thể dễ dàng được xử lý bởi các máy tính trên toàn cầu. Nó được xem
    là cách mô tả thông tin rất hiệu quả trên World Wide Web, và nó cũng được xem là
    một cơ sở dữ liệu có khả năng liên kết toàn cầu.
    Semantic Web được đề xuất bởi Tim Berners-Lee, người phát minh ra WWW,
    URIs, HTTP, và HTML. Hiện tại có một đội ngũ chuyên gia ở World Wide Web
    consortium (W3C) đang làm việc để hoàn thiện, mở rộng và chuẩn hóa hệ thống, các
    ngôn ngữ, xuất bản các bài báo về Semantic Web. Một số công cụ và một số nghiên
    cứu đã được hoàn thiện cho Semantic Web. Tuy nhiên công nghệ Semantic Web còn
    rất bé trong buổi ban đầu của nó. Mặc dù tương lai của dự án được phát thảo rất là
    sáng sủa nhưng hiện nay dường như còn ít sự đồng tình về phương hướng và các đặc
    trưng của một Semantic Web còn rất non trẻ.
    Semantic Web là sự mở rộng của Web hiện tại mà trong đó thông tin được định
    nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách
    hiệu quả hơn. Mục tiêu của Semantic Web là để phát triển các chuẩn chung và công
    nghệ cho phép máy tính có thể hiểu được thông tin nhiều hơn trên Web, sao cho
    chúng có thể hỗ trợ tốt hơn việc khám phá thông tin, tích hợp dữ liệu, và tự động hóa
    các công việc.
    Ví dụ: Ta cần tìm thông tin về chủ tịch Hồ Chí Minh. Một chương trình tìm
    kiếm thông thường có thể đưa ra hàng nghìn kết quả khác nhau trong đó có những kết
    quả không mong muốn như Hồ Chí Minh không phải là tên một người mà là tên của
    thành phố. Một chương trình tìm kiếm trên Semantic Web dựa vào dữ liệu mô tả về
    các danh nhân có thể đưa ra chính xác kết quả mà ta mong muốn, đồng thời nó có thể
    còn chỉ ra rằng Hồ Chí Minh còn là tác giả của tập thơ Nhật ký trong tù.
    Semantics Web liên kết các nguồn khác nhau (tài liệu, hình ảnh, con người,
    khái niệm, ) cho phép chúng ta mở rộng Web thành một môi trường mới với tập các
    mối quan hệ mới (như hasLocation, worksFor, isAuthorOf, hasSubjectOf, dependsOn,
    10
    .) giữa các nguồn dữ liệu, tạo ra các mối liên hệ ngữ cảnh giữa các đối tượng của các
    nguồn dữ liệu (contextual relationship), điều mà Web hiện tại chưa làm được.
    Hình 1.1 Sự liên kết giữa nhiều nguồn dữ liệu khác nhau
    1.2.2 Một số đặc trưng của Semantic Web
    1.2.2.1Máy tính có thể hiểu được dữ liệu trên Web
    Những thông tin trên Web hiện tại chỉ dành cho người đọc, máy tính chỉ đơn
    thuần hiển thị các thông tin cho con người chứ hoàn toàn không hiểu được những
    thông tin này. Dữ liệu trên Semantic Web sẽ làm cho máy hiểu những thông tin mà nó
    cung cấp cho con người. Ví dụ:
    ã The Beatles là một ban nhạc nổi tiếng của Liverpool.
    ã John Lennon là một thành viên của The Beatles.
    1.2.2.2Thông tin được tìm kiếm nhanh chóng và chính xác hơn:
    Với Semantic Web, việc tìm kiếm sẽ dễ dàng vì mọi thứ được đặt trong ngữ
    cảnh. Mục tiêu của Semantic Web là phát triển các tiêu chuẩn và kĩ thuật để giúp máy
    tính hiểu nhiều thông tin trên Web hơn, để chúng tìm ra các thông tin dồi dào hơn, tích
    hợp, duyệt dữ liệu, và tự động hóa các thao tác. Với Semantic Web, chúng ta không
    những nhận được những thông tin chính xác hơn khi tìm kiếm thông tin từ máy tính,
    11
    mà máy tính còn có thể giúp ta tích hợp thông tin từ nhiều nguồn khác nhau, biết so
    sánh các thông tin với nhau.
    1.2.2.3 Dữ liệu liên kết động
    Với Semantic Web, chúng ta có thể kết hợp các thông tin đã được mô tả một
    cách giàu ngữ nghĩa với bất kì nguồn dữ liệu nào.
    Ví dụ, bằng cách thêm các metadata (dữ liệu về dữ liệu) cho các tài liệu khi tạo
    ra nó, chúng ta có thể tìm kiếm các tài liệu của tác giả Tim Berners-Lee. Cũng nhờ
    metadata mà máy tính có thể tìm cho chúng ta chỉ những tài liệu thuộc loại tài liệu
    nghiên cứu của một tác giả nào đó.
    Dựa vào sự liên kết, tham chiếu giữa cácđối tượng với nhau thông qua các mối
    quan hệ giữa các đối tượng, máy tính có thể cung cấp cho ta sự liên quan giữa đối
    tượng này với các đối tượng khác. Trong Semantic Web mỗi thuộc tính của mỗi đối
    tượng được xem là duy nhất (vì chúng được biễu diễn thông qua các không gian tên
    riêng biệt) do đó mối quan hệ giữa các đối tượng mà máy tính chỉ ra là chính xác.
    Ví dụ dựa vào thuộc tính hasManual, isBasedOn, hasAuthor (hình 1.1), máy
    tính có thể chỉ ra tài liệu liên quan đến một software, và tài liệu này dựatrên tài liệu
    của một tác giả nào đó. Đồng thời máy tính còn có khả năng chỉ ra được địa chỉ của tác
    giả đó thông qua thuộc tính liveAt.
    1.2.2.4 Hỗ trợ công cụ tự động hóa
    Dữ liệu trong Semantic Web được đánh dấu, phân lớp, mô hình hóa, được bổ
    sung thêm các thuộc tính, các mối liên hệ theo các lĩnh vực cụ thể, qua đó giúp cho
    các phần mềm máy tính có thể hiểu được dữ liệu và tự động xử lý được những dữ liệu
    đó.
    1.2.3 Kiến trúc Semantic Web
    Semantic Web là một tập hợp hay một chồng (stack) các lớp.Tất cả các lớp của
    Semantic Web được sử dụng để đảm bảo độ an toàn và giá trị thông tin trở nên tốt
    nhất. Tuy nhiên từ tầng Logic trở lên có thể được xem là các tầng xử lý của Semanic
    Web. Ở các tầng này việc mô tả ngôn ngữ ít hơn nhiều so với việc suy luận, xử lý dữ
    liệu. Đây chính là một mảng ứng dụng của hệ chuyên gia, trí tuệ nhân tạo vào
    Semantic Web.
    12


    TÀI LIỆU THAM KHẢO
    [1] Grigoris Antoniou and Frank van Harmelen (2004), A Semantic Web Primer,
    The MIT Press.
    [2] Shelley Powers (2003), Practical RDF, O'Reilly.
    [3] Tim Berners-Lee (1998), Relational Databases on the Semantic Web,
    http://www.w3.org/DesignIssues/RDB-RDF.html.
    [3] http://infomesh.net/2001/swintro/
    [4] http://logicerror.com/semanticWeb-long
    [5] http://www.w3.org/TR/rdf-primer/
    [6] http://www.w3.org/TR/2004/REC-owl-ref-20040210/
    [7] http://www.w3.org/TR/2004/REC-rdf-mt-20040210/
     

    Các file đính kèm:

Đang tải...