Luận Văn Xây dùng wrapper cho nguồn dữ liệu Web trong hệ thống tích hợp dữ liệu

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Julie Nguyễn, 9/12/13.

  1. Julie Nguyễn

    Julie Nguyễn New Member

    Bài viết:
    970
    Được thích:
    2
    Điểm thành tích:
    0
    Xu:
    0Xu
    Lời giới thiệu
    Thông tin ngày càng đóng một vị trí quan trọng trong cuộc sống. Vấn đề lưu trữ và khai thác thông tin đang trở lên cấp thiết hơn bao giờ hết. Lượng thông tin mà ta tiếp xúc là rất lớn, do đó để lựa chọn các thông tin thích hợp là vấn đề không đơn giản. Từ nhu cầu đó sự ra đời của một hệ thống tích hợp thông tin là tất yếu.
    Trên tinh thần nghiên cứu học hỏi các kỹ thuật tích hợp dữ liệu. Nhóm 4 sinh viên chúng em đã nghiên cứu và cài đặt một hệ tích hợp BKDATIS. Đây là hệ thống phát triển tại trung tâm tính toán hiệu năng cao trường Đại học Bách Khoa Hà Nội.
    Hệ thống của chúng em chia làm 4 phần. Trong đó em tham gia phần xây dựng wrapper cho nguồn dữ liệu Web. Đây là đóng gói nguồn dữ liệu Web cung cấp cho tầng trên một giao diện truy cập thống nhất, đơn giản và độc lập
    Cấu trúc đồ án của em có 5 phần: Chương 1: Giới thiệu về hệ thống tích hợp dữ liệu. Chương 2 : Cơ sỏ lý thuyết : Trình bày các kỹ thuật, lý thuyết sử dụng để xây dựng wrapper trong BKDATIS. Chương 3 : Cài đặt : Trình bày mô hình, cài đặt cụ thể wrapper. Chương 4 : Nhận xét đánh giá.
    Do hạn chế về thời gian cũng như kinh nghiệm, nên đồ án không tránh khỏi những thiếu sót. Kính mong thày cô góp ý, hướng dẫn thêm cho chúng em hoàn thiện dự án này.
    Em xin chân thành cảm ơn TS Nguyễn Thanh Thuỷ. Người luôn quan tâm nhắc nhở, hướng dẫn, tạo mọi điều kiện để em hoàn thành đồ án tốt nghiệp này.
    Em vô cùng cảm ơn TS Trần Đình Khang. Người đã tận tình chỉ bảo, góp ý trong qỳa trỡnh làm đồ án.
    Em cũng vô cùng biết ơn ThS Tạ Tuấn Anh. Người đó cú những đóng góp quý báu, đưa ra các mô hình, giải pháp thực hiện giúp bọn em chọn một hướng đi tốt nhất.
    Cuối cùng em rất cảm ơn các thày cô, anh chị và các bạn trên trung tâm Tính toán hiệu năng cao đã tạo mọi điều kiện, giúp đỡ em thực hiện đồ án này.

    Chương I : GIỚI THIỆU
    1.1. Các hệ thống tích hợp dữ liệu
    Khi xã hội phát triển, con người ngày càng phải tiếp xúc với nhiều thông tin hơn. Từ thời nguyên thuỷ khi thông tin cũn ớt con người chưa có nhu cầu về các phương tiện lưu trữ thông tin. Tuy nhiên cùng với thời gian, khi mà lượng thông tin ngày càng nhiều lờn, thỡ bắt đầu xuất hiện chữ viết cựng cỏc phương tiện lưu giữ chúng như vỏ cây, da thỳ, rồi đến các phương tiện tiên tiến hơn như giấy, sách vở, Khi mà lượng sách vở quá nhiều lại xuất hiện nhu cầu tổ chức lưu trữ chúng để sử dụng, và quản lý hiệu quả hơn. Con người tập hợp sách thành thư viện, sắp xếp, phân loại để dễ tìm kiến, trao đổi.
    Hiện nay với sự ra đời và phát triển của công nghệ thông tin, thông tin được lưu trữ trên máy tính rất đơn giản dưới nhiều dạng khác nhau. Điều đó dẫn tới sự bùng nổ về thông tin. Tin tức không những quá nhiều mà còn được biểu diễn dưới rất nhiều dạng, nhiều nơi khác nhau. Con người bị tràn ngập trong biển thông tin, và từ đó xuất hiện nhu cầu làm thế nào để khai thác thông tin một cách hiệu quả.
    Bây giờ hóy xột một ứng dụng hiện tại làm việc cơ sở dữ liệu. Con người nhiều khi phải làm việc với nhiều dạng tài liệu khác nhau từ một tài liệu văn bản thông thường, một bảng Exel, một trang Web, hay một cơ sở dữ liệu. Ngay cả với cơ sở dữ liệu cũng tồn tại nhiều mô hình khác nhau như mô hình quan hệ, mô hình hướng đối tượng, mô hình mạng, Các nguồn dữ liệu này không những khác nhau về mô hình mà với sự phát triển của các hệ thống mạng nó cũn được lưu trữ phân tán khắp nơi. Ngoài ra còn một thách thức nữa là các nguồn này luôn thay đổi, bổ xung, cập nhật một cách độc lập. Vì vậy việc thu thập, tích hợp, và trích chọn thông tin là một yêu cầu cần thiết, nó sẽ giúp người sử dụng nắm bắt thông tin một cách hiệu quả và chính xác.
    Tích hợp thông tin là một trong những vấn đề thách thức đối với việc khai thác thông tin và thu hút được nhiều sự quan tâm của các chuyên gia. Hệ thống tích hợp dữ liệu là hệ thống cho phép đưa ra một khung nhìn thống nhất cho việc truy cập tới các nguồn dữ liệu tự trị không đồng nhất và một giao diện truy vấn trờn nó.
     

    Các file đính kèm:

Đang tải...