Thạc Sĩ Tìm hiểu nguồn mở greenstone và ứng dụng

Thảo luận trong 'THẠC SĨ - TIẾN SĨ' bắt đầu bởi Phí Lan Dương, 31/12/13.

  1. Phí Lan Dương

    Phí Lan Dương New Member
    Thành viên vàng

    Bài viết:
    18,524
    Được thích:
    18
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỞ ĐẦU
    Sống trong kỷ nguyên của sự bùng nổ thông tin như hiện nay, một vấn đề
    quan trọng đặt ra là làm sao quản lý thông tin hiệu quả, khoa học nhất, để có thể tìm
    ra một vài thông tin hữu ích trong hàng ngàn, hàng triệu thông tin nhanh chóng,
    chính xác.
    Chúng ta đều biết, cách quản lý tài liệu truyền thống chủ yếu trên giấy có
    những hạn chế nhất định, không chỉ tốn kém không gian lưu trữ, mà còn chiếm
    nhiều thời gian khi muốn tìm kiếm thông tin. Ngoài ra còn khó bảo quản trong thời
    gian lâu dài dưới những điều kiện xấu, dễ hư hỏng, mất mát. Chưa kể việc khai thác
    sản xuất giấy làm ảnh hưởng tới môi trường sinh thái.
    Máy tính ra đời, giúp giải quyết rất nhiều vấn đề liên quan đến việc quản lý
    thông tin. Hình thức lưu trữ tài liệu dưới dạng điện tử ngày càng thông dụng hơn.
    Thử làm một ví dụ nhỏ để so sánh giữa hình thức lưu trữ trên giấy với trên máy
    tính, ở dạng điện tử. Mỗi hình thức lưu trữ có những ưu khuyết điểm riêng nhưng ở
    đây chỉ so sánh về không gian lưu trữ, và thời gian tìm kiếm, truy xuất thông tin, mà
    không tính đến những yếu tố khác. Đơn vị dung lượng lưu trữ phổ biến hiện nay là
    Gigabyte. Một cuốn sách 200 trang lưu trên đĩa cần khoảng 1 megabyte. Như vậy
    một gigabyte có thể lưu trữ khoảng một ngàn cuốn sách điện tử. Trong khi đó, để
    lưu trữ một ngàn cuốn sách giấy truyền thống cần một kệ sách đầy từ sàn cho đến
    trần nhà, chưa kể tiền mặt bằng, tiền in ấn, phát hành! Khi mà yêu cầu thông tin đòi
    hỏi nhanh chóng, chính xác, tài liệu điện tử càng thể hiện những khả năng ưu việt
    của mình. Cảm thấy rất tâm đắc với những hệ thống quản lý dữ liệu như vậy, chúng
    em đã chọn đề tài “Tìm hiểu nguồn mở Greenstone và Ứng dụng” để làm đề tài Tốt
    nghiệp, với mong muốn hiểu thêm về cách quản lý thông tin, từ đó mong muốn
    đóng góp phần nào vào việc xây dựng thư viện điện tử cho Khoa Công nghệ Thông
    tin, Trường Đại học Khoa học Tự nhiên, Thành phố Hồ Chí Minh.
    v
    NỘI DUNG
    Nội dung Luận văn được tổ chức thành 9 chương:
    Chương 1 – Tổng quan. Giới thiệu về thư viện điện tử và Greenstone.
    Trong chương này sẽ trình bày lý do và các mục tiêu khi thực hiện đề tài.
    Chương 2 – Các khái niệm cơ bản trong Greenstone. Mục đích của chương
    này là giải thích, làm sáng rõ những khái niệm quan trọng trong Greenstone.
    Chương 3 – Xây dựng bộ sưu tập. Tìm hiểu các quá trình thực thi của
    Greenstone để tạo nên một bộ sưu tập hoàn chỉnh.
    Chương 4 – Hiệu chỉnh giao diện của Greenstone. Khai thác khả năng tuỳ
    biến cao của Greenstone để thay đổi giao diện cho phù hợp với yêu cầu thực tế.
    Chương 5 – Hệ thống Web Greenstone. Đi sâu vào những khái niệm nâng
    cao của hệ thống Greenstone, tập trung vào phần xử lý trên web của hệ thống.
    Chương 6 – Xây dựng ứng dụng. Xây dựng thư viện số ITDL cho Khoa.
    Trong chương này sẽ xác định yêu cầu thực tế, xác định hai mô-đun chính của hệ
    thống: ITLib và ITLibWeb.
    Chương 7 – ITLib – Mô-đun xử lý offline. Chương này phân tích thiết kế
    hệ thống ITLib với chức năng chính là tạo các bộ sưu tập.
    Chương 8 – ITLibWeb – Mô-đun xử lý online. Chương này sẽ phân tích,
    thiết kế hệ thống ITLibWeb với giao diện web, tạo thư viện số, giúp người dùng sử
    dụng các bộ sưu tập cũng như các chức năng, nghiệp vụ thư viện khác.
    Chương 9 – Đánh giá và hướng phát triển. Chương cuối cùng của đề tài,
    tổng hợp lại về Greenstone, đánh giá lại hệ thống thư viện điện tử ITDL và nêu
    những hướng phát triển hệ thống trong tương lai.
    Ngoài ra, các phần Phụ lục ở cuối Luận văn còn mở rộng các khía cạnh liên
    quan đến thư viện số, các thành phần cấu thành nên Greenstone (MG, GDBM ) và
    các mô-đun hỗ trợ Greenstone.
    vi
    MỤC LỤC
    LỜI CẢM ƠN . iii
    MỞ ĐẦU . iv
    MỤC LỤC . vi
    DANH SÁCH HÌNH . xi
    DANH SÁCH BẢNG . xiv
    PHẦN 1. TÌM HIỀU NGUỒN MỞ GREENSTONE .1
    CHƯƠNG 1. TỔNG QUAN .2
    1.1. Thư viện và thư viện số 3
    1.1.1. Giới thiệu 3
    1.1.2. Thư viện số 3
    1.2. Thư viện số Greenstone 4
    1.2.1. Giới thiệu 4
    1.2.2. Tính năng 5
    1.3. Mục đích của đề tài 6
    CHƯƠNG 2. CÁC KHÁI NIỆM CƠ BẢN 7
    2.1. Tài liệu 8
    2.2. Bộ sưu tập .8
    2.3. Tìm kiếm 8
    2.4. Duyệt tài liệu 8
    2.5. Metadata .10
    2.6. Biên mục .11
    2.7. Plugin 11
    2.7.1. Giới thiệu 11
    2.7.2. Danh sách các plugin 12
    2.7.3. Các plugin xử lý tài liệu độc quyền 13
    2.7.4. Gán thông tin metadata từ một tập tin mô tả 14
    2.7.5. Chia cấu trúc tài liệu nguồn 16
    2.8. Classifier .22
    2.8.1. Giới thiệu 22
    2.8.2. Phân loại 23
    2.9. Định dạng cách hiển thị tài liệu 25
    2.9.1. Giới thiệu 25
    2.9.2. Định dạng danh sách tài liệu .25
    2.9.3. Định dạng các thành phần của trang web hiển thị tài liệu 28
    CHƯƠNG 3. XÂY DỰNG BỘ SƯU TẬP .30
    3.1. Giới thiệu 31
    3.2. Chương trình mkcol.pl .33
    3.3. Chương trình import.pl .33
    3.4. Chương trình buildcol.pl 35
    3.5. Cấu trúc thư mục của Greenstone 37
    3.6. Cấu trúc thư mục của một bộ sưu tập .38
    3.7. Cấu trúc tài liệu theo định dạng XML 39
    vii
    3.8. Tập tin cấu hình bộ sưu tập 42
    CHƯƠNG 4. HIỆU CHỈNH GIAO DIỆN GREENSTONE .45
    4.1. Giới thiệu 46
    4.2. Ảnh tiêu đề bộ sưu tập 48
    4.3. Các nút duyệt trang .48
    4.3.1. Cách hiển thị .48
    4.3.2. Vị trí đặt các ảnh .51
    4.4. Ảnh tiêu đề trang 52
    4.5. Các nút duyệt tài liệu 53
    4.5.1. Giới thiệu 53
    4.5.2. Vị trí đặt các ảnh .53
    4.5.3. Thêm nút mới 54
    4.5.3.1. Tạo một nút mới dựa vào nút đã có .55
    4.5.3.2. Tạo macro mới cho một nút 55
    4.5.4. Xóa nút duyệt tài liệu 56
    4.5.5. Thay đổi nút duyệt tài liệu 56
    4.6. Hiển thị văn bản .56
    4.6.1. Hiển thị loại CL list .56
    4.6.2. Hiển thị nội dung 57
    4.7. Override các macro 58
    4.8. Thêm một trang mới .60
    4.9. Hiển thị các bộ sưu tập .61
    4.10. Macro chuẩn .62
    4.11. Lưu ý .63
    CHƯƠNG 5. HỆ THỐNG WEB GREENSTONE .64
    5.1. Giới thiệu 65
    5.2. Tổng quan về cơ chế xử lý .65
    5.3. Chi tiết về cơ chế xử lý .67
    5.4. Mã nguồn 69
    5.4.1. Các lớp và hàm cơ bản 70
    5.4.2. Collection server .70
    5.4.3. Receptionist .72
    PHẦN 2. XÂY DỰNG ỨNG DỤNG .75
    CHƯƠNG 6. XÂY DỰNG ỨNG DỤNG .76
    6.1. Tổng quan .77
    6.1.1. Phát biểu bài toán 77
    6.1.2. Giới thiệu về ITDL (IT Digital Library) .77
    6.2. Đối tượng sử dụng hệ thống .78
    6.3. Các chức năng chính 78
    6.3.1. Cung cấp thông tin luận văn .78
    6.3.2. Chuẩn hoá tài liệu .78
    6.3.3. Xây dựng bộ sưu tập .78
    6.3.3.1. Xây dựng bộ sưu tập Luận văn 79
    6.3.3.2. Xây dựng bộ sưu tập Sách .79
    6.3.3.3. Xây dựng bộ sưu tập Tổng quát 79
    viii
    6.3.4. Tra cứu tài liệu 79
    CHƯƠNG 7. ITLIBWEB 80
    7.1. Xác định yêu cầu 81
    7.1.1. Giới thiệu 81
    7.1.2. Bảng chú giải 81
    7.1.2.1. ITLib 81
    7.1.2.2. Greenstone .82
    7.1.2.3. Thanh vien Khoa (Thành viên Khoa) 82
    7.1.3. Đặc tả bổ sung .82
    7.1.3.1. Phạm vi 82
    7.1.3.2. Tài liệu tham khảo .82
    7.1.3.3. Chức năng 82
    7.1.3.4. Tính khả dụng 82
    7.1.3.5. Tính ổn định .83
    7.1.3.6. Sự hỗ trợ 83
    7.1.3.7. Tính bảo mật: .83
    7.1.3.8. Các ràng buộc thiết kế .83
    7.1.4. Mô hình Use Case .83
    7.1.4.1. Mô hình 83
    7.1.4.2. Danh sách các Actor 85
    7.1.4.3. Danh sách các Use Case 85
    7.1.4.4. Đặc tả các Use case chính .86
    7.2. Phân tích các Use case chính 90
    7.2.1. Use case “Dang nhap” (Đăng nhập) .90
    7.2.1.1. Lược đồ tuần tự 90
    7.2.1.2. Lược đồ cộng tác .92
    7.2.1.3. VOPC .93
    7.2.2. Use case “Nhap luan van” (Nhập luận văn) .94
    7.2.2.1. Lược đồ tuần tự 94
    7.2.2.2. Lược đồ cộng tác .97
    7.2.2.3. VOPC .99
    7.2.3. Use case “Tra cuu” (Tra cứu) .100
    7.2.3.1. Lược đồ tuần tự 100
    7.2.3.2. Lược đồ cộng tác .100
    7.2.3.3. VOPC .102
    7.2.4. Use case “Xem luan van” (Xem thông tin luận văn) 102
    7.2.4.1. Lược đồ tuần tự 102
    7.2.4.2. Lược đồ cộng tác .103
    7.2.4.3. VOPC .104
    7.3. Thiết kế .105
    7.3.1. Lược đồ lớp tổng quát của hệ thống .105
    7.3.2. Chi tiết một số lớp chính .107
    7.3.2.1. Lớp đối tượng dùng chung 107
    7.3.2.2. Lớp boundary .107
    7.3.2.3. Lớp control 108
    ix
    7.3.2.4. Lớp entity .109
    7.3.3. Thiết kế dữ liệu .110
    7.3.3.1. Mô hình dữ liệu .110
    7.3.3.2. Danh sách các bảng dữ liệu .110
    7.3.4. Thiết kế giao diện một số trang web chính .111
    7.4. Cài đặt .113
    7.4.1. Công cụ và môi trường phát triển hệ thống 113
    7.4.2. Mô hình cài đặt .114
    7.4.2.1. Mô hình 114
    7.4.2.2. Diễn giải 114
    CHƯƠNG 8. ITLib 115
    8.1. Xác định yêu cầu 116
    8.1.1. Giới thiệu 116
    8.1.2. Bảng chú giải 116
    8.1.2.1. Bộ sưu tập 116
    8.1.2.2. Thủ thư 116
    8.1.2.3. Quản trị hệ thống .117
    8.1.2.4. ITLibWeb 117
    8.1.3. Đặc tả bổ sung .117
    8.1.3.1. Phạm vi 117
    8.1.3.2. Tài liệu tham khảo .117
    8.1.3.3. Chức năng 117
    8.1.3.4. Tính khả dụng 117
    8.1.3.5. Tính ổn định .117
    8.1.3.6. Hiệu suất 118
    8.1.3.7. Sự hỗ trợ 118
    8.1.3.8. Tính bảo mật 118
    8.1.3.9. Các ràng buộc thiết kế .118
    8.1.4. Mô hình Use Case .118
    8.1.4.1. Lược đồ chính của mô hình Use case 118
    8.1.4.2. Danh sách Actor 119
    8.1.4.3. Danh sách Use case .119
    8.1.4.4. Đặc tả các Use case chính .119
    8.2. Phân tích các Use case chính 127
    8.2.1. Use case “Chuan hoa Tai lieu” .127
    8.2.1.1. Lược đồ tuần tự 127
    8.2.1.2. Lược đồ cộng tác .127
    8.2.1.3. VOPC .128
    8.2.2. Use case “QL BST Luan van” 129
    8.2.2.1. Lược đồ tuần tự 129
    8.2.2.2. Lược đồ cộng tác .131
    8.2.2.3. VOPC .135
    8.3. Thiết kế .136
    8.3.1. Sơ đồ lớp đối tượng của hệ thống .137
    8.3.2. Chi tiết một số lớp đối tượng 138
    x
    8.3.2.1. Các lớp boundary .138
    8.3.2.2. Các lớp control 139
    8.3.2.3. Các lớp entity .140
    8.3.3. Thiết kế dữ liệu .140
    8.3.3.1. Mô hình dữ liệu .140
    8.3.3.2. Danh sách các bảng dữ liệu .142
    8.3.4. Thiết kế giao diện 142
    8.3.4.1. Màn hình Chuẩn hoá Tài liệu 143
    8.3.4.2. Màn hình thu thập dữ liệu (cho tất cả các bộ sưu tập) 143
    8.3.4.3. Màn hình quản lý thông tin bộ sưu tập (cho tất cả các bộ sưu tập)
    144
    8.3.4.4. Màn hình tiến hành xây dựng bộ sưu tập (cho tất cả các bộ sưu
    tập) 144
    8.3.4.5. Màn hình quản lý thông tin Luận văn .145
    8.3.4.6. Màn hình quản lý thông tin Sách/Giáo trình .145
    8.3.4.7. Màn hình quản lý thông tin một bộ sưu tập tổng quát 146
    8.4. Cài đặt .146
    8.4.1. Công cụ và môi trường phát triển hệ thống 146
    8.4.2. Mô hình cài đặt .147
    8.4.2.1. Mô hình 147
    8.4.2.2. Diễn giải 147
    PHẦN 3. TỔNG KẾT .149
    CHƯƠNG 9. ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN 150
    9.1. Đánh giá .150
    9.2. Hướng phát triển .150
    PHỤ LỤC A. GIỚI THIỆU VỀ SEARCH ENGINE .151
    PHỤ LỤC B. CÁC THƯ VIỆN SỐ Ở VIỆT NAM .154
    PHỤ LỤC C - CÁC THÀNH PHẦN HỖ TRỢ GREENSTONE 156
    TÀI LIỆU THAM KHẢO .167
     

    Các file đính kèm:

Đang tải...