Đồ Án Xây dựng một số công cụ hổ trợ tra cứu và tổng hợp thông tin trong thư viện số

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    CHƯƠNG 1


    TỔNG QUAN



    Thư viện số là thư viện phục vụ thông tin điện tử ( được số hóa) - được đọc với sự trợ giúp của máy vi tính. Thông tin điện tử có thể được chứa trong những Tư liệu điện tử nằm trong và ngoài thư viện. Tư liệu điện tử bao gồm:
    ã CD-ROM và băng từ - CD-ROM thường chứa những CSDL chuyên ngành,


    được phục vụ riêng lẻ hay trên mạng máy tính.


    ã Tạp chí điện tử - ấn hành trên mạng Internet. Thư viện có thể đặt mua như


    tạp chí in và sẽ được cấp quyền login vào để truy cập.


    ã Cơ sở dữ liệu trực tuyến - có rất nhiều trên mạng Internet do những trường đại học, những cơ sở thông tin, và những công ty tư nhân như LEXIX- NEXIX, DIALOG, vv . - Cũng như tạp chí điện tử, thư viện có thể đặt mua quyền sử dụng.
    ã Tài liệu khác trên Internet - tài liệu trong những web site của những cơ sở chính quyền, trường đại học, công ty, hội đoàn, vv . Việc truy cập thường là miễn phí.
    Thông tin điện tử đôi khi còn bao gồm tư liệu được số hóa, tập hợp dưới hình thức Thư viện số. Tư liệu được số hóa trước tiên là tranh ảnh, tài liệu quý hiếm, vv . Ngày nay nhiều thư viện có khuynh hướng số hóa đại bộ phận tư liệu trong thư viện để phục vụ dưới dạng điện tử.




    1.2. Nghiên cứu về thư viện số tại Mỹ


    Vấn đề nghiên cứu về thư viện số là một trong 5 hướng nghiên cứu chủ yếu về CNTT của Mỹ hiện nay. Những tiến bộ cực kỳ nhanh chóng của kỹ thuật tính toán và mạng máy tính làm cho một tư liệu chỉ trong nháy mắt đã có thể “nhân bản” và chuyển tới hành trăm triệu người trên khắp thế giới.
    Năm 1994, người ta đưa ra một vấn đề gọi là SÁNG KIẾN THƯ VIỆN SỐ


    (SKTVS) mà ngày nay gọi là DLI pha 1. SKTVS pha 1 tập trung làm sáng tỏ từng



    bước các vấn đề về mô hình quan niệm, cấu trúc, những thách thức về tính toán nhằm tạo ra các các kho tri thức nhân loại dạng điện tử. Trong 5 năm, SKTVS pha 1 đã có những thành công bước đầu mà chúng ta đang chứng kiến, chẳng hạn đó là các công cụ tìm kiếm nổi tiếng trên Internet.
    SKTVS pha 2 – DLI pha 2 bắt đầu từ 1999 và đã thu hút rất nhiều nhà khoa học và kỹ sư CNTT, các nhà nghiên cứu của nhiều ngành KHXH, nghệ thuật, sinh học Mục tiêu là phát triển các nguồn tư liệu số, thử nghiệm liên kết giữa các nguồn tư liệu phân tán, thiết lập nguyên tắc, phần mềm và cấu trúc mạng có khả năng liên hợp các tư liệu đa phương tiện thành các bản ghi nhất thể, giải quyết vấn đề ngữ nghĩa hiện đang cản trở việc tích hợp tư liệu số từ các tư liệu từ các sưu tập phân tán và rất khác nhau về cấu trúc. Pha 2 của SKTVS tập trung vào 3 hướng nghiên cứu lớn sau:
    ã Human-centered research-nghiên cứu hỗ trợ việc tạo ra thông tin và sử dụng thông tin.
    ã Content and collections-tạo lập thư viện số chứa đựng các dạng tri thức.


    ã System-centered research-các vấn đề kỹ thuật, phần mềm, phân loại khi tổ


    chức và liên kết các bộ dữ liệu số dạng thức khác nhau thông qua Internet.


    Để hình dung rõ hơn về 3 hướng nghiên cứu trên, chúng ta sẽ lược qua các dự


    án chính, các vấn đề quan trọng nhất của 3 hướng nghiên cứu và triển khai này.






    1.2.1. Human-centered research (nghiên cứu hướng nguời dùng)


    Trong hướng này, có các dự án và chương trình lớn:


    Personalized Retrieval and Summarization of Image, Video, and Language Resources (PERSIVAL). Trong dự án PERSIVAL, các nhà nghiên cứu ở Đại học Columbia đang thử nghiệm thiết kế hệ thống giúp cho các bệnh nhân truy cập dễ dàng và nhanh chóng đến các nguồn thông tin y học trực tuyến thích hợp cho từng người bệnh. http://www.cs.columbia.edu/diglib/PERSIVAL/
    Digital resource designed for children. Các nhà nghiên cứu ở Đại học Maryland phát triển các công cụ thích hợp cho phép nghe, xem, tìm kiếm, hỏi đáp



    và tổ chức thông tin nghe, nhìn, văn bản cho trẻ em.


    http://www.cs.umd.edu/hcil/kiddiglib/


    Technologies and tools for students. Nhiều đại học và cơ quan nghiên cứu như Đại Học Quốc Gia Georgia, Hiệp Hội Máy Tính (Association for Computing Machinery-ACM), Ủỵ Ban Giáo Dục của SIGGRAPH (SIGGRAPH Education Committee) đang phát triển các kỹ thuật và công cụ cho sinh viên để việc truy cập thông tin trực tuyến phục vụ học tập ở đại học được hiệu quả. http://econ.badm.sc.edu/beam/
    Video information college. Dự án được triển khai tại Đại Học Carnegie Mellon nhằm thiết lập môi trường làm việc với các tư liệu video, văn bản, ảnh và âm thanh. http://www.informedia.cs.cmu.edu/
    Alexandria Digital Earth prototype (ADEPT). Đây là một bộ phận của chương trình hợp tác về thư viện số giữa Đại học Berkeley, Đại học Santa Barbara (UCSB), Đại học Stanford, Trung tâm Siêu Máy Tính San Diego và Thư Viện Số California, liên quan chủ yếu đến việc sử dụng các loại thông tin không gian, thư mục hóa chúng, những vấn đề tìm kiếm trên Web
    http:/www.alexandria.ucsb.edu/adept/






    1.2.2. Content and collections (Nội dung và các bộ sưu tập)


    Hướng này tập trung nghiên cứu việc tổ chức các kho thông tin về mọi lĩnh vực tri thức. Một số dự án lớn có thể kể đến như:
    Digital Library for the humanity. Đại Học Tuffs hợp tác với viện Max Planck ở Berlin, Hội Ngôn Ngữ Hiện Đại (the Modern Language Association), Bảo Tàng Nghệ Thuật Boston (the Boston Museum of Fine Arts) và Tổ Hợp Xuất Bản Điện Tử Stoa (the Stoa electronic pubishing consortium) phát triển một thư viện điện tử chứa các tư liệu từ thời Ai Cập cổ đại đến thế kỷ 19. http://www.perseus.tuffs.edu
    National Gallery of Spoken Word (NGSW). Đại Học Quốc Gia Michigan đang thực hiện một thư viện các bài nói lịch sử suốt thế kỷ 20 với các công cụ xử lý hiệu quả. http://www.ngsw.org/app.html.



    National digital library for science, mathematics, engineering, ang technology education (SMETE). Đại Học Berkeley California phát triển một thư viện số tập hợp các ngành khoa học, toán học và công nghệ hỗ trợ việc học tập ở bậc phổ thông trung học. http://www.needs.org
    Digital Atheneum. Đại Học Kentucky được Quỹ Khoa Học Quốc Gia tài trợ phối hợp với Thư Viện Anh và Chương Trình Shared University Research của IBM đang làm việc với kho tư liệu của Thư Viện Anh chứa đựng các tư liệu cổ của Hi Lạp, Do Thái từ thế kỷ 17. http://www.digitalatheneum.org.
    Digital workflow management. Hơn 29.000 ngàn bản nhạc Mỹ từ 1790 đến 1960 đang được Đại Học Hopkins chuyển thành một thư viện số. http://levysheetmusic.mse.jhu.edu
    Data provenance. Các nghiên cứu tại Đại Học Pennsylvania hướng tới vấn đề nan giải bậc nhất của các tập hợp dữ liệu trực tuyến. Đó là độ trung thực của một bản tin số và những vấn đề liên quan, có thể xếp vào nhóm các vấn đề hệ thống
    được trình bày dưói đây. http://db.cis.upenn.edu/Research/ptovenance.html






    1.2.3. System-centered research (nghiên cứu hướng hệ thống )


    Phát triển các thư viện số đòi hỏi phải giải quyết rất nhiều vấn đề về hệ thống. Có thể nêu vài cái trong số các vấn đề quan trọng mà các nhà khoa học Mỹ đang tập trung giải quyết:
    New model for scholarly publishing. Bản chất vấn đề là việc xuất bản bây giờ khác xa cách in ấn truyền thống. Xuất bản tức thời, phân tán, liên tục Mọi quy trình đều phải thay đổi thích hợp để thực hiện việc “xuất bản” trên các hệ thống tính toán phân tán. Vấn đề đang được Đại Học Berkeley California nghiên cứu. http://elib.cs.berkeley.edu
    Classification systems. Một trong những vấn đề kỹ thuật phức tạp nhất của thư viện là phân loại tư liệu. Mọi công cụ lưu trữ, tìm kiếm đều rất phụ thuộc vào kỹ thuật phân loại. Với các thư viện số chứa đựng, tích hợp mọi dạng thức thông tin, tri thức thì vấn đề càng phức tạp. Rất nhiều đại học và các viện nghiện cứu đang



    tập trung cho vấn đề này. Có thể xem trong Web site:


    http://ai.bpa.arizona.edu/go/dl/


    Security, quality, access, and reliability. Với thư viện số thì an toàn, bảo mật, chống sao chép bất hợp pháp, kỹ thuật tìm kiếm còn chứa đựng rất nhiều vấn đề mở. Chẳng hạn ở Đại Học Cornell, các nhà nghiên cứu đang tập trung cho tính toàn vẹn của một thư viện số. http://www.prism.cornell.edu
    1.3. Nghiên cứu về thư viện số tại Việt nam


    Ở Việt nam, các nghiên cứu về thư viện số mới chỉ ở các buớc khởi đầu. Trong những năm qua nhiêề phần mền quản lý thư viện và hỗ trợ đọc sách trên Internet đã được đầu tư phát triển. Bảng 1.1 là đặc tính của một số phần mềm quản lý thư viện do các nhà sản xuất phần mềm trong nước phát triển.
    Bảng 1.1. Danh sách một số phần mền quản lý thư viện do các nhà sản xuất phần mềm Việt nam phát triển
    Tên thuộc
    tính LIBOL (Tinh Vân) ILIB (CMC Soft) VEBRARY (Lạc Việt)
    Mô tả Phát triển vì nhu cầu trong nước
    (1997) và sau đó được thay đổi theo các chuẩn quốc tế Có giao diện dạng Web và được
    thiết kế theo mô hình mở 3 lớp. Đây là hệ thống quản lý thư viện điện
    tử, được dùng đầu tiên tại Trung Tâm Thông Tin Tư Liệu Đại Học Đà Nẵng
    Hệ điều hành WinNT, Unix, Linux
    Cơ sở dữ
    liệu NA Oracle 8i đối với phiên bản lớn
    SQL-Server đối với phiên bản nhỏ SmiLib NA
    Hỗ trợ tiếng
    Việt Hỗ trợ tiếng Việt mà một số
    ngôn ngữ khác như Anh, Nga, Nhật, Hoa, hỗ trợ Unicode Hỗ trợ đa ngôn ngữ, trong đó
    tiêng Việt theo bảng mã Unicode và TVCN
    Hỗ trợ tìm
    kiếm Tìm kiếm tra cứu mạnh, hỗ trợ
    tất cả các khung phân loại Hỗ trợ tìm kiếm tra cứu theo nhiều
    tiêu chí khác nhau

    Các chức
    năng chuyên môn Môi trường hiển thị: Web
    Chuẩn giao tiếp dữ liệu ISO2709
    Hỗ trợ tra cứu liên thư viện qua chuẩn Z39.50
    Có khả năng tùy biến giao diện Có 8 phân hệ nhgiệp vụ chuyên môn: tra cứu (Z39.50), , biên mục, ấn phẩm điện tử, ấn phẩm định kỳ, phân hệ bổ sung, phân hệ quản lý, phân hệ bạn đọc và phân hệ mượn trả. Hỗ trợ tôi đa khả năng liên thư
    việ theo các chuẩn (MARC, USMARC, UNIMARC
    Cho phép tra cứu liên thư viện theo chuẩn Z39.50
    Có chức năng hỗ trợ mã vạch Cho phép thay đổi các module
    khác nhau qua các thông số Mọi thao tác trên thư viện đều qua
    trình duyệt Web
    Lưu trữ và lập chỉ mục với số lượng lớn các dạng tài liệu SGML, XML, MARC, RTF, các dạng tài liệu đa phương tiện theo chuẩn open-ebook của W3C
    Hỗ trợ các tiêu chuẩn về sách điện tử và thư viện như Z39.50, Unicode Biên mục theo chuẩn MARC, ÚMARC (ngầm định là MARC21) Có nhiều tính năng khác như bổ sung tài liệu, lưu thông tài liệu, quản lý xuất bản phẩm nhiều kỳ, mượn liên
    thư viện, báo cáo thống kê. Tính năng bảo mật đáng lưu ý.
    Nhận xét Có khả năng đáp ứng hầu hết
    các nhu cầu chuẩn hóa về nghiệp vụ
    Thân thiện với người dùng, chức năng tìm kiếm nhanh chóng, chính xác trên nhiều ngôn ngữ
    và nhiều tiêu chí Có tính mở và linh hoạt
    Đã được ứng dụng tại một số nơi như Học Viện Quan hệ Quốc tế Tuân thủ những tiêu chuẩn mở về hệ
    thống thư viện và được xây dựng trên nền công nghệ hiện đại, quản lý thư viện hiệu quả, có khả năng liên thông với các thư viện khác trên thế giới.



    Thông tin liên lạc



    http://www.tinhvan.com
    Cty Công nghệ Tin học Tinh Vân
    371 Kim Mã, Hà NộI
    ĐT: (4) 771 5737



    http://ww.cmc.com <a class="__cf_email__" href="http://www.cloudflare.com/email-protection" data-cfemail="2541494c4b654d4b0b4648460b464a480b534b">[email protected]<script type="text/javascript">
    (function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute(data-cfemail);if(a){s=;r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e){}})();
    Cty CMC Soft
    777 GiảI Phóng, Hà NộI
    ĐT: (4) 664 1595



    <a class="__cf_email__" href="http://www.cloudflare.com/email-protection" data-cfemail="f38596918192818ab39f9290859a9687dd909c9edd859d">[email protected]<script type="text/javascript">
    (function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute(data-cfemail);if(a){s=;r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e){}})();

    Cty Cổ phần Tin học Lạc VIệt
    191A Hoàng Văn THụ, q. Phú Nhuận, tp. Hồ Chí Minh
    ĐT: (8) 842 3333
    Fax: (8) 842 2370





    1.4. Mục tiêu nghiên cứu của đề tài


    Các nghiên cứu-ứng dụng CNTT vào quản lý và khai thác thông tin trong các thư viện đã và đang được quan tâm. Sự phát triển nhanh chóng của CNTT và Internet vào những thập niên sau của thế kỷ 20 đã tạo ra lượng thông tin khổng lồ. Các thư viện số hóa đã được hình thành và hiện đang lưu trữ một lượng lớn thông tin, dễ dàng truy cập qua Internet. Do đó cần phải xây dựng các công cụ hỗ trợ tổ chức, tìm, đọc, tổng hợp thông tin.
    Những năm qua, nhiều thư viện và các trung tâm lưu trữ trong nước đã có những bước phát triển đáng kể trong việc sử dụng các công cụ CNTT để quản lý tư liệu, độc giả và hỗ trợ công tác tra cứu thông tin. Tuy nhiên hướng nghiên cứu phát triển các công cụ hỗ trợ tìm kiến, phân tích, tổng hợp thông tin vẫn đang còn chưa
    được đầu tư phát triển.
     

    Các file đính kèm:

Đang tải...