Đồ Án Tìm hiểu về kĩ thuật phân cụm dữ liệu trong hệ quản trị cơ sở dữ liệu Oracle

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    LỜI NÓI ĐẦU

    Từ vài thập niên trở lại đây, với những tác động mạnh mẽ của các tiến bộ trong công nghệ phần cứng và truyền thông, các hệ thống dữ liệu phục vụ cho các lĩnh vực kinh tế - xã hội đã phát triển bùng nổ, lượng dữ liệu được tạo ra ngày càng lớn. Sự phong phú về dữ liệu, thông tin cùng với khả năng kịp thời khai thác chúng đã mang đến những năng suất và chất lượng mới cho công tác quản lý, hoạt động kinh doanh, Nhưng rồi các yêu cầu về thông tin trong các lĩnh vực hoạt động đó, đặc biệt trong lĩnh vực làm ra quyết định, ngày càng đòi hỏi cao hơn, người quyết định không những cần dữ liệu mà còn cần có thêm nhiều hiểu biết, nhiều tri thức để hỗ trợ cho việc ra quyết định của mình. Cho đến những năm 90 của thế kỷ trước, nhu cầu khám phá tri thức mới thực sự bùng nổ, theo đó, hàng loạt các lĩnh vực nghiên cứu về tổ chức các kho dữ liệu và kho thông tin, các hệ trợ giúp quyết định, các thuật toán nhận dạng mẫu và phân lớp mẫu, ra đời, một trong số đó là phân cụm dữ liệu (Data Clustering). Phân cụm dữ liệu là quá trình tìm kiếm và phát hiện ra các cụm hoặc các mẫu dữ liệu tự nhiên trong cơ sở dữ liệu lớn. Các kỹ thuật chính được áp dụng trong phân cụm dữ liệu phần lớn được kế thừa từ lĩnh vực thống kê, học máy, nhận dạng, lượng hoá, Đến nay, đã có nhiều ứng dụng phân cụm dữ liệu cho việc giải quyết các vấn đề trong các lĩnh vực như tài chính, thông tin địa lý, sinh học, nhận dạng ảnh, Trong thời gian gần đây, trong lĩnh vực PCDL, người ta tập trung chủ yếu vào nghiên cứu, phân tích các mô hình dữ liệu phức tạp như dữ liệu văn bản, Web, hình ảnh .
    Hiện nay, Oracle là một hệ quản trị CSDL đang được sử dụng rộng rãi, đặc biệt là trong các cơ quan, tổ chức có nhu cầu lưu trữ một lượng dữ liệu lớn. Tuy nhiên, với khối dữ liệu khổng lồ như vậy, việc khai thác hữu ích các thông tin trong đó là một yêu cầu rất cáp thiết. Từ phiên bản Oracle9i đã tích hợp kỹ thuật khai phá dữ liệu trong phiên bản này để trợ giúp cho người sử dụng có thể tìm kiếm các thông tin cần khai thác. Vì vậy, em chọn đề tài “ Tìm hiểu về kĩ thuật phân cụm dữ liệu trong hệ quản trị cơ sở dữ liệu Oracle ”làm đề tài tốt nghiệp cho mình với mục đích là vận dụng các kiến thức đã học và nghiên cứu các vấn đề mới để xây dựng một ứng dụng trong hệ quản trị CSDL Oracle có áp dụng kỹ thuật phân cụm.
    Nội dung của đồ án gồm 4 chương:
    Chương 1: Phân cụm dữ liệu : trong chương này em trình bày tổng quan về phân cụm dữ liệu bao gồm các kiểu dữ liệu có thể phân cụm , các ứng dụng và các kỹ thuật phân cụm dữ liệu .
    Chương 2: Hệ quản trị cơ sở dữ liệu Oracle
    Giới thiệu về hệ quản trị cơ sở dữ liệu Oracle và phân cụm dữ liệu trong Oracle
    Chương 3: Mô hình Use Case
    Giới thiệu mô hình Use Case , biểu đồ và quan hệ use case .
    Chương 4: Chương trình ứng dụng:
    Giới thiệu chương trình ứng dụng quản lý văn bản đến và đi , sử dụng mô hình Use case , cơ sở dữ liệu Oracle có sử dụng kĩ thuật phân cụm dữ liệu để phân cụm văn bản đến và đi trong Oracle
    Phần kết luận trình bày tóm tắt các kết quả thu được và các đề xuất cho hướng phát triển của đề tài .







    MỤC LỤC

    234574280" MỤC LỤC 1
    234574281" LỜI CẢM ƠN 3
    234574282" LỜI NÓI ĐẦU 4
    234574283" Chương 1PHÂN CỤM DỮ LIỆU 6
    234574284" 1.1Kỹ thuật phân cụm dữ liệu.6
    234574285" 1.2Các ứng dụng của phân cụm dữ liệu. 6
    234574286" 1.3Các kiểu dữ liệu và độ đo tương tự. 7
    234574287" 1.3.1Phân loại các kiểu dữ liệu dựa trên kích thước miền. 7
    234574288" 1.3.2Phân loại các kiểu dữ liệu dựa trên hệ đo. 7
    234574289" 1.4Một số kỹ thuật tiếp cận trong phân cụm dữ liệu. 8
    234574290" 1.4.1Phân cụm phân hoạch. 8
    234574291" 1.4.2Phân cụm dữ liệu phân cấp. 8
    234574292" 1.4.3Phân cụm dữ liệu dựa trên mật độ. 9
    234574293" 1.4.4Phân cụm dữ liệu dựa trên lưới9
    234574294" 1.4.5Phân cụm dữ liệu dựa trên mô hình. 10
    234574295" 1.4.6Phân cụm dữ liệu có ràng buộc. 10
    234574296" 1.5Các yêu cầu cho kỹ thuật PCDL 10
    234574297" 1.6Giới thiệu thuật toán phân cụm dữ liệu điển hình.11
    234574298" 1.7Bài toán phân cụm dữ liệu. 13
    234574299" Chương 2HỆ QUẢN TRỊ CSDL ORACLE 14
    234574300" 2.1Giới thiệu Oracle. 14
    234574301" 2.2Cấu trúc cơ sở dữ liệu (CSDL):15
    234574302" 2.3Sử dụng phân cụm (CLUSTERING ) trong Oracle. 16
    234574303" 2.4Phân loại tài liệu văn bản trong Oracle. 21
    234574304" Chương 3MÔ HÌNH USE CASE 24
    234574305" 3.1Giới thiệu Use Case trong phân tích thiết kế hướng đối tượng. 24
    234574306" 3.2Mô hình hóa Use Case. 24
    234574307" 3.3Biểu đồ Use Case. 27
    234574308" 3.4Quan hệ giữa các Use Case. 27
    234574309" 3.4.1Miêu tả Use Case. 27
    234574310" 3.4.2Thử nghiệm Use Case. 30
    234574311" Chương 4CHƯƠNG TRÌNH ỨNG DỤNG 31
    234574312" 4.1Bài toán quản lý văn bản đến và văn bản đi31
    234574313" 4.2Mô hình usecase trong hệ thống quản lý văn bản đến và đi31
    234574314" 4.2.1Quy trình tạo, gửi đi31
    234574315" 4.2.2Quy trình nhận, đến. 33
    234574316" 4.2.3Quản trị viên hệ thống:34
    234574317" 4.3Đặc Tả User Case. 34
    234574318" 4.4CSDL được tạo trong Oracle. 39
    234574319" 4.5Bảng MSTB_CÔNG VĂN 39
    234574320" 4.6Bảng MSTB_CLUSTERS. 40
    234574321" 4.7Bảng MSTB_CLUSTER_RESULT 40
    234574322" 4.8View tất cả nhân viên. 41
    234574323" 4.9View nhân viên. 42
    234574324" 4.10Sequences. 42
    234574325" 4.11Trong Packages chứa các Procedures p()prtb_vanban,p()prtb_cluster .43
    234574326" 4.12Giới thiệu chương trình ứng dụng. 43
    234574327" 4.12.1Trang Đăng nhập. 43
    234574328" 4.12.2Trang chủ. 44
    234574329" 4.12.3Trang Soạn văn bản. 44
    234574330" 4.12.4Trang Danh sách nhân viên. 45
    234574331" 4.12.5Trang tạo mới nhân viên. 45
    234574332" 4.12.6Trang danh sách phòng ban. 46
    234574333" 4.12.7Trang danh sach văn bản đến. 46
    234574334" 4.12.8Trang tạo mới phong ban. 47
    234574335" 4.12.9Trang thông tin cá nhân. 47
    234574336" 4.12.10Trang tra cứu theo nội dung. 48
    234574337" 4.12.11Trang tra cứu theo phân cụm và kết quả chạy trương trình. 48
    234574338" 4.13Chương trình được thiết kế bởi Microsoft Visual Studio 2005. 48
    234574339" 4.14Kết quả thực hiện chương trình. 49
    234574340" KẾT LUẬN 50
    234574341" Chương 5TÀI LIỆU THAM KHẢO 51
     

    Các file đính kèm:

Đang tải...