Đồ Án Tìm hiểu kỹ thuật Text Mining và ứng dụng_ HVKế toán (TM+ chương trình)

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    1. Tên đề tài:

    Tìm hiểu kỹ thuật Text Mining và ứng dụng.
    2. Các số liệu ban đầu:
    3. Nội dung bản thuyết minh

    Chương I: Data Mining và Text Mining
    Chương II: SQL Server Integration Services (SSIS)
    Chương III: Thuật toán Naïve Bayes và phân loại văn bản
    Chương IV: Ứng dụng Text Mining
    Chương V: Kết luận
    Tài liệu tham khảo
    4. Số lượng, nội dung các bản vẽ A[SUB]0[/SUB] và các sản phẩm (nếu có)

    5. Cán bộ hướng dẫn



    LỜI NÓI ĐẦU

    Hệ thống cơ sở dữ liệu đã đánh dấu một bước thành công lớn trong hơn hai thập kỷ qua. Tìm kiếm các thông tin hữu ích trong các CSDL đã trở thành một điểm quan trọng trong hoạt động kinh doanh và ngày càng có nhiều sự chú ý tới việc khai phá dữ liệu - Data Mining, đó như là một thành phần mấu chốt để khám phá thông tin. Các thuật toán khai phá dữ liệu và các công cụ mô phỏng nó đã và đang đựơc sử dụng để tìm kiếm các hình mẫu quan trọng ẩn chứa trong dữ liệu và tạo ra các dự báo hữu ích. Khoa học này đã và đang được chấp nhận trong hầu hết tất cả các bộ phận kinh doanh như ngân hàng, viễn thông, sản xuất, tiếp thị và thương mại điện tử. Data Mining trong SQL 2005 là một bước tiến lớn trong hệ thống Data Mining và công nghệ cao nhất về CSDL. Các kỹ sư và nhà nghiên cứu từ rất nhiều tổ chức nghiên cứu đã làm việc cùng nhau để mang cả hai trường phái cổ điển và công nghệ mới, mổ xẻ các khía cạnh công cụ Data Mining.
    Trong hệ thống các dạng Data Mining thì có một kiểu khai phá dữ liệu rất đặc biệt chỉ thực hiện trên các dữ liệu định dạng Text đó là Text Mining. Trong thời điểm hiện nay, phân tích các tài liệu dạng Text trở nên rất quan trọng. Và các dự án Textmining thực sự là một công cụ hổ trợ đắc lực trong việc phân nhóm, phân loại và phân đoạn các dữ liệu không cấu trúc này nhằm thực hiện các vấn đề thiết thực trong cuộc sống cũng như hoạt động kinh doanh thương mại. Các lĩnh vực cần sử dụng Text Mining vào thực hiện các công việc trong thực tế rất nhiều, như thực hịên phân nhóm các thông tin phản hồi của khách hàng, thăm dò các ý kiến thông qua các Topic, Blog; phân loại các dạng bài post của một trang Web Với SQL 2005, Data Mining nói chung và Text Mining nói riêng thực sự đã trở thành các công cụ xây dựng các ứng dụng thông minh, hổ trợ đắc lực và thiết thực cho mọi người trong việc giải quyết các vấn đề thực tế.
    Những vấn đề này được em phân tích và xây dựng chi tiết trong nội dung đề tài:
    Tìm hiểu kỹ thuật Text Mining và ứng dụng
    Em xin chân thành cảm ơn TS. Nguyễn Mạnh Hùng đã giúp đỡ em hoàn thành nội dung đề tài này.

    MỤC LỤC
    LỜI NÓI ĐẦU
    Chương I: Data Mining và Text Mining.
    1. Data Mining
    . 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000360037000000
    1.1 Giới thiệu Data Mining.
    1.2 Các bài toán của Data Mining trong kinh doanh.
    1.3 Nhiệm vụ của Data Mining.
    1.4 Kỹ thuật Data Mining.
    1.5 Các thuật toán Data Mining. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000370032000000
    1.5.1 Thuật toán Naive Bayes:.
    1.5.2 Thuật toán cây quyết đinh.
    1.5.3 Thuật toán Neural Network.
    2. Text Mining.
    2.1 Giới thiệu Text mining.
    2.1.1 Khái niệm và vị trí quan trọng của Textmining. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000370038000000
    2.1.2 Kỹ thuật Text Mining.
    2.2 Thuật toán hổ trợ và các bước tiến hành.
    Chương II: SQL Server Integration Services (SSIS).
    1. Giới thiệu về SSIS.
    1.1 SSIS Packages.
    1.2 Task Flow
    1.3 Data Flow
    2. Data Mining trong môi trường SSIS.
    2.1 Data Mining Tasks. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000380037000000
    2.2 Data Mining Transforms.
    Chương III: Thuật toán Naïve Bayes và phân loại văn bản. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000380039000000
    1. Tổng quan về phân loại văn bản. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000390030000000
    1.1 Sự cần thiết của phân loại văn bản.
    1.2 Định nghĩa và các bước trong tiến trình phân loại văn bản.
    2. Thuật toán phân loại văn bản Naïve Bayes.
    Chương IV: Ứng dụng Text Mining.
    1. Giới thiệu ứng dụng.
    1.1 Yêu cầu ứng dụng. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003000390036000000
    1.2 Phương pháp giải quyết yêu cầu ứng dụng.
    2. Xây dựng ứng dụng.
    2.1 Xây dựng từ điển thuật ngữ.
    2.2 Xây dựng một bảng Vectors thuật ngữ.
    2.3 Xây dựng mô hình SSIS chuẩn bị Train/Test Samples.
    2.4 Xây dựng mô hình Data Mining.
    2.5 Xây dựng các bảng dữ liệu đặc trưng.
    2.6 Xây dựng ứng dụng phân loại thư yêu cầu.
    2.6.1 Thuật toán Naïve Bayes sử dụng phân loại văn bản.
    2.6.2 Giao diện chương trình phân loại thư yêu cầu.
    Chương IV: Kết luận. 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003100300037000000
    TÀI LIỆU THAM KHẢO:









    Dau Hoai Nam






    08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200330031003900320037003100300038000000
     

    Các file đính kèm:

Đang tải...