Thạc Sĩ Phương pháp luận kết hợp và Ứng dụng

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu

    MỞ ĐẦU


    Trong những năm gần đây, sự phát triển mạnh mẽ của công nghệ thông tin đã làm cho khả năng thu thập và lưu trữ thông tin của các hệ thống thông tin tăng nhanh một cách nhanh chóng. Bên cạnh đó, việc tin học hóa một cách ồ ạt và nhanh chóng các hoạt động sản xuất, kinh doanh cũng như nhiều lĩnh vực hoạt động khác đã tạo ra cho chúng ta một lượng dữ liệu cần lưu trữ khổng lồ. Hàng triệu cơ sở dữ liệu đã được sử dụng trong các hoạt động sản xuất, kinh doanh, quản lý ., trong đó có nhiều cơ sở dữ liệu cực lớn cỡ Gigabyte, thậm chí là Terabyte.
    Sự bùng nổ này đã dẫn tới một yêu cầu cấp thiết là cần có những kỹ thuật và công cụ mới để tự động chuyển đổi lượng dữ liệu khổng lồ kia thành các tri thức có ích. Từ đó, các kỹ thuật khai phá dữ liệu đã trở thành một lĩnh vực thời sự của nền CNTT thế giới hiện nay nói chung và Việt Nam nói riêng.
    Khai phá dữ liệu đang được áp dụng một cách rộng rãi trong nhiều lĩnh vực kinh doanh và đời sống khác nhau: marketing, tài chính, ngân hàng và bảo hiểm, khoa học, y tế, an ninh, internet Rất nhiều tổ chức và công ty lớn trên thế giới đã áp dụng kỹ thuật khai phá dữ liệu vào các hoạt động sản xuất kinh doanh của mình và thu được những lợi ích to lớn.
    Mục đích nghiên cứu của đề tài là tìm hiểu về các kỹ thuật khai phá dữ liệu; các vấn đề liên quan đến khai phá luật kết hợp nhằm phát hiện và đưa ra các mối liên hệ giữa các giá trị dữ liệu trong CSDL và áp dụng chúng vào bài toán quản lý trang thiết bị đồ dùng của trường THPT Chu Văn An – Tỉnh Thái Nguyên.
    Mục tiêu nghiên cứu của đề tài:

    - Tổng kết các kiến thức cơ bản nhất liên quan đến phát hiện luật kết hợp và tìm kiếm tri thức từ dữ liệu.
    trên thuật toán Apriori.

    Ý nghĩa khoa học của đề tài:

    - Đây là phương pháp được nhiều nhà khoa học nghiên cứu và đã có đóng góp trong thực tiễn.
    - Có thể coi đề tài là một tài liệu tham khảo khá đầy đủ, rõ ràng về các kiến thức cơ bản trong phương pháp phát hiện luật kết hợp.
    Phương pháp nghiên cứu:

    - Lập kế hoạch, lên qui trình, tiến độ thực hiện.

    - Tham khảo nhiều tài liệu có liên quan, tham khảo ý kiến các chuyên gia trong lĩnh vực nghiên cứu.
    Phạm vi nghiên cứu:

    Các kiến thức cơ bản nhất về phương pháp phát hiện luật kết hợp trên cơ sở làm luận văn thạc sỹ.
    Các kết quả nghiên cứu đạt được:

    - Tổng kết các kiến thức cơ bản nhất của phương pháp khai phá luật kết hợp.
    - Luận văn có thể trở thành một tài liệu tham khảo cho những người muốn tìm hiểu về khai phá dữ liệu và phương pháp khai phá luật kết hợp.
    - Xây dựng một phần mềm thử nghiệm dựa trên thuật toán Apriori.

    Luận văn bao gồm 4 chương, với các nội dung:

    Chương 1: Trình bày tổng quan về khám phá tri thức và khai phá dữ liệu, trong đó có đề cập đến khái niệm tri thức, dữ liệu, quá trình khám phá tri thức, nhiệm vụ và các kỹ thuật khám phá tri thức.



    Chương 2: Trình bày về luật kết hợp, trong đó trình bày về các khái niệm, định nghĩa, tính chất của luật kết hợp.
    Chương 3: Trình bày một số kỹ thuật khai thác luật kết hợp.

    Chương 4: Cài đặt chương trình tìm luật kết hợp, ứng dụng trong quản lý trang thiết bị, đồ dùng của trường THPT Chu Văn An – Tỉnh Thái Nguyên.
    Luận văn này đã được hoàn thành trong khoảng thời gian không dài. Tuy nhiên, đã đạt được một số kết quả tốt, tôi đang nghiên cứu để hoàn thiện và đưa chương trình trong luận văn vào ứng dụng thực tiễn quản lý trang thiết bị của trường THPT Chu Văn An – Tỉnh Thái Nguyên, rất mong nhận được sự góp ý của các thầy cô, đồng nghiệp và bạn bè để luận văn và chương trình được hoàn thiện hơn.






    MỤC LỤC
    LỜI CẢM ƠN .i DANH MỤC CÁC HÌNH .ii MỞ ĐẦU . 3

    Chương 1 TỔNG QUAN VỀ KHÁM PHÁ TRI THỨC VÀ KHAI PHÁ
    DỮ LIỆU . 6

    1.1. Phát hiện tri thức và khai phá dữ liệu . 6
    1.2. Quá trình phát hiện tri thức từ cơ sở dữ liệu . 7
    1.2.1. Xác định vấn đề 8
    1.2.2.Thu thập và tiền xử lý dữ liệu 9
    1.2.3. Khai thác dữ liệu . 11
    1.2.4. Minh họa và đánh giá 11
    1.2.5. Đưa kết quả vào thực tế 11
    1.3. Khai phá dữ liệu 12
    1.3.1. Các quan niệm về khai phá dữ liệu . 12
    1.3.2. Nhiệm vụ của khai phá dữ liệu 13
    1.3.3. Triển khai việc khai phá dữ liệu 15
    1.3.4. Một số ứng dụng khai phá dữ liệu . 15
    1.3.5. Các kỹ thuật khai phá dữ liệu 17
    1.3.6. Kiến trúc của hệ thống khai phá dữ liệu 19
    1.3.7. Quá trình khai phá dữ liệu . 21
    1.3.8. Những khó khăn trong khai phá dữ liệu 22
    Chương 2 LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU 25
    2.1. Bài toán kinh điển dẫn đến việc khai phá luật kết hợp . 25
    2.2. Định nghĩa về luật kết hợp . 26
    2.3. Một số hướng tiếp cận trong khai phá luật kết hợp 32
    Chương 3 MỘT SỐ THUẬT TOÁN PHÁT HIỆN LUẬT KẾT HỢP 35
    3.1. Thuật toán AIS 35
    3.2. Thuật toán SETM 36
    3.3. Thuật toán Apriori . 37
    3.4. Thuật toán Apriori-TID . 44
    3.5.Thuật toán Apriori-Hybrid 46
    3.6. Thuật toán FP_growth . 47
    3.7. Thuật toán PARTITION [Savasere 95] 55
    Chương 4 KHAI THÁC LUẬT KẾT HỢP TRONG BÀI TOÁN QUẢN LÝ THIẾT BỊ TRưỜNG THPT CHU VĂN AN- THÁI NGUYÊN . 58
    4.1. Phát biểu bài toán 58
    4.2. Cơ sở dữ liệu của bài toán . 59
    4.3. Rời rạc các thuộc tính gốc để tạo thành các thuộc tính nhị phân 60

    4.6. Kết quả khai thác cơ sở dữ liệu quản lý thiết bị Trường THPT Chu Văn
    An – Thái Nguyên 63
    KẾT LUẬN . 64
    TÀI LIỆU THAM KHẢO 66
     

    Các file đính kèm:

Đang tải...