Luận Văn Khai phá dữ liệu bằng luật kết hợp

Thảo luận trong 'Chưa Phân Loại' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    LỜI NÓI ĐẦU
    Ngày nay các lĩnh vực khoa học kỹ thuật đang ngày một phát triển mạnh mẽ.
    Đặc biệt là nghành khoa học máy tính rất phát triển, nó được ứng dụng rất nhiều
    trong các lĩnh vực khác nhau của cuộc sống như: Giáo dục, Y tế, Kinh tế, Khoa học,
    Xây dưng, Nó đã trở thành một phần không thể thiếu được trong cuộc sống hàng
    ngày của con người.Việc dùng các phương tiện tin học để tổ chức và khai thác các
    cơ sở dữ liệu đã được phát triển từ những năm 60. Đặc biệt trong những năm gần
    đây vai trò của máy tính trong việc lưu trữ và xử lý thông tin ngày càng trở lên quan
    trọng. Bên cạnh đó các thiết bị thu thập dữ liệu tự động tương đối phát triển đã tạo
    ra những kho dữ liệu khổng lồ. Với sự phát triển mạnh mẽ của công nghệ điện tử
    tạo ra các bộ nhớ có dung lượng lớn, bộ xử lý tốc độ cao cùng với các hệ thống
    mạng viễn thông, người ta đã xây dựng các hệ thống thông tin nhằm tự động hoá
    mọi hoạt động kinh doanh của mình. Điều này đã tạo ra một dòng dữ liệu tăng lên
    không ngừng ví ngay từ các các giao dịch đơn gian nhất như một cuộc điện thoại,
    kiểm tra sức khỏe, sử dụng thẻ tín dụng, v.v.đều được ghi vào trong máy tính. Cho
    tới nay con số này đã trở lên khổng lồ, bao gồm các cơ sở dữ liệu, thông tin khách
    hàng, dữ liệu lịch sử các giao dịch, dữ liệu bán hàng, dữ liệu các tài khoản vay, sử
    dụng vốn, Vấn đề đặt ra là làm thế nào để sử lý khối lượng thông tin cực lớn như
    vậy để phát hiện ra các tri thưc tiềm ẩn trong nó.
    Để làm được điều đó người ta đã sử dụng quá trính Phát hiện tri thức trong
    cơ sở dữ liệu( Knowledge Discovery in Database-KDD). Nhiệm vụ của KDD là từ
    dữ liệu sẵn có phải tìm ra những thông tin tiềm ẩn có giá trị mà trước đó chưa được
    phát hiện cũng như tìm ra những xu hướng phát triển và các xu hướng tác động lên
    chúng .Các kỹ thuật cho phép ta lấy được các tri thức từ cơ sở dữ liệu sẵn có đó
    được gọi là kỹ thuật Khai phá dữ liệu( Data Mining).
    eừ những lý do đó chúng em đã hiểu về đề tài Khai phá dữ liệu bằng luật
    kết hợp. Nhằm phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra những mfu
    thông tin, hoạt động có tính chính quy trong tập dữ liệu mà người sử dụng mong
    muốn, đồng thời để áp dụng vào bài toán guản lý bán hàng tại siêu thị.
    erong quá trình làm đồ án để hoàn thành đề tài này chúng đã nhận được sự
    giúp đh chi bảo tận tình của các thầy cô giáo trong khoa công nghệ thông tin và các
    bạn trong lớp, đặc biệt là thầy giáo Trần Hùng Cường. Nhưng do thời gian có giới
    hạn và năng lực còn hạn chế nên không tránh khỏi những sai sót, chúng em mong
    nhận được sự góp ý hơn nữa của thầy cô và các bạn.
    Chúng em cũng xin chân thành cảm ơn các thầy giáo, cô giáo trong khoa
    Công Nghệ ehông ein đã tạo điều kiện giúp đh chúng em trong xuốt thời gian làm
    đồ án và học tập tại trường.
    j




    Chúng em xin chân thành cảm ơn các bạn cùng lớp đã tạo điều kiện cho
    chúng em hoàn thành tốt luận văn này.
    Chúng em xin chân thành cảm ơn!

    TÓM TẮT ĐỒ ÁN
    Nội dung của đồ án là những kiến thức về khai phá dữ liệu sử dụng luật kết
    hợp, các thuật toán kinh điển trong quá trình sử dụng luật kết hợp, cách áp dụng
    thuật toán lpriori vào một phần nhỏ trong bài toán guản lý bán hàng tại siêu thị .
    Mục đích của đồ án là:
    Phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra những mfu thông
    tin, hoạt động có tính chính quy trong tập dữ liệu mà người sử dụng mong muốn.
    Đưa ra các thuật toán cơ bản như lpriori, thuật toán tìm luật kết hợp không
    phát sinh ứng viên dựa vào cấu trúc cây mP- eree, v.v.trong việc sử dụng luật kết
    hợp để phân tích một cơ sở dữ liệu nào đó.
    Phân tích cơ sở dữ liệu và cài đặt thuật toán lpriori để áp dụng một phần
    nhỏ vào bài toán guản lý bán hàng tại siêu thị .
    Đồ án bao gồm có k chương, với các nội dung như sau:
    Chương I: Tổng quan về khai phá dữ liệu. Nội dung trong chương này sẽ
    được trình bày bao gồm: Khai phá dữ liệu và phát hiện tri thức, quá trình phát hiện
    tri thức từ cơ sở dữ liệu, khai phá dữ liệu có lợi ích gìn Các kỹ thuật khai phá dữ
    liệu, nhiêm vụ chính của khai phá dữ liệu, các phương pháp khai phá dữ liệu, ứng
    dụng của khai phá dữ liệu và một số thách thức đặt ra cho việc khai phá dữ liệu.
    Chương II: Tập phổ biến và luật kết hợp: Nội dung đuợc trình bày bao
    gồm: Một số khái niệm, tính chất cơ bản của tập phổ biến và luật kết hợp, tìm tập
    phổ biến, một số thuật toán cơ bản về luật kết hợp, một số ví dụ minh họa các thuật
    toán.
    Chương III: Cách cài đặt và thử nghiệm thuật toán tìm tập phổ biến và
    luật kết hợp: Phân tích một cơ sở dữ liệu, trình bày về cách cài đặt chương trình
    khai thác luật kết hợp trong việc quản lý bán hàng tại siêu thị. Dựa vào kết quả này
    mà người quản lý bán hàng tại thị siêu nom bot được những nhóm mặt hàng nào có
    liên quan tới nhau, phục vụ cho mục đích quản lý và lựa chọn các mặt hàng để kinh
    doanh.
     

    Các file đính kèm:

Đang tải...