Luận Văn đề tài Khai phá dữ liệu với R

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Mai Kul, 4/12/13.

  1. Mai Kul

    Mai Kul New Member

    Bài viết:
    1,299
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    đề tài: KHAI PHÁ DỮ LIỆU VỚI R
    Mục Lục
    10
    Chương 1: Giới Thiệu Ngôn Ngữ R 11
    I. Khái quát chung 11
    1. Giới thiệu R 11
    2. Ưu điểm của R 11
    II. Hướng dẫn sử dụng R 12
    1. Cài đặt và giao diện 12
    2. Nhập dữ liệu trong R 13
    3. Văn phạm ngữ R .
    4. Các lệnh hệ thống . 15
    5. Tổ chức dữ liệu trong R . 16
    6. Các lệnh lập trình trong R 16
    7. Các hàm thống kê và đồ thị 24
    Chương 2: Khai Phá Dữ Liệu 26
    2. 1 Khai phá dữ liệu là gì 26
    2. 1. 1Khái niệm . 26
    2. 1. 2Các bước của quá trình khai phá dữ liệu 26
    2. 1. 3Ví dụ minh họa . 29
    2. 2 Nhiệm vụ chính của Khai phá dữ liệu . 29
    2. 3 Các phương pháp Khai phá dữ liệu . 32
    2. 3. 1 Các thành phần của giải thuật khai phá dữ liệu 32
    2. 3. 2 Một số phương pháp khai thác dữ liệu phổ biến . 34
    2. 4 Các phương pháp dựa trên mẫu 39
    2. 5 Mô hình phụ thuộc dựa trên đồ thị xác suất 39
    2. 6 Mô hình học quan hệ . 40
    2. 7 Khai phá dữ liệu dạng văn bản(Text Mining) . 40
    2. 8 Mạng neuron . 40
    2. 9 Giải thuật di truyền . 42
    2. 4 Lợi thế của Khai phá dữ liệu so với các phương pháp cơ bản 43
    2. 4. 1 Học máy(Machine Learning) 43
    2. 4. 2 Phương pháp hệ chuyên gia 44
    2. 4. 3 Phát kiến khoa học 44
    2. 4. 4 Phương pháp thống kê 44
    2. 5 Lựa chọn phương pháp 45
    2. 6 Những thách thức trong ứng dụng và nghiên cứu kỹ thuật Khai phá dữ
    liệu . 46
    2. 6. 1 Các vấn đề về cơ sở dữ liệu 46
    2. 6. 2 Một số vấn đề khác . 48
    2. 7 Tình trạng ứng dụng dữ liệu 49
    Chương 3: Bài Toán Ứng Dụng . 51
    3. 1 Mô tả bài toán . 51
    3. 2 Các dữ liệu cần thiết 52
    3. 3 chuỗi thời gian dự đoán . 52
    3. 3. 1 Lấy mô hình chuỗi thời gian dự đoán . 55
    Dự báo theo đuổi hồi quy . 59
    3. 3. 2 Đánh giá các mô hình chuỗi thời gian 60
    3. 3. 3 Mô hình lựa chọn 62
    3. 4 Từ dự đoán kinh doanh thành hành động . 66
    3. 4. 1 Đánh giá các tín hiệu kinh doanh 67
    3. 4. 2 Mô phỏng thương mại . 70
    3. 5 Các kết quả trên bộ dữ liệu . 73
    KẾT LUẬN 80
    TÀI LIỆU THAM KHẢO 81

    1. Giới thiệu R
    Năm 1996, trong một bài báo quan trọng về tính toán thống kê, hai nhà thống kê
    học Ross Ihaka và Robert Gentlan thuộc Trường đại học Auckland, New Zealand phác
    hoạ một ngôn ngữ mới cho phân tích thống kê mà họ đặt tên là R. Sáng kiến này được
    rất nhiều nhà thống kê học trên thế giới tán thành và tham gia vào việc phát triển R.
    Vậy R là gì? Nói một cách ngắn gọn, R là một phần mềm sử dụng cho phân tích
    thống kê và vẽ biểu đồ. Thật ra, về bản chất, R là ngôn ngữ máy tính đa năng, có thể sử
    dụng cho nhiều mục tiêu khác nhau, từ tính toán đơn giản, toán học giải trí(recreational
    mathatics) , tính toán ma trận(matrix) , đến các phân tích thống kê phức tạp. Vì là một
    ngôn ngữ, cho nên người ta có thể sử dụng R để phát triển thành các phần mềm chuyên
    môn cho một vấn đề tính toán cá biệt.
    2. Ưu điểm của R
    R có chứa nhiều loại kỹ thuật thống kê: mô hình hóa tuyến tính và phi tuyến,
    kiểm thử thống kê cổ điển, phân tích chuỗi thời gian, phân loại, phân nhóm, v. v.
    và đồ họa. R
    R cũng có tính mở rộng cao bằng cách sử dụng các gói cho người dùng đưa lên
    cho một số chức năng và lĩnh vực nghiên cứu cụ thể.
    Một điểm mạnh khác của R là nền tảng đồ họa có thể tạo ra những đồ thị chất
    lượng cao cùng các biểu tượng toán học.
    Dù R được dùng chủ yếu bởi những nhà thống kê và cũng có thể dùng làm một
    công cụ tính toán ma trận tổng quát với các kết quả đo đạc cạnh tranh so
    với GNU Octave và đối thủ thương mại của nó, MATLAB. Giao diện RWeka đã
    được thêm vào phần mềm khai phá dữ liệu phổ biến Weka, cho phép đọc/ghi
     

    Các file đính kèm:

Đang tải...