Luận Văn Nghiên cứu các thuật toán phân lớp dữ liệu dựa trên cây quyết định

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Củ Đậu Đậu, 31/3/14.

  1. Củ Đậu Đậu

    Bài viết:
    991
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC
    TÓM TẮT NỘI DUNG i
    LỜI CẢM ƠN . ii
    MỤC LỤC iii
    DANH MỤC BIỂU ĐỒHÌNH VẼ .v
    DANH MỤC THUẬT NGỮ vii
    ĐẶT VẤN ĐỀ .1
    Chương 1. TỔNG QUAN VỀPHÂN LỚP DỮLIỆU DỰA TRÊN CÂY QUYẾT
    ĐỊNH .3
    1.1. Tổng quan vềphân lớp dữliệu trong data mining 3
    1.1.1. Phân lớp dữliệu 3
    1.1.2. Các vấn đềliên quan đến phân lớp dữliệu .6
    1.1.3. Các phương pháp đánh giá độchính xác của mô hình phân lớp 8
    1.2. Cây quyết định ứng dụng trong phân lớp dữliệu .9
    1.2.1. Định nghĩa 9
    1.2.2. Các vấn đềtrong khai phá dữliệu sửdụng cây quyết định 10
    1.2.3. Đánh giá cây quyết định trong lĩnh vực khai phá dữliệu .11
    1.2.4. Xây dựng cây quyết định 13
    1.3. Thuật toán xây dựng cây quyết định .14
    1.3.1. Tưtưởng chung 14
    1.3.2. Tình hình nghiên cứu các thuật toán hiện nay 15
    1.3.3. Song song hóa thuật toán phân lớp dựa trên cây quyết định tuần tự 17
    Chương 2. C4.5 VÀ SPRINT 21
    2.1. Giới thiệu chung .21
    2.2. Thuật toán C4.5 .21
    2.2.1. C4.5 dùng Gain-entropy làm độ đo lựa chọn thuộc tính “tốt nhất” 22
    2.2.2. C4.5 có cơchếriêng trong xửlý những giá trịthiếu 25
    2.2.3. Tránh “quá vừa” dữliệu .26
    2.2.4. Chuyển đổi từcây quyết định sang luật .26
    2.2.5. C4.5 là một thuật toán hiệu quảcho những tập dữliệu vừa và nhỏ .27
    2.3. Thuật toán SPRINT 28
    2.3.1. Cấu trúc dữliệu trong SPRINT 29
    2.3.2. SPRINT sửdụng Gini-index làm độ đo tìm điểm phân chia tập dữliệu “tốt nhất”
    31
    2.3.3. Thực thi sựphân chia .34
    2.3.4. SPRINT là thuật toán hiệu quảvới những tập dữliệu quá lớn so với các thuật toán
    khác .35
    2.4. So sánh C4.5 và SPRINT 37
    Chương 3. CÁC KẾT QUẢTHỰC NGHIỆM .38
    3.1. Môi trường thực nghiệm .38
    3.2. Cấu trúc mô hình phân lớp C4.5 release8: 38
    3.2.1. Mô hình phân lớp C4.5 có 4 chương trình chính: 38
    3.2.2. Cấu trúc dữliệu sửdụng trong C4.5 39
    3.3. Kết quảthực nghiệm .40
    3.3.1. `7Một sốkết quảphân lớp tiêu biểu: 40
    3.3.2. Các biểu đồhiệu năng 47
    3.4. Một số đềxuất cải tiến mô hình phân lớp C4.5 54
    KẾT LUẬN 56
    TÀI LIỆU THAM KHẢO .57
     
Đang tải...