Luận Văn Phân cụm ban giám sát

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Phân cụm ban giám sát


    Mục tiêu chính của khóa luận là nghiên cứu khung (framework) xác suất Hidden Markov Random Field (HMRF) [Zhang et al., 2001] cho phép dùng một loạt các độ lệch, bao gồm các độ lệch Bregman (như khoảng cách Euclide bình phương, độ lệch-KL, ) và các độ đo khoảng cách có hướng (như khoảng cách cosine). Qua đó và qua tìm hiểu các thuật toán phân cụm bán giám sát trên cơ sở ràng buộc và trên cơ sở metric, tôi giới thiệu một phương pháp mới trên cơ sở thuật toán K-Means: HMRF-Kmeans, cực tiểu hóa được hàm mục tiêu xuất phát từ xác suất đồng thời của mô hình, và cho phép phối hợp các phương pháp trên cơ sở ràng buộc và trên cơ sở metric làm một. Ngoài ra, trong khóa luận có giới thiệu một thuật toán học động hai pha (two-phase) cho việc chọn các cặp ràng buộc có nhiều thông tin trong query-driven khung từ mô hình HMRF, cải thiện đáng kể sự thực thi với lượng tương đối nhỏ thông tin cung cấp từ người dùng. Sau đó mô tả một số đặc tính và dùng thực nghiệm đánh giá thuật toán trên tập dữ liệu mẫu UCI.
    Chương 1. Tổng quan về khai phá dữ liệu
    Chương 2. Các phương pháp và các thuật toán phân cụm dữ liệu điển hình
    Chương 3. Phân cụm bán giám sát tăng cường
     

    Các file đính kèm:

Đang tải...