Tiểu Luận Giới thiệu nhanh về mạng nơron và bài toán phân cụm dữ liệu

Thảo luận trong 'Sinh Học' bắt đầu bởi Mit Barbie, 11/12/11.

  1. Mit Barbie

    Mit Barbie New Member

    Bài viết:
    2,273
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    Vấn đề phân cụm mờ

    Thông thường, mỗi phương pháp PCDL phân một tập dữ liệu ban đầu thành các cụm dữ liệu có tính tự nhiên và mỗi đối tượng dữ liệu chỉ thuộc về một cụm dữ liệu, phương pháp này chỉ phù hợp với việc khám phá ra các cụm có mật độ cao và rời nhau (phân cụm rõ).

    Tuy nhiên, trong thực tế, các cụm dữ liệu lại có thể chồng lên nhau, nghĩa là một số các đối tượng dữ liệu thuộc về nhiều các cụm khác nhau, người ta đã áp dụng lý thuyết về tập mờ trong PCDL để giải quyết cho trường hợp này, cách thức kết hợp này được gọi là phân cụm mờ.

    Trong phương pháp phân cụm mờ, độ phụ thuộc của đối tượng dữ liệu xk tới cụm thứ i (uik) có giá trị thuộc đoạn
    [0,1]. Ý tưởng trên đã được giới thiệu bởi Ruspini (1969) và được Dunn áp dụng năm 1973 nhằm xây dựng một phương pháp phân cụm mờ dựa trên tối thiểu hoá hàm mục tiêu. Bezdek (1982) đã tổng quát hoá phương pháp này và xây dựng thành thuật toán phân cụm mờ c-means có sử dụng trọng số mũ.

    K-means là thuật toán PCDL rõ và c-means là thuật toán phân cụm mờ tương ứng, hai thuật toán này cùng sử dụng chung một chiến lược phân cụm dữ liệu. Thuật toán c-means mờ hay còn gọi tắt là thuật toán FCM (Fuzzy C means - FCM) đã được áp dụng thành công trong giải quyết một số lớn các bài toán PCDL như trong nhận dạng mẫu, xử lý ảnh, y học,

    Tuy nhiên, nhược điểm lớn nhất của thuật toán FCM là nhạy cảm với các nhiễu và phần tử ngoại lai trong dữ liệu, nghĩa là các trung tâm cụm có thể nằm xa so với trung tâm thực của cụm. Đã có nhiều các phương pháp đề xuất để cải tiến cho nhược điểm trên của thuật toán FCM bao gồm : Phân cụm dựa trên xác suất (keller, 1993), phân cụm nhiễu mờ (Dave, 1991), Phân cụm dựa trên toán tử LP Norm (Kersten, 1999). Thuật toán ε- Insensitive Fuzzy C-means (εFCM).
     

    Các file đính kèm:

Đang tải...