17. Pương pháp phân cụm

Phương pháp phân cấp

     Phương pháp này còn gọi là phương pháp phân cụm cây, trong đó  sắp xếp một tập dữ liệu đã cho thành một cấu trúc có dạng hình cây, cây phân cấp này được xây dựng theo kỹ thuật đệ quy. Cây phân cụm có thể được xây dựng theo hai phương pháp tổng quát: phương pháp dưới lên (thuật toán trội) và phương pháp trên xuống (phương pháp tách).

Phương pháp phân hoạch

     Đây là phương pháp dùng phổ biến nhất, đặc biệt cho tập dữ liệu lớn. Với tập dữ liệu D gồm n đối tượng trong không gian d chiều, và số lượng cụm K thường được xác định trước hoặc đặt dưới dạng tham số.  Người tổ chức các đối tượng thành K cụm sao cho tổng bình phương độ lệch của mỗi đối tượng tới tâm của nó nhỏ nhất. Sau đây là một số thuật toán loại này:

-          K-means

-          K-centroid

-          Phân cụm ngưỡng

-          K-tâm

-          EM(Expectation Maximization)

Bạn đang đọc truyện trên: AzTruyen.Top

Tags: