
Bài viết này trình bày các phương pháp phân cụm dựa trên biến đặc trưng (feature-based clustering), bao gồm thuật toán K-means, K-medoids, phân cụm dựa trên mô hình (model-based clustering) với thuật toán EM, và phương pháp projection pursuit. Khác với phân cụm phân cấp, các phương pháp này cho phép tái phân bổ quan sát và có khả năng xử lý dữ liệu lớn hiệu quả. Chúng ta sẽ ứng dụng các phương pháp này với bộ dữ liệu mô phỏng đã tạo trong bài giới thiệu để so sánh hiệu quả và đặc điểm của từng phương pháp.