KTL nâng caoXử lý dữ liệu
Xác định điểm dị biệt cho các phân phối lệch
Trong các phân tích đơn biến và đa biến, rất khó xác định các điểm dị biệt (outliers) trong trường hợp phân phối bị lệch (skewed) hoặc có đuôi dầy (heavy-tailed distributions). Trong bài viết này, Vietlod sẽ giới thiệu công cụ gboxplot (trường hợp đơn biến) và sdasym (trường hợp đa biến) để xác định các điểm dị biệt này. Xác định điểm dị biệt đơn biết Các biểu đồ hộp (box plot) có lẽ là công cụ được sử dụng phổ biến nhất để trực quan hóa dữ liệu đơn biến và xác định các outliers. Tuy nhiên, Hubert and Vandervieren (2008) đã chỉ ra rằng …