Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnXử lý dữ liệu

Khuynh hướng tập trung của dữ liệu

3.

Mode

Mode là số có tần suất xuất hiện nhiều nhất trong mẫu. Nếu trong mẫu không có số nào xuất hiện lặp lại thì không có mode. Với mẫu dữ liệu trên thì không có mode.

4.

So sánh giữa Mean, Median và Mode

Trong 3 tham số Mean, Mode và Median thì Median có khả năng đo lường xu hướng tập trung của dữ liệu mạnh nhất.

Trở lại ví dụ chạy 100 m trên, giả sử sau khi chạy hết 6 lần, bạn chạy tiếp lần thứ 7. Lần này đột nhiên chân bạn bị đau và bạn đi bộ thay vì chạy và kết quả thời gian của lần này là 79.9 giây. Bạn cố gắng thử thêm lần nữa và kết quả vẫn 79.9 giây. Bây giờ ta có mẫu cho 8 lần chạy như sau:

x = {25.1, 21.2, 17.9, 23.0, 24.6, 19.5, 79.9, 79.9}

Các giá trị Mean, Median và Mode so sánh giữa 2 mẫu này như sau:

Khuynh hướng tập trung 6 lần chạy 8 lần chạy
Mean 21.9 giây 36.4 giây
Median 22.1 giây 23.8 giây
Mode Không có 79.9 giây

Nguồn: http://bis.net.vn/forums/t/489.aspx

Nếu bạn quan sát cẩn thận, đối với 6 lần chạy đầu tiên thì thời gian chính gian chạy còn 2 lần sau có sự khác biệt rất lớn so với 6 lần chạy ban đầu (2 giá trị này được xem là bất thường của dữ liệu – outlier) thực chất nó không phải thời gian chạy mà là thời gian đi bộ. Nếu bạn không bị đau thì thời gian chạy dao động quanh Median.

Theo bảng trên ta thấy rằng 2 Outliers không ảnh hưởng nhiều đến Median (từ 22.1 lên 23.8) nhưng ảnh hưởng rất lớn đến Mean (từ 21.9 lên 36.4) và Mode. Mặc dù Median có khả năng đo lường xu hướng tập trung của dữ liệu mạnh hơn Mean vì Median không bị ảnh hưởng bởi các Outliers nhưng nhiều người vẫn thích sử dụng Mean để đo lường xu hướng tập trung của dữ liệu vì dễ tính hơn không cần phải sắp xếp dữ liệu như Median.

NHẬN XÉT VỀ MODE

Mode rất hữu ích đối với dữ liệu có kiểu dữ liệu phân loại (nominal). Đối với các dữ liệu có kiểu phân loại ta không thể dùng Mean hay Median vì nó không có ý nghĩa gì mà phải dùng Mode. Ví dụ nếu dữ liệu mô tả giới tính là nominal và 1 là nam, 0 là nữ thì Mean hay Median là 0.5 không có ý nghĩa gì. Trong khi đó Mode cho biết tần suất nam hay nữ xuất hiện nhiều nhất.

About the author

About the author

  • Tính tình: Vui vẻ, chịu khó, ham học hỏi, thích sáng tạo,
  • Quan tâm: Dành hơn 4000 giờ để tìm hiểu Kinh tế lượng,
  • Phương châm: Tích tiểu thành đại – Kiên trì thực hiện.
Previous page 1 2
Back to top button