Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnPhân tích hồi quy

Phân phối chuẩn hóa – Normality

Kiểm tra phân phối chuẩn như thế nào?

Có 3 cách để xác định tính chuẩn hóa

Thứ nhất, xem xét đồ thị histogram với đường bao là đường cong chuẩn hóa.
Đây là cách nhìn trực quan về hình dạng phân phối chuẩn, tuy nhiên, không có một quy tắc cụ thể nào khẳng định phân phối chuẩn sẽ như thế nào. Trong SPSS, đồ thị histogram được thực hiện như sau:

  • Chọn Analyze –> Descriptive Statistics –> Frequencies.
  • Chuyển các biến liên tục cần phân tích vào cửa sổ “Variable(s)”.
  • Bấm “Charts”, và chọn “Histogram, with normal curve”.
  • Bấm OK.
    Phân phối chuẩn - spss

Thứ hai, đánh giá thông qua các giá trị độ trôi (Skewness) và độ nhọn (Kurtosis) trong dữ liệu của biến.

1. Độ trôi liên quan đến tính đối xứng của phân phối.
Phân phối chuẩn là phân phối có dạng đối xứng hoàn hảo. Giá trị độ trôi của phân phối chuẩn bằng 0. Một phân phối đối xứng sẽ có giá trị độ trôi xấp xỉ 0. Một sự lệch dương (trung bình lớn hơn trung vị) sẽ kéo đường cong phân phối qua trái với cái đuôi (tail) dài bên phải. Một sự lệch âm (trung bình nhỏ hơn trung vị) sẽ kéo đường cong về phải với cái đuôi dài bên trái. Giá trị độ trôi được tính theo công thức sau:

\(skewness = \frac{\sum_{i=1}^{N}(Y_{i} – \bar{Y})^{3}} {(N-1)s^{3}}\)

Độ nhọn liên quan đến chóp đỉnh của phân phối. Phân phối chuẩn sẽ có chóp đỉnh cong dạng hình chuông và không quá nhọn hoặc quá phẳng. Độ nhọn dương cho biết phân phối có chóp đỉnh nhọn và độ nhọn âm sẽ cho biết phân phối có chóp đỉnh phẳng. Giá trị độ nhọn được tính theo công thức:

\(kurtosis = \frac{\sum_{i=1}^{N}(Y_{i} – \bar{Y})^{4}} {(N-1)s^{4}}\)

Giá trị độ nhọn của phân phối chuẩn sẽ bằng 3. Tuy nhiên trong phần lớn các phần mềm để dễ nhớ người ta xem độ nhọn của phân phối chuẩn có giá trị bằng 0 bằng cách thêm -3 vào vế phải theo công thức sau:

\(kurtosis = \frac{\sum_{i=1}^{N}(Y_{i} – \bar{Y})^{4}} {(N-1)s^{4}} – 3\)

Ở đây:

  • \(Y_{i}\) là giá trị quan sát thứ i của biến Y
  • \(\bar{Y}\) là giá trị trung bình của biến Y
  • s: là độ độ lệch chuẩn của biến Y

Các giá độ trôi và độ nhọn có thể được tìm thấy trong các phân tích thống kê như tần số, mô tả hoặc câu lệnh Explorer trong SPSS.

  • Chọn Analyze –> Descriptive Statistics –> Explore.
  • Chuyển các biến cần phân tích vào cửa sổ “Variable(s)”.
  • Bấm “Plots”, và bỏ chọn “Stem-and-leaf
  • Bấm OK.

Bảng Descriptives cho biết thông tin mô tả của biến.

Trong SPSS, giá trị của độ trôi và độ nhọn tiến gần về 0 là dấu hiệu cho thấy phân phối của biến có dạng phân phối chuẩn. Ngoài ra, có thể căn cứ vào khoảng giá trị (bằng giá trị thống kê cộng trừ sai số chuẩn) của giá trị thống kê SkewnessKurtosis có chứa giá trị 0 thì có thể xem phân phối của biến có dạng phân phối chuẩn.
Phân phối chuẩn - spss
Tuy nhiên, để có cơ sở chắc chắn hơn ta sử dụng kiểm định Kolmogorov-Smirnov (K-S) và Shapiro-Wilk (S-W) được trình bày ở trang tiếp theo, cùng với một số kết luận về tính phân phối chuẩn.

Previous page 1 2 3Next page
Back to top button