Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnPhân tích hồi quy

Chẩn đoán mô hình hồi quy logit

Một cách khác để kiểm tra độ phù hợp của mô hình là sử dụng kiểm định Hosmer và Lemeshow. Ý tưởng đằng sau của kiểm định Hosmer và Lemeshow là kết quả tần suất dự đoán và tần suất quan sát càng gần nhau thì mô hình càng phù hợp. Kiểm định Hosmer-Lemeshow sử dụng thống kê Pearson chi-square từ bảng tần suất dự đoán và tần suất quan sát để tính toán giá trị p-value. Chúng ta mong đợi một giá trị p-value đủ lớn để mô hình cho thấy không có sự khác biệt giữa giá trị quan sát và giá trị dự đoán.

Khi mô hình gồm nhiều biến liên tục thì sẽ tạo ra một bảng ngẫu nhiên rất lớn, từ đó sẽ tạo ra một kết quả có ý nghĩa thống kê hơn bình thường. Vì vậy, một thực tế phổ biến là kết hợp các mô hình được hình thành bởi các biến dự đoán thành 10 nhóm và tạo thành một bảng ngẫu nhiên bởi 2 chiều 10 nhóm này.

Trên Stata, câu lệnh lfit với tùy chọn group(10) table sẽ thực hiện kiểm tra độ phù hợp của mô hình ước lượng theo Hosmer và Lemeshow bằng cách so sánh giá trị quan sát (dữ liệu thu thập) và giá trị ước lượng (kết quả dự báo) ở 10 phân vị xác suất của mỗi nhóm. Theo đó, sự chênh lệch giữa giá trị quan sát và giá trị ước lượng càng nhỏ thì mô hình càng phù hợp. Giả thuyết H0 của kiểm định Hosmer và Lemeshow là mô hình tốt (mô hình phù hợp). Với giá trị p-value = 0.9109 ứng với Hosmer-Lemeshow chi2(8) = 3.34 cho thấy chúng ta chưa đủ bằng chứng để bác bỏ H0 ở mức ý nghĩa 5%, hay nói cách khác mô hình đang xét là phù hợp.

. lfit, group(10) table

Logistic model for hiqual, goodness-of-fit test

  (Table collapsed on quantiles of estimated probabilities)
  +--------------------------------------------------------+
  | Group |   Prob | Obs_1 | Exp_1 | Obs_0 | Exp_0 | Total |
  |-------+--------+-------+-------+-------+-------+-------|
  |     1 | 0.0016 |     0 |   0.1 |    71 |  70.9 |    71 |
  |     2 | 0.0033 |     1 |   0.2 |    73 |  73.8 |    74 |
  |     3 | 0.0054 |     0 |   0.3 |    74 |  73.7 |    74 |
  |     4 | 0.0096 |     1 |   0.5 |    64 |  64.5 |    65 |
  |     5 | 0.0206 |     1 |   1.0 |    69 |  69.0 |    70 |
  |-------+--------+-------+-------+-------+-------+-------|
  |     6 | 0.0623 |     4 |   2.5 |    69 |  70.5 |    73 |
  |     7 | 0.1421 |     2 |   6.6 |    66 |  61.4 |    68 |
  |     8 | 0.4738 |    24 |  22.0 |    50 |  52.0 |    74 |
  |     9 | 0.7711 |    44 |  43.3 |    25 |  25.7 |    69 |
  |    10 | 0.9692 |    61 |  61.6 |     8 |   7.4 |    69 |
  +--------------------------------------------------------+

       number of observations =       707
             number of groups =        10
      Hosmer-Lemeshow chi2(8) =         9.15
                  Prob > chi2 =         0.3296

Với giá trị p-value = 0.3296, chúng ta có thể kết luận rằng kiểm định Hosmer – Lemeshow về độ phù hợp của mô hình cho thấy rằng mô hình phù hợp tốt với dữ liệu.

Previous page 1 2 3 4 5 6 7 8Next page
Back to top button