KTL cơ bảnXử lý dữ liệu

Hướng dẫn sử dụng lệnh fitstat

Tổng hợp và so sánh độ phù hợp của các mô hình ước lượng

Rất nhiều đại lượng vô hướng được tính toán để đo lường độ phù hợp tổng thể của các mô hình hồi quy cho các biến phụ thuộc dạng liên tục, thứ tự hoặc danh mục. Sử dụng câu lệnh hậu kiểm fitstat để tính toán đa dạng các thống kê độ phù hợp nhiều loại mô hình khác nhau. Nó có thể được sử dụng sau lệnh clogit, cnreg, cloglog, intreg, logistic, logit, mlogit, nbreg, ocratio, ologit, oprobit, poisson, probit, regress, zinb, zip.

Cú pháp cơ bản của lệnh fitstat

fitstat [, saving(name) using(name) bic force save dif]

Ví dụ bên dưới hướng dẫn sử dụng tùy chọn using() của lệnh fitstat để so sánh độ phù hợp của mô hình hiện tại với mô hình đã lưu trước đó ở tùy chọn saving().

. use https://www.vietlod.com/data/mroz1.dta, clear
(Data from 1976 PSID-T Mroz)
. logit lfp k5 k618 age wc hc lwg inc
Iteration 0:   log likelihood =  -514.8732  
Iteration 1:   log likelihood = -453.03179  
Iteration 2:   log likelihood = -452.63343  
Iteration 3:   log likelihood = -452.63296  
Iteration 4:   log likelihood = -452.63296  

Logistic regression                             Number of obs     =        753
                                                LR chi2(7)        =     124.48
                                                Prob > chi2       =     0.0000
Log likelihood = -452.63296                     Pseudo R2         =     0.1209

------------------------------------------------------------------------------
         lfp |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          k5 |  -1.462913   .1970006    -7.43   0.000    -1.849027   -1.076799
        k618 |  -.0645707   .0680008    -0.95   0.342    -.1978499    .0687085
         age |  -.0628706   .0127831    -4.92   0.000    -.0879249   -.0378162
          wc |   .8072738   .2299799     3.51   0.000     .3565215    1.258026
          hc |   .1117336   .2060397     0.54   0.588    -.2920969     .515564
         lwg |   .6046931   .1508176     4.01   0.000     .3090961    .9002901
         inc |  -.0344464   .0082084    -4.20   0.000    -.0505346   -.0183583
       _cons |    3.18214   .6443751     4.94   0.000     1.919188    4.445092
------------------------------------------------------------------------------

. fitstat, saving(mod1)
Measures of Fit for logit of lfp

Log-Lik Intercept Only:     -514.873     Log-Lik Full Model:         -452.633
D(745):                      905.266     LR(7):                       124.480
                                         Prob > LR:                     0.000
McFadden's R2:                 0.121     McFadden's Adj R2:             0.105
Maximum Likelihood R2:         0.152     Cragg & Uhler's R2:            0.204
McKelvey and Zavoina's R2:     0.217     Efron's R2:                    0.155
Variance of y*:                4.203     Variance of error:             3.290
Count R2:                      0.693     Adj Count R2:                  0.289
AIC:                           1.223     AIC*n:                       921.266
BIC:                       -4029.663     BIC':                        -78.112

(Indices saved in matrix fs_mod1)
. gen age2 = age^2
. logit lfp k5 k618 age age2 wc hc lwg inc
teration 0:   log likelihood =  -514.8732  
Iteration 1:   log likelihood = -452.42335  
Iteration 2:   log likelihood = -452.03879  
Iteration 3:   log likelihood = -452.03836  
Iteration 4:   log likelihood = -452.03836  

Logistic regression                             Number of obs     =        753
                                                LR chi2(8)        =     125.67
                                                Prob > chi2       =     0.0000
Log likelihood = -452.03836                     Pseudo R2         =     0.1220

------------------------------------------------------------------------------
         lfp |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          k5 |  -1.411597   .2001829    -7.05   0.000    -1.803948   -1.019246
        k618 |  -.0815087   .0696247    -1.17   0.242    -.2179706    .0549531
         age |   .0659135   .1188199     0.55   0.579    -.1669693    .2987962
        age2 |  -.0014784   .0013584    -1.09   0.276    -.0041408     .001184
          wc |   .8098626   .2299065     3.52   0.000     .3592542    1.260471
          hc |   .1340998    .207023     0.65   0.517    -.2716579    .5398575
         lwg |   .5925741   .1507807     3.93   0.000     .2970495    .8880988
         inc |  -.0355964   .0083188    -4.28   0.000    -.0519009   -.0192919
       _cons |    .511489   2.527194     0.20   0.840     -4.44172    5.464698
------------------------------------------------------------------------------

. fitstat, using(mod1)
Measures of Fit for logit of lfp
                             Current            Saved       Difference
Model:                         logit            logit
N:                               753              753                0
Log-Lik Intercept Only:     -514.873         -514.873            0.000
Log-Lik Full Model:         -452.038         -452.633            0.595
D:                           904.077(744)     905.266(745)      -1.189(-1)
LR:                          125.670(8)       124.480(7)         1.189(1)
Prob > LR:                     0.000            0.000            0.000
McFadden's R2:                 0.122            0.121            0.001
McFadden's Adj R2:             0.105            0.105           -0.001
Maximum Likelihood R2:         0.154            0.152            0.001
Cragg & Uhler's R2:            0.206            0.204            0.002
McKelvey and Zavoina's R2:     0.217            0.217           -0.000
Efron's R2:                    0.156            0.155            0.001
Variance of y*:                4.202            4.203           -0.000
Variance of error:             3.290            3.290            0.000
Count R2:                      0.688            0.693           -0.005
Adj Count R2:                  0.277            0.289           -0.012
AIC:                           1.225            1.223            0.001
AIC*n:                       922.077          921.266            0.811
BIC:                       -4024.228        -4029.663            5.435
BIC':                        -72.677          -78.112            5.435

Difference of    5.435 in BIC' provides positive support for saved model.

Đối với tất cả các mô hình, lệnh fitstat báo cáo giá trị log-likelihoods của mô hình đầy đủ và mô hình Null (chỉ gồm hằng số), độ sai lệch (D), tỉ lệ hợp lý chi2 (G2), AIC, AIC*N, BIC và BIC’.

Đối với tất cả các mô hình (trừ OLS), lệnh fitstat báo cáo giá trị McFadden’s R2, McFadden’s R2 hiệu chỉnh, ML R2 và Cragg & Uhler’s R2. Những đại lượng này đo lường tương tự R2 cho hồi quy OLS. Lệnh fitstat báo cáo R2 và R2 hiệu chỉnh sau lệnh hồi quy. Đối với các mô hình với dữ liệu dạng danh mục, fitstat báo cáo R2 và R2 hiệu chỉnh. Các mô hình như hồi quy logit/probit thứ tự, hay mô hình với dữ liệu kiểm duyệt (tobit, cnreg, hay intreg), lệnh fitstat báo cáo McKelvey và Zavonia’s R2. Ngoài ra, nó cũng báo cáo giá trị Efron’s R2 cho hồi quy logit hoặc probit.

Source
Scott Long & Jeremy Freese (2000)

Bài liên quan

Back to top button