Hướng dẫn sử dụng lệnh fitstat
Tổng hợp và so sánh độ phù hợp của các mô hình ước lượng
Rất nhiều đại lượng vô hướng được tính toán để đo lường độ phù hợp tổng thể của các mô hình hồi quy cho các biến phụ thuộc dạng liên tục, thứ tự hoặc danh mục. Sử dụng câu lệnh hậu kiểm fitstat để tính toán đa dạng các thống kê độ phù hợp nhiều loại mô hình khác nhau. Nó có thể được sử dụng sau lệnh clogit, cnreg, cloglog, intreg, logistic, logit, mlogit, nbreg, ocratio, ologit, oprobit, poisson, probit, regress, zinb, và zip.
Cú pháp cơ bản của lệnh fitstat
fitstat [, saving(name) using(name) bic force save dif]
Ví dụ bên dưới hướng dẫn sử dụng tùy chọn using() của lệnh fitstat để so sánh độ phù hợp của mô hình hiện tại với mô hình đã lưu trước đó ở tùy chọn saving().
. use https://www.vietlod.com/data/mroz1.dta, clear (Data from 1976 PSID-T Mroz) . logit lfp k5 k618 age wc hc lwg inc Iteration 0: log likelihood = -514.8732 Iteration 1: log likelihood = -453.03179 Iteration 2: log likelihood = -452.63343 Iteration 3: log likelihood = -452.63296 Iteration 4: log likelihood = -452.63296 Logistic regression Number of obs = 753 LR chi2(7) = 124.48 Prob > chi2 = 0.0000 Log likelihood = -452.63296 Pseudo R2 = 0.1209 ------------------------------------------------------------------------------ lfp | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- k5 | -1.462913 .1970006 -7.43 0.000 -1.849027 -1.076799 k618 | -.0645707 .0680008 -0.95 0.342 -.1978499 .0687085 age | -.0628706 .0127831 -4.92 0.000 -.0879249 -.0378162 wc | .8072738 .2299799 3.51 0.000 .3565215 1.258026 hc | .1117336 .2060397 0.54 0.588 -.2920969 .515564 lwg | .6046931 .1508176 4.01 0.000 .3090961 .9002901 inc | -.0344464 .0082084 -4.20 0.000 -.0505346 -.0183583 _cons | 3.18214 .6443751 4.94 0.000 1.919188 4.445092 ------------------------------------------------------------------------------ . fitstat, saving(mod1) Measures of Fit for logit of lfp Log-Lik Intercept Only: -514.873 Log-Lik Full Model: -452.633 D(745): 905.266 LR(7): 124.480 Prob > LR: 0.000 McFadden's R2: 0.121 McFadden's Adj R2: 0.105 Maximum Likelihood R2: 0.152 Cragg & Uhler's R2: 0.204 McKelvey and Zavoina's R2: 0.217 Efron's R2: 0.155 Variance of y*: 4.203 Variance of error: 3.290 Count R2: 0.693 Adj Count R2: 0.289 AIC: 1.223 AIC*n: 921.266 BIC: -4029.663 BIC': -78.112 (Indices saved in matrix fs_mod1)
. gen age2 = age^2 . logit lfp k5 k618 age age2 wc hc lwg inc teration 0: log likelihood = -514.8732 Iteration 1: log likelihood = -452.42335 Iteration 2: log likelihood = -452.03879 Iteration 3: log likelihood = -452.03836 Iteration 4: log likelihood = -452.03836 Logistic regression Number of obs = 753 LR chi2(8) = 125.67 Prob > chi2 = 0.0000 Log likelihood = -452.03836 Pseudo R2 = 0.1220 ------------------------------------------------------------------------------ lfp | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- k5 | -1.411597 .2001829 -7.05 0.000 -1.803948 -1.019246 k618 | -.0815087 .0696247 -1.17 0.242 -.2179706 .0549531 age | .0659135 .1188199 0.55 0.579 -.1669693 .2987962 age2 | -.0014784 .0013584 -1.09 0.276 -.0041408 .001184 wc | .8098626 .2299065 3.52 0.000 .3592542 1.260471 hc | .1340998 .207023 0.65 0.517 -.2716579 .5398575 lwg | .5925741 .1507807 3.93 0.000 .2970495 .8880988 inc | -.0355964 .0083188 -4.28 0.000 -.0519009 -.0192919 _cons | .511489 2.527194 0.20 0.840 -4.44172 5.464698 ------------------------------------------------------------------------------ . fitstat, using(mod1) Measures of Fit for logit of lfp Current Saved Difference Model: logit logit N: 753 753 0 Log-Lik Intercept Only: -514.873 -514.873 0.000 Log-Lik Full Model: -452.038 -452.633 0.595 D: 904.077(744) 905.266(745) -1.189(-1) LR: 125.670(8) 124.480(7) 1.189(1) Prob > LR: 0.000 0.000 0.000 McFadden's R2: 0.122 0.121 0.001 McFadden's Adj R2: 0.105 0.105 -0.001 Maximum Likelihood R2: 0.154 0.152 0.001 Cragg & Uhler's R2: 0.206 0.204 0.002 McKelvey and Zavoina's R2: 0.217 0.217 -0.000 Efron's R2: 0.156 0.155 0.001 Variance of y*: 4.202 4.203 -0.000 Variance of error: 3.290 3.290 0.000 Count R2: 0.688 0.693 -0.005 Adj Count R2: 0.277 0.289 -0.012 AIC: 1.225 1.223 0.001 AIC*n: 922.077 921.266 0.811 BIC: -4024.228 -4029.663 5.435 BIC': -72.677 -78.112 5.435 Difference of 5.435 in BIC' provides positive support for saved model.
Đối với tất cả các mô hình, lệnh fitstat báo cáo giá trị log-likelihoods của mô hình đầy đủ và mô hình Null (chỉ gồm hằng số), độ sai lệch (D), tỉ lệ hợp lý chi2 (G2), AIC, AIC*N, BIC và BIC’.
Đối với tất cả các mô hình (trừ OLS), lệnh fitstat báo cáo giá trị McFadden’s R2, McFadden’s R2 hiệu chỉnh, ML R2 và Cragg & Uhler’s R2. Những đại lượng này đo lường tương tự R2 cho hồi quy OLS. Lệnh fitstat báo cáo R2 và R2 hiệu chỉnh sau lệnh hồi quy. Đối với các mô hình với dữ liệu dạng danh mục, fitstat báo cáo R2 và R2 hiệu chỉnh. Các mô hình như hồi quy logit/probit thứ tự, hay mô hình với dữ liệu kiểm duyệt (tobit, cnreg, hay intreg), lệnh fitstat báo cáo McKelvey và Zavonia’s R2. Ngoài ra, nó cũng báo cáo giá trị Efron’s R2 cho hồi quy logit hoặc probit.