Điều chỉnh sai số chuẩn cho hồi quy OLS, FE và RE
của các hệ số theo Driscoll and Kraay (1998)

Điều chỉnh sai số
Đối với dữ liệu bảng, khi phần dư của một ước lượng tồn tại các vấn đề như phương sai thay đổi, tự tương quan hay tương quan chéo thì mặc dù các hệ số ước lượng tin cậy và không chệch nhưng các sai số chuẩn được ước tính sẽ không chính xác. Trong trường hợp này cần thiết phải tính toán lại các sai số chuẩn của các hệ số để đảm bảo tính phù hợp của các giá trị t hay giá trị p khi phân tích. Thông thường có ba cách để tính toán lại các sai số chuẩn này.
- Đầu tiên là tính toán sai số chuẩn mạnh (robust), bằng cách sử dụng tùy chọn robust của câu lệnh xtreg
- Thứ hai là sử dụng hồi quy Newey – West (câu lệnh newey) để tính toán lại sai số chuẩn trong trường hợp hồi quy OLS
- Cuối cùng là sử dụng hồi quy Driscoll – Kraay để tính toán lại sai số chuẩn cho cả 3 ước lượng Pooled OLS, FE và RE.
Minh họa sử dụng xtscc
Sử dụng câu lệnh xtscc để tính toán các sai số chuẩn robust cho các bảng tồn tại vấn đề phụ thuộc chéo, thông qua hồi quy với các sai số chuẩn Driscoll and Kraay (1998) cho các hệ số được ước lượng bởi Pooled OLS/WLS, FE hoặc RE (GLS).
Ở đây, cấu trúc sai số được giả định có phương sai thay đổi, tự tương quan ở một vài độ trễ và có thể tương quan chéo giữa các đơn vị bảng. Câu lệnh này có thể sử dụng cho các bảng cân bằng, không cân bằng cũng như tồn tại các quan sát missing.
Phần thực hành bên dưới sử dụng các ví dụ ở phần help xtscc để minh họa cho việc ước lượng các hệ số với sai số chuẩn theo Driscoll and Kraay (1998) trong sự so sánh với các ước lượng Pooled OLS, Fixed Effects, FE và Random effects, RE
Pooled OLS
. webuse grunfeld . reg invest mvalue kstock, robust cluster(company) Linear regression Number of obs = 200 F(2, 9) = 51.59 Prob > F = 0.0000 R-squared = 0.8124 Root MSE = 94.408 (Std. err. adjusted for 10 clusters in company) ------------------------------------------------------------------------------ | Robust invest | Coefficient std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1155622 .0158943 7.27 0.000 .0796067 .1515176 kstock | .2306785 .0849671 2.71 0.024 .0384695 .4228874 _cons | -42.71437 20.4252 -2.09 0.066 -88.91939 3.490649 ------------------------------------------------------------------------------ . est store robust . newey invest mvalue kstock, lag(4) force Regression with Newey–West standard errors Number of obs = 200 Maximum lag = 4 F( 2, 197) = 73.08 Prob > F = 0.0000 ------------------------------------------------------------------------------ | Newey–West invest | Coefficient std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1155622 .0114279 10.11 0.000 .0930255 .1380988 kstock | .2306785 .0684217 3.37 0.001 .0957455 .3656115 _cons | -42.71437 16.17904 -2.64 0.009 -74.62072 -10.80802 ------------------------------------------------------------------------------ . est store newey . xtscc invest mvalue kstock, lag(4) Regression with Driscoll-Kraay standard errors Number of obs = 200 Method: Pooled OLS Number of groups = 10 Group variable (i): company F( 2, 19) = 92.14 maximum lag: 4 Prob > F = 0.0000 R-squared = 0.8124 Root MSE = 94.4084 ------------------------------------------------------------------------------ | Drisc/Kraay invest | Coefficient std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1155622 .0138549 8.34 0.000 .0865636 .1445607 kstock | .2306785 .0508451 4.54 0.000 .1242585 .3370985 _cons | -42.71437 12.57036 -3.40 0.003 -69.02443 -16.4043 ------------------------------------------------------------------------------ . est store dris_kraay . est table *, b se t ----------------------------------------------------- Variable | robust newey dris_kraay -------------+--------------------------------------- mvalue | .11556216 .11556216 .11556216 | .01589434 .01142785 .01385486 | 7.27 10.11 8.34 kstock | .23067849 .23067849 .23067849 | .08496711 .06842168 .0508451 | 2.71 3.37 4.54 _cons | -42.714369 -42.714369 -42.714369 | 20.425203 16.179042 12.570359 | -2.09 -2.64 -3.40 ----------------------------------------------------- Legend: b/se/t
Fixed Effects
. est clear . xtreg invest mvalue kstock, fe robust Fixed-effects (within) regression Number of obs = 200 Group variable: company Number of groups = 10 R-squared: Obs per group: Within = 0.7668 min = 20 Between = 0.8194 avg = 20.0 Overall = 0.8060 max = 20 F(2,9) = 28.31 corr(u_i, Xb) = -0.1517 Prob > F = 0.0001 (Std. err. adjusted for 10 clusters in company) ------------------------------------------------------------------------------ | Robust invest | Coefficient std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1101238 .0151945 7.25 0.000 .0757515 .1444961 kstock | .3100653 .0527518 5.88 0.000 .1907325 .4293981 _cons | -58.74393 27.60286 -2.13 0.062 -121.1859 3.698079 -------------+---------------------------------------------------------------- sigma_u | 85.732501 sigma_e | 52.767964 rho | .72525012 (fraction of variance due to u_i) ------------------------------------------------------------------------------ . est store fe_robust . xtscc invest mvalue kstock, fe lag(4) Regression with Driscoll-Kraay standard errors Number of obs = 200 Method: Fixed-effects regression Number of groups = 10 Group variable (i): company F( 2, 19) = 79.65 maximum lag: 4 Prob > F = 0.0000 within R-squared = 0.7668 ------------------------------------------------------------------------------ | Drisc/Kraay invest | Coefficient std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1101238 .0201931 5.45 0.000 .0678592 .1523884 kstock | .3100653 .034045 9.11 0.000 .2388083 .3813224 _cons | -58.74393 24.45362 -2.40 0.027 -109.926 -7.561907 ------------------------------------------------------------------------------ . est store fe_dris_kraay . est table *, b se t ---------------------------------------- Variable | fe_robust fe_dris_~y -------------+-------------------------- mvalue | .1101238 .1101238 | .01519449 .02019306 | 7.25 5.45 kstock | .31006534 .31006534 | .05275177 .03404502 | 5.88 9.11 _cons | -58.743932 -58.743932 | 27.602861 24.453625 | -2.13 -2.40 ---------------------------------------- Legend: b/se/t
Random effects
. est clear . xtreg invest mvalue kstock, re robust Random-effects GLS regression Number of obs = 200 Group variable: company Number of groups = 10 R-squared: Obs per group: Within = 0.7668 min = 20 Between = 0.8196 avg = 20.0 Overall = 0.8061 max = 20 Wald chi2(2) = 70.13 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 (Std. err. adjusted for 10 clusters in company) ------------------------------------------------------------------------------ | Robust invest | Coefficient std. err. z P>|z| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1097811 .0137557 7.98 0.000 .0828206 .1367417 kstock | .308113 .0549728 5.60 0.000 .2003683 .4158576 _cons | -57.83441 24.84323 -2.33 0.020 -106.5262 -9.142576 -------------+---------------------------------------------------------------- sigma_u | 84.20095 sigma_e | 52.767964 rho | .71800838 (fraction of variance due to u_i) ------------------------------------------------------------------------------ . est store re_robust . xtscc invest mvalue kstock, re lag(4) Regression with Driscoll-Kraay standard errors Number of obs = 200 Method: Random-effects GLS regression Number of groups = 10 Group variable (i): company Wald chi2(2) = 140.73 maximum lag: 4 Prob > chi2 = 0.0000 corr(u_i, Xb) = 0 (assumed) overall R-squared = 0.8061 ------------------------------------------------------------------------------ | Drisc/Kraay invest | Coefficient std. err. t P>|t| [95% conf. interval] -------------+---------------------------------------------------------------- mvalue | .1097811 .0285139 3.85 0.001 .0501009 .1694614 kstock | .308113 .0375064 8.21 0.000 .2296112 .3866147 _cons | -57.83441 51.74256 -1.12 0.278 -166.1328 50.46402 -------------+---------------------------------------------------------------- sigma_u | 84.20095 sigma_e | 52.767964 rho | .71800838 (fraction of variance due to u_i) ------------------------------------------------------------------------------ . est store re_dris_kraay . est table *, b se t ---------------------------------------- Variable | re_robust re_dris_~y -------------+-------------------------- mvalue | .10978115 .10978115 | .01375566 .02851388 | 7.98 3.85 kstock | .30811298 .30811298 | .05497278 .03750638 | 5.60 8.21 _cons | -57.834409 -57.834409 | 24.843229 51.742563 | -2.33 -1.12 ---------------------------------------- Legend: b/se/t
Tham khảo thêm:
Driscoll, John Cand Aart CKraay. 1998. Consistent Covariance Matrix Estimation with Spatially Dependent Panel Data. Review of Economics and Statistics, 80, 549-560.