KTL cơ bảnPhân tích hồi quy

Hồi quy Probit – STATA

GIỚI THIỆU VỀ HỒI QUY PROBIT

Hồi quy Probit, đôi khi còn được gọi là mô hình probit, được sử dụng để ước lượng mô hình có biến phụ thuộc dạng nhị phân. Trong hồi quy probit, nghịch đảo của hàm phân phối xác suất chuẩn chuẩn hóa là sự kết hợp tuyến tính của các biến giải thích.

Ví dụ: chúng ta muốn biết các biến như điểm bài thi cuối khóa (gre), học lực trung bình (gpa) và uy tín của trường THCS (rank) mà các học sinh theo học ảnh hưởng như thế nào đến kết quả xét tuyển (admit) ở bậc học PTTH. Biến kết quả ở đây là một biến nhị phân (được chấp nhận/không chấp nhận).

Phần minh họa sử dụng dữ liệu thực hành là binary.dta

use https://www.vietlod.com/data/binary.dta, clear

Bộ dữ liệu bao gồm 400 quan sát với 3 biến giải thích (gpa, gre, rank) và 1 biến phụ thuộc dạng nhị phân (admit). Trong 3 biến giải thích, 2 biến liên tục và một biến (rank) dạng thứ tự (nhận giá trị từ 1 đến 4). Kết quả thống kê mô tả các biến được thể hiện như bên dưới:

summarize gre gpa
tab admit rank
Hồi quy probit - stata

1.

Lựa chọn phương pháp

Phần trình bày bên dưới sẽ liệt kê một số phương pháp có thể được sử dụng để giải quyết vấn đề của ví dụ nêu ra.

  • Hồi quy Logit: mô hình hồi quy Logit sẽ cho ra các kết quả tương đối giống với hồi quy probit. Việc lựa chọn giữa logit vs probit phần lớn tùy thuộc vào quan điểm cá nhân của người sử dụng.

Đọc thêm: Phân biệt mô hình logit vs probit.

  • Hồi quy OLS. Khi biến phụ thuộc của mô hình có dạng danh mục (nhị phân, thứ tự, định danh) thì hồi quy OLS (cụ thể trong trường hợp này là mô hình xác suất tuyến tính) được sử dụng như cách mô tả các xác suất có điều kiện. Tuy nhiên, các phần dư (sai số) của mô hình xác suất tuyến tính sẽ vi phạm giả thuyết OLS về tính đồng nhất và phân phối chuẩn của phần dư. Kết quả là các sai số chuẩn của hệ số ước lượng, và giá trị kiểm định thống kê sẽ không còn đúng.[1]
  • Phương pháp phân tách 2 nhóm. Một phương pháp phân tích đa biến cho trường hợp biến phụ thuộc dạng nhị phân thường được sử dụng là Hotelling’s T2. Ý tưởng của phương pháp Hotelling’s T2 là chuyển các giá trị 0/1 của biến phụ sang biến phân nhóm và các biến giải thích sẽ được chuyển sang các biến kết quả. Điều này cho phép thực hiện kiểm định chung về mức ý nghĩa của mô hình nhưng không cho biết được giá trị hệ số của từng biến riêng rẻ. Do vậy, ý nghĩa giải thích của các biến độc lập sẽ không còn rõ ràng.
  • Hồi quy probit. Như đã trình bày ở trên, hồi quy probit vs logit là 2 dạng thể hiện khác nhau của hàm phân phối xác suất. Kết quả hồi quy từ mô hình logit vs probit có mối quan hệ chặt với nhau[2].

Bài viết này sẽ minh họa ước lượng mô hình ở ví dụ trên bằng phương pháp hồi quy probit với sự hỗ trợ của phần mềm STATA.

Trên STATA, hồi quy probit được thực hiện bằng câu lệnh probit. Cấu trúc của probit tương tự với logit như sau:

probit admit gre gpa i.rank
Hồi quy probit - stata

Ghi chú: tiền tố i. trước biến rank nhằm mục đích thông báo cho STATA hiểu phải thực hiện hồi quy probit với i biến giả tương ứng với i giá trị của biến thứ tự rank (ở đây i = 4).

Xem tiếp giải thích kết quả hồi quy Probit ở trang 2

1 2Trang sau

One Comment

  1. Thân gửi thầy,

    Em đang làm luận văn thạc sỹ, và chọn mô hình probit. Qua website em thấy một số bài phân tích của thầy khá chi tiết, và có một số lệnh chạy rất hay. Em chưa biết nhiều về mô hình này nên kính mong thầy giải đáp cho em một số thắc mắc.

    – Xin thầy chỉ cho em những bước nên làm khi chạy một mô hình probit (kiểm định, thống kê….)
    – Mô hình của em chạy ra thì có chỉ số Psuedo R2= 0.9362 thì không biết có ok không thầy, tại em thấy mấy bài của thầy chỉ số này khá nhỏ.
    – Thầy giúp em giải nghĩa các thông tin trong bảng fitstat, em nên chọn lọc và đưa vào đánh giá những chỉ số nào.
    – Ở phía trên thầy có chạy một bảng so sánh giữa probit và logit. Cái này thật sự hay nhưng em mới nhập môn nên không biết. Kính mong thầy hướng dẫn cho em.

    Một số câu hỏi kính mong thầy giải đáp giúp em, vì em cũng sắp hết thời gian nên cũng rất gấp.

    p/s: Nếu được thì thầy reply qua mail cho em và cho em xin SDT thầy với nhé ^^

Back to top button