Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnXử lý dữ liệu

Các phương pháp xử lý missing

Ngoài ra, quá trình thay thế lặp MI có thể được thực hiện thông qua cửa sổ giao diện.

Vào Statistics chọn Multiple Imputation, cửa sổ giao diện hiện ra như sau:

Phương pháp thay thế lặp - MI

Trong đó, bao gồm các thiết lập quan trọng sau:

  • Examine: kiểm tra các mẫu missing và lựa chọn phương pháp thay thế phù hợp.
  • Setup: thiết lập dữ liệu để sử dụng mi.
  • Impute: để tạo phép thay thế
  • Nếu bạn có dữ liệu đã thay thế, bỏ qua Setup và đi thẳng vào Import để nhập dữ liệu đã thay thế.
  • Manage: được sử dụng để tạo biến mới, merge hoặc reshape dữ liệu.
  • Khi tất cả hoàn tất, chọn Estimate để lựa chọn mô hình phân tích.
  • Test: thực hiện các kiểm định giả thiết.

Ví dụ: Sử dụng dữ liệu dự báo khả năng đau tim (attact) theo các yếu tố như tình trạng hút thuốc (smokes), tuổi (age), chỉ số trọng lượng (bmi), giới tính (gender) và mức học vấn (hsgrad)

Mô hình dự báo khi đó sẽ là: logistic attack smokes age bmi hsgrad female

Nhưng các biến age và bmi gồm nhiều giá trị missing. Việc ước lượng trực tiếp mô hình bằng câu lệnh trên sẽ bỏ qua rất nhiều thông tin trong dữ liệu (quan sát có chứa giá trị missing ở 1 biến sẽ bị loại bỏ). Phương pháp thay thế lặp MI sẽ được sử dụng để khôi phục các thông tin này. Nó sẽ thay thế m lần để lấp đầy mỗi giá trị missing. Sau đó, sẽ thực hiện riêng rẽ các kỹ thuật thống kê lên m dữ liệu lặp và kết hợp các kết quả này lại. Mục đích là tìm ra một ước lượng tốt hơn cho các tham số và các sai số chuẩn của nó.

Quá trình thực hiện thay thế lặp MI m lần như sau:

webuse mheart5

  • Chuẩn bị dữ liệu cho mi:
    mi set mlong
  • Khai báo cho mi biết các biến có giá trị missing mà chúng ta muốn thay thế:
    mi register imputed age bmi
  • Khai báo giá trị ngẫu nhiên (tùy chọn):
    set seed 29390
  • Thực hiện thay thế:
    mi impute mvn age bmi = attack smokes hsgrad female, add(10)

Chúng ta tạo 10 lần lặp (m=10) cho mỗi giá trị missing trong các biến mà chúng ta đã khai báo (mi register)

  • Ước lượng riêng rẻ các mô hình với với dữ liệu của 10 lần lặp và kết hợp các kết quả này lại:
    mi estimate: logistic attack smokes age bmi hsgrad female

GHI CHÚ

Kết quả ước lượng của câu lệnh

mi estimate: logistic attack smokes age bmi hsgrad female

trình bày các hệ số ước lượng không phải là odds ratios như ở hồi quy logistic thông thường. Điều này bởi vì câu lệnh ước lượng không phải là logistic mà nó là mi estimate. Và mi estimate chỉ sử dụng logistic để ghi nhận các kết quả rồi sau đó kết hợp chúng vào kết quả ước lượng của nó.

Mặc định mi estimate thể hiện các hệ số, nếu chúng ta muốn xem hệ số dạng odds ratios thì có thể gõ tiếp:

mi estimate, or

Hoặc sử dụng trực tiếp như sau:

mi estimate, or: logistic attack smokes age bmi hsgrad female

Xem thêm: giới thiệu chi thiết phương pháp thay thế lặp – MI

Previous page 1 2 3 4 5
Back to top button