KTL nâng cao

Tản mạn về mô hình SEM

3. Mô hình SEM đòi hỏi cở mẫu lớn

Có rất nhiều nỗ lực nhằm biến đổi mô hình SEM tương thích với các mẫu dữ liệu nhỏ, tuy nhiên, một thực tế phổ biến SEM là một kỹ thuật ước lượng mẫu lớn. Sở dĩ là vì một vài ước lượng thống kê trong mô hình SEM chẳng hạn như sai số chuẩn ước lượng có thể sẽ không chính xác khi cở mẫu không đủ lớn hoặc vấn đề lớn hơn về kỹ thuật của ước lượng hợp lý cực đại.

Câu hỏi đặt ra là “lớn thế nào là đủ”. Rất khó để đưa ra một câu trả lời hoàn chỉnh bởi nó phụ thuộc vào độ phức tạp của mô hình. Mô hình phức tạp yêu cầu cở mẫu lớn hơn mô hình đơn giản bởi có nhiều tham số được ước lượng hơn, vì vậy, yêu cầu cở mẫu phải lớn hơn để đảm bảo sự ổn định và tin cậy của kết quả ước lượng. Ngoài ra, cở mẫu còn phụ thuộc vào dạng phân phối của dữ liệu. Thông thường, có thể chấp nhận cở mẫu nhỏ hơn khi các biến phụ thuộc dạng liên tục có phân phối chuẩn và có mối quan hệ tuyến tính với các biến khác.

Một quy tắc kinh nghiệm hữu ích (rule of thumb) liên quan đến mối quan hệ giữa cở mẫu và độ phức tạp của mô hình được Jackson (2003) đề cập là quy tắc N:q. Quy tắc N:q được áp dụng khi phương pháp ước lượng được sử dụng là phương pháp ước lượng hợp lý cực đại ML (maximum likelihood) được sử dụng khá phổ biển trong mô hình SEM. Theo đó, Jackson (2003) đề nghị cở mẫu tối thiểu cần thiết sẽ dựa trên tỉ lệ số quan sát (N) trên mỗi tham số được ước lượng (q). Một mẫu tối thiểu lý tưởng sẽ có tỉ lệ N:q là 20:1. Ví dụ, chúng ta có 10 tham số ước lượng thì cở mẫu tối thiểu lý tưởng là 20*10 = 200 quan sát. Ngoài ra, trong trường hợp việc tiếp cận dữ liệu bị giới hạn thì Jackson (2003) cũng đề nghị 1 tỉ lệ ít lí tưởng hơn có thể sử dụng tỉ lệ N:q là 10:1 cũng đảm bảo tính chất tin cậy của kết quả.

Ngoài ra, cở mẫu điển hình trong phân tích mô hình SEM là 200. Gọi là điển hình bởi có khá nhiều nghiên cứu của các học giả sử dụng cở mẫu này. Cụ thể theo kết quả thống kê của Breckler (1990) cho thấy có đến 72 bài báo đăng trên các personality and social psychology journals sử dụng cở mẫu 200 hoặc kết quả thống kê Shah and Goldstein (2006) với hơn 93 bài báo đăng trên tạp chí khoa học quản lý (management science journals). Tuy nhiên, một mẫu với 200 quan sát là rất nhỏ khi phân tích một mô hình phức tạp, sử dụng một phương pháp ước lượng khác, hoặc dữ liệu không có phân phối chuẩn…

Trang trước 1 2 3 4 5 6Trang sau

Bài liên quan

Back to top button