Hay cần học

Ước tính cở mẫu cho một nghiên cứu

Sử dụng Power analysis trên R

Power analysis là một phần rất quan trọng của các nghiên cứu thực nghiệm. Nó cho phép xác định cở mẫu cần thiết để phát hiện ảnh hưởng (effect size) của một yếu tố với một mức độ tin cậy nhất định. Nó cũng cho phép xác định xác suất phát hiện một ảnh hưởng với một mức tin cậy nhất định ở một cở mẫu cụ thể. Nếu xác suất phát hiện thấp thì cần thiết thay đổi hoặc từ bỏ thử nghiệm.

Sai lầm loại I, sai lầm loại 2 và Power của nghiên cứu
Sai lầm loại I, sai lầm loại 2 và Power của nghiên cứu

 

Sau đây là bốn đại lượng quan trọng trong một thiết kế nghiên cứu

  1. Cở mẫu (sample size)
  2. Độ ảnh hưởng (effect size)
  3. Sai lầm loại I, alpha
  4. Power = 1 – beta với beta là sai sót loại II.

Cở mẫu là số đối tượng cần thiết trong một nghiên cứu để kiểm định một hay nhiều giả thuyết khoa học. Việc ước tính cở mẫu tùy thuộc vào mô hình nghiên cứu, biến số phân tích, độ ảnh hưởng, mức độ sai sót (loại I và loại II) trong kiểm định giả thuyết.

Độ ảnh hưởng (effect size) hiểu một cách đơn giản là giá trị tới hạn (nhỏ nhất) mà một tác động (ảnh hưởng) được phát hiện hoặc ghi nhận trong thực nghiệm.

Sai lầm loại I, alpha chính là xác suất xác suất bác bỏ giả thuyết H0 khi giả thuyết này đúng. Ngược lại, sai sót loại II, beta là xác suất chấp nhận H0 khi mà giả thuyết này sai. Nói một cách dân dã trong trường hợp H0 thì nếu đúng mà bác bỏ (giết nhầm hơn bỏ sót) là sai lầm loại I (alpha). Sai mà chấp nhận (nhận giặc làm cha) là sai lầm loại II (beta).

Power của một nghiên cứu là xác suất mà nghiên cứu cho ra kết quả có ý nghĩa thống kê nếu giả thuyết đối H1 đúng. Power của một nghiên cứu chính độ nhạy (sensitivity) của nghiên cứu đó.

Xem thêm mục 21 Ước tính cở mẫu của Nguyễn Văn Tuấn (2014, trang 425).

Thông thường, alpha được xác định ở mức 0.05 hay 0.01, và beta thường được chấp nhận sai sót ở mức 0.20 hay 0.10. Các sai sót alpha và beta này phải được xác định trước khi ước tính cở mẫu.

Bài viết ở link bên dưới sẽ giới thiệu chi tiết cách sử dụng các hàm trên R trong Power analysis cho các kiểm định tỉ lệ, t-test, ANOVA, Chi squared, tương quan…

https://www.statmethods.net/stats/power.html

Back to top button