T-test trung vị mẫu – Npar tests
Hướng dẫn thực hiện Kiểm định t-test trung vị mẫu với SPSS

Tóm tắt: Bài viết hướng dẫn các bạn thực hiện kiểm định t-test trung vị mẫu trong SPSS theo phong cách Laerd Statistics Tutorials. Nội dung bao gồm chuẩn bị dữ liệu, thiết lập giả thiết, thao tác từng bước trên giao diện, giải thích chi tiết kết quả, lưu ý quan trọng và mã lệnh tương đương trong Stata, R, Python nhằm phục vụ thực hành kinh tế lượng hiệu quả trong nghiên cứu kinh tế Việt Nam.
Giới thiệu
Nội dung chính
Trong thực hành kinh tế lượng, khi ta muốn so sánh trung vị (\(\tilde{x}\)) của một biến với một giá trị tham chiếu (chẳng hạn 50 điểm) nhưng không chắc chắn hoặc biết rằng dữ liệu không phân phối chuẩn, kiểm định t-test trung vị mẫu (one sample median test) là lựa chọn phù hợp. Khác với t-test trung bình một mẫu yêu cầu giả định phân phối chuẩn, kiểm định trung vị thuộc nhóm kiểm định phi tham số, do đó linh hoạt hơn trong thực tiễn.
Xem thêm: Kiểm định phi tham số
Giả thiết kiểm định
Giả sử chúng ta muốn kiểm tra xem trung vị điểm toán của học sinh có khác 50 hay không. Ta có:
$$
\begin{aligned}
H_0 &: \tilde{x}=50 \quad &(\text{trung vị bằng 50}) \\
H_1 &: \tilde{x}\neq50 \quad &(\text{trung vị khác 50})
\end{aligned}
$$
Trong đó \(\tilde{x}\) là ký hiệu trung vị của tổng thể.
Ví dụ thực tế từ kinh tế Việt Nam
Dữ liệu hsb2.sav bao gồm 200 học sinh bậc trung học. Chúng ta muốn biết liệu trung vị điểm toán (math
) của toàn bộ học sinh có khác 50 – mức điểm đạt yêu cầu của một kỳ thi chuẩn hóa hay không. Đây là câu hỏi quen thuộc trong phân tích giáo dục, hỗ trợ nhà quản lý đánh giá chất lượng dạy học.
- Biến quan tâm: math (điểm toán, thang 0–100)
- Giá trị kiểm định: 50 điểm
- Phần mềm: SPSS thống kê phiên bản 28
Dữ liệu mẫu và kiểm tra sơ bộ
Trước khi phân tích, hãy mở file hsb2.sav
trong SPSS và quan sát thống kê mô tả:
- Số quan sát (N) = 200
- Trung vị (Median) = 52
- Min–Max = 33–75
Hướng dẫn thực hành chi tiết trên SPSS
Bước 1: Truy cập chức năng kiểm định
– Vào Analyze → Nonparametric Tests → One Sample…
Bước 2: Hiểu giao diện Objective
Cửa sổ One-Sample Nonparametric Tests mở ra với tab mặc định Objective. SPSS thông báo nhóm kiểm định này không yêu cầu phân phối chuẩn. Chọn Customize analysis để tùy chỉnh.
Bước 3: Chọn biến tại tab Fields
Giữ biến math
trong hộp Test Fields, các biến khác đưa về hộp Fields.
Bước 4: Cài đặt tham số tại tab Settings
Tại tab Settings, tích chọn Compare median to hypothesized (Wilcoxon Signed-rank test) và nhập 50 vào ô Hypothesized median.
Nhấn Run để tiến hành kiểm định.
Giải thích kết quả
Bảng Hypothesis Test Summary
- Statistic: 3512.0
- p-value (Sig.): 0.018 < 0.05
- Kết luận: Bác bỏ \(H_0\) ⇒ Trung vị điểm toán khác 50 tại mức ý nghĩa 5 %.
Cửa sổ Model Viewer
Double-click vào bảng để mở Model Viewer – nơi hiển thị chi tiết thống kê và biểu đồ trực quan.
Lưu ý quan trọng
- Nếu dữ liệu chứa quá nhiều giá trị trùng với giá trị kiểm định (50), Wilcoxon Signed-rank có thể mất hiệu lực.
- Kiểm định trung vị chỉ phản ánh vị trí trung tâm, không nói lên sự khác biệt về phân tán.
- Kết quả có ý nghĩa thống kê nhưng cần cân nhắc ý nghĩa thực tiễn (practical significance) trước khi khuyến nghị chính sách giáo dục.
Tổng kết
Bài viết đã trình bày quy trình 5 bước thực hiện kiểm định t-test trung vị mẫu trong SPSS và giải thích kết quả để phục vụ thực hành kinh tế lượng. Phương pháp phù hợp khi dữ liệu không đáp ứng giả định phân phối chuẩn và giúp nhà nghiên cứu đánh giá trung vị của biến so với chuẩn mực.
Key points:
- Kiểm định trung vị là một kiểm định phi tham số linh hoạt.
- Sử dụng Wilcoxon Signed-rank để so sánh trung vị với giá trị giả định.
- SPSS hỗ trợ thao tác click đơn giản, kết quả trực quan qua Model Viewer.
- Luôn kiểm tra ý nghĩa thực tiễn bên cạnh ý nghĩa thống kê.
Phụ lục: Code thực hiện trên các phần mềm
SPSS Syntax
SPSS Syntax (.sps)
* Kiểm định trung vị mẫu bằng Wilcoxon Signed-rank trong SPSS.
* Tác giả: Thực hành kinh tế lượng.
GET FILE='/data/hsb2.sav'.
* Chạy One-Sample Nonparametric Tests.
NPAR TESTS
/ONESAMPLE TEST (MEDIAN)=math (50)
/MISSING ANALYSIS.
Stata
Code Stata
// Kiểm định trung vị mẫu (signrank) trong Stata
// Tác giả: Thực hành kinh tế lượng
* Mở dữ liệu
use "hsb2.dta", clear
* Kiểm định Wilcoxon Signed-rank so sánh median với 50
signrank math = 50
R
Code R
# Kiểm định trung vị mẫu trong R
# Tác giả: Thực hành kinh tế lượng
# Đọc dữ liệu
data <- read.csv("hsb2.csv")
# Kiểm định Wilcoxon Signed-rank
wilcox.test(data$math, mu = 50, conf.int = TRUE)
Python
Code Python
# Kiểm định trung vị mẫu bằng Python (SciPy)
# Tác giả: Thực hành kinh tế lượng
import pandas as pd
from scipy.stats import wilcoxon
# Đọc dữ liệu
df = pd.read_csv('hsb2.csv')
# Thực hiện Wilcoxon Signed-rank test
stat, p_value = wilcoxon(df['math'] - 50)
print(f'Statistic = {stat:.4f}, p-value = {p_value:.4f}')
if p_value < 0.05:
print("Bác bỏ H0: Trung vị khác 50")
else:
print("Không bác bỏ H0: Trung vị bằng 50")
Tài liệu tham khảo
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics. SAGE.
- Pallant, J. (2020). SPSS Survival Manual. McGraw-Hill.
- IBM Corporation. (2021). IBM SPSS Statistics Documentation.
- Hoàng Trọng & Chu Nguyễn Mộng Ngọc. (2019). Phân tích dữ liệu nghiên cứu với SPSS. NXB Hồng Đức.
- Nguyễn Khánh Trung. (2020). Thực hành kinh tế lượng với phần mềm thống kê. NXB Thống kê.