KTL cơ bảnXử lý dữ liệu

Chuyển đổi bảng ngang – bảng dọc

Hướng dẫn thực hiện trên SPSS

Tóm tắt: Bài viết hướng dẫn chi tiết cách chuyển đổi cấu trúc dữ liệu giữa dạng bảng ngang (wide format)bảng dọc (long format) trong SPSS Statistics. Việc chuyển đổi này rất quan trọng trong các phân tích thống kê như ANOVA lặp, hồi quy logit lặp, và các mô hình tuyến tính hỗn hợp. Chúng tôi sẽ trình bày cả hai phương pháp: sử dụng lệnh Syntax và giao diện Menu, kèm theo ví dụ minh họa cụ thể.

Giới thiệu

Trong phân tích dữ liệu, đặc biệt là đối với các dữ liệu có các quan sát lặp thì đòi hỏi người phân tích phải cấu trúc lại dữ liệu cho phù hợp với các phương pháp phân tích. Chẳng hạn, đối với các phương pháp như phân tích như ANOVA lặp 1 chiều, hồi quy logit lặp thì dữ liệu phải có cấu trúc bảng dọc (long), ngược lại một số các phương pháp khác đòi hỏi dữ liệu có cấu trúc bảng ngang.

Điều này lại trở nên cần thiết hơn khi chúng ta sử dụng các mô hình tuyến tính hỗn hợp (mixed linear models) hoặc phân tích dữ liệu bảng. Việc hiểu rõ cách chuyển đổi giữa hai dạng cấu trúc này sẽ giúp bạn linh hoạt trong việc áp dụng các phương pháp phân tích khác nhau.

Ví dụ minh họa Cấu trúc dữ liệu

Cấu trúc bảng ngang (Wide Format)

Cấu trúc dạng bảng ngang thể hiện mỗi dòng là mỗi quan sát hoặc mỗi đối tượng, có dạng như sau:

IDx1x2x3y1y2y3
1200190180350033003100
2160150140300029002800

Cấu trúc bảng dọc (Long Format)

Trong khi đó, cấu trúc bảng dọc sử dụng nhiều dòng để mô tả cho một đối tượng, có dạng như sau:

IDXYTIME
120035001
119033002
118031003
216030001
215029002
214028003

Hướng dẫn thực hành

Wide to Long

Trong SPSS, để chuyển dữ liệu từ dạng bảng ngang sang bảng dọc, chúng ta có 2 cách thực hiện như sau:

Phương pháp 1: Sử dụng lệnh syntax

Lưu ý: Để hiển thị cửa sổ Syntax Editor chúng ta vào FileNewSyntax

VARSTOCASES
/make X from x1 x2 x3
/make Y from y1 y2 y3
/index= TIME(3)
/keep=ID.

Tô đen vùng lệnh này và bấm Run selection để thực hiện chuyển đổi.

Chuyển bảng ngang thành bảng dọc - Restructure wide to long

Phương pháp 2: Sử dụng Menu

Vào DataRestructure…

Cửa sổ Restructure Data Wizard hiện ra và thực hiện các bước như sau:

Bước 1: Chọn Restructure selected variables into cases, và bấm nút Next để qua bước 2

Chuyển bảng ngang thành bảng dọc - Restructure wide to long

Bước 2: Tạo biến được gộp

  • Ở phần How many variable groups do you want to restructure?, chúng ta chọn số biến cần được gộp. Trong ví dụ này chúng ta có 2 biến cần gộp đó là XY. X được gộp từ x1, x2, x3Y được gộp từ y1, y2, y3. Nhập 2 ở ô How Many?.
  • Bấm nút Next để qua bước 3.

Bước 3: Xác định các biến cần gộp

  • Ở mục Case Group Identification, chọn Use selected variable và chuyển biến ID vào ô Variable ngay bên dưới.
  • Ở mục Variables to be Transposed, đổi tên trans1 thành X và đưa các biến x1, x2, x3 vào khung ngay bên dưới.
  • Thực hiện tương tự, chọn và đổi tên trans2 từ menu sổ xuống Target Variable thành Y. Tiếp đến đưa y1, y2, y3 vào khung ngay bên dưới.

Chuyển bảng ngang thành bảng dọc - Restructure wide to long

Bước 4: Thiết lập biến chỉ mục

  • Ở mục How many index variables do you want to create?, chúng ta chọn One vì biến Y được đo lường chỉ 1 lần cho 1 quan sát.
  • Bấm nút Next để qua bước 5.

Bước 5: Đặt tên biến xác định

  • Ở mục Edit the index variable name and label, đặt tên cho biến xác định là TIME (đổi tên index1 thành TIME).
  • Bấm nút Next để qua bước 6.

Bước 6: Thiết lập tùy chọn

  • Sử dụng mặc định ở bước này (giữ và tạo file mới để lưu các giá trị missing nếu có).
  • Bấm nút Finish để thực hiện.

Long to Wide

Quá trình chuyển dữ liệu từ dạng bảng dọc sang bảng ngang trong SPSS có thể được thực hiện qua 2 cách sau:

Phương pháp 1: Sử dụng lệnh Syntax

CASETOVARS
/id=ID
/index = TIME.

Phương pháp 2: Sử dụng Menu

Vào DataRestructure…

Bước 1: Chọn mục Restructure selected cases into variables, và bấm nút Next để qua bước 2

Chuyển bảng dọc thành bảng ngang - Restructure long to wide

Bước 2: Chọn biến cần tách quan sát

  • Chuyển biến ID vào khung Identifier Variable
  • Chuyển biến TIME vào khung Index Variable (biến xác định cho mỗi quan sát).

Chuyển bảng dọc thành bảng ngang - Restructure long to wide

Bước 3: Sắp xếp dữ liệu

  • Chọn Yes – data will be sorted by the Identifier and Index variable
  • Bấm nút Finish để thực hiện.

Chuyển bảng dọc thành bảng ngang - Restructure long to wide

Kết luận

Việc chuyển đổi cấu trúc dữ liệu giữa bảng ngang và bảng dọc là một kỹ năng quan trọng trong phân tích dữ liệu với SPSS. Tùy thuộc vào phương pháp phân tích bạn sử dụng, bạn có thể cần phải chuyển đổi dữ liệu giữa hai dạng này. Cả hai phương pháp (Syntax và Menu) đều có ưu điểm riêng: Syntax cho phép tự động hóa và lặp lại quá trình, trong khi Menu cung cấp giao diện trực quan dễ sử dụng cho người mới bắt đầu.

Lưu ý: Khi chuyển đổi cấu trúc dữ liệu, hãy luôn kiểm tra kết quả để đảm bảo dữ liệu đã được chuyển đổi chính xác theo ý muốn.

Key Points:

  • Dữ liệu bảng ngang (wide format) có mỗi dòng là một đối tượng quan sát
  • Dữ liệu bảng dọc (long format) sử dụng nhiều dòng để mô tả một đối tượng
  • Sử dụng lệnh VARSTOCASES để chuyển từ wide sang long
  • Sử dụng lệnh CASETOVARS để chuyển từ long sang wide
  • Cả hai phương pháp Syntax và Menu đều có thể thực hiện chuyển đổi hiệu quả
  • Việc chọn cấu trúc dữ liệu phù hợp phụ thuộc vào phương pháp phân tích sẽ sử dụng

Ghi Chú:

Trên phần mềm Stata để chuyển đổi dạng dữ liệu trên chúng ta sử dụng lệnh reshape đơn giản như sau:

  • Wide to Long: reshape long X Y, i(ID) j(TIME)
  • Long to Wide: reshape wide X Y, i(ID) j(TIME)
Xem thêm
Back to top button