Home | Xử lý dữ liệu

Xử lý dữ liệu

Tại sao cần xử lý dữ liệu???

Xử lý dữ liệu là bước đầu tiên trong bất kì một quá trình phân tích dữ liệu nào. Theo đó, dữ liệu trước khi được sử dụng trong các phân tích thì phải được xử lý và làm sạch. Mục đích của xử lý dữ liệu (data screening) bao gồm:

  1. Kiểm tra sự hợp lý của dữ liệu
  2. Kiểm tra các giá trị rỗng (missings) và tìm phương án xử lý
  3. Kiểm tra các giá trị dị biệt (outliers) và tìm hướng khắc phục
  4. Kiểm tra tính chuẩn hóa của phân phối và lựa chọn kiểm định

Ngoài ra, phần này cũng giải thích làm thế nào để tạo ra các bộ chỉ số bằng cách kết hợp các biến riêng rẻ vào một biến tổng hợp mới hoặc làm thế nào để chuyển đổi một biến liên tục vào một biến phân loại và giới thiệu một số kỹ thuật lọc quan sát hoặc nối dữ liệu nhằm đáp ứng các nhu cầu cầu nghiên cứu cụ thể của các bạn. Tất cả các công việc này sẽ lần lượt được trình bày bên dưới với sự hỗ trợ của phần mềm STATA, SPSS.

Bảng tổng hợp các thủ tục xử lý dữ liệu và các hướng dẫn thực hiện trên SPSS, STATA

Xử lý dữ liệu

SPSS

STATA

Nhập và xuất dữ liệu

SPSS

STATA

Tạo biến

SPSS

STATA

Kiểm tra dữ liệu nhập

SPSS

STATA

Phát hiện điểm dị biệt

SPSS

STATA

Thay thế giá trị rỗng

SPSS

STATA

Nối dữ liệu

SPSS

STATA

Lọc quan sát

SPSS

STATA