KTL nâng cao
Cây hồi quy, phân loại và rừng ngẫu nhiên
Lý thuyết và thực hành trên dữ liệu phụ thuộc lớn

Bài viết này trình bày toàn diện về lý thuyết và thực hành các phương pháp cây hồi quy, cây phân loại (classification and regression trees – CART) và rừng ngẫu nhiên (random forest) trên dữ liệu phụ thuộc lớn. Nội dung bao gồm: nguyên lý xây dựng cây, tiêu chí chia nhánh, cắt tỉa cây, thuật toán rừng ngẫu nhiên, ví dụ minh họa thực tế và hướng dẫn thực hành chi tiết trên Stata, R, Python với bộ dữ liệu mô phỏng ml_bigdepdata.csv.