Please Enable JavaScript in your Browser to visit this site

Lời giới thiệu

Estimated reading: 28 minutes 16 views

Dữ liệu tài chính

Dữ liệu tài chính thường được đặc trưng bởi hai hoặc nhiều chiều. Ví dụ lợi suất hàng tháng trên một nhóm cổ phiếu, dữ liệu báo cáo hàng năm cho một nhóm công ty, hoặc luồng tiền hàng tháng của các quỹ chung khoán. Các chiều bổ sung xuất hiện khi, ví dụ, quy mô ngành nghề hoặc quốc gia được thêm vào, hoặc khi theo dõi các khoản đầu tư cổ phiếu của các quỹ chung khoán qua một số quý. Các mô hình kinh tế lượng có thể giúp hiểu và giải thích sự biến động qua nhiều chiều.

Mô hình hóa dữ liệu bảng trong tài chính giới thiệu một số vấn đề liên quan đến sự không đồng nhất (heterogeneity), tương quan chéo (cross-correlations) và đặc tả của các biến kiểm soát (specification of control variables). Ví dụ, các thành phần hệ số chặn hoặc hệ số góc trong một mô hình có thể thay đổi theo thời gian hoặc giữa các đơn vị chéo, và các yếu tố không quan sát được trong một phương trình có thể tương quan theo thời gian hoặc giữa các công ty.

Trong nhiều trường hợp, điều này liên quan đến các thách thức cụ thể trong các mô hình có biến giải thích không phải ngoại sinh ngặt (strictly exogenous), các mô hình bảng động và mô hình phi tuyến.

Minh họa sử dụng dữ liệu bảng

Trong lĩnh vực tài chính, chúng ta gặp phải nhiều mô hình kinh tế lượng khác nhau khai thác cả các chiều thời gian và không gian của dữ liệu.

Dự đoán lợi suất cổ phiếu

Các mô hình định giá tài sản, như mô hình định giá tài sản vốn, CAPM (Capital Asset Pricing Model), áp đặt các ràng buộc lên phân phối chung của chuỗi lợi suất. Brennan et al. (1998) và Lewellen (2015) xây dựng một mô hình lợi suất ở thời điểm $t$ theo các điểm liên quan đến cổ phiếu ở thời điểm trước đó, $t-1$. Dạng đơn giản của mô hình (1.1):

$$R_{it} = \mu_t + \beta_1 \text{logsize}_{i,t-1} + \beta_2 \text{logB/M}_{i,t-1} + \beta_3 \text{return}_{i,t-2,-12} + \varepsilon_{it} \tag{1.1} $$

trong đó:

– $R_{it}$ biểu thị lợi suất của cổ phiếu $i$ trong tháng $t$,
– ${logsize}_{i,t-1}$ biểu thị logarit của giá trị vốn hóa tại cuối tháng $t − 1$,
– ${logB/M}_{i,t-1}$ biểu thị logarit của giá trị sổ sách trừ logarit của giá trị vốn hóa,
– ${return}_{i,t-2,-12}$ là lợi suất cổ phiếu từ tháng t − 12 đến t − 2, để ghi nhận hiệu ứng tăng trưởng theo đà (momentum effect).
– Các thành phần $\mu_t$ biểu thị các giá trị chặn cụ thể theo thời gian.
– $\varepsilon_{it}$ là sai số ngẫu nhiên.

Trong nhiều trường hợp, một mô hình như (1.1) được ước tính bằng cách sử dụng các phương trình hồi quy Fama và MacBeth (1973), với các hệ số mô hình được ước tính trước tiên cho mỗi $t$, sử dụng các bộ dữ liệu chéo tương ứng của các cổ phiếu. Sau đó việc suy diễn dựa kết quả của $T$ mẫu được ước tính khác nhau. Hoặc, mô hình có thể được ước tính dưới dạng một phương trình hồi quy tổng hợp sử dụng phương pháp OLS trên tất cả các quan sát.

Ngoài việc thảo luận về việc nên đưa các biến giải thích nào, dạng hàm phù hợp của các biến thì sự quan tâm chính đối với các phương trình hồi quy như trên liên quan đến vấn đề tương quan chéo (cross-correlations) giữa các thành phần sai số khác nhau $\varepsilon_{it}$. Quan trọng nhất, có thể mong đợi rằng các thành phần sai số cho các cổ phiếu khác nhau trong cùng một tháng có tương quan do các ảnh hưởng chung của thị trường đến tất cả các cổ phiếu, mặc dù không nhất thiết ở cùng mức độ. Do đó, các hiệu ứng như vậy không được ghi nhận đầy đủ bởi các hiệu ứng thời gian chung trong $\mu_t$.

Ngoài ra, có thể có một mức độ tự tương quan nhất định trong mỗi cổ phiếu, mặc dù có thể mong đợi rằng sự tự tương quan này là nhỏ. Điều này có nghĩa là bất kỳ suy diễn thống kê nào nên cẩn thận xem xét các sự tự tương quan như vậy. Bởi vì các biến dự đoán trên phía bên phải tại kỳ $t − 1$ hoặc trước đó, có thể đáng tin cậy cho rằng chúng không tương quan với thành phần sai số ở kỳ $t$. Nghĩa là, các biến hồi quy trong phương trình có thể ngầm giả định rằng ngoại sinh.

Khi áp dụng các mô hình định giá tài sản dựa trên yếu tố, các phương trình hồi quy như (1.1) sẽ bao gồm các biến giải thích là yếu tố tác động. Yếu tố tác động đo lường độ nhạy cảm của một cổ phiếu đối với một yếu tố rủi ro tổng quát. Ví dụ, theo mô hình định giá tài sản vốn (CAPM), lợi suất thị trường là yếu tố rủi ro liên quan duy nhất, và sự tác động đến yếu tố này, thường được gọi là beta thị trường, sẽ là chỉ dự đoán trong một phương trình hồi quy chéo. Fama và French (1992) và nhiều người khác sử dụng điều này để kiểm tra tính hợp lệ của CAPM bằng cách mở rộng tập các biến hồi quy bao gồm các biến bổ sung, tương tự như các biến được liệt kê ở trên.

Một vấn đề bổ sung khác là các yếu tố tác động không được quan sát và cần được ước tính trước. Điều này dẫn đến một vấn đề khác là sai số trong biến (errors-in-variables problem). Có các phương pháp khác nhau để giải quyết vấn đề sai số trong biến. Fama và MacBeth (1973) và Fama và French (1992) sử dụng các ước tính dựa trên danh mục cổ phiếu để giảm thiểu vấn đề sai số trong biến. Shanken (1992) đề xuất điều chỉnh sai số chuẩn để điều chỉnh các sai lệch tương ứng.

Giải thích luồng tiền đến các quỹ tương hỗ

Một tài liệu có tính chất thực tiễn nghiên cứu các luồng tiền vào và ra khỏi các quỹ đầu tư, ví dụ như để các nhà đầu tư hiểu thông tin về hiệu suất quỹ. Điều này cũng liên quan đến động cơ của các nhà quản lý quỹ vì phần thưởng của họ thường liên quan mật thiết đến tài sản được quản lý. Sirri và Tufano (1998) ước tính một mô hình luồng tiền liên quan đến hiệu suất quỹ, chi phí, quy mô quỹ và các đặc điểm khác. Một dạng đặc tả đơn giản của mô hình được cho bởi (1.2)

$$\text{flow}_{it} = \mu_t + \beta_1 \text{rank}_{i,t-1} + \beta_2 \text{logfundsize}_{i,t-1} + \beta_3 \text{fee}_{i,t-2,-12} + \cdots + \varepsilon_{it}$$

trong đó:
– $\text{flow}_{it}$ biểu thị sự tăng trưởng tỷ lệ ròng của quỹ $i$ trong năm $t$,
– $\text{rank}_{i,t-1}$ biểu thị hạng hiệu suất của một quỹ tương hỗ trong năm $t − 1$.

Các mô hình như (1.2) có thể được ước tính bằng phương pháp Fama và MacBeth (1973), như trong Sirri và Tufano (1998) hoặc Spiegel và Zhang (2013), hoặc bằng cách sử dụng POLS như trong Barber et al. (2016). Trong khi phương trình tương tự như (1.1), các vấn đề kinh tế lượng là khác nhau một chút. Quan trọng nhất, các thành phần sai số trong (1.2) có khả năng có sự tương quan trong cùng một quỹ. Điều này bởi vì dòng tiền của quỹ có xu hướng kéo dài (persistent), vì nhà đầu tư tái phân bổ đầu tư của họ.

Có nhiều cách khác nhau để giảm thiểu các vấn đề như vậy. Ví dụ, Spiegel và Zhang (2013) và Barber et al. (2016) bao gồm các độ trễ trong phương trình. Hoặc có thể sử dụng một mô hình tĩnh trong đó các sai số chuẩn được điều chỉnh cho các sự tự tương quan trong quỹ (within-fund) và trong khoảng thời gian (within-period correlations). Phương pháp Fama và MacBeth (1973) tiêu chuẩn không cho phép sự tự tương quan trong các sai số.

Tác động của thù lao CEO hoặc cấu trúc ban quản trị đến giá trị doanh nghiệp

Một câu hỏi thú vị trong tài chính doanh nghiệp là đến mức độ nào giá trị doanh nghiệp bị ảnh hưởng bởi các đặc điểm của quản trị công ty (ví dụ như Gompers et al., 2003), hợp đồng thù lao của Giám đốc điều hành (CEO) (ví dụ như Palia, 2001), hoặc các lựa chọn khác của công ty. Một mô hình điển hình cho việc này sẽ liên quan một đo lường về giá trị doanh nghiệp (thường là Tobin’s Q hoặc tỷ lệ giá trị thị trường so với giá trị sách) đến đặc điểm quan tâm và một tập các biến kiểm soát. Chúng ta có thể viết dạng phương trình (1.3) như sau:

$$\text{firmvalue}_{it} = \beta_1 \text{comp}_{i,t} + \text{controls} + \alpha_i + \varepsilon_{it}$$

trong đó $\alpha_i$ là sự đa dạng không quan sát được không thay đổi theo thời gian giữa các công ty, và $\text{comp}_{i,t}$ mô tả hợp đồng thù lao của CEO, là biến chính quan tâm của chúng ta. Một đặc điểm đặc biệt thú vị là độ nhạy của mức thù lao đến hiệu suất (pay-to performance sensitivity), thường được định nghĩa là sự thay đổi trong giá trị thù lao mà quản lý được sở hữu đối với một sự thay đổi một điểm phần trăm trong giá cổ phiếu (delta, xem Coles et al., 2006).

Delta có thể được hiểu là một đo lường về sự phù hợp của động lực của người quản lý với lợi ích của cổ đông. Delta càng cao thì người quản lý sẽ nỗ lực hơn vì họ chia sẻ lợi nhuận và lỗ rủi ro với cổ đông. Tuy nhiên, hợp đồng thù lao của CEO không phải là biến ngoại sinh. Các đặc điểm không quan sát được của công ty, chẳng hạn như văn hóa công ty, có khả năng tương quan với cả giá trị doanh nghiệp và hệ thống động lực của CEO. Việc bao gồm của $\alpha_i$ như một hiệu ứng cố định của công ty có thể kiểm soát những khác biệt không quan sát được này, miễn là chúng không thay đổi theo thời gian.

Phương trình (1.3) có thể được ước tính dưới giả định hiệu ứng cố định, đó là loại bỏ $\alpha_i$ thông qua một phép biến đổi, ví dụ như trừ đi trung bình trên mỗi công ty qua thời gian (biến đổi trong, within transformation) hoặc thông qua việc tính chênh lệch hay sai phân bậc nhất (first-differencing). Tác động của hợp đồng thù lao đối với giá trị doanh nghiệp sau đó được xác định từ sự biến đổi của nó theo thời gian, chỉ trong mỗi công ty. Điều này làm cho bộ ước lượng hiệu ứng cố định trở thành một lựa chọn phổ biến trong các nghiên cứu thực nghiệm. Khi số lượng giai đoạn thời gian nhỏ, Grieser và Hadlock (2019) đề xuất giả định rằng $\text{comp}_{i,t}$ có tính ngoại sinh ngặt (strict exogeneity), nghĩa là hợp đồng thù lao không phụ thuộc vào giá trị công ty ở thời điểm trước đó.

Giải thích sự lựa chọn cấu trúc vốn

Giải thích cấu trúc vốn của các công ty là một trong những câu hỏi quan trọng trong tài chính doanh nghiệp. Modigliani và Miller (1958) chỉ ra rằng trong một thị trường vốn hiệu quả, cấu trúc vốn của một công ty sẽ không liên quan đến giá trị của nó. Tuy nhiên, trong thực tế, sự tồn tại của các vấn đề không hoàn hảo trên thị trường như thuế và chi phí phá sản, có thể làm cho giá trị công ty phụ thuộc vào cấu trúc vốn. Các công ty lựa chọn tỷ lệ nợ mục tiêu tối ưu dựa trên sự cân đối giữa chi phí và lợi ích của nợ. Ví dụ, các công ty sẽ cân nhắc giữa lợi ích thuế từ việc tài trợ bằng nợ và các chi phí rủi ro tài chính khi họ vay quá nhiều.

Hoặc, lý thuyết trật tự phân hạng (pecking order theory) (Myers, 1984) cho rằng, do sự bất cân xứng thông tin, các công ty ưu tiên lựa chọn tài trợ tài chính theo một trật tự phân cấp theo đó sẽ ưu tiên cho tài trợ nội bộ hơn tài trợ bên ngoài. Nếu cần tài trợ bên ngoài, các công ty đầu tiên tìm kiếm vốn vay. Cổ phiếu chỉ được phát hành khi không còn cách nào khác.

Lemmon et al. (2008) xây dựng các phương trình thay thế để giải thích tỷ lệ đòn bẩy của một công ty, được định nghĩa là số nợ so với giá trị thị trường hoặc giá trị sách của công ty. Một trong các phương trình của họ được cho ở (1.4)

$$\text{leverage}_{it} = x_{i,t-1}^/ \beta + \mu_t + \alpha_i + \varepsilon_{it}$$

trong đó $\text{leverage}_{it}$ biểu thị đòn bẩy của công ty $i$ trong năm $t$, và $x_{i,t-1}^/$ là một véc-tơ các biến giải thích, bao gồm log(doanh số) và các chỉ số về lợi nhuận và tài sản cố đinh, quan sát trong năm trước đó. Hơn nữa, $\mu_t$ là hiệu ứng tổng thể theo thời gian, và $\alpha_i$ là hiệu ứng cố định theo thời gian của công ty.

Vì đòn bẩy có tính liên tục cao, các hiệu ứng cố định của công ty trong $\alpha_i$ được sử dụng để ghi nhận sự đa dạng chưa được quan sát ở các công ty. Lemmon et al. (2008) luận điểm rằng thành phần không được quan sát bất biến theo thời gian (time-invariant unobserved component) của tỷ lệ đòn bẩy của một công ty có khả năng tương quan với các biến giải thích. Do đó, xem $\alpha_i + \varepsilon_{it}$ như một thành phần sai số ngẫu nhiên, không tương quan với các biến giải thích, là không phù hợp và có xu hướng dẫn đến bộ ước lượng sai lệch và không nhất quán (inconsistent estimators).

Thay vào đó, cần sử dụng các phương pháp bộ ước lượng hiệu ứng cố định hoặc phương pháp khác để kiểm soát vấn đề nội sinh này. Ngoài sự hiện diện của $\alpha_i$, còn có một thành phần hệ số cắt cụ thể theo năm để ghi nhận sự tương quan giữa tỷ lệ đòn bẩy của các công ty khác nhau trong cùng một năm. Fama và French (2002) lập luận rằng sự tương quan này quan trọng. Ngoài ra, có thể có sự tương quan chuỗi trong $\varepsilon_{it}$. Tất cả các vấn đề này ảnh hưởng đến việc xác định bộ ước lượng phù hợp cho (1.4) và cách tính toán đúng các sai số chuẩn. Các tác giả khác nhau có các lựa chọn khác nhau trong việc này.

Một cách khá phổ biến để mở rộng mô hình trước đó bằng cách thêm biến trễ của tỷ lệ đòn bẩy trễ như ở (1.5),

$$\text{leverage}_{it} = x_{i,t-1}^/ \beta + \gamma \text{leverage}_{i,t-1} \mu_t + \alpha_i + \varepsilon_{it}$$

như đã được thực hiện trong Flannery và Rangan (2006). Điều này tạo ra một vấn đề bổ sung trong việc biến số phụ thuộc trễ có mối tương quan với $\alpha_i$ và $\varepsilon_{i,t-1}$. Điều này làm cho các phương pháp bộ ước lượng hiệu quả cố định tiêu chuẩn không còn nhất quán. Khi đó, cần sử dụng các bộ ước lượng biến công cụ hoặc bộ ước lượng phương pháp mô-men tổng quát (GMM) tổng quát để giải quyết vấn đề biến nội sinh ở biến phụ thuộc trễ này.

Quản trị và giá trị công ty

Một câu hỏi thường được đặt ra là liệu quản trị công ty có tác động đến giá trị công ty (hoặc một đo lường khác về hiệu suất) và đến mức độ nào. Một mô hình tuyến tính dựa trên dữ liệu bảng có thể được viết như sau:

$$\text{firmvalue}_{it} = \beta_1 + \beta_2 \text{gov}_{i,t} + \text{controls} + \varepsilon_{it}$$

trong đó $\text{gov}_{i,t}$ là một đo lường về quản trị công ty, ví dụ như các đặc điểm của hội đồng quản trị (Fich và Shivdasani, 2006). Vấn đề là biến quản trị không không hẳn là biến ngoại sinh. Ví dụ, có thể có một biến bị bỏ sót (hoặc sự đa dạng không quan sát được, unobserved heterogeneity) ảnh hưởng đến cả giá trị công ty và quản trị. Và việc không kiểm soát vấn đề này sẽ dẫn đến bộ ước lượng sai lệch cho $\beta_2$. Nếu biến bị bỏ sót là không đổi theo thời gian thì phương pháp hiệu quả cố định sẽ giúp giảm thiểu mối lo ngại này, với điều kiện $\text{gov}_{i,t}$ là biến ngoại sinh ngặt.

Một vấn đề có thể xảy ra là năng lực giải thích hay hiệu năng của bộ ước lượng (power) sẽ thấp nếu $\text{gov}_{i,t}$ ít biến thiên trong thời gian xem xét. Ngoài vấn đề thiên chệch do bỏ sót biến, các vấn đề khác cũng có thể cản trở mô hình này. Ví dụ, quản trị và giá trị công ty có thể được xác định đồng thời, hoặc tác động của quản trị đối với giá trị công ty có thể không đồng nhất và thay đổi giữa các nhóm công ty, phụ thuộc vào các đặc điểm quan sát và không quan sát được.

Chính sách cổ tức

Trong một thế giới không có thuế và chi phí giao dịch, Miller và Modigliani (1961) đã chỉ ra rằng chính sách cổ tức của một công ty không liên quan đến giá trị của nó. Câu hỏi vì sao một số công ty trả cổ tức và một số công ty không trả cổ tức đã làm đau đầu các nhà nghiên cứu tài chính. Thực nghiệm cho thấy, có vẻ như các công ty lớn hơn, công ty có lợi nhuận cao hơn và công ty có ít cơ hội tăng trưởng hơn có khả năng trả cổ tức cao hơn (Fama và French, 2001). Khi mô hình hóa chính sách cổ tức, biến phụ thuộc là một biến dạng nhị phân: $\text{div}_{it} = 1$ nếu công ty $i$ trả cổ tức trong năm $t$ và $\text{div}_{it} = 0$ nếu không chi trả.

Do đó, các mô hình kinh tế về giải thích việc trả cổ tức là các mô hình lựa chọn nhị phân. Nó giải thích xác suất một công ty chi trả cổ tức dựa trên các đặc điểm của công ty, như quy mô, lợi nhuận, tăng trưởng tài sản hoặc tỷ lệ giá trị sổ sách trên giá trị thị trường. Một hồi quy logit dạng (1.7) mô tả mối quan hệ này.

$$ Pr\left(\text{div}_{it} = 1\right) = \frac{\text{exp}\left(x_{it}^/ \beta \right)} {1 + \text{exp}\left(x_{it}^/ \beta \right)} $$

trong đó $x_{it}$ là một vector các đặc điểm của công ty. Để thu thập xu hướng giảm của xác suất các công ty trả cổ tức, việc bao gồm yếu tố thời gian cố định trong quy định có vẻ là phù hợp (thay thế $x_{it}^/ \beta$ trong (1.7) bằng $\mu_t + x_{it}^/ \beta$). Điều này ngụ ý rằng phương trình logit có một thành phần hệ số cắt cụ thể cho từng năm.

Với thiết lập như trong (1.7) thì xác suất của một công ty trả cổ tức là độc lập với lịch sử chi trả cổ tức của công ty. Thực nghiệm, điều này có thể không phù hợp vì hầu hết các công ty hoặc không bao giờ trả cổ tức hoặc trả cổ tức hàng năm (Fama và French, 2001). Do đó, có thể mong đợi rằng có sự phụ thuộc đáng kể giữa quyết định chi trả cổ tức của một công ty cụ thể nào đó ở hai thời điểm $t$ và $t – 1$.

Vấn đề này có thể được giải quyết bằng cách bổ sung các ảnh hưởng cố định đặc trưng của mỗi công ty ($\alpha_i$) hoặc một biến biến phụ thuộc trễ vào (1.7). Nhiều bài báo (ví dụ như Fama và French, 2001; DeAngelo et al., 2006; Denis và Osobov, 2008) thực hiện bộ ước lượng hồi quy logit cho từng năm, sau đó trình bày các hệ số trung bình theo tinh thần của Fama và MacBeth (1973). Mặc dù cách này có vẻ hấp dẫn, nhưng việc tính toán các sai số chuẩn hợp lệ là một thách thức, đặc biệt là khi tồn tại mối quan hệ động và cả các hiệu ứng cố định (Petersen, 2009).

Hoặc, một cách khác, ta có thể mô hình hóa số tiền cổ tức được trả bởi một công ty. Điều này dẫn đến một biến phụ thuộc chỉ quan sát được trong một giới hạn nhất định, với nhiều giá trị bằng 0. Mô hình Tobit đã được phát triển để giải quyết vấn đề này (xem, ví dụ, Brockman và Unlu, 2009). Tuy nhiên cũng cần quan tâm đến tính chất động của mức cổ tức chi trả.

Các ví dụ từ các phần trước đây minh họa một loạt các vấn đề có vai trò trong việc bộ ước lượng mô hình kinh tế lượng sử dụng dữ liệu bảng trong lĩnh vực tài chính. Trong phần trình bày này, chúng tôi sẽ xem xét một cách có hệ thống các vấn đề này, bao gồm các giả định về tính nhất quán, xử lý vấn đề không đồng nhất và tương quan chéo, sự thiên chệch mẫu nhỏ (small sample biases), tính toán các sai số chuẩn phù hợp và xác định các ảnh hưởng nhân quả.

Chương tiếp theo bắt đầu bằng việc trình bày về mô hình hồi quy tuyến tính trong trường hợp dữ liệu bảng để trình bày và thảo luận về một loạt các bộ ước lượng cơ bản như bộ ước lượng OLS gộp (POLS), bộ ước lượng hiệu ứng cố định (FE), hiệu ứng ngẫu nhiên (RE), và phương pháp của Fama và MacBeth (1973). Đồng thời cũng thảo luận về một loạt các vấn đề liên quan đến việc bao gồm hiệu ứng cố định trong mô hình, sử dụng các bộ ước lượng biến công cụ, và phương pháp GMM.

Back to top button