Phạm Thuỷ Tú
Trường Đại học Ngân hàng, TP. Hồ Chí Minh, Việt Nam
Phạm Anh Thuỷ
Trường Đại học Ngân hàng, TP. Hồ Chí Minh, Việt Nam
Ngày nhận: 19/09/2024; Ngày hoàn thành biên tập: 20/03/2025; Ngày duyệt đăng: 27/03/2025
DOI: https://doi.org/10.38203/jiem.vi.092024.1186
Tóm tắt: Nghiên cứu này đánh giá hiệu quả của hồi quy Lasso, Ridge và phân tích thành phần chính (PCA) khi kết hợp với các mô hình học máy trong dự báo chỉ số Z-score - thước đo mức độ ổn định tài chính ngân hàng. Dữ liệu nghiên cứu gồm 30 ngân hàng thương mại Việt Nam giai đoạn 2010-2023. Các mô hình học máyđược sử dụng bao gồm Linear Regression, Gradient Boost, Decision Tree, Random Forest, KNN, SVR, AdaBoostRegressor và XGBRegressor. Hồi quy Lasso và Ridge hỗ trợ chọn lọc biến và giảm thiểu nhiễu trong ước lượng, trong khi PCA giúp giảm chiều dữ liệu. Kết quả cho thấy mô hình Gradient Boost kết hợp Lasso đạt hiệu suất dự báo cao nhất, trên 95%. Hơn nữa, sự kết hợp giữa Lasso, Ridge và học máy mang lại kết quả tốt hơn so với PCA. Các kỹ thuật tiền xử lý dữ liệu cũng đóng vai trò quan trọng trong việc nâng cao độ chính xác của mô hình. Nghiên cứu cung cấp bằng chứng thực nghiệm vững chắc về hiệu quả của việc tích hợp các phương pháp hồi quy và học máy trong đánh giá ổn định tài chính ngân hàng. Kết quả này không chỉ góp phần vào nền tảng học thuật về ứng dụng học máy trong tài chính mà còn hỗ trợ nhà quản lý trong việc ra quyết định chiến lược nhằm giảm thiểu rủi ro và tăng cường ổn định hệ thống ngân hàng.
Từ khoá: Lasso, học máy , Ngân hàng, phân tích thành phần chính (PCA), Ridge, Z-score
COMBINING LASSO, RIDGE, PRINCIPAL COMPONENT ANALYSIS, AND MACHINE LEARNING MODELS IN FORECASTING THE BANKING FINANCIAL STABILITY INDEX: A CASE STUDY OF VIETNAMESE
Abstract
This study evaluates the effectiveness of Lasso and Ridge regression, along with Principal Component Analysis (PCA), when integrated with Machine Learning models in forecasting the Z-score—a key indicator of banking financial stability. The research utilizes secondary data from 30 Vietnamese commercial banks during the 2010-2023 period. The Machine Learning models employed include Linear Regression, Gradient Boost, Decision Tree, Random Forest, KNN, SVR, AdaBoostRegressor, and XGBRegressor. Lasso and Ridge regression aid in feature selection and noise reduction in estimation, while PCA assists in dimensionality reduction. The results indicate that the Gradient Boost model combined with Lasso achieves the highest forecasting performance, exceeding 95%. Furthermore, the integration of Lasso, Ridge, and Machine Learning models outperforms PCA. Data preprocessing techniques also play a crucial role in enhancing model accuracy. This study provides robust empirical evidence on the effectiveness of combining regression techniques with Machine Learning for assessing banking financial stability. The findings contribute not only to the academic understanding of Machine Learning applications in finance but also offer practical implications, assisting policymakers in making strategic decisions to mitigate risks and strengthen banking system stability.
Keywords: Lasso, Machine Learning, Banking, Principal Component Analysis, Ridge, Z-score