Enhancing financial risk prediction with symbolic classifiers: addressing class imbalance and the accuracy–interpretability trade–off

Luis J. Mena; Vicente García; Vanessa G. Félix; Rodolfo Ostos; Rafael Martínez-Peláez; Alberto Ochoa-Brust; Pablo Velarde-Alvarado

doi:10.1057/s41599-024-04047-5

Humanities & Social Sciences Communications (Nov 2024)

Enhancing financial risk prediction with symbolic classifiers: addressing class imbalance and the accuracy–interpretability trade–off

Luis J. Mena,
Vicente García,
Vanessa G. Félix,
Rodolfo Ostos,
Rafael Martínez-Peláez,
Alberto Ochoa-Brust,
Pablo Velarde-Alvarado

Affiliations

Luis J. Mena: Academic Unit of Information Technology Engineering, Universidad Politecnica de Sinaloa
Vicente García: Department of Electrical and Computer Engineering, Universidad Autonoma de Ciudad Juarez
Vanessa G. Félix: Academic Unit of Information Technology Engineering, Universidad Politecnica de Sinaloa
Rodolfo Ostos: Academic Unit of Information Technology Engineering, Universidad Politecnica de Sinaloa
Rafael Martínez-Peláez: Academic Unit of Information Technology Engineering, Universidad Politecnica de Sinaloa
Alberto Ochoa-Brust: Faculty of Mechanical and Electrical Engineering, Universidad de Colima
Pablo Velarde-Alvarado: Academic Unit of Basic Sciences and Engineering, Universidad Autonoma de Nayarit

DOI: https://doi.org/10.1057/s41599-024-04047-5
Journal volume & issue: Vol. 11, no. 1
pp. 1 – 11

Abstract

Read online

Abstract Machine learning for financial risk prediction has garnered substantial interest in recent decades. However, the class imbalance problem and the dilemma of accuracy gain by loss interpretability have yet to be widely studied. Symbolic classifiers have emerged as a promising solution for forecasting banking failures and estimating creditworthiness as it addresses class imbalance while maintaining both accuracy and interpretability. This paper aims to evaluate the effectiveness of REMED, a symbolic classifier, in the context of financial risk management, and focuses on its ability to handle class imbalance and provide interpretable decision rules. Through empirical analysis of a real-world imbalanced financial dataset from the Federal Deposit Insurance Corporation, we demonstrate that REMED effectively handles class imbalance, improving performance accuracy metrics while ensuring interpretability through a concise and easily understandable rule system. A comparative analysis is conducted against two well-known rule-generating approaches, J48 and JRip. The findings suggest that, with further development and validation, REMED can be implemented as a competitive approach to improve predictive accuracy on imbalanced financial datasets without compromising model interpretability.

Published in Humanities & Social Sciences Communications

ISSN: 2662-9992 (Online)
Publisher: Springer Nature
Country of publisher: United Kingdom
LCC subjects: General Works: History of scholarship and learning. The humanities; Social Sciences
Website: https://www.nature.com/palcomms/

About the journal