Practical guide to building machine learning-based clinical prediction models using imbalanced datasets

Joseph D Forrester; Jeff Choi; Advait Patil; Jacklyn Luu; Evgenia Borisenko; Valerie Przekop

doi:10.1136/tsaco-2023-001222

Trauma Surgery & Acute Care Open (Apr 2024)

Practical guide to building machine learning-based clinical prediction models using imbalanced datasets

Joseph D Forrester,
Jeff Choi,
Advait Patil,
Jacklyn Luu,
Evgenia Borisenko,
Valerie Przekop

Affiliations

Joseph D Forrester: Department of Surgery, Stanford University Department of Medicine, Stanford, California, USA
Jeff Choi: Department of Surgery, Stanford University, Stanford, California, USA
Advait Patil: Stanford University, Stanford, California, USA
Jacklyn Luu: Stanford University, Stanford, California, USA
Evgenia Borisenko: Stanford University, Stanford, California, USA
Valerie Przekop: Stanford University, Stanford, California, USA

DOI: https://doi.org/10.1136/tsaco-2023-001222
Journal volume & issue: Vol. 9, no. 1

Abstract

Read online

Clinical prediction models often aim to predict rare, high-risk events, but building such models requires robust understanding of imbalance datasets and their unique study design considerations. This practical guide highlights foundational prediction model principles for surgeon-data scientists and readers who encounter clinical prediction models, from feature engineering and algorithm selection strategies to model evaluation and design techniques specific to imbalanced datasets. We walk through a clinical example using readable code to highlight important considerations and common pitfalls in developing machine learning-based prediction models. We hope this practical guide facilitates developing and critically appraising robust clinical prediction models for the surgical community.

Published in Trauma Surgery & Acute Care Open

ISSN: 2397-5776 (Online)
Publisher: BMJ Publishing Group
Country of publisher: United Kingdom
LCC subjects: Medicine: Surgery; Medicine: Internal medicine: Medical emergencies. Critical care. Intensive care. First aid
Website: http://tsaco.bmj.com/

About the journal