大数据 (Jan 2024)
小样本数据下特种材料基因工程的数据扩充方法
Abstract
随着地下水利、水务管网对材料需求的多样性和复杂性日益加剧,通过机器学习高效便捷地设计满足个性化需求的特种材料成为人们关注的热点。传统监督学习方法均以大量数据训练建模为基础,但从深埋地下水务管网、高端军工设备等领域所需的特种材料,如稀贵高熵合金等获取大数据集,需要的成本极高且周期较长。为了解决该问题,提出了一种小样本扩充模型——RX-SMOGN,使用极致梯度提升模型和使用交叉验证的递归特征消除算法进行特征筛选,使用SMOGN算法扩充数据集。提出以高熵合金相结构为研究对象,训练传统机器学习模型对其进行预测以验证RX-SMOGN模型的有效性。由五折交叉验证及4个评价指标结果可知,RX-SMOGN模型充分提高了机器学习模型的性能,为合金材料设计提供了一种更便捷的方法,充分提高了合金材料设计的效率。
Keywords