摘要
既往流行病学研究已表明某些肥胖指标与高尿酸血症之间存在关联,然而,这些发现尚无定论。为了进一步理解和提高肥胖指标在预测高尿酸血症方面的有效性,本研究开发了一种有效且可解释的机器学习模型,该模型整合了多种肥胖指标来预测高尿酸血症,并采用SHapley Additive exPlanation(SHAP)来阐明每个指标对病情的个体影响。为预防高尿酸血症提供科学依据。
本研究纳入了来自国家健康与营养调查(NHANES)2013-2020年这三个周期的6882名参与者,并选择了13项与肥胖相关的指标来预测高尿酸血症。2015-2020年的数据作为训练集,而2013-2014年的数据则作为测试集。本研究采用了七种机器学习模型进行预测,并对表现最佳的模型进行了评估。使用SHAP图来解释模型的预测结果,并说明各种肥胖指标对结果的影响。
CatBoost模型的表现优于其他模型,其受试者工作特征(ROC)曲线下面积(AUC)为0.745(95%置信区间[CI]:0.720–0.771)。基于SHAP的变量重要性分析确定了前五个主要影响因素为METS-IR、METS-VF、种族、TG和TyG,其中METS-IR升高对高尿酸血症患病率的影响最为显著,具有最强的正预测作用。
本研究开发的CatBoost模型在预测与各种肥胖指标相关的高尿酸血症风险方面表现出高准确性和稳健性。值得注意的是,降低METS-IR水平有助于降低高尿酸血症的风险。
