摘要
研究住院患儿高尿酸血症的检出情况及分布特征,比较统一阈值方案(血尿酸≥420μmol/L)和性别特异阈值方案(男≥420μmol/L、女≥360μmol/L)下检出率的差异;探究主要相关因素,构建并内部验证多种机器学习预测模型,据此开发无创初筛工具。
纳入住院患儿98539例,比较两种阈值方案下高尿酸血症总体及不同年龄、性别、主诊断系统间的检出率差异。进一步选取符合建模条件的患儿53625例,以高尿酸血症为结局,采用LASSO回归筛选变量,分别构建Logistic回归、决策树、随机森林、XGBoost、LightGBM及人工神经网络共6种模型。基于简化特征集构建无创初筛模型,并采用Shapley加性解释方法进行模型解释,最后开发在线风险评估工具。
统一阈值下,高尿酸血症总体检出率为6.65%,男童高于女童,且随年龄增长而升高,且以青春期后增幅更明显;性别特异阈值下,总体检出率升至9.43%,增幅主要来自女童,约12岁时两性血尿酸水平曲线出现交叉。不同主诊断系统间检出率存在差异,以消化系统和内分泌/代谢系统最高。多因素Logistic回归显示,男性、体质指数升高、血肌酐升高、甘油三酯升高及凝血酶原时间延长与高尿酸血症独立相关。多模型比较显示,XGBoost模型表现最佳,验证集中AUC为0.87;基于性别、年龄、体质指数和收缩压构建的简化XGBoost模型AUC约为0.80。Shapley加性解释分析提示,血肌酐、体质指数、凝血酶原时间、直接胆红素、前白蛋白及年龄对模型预测贡献较大。
单中心住院儿童高尿酸血症检出率较高,存在显著年龄和性别差异。血肌酐、体质指数等因素与儿童高尿酸血症密切相关。XGBoost模型具有较好的识别能力,基于性别、年龄、体质指数和收缩压构建的简化模型可用于儿童高尿酸血症风险的无创初筛。
