摘要
探索原发性干燥综合征(pSS)合并间质性肺病(ILD)的危险因素,构建并验证pSS-ILD疾病风险预测模型,并进一步构建pSS-ILD疾病严重程度风险
研究对象为2016年6月至2024年9月于深圳市人民医院住院pSS患者,2022年1月至2025年8月于其他深圳市三甲医院住院pSS患者为外部验证集。根据胸部高分辨率CT(HRCT)诊断ILD,分为未合并ILD组(pSS-nILD)与合并ILD组(pSS-ILD),收集患者数据。采用logistic回归分析pSS合并ILD的危险因素,并采用限制性立方样图(RCS)及分段logistic回归方法分析全身免疫炎症指数(SII,血小板计数×中性粒细胞计数与淋巴细胞计数比值)的阈值效应。按7:3随机划分训练集和内部验证集,采用LASSO筛选变量,建立逻辑回归(LR)、随机森林(RF)、极端梯度提升(XGBoost)、决策树(DT)、朴素贝叶斯(NB)、多层感知机(MLP)、轻量级梯度提升(Lightgbm)7种机器学习预测模型。通过ROC曲线、校准曲线、决策曲线等评估模型,确定最优预测模型,并建立网页计算器。进一步,将多中心pSS-ILD患者的HRCT,根据Warrick评分分为轻度组和中重度组,采用多因素logistic回归分析ILD疾病严重程度的危险因素,并构建预测ILD疾病严重程度风险Nomogram列线图模型。
本院共收集439例患者,排除21例患者,最终纳入研究为418例患者,85例患者合并ILD。外部验证集中pSS患者共91例,其中合并ILD患者20例。多因素logistic回归分析年龄、血清白蛋白降低、SII、抗CenpB抗体阳性、关节受累是pSS合并ILD的独立危险因素。当SII >509.26时,pSS合并ILD风险增加。将418例患者随机分为训练集(292例)和内部验证集(162例)。纳入预测模型中的9个变量包括病程、关节累及、白细胞计数、乳酸脱氢酶、血清白蛋白、抗CenpB抗体、全身炎症反应指数(SIRI,中性粒细胞计数×单核细胞计数与淋巴细胞计数比值)、衍生中性粒细胞与淋巴细胞比值(dNLR,中性粒细胞计数与(白细胞计数-淋巴细胞计数)比值)。最优模型Lightgbm模型在训练集中AUC值为0.868,内部验证集中AUC值为0.842,外部验证集中AUC值为0.810。使用SHAP方法解释最优模型,并构建网页计算器(https://ml-model-1.shinyapps.io/online_model_66/)预测pSS-ILD疾病风险概率。多中心pSS-ILD患者总共105例,排除无法进行Warrick评分患者后,轻度组有53例,中重度组有45例。多因素logistic回归结果示年龄、ILD病程、以呼吸道症状起病、血清白蛋白降低是pSS-ILD病情进展为中重度的独立危险因素,基于此构建的Nomogram模型AUC为0.846。
年龄、血清白蛋白降低、SII、抗CenpB抗体阳性、关节受累是pSS合并ILD的独立危险因素。基于Lightgbm模型建立的网页计算器能较准确地计算pSS合并ILD的风险概率。年龄、ILD病程、以呼吸道症状起病、血清白蛋白降低是pSS-ILD病情进展为中重度的独立危险因素,Nomogram模型能初步预测pSS-ILD患者疾病严重程度。
