您所在的位置:
基于外周血淋巴细胞亚群谱的机器学习辅助诊断模型在系统性自身免疫病中的应用
作者: 牟方祥
单位: 重庆大学附属人民医院

摘要

探讨系统性红斑狼疮(SLE)、类风湿关节炎(RA)与干燥综合征(SS)在外周血常规淋巴细胞亚群特征上的特异性分布,并评估无监督聚类与可解释性机器学习模型在三大系统性自身免疫病(SARDs)鉴别诊断中的应用价值。

回顾性收集本中心具有完整外周血淋巴细胞流式细胞学(CD4+T、CD8+T、NK、B淋巴细胞比例及绝对计数)检测记录的207例SARDs患者数据(SLE 50例,RA 128例,SS 29例)。首先运用Kruskal-Wallis检验与Bonferroni法对各亚群指标进行多组事后比较,进而采用t-SNE算法进行非监督降维与核密度边界可视化聚类,最后将数据按7:3划分为训练集与测试集,构建随机森林多分类辅助诊断模型,并提取模型特征的方向性归因以解释预测结果。

Kruskal-Wallis检验显示,三大SARDs的淋巴细胞亚群存在显著的异质性(整体P均<0.01)。经事后校正,SLE组具有显著偏高的CD8+抑制性T细胞比率(Adj P<0.001)及显著降低的NK细胞绝对数(Adj P<0.001);而SS组的总B淋巴细胞比率显著高于SLE与RA(Adj P<0.05)。t-SNE非监督降维结果揭示,三大疾病的细胞免疫图谱存在天然的分类分割面。基于常规淋巴细胞亚群构建的随机森林诊断模型在测试集中取得71%的整体准确率(Accuracy),对RA的鉴别敏感度高达95%。特征可解释性分析表明,总B细胞比率、NK细胞比率、CD8+T细胞比率及CD4+/CD8+比值是驱动模型分类的核心参数。模型清晰揭示出高B细胞比率是驱动SS分类的绝对强正向因子,而高CD8+比率叠加低NK细胞及倒置的CD4+/CD8+比值则是驱动模型判定SLE的最强证据链。


常规外周血淋巴细胞亚群在三大SARDs间呈现出清晰聚类边界。结合机器学习模型与可解释性分析,不仅能有效辅助难治性及重叠SARDs的鉴别诊断,而且通过算法客观确认了各亚群(如CD8、B、NK)在不同疾病预测上的方向性权重,为临床免疫微环境的精准评估提供了一种基于算法驱动的新型工具。

关键词: 淋巴细胞,自身免疫性疾病,机器学习
来源:中华医学会第二十八次风湿病学学术会议