属于超级学习者的时代！中国学者用三种策略找到放射组学预测模型的最佳算法

news2026/4/2 9:43:19

源自风暴统计网一键统计分析与绘图的网站由于可以使用大量数据进行训练还能整合基因图谱、影像、脑电图、生理数据等多种数据源因此机器学习ML算法特别适合个体化医疗。今天分享一篇基于集成机器学习结合从医疗记录中提取的多模态临床和放射学特征开发和验证一种非侵入性、临床适用的预测模型的研究论文。研究团队旨在用该预测模型精准识别多发性硬化症TSC患者的多皮质皮质的致痫epi灶和评估手术结果。在这项多中心研究中研究团队利用 2013年6月至2024年10月的三个回顾性队列和一个前瞻性队列的多模态临床放射学特征开发并验证了用于定位TSC感染中心和手术结果的非侵入性预测模型。从统计学与机器学习方法学的角度切入本文的研究重点在于模型的选择策略、集成学习的构建方式、性能评估的严谨性以及模型的可解释性与临床转化路径。模型构建在特征工程阶段研究从每个病灶的影像中提取了1316个放射组学特征。这些特征涵盖了一阶统计、形态学、灰度共生矩阵、灰度游程矩阵、灰度大小区域矩阵以及邻域灰度差分矩阵等多个维度。为了确保所选特征的稳健性研究者首先通过组内相关系数对特征的重复性进行了评估随后采用LASSO回归结合10折交叉验证的方法进行特征选择最终从多模态影像中筛选出19个最具预测能力的放射组学特征。这一过程不仅有效降低了特征维度避免了模型的过拟合也为后续的建模工作提供了高质量的输入变量。在模型构建层面研究首先构建了19种个体机器学习模型涵盖了逻辑回归、线性判别分析、决策树、高斯朴素贝叶斯、随机森林等主流算法。这些模型在训练集上进行训练并在验证集上通过AUC值进行初步的性能评估。为了克服单一模型可能存在的偏差和局限性研究进一步构建了三种集成学习模型第一种是投票法基于多个模型的预测结果进行多数表决第二种是平均法对多个模型的预测概率进行加权平均第三种是超学习器采用堆叠策略将多个基学习器的输出作为输入训练一个元学习器进行最终预测。其中超学习器作为一种最优加权组合算法其设计理念是通过交叉验证动态评估各基学习器的表现并分配权重从而在理论上达到最佳的预测性能并在不同数据分布下保持稳健性。模型的性能评估采用了多维度的指标包括AUC、准确率、精确度、特异性、灵敏度与F1分数。主要研究结果研究结果显示基于多模态影像构建的模型普遍优于单模态模型而集成模型在各项指标上又均优于个体模型。其中超学习器在所有队列中表现最为突出其AUC值分别达到0.92、0.92、0.91和0.87且通过DeLong检验证实其性能显著优于其他模型。此外研究还引入了决策曲线分析与校准曲线分别用于评估模型在临床决策中的净收益以及预测概率与实际观测结果之间的一致性。研究结果进一步验证了超学习器的临床实用性与预测稳健性。为了提升模型的可解释性研究采用SHAP值对超学习器的预测结果进行归因分析。识别出对癫痫灶预测贡献最大的放射组学特征主要来源于PET与T2 FLAIR影像。这一步骤不仅揭示了模型的内部决策机制也为临床医生提供了可理解的预测依据。最终研究开发了一个基于Flask框架的网页工具集成了所有个体与集成模型允许临床医生输入病灶的临床与放射组学特征实时获取癫痫灶的预测结果。实验表明该工具显著提升了初级医生的诊断准确率使其接近高级医生的水平充分体现了其在辅助临床决策方面的实际应用潜力。说到超级学习者就不得不说郑老师团队的研究了不过我们做的是因果推断郑老师统计团队及公众号全国较大的线上医学统计服务平台专注于医学生、医护工作者学术研究统计支持我们是你们统计助理我们提供各式医护科研设计与统计服务1️⃣研究者发起的临床试验项目2️⃣临床预测模型与机器学习方法3️⃣医学数据库NHANES、GBD、孟德尔随机化等挖掘发表级数据4️⃣NHANES、CHARLS医学数据库保发表训练营联系助教陈老师咨询微信号sas555777

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2474964.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！