NPJ Precis Oncol 加拿大蒙特利尔大学医院研究中心:多组学融合网络预测结直肠癌肝转移术后早期复发

news2026/5/1 19:05:34
01文献学习今天分享的文献是由加拿大蒙特利尔大学医院研究中心等团队于2026年1月10日在肿瘤学领域顶刊《npj Precision Oncology》中科院1区IF8上发表的研究“Multi-omics fusion network for prediction of early recurrence in colorectal liver metastases”即基于多组学融合网络的结直肠肝转移早期复发预测该研究提出一种整合CT影像、转录组RNA测序与临床数据包括Fong临床风险评分的多组学融合网络用于预测结直肠肝转移CRLM患者术后2年内早期复发的风险。该模型在129例前瞻性数据集中表现出优于单模态或双模态方法的预测性能AUC 0.75具有临床风险分层和个体化治疗指导的潜力。创新点①首次提出整合CT影像、RNA测序与临床数据的多组学融合网络全面捕捉表型与分子特征。②采用生成对抗插补与合成数据增强技术有效处理RNA测序中的缺失值和高维度问题。③结合传统影像组学与预训练基础模型特征通过中间融合策略实现多模态互补优化。临床价值①模型AUC达0.75显著优于传统Fong评分提升早期复发风险预测准确性。②可辅助临床分层指导术后化疗与随访策略避免低危患者过度治疗。③提供基因与通路层面的生物学解释为复发机制研究与靶向治疗提供新线索。图 1多组学模型架构图a整体多模态流程整合CT影像、RNA测序、临床数据三大模态。RNA测序经GAIN插补CTGAN合成扩充后通过FT-transformer生成转录组评分CT影像经放射组学特征提取基础模型特征提取通过级联随机森林生成影像评分两者与临床特征Fong CRS、年龄、性别共同输入最终MLP输出2年复发预测结果。bGAIN插补模块由生成器G和判别器D构成。生成器利用部分观测数据X~、二进制掩码M和随机噪声Z合成缺失基因表达值判别器通过提示矩阵H学习区分真实表达值与合成插补值通过极小极大博弈优化插补精度。cFT-transformer架构先通过特征分词器将基因表达特征转化为嵌入向量Hi拼接分类令牌CLS后输入Transformer编码器含自注意力机制和前馈网络最终通过全连接层输出复发预测结果。02研究背景及目的研究背景结直肠癌CRC是全球范围内致死率排名第二的恶性肿瘤约半数患者会发生肝转移CRLM这是最常见的进展形式。尽管手术切除联合化疗是潜在的根治手段但近70%的患者会在术后两年内复发其中多数复发集中在术后早期凸显了精准预后评估的紧迫性。目前临床广泛采用的预测工具主要是Fong等人提出的临床风险评分CRS该评分基于五项临床参数虽具一定参考价值但因其通用性而无法全面反映个体患者的肿瘤生物学特性限制了其个性化精准医疗中的应用潜力。近年来随着多组学技术的发展影像组学如CT、MRI和分子组学如转录组测序在肿瘤预后评估中展现出巨大潜力。影像组学能够从常规影像中提取定量特征反映肿瘤的异质性而转录组测序则能揭示驱动肿瘤进展的关键基因表达谱。然而现有研究多局限于单一模态或双模态分析尚未有研究系统整合临床、影像与转录组数据来构建CRLM的早期复发预测模型。此外转录组数据分析面临高维度、小样本、基因表达缺失dropout等关键挑战制约了其临床应用。因此开发一种能够融合多源异构数据、克服技术瓶颈、并提供生物学解释的综合预测框架成为提升CRLM患者风险分层和治疗决策精准度的关键研究方向。研究目的本研究旨在开发并验证一个创新的多组学融合网络模型以整合术前诊断性CT影像、肿瘤转录组RNA-seq测序数据和临床信息包括Fong CRS从而精准预测结直肠癌肝转移CRLM患者根治性切除术后两年内的早期复发风险。其核心目的不仅在于构建一个性能优于现有单模态或双模态方法的预测工具更在于提供一个能够全面捕捉肿瘤表型影像与分子基因表达特征、并与临床实践无缝衔接的综合评估框架。在技术层面研究致力于解决多模态数据融合中的关键难题针对转录组数据提出采用生成对抗插补网络GAIN处理缺失表达值并利用条件生成对抗网络CTGAN进行合成数据扩增以应对高维度与小样本问题针对影像数据创新性地结合了可解释的传统影像组学特征与基于预训练基础模型Foundation Model提取的深层特征以更全面地表征肿瘤生物学特性。最终通过中间融合策略将处理后的转录组评分、影像评分及临床特征进行有效整合。临床应用层面该模型旨在超越传统Fong CRS的预测能力为临床医生提供更可靠的个体化复发风险分层从而指导术后辅助化疗决策、优化随访策略、并为高危患者筛选参与新型辅助治疗临床试验提供依据最终改善患者预后并实现医疗资源的合理化配置。03数据和方法研究数据队列来源蒙特利尔大学医院CHUM2010-2022年接受CRLM根治性切除的129例患者前瞻性随访至复发或死亡以先发生者为准。患者特征平均年龄64.1岁38-83岁男性占65.9%65.1%患者术后2年内复发中位随访45.5个月56.6%患者随访期内死亡64.7%患者Fong CRS为0-2分84.5%接受新辅助化疗62.0%接受术后化疗无患者接受靶向或免疫治疗。数据类型影像数据术前增强CT影像512×512像素重采样至1mm各向同性分辨率经MedSAM工具分割病灶。转录组数据CRLM组织RNA测序28578个基因含12806个随机缺失基因经质控、批次效应校正Combat-seq处理。临床数据Fong CRS基于5项临床参数、年龄、性别、治疗史、肿瘤病理特征等。技术方法1数据预处理影像重采样统一分辨率半自动分割病灶MedSAM工具放射组学特征提取PyRadiomics与基础模型特征提取3D ResNet50。转录组筛选表达量≥10的基因Combat-seq校正批次效应GAIN模型插补缺失值CTGAN生成合成样本扩充数据。临床性别独热编码年龄与Fong CRS标准化处理。2多组学模块设计RNA测序模块GAIN插补→CTGAN扩充→FT-transformer影像模块放射组学特征基础模型深度特征→随机森林→MLP融合临床模块FongCRS年龄性别3多模态融合策略采用中间融合方式先分别训练各模态子模型生成评分再将RNA测序评分、影像评分与临床特征联合输入最终MLP模型2层隐藏层ReLU激活输出2年复发概率。对比策略早期融合直接拼接所有特征、晚期融合独立训练各模态模型后投票集成。4模型验证与分析验证方式5折交叉验证避免数据泄露。评估指标AUC、准确率、精确率、召回率、F1分数。辅助分析Kaplan-Meier生存分析、Cox比例风险回归单变量/多变量、SHAP分析特征重要性、决策曲线分析DCA临床效用、差异基因表达分析GSEA生物学可解释性。04实验结果1模型性能多模态模型最优AUC0.75±0.05准确率0.70精确率0.72召回率0.88F1分数0.79。优于其他模型显著高于单模态RNA测序AUC0.68、临床特征AUC0.70、CT影像AUC0.62和双模态模型如RNACTAUC0.71、临床CT AUC0.71与Fong CRS相比AUC提升7.14%p0.002。融合策略优势中间融合AUC0.75显著优于早期融合AUC0.62p0.05和晚期融合AUC0.73。2影像模块性能放射组学基础模型特征融合AUC0.62准确率0.70显著优于单一特征放射组学AUC0.61基础模型AUC0.61且纹理特征是影像预后的核心占前20个重要特征的17个。3预后价值与临床效用生存分层多组学模型可显著区分高/低复发风险患者2年复发率高风险80%vs低风险40%log-rank p0.0008。独立预后价值多组学标志物在多变量Cox回归中仍显著关联复发时间HR3.5695% CI 1.29-9.81p0.01独立于Fong CRSHR1.90p0.01。临床效用DCA显示风险阈值0.45时模型净获益高于“全部高风险”或“全部低风险”策略可减少不必要的辅助治疗和随访负担。4生物学可解释性差异基因识别MAGE家族MAGEA2、MAGEA2B、RPL10假基因RPL10P6、RPL10P9等预后相关基因其中MAGE家族与肿瘤免疫逃逸相关。通路分析高风险患者中KRAS信号通路激活、细胞凋亡负调控通路富集提示肿瘤侵袭性增强。特征重要性SHAP分析显示RNA测序评分贡献最大其次为FongCRS和影像评分不同模态特征相关性低互补性强。图 2不同模态的复发预测性能图图 3影像模块消融实验图图 4不同模态的复发风险分层曲线展示7种模态组合模型的Kaplan-Meier曲线疾病无复发生存曲线以2年为关键时间节点。图 5不同模态的决策曲线分析图图 6多组学模型可解释性分析图包括差异基因火山图、放射组学SHAP分析、特征相关性矩阵、临床特征SHAP分析。图 7基于影像特征的比较模型性能图展示基础模型特征和放射组学特征对应的不同机器学习模型性能。05研究结论该研究构建了一个多组学融合网络模型用于预测结直肠癌肝转移CRLM术后两年内的早期复发风险。通过整合术前CT影像特征、RNA转录组测序数据和临床风险评分Fong CRS模型在129例患者的前瞻性队列中取得了AUC为0.75±0.05的预测性能显著优于单一或双数据源模型且其预测能力在统计学上独立于传统临床风险因素。研究发现RNA数据在模型中贡献最大其通过生成对抗插补GAIN和合成数据增强CTGAN有效处理了基因表达缺失与高维度问题影像模块则结合了传统放射组学与基于基础模型的深度特征提升了表征能力。模型识别出包括MAGEA2、MAGEA2B等高复发风险相关基因并通过富集分析揭示了KRAS信号通路上调、细胞凋亡抑制等生物学机制提供了可解释的分子依据。尽管模型展现出良好的风险分层与临床决策潜力但仍需在更大规模、多中心队列中进一步验证其泛化能力与临床适用性。参考文献Saber R, Carneiro M, Montagnon E, Tang A, Turcotte S, Kadoury S. Multi-omics fusion network for prediction of early recurrence in colorectal liver metastases. NPJ Precis Oncol. 2026 Jan 10. doi: 10.1038/s41698-025-01264-2.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2528627.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…