【论文阅读笔记】LeSAM: Adapt Segment Anything Model for medical lesion segmentation

news2025/6/28 10:20:49

1.论文介绍

LeSAM: Adapt Segment Anything Model for medical lesion segmentation
LeSAM:适用于医学病变分割的任意分割模型
2024年发表于 JBHI
Paper 无code

2.摘要

Segment Anything Model,SAM是自然图像分割领域的一个基础性模型,取得了令人印象深刻的成果。然而,对于医学图像分割,它的性能仍然是次优的,特别是在描绘不规则形状和低对比度的病变时。这可以归因于医学图像和自然图像之间的显著域差距,而SAM最初是在自然图像上进行训练的。本文提出了一种专门为病变分割量身定做的SAM算法,称为LeSAM。LeSAM首先通过一个高效的自适应模块学习医学特定领域的知识,并将其与从预先训练的SAM获得的一般知识相结合。随后,我们利用这些合并的知识,使用作为轻量级U型网络设计实现的改进的掩模解码器来生成病变掩模。这种修改可以更好地描绘病变边界,同时便于培训。

Keywords:SAM, U型解码器,自适应编码器模块

3.Introduction

病变分割在医学图像分析中起着至关重要的作用,有助于精确定位和量化病变区域,以便及早发现和治疗疾病。然而,由于医学图像的复杂性和多样性,准确的病变分割仍然具有很大的挑战性。在本文中,通过简单而有效的策略提出了一种通用的病变分割模型–LeSAM。首先,在原始SAM编码器的每个转换模块中使用两个适配器模块来顺序地合并和提炼特定于任务的知识。此外,我们采用渐进式学习方法来促进适配器模块的训练,而不依赖于大规模的注释医疗数据。其次,受U型网络通过渐进上采样和捷径操作集成多分辨率特征的成功启发,我们将原有的掩码解码器修改为U型模块,并从头开始训练。

4.模型结构详解

在这里插入图片描述
如图所示,LeSAM包括三个模块:修改的图像编码器、提示编码器和修改的掩码解码器。为了能够提取潜在的医学特定特征,可调适配器模块被结合到原始图像编码器的每个变换器块中;提示编码器以框模式保持其原始结构,其中提供边界框以指示目标在每个输入图像中的位置;掩模解码器被修改为U形结构,以增强模糊和不规则病变边界的描绘。此外,冻结了原始图像编码器的参数,同时保持提示编码器和掩码解码器都是可调的。

医用专用图像编码器

由于自然图像和医学图像之间存在领域鸿沟,原始图像编码者很难获取潜在的医学特定知识。因此,在原始图像编码器的每个变换器块中都加入了适配器模块,以有效地弥合这一差距。改装的transformer块的具体架构如图所示,每个transformer块中都集成了两个适配器,其中每个适配器依次包括下投影线性层、Gelu激活层和上投影线性层。第一个适配器位于变压器块的开始处,以引入医学特定知识,然后将其与预先训练的SAM学习的一般知识相结合。另一个适配器被放置在块的末尾,以优化集成的跨域知识和提炼图像特征。

在image-encoder的每一个transformer块中有两个adapter,一个在开头,接收传入的特征;一个在块结尾,融合中间特征和最终特征再处理。每个adapter包含一个特征降维的线性层,GeLU激活层和一个特征扩展的线性层。

在这里插入图片描述
特定于任务的掩码解码器

由于病变典型的不规则形状和与周围组织的低对比度,原始的SAM掩模解码器在准确描绘病变边界方面的性能不佳。因此开发了一种特定于任务的掩码解码器来增强边缘描绘能力,以实现精确的病变分割。如模型图所示,将特定任务的掩码解码器设计为U型结构。保留了自注意块双向交叉注意块(提示到图像嵌入,反之亦然)来生成掩码嵌入(带有提示信息的图像嵌入)和IOU分数。随后,没有对掩码嵌入进行上采样来生成输出掩码,而是通过改进的U型解码器来传播它们。

考虑到图像编码器的图像嵌入具有64×64(如果image size是1024×1024则是64)的分辨率,对这三个中间图像嵌入分别使用“卷积”和“上卷积”,以获得不同分辨率和通道的新图像嵌入。具体地说,如下图所示,“卷积”包括卷积和用于重新编码图像嵌入的短连接,“上卷积”通过在两个“卷积”块之间加入一个或两个反卷积层而建立在“卷积”之上。每个反卷积层执行图像嵌入的两倍上采样。随后,从掩模嵌入和等维图像嵌入开始,逐步融合和传播这些级联表示,直到它们的分辨率与输入图像的分辨率匹配。如下图所示,融合过程依次由反卷积操作和随后的“卷积”块组成。反卷积被用来提高级联嵌入的分辨率,而卷积用于对它们进行进一步编码。最后,利用嵌入来生成预测掩码。在模型图底部直观地展示了掩码解码器的中间特征图。前三个特征图以从左到右的方式描述不同级别的特征,从低级特征(如边缘和局部特征)到高级特征(如形状和全局特征)。最后三个映射表示解码的特征,第一个解码的特征映射展示了提示信息的并入,将模型的注意力引导到感兴趣的区域,促进了语义知识的获取。这种获得的语义知识随后通过两个融合阶段进行提炼,最终产生预测的掩码。重要的是要注意,功能映射具有不同的分辨率。

原来的decoder输出在自注意力和交叉注意力的时候就停止,不膨胀了输入U型decoder中。本文取了image-encoder的三个中间张量,先用卷积,再反卷积上采样,最后卷积。与原decoder的输出cat,与Unet解码器相同,使用反卷积上采样再卷积融合,再cat再处理(就是模型图下方的操作)。对于卷积操作:本文采用了卷积和短连接。
短连接是残差连接,就是一个卷积激活再卷积,一个直接一个卷积后与那个加和,再relu激活。

在这里插入图片描述在这里插入图片描述
渐进式训练策略

本文还通过t-SNE算法对比了自然图像和医学图像的特征,发现两者之间虽然有一些共享特征,但总体上差异显著。这提示在直接训练模型进行医学图像分割时可能会遇到困难,因此需要考虑专门的训练策略来应对这些挑战。

本文采用渐进式学习策略,将模型从自然图像分割逐步训练到医学病变分割。整个训练过程包括自我监督预训阶段和监督学习阶段。为了实现从自然图像到医学图像的领域自适应,首先使用廉价的无标签医学数据进行适配器模块的初步训练。这些数据通过MAE(Masked Autoencoder)方法进行自监督学习。在这个阶段,解码器是MAE的解码器,使用均方误差(MSE)来重建部分掩盖的图像嵌入:
在这里插入图片描述
其中𝑦𝑖和𝑦̂𝑖分别表示原始图像和重建图像。在MAE之后,丢弃简单的解码器,并且使用特定于任务的数据集来使用骰子损失和交叉熵损失之和来训练适配器和其他可调组件,其公式如下:
在这里插入图片描述

说明

这个模型的创新在于:

  • 基于SAM,image-encoder增加adapter;
  • decoder保留一部分,从encoder里抽取三层特征,做一个u型结构,使用卷积和反卷积处理;
  • 训练采用渐进式,包括自监督和全监督,后者采用模型结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1822465.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机网络(6) TCP协议

TCP(Transmission Control Protocol,传输控制协议)是互联网协议套件中一种核心协议。它提供面向连接的、可靠的字节流传输服务,确保数据从一端正确无误地传输到另一端。TCP的主要特点包括: 可靠性:TCP使用…

怎么脚本ai创作?分享三个方法

怎么脚本ai创作?在数字化时代,AI技术正逐渐渗透到我们生活的方方面面,其中AI脚本创作软件的出现,极大地提高了创作效率,降低了创作门槛。今天,就为大家推荐三款备受好评的AI脚本创作软件,其中聪…

MyBatis 获取参数的两种方式

${paramName} 使用这种方式的结果是直接替换。 #{paramName} 使用这种方式的实现是占位符。(?)

昂辉科技EasySAR-BootLoader上位机产品

近年来,硬件标准化、同质化和软件差异化、复杂化成为了汽车产品研发的重要趋势。与此同时,大量的智能化功能和快速上车的节奏,对软件开发提出了更高的要求。在软硬件解耦的大背景下,建立统一的软件体系和开发工具以紧跟硬件更新迭…

UE4中性能优化工具合集

UE4中性能优化工具合集 简述CPUUnreal InsightUnreal ProfilerSimpleperfAndroid StudioPerfettoXCode TimeprofilerBest Practice GPUAdreno GPUMali GPUAndroid GPU Inspector (AGI) 内存堆内存分析Android StudioLoliProfilerUE5 Memory InsightsUnity Mono 内存MemreportRH…

JavaScript 基础 - 第2天【函数】

文章目录 前言一、声明和调用1、声明(定义)2、调用 二、参数三、返回值四、作用域1、全局作用域2、局部作用域 五、匿名函数1、函数表达式2、立即执行函数 前言 理解封装的意义,能够通过函数的声明实现逻辑的封装,知道对象数据类…

基于pytorch的LSTM模型训练与预测(附源码)

1.LSTM模型 关于这个模型的基本概念长短时记忆网络(LSTM)(超详细 |附训练代码)_lstm代码-CSDN博客可以查看这篇文章,写得很详细,我觉得能大概看明白反向传递各个部分的推导就行了。 2.pytorch的安装 我使用的是conda环境,在参照网上的安装过程…

EndNote 专业的文献管理软件下载,强大的引用和参考文献生成功能

EndNote,它以其强大的功能和便捷的操作赢得了广大学术工作者的青睐,成为了他们不可或缺的研究助手。 EndNote软件的出现,极大地简化了学术文献的管理和组织工作。用户只需将收集到的文献导入软件,便可轻松实现对文献的分类、排序和…

【APP移动端自动化测试】第四节.元素操作的API

文章目录 前言一、点击&输入&清空操作 1.1 点击元素 1.2 输入&清空元素二、获取文本内容&位置&大小操作 2.1 获取文本内容 2.2 获取位置&大小三、根据属性名获取属性值操作四、滑动和拖拽操作 4.1 _swipe 4.2 _scroll …

20240613确认飞凌的OK3588-C的核心板的HDMI IN功能

20240613确认飞凌的OK3588-C的核心板的HDMI IN功能 2024/6/13 16:09 v4l2-ctl --list-devices v4l2-ctl --list-formats-ext -d /dev/video8 【这里必须拿到HDMI OUT机芯的分辨率。如果拿不到,肯定硬件异常/线没有接好】 v4l2-ctl -V -d /dev/video8 gst-launch-1.…

宏电“灌区哨兵”助力灌区信息化建设,开启灌区“智水”时代

灌区是保障国家粮食安全的重要水利设施。“十四五”提出,要推进大中型灌区节水改造和精细化管理。灌区信息化是建设智慧水利、深化行业监管、提升灌区科学管理水平的基础支撑,也是“十四五”期间灌区现代化改造的重点内容之一。 宏电智慧灌区信息化解决方…

探秘扩散模型:训练算法与采样算法的双重解读

很早之前就新建了一个专栏从0开始弃坑扩散模型,但发了一篇文章就没有继续这一系列,在这个AIGC的时代,于是我准备重启这个专栏。 整个专栏的学习顺序可以见这篇汇总文章 很多时候我们看到一篇文章很长,难免会心生胆怯,所以我将这些…

docker的教程长亭

把我的常用docker写在这里 之前用 vul - hub 靶场经常用 现在docker不知道为什么挂了 开启 docker-compose up -d 关闭 docker-compose down docker ps 只是运行 docker ps -a 所有 包括停止 docker ps -q 只看id docker stop <container_name_or_id> docker 的容器…

Pinia的简要概述

Pinia是专为 Vue 应用程序开发的状态管理库&#xff0c;Pinia 支持 Vue2和 Vue3。在 Vue3项目中,既可以使用传统的 Vuex实现状态管理&#xff0c;又可以使用 Pinia 实现状态管理。本章将对 Pinia的基本使用方法进行讲解。 一.Pinia 概述 Pinia 是新一代的轻量级状态管理库&…

Echarts图表实现X轴自动滚动加载数据

1.用到了Echarts图表自带的dataZoom组件 2.使用定时器定时刷新数据 效果图 关键代码 dataZoom: [{xAxisData: 0,//这里是从X轴的0刻度开始show: false,//是否显示滑动条type: slider, // 这个 dataZoom 组件是 slider 型 dataZoom 组件startValue: 0, // 从头开始。endValue:…

小程序 UI 风格,构建美妙视觉

小程序 UI 风格&#xff0c;构建美妙视觉

数据结构——队列(Queue)详解

1.队列&#xff08;Queue&#xff09; 1.1概念 队列&#xff1a;只允许在一端进行插入数据操作&#xff0c;在另一端进行删除数据操作的特殊线性表&#xff0c;队列具有先进先出FIFO(First In First Out)的性质 入队列&#xff1a;进行插入操作的一端称为队尾(Tail/Rear) 出…

10054 远程主机强迫关闭了一个现有的连接

在连接数据库SQLserver&#xff0c;时可能会出现如下的故障&#xff0c;特别是当操作系统是Win11时&#xff0c;在连接比较旧的版本数据库时会出现这样的问题&#xff1a;10054 远程主机强迫关闭了一个现有的连接。报错如下图所示&#xff1a; 根据微软的官方网站&#xff0c;查…

U盘文件损坏且无法读取怎么修复?五个方法帮你搞定

在现代社会&#xff0c;U盘已经是我们日常生活和工作中不可缺少的工具之一。U盘的容量大、体积小、携带方便&#xff0c;很多人都喜欢使用U盘用于个人和工作数据的存储和传输。但是&#xff0c;U盘和其他的电子设备一样&#xff0c;在试用期间有时候会出现U盘打不开提示目录结构…

jadx+android studio+雷电模拟器 动态调试apk

# 环境准备 1.雷电模拟器&#xff0c;开启root 2.jadx&#xff1a; https://sourceforge.net/projects/jadx.mirror/files/v1.5.0/jadx-gui-1.5.0-with-jre-win.zip/download 3.java jdk 11 https://www.oracle.com/cn/java/technologies/javase/jdk11-archive-downloads.…