ISBI 2012 EM 神经元结构分割数据集复现UNet

news2025/5/17 20:14:41

一些笔记在代码的注释中

因为使用的数据集比较简单,所以没有使用模型可视化和调试的内容,只是简单的数据集预处理和模型的搭建以及训练。

# 1. PyTorch 基础模块
import torch                  # 张量操作
import torch.nn as nn         # 构建神经网络模块(如Conv2d, Module等)
import torch.nn.functional as F  # 函数式API(如激活函数、卷积等)
import torch.optim as optim   # 优化器(如Adam, SGD)
from torch.utils.data import Dataset, DataLoader  # 数据加载
# 2. 图像处理和增强
import torchvision.transforms as transforms  # 常用图像变换方法(ToTensor, Normalize等)
import torchvision.transforms.functional as TF  # 具体变换函数(hflip, vflip等)
# 3. 读取医学图像文件(TIFF格式)
import tifffile  # tif文件读取函数 tifffile.imread()
# 4. 其他辅助模块
import numpy as np           # 数组和矩阵操作
import random                # 随机数生成
import os
import zipfile
import requests
import matplotlib.pyplot as plt



# 数据路径
data_dir = "D:\python\Pytorch"

# 读取训练图像和标签
train_image_stack = tifffile.imread(os.path.join(data_dir, "train-volume.tif"))
train_label_stack = tifffile.imread(os.path.join(data_dir, "train-labels.tif"))

print("图像 shape:", train_image_stack.shape)   # (30, 512, 512)
print("标签 shape:", train_label_stack.shape)   # (30, 512, 512)


#数据集加载
class ISBIDataset(Dataset):
    def __init__(self,images,masks,patch_size=128,augment=True):##augment=True 这个参数通常用于控制**数据增强(data augmentation)**功能是否开启。
        self.images = images
        self.masks = masks
        self.patch_size = patch_size
        self.augment = True
    #作用:初始化 Dataset 对象,完成数据路径、预处理操作等的准备工作。你可以在这里加载数据列表、设置变换(transform)等。
    def __len__(self):
        return len(self.images)*10 #将一张图片分为10个patch 输出的数据的总数
    #作用:返回整个数据集的样本数量。DataLoader 会调用它来知道数据集有多大,从而决定迭代次数。
    def __getitem__(self, idx):
        img_idx = idx % len(self.images) #上面把一张图片分为10个patch 这里是把每10个patch的样本编码表示为同一图片
        image = self.images[img_idx]
        mask = self.masks[img_idx]
    #作用:根据给定的索引,返回对应的数据样本(例如图像和标签)。DataLoader 通过索引调用它,取出单个样本进行训练或推理。

#数据预处理
#随即裁剪patch
        # 随机裁剪 patch
        i = random.randint(0, image.shape[0] - self.patch_size)
        j = random.randint(0, image.shape[1] - self.patch_size)

        image_patch = image[i:i + self.patch_size, j:j + self.patch_size]
        mask_patch = mask[i:i + self.patch_size, j:j + self.patch_size]

        # 转为 tensor 并归一化
        image_patch = torch.from_numpy(image_patch).float().unsqueeze(0) / 255.0  # (1, H, W)
        mask_patch = torch.from_numpy(mask_patch).float().unsqueeze(0) / 255.0
        mask_patch = (mask_patch > 0.5).float()  # 转为0/1标签

        # 数据增强(水平/垂直翻转)
        if self.augment:
            if random.random() > 0.5:
                image_patch = TF.hflip(image_patch)
                mask_patch = TF.hflip(mask_patch)
            if random.random() > 0.5:
                image_patch = TF.vflip(image_patch)
                mask_patch = TF.vflip(mask_patch)

        return image_patch, mask_patch
#在面对不同的数据集时,都要根据数据集的文档或者特征使用不同的数据预处理的方法
# 创建训练数据集和 DataLoader
train_dataset = ISBIDataset(train_image_stack, train_label_stack, patch_size=128, augment=True)#这里的augment参数 是指数据增强又没有开启
train_loader = DataLoader(train_dataset, batch_size=8, shuffle=True)

# 测试一下 DataLoader
for img, mask in train_loader:
    print("图像 shape:", img.shape)   # [8, 1, 128, 128]
    print("掩码 shape:", mask.shape) # [8, 1, 128, 128]
    break


#卷积模块
class DoubleConv(nn.Module):
    def __init__(self, in_channels, out_channels):
        super(DoubleConv, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1)
        self.relu = nn.ReLU(inplace=True)  # 一般设置inplace=True节省内存

    def forward(self, x):
        x = self.relu(self.conv1(x))
        x = self.relu(self.conv2(x))
        return x
#每个卷积模块都是由 两层(conv+relu)组成的 方便后面使用

#UNet模型核心模块
class UNet(nn.Module):
    def __init__(self,in_channels=1,out_channels=1):
        super(UNet,self).__init__()
        #编码器部分
        #连续的卷积块(Conv + ReLU + Conv + ReLU)
        #每个卷积块后接池化层(MaxPool)进行下采样,提取特征并降低分辨率
        self.down1 = DoubleConv(in_channels=1, out_channels=64)
        self.pool1 = nn.MaxPool2d(kernel_size=2)#池化层

        self.down2 = DoubleConv(64, 128)
        self.pool2 = nn.MaxPool2d(2)

        self.down3 = DoubleConv(128, 256)
        self.pool3 = nn.MaxPool2d(2)

        self.down4 = DoubleConv(256, 512)
        self.pool4 = nn.MaxPool2d(2)

        # 瓶颈层
        # 起到信息压缩 + 表征增强的作用
        # 这个位置的特征图最小(尺寸最小,语义最强)
        # 为解码器提供最深的上下文信息,提升分割准确性
        self.bottleneck = DoubleConv(512,1024)


        #解码器部分
        #使用反卷积(TransposedConv)或插值上采样
        #拼接对应编码器层的特征图(skipconnection)
        #卷积块提取融合特征
        self.up1 = nn.ConvTranspose2d(1024, 512, kernel_size=2, stride=2)
        self.dec1 = DoubleConv(1024, 512)  # 拼接后通道是 512 + 512

        self.up2 = nn.ConvTranspose2d(512, 256, kernel_size=2, stride=2)
        self.dec2 = DoubleConv(512, 256)

        self.up3 = nn.ConvTranspose2d(256, 128, kernel_size=2, stride=2)
        self.dec3 = DoubleConv(256, 128)

        self.up4 = nn.ConvTranspose2d(128, 64, kernel_size=2, stride=2)
        self.dec4 = DoubleConv(128, 64)

        #最终卷积层1x1卷积输出预测掩码
        self.final = nn.Conv2d(64, out_channels, kernel_size=1)

#模型的前向传播部分
    def forward(self,x):
        x1 = self.down1(x)
        x2 = self.down2(self.pool1(x1))
        x3 = self.down3(self.pool1(x2))
        x4 = self.down4(self.pool1(x3))
        x5 = self.bottleneck(self.pool1(x4))
        #实现跳跃连接的部分
        d1 = self.up1(x5)  # 上采样 1024 -> 512
        d1 = torch.cat([d1, x4], dim=1)  # 拼接编码器对应层(跳跃连接)
        d1 = self.dec1(d1)  # -> 输出 512

        d2 = self.up2(d1)  # 512 -> 256
        d2 = torch.cat([d2, x3], dim=1) #将对应的卷积层进行跳跃连接
        d2 = self.dec2(d2)

        d3 = self.up3(d2)  # 256 -> 128
        d3 = torch.cat([d3, x2], dim=1)
        d3 = self.dec3(d3)

        d4 = self.up4(d3)  # 128 -> 64
        d4 = torch.cat([d4, x1], dim=1)
        d4 = self.dec4(d4)
        out = self.final(d4)
        return out
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = UNet(in_channels=1,out_channels=1).to(device) #定义模型

criterion = nn.BCEWithLogitsLoss() #损失函数
optimizer = torch.optim.Adam(model.parameters(),lr = 1e-4) #优化器

#对单个训练计划的定义
def train_one_epoch(model,dataloader,optimizer,criterion,device):
    model.train()
    total_loss = 0.0

    for images,masks in dataloader:
        images = images.to(device)
        masks = masks.to(device)

        outputs = model(images)
        loss = criterion(outputs,masks)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_loss +=loss.item()*images.size(0)

    avg_loss = total_loss / len(dataloader.dataset)
    return avg_loss

num_epochs = 20  # 你可以根据数据大小调整

for epoch in range(num_epochs):
    train_loss = train_one_epoch(model, train_loader, optimizer, criterion, device)
    print(f"Epoch [{epoch+1}/{num_epochs}], Train Loss: {train_loss:.4f}")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2377948.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot连接高斯数据库(GaussDB)踩坑指南

1. 用户密码加密类型与gsjdbc4版本不兼容问题 我的数据库,设置的加密类型(password_encryption_type)是2, 直接使用gsjdbc4.jar连接数据库报错。 org.postgresql.util.PSQLException: Invalid or unsupported by client SCRAM mechanisms 后使用gsjdb…

c++20引入的三路比较操作符<=>

目录 一、简介 二、三向比较的返回类型 2.1 std::strong_ordering 2.2 std::weak_ordering 2.3 std::partial_ordering 三、对基础类型的支持 四、自动生成的比较运算符函数 4.1 std::rel_ops的作用 4.2 使用<> 五、兼容他旧代码 一、简介 c20引入了三路比较操…

Cursor开发酒店管理系统

目录&#xff1a; 1、后端代码初始化2、使用Cursor打开spingboot项目3、前端代码初始化4、切换其他大模型5、Curosr无限续杯 1、后端代码初始化 找一个目录&#xff0c;使用idea在这个目录下新建springboot的项目。 2、使用Cursor打开spingboot项目 在根目录下新建.cursor文件…

图像对比度调整(局域拉普拉斯滤波)

一、背景介绍 之前刷对比度相关调整算法&#xff0c;找到效果不错&#xff0c;使用局域拉普拉斯做图像对比度调整&#xff0c;尝试复现和整理了下相关代码。 二、实现流程 1、基本原理 对输入图像进行高斯金字塔拆分&#xff0c;对每层的每个像素都针对性处理&#xff0c;生产…

如何在本地打包 StarRocks 发行版

字数 615&#xff0c;阅读大约需 4 分钟 最近我们在使用 StarRocks 的时候碰到了一些小问题&#xff1a; • 重启物化视图的时候会导致视图全量刷新&#xff0c;大量消耗资源。- 修复 PR&#xff1a;https://github.com/StarRocks/starrocks/pull/57371• excluded_refresh_tab…

git使用的DLL错误

安装好git windows客户端打开git bash提示 Error: Could not fork child process: Resource temporarily unavailable (-1). DLL rebasing may be required; see ‘rebaseall / rebase –help’. 提示 MINGW64的DLL链接有问题&#xff0c;其实是Windows的安全中心限制了&…

区块链blog1__合作与信任

&#x1f342;我们的世界 &#x1f33f;不是孤立的&#xff0c;而是网络化的 如果是单独孤立的系统&#xff0c;无需共识&#xff0c;而我们的社会是网络结构&#xff0c;即结点间不是孤立的 &#x1f33f;网络化的原因 而目前并未发现这样的理想孤立系统&#xff0c;即现实中…

从数据包到可靠性:UDP/TCP协议的工作原理分析

之前我们已经使用udp/tcp的相关接口写了一些简单的客户端与服务端代码。也了解了协议是什么&#xff0c;包括自定义协议和知名协议比如http/https和ssh等。现在我们再回到传输层&#xff0c;对udp和tcp这两传输层巨头协议做更深一步的分析。 一.UDP UDP相关内容很简单&#xf…

【CanMV K230】AI_CUBE1.4

《k230-AI 最近小伙伴有做模型的需求。所以我重新捡起来了。正好把之前没测过的测一下。 这次我们用的是全新版本。AICUBE1.4.dotnet环境9.0 注意AICUBE训练模型对硬件有所要求。最好使用独立显卡。 有小伙伴说集显也可以。emmmm可以试试哈 集显显存2G很勉强了。 我们依然用…

vscode 默认环境路径

目录 1.下面放在项目根目录上&#xff1a; 2.settings.json内容&#xff1a; 自定义conda环境断点调试 启动默认参数&#xff1a; 1.下面放在项目根目录上&#xff1a; .vscode/settings.json 2.settings.json内容&#xff1a; {"python.analysis.extraPaths"…

支付宝授权登录

支付宝授权登录 一、场景 支付宝小程序登录&#xff0c;获取用户userId 二、注册支付宝开发者账号 1、支付宝开放平台 2、点击右上角–控制台&#xff0c;创建小程序 3、按照步骤完善信息&#xff0c;生成密钥时会用到的工具 4、生成的密钥&#xff0c;要保管好&#xff…

Fabric 服务端插件开发简述与聊天事件监听转发

原文链接&#xff1a;Fabric 服务端插件开发简述与聊天事件监听转发 < Ping通途说 0. 引言 以前写过Spigot的插件&#xff0c;非常简单&#xff0c;仅需调用官方封装好的Event类即可。但Fabric这边在开发时由于官方文档和现有互联网资料来看&#xff0c;可能会具有一定的误…

电商物流管理优化:从网络重构到成本管控的全链路解析

大家好&#xff0c;我是沛哥儿。作为电商行业&#xff0c;我始终认为物流是电商体验的“最后一公里”&#xff0c;更是成本控制的核心战场。随着行业竞争加剧&#xff0c;如何通过物流网络优化实现降本增效&#xff0c;已成为电商企业的必修课。本文将从物流网络的各个环节切入…

Unity:延迟执行函数:Invoke()

目录 Unity 中的 Invoke() 方法详解 什么是 Invoke()&#xff1f; 基本使用方法 使用要点 延伸功能 ❗️Invoke 的局限与注意事项 在Unity中&#xff0c;延迟执行函数是游戏逻辑中常见的需求&#xff0c;比如&#xff1a; 延迟切换场景 延迟播放音效或动画 给玩家时间…

移植RTOS,发现任务栈溢出怎么办?

目录 1、硬件检测方法 2、软件检测方法 3、预防堆栈溢出 4、处理堆栈溢出 在嵌入式系统中&#xff0c;RTOS通过管理多个任务来满足严格的时序要求。任务堆栈管理是RTOS开发中的关键环节&#xff0c;尤其是在将RTOS移植到新硬件平台时。堆栈溢出是嵌入式开发中常见的错误&am…

【设计模式】- 结构型模式

代理模式 给目标对象提供一个代理以控制对该对象的访问。外界如果需要访问目标对象&#xff0c;需要去访问代理对象。 分类&#xff1a; 静态代理&#xff1a;代理类在编译时期生成动态代理&#xff1a;代理类在java运行时生成 JDK代理CGLib代理 【主要角色】&#xff1a; 抽…

数据服务共享平台方案

该文档聚焦数据服务共享平台方案,指出传统大数据管理存在数据定义不统一、开发困难、共享不足等挑战,提出通过自服务大数据平台实现数据 “采、存、管、用” 全流程优化,涵盖数据资产管理、自助数据准备、服务开发与共享、全链路监控等功能,并通过国家电网、东方航空、政府…

skywalking使用教程

skywalking使用教程 一、介绍 skywalking 1.1 概念 skywalking是分布式系统的应用程序性能监视工具&#xff0c;专为微服务、云原生架构和基于容器&#xff08;Docker、K8s、Mesos&#xff09;架构而设计。SkyWalking 是观察性分析平台和应用性能管理系统&#xff0c;提供分布…

C 语 言 - - - 简 易 通 讯 录

C 语 言 - - - 简 易 通 讯 录 代 码 全 貌 与 功 能 介 绍通 讯 录 的 功 能 说 明通 讯 录 效 果 展 示代 码 详 解contact.hcontact.ctest.c 总 结 &#x1f4bb;作 者 简 介&#xff1a;曾 与 你 一 样 迷 茫&#xff0c;现 以 经 验 助 你 入 门 C 语 言 &#x1f4a1;个 …

机器学习知识自然语言处理入门

一、引言&#xff1a;当文字遇上数学 —— 自然语言的数字化革命 在自然语言处理&#xff08;NLP&#xff09;的世界里&#xff0c;计算机要理解人类语言&#xff0c;首先需要将文字转化为数学向量。早期的 One-Hot 编码如同给每个词语分配一个唯一的 “房间号”&#xff0c;例…