《Brief Bioinform》: 鼠脑单细胞与Stereo-seq数据整合算法评估

news2025/6/8 11:13:46

一、写在前面

基因捕获效率、分辨率一直是空间转录组细胞类型识别的拦路虎,许多算法能够整合单细胞(single-cell, sc)或单细胞核(single-nuclear, sn)数据与空间转录组数据,从而帮助空转数据的细胞类型注释。此前我们介绍过近年新出炉的Stereo-seq平台,这一新兴技术相关的分析思路及工具支持仍有所欠缺,因此本文的作者评估了9种单细胞数据与stereo-seq空转数据进行mapping的算法,以帮助大家提示stereo-seq数据处理的准确性与效率。原文引用信息:

Tao Q, Xu Y, He Y, Luo T, Li X, Han L. Benchmarking mapping algorithms for cell-type annotating in mouse brain by integrating single-nucleus RNA-seq and Stereo-seq data. Brief Bioinform. 2024 May 23;25(4):bbae250. 

如果想系统性的学习空间转录组数据分析也可以看这里:

空间转录组学习手册合辑

Stereopy空间转录组学习手册

Squidpy空间转录组学习手册

Scanpy空间转录组学习手册

Seurat空间转录组学习手册

一文搞定空间转录组与单细胞测序的整合分析

CellChat空转细胞通讯合辑

SeekSpace| 会单细胞就会空间转录组

二、背景介绍

哺乳动物的脑组织具有极高的异质性以及复杂的细胞类型(神经元、免疫细胞、血管细胞等等)组成,较为传统的技术例如免疫荧光或原位杂交技术无法同一时间内注释出所有细胞类型,因此,脑组织常作为空间转录组想要占领的测试高地:长脑子了!时空转录组揭示大脑再生机制。stereo-seq凭借分辨率高(0.22μm)、视场大(芯片大小可定制)、无需预先设置探针等特点被广泛应用于生命科学研究的各个领域之中。但实战过程中,"cellbin"的划分细胞策略容易遇到体积小的细胞捕获到的分子数量不足、"square bin"划分细胞不能满足单细胞分辨率的尴尬。因此实际分析过程中stereo-seq与其它空间转录组数据一样需要依赖单细胞水平的数据的mapping帮助完成注释过程。目前能够完成这一过程的软件众多:DestVI可以通过基因的"罚分"来完成参考单细胞数据与空转数据的神经网络构建;RCTD利用最大相似度预测各spot的细胞占比(能够减少平台不同带来的影响);SpatialDWLS本质上利用阻尼加权最小二乘回归,通过整合富集分析以及Giotto提供的差异分析来完成mapping过程;大家熟悉的神包Seurat能够通过最近临近法整合多来源的细胞;Tangram能够梯度优化的计算连哥哥数据集间的KL离散度与余弦相似性;SpatialID利用转化学习训练深度神经网络模型生成各细胞在空转中分布的可能性;SpatialID利用每个数据集的高变基因构建系统模型,输出全局最优的转化矩阵可能性;Spann也能够优化转化模型,使得临近的的样本具有相同的细胞类型。此前也有过空转与单细胞数据整合的工具benchmarking(空间转录组与单细胞转录组整合分析工具大比拼),但新出现的stereo-seq在之前并没有被纳入考察目标之中,并且这些工具的benckmarking大都依赖高质量的”groudtruth“,而stereo-seq能够使用不同大小的bin size来互相做校验,显然对于这些工具来说也是一个良好的测试数据集。

三、主要结果

如Figure1 A的流程图所示,作者通过已注释的snRNA-seq数据生成了一个拟空间数据作为background,然后收集了八个包含对应脑区位置(例如海马体、小脑、嗅球、皮质等)的snRNA-seq数据与stereo-seq数据。作者主要从square bin 50(大约25μmX25μm)与cell bin(利用ssDNA划分生成的细胞单位)的各算法效果,可以明显看出,Bin50的spot数量要明显小于Cellbin,但nFeature和nCount方面前者更高,换句话说,在这些数据中Bin50的尺寸要大于Cellbin(Biomamba目前处理过的数据也基本都是这个情况)。

图片

Figure 1

在完成了四个脑区数据的注释(Figure 2A-B)之后,使用各mapping算法工具处理拟空间数据与stereo-seq空转数据,并对每个spot中细胞比例进行皮尔森相关系数计算(Figure 2C),肉眼可见Cell2location(基于Python)与RCTD(基于R)的相关系数又高又稳(这两个包的教程可见:一文搞定空间转录组与单细胞测序的整合分析)。在合并相同细胞类型的表达矩阵后,作者对stereo-seq细胞表达矩阵与snRNA-seq的细胞表达矩阵进行相关性系数分析(Figure 2D),可以看出RCTD这次遥遥领先,其余软件除了Tangram外表现都很差。

图片

Figure 2

接下来作者开始了实战部分,成年脑矢状面脑组织HIP的snRNA-seq与stereo-seq的运行结果如图3A所示,通过作者的生物学知识基础,可以发现RCTD与SpatialDWLS对主要的细胞类型如CA1、CA2、CA3分布的预测较为精准,而其它软件存在边界不清晰、注释不准确的现象。作者引入了ASS来评估细胞距离及相关性,结果显示RCTD(在多个数据集及分bin方法中均表现上乘)与SpatialDWLS表现最优,而Spatial-ID与DestVI垫底(Figure 3B-C)。在注释结果的细胞类型中可见,RCTD与SpatialDWLS能够预测到占比非常小的细胞类型,而DestVI这种仅能够预测到占比比较大的细胞类型。

ASS公式如下,感兴趣的同学可以看一下原文了解详细参数含义:

图片

图片

Figure3

在小脑数据的layer的识别上来说,RCTD与SpatialDWLS无论是在cell bin还是在bin50均能够精准的分配出符合其空间位置的细胞类型(Figure 4A),而其它工具都或多或少的丢失了一些layer,例如Cell2location没有识别出Purkinje cell layer。

图片

Figure 4

四、最后聊聊

这篇文章想提供给大家的信息很简单,如果你想用R语言处理stereo-seq,你就用RCTD,如果你想用python处理stereo-seq,你就用SpatialDWLS。值得一提的是,以上的结果都是作者使用脑部数据测试得到的结果,其它的组织器官可能会遇到不同的情况。并且,作为一个benchmarking的文章,作者并没有给出计算效率的评估,要知道,不同算法/工具对于相同输入数据的计算时间可能会相差数千倍。最重要的是作者提出了Accuracy scoring system(ASS)这一概念来评估各工具对空间转录组mapping的效果。本篇文章的代码链接如下,大家可以自行学习体会一番:https://github.com/qyTao185/Benchmarking-Mapping-Algorithms.git

如果你的计算机不足以支持该工具的计算,可按需选用适合自己的计算资源:

共享(经济实惠):有root权限的共享服务器

独享(省电省心):生信分析不求人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2404063.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Springboot的宠物领养系统

本系统是一个面向社会的宠物领养平台,旨在帮助流浪宠物找到新家庭,方便用户在线浏览、申请领养宠物,并支持管理员高效管理宠物、公告和用户信息。 技术栈: -后端: Java 8Spring BootSpring MVCMyBatis-PlusMySQL 8R…

Readest(电子书阅读器) v0.9.53

Readest 是一款开源电子书阅读器,专为沉浸式和深度阅读体验而设计。它是对Foliate的现代重写,利用Next. js 15和Tauri v2在macOS、Windows、Linux和Web上提供无缝的跨平台体验,并即将支持移动平台。 软件特色 多格式支持 支持EPUB、MOBI、K…

USART 串口通信全解析:原理、结构与代码实战

文章目录 USARTUSART简介USART框图USART基本结构数据帧起始位侦测数据采样波特率发生器串口发送数据 主要代码串口接收数据与发送数据主要代码 USART USART简介 一、USART 的全称与基本定义 英文全称 USART:Universal Synchronous Asynchronous Receiver Transmi…

UOS无法安装deb软件包

UOS无法安装deb软件包 问题描述解决办法: 关闭安全中心的应用隔离结果验证 问题描述 UOS安装Linux微信的deb包时,无法正常安装 解决办法: 关闭安全中心的应用隔离 要关闭-安全中心的应用隔离后才可以正常软件和运行。 应用安全----》 允许任意应用。 结果验证 # …

VUE前端实现自动打包成压缩文件

VUE前端实现自动打包成压缩文件 背景思路实现打包代码实现 尾巴 背景 做前端开发的兄弟们都经历过每次开发完成之后发包需要进行打包,然后将打包文件压缩。每次打好包了都得手动压缩一遍,就有点繁琐。今天我们就使用一种命令行自动压缩的方法&#xff0…

2025政务服务便民热线创新发展会议顺利召开,张晨博士受邀分享

5月28日,由新华社中国经济信息社、新华社广东分社联合主办的2025政务服务便民热线创新发展暨“人工智能热线”会议在广州举行。会议围绕“人工智能与新质热线”主题,邀请全国的12345政务服务便民热线主管部门负责人、省市热线负责人和专家学者&#xff0…

【PDF PicKiller】PDF批量删除固定位置图片工具,默认解密,可去一般图、背景图、水印图!

PDF批量删除固定位置图片工具 PDF PicKiller <center>PDF PicKiller [Download](https://github.com/Peaceful-World-X/PDF-PicKiller)&#x1f929; 工具介绍&#x1f973; 主要功能&#x1f92a; 软件使用&#x1f92a; 参数解释&#x1f92a; 关键代码&#x1f929; 项…

GIC700组件

GIC700包含了几个重要的组件,它们使用一个内部的GIC互联,用于在不同的组件之间使用AXI5-Stream接口进行路由。 1. Distributor(GICD) gicd是GIC700中所有组件之间的主要通信节点。它作为SPI的管理者以及维护LPI的cache,并且与其它chip上的GIC700组件进行通信。当支持GIC…

有没有 MariaDB 5.5.56 对应 MySQL CONNECTION_CONTROL 插件

有没有 MariaDB 对应 MySQL CONNECTION_CONTROL 插件 背景 写这篇文章的目的是因为昨晚半夜突然被call起来&#xff0c;有一套系统的mysql数据库启动失败了。尝试了重启服务器也不行。让我协助排查一下问题出在哪。 分析过程 一开始拿到服务器IP地址&#xff0c;就去数据库…

TripGenie:畅游济南旅行规划助手:个人工作纪实(二十二)

这周&#xff0c;我进行了历史记录的设计与制作&#xff0c;我对于每一个用户与智能体交互得出的历史行程的数据进行了存储与可视化展示。 首先&#xff0c;我设置了一个csv文件存储每一个得出的行程规划&#xff0c;注意这里的地图我设置了一个全路径进行存储&#xff0c;这样…

如何用AI高效运营1000+Tiktok矩阵账号

在当今数字化的时代&#xff0c;Tiktok 矩阵账号运营成为了众多企业和个人追求流量与变现的重要手段。然而&#xff0c;面对众多的账号管理&#xff0c;如何高效运营成为了关键。此时&#xff0c;AI 工具的出现为我们提供了强有力的支持。 一、Tiktok 矩阵账号的重要性 Tiktok…

【论文解读】Toolformer: 语言模型自学使用工具

1st author: ‪Timo Schick‬ - ‪Google Scholar‬ paper: Toolformer: Language Models Can Teach Themselves to Use Tools | OpenReview NeurIPS 2023 oral code: lucidrains/toolformer-pytorch: Implementation of Toolformer, Language Models That Can Use Tools, by…

408第一季 - 数据结构 - 线性表II

链表 头节点始终指向第一个 头节点的好处&#xff1a; 第一个好处 这里L是头节点 可以发现&#xff0c;删除第一个也可以统一了 第二个好处 这是无头节点&#xff0c;空和非空指向的不一样 然后有头节点就可以统一了&#xff01; 双链表 插入 第一步要在第四步之前&…

基于VMD-LSTM融合方法的F10.7指数预报

F10.7 Daily Forecast Using LSTM Combined With VMD Method ​​F10.7​​ solar radiation flux is a well-known parameter that is closely linked to ​​solar activity​​, serving as a key index for measuring the level of solar activity. In this study, the ​​…

35 C 语言字符串转数值函数详解:strtof、strtod、strtold(含 errno 处理、ERANGE 错误)

1 strtof() 函数 1.1 函数原型 #include <stdlib.h> // 必须包含这个头文件才能使用 strtof() #include <errno.h> // 包含 errno 和 ERANGE #include <float.h> // 包含 FlOAT_MAX 和 FLOAT_MIN #include <math.h> // 包含 HUGE_VALF(inf)float…

日志收集工具-Filebeat

提示&#xff1a;windows 环境下 Filebeat 的安装与使用 文章目录 前言一、安装二、配置部署三、启动测试 前言 Filebeat 一般用于日志采集&#xff0c;由两部分组成 &#xff1a;Harvesters 和 prospector Harvesters采集器&#xff1a;逐行读取单个文件的内容&#xff0c;并…

Vue3学习(4)- computed的使用

1. 简述与使用 作用&#xff1a;computed 用于基于响应式数据派生出新值&#xff0c;其值会自动缓存并在依赖变化时更新。 ​缓存机制​&#xff1a;依赖未变化时直接返回缓存值&#xff0c;避免重复计算&#xff08;通过 _dirty 标志位实现&#xff09;。​响应式更新​&…

手机上网可以固定ip地址吗?详细解析

在移动互联网时代&#xff0c;手机已成为人们日常上网的主要设备之一。无论是工作、学习还是娱乐&#xff0c;稳定的网络连接都至关重要。许多用户对IP地址的概念有所了解&#xff0c;尤其是固定IP地址的需求。那么&#xff0c;手机上网能否固定IP地址&#xff1f;又该如何实现…

如何在Unity中实现点击一个按钮跳转到哔哩哔哩

1.创建一个按钮 2.编写一个脚本&#xff08;你可以把链接改成你想要跳转的网站&#xff09; using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.UI;public class JumpToBilibili : MonoBehaviour {void Start(){gameObject.…

PySide6 GUI 学习笔记——常用类及控件使用方法(单行文本控件QLineEdit)

文章目录 QLineEdit 介绍常用方法QLineEdit.EchoMode 取值光标相关方法文本选择方法输入格式化字符&#xff08;Input Mask&#xff09;常用信号QLineEdit 实例 QLineEdit 介绍 QLineEdit 是 PySide6&#xff08;Qt for Python&#xff09;中用于单行文本输入的控件。它支持文本…