WES与WGS数据线粒体DNA数据分析及检测工具

news2025/7/19 5:32:58

1. 线粒体DNA的异质性

传统的全外显子组测序(WES)和全基因组测序(WGS)的二代测序(SGS) 数据分析流程,能够识别多种类型的基因改变。但大多数用于基因变异分析和注释的工具,在输出文件中并未对线粒体 DNA(mtDNA)中的变异进行优化。这是由于 mtDNA 具有一种特殊的特性 —— 异质性,即细胞内存在多种类型的线粒体基因组

实际上,与仅存在两份拷贝的核基因组不同,大多数体细胞中 mtDNA 的拷贝数可达约 1000 到 10000 份

因此,mtDNA 可以处于异质状态,即细胞内不同 mtDNA 分子的序列存在差异;或者处于同质状态,即所有 mtDNA 的序列相同突变型和野生型分子的比例通常被称为异质性百分比或异质性频率

尽管如此,利用专门的生物信息学工具,结合进行 SGS的遗传学实验室现有的标准硬件和专业知识,从 WES 或 WGS 的原始 SGS 测序数据中提取这类信息是可行的。

2. 粒体DNA分析基本流程

从通过 WES 和 WGS 测序的样本的 FASTQ 文件出发,能够对线粒体染色体(chrM)进行变异检测,包括同质和异质变异(即使是低至 2 - 3% 以上的低频率变异)

生成 BAM 文件的比对阶段,与经典的 WES 或 WGS 分析流程相同。唯一的区别在于,需要将 FASTQ 文件中的读数比对到人类线粒体基因组(修订的剑桥参考序列 —rCRS,NCBI NC_012920.1),而非完整的人类基因组。从生成的 BAM 文件中,便可以通过生物信息学工具检测线粒体变异。

3. 识别线粒体DNA变异工具

与核基因组不同,核基因组中的变异通常以预期的变异等位基因频率(VAFs)出现,杂合子约为 50%,纯合子约为 100%,而 mtDNA 的异质性带来了独特的挑战。异质变异可以以任何等位基因比例存在,因为每个细胞包含众多线粒体基因组,它们之间可能存在差异。

标准的生物信息学变异检测工具常常会舍弃低 VAF 的变异,将其视为测序假象。然而,在 mtDNA 分析中,即使是低 VAF 的变异也具有重要意义,必须准确识别。因此,需要专门的工具(通常是从用于体细胞癌症突变检测的工具改编而来)来检测所有 VAF 水平的 mtDNA 变异,以确保全面的变异检测。

直到近年来,才开发出专门用于检测线粒体变异的程序,每个程序都有略微不同的特点,并针对识别线粒体基因组特有的变异类型进行了优化。

![[线粒体DNA分析工具.png]]

  • Mutect2:一种广泛使用的工具,特别适用于检测异质的 SNV 和 InDel 变异,最初是为检测体细胞变异(肿瘤)而设计的
  • Mity:该方法用于检测异质的 SNVs 和 InDels,对 WGS 数据非常敏感,能进行广泛的变异注释,并已在临床研究中得到验证。所需的输入是经过比对的数据文件(BAM),会对同聚物区域(m.302 - 319 和 m.3105 - 3109)进行过滤 。
  • MToolBox:此工具用于检测异质的 SNVs 和 InDels,并进行注释。适用于 WGS 和 WES 数据,包括 WES 的脱靶读数。输入可以是比对后的 BAM 文件,也可以是未比对的 FASTQ 文件 。
  • Mt - DNA server:mitoverse 套件中的一个基于云的应用程序,具有直观的界面,用于检测异质的 SNV 和 InDel。能够识别并标记低复杂度区域和已知的核线粒体 DNA 片段(NUMTs)。接受比对或未比对的 WES、WGS 或仅 mtDNA 数据作为输入 。
  • MitoScape:一种用于从 WGS 数据中检测异质 SNVs 和 InDels 的流程,主要为复杂疾病设计。它采用一种新的机器学习方法,实现极其准确的变异检测和去除所谓的 NUMTs。其性能优于 MToolBox 和 Mt - DNA 服务器,并且可以用于估计 mtDNA 拷贝数
  • MitoHPC:一种用于测量 WGS 数据中 mtDNA 拷贝数(以 mtDNA 覆盖度的比率表示)的流程。它还能检测和注释异质的 SNVs 和 InDels,进行额外的环化比对,并生成个体特异性的 mtDNA “参考” 序列,减少假阳性变异的识别。此外,它会标记同聚物、高变区域和 NUMTs 。
  • eKLIPse:旨在识别多个缺失的多个断点,并生成 Circos 图 。
  • MitoSAlt:该工具基于对有断点序列的分析,对缺失和重复进行量化。它包括第二个比对阶段,以识别映射和未映射数据中的断裂序列。特别适用于 WGS 数据。

利用专门的生物信息学工具,可以从 WES 和 WGS 数据中识别 mtDNA 变异,包括同质和异质变异。尽管传统的测序流程通常不会在输出中包含 mtDNA 变异,但通过将读数比对到线粒体基因组,仍然可以进行变异检测。像 Mutect2、Mity 和 MToolBox 等工具,针对检测 mtDNA 特有的变异(如 SNVs 和 InDels)进行了优化。MitoHPC 和 MitoScape 等先进工具还提供了额外的功能,如 mtDNA 拷贝数估计和去除由 NUMTs 导致的假阳性。这些工具支持在分析与人类疾病相关的线粒体变异时的临床和研究应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2331554.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

word表格间隔设置

1.怎么解决word表格间隔达不到我们想要的要求 其实很简单, 我们直接在word表格里面, 全选表格中里面的内容。接着,我们选择自动调整---->根据内容自动调整表格,即可达到我们想要的要求

SpringBoot 接口限流Lua脚本接合Redis 服务熔断 自定义注解 接口保护

介绍 Spring Boot 接口限流是防止接口被频繁请求而导致服务器负载过重或服务崩溃的一种策略。通过限流,我们可以控制单位时间内允许的请求次数,确保系统的稳定性。限流可以帮助防止恶意请求、保护系统资源,并优化 API 的可用性,避…

I/O进程4

day4 九、信号灯集 1.概念 信号灯(semaphore),也叫信号量。它是不同进程间或一个给定进程内部不同线程间同步的机制;System V的信号灯是一个或者多个信号灯的一个集合。其中的每一个都是单独的计数信号灯。 通过信号灯集实现共享内存的同步操作。 2.编程…

【语法】C++的list

目录 为什么会有list? 迭代器失效: list和vector的迭代器不同的地方: list的大部分用法和vector都很像,例如push_back,构造,析构,赋值重载这些就不再废话了,本篇主要讲的是和vecto…

【Ai/Agent】Windows11中安装CrewAI过程中的错误解决记录

CrewAi是什么,可以看之下之前写的 《初识CrewAI多智能代理团队协框架》 (注:这篇是基于linux系统下安装实践的) 基于以下记录解决问题后,可以再回到之前的文章继续进行CrewAI的安装 遇到问题 在windows系统中安装 CrewAi 不管是使用 pip 或者…

OSPF的数据报文格式【复习篇】

OSPF协议是跨层封装的协议(跨四层封装),直接将应用层的数据封装在网络层协议之后,IP协议包中协议号字段对应的数值为89 OSPF的头部信息: 所有的数据共有的信息字段 字段名描述版本当前OSPF进程使用的版本(…

【力扣刷题实战】Z字形变换

大家好,我是小卡皮巴拉 文章目录 目录 力扣题目:Z字形变换 题目描述 解题思路 问题理解 算法选择 具体思路 解题要点 完整代码(C) 兄弟们共勉 !!! 每篇前言 博客主页:小卡…

力扣题解:142. 环形链表 II

在链表学习中,我们已经了解了单链表和双链表,两者的最后一个结点都会指向NULL;今天我们介绍的循环列表则不同,其末尾结点指向的这是链表中的一个结点。 循环链表是一种特殊类型的链表,其尾节点的指针指向头节点&#…

latex模板文件

LaTeX 是一款广泛应用于学术领域的​​文档排版系统​​,尤其以其在数学公式、科学符号和复杂技术文档排版中的强大能力著称。虽然它本身并非专门的“数学软件”,但在处理数学相关内容时表现尤为出色。 1. LaTeX 的核心特点​ 数学公式支持​​&#xff…

BLE 协议栈事件驱动机制详解

在 BlueNRG-LP 等 BLE 系统中,事件驱动是控制状态转移、数据交互和外设协作的基础。本文将深入讲解 BLE 协议栈中事件的来源、分发流程、处理结构与实际工程实践策略,帮助你构建稳定、可维护的 BLE 系统。 📦 一、BLE 事件的来源分类 BLE 协议栈中的事件严格来自协议栈本身…

Rust 之四 运算符、标量、元组、数组、字符串、结构体、枚举

概述 Rust 的基本语法对于从事底层 C/C 开发的人来说多少有些难以理解,虽然官方有详细的文档来介绍,不过内容是相当的多,看起来也费劲。本文通过将每个知识点简化为 一个 DEMO 每种特性各用一句话描述的形式来简化学习过程,提高学…

fuse-python使用fuse来挂载fs

winfsp 安装winfsp,https://winfsp.dev/ fusepy python安装fusepy #!/usr/bin/env python3 import os import stat from fuse import FUSE, FuseOSError, Operationsclass Passthrough(Operations):def __init__(self, root):self.root root# 辅助函数:将挂载点…

基于ueditor编辑器的功能开发之增加自定义一键排版功能

用户有自己的文章格式,要求复制或者粘贴进来的文章能够一键排版,不需要手动调试 这个需求的话咱们就需要自己去注册一个事件啦,这里我没有修改源码,而是在编辑器初始化之后给他注册了一个事件 我的工具列表变量 vue组件中data中…

VS Code Markdown渲染配置

VS code markdown preview enhanced插件渲染配置 mac: commandshiftP命令输入Markdown Preview Enhanced: Customize CSS,并点击在打开的style.less配置文件添加一下配置 /* Please visit the URL below for more information: */ /* https://shd101wyy.github.…

数据结构篇:线性表的另一表达—链表之单链表(上篇)

目录 1.链表的引入 1.1 链表的概念 1.2 next的意义 2.链表的分类 3.单链表的实现 3.1 单链表实现接口 3.1.1 插入节点函数封装 3.1.2 尾插 3.1.3 头插 3.1.4 报错的根本问题 3.1.5 头删 3.1.6 尾删 4.小结 1.链表的引入 根据顺序表的一些缺陷…

SpringBoot企业级开发之【用户模块-获取用户详细信息】

接口文档的要求: 了解一下token令牌头是怎么用的 我们直接放到前端交互的controller类下,在声明的方法中加入参数为String token且加入注解RequestHeader(name"Authorization【你自己设定的token】") 设计思路: 实战开发: control…

Mockito如何对静态方法进行测试

在 Mockito 中,直接对静态方法进行模拟是困难的,因为 Mockito 的设计理念是优先通过依赖注入(DI)管理对象,而静态方法破坏了这种设计(难以解耦)。不过,从 Mockito 3.4.0 版本开始,通过 mockStatic 方法支持了对静态方法的模拟(需配合 mockito-inline 依赖)。 从 Mo…

Navicat 17 for Mac 数据库管理

Navicat 17 for Mac 数据库管理 一、介绍 Navicat Premium 17 for Mac是一款专业的数据库管理工具,适用于开发人员、数据库管理员和分析师等用户。它提供了强大的数据管理功能和丰富的工具,使用户能够轻松地管理和维护数据库,提高数据处理效…

grok 驱动级键盘按键记录器分析

grok是一个驱动模块,其主要功能就行进行键盘按键及剪切板数据的记录,也就是一个键盘记录器。实现原理是通过对shadow-ssdt的相关函数进行hook,和r3对GetUserMessage进行hook的原理差不多。 关键部分如下: 查找csrss.exe进程是否已经启动&…

MyBatis中特殊符号处理总结

前言 MyBatis 是一款流行的Java持久层框架&#xff0c;广泛应用于各种类型的项目中。因为我们在日常代码 MyBatis 动态拼接语句时&#xff0c;会经常使用到 大于(>,>)、小于(<,<)、不等于(<>、!)操作符号。由于此符号包含了尖括号&#xff0c;而 MyBatis 使用…