易基因|DNA甲基化研究的测序数据挖掘思路:干货分享

news2025/7/19 4:21:06

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

总体来说,DNA甲基化一般遵循三个步骤进行数据挖掘。

首先,进行整体全基因组甲基化变化的分析,包括平均甲基化水平变化、甲基化水平分布变化、降维分析、聚类分析、相关性分析等。

其次,进行甲基化差异水平分析,筛选具体差异基因,包括DMC/DMR/DMG鉴定、DMC/DMR在基因组元件上的分布、DMC/DMR的TF结合分析、时序甲基化数据的分析策略、DMG的功能分析等。

最后,将甲基化组学&转录组学关联分析,包括Meta genes整体关联、DMG-DEG对应关联、网络关联等。

一、甲基化图谱分析

(1)平均甲基化水平的比较

平均甲基化水平能反应样本整体的甲基化水平。

但是平均水平差异不大并不能说明样本间甲基化图谱没有差异。

胚胎发育

果实成熟

肌肉发育

(2)CG/CHG/CHH甲基化水平分布

不同物种中,甲基化修饰可能倾向于发生在不同类型的C位点上,该分析有助于反应甲基化发生位点类型的偏好性。

甲基化水平分布的组间比较,能够更进一步了解组间甲基化水平的变化。

不同基因组元件(CGI相关元件、重复序列元件、基因元件等)的甲基化水平分布规律不同。特别是在不同物种中,基因元件的甲基化水平可能有一定的特点。

比较特定元件甲基化水平的组间差异也能发现潜在的功能差异。

单样本三类甲基化水平分布

组间CpG甲基化水平分布比较

CGI相关元件

各类重复序列元件

基因元件

(3)降维分析

降维分析尝试找到最能反映数据点真实分布情况的两个维度,以方便对数据进行直观把握。一般采用共同覆盖的5×以上位点进行分析:

  • 主成分分析(PCA)

  • 非度量多维标度法(NMDS)

  • 主坐标分析(PCoA)

PCA

可采用统计检验分析组间差异的显著性:

  • 相似性分析(ANOSIM)

  • 置换多元方差分析(ADONIS)

NMDS

PCoA

(4)聚类分析

聚类分析考虑的是各样本之间的距离,即不相似性。一般采用共同覆盖的5×以上位点进行分析。

与降维分析的差别在于,聚类分析更真实地反映样本的差距,而非仅考虑两个代表性维度。

(5)相关性分析

相关性分析考虑的是各样本之间的相似性。一般采用共同覆盖的5×以上位点进行分析。

一般采用皮尔森相关系数

二、差异甲基化位点/区域分析DMC/DMR分析)

(1)DMC/DMR鉴定

差异甲基化位点:DMC

差异甲基化区域:DMR

(甲基化位点一般是与附近的位点一起起作用的)

鉴定实验组与对照组甲基化图谱的具体差异。

如果实验设计包括多个时间节点,也可以比较相邻时间节点/感兴趣的时间节点之间的甲基化图谱的差异。

DMC在基因组上的分布

DMR在基因组上的分布

(2)DMC/DMR转录因子结合分析(TF binding motif )

主要关注Promoter和Enhancer等调控区域DMC/DMR的TF结合位点。

(3)时序甲基化数据的分析策略(Time Course)

比较相邻时间点的差异

直接筛选时间阶段相关的DMC和DMR

线性模型/混合线性模型

(可以排除混杂因素干扰,如性别)

共甲基化模式分析(阶段特异性Cluster筛选)

WGCNA(权重基因共表达网络分析)

MEGENA(多尺度嵌入式基因共表达网络分析)

mfuzz

... ...

(4)DMC/DMR在基因元件上的分布

TE(转座元件):影响基因组稳定性

Promoter:影响基因表达

Genebody

(5)差异甲基化基因集(DMGs)的功能分析

分析策略:

可以分为Hyper-DMG和Hypo-DMG

可以分为Promoter-DMG和Genebody-DMG

  • Gene Ontology

  • KEGG pathway

  • Reactome pathway

  • DisGeNET disease

  • Disease Ontology

三、组学关联分析:甲基化组学&转录组学

(1)Meta genes整体关联

同一样本/组别内,所有基因的表达水平与对应基因的甲基化水平进行关联。

研究的是基因甲基化与表达的整体关系。

  • TSS位点附近负相关

  • Genebody区正相关

整体负相关

(2)DMG-DEG对应关联

重叠分析:

特点:简单粗暴,也适用于样本量少的情况。

分析结果:韦恩图。

皮尔森/斯皮尔曼相关性分析

特点:准确计算相关性程度(R值),及其显著性(p值)。

分析结果:散点图(+拟合线);相关性热图

(3)网络关联

基于基因表达具有功能和通路的富集性。有最低样本数量要求。

共表达-共甲基化网络关联:

  • WGCNA module correlation

  • EMDN algorithm

融合网络关联:

  • SNF algorithm

以上就是关于DNA甲基化测序的数据挖掘思路分享,易基因科技提供全面的DNA甲基化研究整体解决方案,技术详情了解请致电易基因。

相关阅读:

14种全基因组DNA甲基化测序(WGBS)标准分析比对软件的比较 | 生信专区

DNA甲基化方法全解析:方法发展、技术应用、优缺点

2022最新:8种常用DNA甲基化测序技术,你知道几个?

一文读懂:十大DNA甲基化研究核心问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/369055.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Wsl2 ubuntu 配置git 阿里云codeup

目录 创建一个跟你windows git使用相同的用户名,特别重要 配置git 用户名和邮箱 配置阿里云codeup 拉取仓库提示文件权限问题 给用户目录权限 配置项目文件别名 key_load_public: invalid format 怎么办? WSL ubuntu sshd: no hostkeys available -- exiting…

初始C++

写在前面 这是我第一次接触到C,之前对它的大名可谓是如雷贯耳.这两天有人问我学习C的感觉怎么样?对此我想说,很难.C的细节很多,要求我们比学习C语言更加细心,我不是没有学习过OOP语言,但是刚开始接触到还是感觉有点吃力,不过这是一种很令人高兴的情况,这代表你在进步,要是我们…

QT MySQL 连接出错报 QSqlDatabase: QMYSQL driver not loaded

QT连接MySQL失败(本人QT版本:5.12.5)一、报错结果QSqlDatabase: QMYSQL driver not loadedQSqlDatabase: available drivers: QSQLITE QODBC QODBC3 QPSQL QPSQL7二、报错原因缺少MySQL驱动(qsqlmysql.dll,qsqlmysql.d…

Salesforce大揭秘!SaaS鼻祖不为人知的那些事!

Salesforce的世界无疑是广阔的。自从创始人Marc Benioff于1999年创立公司以来,Salesforce一直在打破CRM领域的界限,改变销售、营销和技术的格局。 作为全球领先的B2B科技公司之一,Salesforce和硅谷里的其他企业一样,缔造着一个关…

Python入门之最基础

Python入门之最基础 IDLE有两种模式,一种是交互模式,通俗讲就是写一个代码,会得到相应的反馈,另一种为编辑模式. 注意事项: 标点符号一定要用英文符号 要注意缩进 dir(builtins)可以看到python所有的内置函数&#…

P6软件核心CPM关键路径

卷首语 由于单代号网络图能体现更丰富的活动逻辑关系,目前关键路径法的应用更倾向于使用单代号网络图。 关键路径法 关键路径法,又称关键路径分析,是网络计划技术的一种,通过其蕴含的算法安排项目活动的开展。关键路径法将项目…

Java Object的hashCode方法及其重写应用

本文参考: Object中的hashCode()终于搞懂了!!!_马走日mazouri的博客-CSDN博客_object hashcode Java加密:常见哈希算法总结_m.j.y.的博客-CSDN博客 Java Object类中的hashCode方法_qq_18974899的博客-CSDN博客_object类…

Java行转列通用工具类适用于各种查询情况

1、说明 有时候工作中需要动态生成列,也就是不确定的列,那么在数据库层就不是那么好操作了,可以使用java工具类来实现。 本工具类是对市面上的工具类进行加工改造,可以通用于各种情况,更加灵活,下面我来演…

GitHub

什么是 Github?GitHub是一个面向开源及私有软件项目的托管平台,因为只支持Git作为唯一的版本库格式进行托管,故名GitHub。一、常用词Watch:观察。如果watch了一个项目,之后这个项目有更新,你会在第一时间收到该项目更…

pytorch1.2.0+python3.6

一、说明 pytorch1.2.0python3.6CUDA10.0cudnn7.4.1.5 二、步骤 在conda中创建一个新的虚拟环境 查看一下自己的所有环境 激活虚拟环境 conda activate torch1.2.0 关于cuda和cudnn 1、查看自己电脑系统是10.2版本 http://链接:https://pan.baidu.com/s/1v5cN6…

Vivado_FIR滤波器输出位宽计算方法

计算方法 全精度输出宽度可以定义为输入数据宽度加上由滤波器系数导致的位增长数。 最坏情况下的位增长等于系数宽度加上所需非零乘法次数的以2为底的对数并四舍五入后的值。然而,这没有考虑实际系数值。计算公式如下。 BCWceil⁡[log⁡2N]BC_{W}\operatorname{cei…

滑台模组的应用有哪些?

在自动化生产中,我们常常会看到滑台模组的身影,那么,滑台模组究竟在自动化生产设备中起着怎样的作用呢? 简单点说,滑台模组由滑块、滚珠丝杆、导轨、主体等其它传动零件组成的自动化晋级单元,经过各单元的组…

储物流行业解决方案

行业分析 第三方物流仓储物流的日常管理控制活动主要包括进,出,存三个方面。在没有实现计算机化管理的商业企业中,大量的业务操作和管理活动由人工来完成。在管理层中,由于大量必要的信息不能及时被采集﹑加工和整理使用,造成了极…

想成为一名专业黑客,但不知道从哪里学起?我来教你。

成为一名黑客需要学什么? 想成为一名专业黑客,但不知道从哪里学起”很多人在后台问过这个问题,今天就为你介绍成为专业黑客必须学习的十个方面的知识,希望能为迷惘中的你指明方向。 想要成为网络hacker黑客?先来学习…

未来土地利用模拟FLUS模型

未来土地利用模拟(FutureLand-Use Simulation, FLUS)模型1 模型简介1.1 基于ANN 的适宜性概率计算1.2 基于自适应惯性机制的元胞自动机1.3 模拟精度评价参考流域 径流变化是 自然因素和 人为因素共同作用的结果,其中人为因素最为直接的方式就…

SpringMVC框架知识详解(入门版)

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

【mysql 5.7】基础入门(一)

文章目录1.常用命令2.SQL语句3导入数据4.DQL4.1 查询一个字段4.2 查询多个字段4.3 查询所有字段4.4 列起别名4.5 列参与数学运算4.6 条件查询4.7 排序4.8 多个字段排序5.函数5.1 单行处理函数5.2 分组函数6.分组查询1.常用命令 退出mysql exit;查看有哪…

Redis 集群搭建

前缀参考文章1:Centos7 安装并启动 Redis-6.2.6 前缀参考文章2:Redis 主从复制-服务器搭建【薪火相传/哨兵模式】 管道符查看所有redis进程:ps -ef|grep redis 杀死所有redis进程:killall redis-server 1. 首先修改 redis.conf 配…

Jmeter(GUI模式)详细教程

Jmeter(GUI模式)详细教程 目录:导读 一、安装Jmeter 二、Jmeter工作原理 三、Jmeter操作步骤 Jmeter界面 1、测试计划 2、线程组 3、HTTP请求 4、监听器 四、压力测试 写在最后 前些天,领导让我做接口的压力测试。What…

cocos2dx+lua学习笔记:UIScrollView的使用

前言 本篇在讲什么 本篇简单介绍Lua篇cocos2dx中UIScrollView的相关内容 仅介绍简单的应用,仅供参考 本篇适合什么 适合初学Cocos2dX的小白 适合想要在Cocos2dx-lua中使用UIScrollView的人 本篇需要什么 对Lua语法有简单认知 对Cocos2dx-Lua有简单认知 Co…