miRNA测序数据生信分析——第三讲，已知物种的生信分析实例

miRNA测序数据生信分析——第三讲，已知物种的生信分析实例

news2026/2/28 1:20:47

miRNA测序数据生信分析——第三讲，已知物种的生信分析实例

miRNA测序数据生信分析——第三讲，已知物种的生信分析实例
- 1. 下载测序数据
- 2. 原始数据质控——软件fastqc
- 3. 注释tRNA和rRNA，使用Rfam数据库——软件blast，Rfam_statistics.py脚本
- 4. 注释miRNA，包括种类，序列及定量，靶基因和绘图
- - 4.1 鉴定，使用miRBase数据库——软件blast
  - 4.2 定量和miRNA序列提取——脚本miRBase_sequence.py
  - 4.3 miRNA靶基因，使用miRTarBase和miRDB数据库
  - - 4.3.1 miRTarBase数据库——脚本miRTarBase_Target.py
    - 4.3.2 miRDB数据库——脚本miRDB_Target.py
    - 4.3.3 整合两个数据库——脚本Total_Target.py
  - 4.4 绘制miRNA-靶基因互作图——软件Cytoscape
- 5. 总结

miRNA测序数据生信分析——第三讲，已知物种的生信分析实例

1. 下载测序数据

SRA号：DRR463940 单端测序测序类型：miRNA-seq
点击FASTQ，下载即可。文件DRR463940.fastq
在这里插入图片描述

2. 原始数据质控——软件fastqc

cd /home/zhaohuiyao/miRNA_seq/DRR463940/00Rawdata
#质控
/home/zhaohuiyao/Biosoft/general/FastQC/fastqc ./DRR463940.fastq
#Read数目：311289；Read长度分布：8~136bp
#查看质控下的每一个模块，都是可以理解的，判断不修剪
/home/zhaohuiyao/Biosoft/seqkit fq2fa -w 0 ./DRR463940.fastq > ./DRR463940.fasta

3. 注释tRNA和rRNA，使用Rfam数据库——软件blast，Rfam_statistics.py脚本

这里需要的Rfam数据库数据是博文：miRNA测序数据生信分析——第二讲，数据库下载整理，中提到的1.2.2 用于注释ncRNA/sRNA测序中的tRNA和rRNA序列，整理的。
为什么要做这一步呢？
从第二步质控结果Read长度分布：8~136bp，判断虽然是miRNA测序，但是依旧有rRNA和tRNA混入。做这一步，可以看看混入占比。

cd /home/zhaohuiyao/miRNA_seq/DRR463940/01Rfam
#只保留一个比对结果
/home/zhaohuiyao/Biosoft/general/ncbi-blast-2.10.0+/bin/blastn -db /home/zhaohuiyao/Database/Rfam/Rfam -query …/00Rawdata/DRR463940.fasta -out DRR463940_Rfam.annotations -outfmt 6 -evalue 1e-5 -num_alignments 1 -num_threads 36
#统计
python ./Rfam_statistics.py -i ./DRR463940_Rfam.annotations -db1 /home/zhaohuiyao/Database/Rfam/family.txt -db2 /home/zhaohuiyao/Database/Rfam/Rfam.full_region -o ./
在这里插入图片描述
#注意1：这里Subclass为ncRNA指在Rfam数据库中定义了Class但没有定义Subclass的ncRNA。注意2：可以看中重点比对结果出现在tRNA和rRNA，而其他注释类型少。
#结果
#总比对结果数目：98127条（98127/311289=31.52%）
#tRNA比对结果数目：75446条（75446/311289=24.24%）
#rRNA比对结果数目：4709条（4709/311289=1.51%）

4. 注释miRNA，包括种类，序列及定量，靶基因和绘图

测序物种已知，人类Homo sapiens（hsa）。且该物种在后续使用的miRBase、miRDB、miRTarbase数据库中都存在。

4.1 鉴定，使用miRBase数据库——软件blast

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/
grep “Homo sapiens” /home/zhaohuiyao/Database/miRBase/organisms.txt
在这里插入图片描述
#提取miRBase数据库中物种hsa的所有miRNA序列，制作物种特异数据库。
grep -A 1 “hsa” /home/zhaohuiyao/Database/miRBase/mature.fa | grep -v “--” > /home/zhaohuiyao/Database/miRBase/hsa_mature.fa
grep -c “>” /home/zhaohuiyao/Database/miRBase/hsa_mature.fa #2656个miRNA
/home/zhaohuiyao/Biosoft/general/ncbi-blast-2.10.0+/bin/makeblastdb -in /home/zhaohuiyao/Database/miRBase/hsa_mature.fa -dbtype nucl -out /home/zhaohuiyao/Database/miRBase/hsa_mature
#只保留一个比对结果
cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/01miRBase
/home/zhaohuiyao/Biosoft/general/ncbi-blast-2.10.0+/bin/blastn -task blastn-short -db /home/zhaohuiyao/Database/miRBase/hsa_mature -query /home/zhaohuiyao/miRNA_seq/DRR463940/00Rawdata/DRR463940.fasta -out DRR463940_miRBase.annotations -outfmt 6 -evalue 1e-5 -num_alignments 1
#统计
wc -l ./DRR463940_miRBase.annotations #66776条比对结果（66776/311289=21.45%）
cut -f 2 ./DRR463940_miRBase.annotations | sort | uniq | wc -l #367种miRNA

4.2 定量和miRNA序列提取——脚本miRBase_sequence.py

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/02Sequence_Quantity
python ./miRBase_sequence.py -i …/01miRBase/DRR463940_miRBase.annotations -db /home/zhaohuiyao/Database/miRBase/hsa_mature.fa -o ./
在这里插入图片描述
#两个结果文件：
DRR463940_miRBase.annotations.fa和DRR463940_miRBase.annotations.readscount

4.3 miRNA靶基因，使用miRTarBase和miRDB数据库

#三个子目录miRTarBase/、miRDB/和Total/

4.3.1 miRTarBase数据库——脚本miRTarBase_Target.py

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/03Target/miRTarBase
#确保物种在miRTarBase数据库中
grep “hsa” /home/zhaohuiyao/Database/miRTarBase/miRTarBase.organism
在这里插入图片描述
python ./miRTarBase_Target.py -i …/…/02Sequence_Quantity/DRR463940_miRBase.annotations.readscount -db /home/zhaohuiyao/Database/miRTarBase/miRTarBase_MTI.txt -o ./
#结果文件DRR463940_miRBase.annotations.miRTarBase

4.3.2 miRDB数据库——脚本miRDB_Target.py

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/03Target/miRDB
#确保物种在miRDB数据库中
grep “hsa” /home/zhaohuiyao/Database/miRTarBase/miRDB.organism
在这里插入图片描述
python ./miRDB_Target.py -i …/…/02Sequence_Quantity/DRR463940_miRBase.annotations.readscount -db /home/zhaohuiyao/Database/miRDB/miRDB_v6.0_prediction_result.txt.hsa -o ./

#结果文件DRR463940_miRBase.annotations.miRDB

4.3.3 整合两个数据库——脚本Total_Target.py

#取两个数据库的并集，获得最终miRNA-Gene关系文件
cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/03Target/Total
python ./Total_Target.py -db1 …/miRTarBase/DRR463940_miRBase.annotations.miRTarBase -db2 …/miRDB/DRR463940_miRBase.annotations.miRDB -o ./
在这里插入图片描述
#结果文件DRR463940_miRBase.annotations.target

4.4 绘制miRNA-靶基因互作图——软件Cytoscape

因为这个互作关系很庞大，有351413条关系。因此绘制会比较难，我就单独提取了部分互作关系，进行绘图，在Windows下进行。绘图查看另一篇公众号文章：https://mp.weixin.qq.com/s/vbFAre601-9atwah9PMwUw查看

5. 总结

以上就是针对已知物种的miRNA分析。同时满足miRBase、miRTarBase和miRDB三个数据的物种，只有5种。因此针对未知的分析是重要的，而且在你时候的时候，可能会交叉使用。上面步骤中涉及了很多脚本，但都是很简单的文件内容提取比对。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1080182.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

MySQL数据库技术笔记(3)

MySQL数据库技术笔记(3)

概述学习MySQL数据库技术其实只需要安装mysql服务器就可以使用了。只不过对于初学者来说直接操作dos窗口方式比较麻烦，命令不熟悉，导致经常写错。在真实的开发当中直接操作dos窗口效率比较慢，企业中也会经常使用一些mysql数据库支持的可视化…

阅读更多...

【VR开发】【Unity】0-课程简介和概述

【VR开发】【Unity】0-课程简介和概述

【说明】这是我录制的一套VR基础开发课程的文字版本，更加便于快速参考。应大家在后台所提的需求，从今天开始，我计划带给大家一套完整达40课时的VR开发基础课程。在开始学习前需要注意如下几点： 本教程基于Unity2022.2.1f1版…

阅读更多...

【Python 零基础入门】基础语法

【Python 零基础入门】基础语法

【Python 零基础入门】第四课基础语法【Python 零基础入门】第四课基础语法怎么写 Python 代码缩进注释Python 标识符规则Python关键字代码行和块导包字符串操作字符串连接字符串的其他常用方法循环for 循环while 循环判断语句比较运算符逻辑运算符if 判断三元表达式brea…

阅读更多...

【已解决】ORA-01722: invalid number

【已解决】ORA-01722: invalid number

文章目录 ORA-01722: invalid number问题思路解决 ORA-01722: invalid number 问题 invalid number 字符与数值不匹配 oracle 截取 ‘1-2’ 只需要’-前面的思路一、问题提示执行Oracle的sql语句提示【ORA-01722: invalid number】无效数字错误。二、问题分析 2.1、类…

阅读更多...

共模电感在EMC电路里有哪些原理及作用？|深圳比创达EMC

共模电感在EMC电路里有哪些原理及作用？|深圳比创达EMC

共模电感在EMC电路里有哪些原理及作用？相信不少人是有疑问的，今天深圳市比创达电子科技有限公司就跟大家解答一下！ 一、共模电感在EMC电路里的作用 EMC电路设计中共模干扰问题居多，所以共模电感很常见。共模电感是可以抑制共模干…

阅读更多...

亚马逊“黑五网一”大促开启！如何抓住流量密码实现爆单？

亚马逊“黑五网一”大促开启！如何抓住流量密码实现爆单？

亚马逊“黑五网一”大促从起10月30日正式开始，对比往年活动周期增加至11天，作为海外电商年度盛宴，将覆盖Choice day年度盛典、双十一、黑色星期五三大营销节点，备受全民瞩目。去年，仅是美国消费者在“黑五”期间消费…

阅读更多...

golang使用energy开发GUI桌面程序，CEF，LCL

golang使用energy开发GUI桌面程序，CEF，LCL

1、概述仓库：https://github.com/energye/energy 文档：https://energy.yanghy.cn/ Energy 是 Go 基于 CEF(Chromium Embedded Framework) 开发的框架，内嵌 CEF 二进制使用 Go 和 Web 端技术 ( HTML CSS JavaScript ) 构建支持Windows, …

阅读更多...

配电室六氟化硫气体泄漏报警装置安装位置

配电室六氟化硫气体泄漏报警装置安装位置

六氟化硫气体泄漏报警装置安装位置产品的设计、检验、制造均遵循GB16808-2008《可燃气体报警控制器》和GB12358-2006《作业场所环境气体检测报警仪通用技术要求》严格设计。是经过高速CPU数据处理，通过LCD显示出探测器的浓度、状态并输出相应的控制信号。报警控制器…

阅读更多...

什么是 API 接口？给大家举例说明

什么是 API 接口？给大家举例说明

Api 接口也就是所谓的应用程序接口，api 接口的全称是 Application Program Interface，通过 API 接口可以实现计算机软件之间的相互通信，开发人员可以通过 API 接口程序开发应用程序，可以减少编写无用程序，减轻编程任务…

阅读更多...

KdMapper扩展实现之SOKNO S.R.L(speedfan.sys)

KdMapper扩展实现之SOKNO S.R.L(speedfan.sys)

1.背景 KdMapper是一个利用intel的驱动漏洞可以无痕的加载未经签名的驱动，本文是利用其它漏洞（参考《【转载】利用签名驱动漏洞加载未签名驱动》）做相应的修改以实现类似功能。需要大家对KdMapper的代码有一定了解。 2.驱动信息驱动名称spee…

阅读更多...

JavaScript算法43- 分类求和并作差（leetCode:100103easy）周赛

JavaScript算法43- 分类求和并作差（leetCode:100103easy）周赛

2894. 分类求和并作差一、题目给你两个正整数 n 和 m 。现定义两个整数 num1 和 num2 ，如下所示： num1：范围 [1, n] 内所有无法被 m 整除的整数之和。num2：范围 [1, n] 内所有能够被 m 整除的整数之和。返回整数 num1…

阅读更多...

Spring Cloud 微服务系列文章合集，一次性看个够！

Spring Cloud 微服务系列文章合集，一次性看个够！

微服务架构图为了方便大家可以直接下载编辑，这里用的ProcessOn画的架构图，可以直接克隆一个出来进行编辑，地址：https://www.processon.com/view/6523a1b37fde9c4bb35c7278 微服务系列文章合集，点击阅读 Spring Cl…

阅读更多...

CAD（计算机辅助设计）软件的开发框架

CAD（计算机辅助设计）软件的开发框架

CAD（计算机辅助设计）软件的开发通常使用特定的CAD开发框架和工具。这些框架提供了一组API（应用程序编程接口）和开发工具，使开发人员能够创建自定义插件、应用程序和功能。以下是一些常见的CAD开发框架和平台&#xff0…

阅读更多...

linux系统配置Samba实现与Windows系统的文件共享

linux系统配置Samba实现与Windows系统的文件共享

1.linux系统下载安装Samba sudo apt install samba 2.在linux文件系统中创建一个共享目录(通常在用户目录下面创建一个名为share的目录) mkdir share 3.修改samba配置文件 sudo vim /etc/samba/smb.conf 添加配置信息(path share路径,需要修改) ,保存修改 [Share]comm…

阅读更多...

MySQL-3（9000字详解）

MySQL-3（9000字详解）

一：索引索引是一种特殊的文件，包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引，并指定索引的类型，各类索引有各自的数据结构实现。 1.1索引的意义索引的意义：加快查找速度，但需要…

阅读更多...

什么是嵌入式Linux？

什么是嵌入式Linux？

什么是嵌入式Linux？ 对于很多电气、电信、通信专业的同学来说，对口专业就业方向主要有软、硬件两个方向。无论是对于学生还是就业而言，软硬件的开发学习，嵌入式物联网在近年来无疑是一个摆在面前的“香饽饽”。近年来国家社会愈…

阅读更多...

百花齐放：解锁大型语言模型的潜力 | 开源专题 No.32

百花齐放：解锁大型语言模型的潜力 | 开源专题 No.32

这一系列开源项目共同特点在于它们提供多模型支持、具备可定制性、开源可自由修改、并且提供多功能性，为用户提供了灵活、强大的AI聊天和模型访问工具，为AI交互和实验提供了广泛的选择和创新机会。 jtsang4/claude-to-chatgpt Stars: 2.3k License: MI…

阅读更多...

JavaScript和Java的区别是什么？

JavaScript和Java的区别是什么？

目录一、不同的公司开发的不同产品。二、使用的方向不同三、对象不同四、HTML文档中采用的标识不同五、语言类型不同六、在浏览器中所执行的方式不同七、代码格式不同八、所采取的变量是不同九、联编方式不一样十、对图文操作方式不一样很多初学者看到Jav…

阅读更多...

echarts折线图设置背景颜色

echarts折线图设置背景颜色

initChartsBox() {this.option {tooltip: {trigger: "axis",axisPointer: {// 方法一type: "shadow", // 默认为直线，可选为：line | shadowshadowStyle: {color: "rgba(41, 95, 204, 0.2)",},},borderColor: "rgba(…

阅读更多...

解决Mysql时区问题

解决Mysql时区问题

程序员的公众号：源1024，获取更多资料，无加密无套路！ 最近整理了一份大厂面试资料《史上最全大厂面试题》，Springboot、微服务、算法、数据结构、Zookeeper、Mybatis、Dubbo、linux、Kafka、Elasticsearch、数据库等等…

阅读更多...

推荐文章

最新文章