RepeatModeler 2.0.7 安装与使用--生信工具75
1. 简介RepeatModeler 是一套从头de novo鉴定转座子TE家族并构建共有序列的软件包。它整合了多个互补的重复序列预测工具自动完成重复序列识别、聚类、去冗余、精修与分类最终生成可直接用于 RepeatMasker 注释、甚至可提交至 Dfam 数据库的高质量 TE 文库。https://github.com/Dfam-consortium/RepeatModeler #官网核心组件RECONRepeatScoutLtrHarvest / LTR_retrieverLTR 结构预测源码发布版本可在 GitHub Release 或官网下载http://www.repeatmasker.org2. 安装方式RepeatModeler 支持两种安装方式源码编译安装传统服务器Dfam-TETools 容器Docker/Singularity一键环境2.1 依赖必须提前装好必选依赖Perl≥5.8.8RepeatMasker 库文件推荐 4.1.9RECON 1.08patched 版本支持 64 位RepeatScout 1.0.7TRFTandem Repeat Finder≥4.0.9RMBlast≥2.14.1RepeatMasker 专用 blastRepeatAfterMe≥0.0.6共有序列精修UCSC 工具twoBitToFa、faToTwoBit、twoBitInfoLTRStruct 可选依赖强烈建议开启GenomeTools / LtrHarvest1.5.9编译加threadsyesLTR_retriever2.9.0新版不兼容MAFFT≥7.505CD-HIT≥4.8.1Ninja0.98-cluster_only2.2 源码安装步骤下载源码GitHubhttps://github.com/Dfam-consortium/RepeatModeler官网http://www.repeatmasker.org/RepeatModeler解压tar -zxvf RepeatModeler-xxx.tar.gz配置perl ./configure按提示依次指定RepeatMaskerRECONRepeatScoutTRFRMBlastLTR 相关工具如启用 LTRStruct也可直接带参数配置perl ./configure -rscout_dir ... -recon_dir ...3. 使用构建数据库必须先做BuildDatabase -name elephant elephant.fa运行 RepeatModeler推荐加 LTRStructnohup RepeatModeler -database elephant \ -threads 20 \ -LTRStruct \ run.out 要点建议32G 内存、多核 CPU大型基因组可能运行1–3 天使用nohup或screen避免断连日志非常重要用于断点续跑与 debug4. 结果文件说明运行成功后会生成三个关键文件elephant-families.fa # 最终TE共有序列文库可直接给RepeatMasker用 elephant-families.stk # 种子比对文件可提交Dfam elephant-rmod.log # 运行日志临时目录用于断点续跑RM_PID.日期/ ├── round-1/ ├── round-2/ ├── round-3/ ├── consensi.fa ├── families.stk └── index.html可浏览器查看模型断点续跑崩溃后必备如果任务中断无需重新开始RepeatModeler -recoverDir RM_xxx.xxx ...使用文库进行 RepeatMasker 注释RepeatMasker -lib elephant-families.fa genome.fa重要注意事项避坑指南RMBlast 会上报使用统计内网 / 无外网机器必须关闭export BLAST_USAGE_REPORTfalse只适用于基因组组装不适用于 reads软件会自动检查 N50短序列无法运行。必须单节点多线程不支持分布式不要分批跑再粗暴合并结果会造成大量冗余影响注释质量。如需加大样本量使用-genomeSampleSizeMax。运行速度参考RepeatModeler 2.0.7 48 线程物种基因组大小运行时间模型数量果蝇164 Mbp3h41m492人类3.1 Gbp21h26m810
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2418366.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!