Archives

驯化VirSorter: 预测metagenome contigs的prophage

鉴定噬菌体的工具有Phage_Finder, Prophinder , PHASTPhiSpy,不过要讲的是 VirSorter。VirSorter适合不完整的基因组,单细胞基因组,宏基因组。

VirSorter 运行时间很长问题,主要问题是 HMMER的问题,HMMER支持多线程不理性,即使设置多线程,实际执行的时候基本都是单线程,导致运行时间比较长。

那解决这个问题的方式就是:将线程强制变成进程,根据hmmsearch的特点,将库文件拆分成指定ncpu份, 单独提交可以达到并行目的, 然后将拆分后的结果合并为输出文件即可。

为解决这个问题 Biostack,实现了 hmmsearch-virsorter 做为HMMSEARCH任务提交的中间件,替换掉VirSorter的提交方式,可以顺利进行真实的并行任务提交。

$ hmmsearch-virsorter


Program: hmmsearch-virsorter: HMM based annotation.
Version: 0.0.1
Contact: ZHANG LEI <zhanglei@logicinformatics.com>

Usage:   hmmsearch-virsorter [options] <sequence> <tblout> <output>

Options: -c INT    CPU number, default: [40]
         -d STR    database location, default: [/biostack/database/pfam/Pfam-A.hmm]

现在利用40线程,一个典型的细菌基因组基本3分钟就可以完成前噬菌体鉴定。

Comments are closed.