Archives

驯化VirSorter: 预测metagenome contigs的prophage

鉴定噬菌体的工具有Phage_Finder, Prophinder , PHAST,PhiSpy,不过要讲的是 VirSorter。VirSorter适合不完整的基因组,单细胞基因组,宏基因组。

VirSorter 运行时间很长问题,主要问题是 HMMER的问题,HMMER支持多线程不理性,即使设置多线程,实际执行的时候基本都是单线程,导致运行时间比较长。

那解决这个问题的方式就是:将线程强制变成进程,根据hmmsearch的特点,将库文件拆分成指定ncpu份, 单独提交可以达到并行目的, 然后将拆分后的结果合并为输出文件即可。

为解决这个问题 Biostack,实现了 hmmsearch-virsorter 做为HMMSEARCH任务提交的中间件,替换掉VirSorter的提交方式,可以顺利进行真实的并行任务提交。

$ hmmsearch-virsorter Program: hmmsearch-virsorter: HMM based annotation. Version: 0.0.1 Contact: ZHANG LEI <zhanglei@logicinformatics.com> Usage: hmmsearch-virsorter [options] <sequence> <tblout> <output> Options: -c INT CPU number, default: [40] -d STR database location, default: [/biostack/database/pfam/Pfam-A.hmm]

现在利用40线程,一个典型的细菌基因组基本3分钟就可以完成前噬菌体鉴定。