Archives

去除嵌合体: uchime_ref和uchime3_denovo

嵌合体从序列组成来说是指一条序列由两条或者更多条生物学序列连接而成(见下面示意图),扩增子测序实验中,主要由于PCR阶段不完全延伸形成,形成的嵌合体会在随后PCR过程被放大。具体解释可参考 chimera_formation。

嵌合体示意图:

下面讨论如何去除这些嵌合体,以及什么场景采用什么策略。

USEARCH系统去除嵌合体策略主要有:

使用嵌合体参考库 参考:uchime2_ref 从头去除嵌合体 参考:uchime3_denovo OTU构建集成: 参考: uparse 和 unoise3

请参考: UCHIME2 算法: UCHIME2: Improved chimera detection for amplicon sequences

1. 使用嵌合体参考库

命令行接口:

usearch -uchime_ref reads.fasta -db silva.udb -uchimeout out.txt -strand plus -threads 20 -mode balanced

主要参数解释:

-db: 参考库, 推荐SILVA; -strand: 目前只支持 plus,所以序列最好是调整好方向的; -uchimeout: 嵌合体输出文件; -threads: 线程数; -mode: 可以使用的模型,支持 high_confidence、specific、balanced、sensitive等几种模式。\ […]