Archives

Categories

BLASTparser : 转换BLAST -m5/ -m0 格式成Table格式

一、 准备工作:

1.1 系统平台:这里使用的是Ubuntu Linux 12.04 LTS 64bit 版本;

1.2 Windows版本: 如果你说只有Windows,安装个虚拟机嘛

推荐VirtualBox https://www.virtualbox.org/

网上有相当多的图文教程

比如:http://blog.csdn.net/tangyajun_168/article/details/7063448

1.3 BLAST 本地下载安装

wget ftp://ftp.ncbi.nih.gov/blast/executables/LATEST/ncbi-blast-2.2.28+-x64-linux.tar.gz

注意 blast 和 blast+ 在参数方面有很大的不同。而且blast 好像2.2.26 以后就没有更新,而blast+一直在更新,而且blast+可以自己定制(- outfmt 6 ,7, 10)输出格式。

这里测试都是使用blast+。

二、测试数据

2.1 参考序列:

使用The Consensus CDS (CCDS)数据库中的人类的氨基酸序列和核酸序列(20130430 版本),关于CCDS以后会在kbase 标签下介绍。

下载地址:ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/

2.2查询序列:

找一个比较小的测试集,选了人类的编码激酶的蛋白和核酸数据(kinome)。

http://kinase.com/kinbase/FastaFiles/Human_kinase_rna.fasta

http://kinase.com/kinbase/FastaFiles/Human_kinase_protein.fasta

三、执行BLAST

这里我把测试了BLASTp,BLASTn,BLASTx

因为自定义输出格式(仅限于table格式)大家用的不多,所以这里就给了几个示例。

3.1. Formatdb

../bin/ncbi-blast-2.2.28+/makeblastdb -in CCDS_protein.20130430.faa […]