在Ubuntu上安装InterProScan(Ubuntu)
Related:BLAST2GO数据库本地化安装
基本介绍
Interproscan 组合了不同的蛋白质特征(protein signature)数据库,包括了 Pfam , PIR,SMART,Gene3D,TigrFam,SuperFamily,TMHMM,SignalPHMM,FPrintScan以及PatternScan等。通过InterPro,我们可以利用这些数据库更好的注释和了解蛋白质功能等详细信息,此外,我们也可以容易的和GO进行关联,极大的丰富蛋白质的GO功能注释。
基本步骤
安装Perlbrew
为了安装本地的IPRscan,需要安装好多Perl的包,在Ubuntu 12.04 上Perl 版本是 5.14.2,最新的是5.18.0,很多包不都这么支持了,比如 File::Basename, English,不过 perlbrew , 可以很方便的安装多个Perl版本,以及随意切换, 在Perl 5.18.0 环境下可以将IPRscan需要的包顺利安装完成。
设置perlbrew 安装路径:
export PERLBREW_ROOT=/home/biostack/tools/perl5
安装perlbrew
wget -O - http://install.perlbrew.pl | bash
bashrc 中添加:
#perlbrew
export PERLBREW_ROOT=/home/biostack/tools/perl5
source /home/biostack/tools/perl5/etc/bashrc
初始化
perlbrew init
选择镜像
perlbrew mirror
查看可以安装的perl 版本
perlbrew available
安装perl-5.18.0
perlbrew install perl-5.18.0 --thread --multi --64int --64all
安装cpanm的模块管理工具,只安装在当前的Perl版本下。
perlbrew install-cpanm
安装IPRscan需要的各种包
安装包之前需要安装两个库,(分别是XML parsing C library和Berkeley Database Libraries)
sudo apt-get install libexpat1-dev
sudo apt-get install libdb++-dev libdb-dev
使用cpanm 安装需要的InterProScan需要的包:
cpanm XML::Quote XML::Parser URI::Escape Sys::Hostname Mail::Send IO::String IO::Scalar FileHandle File::Spec::Functions File::Path File::Copy File::Basename English DB_File CGI
只在当前shell下使用perl-5.18.0
perlbrew use perl-5.18.0
如果想一直使用perl-5.18.0,执行
perlbrew switch perl-5.18.0
下载IPRscan所需要的数据
- ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/DATA/iprscan_DATA_43.0.tar.gz
- ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/DATA/iprscan_MATCH_DATA_43.1.tar.gz
- ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/DATA/latest_pthr.tar.gz
- ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/BIN/4.x/iprscan_bin4.x_Linux64.tar.gz
- ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/RELEASE/4.8/iprscan_v4.8.tar.gz
解压安装:
gunzip -c iprscan_DATA_43.0.tar.gz | tar -xvf -
gunzip -c latest_pthr.tar.gz | tar -xvf -
gunzip -c iprscan_MATCH_DATA_43.1.tar.gz | tar -xvf -
gunzip -c iprscan_bin4.x_Linux64.tar.gz | tar -xvf –
安装InterProScan
这里只需要
perl ./Config.pl
按照提示设置一些选项就可以,这里所有的蛋白质特征(protein signature)数据库可以全部选择,因为后面我们可以根据需要在appl 中设置数据库。
iprscan -cli -i orf_trans_example.fasta -o iprscan.xml -appl hmmpfam -appl hmmtigr -appl hmmsmart -appl gene3d -appl signalp -appl tmhmm -appl coils -appl patternscan -appl profilescan -
seqtype p -format xml -goterms -iprlookup
需要解决两个问题
安装完毕后,会发现:ParseBlastXmlReport 和 pfscan 缺失两个两个动态连接库libexpat.so.0 和 libg2c.so.0
libexpat.so.0问题解决方案:
cd /lib/x86_64-linux-gnu
sudo ln -s libexpat.so.1 libexpat.so.0
libg2c.so.0问题解决方案:
nano /etc/apt/sources.list
deb http://hu.archive.ubuntu.com/ubuntu/ hardy universe
deb-src http://hu.archive.ubuntu.com/ubuntu/ hardy universe
deb http://hu.archive.ubuntu.com/ubuntu/ hardy-updates universe
deb-src http://hu.archive.ubuntu.com/ubuntu/ hardy-updates universe
sudo apt-get update
sudo apt-get install g77
这样本地化的InterProScan 基本安装完毕。
参考
- http://perlbrew.pl/Perlbrew-%E4%B8%AD%E6%96%87%E7%B0%A1%E4%BB%8B.html
- ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/4/Installing_InterProScan.txt