Archives

在Ubuntu上安装InterProScan(Ubuntu)

在Ubuntu上安装InterProScan(Ubuntu)

Related:BLAST2GO数据库本地化安装

基本介绍

Interproscan 组合了不同的蛋白质特征(protein signature)数据库,包括了 Pfam , PIR,SMART,Gene3D,TigrFam,SuperFamily,TMHMM,SignalPHMM,FPrintScan以及PatternScan等。通过InterPro,我们可以利用这些数据库更好的注释和了解蛋白质功能等详细信息,此外,我们也可以容易的和GO进行关联,极大的丰富蛋白质的GO功能注释。

基本步骤

安装Perlbrew

为了安装本地的IPRscan,需要安装好多Perl的包,在Ubuntu 12.04 上Perl 版本是 5.14.2,最新的是5.18.0,很多包不都这么支持了,比如 File::Basename, English,不过 perlbrew , 可以很方便的安装多个Perl版本,以及随意切换, 在Perl 5.18.0 环境下可以将IPRscan需要的包顺利安装完成。

设置perlbrew 安装路径:

export PERLBREW_ROOT=/home/biostack/tools/perl5

安装perlbrew

wget -O - http://install.perlbrew.pl | bash

bashrc 中添加:

#perlbrew
export PERLBREW_ROOT=/home/biostack/tools/perl5
source /home/biostack/tools/perl5/etc/bashrc

初始化

perlbrew init

选择镜像

perlbrew mirror

查看可以安装的perl 版本

perlbrew available

安装perl-5.18.0

perlbrew install perl-5.18.0 --thread --multi --64int --64all

安装cpanm的模块管理工具,只安装在当前的Perl版本下。

perlbrew install-cpanm

安装IPRscan需要的各种包

安装包之前需要安装两个库,(分别是XML parsing C library和Berkeley Database Libraries)

sudo apt-get install  libexpat1-dev
sudo apt-get install  libdb++-dev   libdb-dev

使用cpanm 安装需要的InterProScan需要的包:

cpanm  XML::Quote  XML::Parser  URI::Escape  Sys::Hostname   Mail::Send  IO::String  IO::Scalar   FileHandle  File::Spec::Functions File::Path  File::Copy  File::Basename  English  DB_File  CGI

只在当前shell下使用perl-5.18.0

perlbrew  use perl-5.18.0

如果想一直使用perl-5.18.0,执行

perlbrew  switch perl-5.18.0

下载IPRscan所需要的数据

  1. ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/DATA/iprscan_DATA_43.0.tar.gz
  2. ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/DATA/iprscan_MATCH_DATA_43.1.tar.gz
  3. ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/DATA/latest_pthr.tar.gz
  4. ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/BIN/4.x/iprscan_bin4.x_Linux64.tar.gz
  5. ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/4/RELEASE/4.8/iprscan_v4.8.tar.gz

解压安装:

gunzip -c  iprscan_DATA_43.0.tar.gz  | tar  -xvf  -
gunzip -c latest_pthr.tar.gz  | tar -xvf  -
gunzip -c iprscan_MATCH_DATA_43.1.tar.gz   | tar -xvf -
gunzip -c iprscan_bin4.x_Linux64.tar.gz | tar -xvf –

安装InterProScan

这里只需要

perl ./Config.pl

按照提示设置一些选项就可以,这里所有的蛋白质特征(protein signature)数据库可以全部选择,因为后面我们可以根据需要在appl 中设置数据库。

iprscan -cli -i  orf_trans_example.fasta -o  iprscan.xml -appl  hmmpfam -appl hmmtigr -appl hmmsmart -appl gene3d -appl signalp -appl tmhmm -appl coils -appl patternscan -appl profilescan -
seqtype p  -format xml -goterms -iprlookup

需要解决两个问题

安装完毕后,会发现:ParseBlastXmlReport 和 pfscan 缺失两个两个动态连接库libexpat.so.0 和 libg2c.so.0

libexpat.so.0问题解决方案:

cd  /lib/x86_64-linux-gnu
sudo ln -s  libexpat.so.1   libexpat.so.0

libg2c.so.0问题解决方案:

nano /etc/apt/sources.list
deb http://hu.archive.ubuntu.com/ubuntu/ hardy universe
deb-src http://hu.archive.ubuntu.com/ubuntu/ hardy universe
deb http://hu.archive.ubuntu.com/ubuntu/ hardy-updates universe
deb-src http://hu.archive.ubuntu.com/ubuntu/ hardy-updates universe
sudo apt-get update
sudo apt-get install g77

这样本地化的InterProScan 基本安装完毕。

参考

  1. http://perlbrew.pl/Perlbrew-%E4%B8%AD%E6%96%87%E7%B0%A1%E4%BB%8B.html
  2. ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/4/Installing_InterProScan.txt

Comments are closed.