Archives

Categories

NGS数据分析中的质量控制工具

NGS数据分析中的质量控制工具,老规矩,先占坑!

基本介绍 NGS QC-Chain (Zhou et al. 2013)1 http://www.computationalbioenergy.org/qc-chain.html RNA-SeQC (DeLuca et al. 2012)2 https://confluence.broadinstitute.org/display/CGATools/RNA-SeQC HTQC (Yang et al. 2013)3 http://sourceforge.net/projects/htqc/ Trimmomatic (Lohse et al. 2012)4 http://www.usadellab.org/cms/?page=trimmomatic NGS QC Toolkit (Patel and Jain 2012)5 http://www.nipgr.res.in/ngsqctoolkit.html FastUniq (Xu et al. 2012)6 http://sourceforge.net/projects/fastuniq/ RseQC (Wang et al. 2012)7 http://code.google.com/p/rseqc/ CHANCE (Diaz et al. 2012)8 https://github.com/songlab/chance htSeqTools (Planet […]

K-mer在生物信息学中的应用及其工具列表

先在这里开个头,后面不断对这个Topic 进行更新。

基本介绍

K-mer 在生物信息学中有着广泛的应用,比如基因组拼装,评估基因组测序覆盖度,测序数据的纠错,多序列比对,重复序列检测。但是计算K-mer 比较耗费内存,因此好的数据结构有利于降低内存的使用,比如Khmer,采用概率型数据结构(Bloom_filter, http://en.wikipedia.org/wiki/Bloom_filter),Jellyfish 采用了并行无锁哈希表(lock-free hash table)数据结构,为了降低内存使用,有时候可能需要在时间,内存,磁盘空间使用上进行折中。 下面列出了现在比较常用的K-mer计算的工具以及一些应用实例。

工具 DSK (Rizk et al. 2013)1 http://minia.genouest.org/dsk/ Musket (Liu et al. 2013)2 http://musket.sourceforge.net/homepage.htm#latest Khmer (McDonald and Brown 2013)3 http://khmer.readthedocs.org/en/latest/ BFCounter (Melsted and Pritchard 2011)4 http://pritch.bsd.uchicago.edu/bfcounter.html Simrank (DeSantis et al. 2011)5 http://search.cpan.org/~shuriko/String-Simrank-0.079/lib/String/Simrank.pm Kmer (Walenz and Florea 2011)6 http://sourceforge.net/apps/mediawiki/kmer/index.php?title=Main_Page Jellyfish (Marcais and Kingsford 2011)7 http://www.cbcb.umd.edu/software/jellyfish/ Tallymer […]

Windows上安装Centos 6.4的操作流程

这次编辑使用了Markdown效果还是很不错的,真体会到了生产力很重 ,你做生物信息还在折腾Windows吗?

很多人想学习生物信息学,而学习生物信息学的最佳环境应该是Linux(这里推荐Ubuntu/Centos),但是自己电脑上又是安装的Windows , 这个时候最好的解决办法是安装虚拟机(当然推荐开源的VirtualBox),这里简单写了点Windows上安装Centos的操作流程,完全按照自己操作步骤写的。

一、下载软件 Virtualbox

版本4.2.16 下载地址:http://download.virtualbox.org/virtualbox/4.2.16/VirtualBox-4.2.16-86992-Win.exe

Centos

下载选用了:CentOS-6.4-x86_64-LiveCD.iso 下载地址:http://centos.arcticnetwork.ca/6.4/isos/x86_64/CentOS-6.4-x86_64-LiveCD.iso

二、安装 安装VirtualBox

这个就不多说了,拼命下一步就可以了。注意一定要安装增强工具。

安装Centos 6.4

这里就直接参考 “VirtualBox 安装 CentOs 6.3图文详细教程”(http://blog.phpcxz.com/2012/09/virtualbox_centos.html)的步骤,很容易就安装上了。

注意事项:

设置选项里有高级:一定要设置共享剪切板啊,后面会带来很大方便。 中间需要设置root 密码和 用户帐号(这里设置成biostack)和密码 安装完毕后记得那个虚拟光盘卸载掉。

最后安装完大概2.47G大小。

三、安装虚拟增强工具

如果不安装安装虚拟增强工具 a. 文件共享不能实现, b. 显示会有问题。 安装这个有点小麻烦,需要root 用户 Kernel-devel 和 gcc 参考“virtualbox centos安装增强工具和Centos与VirtualBox共享文件夹设置(http://linmaogan.blog.163.com/blog/static/38263937201233021623493/)”也很容易搞定。

具体操作:

$su (输入root 的密码) #yum install kernel-devel gcc #ln -s /usr/src/kernels/2.6.32-358.14.1.el6.x86_64 /usr/src/linux 安装VirtualBox […]