Archives

Categories

OTU表过滤操作:otutable_filter

otutable_filter程序主要实现了对OTU表中的丰度信息进行过滤,比如过滤符合一定规则的OTU(比如丰度和小于设定阈值)。

命令行接口:

$ otutable_filter Usage: otutable_abundance [options] <otu-table> <cutoff:2> Options: -v print version number

程序接受两个参数, OTU表和设置阈值,支持未注释的OTU表和注释的OTU表。

实例

otutable_filter otutable_freq.txt 0.1

过滤掉特定OTU(所有的样本相对丰度和小于0.1)的OTU。

本文材料为 BASE (Biostack Applied bioinformatic SEies ) 课程 Linux Command Line Tools for Life Scientists 材料,版权归 上海逻捷信息科技有限公司 所有。

Last Upate: 2017/10/21 18:51

Div-seq lite 16S 数据分析流程使用教程

引言

微生物组研究的主要对象为特定环境中微生物群落的所有成员及其全部遗传与生理功能,传统的纯培养法经过百年来的发展和完善,从环境中分离和培养并鉴定菌株的研究工作已经接近极限,随着测序技术的发展,直接对环境样本中的保守的遗传标记片段比如:16S rRNA 基因进行扩增测序成为新的研究手段。 随着测序技术的发展以及测序成本的降低,越来越多的环境微生物多样性被研究,比如:人类肠道、温泉、土壤、火山口、南极冰川、深海、沼液、城市交通系统、生活用水等,对健康、农业、环境、海洋等重大系统问题产生深远影响。 人体微生物组计划(The Human Microbiome Project,HMP),对人体部位(胃肠道、口腔、鼻腔、女性生殖道以及皮肤)的微生物组进行广泛的研究,揭示出微生物组与人类健康状态息息相关,并推动了各国的微生物组计划和执行,美国更是将微生物组研究上升到了国家层面,提出了“国家微生物组计划”, 因此微生物研究也成为生物医学领域最火爆的前沿研究方向,未来精准医疗的重要组成部分。 为此,我们开发了div_seq 通用微生物组数据分析流程,快速有效的解析微生物的组成和功能,以便深入了解环境中微生物的群落结构及多样性和微生物的功能及代谢机理。

Div-seq-lite 介绍

Div-seq-lite 是完全基于 USEARCH(版本 10), USEARCH 版本10 新增了很多新的功能,包括了, 质量控制和双端序列合并 fastq_mergepairs, doi: 10.1093/bioinformatics/btv401、OTU表构建 UPARSE, Pubmed:23955772, dx.doi.org/10.1038/nmeth.2604 、 菌群组成分析 SINTAX 多样性指数分析 (alpha 和 beta)等。

流程包括了一下几个分析内容(模块):

1. 原始数据质量控制 trimming; 2. 双端序列合并 mergepairs; 3. OTU表构建 uparse 4. 鉴定代表序列的分类 sintax; 5. 物种组成多样及其可视化 taxonomy; 6. 样品多样性分析(alpha 多样性),获得稀释曲线 alpha; […]

MG-RAST:经典的Metagenome在线数据分析平台,完美解决物种组成和功能解析

标题:

The metagenomics RAST server – a public resource for the automatic phylogenetic and functional analysis of metagenomes

摘要:

Background Random community genomes (metagenomes) are now commonly used to study microbes in different environments. Over the past few years, the major challenge associated with metagenomics shifted from generating to analyzing sequences. High-throughput, low-cost next-generation sequencing […]

FASTQSim:高通量测序数据模拟应用,支持 illumina/ion/pacbio/roche平台

标题:

FASTQSim: platform-independent data characterization and in silico read generation for NGS datasets.

摘要:

BACKGROUND: High-throughput next generation sequencing technologies have enabled rapid characterization of clinical and environmental samples. Consequently, the largest bottleneck to actionable data has become sample processing and bioinformatics analysis, creating a need for accurate and rapid algorithms to process genetic data. […]

Biostack.ORG 开始社区建设

关注我们: Biostack.ORG , 专业的生物信息社区

社区建设中。

Illumina Announces Moleculo Long Read Technology and Phasing As Service

Illumina Announces Moleculo Long Read Technology and Phasing As Service

links: http://nextgenseek.com/2013/07/illumina-announces-moleculo-long-read-technology-and-phasing-as-service/

Illumina kept its promise of making Moleculo’s Long Read Technoogy as service in 2013. Illumina announced today that Illumina’s FastTrack Services will be offering Long-Read Sequencing Services and new Phasing Analysis. With the two new additional services, Illumina can provide whole-genome results within […]

Hello world!

Welcome to WordPress. This is your first post. Edit or delete it, then start blogging!