Archives

扩增子数据分析之多样性指数: alpha多样性

多样性指数(Diversity index)和计算公式可以见: wikipedia

Alpha多样性(Alpha Diversity)是对某个样品中物种多样性的分析,包含样品中的物种类别的多样性——丰富度(Richness)和物种组成多少的整体分布——均匀度(Evenness)两个因素,通常用Richness,Chao1,Shannon,Simpson,Dominance和Equitability等指数来评估样本的物种多样性。

丰富度指数

Richness, Chao1,Shannon三个指数是常用的评估丰富度的指标,数值越高表明样品包含的物种丰富度就越高。

Richness指数: 指样本中被检测到的OTU量;
Chao1指数   : 通过低丰度OTUs来进一步预测样品中的OTUs数量;
Shannon指数 : 计算考虑到样品中的OTUs及其相对丰度信息,
             通过对数(如以2为底的shannon_2,以自然对数为底的shannon_e
             以10为底的shannon_10)转换来预测样品中的分类多样性。

均匀度指数

Simpson,Dominance和Equitability三个指数是常用的评估均匀度的指标。

Simpson指数     : 表示随机选取两条序列属于同一个分类(如OTUs)的概率(故数值在0~1之间),
                  数值越接近1表示表明OTUs的丰度分部越不均匀;
Dominancez指数  : 取值为1-Simpson,表示随机选取两条序列属于不同分类(如OTUs)的概率;
Equitability指数: 根据Shannon指数值计算,当其值为1时表明样品中的物种丰度分布绝对均匀,
                  而其值越小这表明物种丰度分布呈现出越高的偏向。

汇总表:

指数 单位 计算方式
richness OTUs 样本中至少包含一条序列的OTU数目
chao1 OTUs N + S^2 / (2D^2),其中N为OTU个数, S为丰度为1的OTUs个数,D为丰度为2的OTUs数目;
shannon_2 bits sum(f), 对所有OTU频率计算p*log(p,2)和, p为OTU的频率;
shannon_e nats sum(f), 对所有OTU频率计算p*log(p,e)和, p为OTU的频率;
shannon_10 dits sum(f), 对所有OTU频率计算p*log(p,10)和, p为OTU的频率;
simpson Probability sum(f^2), f为所有OTU频率的和
dominance Probability 1-simpson
equitability shannon/log(N), N为OTU数(logs to base 2)

实例:

USEARCH alpha_div

USEARCH 提供了alpha_div函数进行计算各种指数, 可通·-metrics 指定需要计算指数,支持的指数有: berger_parker、buzas_gibson、chao1、dominance、equitability、jost、jost1、reads、richness、robbins、simpson shannon_e、shannon_2、shannon_10

usearch -alpha_div otutable.txt -output alpha.txt
usearch -alpha_div otutable.txt -output gini.txt  -metrics gini_simpson
usearch -alpha_div otutable.txt -output alpha.txt -metrics chao1,

QIIME diversity alpha

qiime2 数据分析流程通过 qiime diversity接口提供了分析`alpha多样性·的各种命令:

--i-table  : FeatureTable
--p-metric : enspie|michaelis_menten_fit|strong|lladser_pe|fisher_alpha
             |goods_coverage|doubles|simpson|margalef|observed_otus|osd
             |shannon|pielou_e|chao1|brillouin_d|menhinick|simpson_e
             |kempton_taylor_q|robbins|dominance|lladser_ci|heip_e
             |singles|chao1_ci|mcintosh_d|ace|mcintosh_e|gini_index
             |berger_parker_d|esty_ci
--o-alpha-diversity: 输出alpha多样性;
--output-dir: 输出目录(如不指定--o-distance-matrix);

执行:

qiime diversity alpha          \
   --i-table  table.qza       \
   --p-metric  goods_coverage \
   --o-alpha-diversity  goods_coverage.qza

本文材料为 BASE (Biostack Applied bioinformatic SEies ) 课程 Linux Command Line Tools for Life Scientists 材料, 版权归 上海逻捷信息科技有限公司 所有。

Last Update: 2017-09-25 11:56 AM

Comments are closed.