Archives

矩阵操作之子集和格式转换:tabtk_submatrix 和 tabtk_matrix2tab

针对16S数据分析中,通过Usearch beta_div 或者 QIIME的beta_div, 我们可以获得样本间的距离矩阵,格式:

    A   B   C
A   0   2   3
B   2   0   6
C   3   6   0

或者包含描述信息,比如:多一个Y表述什么类型的距离度量。

Y   A   B   C
A   0   2   3
B   2   0   6
C   3   6   0

针对这样矩阵,我们有时需要两种操作:
一种操作是或者子矩阵, 比如,只包含样本A和B的距离矩阵。

    A   B
A   0   2
B   2   0

另一种转换成下面类邻接表格式:

A   A   0
A   B   2

tabtk_submatrixtabtk_matrix2tab 可完成矩阵类似操作。

1. tabtk_submatrix

命令行接口:

$ tabtk_submatrix
Usage: tabtk_submatrix <matrix> <samples>
version: 0.0.1

接收两个参数文件: 距离矩阵文件和样本列表文件

实例:

tabtk_submatrix   weighted_unifrac.distmx.txt samples.txt

2. tabtk_matrix2tab

命令行接口:

$ tabtk_matrix2tab
Usage: tabtk_matrix2tab [options] <matrix>
Options:
  -v print version number

实例:

tabtk_matrix2tab matrix.txt

本文材料为 BASE (Biostack Applied bioinformatic SEies ) 课程 Linux Command Line Tools for Life Scientists 材料, 版权归 上海逻捷信息科技有限公司 所有。

Last Update: 2017-10-26 3:24 PM

Comments are closed.