<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[qiime 获取 alpha 和 beta 多样性指标数据]]></title><description><![CDATA[<h1>qiime 获取 alpha 和 beta 多样性指标数据</h1>
<p dir="auto">DATA_PATH: <code>/home/ice-melt/workspace/metagenomics</code></p>
<p dir="auto">可将目录中<code>phylogeny/rooted_tree_from_seqs.qza</code>和<code>dada2_denoise/atcc_table.qza</code>两个文件拷贝到新目录中进行验证</p>
<h2>一、使用 pipeline 方式</h2>
<pre><code class="language-bash">qiime diversity core-metrics-phylogenetic \
  --i-phylogeny phylogeny/rooted_tree_from_seqs.qza \
  --i-table dada2_denoise/atcc_table.qza \
  --p-sampling-depth 1103 \
  --m-metadata-file my-metadata.tsv \
  --output-dir core-metrics-results
</code></pre>
<p dir="auto">指标和可视化结果输出到<code>core-metrics-results</code>目录</p>
<h2>二、如何自定义选定指标</h2>
<p dir="auto">根据 pipeline 方式的运行逻辑整理以下命令，首先进行特征表的降采样</p>
<pre><code class="language-bash">qiime feature-table rarefy \
--i-table dada2_denoise/atcc_table.qza \
--p-sampling-depth 1103 \
--p-with-replacement False \
--o-rarefied-table rarefied_table.qza
</code></pre>
<blockquote>
<p dir="auto"><code>atcc_table.qza</code> 是所有特征表数据,<code>rarefied_table.qza</code> 是按指定深度过滤后的特征表数据</p>
<p dir="auto">采样深度为可调整参数，根据前一步图表结果用户分析指定，影响后续指标分析的准确性</p>
</blockquote>
<p dir="auto">该命令得到新特征表数据后进行多样性分析</p>
<h3>2.1 非进化树的alpha多样性</h3>
<p dir="auto">alpha 多样性指标集合</p>
<pre><code class="language-python">{'ace', 'chao1', 'chao1_ci', 'berger_parker_d', 'brillouin_d',
'dominance', 'doubles', 'enspie', 'esty_ci', 'fisher_alpha',
'goods_coverage', 'heip_e', 'kempton_taylor_q', 'margalef',
'mcintosh_d', 'mcintosh_e', 'menhinick', 'michaelis_menten_fit',
'observed_otus', 'osd', 'pielou_e', 'robbins', 'shannon',
'simpson', 'simpson_e', 'singles', 'strong', 'gini_index',
'lladser_pe', 'lladser_ci'}
</code></pre>
<p dir="auto">alpha 多样性指标参考命令</p>
<pre><code class="language-bash">qiime diversity alpha \
  --i-table rarefied_table.qza \
  --p-metric ace \
  --o-alpha-diversity ace.qza
</code></pre>
<p dir="auto">具体指标可指定集合中的具体值,pipeline中默认运行 'observed_otus', 'shannon', 'pielou_e'</p>
<h3>2.2 非进化树的beta多样性</h3>
<p dir="auto">beta 多样性指标集合</p>
<pre><code class="language-python">{'cityblock', 'euclidean', 'seuclidean', 'sqeuclidean', 'cosine',
'correlation', 'hamming', 'jaccard', 'chebyshev', 'canberra',
'braycurtis', 'mahalanobis', 'yule', 'matching', 'dice',
'kulsinski', 'rogerstanimoto', 'russellrao', 'sokalmichener',
'sokalsneath', 'wminkowski', 'aitchison', 'canberra_adkins'}
</code></pre>
<p dir="auto">beta 多样性指标参考命令</p>
<pre><code class="language-bash">qiime diversity beta \
--i-table rarefied_table.qza \
--p-metric jaccard \
--p-pseudocount 1 \
--p-n-jobs 1 \
--o-distance-matrix jaccard.qza
</code></pre>
<p dir="auto">参数说明：</p>
<ul>
<li><code>pseudocount</code> 参数只影响 <code>aitchison</code> 指标,默认值是1,参数可省略</li>
<li><code>n-jobs</code> 参数指定线程数,默认值是1,参数可省略</li>
</ul>
<p dir="auto">具体指标可指定beta 多样性指标集合中的具体值,pipeline中默认运行 'jaccard', 'braycurtis'</p>
<h3>2.3 基于进化树的alpha多样性</h3>
<pre><code class="language-bash">qiime diversity alpha-phylogenetic \
--i-table rarefied_table.qza \
--i-phylogeny phylogeny/rooted_tree_from_seqs.qza \
--p-metric faith_pd \
--o-alpha-diversity faith_pd.qza
</code></pre>
<p dir="auto">只有 faith_pd 一个指标参数</p>
<h3>2.4 基于进化树的beta多样性</h3>
<p dir="auto">可选参数集合</p>
<pre><code class="language-python">{'unweighted_unifrac': unifrac.unweighted,
'weighted_unifrac': unifrac.weighted_unnormalized,
'weighted_normalized_unifrac': unifrac.weighted_normalized,
'generalized_unifrac': unifrac.generalized}
</code></pre>
<p dir="auto">参考命令:</p>
<pre><code class="language-bash">qiime diversity beta-phylogenetic \
--i-table rarefied_table.qza \
--i-phylogeny phylogeny/rooted_tree_from_seqs.qza \
--p-metric unweighted_unifrac \
--variance-adjusted False\
--alpha float\
--bypass-tips False \  
--o-alpha-diversity unweighted_unifrac.qza
</code></pre>
<p dir="auto">参数说明：</p>
<ul>
<li><code>variance-adjusted</code>可选，默认值 False</li>
<li><code>alpha</code>,当且仅当指标为 <code>generalized_unifrac</code>时可选,此时默认值为1.0,当metric为其它指标时命令不能包含该参数</li>
<li><code>bypass-tips</code>可选，默认值 False</li>
</ul>
<p dir="auto">指标可从集合中选择,pipeline中默认运行 'unweighted_unifrac', 'weighted_unifrac'</p>
]]></description><link>http://an.forum.genostack.com/topic/4/qiime-获取-alpha-和-beta-多样性指标数据</link><generator>RSS for Node</generator><lastBuildDate>Sat, 13 Jun 2026 13:45:51 GMT</lastBuildDate><atom:link href="http://an.forum.genostack.com/topic/4.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 18 Jul 2020 07:35:22 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to qiime 获取 alpha 和 beta 多样性指标数据 on Mon, 24 Aug 2020 05:39:25 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="http://an.forum.genostack.com/uid/3">@ice-melt</a></p>
<pre><code class="language-bash">qiime diversity beta-phylogenetic \
--i-table rarefied_table.qza \
--i-phylogeny phylogeny/rooted_tree_from_seqs.qza \
--p-metric unweighted_unifrac \
--p-variance-adjusted False\
--p-bypass-tips False \  
--o-distance-matrix unweighted_unifrac.qza
</code></pre>
<blockquote>
<p dir="auto">注： <code>--o-alpha-diversity</code> 修改为 <code>--o-distance-matrix</code></p>
</blockquote>
]]></description><link>http://an.forum.genostack.com/post/110</link><guid isPermaLink="true">http://an.forum.genostack.com/post/110</guid><dc:creator><![CDATA[ice-melt]]></dc:creator><pubDate>Mon, 24 Aug 2020 05:39:25 GMT</pubDate></item><item><title><![CDATA[Reply to qiime 获取 alpha 和 beta 多样性指标数据 on Tue, 18 Aug 2020 06:45:51 GMT]]></title><description><![CDATA[<p dir="auto">关于多样性分析指标介绍</p>
<blockquote>
<p dir="auto">计算alpha多样性时使用的指标名<br />
<a href="http://scikit-bio.org/docs/0.4.2/generated/skbio.diversity.alpha.html#module-skbio.diversity.alpha" rel="nofollow ugc">http://scikit-bio.org/docs/0.4.2/generated/skbio.diversity.alpha.html#module-skbio.diversity.alpha</a></p>
</blockquote>
<blockquote>
<p dir="auto">计算beta多样性时使用的距离函数<br />
<a href="https://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.pdist.html#scipy.spatial.distance.pdist" rel="nofollow ugc">https://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.pdist.html#scipy.spatial.distance.pdist</a></p>
</blockquote>
<p dir="auto">另，qiime2计算beta多样性时额外实现了两个距离算法</p>
<pre><code class="language-python">    counts = table.matrix_data.toarray().T

    def aitchison(x, y, **kwds):
        return euclidean(clr(x), clr(y))

    def canberra_adkins(x, y, **kwds):
        if (x &lt; 0).any() or (y &lt; 0).any():
            raise ValueError("Canberra-Adkins is only defined over positive "
                             "values.")

        nz = ((x &gt; 0) | (y &gt; 0))
        x_ = x[nz]
        y_ = y[nz]
        nnz = nz.sum()

        return (1. / nnz) * np.sum(np.abs(x_ - y_) / (x_ + y_))

    if metric == 'aitchison':
        counts += pseudocount # pseudocount为方法入参，默认1
        metric = aitchison
    elif metric == 'canberra_adkins':
        metric = canberra_adkins

    # 之后调用 skbio.diversity.beta_diversity
</code></pre>
<blockquote>
<p dir="auto">beta基于树的多样性分析<br />
<a href="https://www.cnpython.com/pypi/unifrac#" rel="nofollow ugc">https://www.cnpython.com/pypi/unifrac#</a><br />
qiime2使用该库，此库为qiime开发，目前无完整api介绍</p>
</blockquote>
<pre><code class="language-python">    # 基于树的beta多样性支持的指标名
	{'unweighted_unifrac': unifrac.unweighted,
	'weighted_unifrac': unifrac.weighted_unnormalized,
	'weighted_normalized_unifrac': unifrac.weighted_normalized,
	'generalized_unifrac': unifrac.generalized}
    # 基于树的beta多样性计算核心调用代码

    if metric == generalized_unifrac:
        alpha = 1.0 if alpha is None else alpha
        f = partial(metrics[metric], alpha=alpha)
    else:
        f = metrics[metric]

    # unifrac processes tables and trees should be filenames
    return f(str(table), str(phylogeny), threads=n_jobs,
             variance_adjusted=variance_adjusted, bypass_tips=bypass_tips)

</code></pre>
]]></description><link>http://an.forum.genostack.com/post/95</link><guid isPermaLink="true">http://an.forum.genostack.com/post/95</guid><dc:creator><![CDATA[ice-melt]]></dc:creator><pubDate>Tue, 18 Aug 2020 06:45:51 GMT</pubDate></item><item><title><![CDATA[Reply to qiime 获取 alpha 和 beta 多样性指标数据 on Wed, 05 Aug 2020 01:48:57 GMT]]></title><description><![CDATA[<h1>增加命令20200805</h1>
<p dir="auto">PCoA结果可视化</p>
<pre><code class="language-bash">qiime emperor plot \
--i-pcoa bray_curtis_pcoa_results.qza \
--m-metadata-file metadata.tsv \
--o-visualization bray_curtis_pcoa_results.qzv
</code></pre>
<ul>
<li><code>i-pcoa</code>: 输入，所有beta多样性分析PCoA结果均可作为输入</li>
<li><code>m-metadata-file</code>: 元数据文件，与样本本身强相关的描述文件</li>
<li><code>o-visualization</code>: 输出，可视化文件输出，<code>qzv</code>工件，可自定义名称（一般为指标名接pcoa_results）</li>
</ul>
<p dir="auto">alpha稀释性曲线</p>
<pre><code class="language-bash">qiime diversity alpha-rarefaction \
  --i-table table.qza \
  --i-phylogeny rooted-tree.qza \
  --p-max-depth 4000 \
  --m-metadata-file metadata.tsv \
  --o-visualization alpha-rarefaction.qzv
</code></pre>
<ul>
<li><code>--i-table</code> :输入，特征表</li>
<li><code>--i-phylogeny</code> 输入，进化树</li>
<li><code>--p-max-depth</code> 参数，采样深度</li>
<li><code>--m-metadata-file</code> 元数据文件</li>
<li><code>--o-visualization</code> 输出，特征表稀释曲线可视化工件</li>
</ul>
]]></description><link>http://an.forum.genostack.com/post/75</link><guid isPermaLink="true">http://an.forum.genostack.com/post/75</guid><dc:creator><![CDATA[ice-melt]]></dc:creator><pubDate>Wed, 05 Aug 2020 01:48:57 GMT</pubDate></item><item><title><![CDATA[Reply to qiime 获取 alpha 和 beta 多样性指标数据 on Tue, 28 Jul 2020 06:56:57 GMT]]></title><description><![CDATA[<h1>增加命令20200728</h1>
<p dir="auto">qiime数据分析PCoA</p>
<pre><code class="language-bash">qiime diversity pcoa \
--i-distance-matrix core-metrics-results/bray_curtis_distance_matrix.qza \
--p-number_of_dimensions 5\
--o-pcoa bray_curtis_pcoa_results.qza
</code></pre>
<ul>
<li><code>i-distance-matrix</code>:输入，必须是一个距离矩阵（beta多样性的结果都是距离矩阵，可用于此步骤的输入）</li>
<li><code>p-number_of_dimensions</code>：参数，默认不加入此参数，表示对距离矩阵求取所有维度的精确特征值和特征向量，增加此参数表示通过fsvd使用快速启发式特征分解，此时需要指定所需的维数，如果指定0，表示指定矩阵的维度</li>
<li><code>o-pcoa</code>：输出，pcoa分析的结果数据<code>.qza</code>，这个可以文件进行下一步操作，将数据转换成图形需要的数据结构</li>
</ul>
<p dir="auto">说明：入参为距离矩阵，目前只有beta多样性的输出结果中有距离矩阵</p>
]]></description><link>http://an.forum.genostack.com/post/34</link><guid isPermaLink="true">http://an.forum.genostack.com/post/34</guid><dc:creator><![CDATA[ice-melt]]></dc:creator><pubDate>Tue, 28 Jul 2020 06:56:57 GMT</pubDate></item><item><title><![CDATA[Reply to qiime 获取 alpha 和 beta 多样性指标数据 on Tue, 21 Jul 2020 10:23:50 GMT]]></title><description><![CDATA[<h1>基于进化树的beta多样性命令参数修改</h1>
<p dir="auto">参考命令:</p>
<pre><code class="language-bash">qiime diversity beta-phylogenetic \
--i-table rarefied_table.qza \
--i-phylogeny phylogeny/rooted_tree_from_seqs.qza \
--p-metric unweighted_unifrac \
--p-variance-adjusted False\
--p-alpha 1.0\
--p-bypass-tips False \  
--o-alpha-diversity unweighted_unifrac.qza
</code></pre>
<blockquote>
<p dir="auto">注：qiime中，参数前需要加<code>p</code>,进行标识，输入需要加<code>i</code>标识，输出加<code>o</code>进行标识</p>
</blockquote>
]]></description><link>http://an.forum.genostack.com/post/12</link><guid isPermaLink="true">http://an.forum.genostack.com/post/12</guid><dc:creator><![CDATA[ice-melt]]></dc:creator><pubDate>Tue, 21 Jul 2020 10:23:50 GMT</pubDate></item></channel></rss>