暗能星系

    • 登录
    • 搜索

    使用 UNITE ITS 参考序列训练 QIIME2 分类器

    生物信息分析
    1
    1
    6
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • Z
      zhangfanglin 最后由 编辑

      使用 UNITE ITS 参考序列训练 QIIME2 分类器

      下载 UNITE QIIME 格式的参考序列和分类文件。

      qiime相关下载地址:
      https://unite.ut.ee/repository.php

      wget https://files.plutof.ut.ee/public/orig/98/AE/98AE96C6593FC9C52D1C46B96C2D9064291F4DBA625EF189FEC1CCAFCF4A1691.gz
      

      解压。下载的文件实际上是一个 tar.gz 文件,所以需要解压:

      tar xzf 98AE96C6593FC9C52D1C46B96C2D9064291F4DBA625EF189FEC1CCAFCF4A1691.gz
      

      进入开发者目录。

      cd sh_qiime_release_04.02.2020/developer/
      

      修复阻止将参考序列导入 QIIME2 的格式错误。有干扰的空格,可能还有一些需要转换为大写的小写字母。

      awk '/^>/ {print($0)}; /^[^>]/ {print(toupper($0))}' sh_refs_qiime_ver8_99_04.02.2020_dev.fasta | tr -d ' ' > sh_refs_qiime_ver8_99_04.02.2020_dev_uppercase.fasta
      

      将 UNITE 参考序列导入 QIIME2。

      qiime tools import \
      --type FeatureData[Sequence] \
      --input-path sh_refs_qiime_ver8_99_04.02.2020_dev_uppercase.fasta \
      --output-path unite-ver8-seqs_99_04.02.2020.qza
      

      导入分类文件。

      qiime tools import \
      --type FeatureData[Taxonomy] \
      --input-path sh_taxonomy_qiime_ver8_99_04.02.2020_dev.txt \
      --output-path unite-ver8-taxonomy_99_04.02.2020.qza \
      --input-format HeaderlessTSVTaxonomyFormat
      
      

      训练分类器。

      qiime feature-classifier fit-classifier-naive-bayes \
      --i-reference-reads unite-ver8-seqs_99_04.02.2020.qza \
      --i-reference-taxonomy unite-ver8-taxonomy_99_04.02.2020.qza \
      --o-classifier unite-ver8-99-classifier-04.02.2020.qza
      
      1 条回复 最后回复 回复 引用 0
      • First post
        Last post
      Powered by 暗能星系