暗能星系

    • 登录
    • 搜索

    qiime 进行物种注释

    刘茜
    1
    1
    19
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • I
      ice-melt 最后由 编辑

      训练模型

      进行物种注释前需要进行模型训练

      qiime tools import \
        --type 'FeatureData[Sequence]' \
        --input-path 99_otus.fasta \
        --output-path 99_otus.qza
      
      qiime tools import \
        --type 'FeatureData[Taxonomy]' \
        --input-format HeaderlessTSVTaxonomyFormat \
        --input-path 99_otu_taxonomy.txt \
        --output-path ref-taxonomy.qza
      

      导入的数据是参考数据库,序列和对应的标注通过一个相同的id关联

      # fasta
      >1111772
      CCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGATGAACCGGCTTCGGCCGGGGATTAGTGGCGAACGGGTGAGTAACACGTGGGCAATCTGCCCTGCACTCTGGGACAAGCCCTGGAAACGGGGTCTAATACCGGATACGACGCAGGATCGCATGGTCTCTGCGTGGAAAGCTCCGGCGGTGCAGGATGAGCCCGCGGCCTATCAGCTTGTTGGTGAGGTAACGGCTCACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGAAGAAGCGTAAGTGACGGTACCTGCAGAAGAAGCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGCGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTCGCGTCGGGTGTGAAAGCCCGGGGCTTAACCCCGGGTCTGCATTCGATACGGGCAGGCTAGAGTGTGGTAGGGGAGATCGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGATCTCTGGGCCATTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGCACTAGGTGTTGGCGACATTCCACGTCGTCGGTGCCGCAGCTAACGCATTAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCATGTGGCTTAATTCGACGCAACGCGAAGAACCTTACCAAGGCTTGACATACACCGGAAACATCCAGAGATGGGTGCCCCCTTGTGGTCGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTGTGTTGCCAGCATGCCCTTTGGGGTGATGGGGACTCACAGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGCCCCTTATGTCTTGGGCTGCACACGTGCTACAATGGCCGGTACAAAGAGCTGCGATACCGTGAGGTGGAGCGAATCTCAAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCCCATGAAGTCGGAGTTGCTAGTAATCGCAGATCAGCATTGCTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACGTCACGAAAGTCGGTAACACCCGAAGCCGGTGGCCCAACCCCTTGTGGGAGGGAGCTGTCGAAGGTGGGACTGGCGATTGGGACGAAGTCGTAACA
      # taxonomy
      228054	k__Bacteria; p__Cyanobacteria; c__Synechococcophycideae; o__Synechococcales; f__Synechococcaceae; g__Synechococcus; s__
      
      qiime feature-classifier extract-reads \
        --i-sequences 99_otus.qza \
        --p-f-primer GTGCCAGCMGCCGCGGTAA \
        --p-r-primer GGACTACHVGGGTWTCTAAT \
        --p-trunc-len 120 \
        --p-min-length 100 \
        --p-max-length 400 \
        --o-reads ref-seqs.qza  
        
      qiime feature-classifier fit-classifier-naive-bayes \
        --i-reference-reads ref-seqs.qza \
        --i-reference-taxonomy ref-taxonomy.qza \
        --o-classifier gg-13-8-515-806-nb-classifier.qza
      

      物种注释

      注释

      qiime feature-classifier classify-sklearn \
        --i-classifier gg-13-8-99-515-806-nb-classifier.qza \
        --i-reads rep-seqs.qza \
        --o-classification taxonomy.qza
      
      • i-classifier :输入,预先训练好的分类器
      • i-reads :输入,合并去噪后的序列读段文件
      • o-classification :输出,通过模型进行物种注释的结果文件

      绘图

      qiime taxa barplot \
        --i-table table.qza \
        --i-taxonomy taxonomy.qza \
        --m-metadata-file sample-metadata.tsv \
        --o-visualization taxa-bar-plots.qzv  
      
      • --i-table 特征表
      • --i-taxonomy 物种注释结果文件
      • --m-metadata-file 元数据文件
      • --o-visualization 可视化文件输出
      1 条回复 最后回复 回复 引用 0
      • First post
        Last post
      Powered by 暗能星系