使用 UNITE ITS 参考序列训练 QIIME2 分类器
-
使用 UNITE ITS 参考序列训练 QIIME2 分类器
下载 UNITE QIIME 格式的参考序列和分类文件。
qiime相关下载地址:
https://unite.ut.ee/repository.phpwget https://files.plutof.ut.ee/public/orig/98/AE/98AE96C6593FC9C52D1C46B96C2D9064291F4DBA625EF189FEC1CCAFCF4A1691.gz解压。下载的文件实际上是一个 tar.gz 文件,所以需要解压:
tar xzf 98AE96C6593FC9C52D1C46B96C2D9064291F4DBA625EF189FEC1CCAFCF4A1691.gz进入开发者目录。
cd sh_qiime_release_04.02.2020/developer/修复阻止将参考序列导入 QIIME2 的格式错误。有干扰的空格,可能还有一些需要转换为大写的小写字母。
awk '/^>/ {print($0)}; /^[^>]/ {print(toupper($0))}' sh_refs_qiime_ver8_99_04.02.2020_dev.fasta | tr -d ' ' > sh_refs_qiime_ver8_99_04.02.2020_dev_uppercase.fasta将 UNITE 参考序列导入 QIIME2。
qiime tools import \ --type FeatureData[Sequence] \ --input-path sh_refs_qiime_ver8_99_04.02.2020_dev_uppercase.fasta \ --output-path unite-ver8-seqs_99_04.02.2020.qza导入分类文件。
qiime tools import \ --type FeatureData[Taxonomy] \ --input-path sh_taxonomy_qiime_ver8_99_04.02.2020_dev.txt \ --output-path unite-ver8-taxonomy_99_04.02.2020.qza \ --input-format HeaderlessTSVTaxonomyFormat训练分类器。
qiime feature-classifier fit-classifier-naive-bayes \ --i-reference-reads unite-ver8-seqs_99_04.02.2020.qza \ --i-reference-taxonomy unite-ver8-taxonomy_99_04.02.2020.qza \ --o-classifier unite-ver8-99-classifier-04.02.2020.qza