暗能星系

    • 登录
    • 搜索

    16S流程节点参数描述(qiime based)

    其它
    1
    1
    11
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • I
      ice-melt 最后由 编辑

      导入

      qiime tools import \
      --type 'SampleData[PairedEndSequencesWithQuality]' \
      --input-path ${Data} \
      --input-format CasavaOneEightSingleLanePerSampleDirFmt \
      --output-path atcc-paired-end.qza
      
      • type:导入数据的类型,双端fastq文件必须为 'SampleData[PairedEndSequencesWithQuality]'
      • input-path:应导入的文件或目录的路径。双端fastq文件必须为父级目录,相对路径或全路径均可
      • input-format:输入格式(暂指定CasavaOneEightSingleLanePerSampleDirFmt )
      • output-path:输出文件路径,文件名可自定义,文件类型为.qza文件
      # type参数在其它文件类型中可能的取值列表
      DeblurStats
      DistanceMatrix
      EMPPairedEndSequences
      EMPSingleEndSequences
      ErrorCorrectionDetails
      FeatureData[AlignedSequence]
      FeatureData[Differential]
      FeatureData[Importance]
      FeatureData[PairedEndSequence]
      FeatureData[Sequence]
      FeatureData[Taxonomy]
      FeatureTable[Balance]
      FeatureTable[Composition]
      FeatureTable[Frequency]
      FeatureTable[PercentileNormalized]
      FeatureTable[PresenceAbsence]
      FeatureTable[RelativeFrequency]
      Hierarchy
      MultiplexedPairedEndBarcodeInSequence
      MultiplexedSingleEndBarcodeInSequence
      PCoAResults
      Phylogeny[Rooted]
      Phylogeny[Unrooted]
      Placements
      QualityFilterStats
      RawSequences
      SampleData[AlphaDiversity]
      SampleData[BooleanSeries]
      SampleData[ClassifierPredictions]
      SampleData[DADA2Stats]
      SampleData[FirstDifferences]
      SampleData[JoinedSequencesWithQuality]
      SampleData[PairedEndSequencesWithQuality] #双端含质量信息(fastq)文件
      SampleData[Probabilities]
      SampleData[RegressorPredictions]
      SampleData[SequencesWithQuality]
      SampleData[Sequences]
      SampleEstimator[Classifier]
      SampleEstimator[Regressor]
      SeppReferenceDatabase
      TaxonomicClassifier
      UchimeStats
      # input-format 参数在可能的取值列表
      AlignedDNAFASTAFormat
      AlignedDNASequencesDirectoryFormat
      AlphaDiversityDirectoryFormat
      AlphaDiversityFormat
      BIOMV100DirFmt
      BIOMV100Format
      BIOMV210DirFmt
      BIOMV210Format
      BooleanSeriesDirectoryFormat
      BooleanSeriesFormat
      CasavaOneEightLanelessPerSampleDirFmt
      CasavaOneEightSingleLanePerSampleDirFmt
      DADA2StatsDirFmt
      DADA2StatsFormat
      DNAFASTAFormat
      DNASequencesDirectoryFormat
      DeblurStatsDirFmt
      DeblurStatsFmt
      DifferentialDirectoryFormat
      DifferentialFormat
      DistanceMatrixDirectoryFormat
      EMPPairedEndCasavaDirFmt
      EMPPairedEndDirFmt
      EMPSingleEndCasavaDirFmt
      EMPSingleEndDirFmt
      ErrorCorrectionDetailsDirFmt
      FastqGzFormat
      FirstDifferencesDirectoryFormat
      FirstDifferencesFormat
      HeaderlessTSVTaxonomyDirectoryFormat
      HeaderlessTSVTaxonomyFormat
      ImportanceDirectoryFormat
      ImportanceFormat
      LSMatFormat
      MultiplexedPairedEndBarcodeInSequenceDirFmt
      MultiplexedSingleEndBarcodeInSequenceDirFmt
      NewickDirectoryFormat
      NewickFormat
      OrdinationDirectoryFormat
      OrdinationFormat
      PairedDNASequencesDirectoryFormat
      PairedEndFastqManifestPhred33
      PairedEndFastqManifestPhred33V2
      PairedEndFastqManifestPhred64
      PairedEndFastqManifestPhred64V2
      PlacementsDirFmt
      PlacementsFormat
      PredictionsDirectoryFormat
      PredictionsFormat
      ProbabilitiesDirectoryFormat
      ProbabilitiesFormat
      QIIME1DemuxDirFmt
      QIIME1DemuxFormat
      QualityFilterStatsDirFmt
      QualityFilterStatsFmt
      SampleEstimatorDirFmt
      SeppReferenceDirFmt
      SingleEndFastqManifestPhred33
      SingleEndFastqManifestPhred33V2
      SingleEndFastqManifestPhred64
      SingleEndFastqManifestPhred64V2
      SingleLanePerSamplePairedEndFastqDirFmt
      SingleLanePerSampleSingleEndFastqDirFmt
      TSVTaxonomyDirectoryFormat
      TSVTaxonomyFormat
      TaxonomicClassiferTemporaryPickleDirFmt
      UchimeStatsDirFmt
      UchimeStatsFmt
      

      去噪

      qiime dada2 denoise-paired \
      --i-demultiplexed-seqs ${AtccPairedEnd} \
      --p-trim-left-f 17 \
      --p-trim-left-r 21 \
      --p-trunc-len-f 300 \
      --p-trunc-len-r 300 \
      --o-table atcc_table.qza \
      --o-representative-sequences atcc_seqs.qza \
      --o-denoising-stats atcc_stats.qza
      
      • --i-demultiplexed-seqs 双端序列数据工件(.qza)
      • --p-trim-left-f 整数,小于--p-trunc-len-f,由于质量较低,前向读取序列应被修剪的位置。这将修剪输入序列的5'端,这将是在第一个循环中被测序的基
      • --p-trim-left-r 整数,小于--p-trunc-len-r,由于质量较低,应修剪反向读取序列的位置。这将修剪输入序列的5'端,这将是在第一个循环中被测序的基
      • --p-trunc-len-f 整数,由于质量下降,前向读取序列应被截断的位置。这将截断输入序列3'端,小于此值的read将被丢弃。应用此参数后,正向和反向读取之间必须至少有12个核苷酸重叠。如果提供0,则不执行截断或长度筛选
      • --p-trunc-len-r 整数,由于质量下降而应截断反向读取序列的位置。这将截断输入序列的3'结尾,这将是在上一个循环中序列化的基。小于此值的读取将被丢弃。应用此参数后,正向和反向读取之间必须至少有12个核苷酸重叠。如果提供0,则不执行截断或长度筛选
      • --o-table 输出otu table,.qza工件
      • --o-representative-sequences 输出参数,.qza工件
      • --o-denoising-stats 输出参数,.qza工件

      特征表信息汇总(可以不在流程中执行)

      qiime feature-table summarize \
      --i-table ${AtccTable} \
      --o-visualization atcc_summarize_from_table.qzv \
      --m-sample-metadata-file ${MyMetadata}
      
      • --i-table 去噪后的序列工件
      • --o-visualization 输出可视化工件
      • --m-sample-metadata-file 元数据文件

      进化树

      qiime phylogeny align-to-tree-mafft-fasttree \
      --i-sequences ${AtccSeqs} \
      --o-alignment alignment_from_seqs.qza \
      --o-masked-alignment masked_alignment_from_seqs.qza \
      --o-tree tree_from_seqs.qza \
      --o-rooted-tree rooted_tree_from_seqs.qza
      
      • --i-sequences 去噪后的序列数据工件,.qza
      • --o-alignment 对齐的序列工件,.qza
      • --o-masked-alignment 掩码对齐序列工件,.qza
      • --o-tree 无根系统发育树工件.qza
      • --o-rooted-tree 有根的系统发育树工件.qza

      多样性pipeline

      qiime diversity core-metrics-phylogenetic \
      --i-phylogeny ${RootedTreeFromSeqs} \
      --i-table ${AtccTable} \
      --p-sampling-depth 1103 \
      --m-metadata-file ${MyMetadata} \
      --output-dir core-metrics-results  
      
      • --i-phylogeny 从序列中构建的进化树数据工件,.qza
      • --i-table 去噪后的序列工件,.qza
      • --p-sampling-depth 采样深度,大于0,不超过样本中含序列数最多的序列数
      • --m-metadata-file 元数据文件路径
      • --output-dir 输出目录路径

      特征表稀释

      qiime feature-table rarefy \
      --i-table ${atccTable} \
      --p-sampling-depth ${samplingDepth} \
      --p-with-replacement ${withReplacement} \
      --o-rarefied-table rarefied_table.qza
      
      • --i-table 要精简的特征表。.qza
      • --p-sampling-depth 整数,采样深度,小于此深度的序列将被过滤
      • --p-with-replacement bool值,默认False。从多项式分布中抽样来代替无替代的稀疏化
      • --o-rarefied-table 输出工件,OTU表。.qza`

      多样性

      alpha

      qiime diversity alpha \
      --i-table ${rarefiedTable} \
      --p-metric ${metric} \
      --o-alpha-diversity ${metric}.qza
      
      • --i-table 包含应计算α多样性的样本的特征表。.qza
      • --p-metric 字符串,alpha多样性指标
      • --o-alpha-diversity 包含每个样本α多样性的向量工件。.qza

      基于发育树的alpha

      qiime diversity alpha-phylogenetic \
      --i-table ${rarefiedTable} \
      --i-phylogeny ${rootedTreeFromSeqs} \
      --p-metric faith_pd \
      --o-alpha-diversity ${faithPd}
      
      • --i-table 包含应计算α多样性的样本的特征表。.qza
      • --i-phylogeny 系统发生树,包含与表中的特征标识符相对应的提示标识符。此树可以包含表中不存在的提示ID,但表中的所有功能ID都必须存在于该树中。.qza
      • --p-metric 字符串,目前该指标只能为faith_pd
      • --o-alpha-diversity 包含每个样本α多样性的向量工件。.qza

      beta

      qiime diversity beta \
      --i-table ${rarefiedTable} \
      --p-metric ${metric} \
      --p-pseudocount ${pseudocount} \
      --p-n-jobs ${jobs} \
      --o-distance-matrix ${metric}
      
      • --i-table 包含应计算beta多样性的样本的特征表。.qza
      • --p-metric 字符串,多样性指标
      • --p-pseudocount 用于处理零的组合度量的伪计数。对于aitchison之外的其他指标,该参数将被忽略
      • --p-n-jobs 线程数,默认为1,必须小于系统可指定的最大线程数
      • --o-distance-matrix 距离矩阵结果。.qza

      基于发育树的beta

      qiime diversity beta-phylogenetic \
      --i-table ${rarefiedTable} \
      --i-phylogeny ${rootedTreeFromSeqs} \
      --p-metric ${metric} \
      --p-variance-adjusted ${varianceAdjusted} \
      --p-alpha float \
      --p-bypass-tips ${bypassTips} \
      --o-alpha-diversity ${metric}.qza
      
      • --i-table 包含应计算beta多样性的样本的特征表。.qza
      • --i-phylogeny 系统发生树,包含与表中的特征标识符相对应的提示标识符。此树可以包含表中不存在的提示ID,但表中的所有功能ID都必须存在于该树中。.qza
      • --p-metric 字符串,beta多样性指标
      • --p-variance-adjusted 布尔值,默认False
      • --p-alpha 浮点数,此参数仅在度量的选择是generalized_unifrac时使用。alpha的值控制采样均匀的程度。1.0是加权标准化UniFrac。0.0接近于未加权的UniFrac,但前提是样本比例是两分的。
      • --p-bypass-tips 布尔值,默认False。方差调整,基于给定节点样本之间相对丰度的比例加权距离。
      • --o-alpha-diversity 距离矩阵结果。.qza
      1 条回复 最后回复 回复 引用 0
      • First post
        Last post
      Powered by 暗能星系