暗能星系

    • 登录
    • 搜索

    解压SRR数据过程记录

    刘茜
    2
    2
    11
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • I
      ice-melt 最后由 编辑

      SRR数据 转fastq

      # 默认情况下fastq-dump不对reads进行拆分,
      # 双端需要拆分
      fastq-dump --split-e SRR3664239
      

      参数说明

      与拆分文件有关的参数

      --split-spot: 将双端测序分为两份,但是都放在同一个文件中
      --split-files: 将双端测序分为两份,放在不同的文件,但是对于一方有而一方没有的reads直接丢弃
      --split-3 : 将双端测序分为两份,放在不同的文件,但是对于一方有而一方没有的reads会单独放在一个文件夹里

      注: --split-e参数 在新版本中更新为 --split-3

      与输出序列ID有关的参数

      区分 r1,r2,
      @SRR5829230.1.1 1 length=36
      @SRR5829230.1.2 1 length=36
      注意: 有可能造成后续bwa报错
      

      -I | --readids:

      默认情况下输出的文件的ID都是SRR开头,但其实原始数据名字不是这样子,比如说
      @ST-E00600:143:H3LJWALXX:1:1101:5746:1016 2:N:0:CCTCCTGA,
      @HWI-ST620:248:HB11HADXX:2:1101:1241:2082#0/1这种. 
      如果你想看到那种格式,而不是SRR,你需要怎么做呢?
      

      F|--origfmt: 仅保留数据名字
      --defline-seq <fmt>: 定义readsID的显示方式
      --defline-qual <fmt>: 定义质量的显示方式

      与输出有关的参数

      --gzip, --bzip2: 压缩方式
      -Z | --stdout : 输出到标准输出
      -O|--outdir : 输出到指定文件夹

      报错记录

      2021-05-08T01:20:51 fastq-dump.2.10.8 err: directory unauthorized while creating directory within file system module - failed SRR3664239
      
      =============================================================
      An error occurred during processing.
      A report was generated into the file '/home/bioinfo/ncbi_error_report.txt'.
      If the problem persists, you may consider sending the file
      to 'sra-tools@ncbi.nlm.nih.gov' for assistance.
      =============================================================
      
      fastq-dump quit with error code 3
      

      原因:文件夹权限问题,或者硬盘空间不足

      1 条回复 最后回复 回复 引用 0
      • A
        anneng 最后由 编辑

        fastq-dump --origfmt --split-files SRR7879722.1

        1 条回复 最后回复 回复 引用 0
        • First post
          Last post
        Powered by 暗能星系