解压SRR数据过程记录
-
SRR数据 转fastq
# 默认情况下fastq-dump不对reads进行拆分, # 双端需要拆分 fastq-dump --split-e SRR3664239参数说明
与拆分文件有关的参数
--split-spot:将双端测序分为两份,但是都放在同一个文件中
--split-files:将双端测序分为两份,放在不同的文件,但是对于一方有而一方没有的reads直接丢弃
--split-3: 将双端测序分为两份,放在不同的文件,但是对于一方有而一方没有的reads会单独放在一个文件夹里注:--split-e参数 在新版本中更新为--split-3与输出序列ID有关的参数
区分 r1,r2, @SRR5829230.1.1 1 length=36 @SRR5829230.1.2 1 length=36 注意: 有可能造成后续bwa报错-I | --readids:默认情况下输出的文件的ID都是SRR开头,但其实原始数据名字不是这样子,比如说 @ST-E00600:143:H3LJWALXX:1:1101:5746:1016 2:N:0:CCTCCTGA, @HWI-ST620:248:HB11HADXX:2:1101:1241:2082#0/1这种. 如果你想看到那种格式,而不是SRR,你需要怎么做呢?F|--origfmt: 仅保留数据名字
--defline-seq <fmt>: 定义readsID的显示方式
--defline-qual <fmt>: 定义质量的显示方式与输出有关的参数
--gzip, --bzip2: 压缩方式
-Z | --stdout: 输出到标准输出
-O|--outdir: 输出到指定文件夹报错记录
2021-05-08T01:20:51 fastq-dump.2.10.8 err: directory unauthorized while creating directory within file system module - failed SRR3664239 ============================================================= An error occurred during processing. A report was generated into the file '/home/bioinfo/ncbi_error_report.txt'. If the problem persists, you may consider sending the file to 'sra-tools@ncbi.nlm.nih.gov' for assistance. ============================================================= fastq-dump quit with error code 3原因:文件夹权限问题,或者硬盘空间不足 -
fastq-dump --origfmt --split-files SRR7879722.1