<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[解压SRR数据过程记录]]></title><description><![CDATA[<h2>SRR数据 转fastq</h2>
<pre><code class="language-bash"># 默认情况下fastq-dump不对reads进行拆分,
# 双端需要拆分
fastq-dump --split-e SRR3664239
</code></pre>
<h2>参数说明</h2>
<h4><strong>与拆分文件有关的参数</strong></h4>
<p dir="auto"><code>--split-spot:</code> 将双端测序分为两份,但是都放在同一个文件中<br />
<code>--split-files:</code> 将双端测序分为两份,放在不同的文件,但是对于一方有而一方没有的reads直接丢弃<br />
<code>--split-3</code> : 将双端测序分为两份,放在不同的文件,但是对于一方有而一方没有的reads会单独放在一个文件夹里</p>
<p dir="auto"><code>注：</code> <code>--split-e</code>参数 在新版本中更新为 <code>--split-3</code></p>
<h4><strong>与输出序列ID有关的参数</strong></h4>
<pre><code>区分 r1，r2,
@SRR5829230.1.1 1 length=36
@SRR5829230.1.2 1 length=36
注意： 有可能造成后续bwa报错
</code></pre>
<p dir="auto"><code>-I | --readids</code>:</p>
<pre><code>默认情况下输出的文件的ID都是SRR开头,但其实原始数据名字不是这样子,比如说
@ST-E00600:143:H3LJWALXX:1:1101:5746:1016 2:N:0:CCTCCTGA,
@HWI-ST620:248:HB11HADXX:2:1101:1241:2082#0/1这种. 
如果你想看到那种格式,而不是SRR,你需要怎么做呢?
</code></pre>
<p dir="auto"><code>F|--origfmt</code>: 仅保留数据名字<br />
<code>--defline-seq &lt;fmt&gt;</code>: 定义readsID的显示方式<br />
<code>--defline-qual &lt;fmt&gt;</code>: 定义质量的显示方式</p>
<h4><strong>与输出有关的参数</strong></h4>
<p dir="auto"><code>--gzip, --bzip2</code>: 压缩方式<br />
<code>-Z | --stdout</code> : 输出到标准输出<br />
<code>-O|--outdir</code> : 输出到指定文件夹</p>
<h2>报错记录</h2>
<pre><code>2021-05-08T01:20:51 fastq-dump.2.10.8 err: directory unauthorized while creating directory within file system module - failed SRR3664239

=============================================================
An error occurred during processing.
A report was generated into the file '/home/bioinfo/ncbi_error_report.txt'.
If the problem persists, you may consider sending the file
to 'sra-tools@ncbi.nlm.nih.gov' for assistance.
=============================================================

fastq-dump quit with error code 3
</code></pre>
<p dir="auto"><code>原因:</code>文件夹权限问题，或者硬盘空间不足</p>
]]></description><link>http://an.forum.genostack.com/topic/302/解压srr数据过程记录</link><generator>RSS for Node</generator><lastBuildDate>Sat, 13 Jun 2026 10:59:29 GMT</lastBuildDate><atom:link href="http://an.forum.genostack.com/topic/302.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 08 May 2021 01:40:42 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 解压SRR数据过程记录 on Mon, 03 Jan 2022 08:55:10 GMT]]></title><description><![CDATA[<p dir="auto">fastq-dump --origfmt --split-files SRR7879722.1</p>
]]></description><link>http://an.forum.genostack.com/post/1064</link><guid isPermaLink="true">http://an.forum.genostack.com/post/1064</guid><dc:creator><![CDATA[anneng]]></dc:creator><pubDate>Mon, 03 Jan 2022 08:55:10 GMT</pubDate></item></channel></rss>