下载SRA数据过程记录
-
SRA数据下载
拆解说明
1) 首先肯定是找到一个SRA号啦
2) 登录 https://sra-explorer.info/? 网站,输入SRA号进行搜索

3)筛选需要下载的数据,并保存到 datasets 里

4)拷贝脚本命令

5) 到装有aspera的服务器上执行
ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR828/SRR828261/SRR828261.fastq.gz . && mv SRR828261.fastq.gz SRR828261_The_population_structure_and_recent_colonization_history_of_Oregon_threespine_stickleback_determined_using_RAD-seq.fastq.gz ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR828/SRR828262/SRR828262.fastq.gz . && mv SRR828262.fastq.gz SRR828262_The_population_structure_and_recent_colonization_history_of_Oregon_threespine_stickleback_determined_using_RAD-seq.fastq.gz脚本批量下载
# vim list.txt ,将SRR号粘贴到文件里,每行一个SRR号 srr_no=$(cat list.txt) # 指定下载文件夹路径 base_dir="/data_raid1/gene_data/data_archive/radseq_sra070979" for f in $srr_no do filename=$base_dir/${f}.fastq.gz if [ ! -f $filename ];then ascp -QT -l 300m -P33001 -i \ ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \ era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/${f:0:6}/${f}/${f}.fastq.gz . echo "download over ${f}" if [ ! -f ${f}.fastq.gz ];then echo "ascp raise error" else mv ${f}.fastq.gz /data_raid1/gene_data/data_archive/radseq_sra070979/ echo "mv success" fi fi done -
使用 aspera 下载NCBI ftp中的数据
## 示例1,来自王通的纳米孔宏基因课件 .aspera/connect/bin/ascp -i .aspera/connect/etc/asperaweb_id_dsa.openssh \ --overwrite=diff -QTr -l 6000m anonftp@ftp.ncbi.nlm.nih.gov:blast/db/swissprot.tar.gz ./## 示例2,来自 https://www.jianshu.com/p/0bff79fcde3d ascp -QT \ -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \ -k1 -l 300m \ anonftp@ftp.ncbi.nlm.nih.gov:/blast/db/FASTA/nt.gz ./## 示例3,下载烟草参考基因组时使用的命令 ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --overwrite=diff -QTr -l 6000m \ anonftp@ftp.ncbi.nlm.nih.gov:genomes/all/GCF/000/715/135/GCF_000715135.1_Ntab-TN90/GCF_000715135.1_Ntab-TN90_genomic.fna.gz注意点:
- 需要正确给出 aspera-license ,在
-i后面接license文件,这里是
asperaweb_id_dsa.openssh - ftp 账号要写正确
- NCBI 账号是:
anonftp@ftp.ncbi.nlm.nih.gov - EBI 公共账号:
era-fasp
- NCBI 账号是:
- ftp 地址后面接冒号,然后是ftp文件的具体位置
- 需要正确给出 aspera-license ,在
-
sra数据查询下载
地址: https://www.ncbi.nlm.nih.gov/sra
使用说明: https://www.jianshu.com/p/680e8d720516