暗能星系

    • 登录
    • 搜索

    下载SRA数据过程记录

    刘茜
    1
    3
    24
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • I
      ice-melt 最后由 编辑

      SRA数据下载

      拆解说明

      1) 首先肯定是找到一个SRA号啦

      2) 登录 https://sra-explorer.info/? 网站,输入SRA号进行搜索

      27b7b0c9-aadc-4762-a210-e8ebe754d8b5-image.png

      3)筛选需要下载的数据,并保存到 datasets 里

      79263f8e-449e-4e0a-a152-2947c6d43e66-image.png

      4)拷贝脚本命令

      b84c056e-88d5-4e3a-aa3e-c5b170c76324-image.png

      5) 到装有aspera的服务器上执行

      ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR828/SRR828261/SRR828261.fastq.gz . && mv SRR828261.fastq.gz SRR828261_The_population_structure_and_recent_colonization_history_of_Oregon_threespine_stickleback_determined_using_RAD-seq.fastq.gz
      
      ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR828/SRR828262/SRR828262.fastq.gz . && mv SRR828262.fastq.gz SRR828262_The_population_structure_and_recent_colonization_history_of_Oregon_threespine_stickleback_determined_using_RAD-seq.fastq.gz
      
      

      脚本批量下载

      # vim list.txt ,将SRR号粘贴到文件里,每行一个SRR号
      
      srr_no=$(cat list.txt)
      # 指定下载文件夹路径
      base_dir="/data_raid1/gene_data/data_archive/radseq_sra070979"
      
      
      for f in $srr_no
      do
              filename=$base_dir/${f}.fastq.gz
              if [ ! -f $filename ];then
                      ascp -QT -l 300m -P33001 -i \
                              ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
                              era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/${f:0:6}/${f}/${f}.fastq.gz . 
                      echo "download over ${f}"
                      if [ ! -f ${f}.fastq.gz ];then
                              echo "ascp raise error"
                      else
                              mv ${f}.fastq.gz /data_raid1/gene_data/data_archive/radseq_sra070979/
                              echo "mv success"
                      fi
              fi
      done
      
      
      1 条回复 最后回复 回复 引用 0
      • I
        ice-melt 最后由 ice-melt 编辑

        使用 aspera 下载NCBI ftp中的数据

        ## 示例1,来自王通的纳米孔宏基因课件                                                                   
        .aspera/connect/bin/ascp -i .aspera/connect/etc/asperaweb_id_dsa.openssh \
        --overwrite=diff -QTr -l 6000m anonftp@ftp.ncbi.nlm.nih.gov:blast/db/swissprot.tar.gz ./
        
        ## 示例2,来自 https://www.jianshu.com/p/0bff79fcde3d                                                     
        ascp -QT \
         -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
         -k1 -l 300m \
         anonftp@ftp.ncbi.nlm.nih.gov:/blast/db/FASTA/nt.gz ./ 
        
        ## 示例3,下载烟草参考基因组时使用的命令
        ascp -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --overwrite=diff -QTr -l 6000m \
        anonftp@ftp.ncbi.nlm.nih.gov:genomes/all/GCF/000/715/135/GCF_000715135.1_Ntab-TN90/GCF_000715135.1_Ntab-TN90_genomic.fna.gz
        

        注意点:

        • 需要正确给出 aspera-license ,在-i后面接license文件,这里是
          asperaweb_id_dsa.openssh
        • ftp 账号要写正确
          • NCBI 账号是:anonftp@ftp.ncbi.nlm.nih.gov
          • EBI 公共账号: era-fasp
        • ftp 地址后面接冒号,然后是ftp文件的具体位置
        I 1 条回复 最后回复 回复 引用 0
        • I
          ice-melt @ice-melt 最后由 编辑

          @ice-melt

          sra数据查询下载

          地址: https://www.ncbi.nlm.nih.gov/sra
          使用说明: https://www.jianshu.com/p/680e8d720516

          1 条回复 最后回复 回复 引用 0
          • First post
            Last post
          Powered by 暗能星系