暗能星系

    • 登录
    • 搜索

    SARS-CoV-2-FASTA-freebayes 流程记录

    张渌
    1
    1
    10
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • Z
      zhanglu 最后由 编辑

      地址:https://github.com/cfarkas/SARS-CoV-2-freebayes
      其中参考序列为:https://github.com/cfarkas/SARS-CoV-2-freebayes/blob/master/CDC_HK_Pasteur_primers.fasta

      测试命令

      minimap2 -ax sr /ceph_disk1/xinguan/SARS-CoV-2-freebayes/covid19-refseq.fasta SRR11728611.fastp.gz > SRR11728611.sam 
      minimap2 -ax sr /ceph_disk1/xinguan/SARS-CoV-2-freebayes/covid19-refseq.fasta SRR11728650.fastp.gz > SRR11728650.sam
      
      samtools view -bS SRR11728611.sam > SRR11728611.bam
      samtools view -bS SRR11728650.sam > SRR11728650.bam
      
      samtools sort SRR11728611.sam  > SRR11728611.sorted.bam
      samtools sort SRR11728650.sam  > SRR11728650.sorted.bam
      
      samtools index SRR11728611.sorted.bam
      samtools index SRR11728650.sorted.bam
      
      
      freebayes -f /ceph_disk1/xinguan/SARS-CoV-2-freebayes/covid19-refseq.fasta -C 1 SRR11728611.sorted.bam > vcf/SRR11728611.freebayes.vcf
      freebayes -f /ceph_disk1/xinguan/SARS-CoV-2-freebayes/covid19-refseq.fasta -C 1 SRR11728650.sorted.bam > vcf/SRR11728650.freebayes.vcf
      
      jacquard merge --include_all ./vcf merged.vcf
      

      问题一: 参考序列格式不规范,在 jacquard merge --include_all ./vcf merged.vcf 会出错
      (key error)
      错误格式:

      NC_045512.2 Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome
      ATTAAAGGTTTATACCTTCCCAGGTAACAAACCAACCAACTTTCGATCTCTTGTAGATCTGTTCTCTAAA

      修改为:

      NC_045512.2 Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1
      ATTAAAGGTTTATACCTTCCCAGGTAACAAACCAACCAACTTTCGATCTCTTGTAGATCTGTTCTCTAAA

      1 条回复 最后回复 回复 引用 0
      • First post
        Last post
      Powered by 暗能星系