SV结构变异分析
-
-
SV结构变异工具介绍:
GATK,Delly,和Manta都是常用于结构变异(SV)分析的工具。以下是对这三个工具的简要概述:
1. GATK(Genome Analysis Toolkit):
用途: GATK最初是为SNP和INDEL变异分析设计的,但它也提供了一些工具用于结构变异的分析。
特点: GATK的工作流程强调质量校正和基因型的精准调用。对于结构变异,它包括多个步骤,如HaplotypeCaller用于发现插入和删除的序列。
适用场景: 适用于对结构变异进行详细分析,尤其是在需要高精度的基因型调用的情况下。
2. Delly:
’用途: Delly是一个专门用于结构变异分析的工具,支持检测插入、删除、倒置和重复等结构变异。
特点: Delly通过分析测序数据的拆分、软剪接和不平衡的比对匹配来发现结构变异。它提供了高灵敏度的结构变异检测。
适用场景: 适用于全面检测各种类型的结构变异,特别是在关注高灵敏度的情况下。
3. Manta:
用途: Manta是一个专门用于结构变异分析的工具,主要关注于发现大片段的插入、删除、倒置和复制等结构变异。
特点: Manta使用一种基于比对的方法,通过检测拆分和不平衡的比对来发现结构变异。它被设计为高度灵敏且适用于不同类型的结构变异。
适用场景: 适用于需要高灵敏度的结构变异检测,尤其是对于大片段变异的发现。
总体比较:精度: GATK在基因型调用方面强调精确性,适用于需要高精度的研究。Delly和Manta则更注重于全面而灵敏的结构变异检测。
适用类型: Delly和Manta专注于各种结构变异的检测,而GATK更通用,同时支持SNP、INDEL和结构变异的分析。
运行复杂度: GATK通常包含多个步骤,可能需要更多的运行时间和计算资源。Delly和Manta在某些情况下可能更快速。
选择使用哪个工具或者结合它们的结果进行综合分析应该基于具体的研究问题和数据特点。在使用这些工具时,请查阅相应的文档以了解最佳实践和参数调整建议。
-
GATK(Genome Analysis Toolkit)是一个用于高通量测序数据分析的强大工具包,包括结构变异分析。以下是使用GATK进行结构变异分析的基本命令整理:
1. 数据预处理:
1.1 基础处理
# 使用Picard工具包进行格式转换和排序 picard CreateSequenceDictionary R=reference_genome.fasta O=reference_genome.dict picard AddOrReplaceReadGroups I=input.bam O=rg_added_sorted.bam SO=coordinate RGID=id RGLB=library RGPL=platform RGPU=machine RGSM=sample # 索引 samtools index rg_added_sorted.bam1.2 基本质控(可选)
# 使用FastQC进行测序数据质控 fastqc input.fastq ## 2. 结构变异检测: ### 2.1 使用GATK HaplotypeCaller进行变异调用 gatk HaplotypeCaller -R reference_genome.fasta -I rg_added_sorted.bam -O raw_variants.vcf2.2 过滤变异
# 使用GATK VariantFiltration进行变异过滤 gatk VariantFiltration -R reference_genome.fasta -V raw_variants.vcf --filter-expression "QD < 2.0 || FS > 60.0 || MQ < 40.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0" --filter-name "my_snp_filter" -O filtered_variants.vcf3. 结果注释:
3.1 使用GATK VariantAnnotator进行注释
gatk VariantAnnotator -R reference_genome.fasta -V filtered_variants.vcf -A Coverage -A QualByDepth -A FisherStrand -O annotated_variants.vcf -
Delly/manta 结构变异
1. 数据预处理:
获取测序数据: 假设你有原始的测序数据,通常是FASTQ格式。
2. 比对与组装:
使用Bowtie2进行比对:
bowtie2 -x reference_genome -U your_sequence.fastq -S aligned.sam将SAM文件转换为BAM格式:
samtools view -bS aligned.sam > aligned.bam对BAM文件进行排序和索引:
samtools sort aligned.bam -o sorted.bam samtools index sorted.bam- 结构变异检测:
使用Delly检测结构变异:
delly call -g reference_genome.fasta -o output.bcf -x exclude_regions.bed sorted.bam使用Manta检测结构变异:
configManta.py --bam=sorted.bam --referenceFasta=reference_genome.fasta --runDir=manta_output manta_runWorkflow.py -mantaFlowDir=manta_output- 结果过滤与注释:
使用bcftools过滤和注释BCF/VCF文件:
bcftools filter -s LowQual -i'%QUAL>20' output.bcf -o filtered_output.vcf bcftools annotate -a annotations.gff -c INFO filtered_output.vcf -o annotated_output.vcf- 生物学解释:
使用生物信息学工具进行进一步分析: 例如,可以使用BEDTools、GATK等进行进一步的注释和生物学解释。 - 结果验证:
验证结果,例如使用PCR或Sanger测序。
- 结构变异检测:
-
GATK变异检测
数据类型:Illumina数据
软件版本:Gatk 4.1.8.1、fastp 0.20.0、bwa 0.7.17、samtools 1.9
https://blog.csdn.net/weixin_45606903/article/details/107971777 -
4. svtyper:
用途: svtyper 主要用于结构变异的基因型调用,从已检测到的结构变异结果中生成样本的基因型。
特点: 通过考虑拆分读取和杂交读取,为每个样本生成基因型。主要用于从已有的结构变异检测结果中获取更精确的基因型信息。
选择使用哪个工具或者结合它们的结果进行综合分析应该基于具体的研究问题和数据特点。在使用这些工具时,请查阅相应的文档以了解最佳实践和参数调整建议。
-
-
LUMPY和SVTyper:
- 用途:LUMPY 是一个用于发现结构变异的工具。它可以检测出插入、删除、倒位和易位等多种类型的 SV。SVTyper 是一个补充工具,用于对 LUMPY 发现的 SV 进行基因分型。
- 特点:LUMPY 的独特之处在于它结合了多种信号,包括配对末端测序、跨区域读取和读取深度,以提高 SV 检测的准确性。SVTyper 则利用这些信息来确定特定的基因型。它们通常联合使用,LUMPY 负责检测 SV,而 SVTyper 负责分型。
Delly:
- 用途:Delly 旨在发现、分类和分型结构变异,包括删除、重复、易位、倒位和插入等。
- 特点:Delly 使用配对末端测序和跨区域读取来识别 SV。它在处理大型结构变异方面表现出色,并且适用于多样本分析,有助于比较不同样本间的 SV。
Manta:
- 用途:Manta 快速准确地检测各种大小的 SV,特别擅长在肿瘤样本等复杂基因组中检测小型至中等大小的 SV。
- 特点:Manta 以其速度和灵敏度而闻名,尤其是在处理小型 SV 上。它综合了配对末端和跨区域读取的信息,能够快速识别出多种类型的 SV。
总结:
LUMPY-SVTyper 是一种综合性工具,能够检测和分型多种类型的 SV,特别是在多种类型的信号结合使用时效果更佳。
Delly 强于处理大型 SV,适合多样本分析和比较。
Manta 在处理小型至中等大小的 SV 上表现优秀,特别适用于复杂的基因组如肿瘤样本。 -