简化基因组分析
-
https://www.yn-tobacco.com/gzfw/rqfw/xfz/jyzwjb/201801/t20180112_215188.html
烟草有参考基因组吗?
普通烟草(Nicotiana tabacum)为异源四倍体植物,基因组大小约 4.5G,基因组结构高度复杂。美国烟草基因组计划对四倍体烤烟品种采用甲基过滤法测序只获得了部分基因序列信息。我国烟草基因组计划完成了对普通烟草的两个祖先种绒毛状烟草(N. tomentosiformis)和林烟草(N. sylvestris)全基因组序列图谱的绘制,更充分地验证了烟草基因组结构高度复杂这一事实。在林烟草和绒毛状烟草7万多个基因中,有1万多个属于高度同源基因,就像孪生兄弟一样十分相像,常规的表达谱芯片探针设计难以有效区分鉴别。
N.tomentosiformis 绒毛状烟草
N.sylvestris 林烟草
N.tabacum 普通烟草
用tobacco搜索NCBI 有参考基因组 到时侯也可以和客户沟通下用哪个 -
实际测试:
鸿元服务器 /home/bioinfo/radseq
process_radtags -p . -o 1-cleandata/ -e sbfI -c -q -r
zgrep TGCAGG --color=always SRR828261.1.fq.gz |head -n 20
//比对
bwa mem ../Gasterosteus_aculeatus.BROADS1.dna.toplevel.fa ../SRR828261.1.fastq |gzip -3 > SRR828261.1.sam.gz
//查看比对率
samtools flagstat SRR828303.1.sam.gz
//构建loci
gstacks -I ../2-align/ -M popmap -O output -t 8
//populations分析
populations -P ../3-build-loci/output/ -M ./popmap -r 0.65 --vcf --genepop --fstats --smooth --hwe -t 8 -
-
-
-
-
-
-
-
python tagdigger_script.py -w . -b samples.csv -o mycounts.csv -k markerstokeep.txt --StacksTags ../ANCHA180152/ustack/catalog.tags.tsv.gz --StacksSNPs ../ANCHA180152/ustack/catalog.snps.tsv.gz --StacksAlleles ../ANCHA180152/ustack/catalog.alleles.tsv.gz
-

https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0201254
A RAD-sequencing approach to genome-wide marker discovery, genotyping, and phylogenetic inference in a diverse radiation of primates -
https://groups.google.com/g/stacks-users/c/1n6O98oWO2o/m/oRm3FYZTs1IJ?pli=1
Stacks不太适合多倍体(大于2)