植物GWAS数据分析

Reply to 植物GWAS数据分析 on Mon, 18 Dec 2023 09:17:35 GMT

mengpf — Mon, 18 Dec 2023 09:17:35 GMT

比较经典的文献
https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzIyNzIyNTczNA==&action=getalbum&album_id=1538356061521444865&scene=173&subscene=&sessionid=undefined&enterid=0&from_msgid=2247523779&from_itemidx=3&count=3&nolastread=1#wechat_redirect

Reply to 植物GWAS数据分析 on Mon, 18 Dec 2023 08:23:22 GMT

mengpf — Mon, 18 Dec 2023 08:23:22 GMT

@mengpf

Reply to 植物GWAS数据分析 on Mon, 18 Dec 2023 08:17:21 GMT

mengpf — Mon, 18 Dec 2023 08:17:21 GMT

@mengpf
连锁不平衡分析（LD）

指在某一群体中，不同座位上某两个基因同时遗传的频率明显高于预期的随机频率的现象。LD在染色体上的分布一般用LD衰减图来描述，可以观测LD随遗传或物理距离的衰减速率。

一般来说，在连锁不平衡分析中，驯化种由于受到了正选择的作用，LD值就会偏大，这是因为在一段DNA序列中位点与位点之间存在着连锁的关系。不同位点间的连锁构成了“单倍体型”，随着重组的积累，特定的单倍体型会被削弱而逐渐消失。由于重组率与连锁距离有关，所以连锁不平衡范围会逐渐缩短。对于新产生的一个单倍体型，由于重组来不及破坏位点之间的连锁，所以它们之间连锁不平衡的距离往往比较远。在中性条件下，如果某个单倍体型是较新产生的，那么它的频率往往较低，而频率较高的单倍体型，需要经历很长一段时间才可能因为受到随机漂变的影响达到较高的频率。如果群体经历了正向选择，那么与有利位点连锁的周围位点会由于搭载效应而导致频率很快提升，所以包含有利位点的单倍体型一方面有着较高的频率，另一方面由于经历的时间不长，因此也有这较长的LD影响范围。这种特征为检测是否发生了正向选择提供了一个有效的突破点。

Reply to 植物GWAS数据分析 on Mon, 18 Dec 2023 07:59:21 GMT

mengpf — Mon, 18 Dec 2023 07:59:21 GMT

@mengpf 第4篇参考文献：栽培桃（Prunus persica (L.) Batsch）
链接：https://www.nature.com/articles/s41467-021-23879-2

这篇文献是很典型的群体研究思路，测序后得到变异位点，基于这些位点进行全基因组关联分析和遗传进化分析，得到候选基因，挑选感兴趣的基因，对其进行单倍型分析和实验验证。

整体思路：
高质量桃基因组组装

种群结构分析

群体分化选择

全基因组关联分析鉴定重要性状的相关位点

具体基因功能分析及实验验证

Reply to 植物GWAS数据分析 on Mon, 18 Dec 2023 07:56:08 GMT

mengpf — Mon, 18 Dec 2023 07:56:08 GMT

@mengpf
第三篇参考文献：紫花苜蓿。这篇文献是很典型的群体研究思路，测序后得到变异位点，基于这些位点进行全基因组关联分析和遗传进化分析，得到候选基因，挑选感兴趣的基因，对其进行单倍型分析和表达分析
jipb.13172.pdf

总体思路：
重测序获得变异数据

种群结构及连锁不平衡（系统发育树，structure，LD）

遗传多样性及群体分化选择（π ，Tajima’s D，Fst，XP-CLR）

与重要性状相关位点的鉴定（GWAS）

具体基因功能分析及验证（单倍型分析，相关性分析，表达分析）