GWAS-pLINK分析
-
Plink得到的结果是什么意思
#CHROM POS ID REF ALT A1 TEST OBS_CT BETA SE T_STAT P
1 1 rs6681049 2 1 1 ADD 89 -0.0910344 0.299102 -0.304359 0.761598
1 1 rs6681049 2 1 1 COVAR1 89 1.3589 0.233948 5.80856 1.06519e-07
1 1 rs6681049 2 1 1 ADDxCOVAR1 89 -0.138503 0.300469 -0.460957 0.646007CHROM:染色体编号。
POS:位点(SNP)的物理位置。
ID:位点的标识符(通常是rs号)。
REF:参考等位基因。
ALT:替代等位基因。
A1:分析中用作效应等位基因的等位基因。
TEST:统计检验类型,包括"ADD"(加法模型)和"COVAR1"(协变量1模型)等。
OBS_CT:观测样本数量。
BETA:回归系数或效应量,表示与某个特征(例如,疾病状态或表型)的关联性。
SE:回归系数的标准误差。
T_STAT:回归系数的t统计量,用于检验系数是否显著。
P:相关性或回归系数的p值,用于确定结果是否具有统计学意义。 -
什么是"ADD"(加法模型)和"COVAR1"(协变量1模型)
"ADD"(加法模型)和"COVAR1"(协变量1模型)是在遗传关联分析中常用的两种不同的分析模型,用于研究基因型与某个表型(通常是疾病状态或其他特征)之间的关系。这些模型的解释如下:
加法模型 ("ADD"):这是最简单的遗传关联分析模型之一。在加法模型中,假设每个等位基因对于表型的影响是独立的,基因型对表型的影响是累积的。通常,这个模型用于分析单一位点(SNP)与表型之间的关联。回归系数(BETA)表示了每个额外的效应等位基因对表型的影响,标准误差(SE)和t统计量(T_STAT)用于确定这个效应是否显著。p值(P)用于衡量关联的统计显著性。
协变量模型 ("COVAR1"):协变量模型考虑了一个或多个协变量(通常是连续或分类变量),以控制这些协变量对表型的影响,从而更准确地评估基因型与表型之间的关联。在示例中,"COVAR1"表示使用一个名为"COVAR1"的协变量模型,其中协变量1用于调整分析,以控制可能对表型的影响。协变量模型可以提高分析的灵敏度,并有助于排除其他因素对关联的干扰。
总之,"ADD"模型假定基因型的效应是累积的,而"COVAR1"模型引入协变量以考虑其他可能影响表型的因素,从而更精确地评估基因型与表型之间的关系。选择哪种模型取决于研究的具体问题以及是否需要考虑其他潜在的协变量。
-
plink2 \ --bed ~{bed_file} \ --bim ~{bim_file} \ --fam ~{fam_file} \ --logistic interaction \ --out ~{output_name} \ --pheno ~{pheno} \ --1 \ --covar ~{covar} \ --covar-variance-standardize \ --maf 0.05 \ --threads ~{cpu} \ --memory ~{memory_for_plink}Phenotype File (pheno):
用途: 这个文件包含了表型(Phenotype)数据。在GWAS中,表型是你要研究的特征或疾病状态。例如,它可能是个体的身高、体重,或者某种疾病的有无。
格式: 这个文件通常包含了个体的标识符和它们的表型值。表型文件通常有两列或更多列,第一列是个体的标识符(与FAM文件中的ID对应),后面的列是对应的表型值。
示例:
Copy code
ID1 2
ID2 2
ID3 1
ID4 2
在这个示例中,第一列是个体标识符,第二列是表型值(例如,1表示无疾病,2表示有疾病)。Covariate File (covar):
用途: 协变量文件包含了可能影响表型的其他因素的信息。在GWAS中,协变量用来控制这些额外因素的影响,如年龄、性别或者其他生物学或社会经济因素。
格式: 这个文件的格式与表型文件类似,也包含个体的标识符和一个或多个协变量的值。格式通常是第一列为个体标识符,后面的列是不同的协变量值。
示例:
Copy code
ID1 1 25
ID2 2 30
ID3 1 28
ID4 2 35
在这个示例中,第一列是个体标识符,第二列可能是性别(1表示男性,2表示女性),第三列是年龄。 -
ADD (Additive Model):
这代表加性模型的测试结果,通常是基因型数据的主要分析方法。
在加性模型中,假设一个等位基因的效应(对表型的影响)是加性的,即不考虑基因间的相互作用。
在输出中,ADD 行表示单个等位基因变化对表型的影响,即每增加一个特定等位基因,表型(比如疾病风险)如何变化。
COVAR1 (Covariate):这表示单独考虑协变量(例如,年龄、性别)对表型的影响的结果。
COVAR1 测试的目的是估计协变量本身对表型的影响,而不是基因型。
这有助于理解和控制这些非遗传因素对研究结果的潜在影响。
ADDxCOVAR1 (Interaction between Additive Genetic Effect and Covariate):这代表基因型(加性效应)和协变量之间交互作用的测试结果。
该测试旨在评估特定的基因型和协变量(如性别、年龄等)之间是否存在交互作用,这种交互作用是否影响了表型。
例如,某个基因变体对疾病风险的影响可能在不同年龄或性别的人群中有所不同。
在解释这些结果时,重要的是要考虑到你的特定研究目标和上下文。ADD 结果通常是最关注的,因为它直接关系到基因型与表型之间的关联。COVAR1 和 ADDxCOVAR1 的结果有助于理解和解释这些基因型-表型关联可能受哪些其他因素的影响。