生命科学学院 新闻动态

杨剑团队开发OPERA精确地定位人类复杂疾病相关基因和基因组功能区

面对相同的慢性疾病或病原体侵入,为什么有些人具有较强的抵抗力,而另一些人则恰恰相反?这种差异是由我们的基因差异造成的吗?如果是,这些基因又位于哪里?在最近的一项研究中,您可能会找到这两个问题的一些解答。

北京时间202361923点,Cell Genomics在线发表了一篇研究论文,题为Joint analysis of GWAS and multi-omics QTL summary statistics reveals a large fraction of GWAS signals shared with molecular phenotypes”。该研究开发了一种名为OPERA的方法,通过高效地整合分析大规模人群的基因组学和多组学数据,精确地定位人类复杂疾病相关基因和基因组功能区,促进我们对复杂疾病遗传调控机制的理解。

人类的行为、生理特征以及对疾病的易感性等复杂性状,均受到众多遗传和环境因素的共同影响。这些性状包括身高、体重指数,以及对慢性疾病(如糖尿病、精神疾病和癌症)或病原体侵染(如新冠病毒)的易感性等。

定位复杂性状的遗传位点是一项极具挑战性的任务,主要原因在于每个位点对性状的单独贡献通常较小。因此,为了确定某个遗传位点是否影响性状,需要将人群根据是否携带特定遗传变异位点进行分组,并比较各组之间的平均值。在这类试验中,人群数量越大,平均值估计越准确,从而更有可能发现组间的细微差异。因此,这种实验设计的关键因素是人群数量以及遗传变异位点在基因组上的覆盖度。

高通量测序和分子标记检测技术的发展使得在大规模人群中进行全基因组水平的遗传位点检测成为可能,从而促进了全基因组关联研究(GWAS)的发展。GWAS通过无偏的方式扫描大规模人群的基因组,寻找与复杂性状相关的遗传变异位点。随着GWAS人群数量的不断增加,已经定位了数以万计的复杂性状遗传位点。然而,绝大部分这些GWAS位点对应的基因尚不明确,极大地阻碍了我们对相关分子机制的理解,从而难以将GWAS结果转化为生物学机制和临床应用。

分子性状位点(xQTL)是影响分子表型(如基因表达、蛋白质水平或表观遗传修饰)的遗传位点。将xQTL数据与GWAS结果整合,有助于深入了解遗传变异与复杂性状之间关联的分子机制。

本研究开发的OPERA方法是该领域的重要突破,它可以整合来自多个组学层次的xQTL数据和GWAS数据,判断哪些分子表型与性状共享潜在的遗传调控机制,从而将众多分子表型和复杂性状进行遗传关联。这种同时整合多个组学xQTLGWAS数据的分析方法不仅突破了计算瓶颈,更重要的是提高了统计检验的功效,使得大量原本功能未知的GWAS位点与分子表型产生遗传关联,为揭示GWAS位点背后的生物学机制迈出了重要一步。

OPERA方法的另一个优点是不需要原始的基因型、性状表型或组学数据,只需利用GWASxQTL研究的概括性统计量进行分析。这种特性既增加了数据分析的灵活性,也加强了数据的隐私和安全保护。

利用OPERA分析了50个复杂性状的GWAS数据和7个组学层次的xQTL数据后,研究人员检测到了17,619个与复杂性状存在遗传关联的分子表型,并发现了近50%的复杂性状GWAS位点可以与至少一个分子表型存在遗传关联。这一发现加深了我们对分子表型如何介导遗传效应从而影响复杂性状的理解。特别是那些与多个分子表型共享遗传调控位点的GWAS信号,如前列腺癌在MSMB基因位点的信号,对于进一步揭示复杂性状的遗传调控机制提供重要的理论和数据支持。这项研究为我们从GWAS信号到复杂性状基因迈出了重要的一步,这些复杂疾病新基因的发现将为新治疗方案的开发提供许多新的靶点,有助于为各种疾病和病状开发更有针对性和有效的治疗方法。

此外,该研究还展望了未来研究方向,认为需要更深入地开展分子表型研究,结合更大的人群数量并同时考虑时空效应,以期构建一个更全面的分子表型和GWAS信号遗传关联图谱。这将持续加深我们对遗传变异与复杂性状之间关系的理解,为未来疾病预防和治疗提供更多的可能性。

本研究的第一作者是毕业于澳大利亚昆士兰大学的吴洋博士(现任四川大学特聘研究员),昆士兰大学高级研究员曾剑博士和西湖大学杨剑教授是本文的共同通讯作者。


论文链接:

https://www.cell.com/cell-genomics/fulltext/S2666-979X(23)00119-2