
两种广泛使用的基因研究方法揭示了不同类型的致病基因靶点,这一发现有望彻底改变制药公司优先选择药物靶点的方式。2023年11月5日发表在《自然》(Nature)杂志上的一项开创性研究,由纽约大学朗格尼健康中心、斯坦福大学、加州大学旧金山分校和东京大学的科学家共同主导,通过分析超过20万人的遗传数据,深入探究了为何这些方法会产生相互矛盾的结果。
不同方法,不同基因靶点
这项研究利用英国生物样本库(UK Biobank)的数据,对209种性状进行了全基因组关联研究(GWAS)与负荷测试(burden tests)的比较。GWAS旨在检测全基因组的常见遗传变异,以发现其与疾病的关联;而负荷测试则侧重于影响蛋白质功能的罕见变异。尽管两者都针对相同的疾病,研究人员却发现,这些方法系统性地识别出不同的基因。
“这项研究解释了为何这两种方法会产生不同的结果,以及为何它们在生物学上都至关重要,”纽约大学格罗斯曼医学院人口健康系助理教授、共同资深作者哈卡马内什·莫斯塔法维(Hakhamanesh Mostafavi)博士指出。负荷测试主要识别那些仅对特定疾病有影响,而对其他性状影响甚微的基因;相比之下,GWAS不仅能检测到疾病特异性基因,还能发现“多效性”(pleiotropic)基因,这类基因同时影响多种疾病和生物过程。
研究人员发现,关键差异源于进化的压力。那些严重扰乱多个性状基因的变异,由于会降低生存或繁殖成功率,在自然选择过程中被淘汰,因此在人群中变得极为罕见,这使得负荷测试难以检测到它们。然而,GWAS仍能通过更微妙地影响基因活性的调控DNA变异来识别这些基因。
挑战统计假设:p值并非万能
或许最令人惊讶的是,研究揭示p值——这一衡量统计可靠性的标准——在这两种方法中都不能很好地指示基因的实际生物学重要性。这一发现挑战了研究人员目前优先选择药物开发基因的方式,因为统计学上最显著的基因不一定具有最大的生物学影响。
旧金山加州大学的共同资深作者杰弗里·斯彭斯(Jeffrey Spence)博士强调了这一变革性潜力:“这将是革命性的,因为它能让我们利用所有细胞层面的实验数据来了解人类层面的性状,识别最重要的疾病基因,并简化药物开发流程。”
机器学习方案:解锁精准药物靶点
该研究团队正在开发新的机器学习方法,将基因关联数据与迅速增长的描述细胞基因功能的实验数据集相结合。这些方法旨在识别基因的“重要性”——即一个基因在被扰乱时对疾病影响的程度——以及“特异性”——即一个基因是主要影响一种疾病还是多种性状。
这种双参数方法可以帮助制药公司识别最佳药物靶点:那些对疾病有强大影响且具有高度特异性的基因,它们能最大限度地提高治疗效益,同时最大限度地减少副作用。研究人员表示,这种整合方法有望为疾病机制提供更清晰的见解和更具战略性的治疗干预措施,从而加速发现针对个体基因特征量身定制的治疗方案。
