
哈佛医学院与巴塞罗那基因组调控中心的科研团队近日突破性地开发出新型人工智能模型,通过分析数十万个物种的进化数据,能够精准识别致病基因突变。这项发表于《自然·遗传学》的研究成果,或将彻底变革罕见疾病的临床诊断模式。
这款名为popEVE的AI模型在31,000余例重症发育障碍患儿的基因分析中,实现了98%的致病突变精准识别率。研究显示其诊断效能显著超越DeepMind开发的AlphaMissense等同类模型,更首次发现123个潜在致病新基因,其中104个基因仅在单例或两例患者中观察到。
popEVE的创新之处在于融合了亿万年的生物进化史与当代人群基因组数据。该模型通过解析2万种人类蛋白质的结构特征,精准判断哪些区域为生命必需功能区,同时整合英国生物样本库与gnomAD数据库的健康人群变异信息,构建出多维度的基因致病性评估体系。
“临床诊断往往面临患者父母DNA数据缺失的困境”,基因组调控中心研究员、论文共同通讯作者Mafalda Dias博士指出,”popEVE仅需患者个体基因信息即可实现精准诊断,这对医疗资源有限的地区具有重要价值”。相较于需要父母双方基因数据的传统三联测序技术,新方法可使诊断效率提升60%,成本降低40%。
该模型的另一突破在于有效规避了基因数据库中的族群偏差问题。全球现有基因数据约78%来自欧洲裔人群,导致其他族裔的基因诊断准确率显著偏低。popEVE采用平等评估机制,无论基因变异在特定族群中仅出现单次,或在欧洲人群中重复数千次,均采用统一评判标准。
“任何个体都不应因所属族群在数据库中的代表性不足而获得不准确的诊断结果”,课题组共同负责人Jonathan Frazer博士强调,”这项技术将推动基因医学迈向更公平的发展阶段”。目前全球近半数的罕见病患者始终无法获得明确诊断,而popEVE目前专注于错义突变(即导致蛋白质单个氨基酸改变的DNA变异)的解读,为临床决策提供重要参考。
