谷歌DeepMind的AI工具网越织越密,其并未止步于对蛋白质等生物分子的预测,还深入布局蛋白质设计领域。
今年5月,DeepMind推出AlphaFold 3,能够较为精准地预测蛋白质和其他生物分子的结构和相互作用,但无法创造新的蛋白质来直接操纵这些相互作用。
实际上,科学家可以创造出成功与靶分子结合的新型蛋白质,推进药物研发、疾病理解和诊断等研究领域。尽管机器学习在蛋白质设计方面已取得进展,但实验过程仍耗时耗力。
日前,DeepMind推出了其首个专为设计新型高强度蛋白质结合物的AI系统AlphaProteo,为多种目标蛋白生成新的蛋白结合体。
沙利文大中华区执行总监周明子向21世纪经济报道记者介绍,AlphaFold和AlphaProteo都处于靶点发现和药物研发的前端,但AlphaProteo更进一步,其对蛋白质粘合剂的设计能力,加速推进了AI在靶点发现及药物研发方面的应用进程。
“AlphaProteo对药物研发的重要性主要体现在缩短药物研发时间,且提高了研发有效性。AlphaProteo作为专为设计新型高强度蛋白质结合物的AI系统,能够为多种目标蛋白生成新的蛋白结合体,尤其在癌症和糖尿病并发症治疗相关的VEGF-A蛋白结合物设计上取得了历史性进展。此外,AlphaProteo作为蛋白组学领域的新突破,以药物研发为原点,可向农业、食物科学等多个领域发展,应用前景广阔。”周明子说。
实验亮点
在科学研究中,想要设计出可以与靶蛋白紧密结合的蛋白结合剂并不容易,传统方法非常费力,且创建结合剂后,还需要多轮实验优化结合亲和力。
“AlphaProteo可直接用于设计新型高强度蛋白质粘合剂,加速了蛋白质靶标的发现和药物研发的进程。”周明子表示,AlphaFold目前已经积累了超1亿的蛋白质预测结构,AlphaProteo可以在此基础上,通过蛋白质数据库(PDB)中的大量蛋白质数据进行训练,从而掌握了各种分子结合方式。通过给定目标分子结构及该分子上的一组首选结合位置,AlphaProteo可生成相应的候选蛋白质。
为了测试 AlphaProteo,研究人员设计了针对各种靶蛋白的结合剂,包括两种与感染有关的病毒蛋白BHRF1和SARS-CoV-2刺突蛋白受体结合域SC2RBD,以及五种与癌症、炎症和自身免疫性疾病有关的蛋白IL-7Rɑ、PD-L1、TrkA、IL-17A和VEGF-A。
为什么研究人员会选择这几种蛋白质做实验,在选择上更偏向于实用还是更可能发挥该技术的能力?对此,周明子认为,AlphaProteo选择与癌症、炎症、自身免疫疾病以及病毒感染相关的蛋白质作为实验目标,是基于这些领域的广泛研究需求和对疾病治疗的深远影响。从选择上来看,两方面都有考虑到,但实用性或是考虑更多的因素。
从实用性来看,感染、癌症、炎症和自身免疫疾病相关领域需要精准药物研发及更快的药物研发进程,AlphaProteo的应用能够加速该领域的研发进程。从能力发挥方面来看,目前已有对感染、癌症、炎症和自身免疫疾病相关的蛋白质领域较为深入的研究基础,因此,选择该领域更能验证AlphaProteo的技术精准性及能力。
结合研究报告,周明子认为,与以往技术相比,AlphaProteo蛋白设计平台的亮点主要体现在几个方面,首先蛋白质设计成功率破纪录,在测试的7种靶蛋白上,AlphaProteo的实验成功率更高,在湿实验室中测试时,9%—88%候选分子成功结合,这比其他方法高出5—100倍。而且,比现有最佳方法的结合亲和力高出3—300倍。
其次,AlphaProteo能够生成适用于多种应用的“即用型”结合剂,仅需一轮中等通量筛选,无需进一步优化;另外,AlphaProteo不仅能够设计针对单一目标的蛋白质结合体,还能够设计针对多种目标蛋白质的结合体,包括与癌症、炎症、自身免疫疾病以及病毒相关的目标蛋白质。
业内普遍认为,这一突破性成果不仅极大地提高了研究效率,将原本需要数年的实验室工作缩短至几周甚至几天,而且为未来的药物研发开辟了新的可能性。
“不仅如此,AlphaProteo也为解决更多深远的生物学问题提供了更大的可能性,并为药物设计提供了更大的可能性。其设计原理是通过紧密附着在病毒或癌细胞上,阻止它们之间的信号传递,从而扰乱其功能,最终导致病原体或癌细胞的死亡。这一机制为预防病毒感染和治疗癌症等提供了新的策略。”周明子说。
值得注意的是,研究显示,AlphaProteo无法针对与类风湿性关节炎等自身免疫性疾病相关的TNFɑ设计成功的粘合剂,不过,计算分析表明针对TNFɑ设计粘合剂非常困难,这也是研究人员选择它用来开展测试的原因。
大规模落地仍有壁垒
从目前的研究进展来看,AlphaProteo已经展示出在多种蛋白质靶标上的高成功率和高亲和力,但想要大规模用于药物研发仍有一些壁垒需要打破。
“至少还需要5—10年的时间实现真正大规模用于药物研发。”周明子判断,AlphaProteo大规模应用仍有一些挑战,首先,尽管该系统在中等通量筛选中表现优异,但实验验证的目标蛋白数量相对较少,这意味着在更广泛的蛋白质靶标上,可能仍存在一些难以预测的挑战。
其次,现有的设计依赖于目标蛋白的晶体结构,许多潜在的药物靶标可能没有已知的高分辨率结构,这对AlphaProteo的广泛应用提出了新的需求。
此外,虽然AlphaProteo生成的结合物具有出色的热稳定性,但这些结合物在复杂的体内环境中的长期稳定性和有效性仍需进一步验证。
周明子进一步表示,在追求技术革新以推动AlphaProteo系统应用的过程中,研究团队面临三大关键挑战:首先,需对算法进行深度优化,以扩展其适用性至缺乏高分辨率晶体结构的蛋白靶标,实现更广泛的目标覆盖;其次,尽管当前已通过中等通量筛选获得了高亲和力结合物,但为了确保针对复杂靶标的结合物具备有效性和特异性,仍需开展多轮筛选与优化;此外,鉴于现有研究主要局限于体外实验,确保这些结合物在体内环境中保持稳定并发挥效力,成为下一阶段必须攻克的重要课题。
值得一提的是,AlphaProteo的部分细节和研究成果并未完全开源,尤其是涉及生物安全性和商业用途的部分内容。
周明子认为,尽管某些方法和结果已经在学术文献中公开,但核心的机器学习模型和算法尚未向公众开放。这种有限开源的策略主要出于对技术滥用和安全风险的考虑。开源能够促进全球科研界共同推进技术进步,增加其应用广度;但出于生物安全的考虑,某些高风险应用可能需要谨慎对待,以防止技术被滥用。
“部分开源或许将是主流,将部分内容开源提供给大学等科研机构使用,同时保留核心技术,是一种平衡科学普及与商业利益的策略。这种做法既能促进学术研究,又能为技术持续创新提供资金支持,同时通过控制核心技术确保技术的质量和安全,实现双赢局面。”周明子说。
尽管当前AlphaProteo并未完全开源,但该项技术的出现仍将为我国科研界和生物制药企业带来药物研发思路的重大创新。
“面对这一趋势,我国科研界需加强对该技术的学习和应用,促进跨学科合作,特别是在人工智能与生物医学领域的融合。同时,企业应加大前沿生物技术的投入,构建强大的技术研发能力与国际合作网络,以把握未来的市场机遇。”周明子表示。
转载来源:21世纪经济报道 作者:闫硕