当前位置:首页 > 热点

能设计新蛋白质的AI再现突破,生成在天然蛋白质中从未见过的拓扑结构

科技日报记者 张梦然

《自然》杂志11日发表的计新见过论文描述了一项结构生物学新突破:一种能设计新蛋白质的深度学习方法,名为RoseTTAFold Diffusion(RFdiffusion)。蛋白蛋白的拓其能生成各种功能性蛋白质,质的再现质中包括在天然蛋白质中从未见过的突破天拓扑结构。


研究示意图(部分)
图片来源:《自然》网站

深度学习推动了蛋白质结构的生成预测和设计,但仍需一个通用框架来克服在蛋白质设计上遇到的扑结各种挑战。扩散模型是计新见过一种生成式模拟方法,已被证明在图像和文本生成中很有用,蛋白蛋白的拓而且似乎也适用于蛋白质设计。质的再现质中然而,突破天这类模型目前的生成成功率并不高,产生的扑结序列基本不能折叠成目标结构。

美国华盛顿大学科学家研究表明,计新见过通过细调之前报道过的蛋白蛋白的拓RoseTTAFold的结构预测网络,将其整合到一个降噪扩散模型中,质的再现质中就能生成具有实际意义的蛋白质骨架,而蛋白质骨架决定了蛋白质的形状和功能。RFdiffusion模型能测试拥有不同结构元素的设计组合,并从头开始产生蛋白质。该模型还能执行不同的任务,设计单体(蛋白质的基本组成单位)、寡聚体(多亚基聚体)、有治疗或工业应用前景的复杂结构。

团队对数百个设计出的对称聚体、金属结合蛋白和结合蛋白的结构和功能进行了实验表征,证明了该方法的实用性。他们生成了RFdiffusion设计的一种结合蛋白与其底物(此处为流感血凝素,一种在流感病毒表面发现的蛋白)的复合物并分析了其结构,发现结果与设计的模型几乎一模一样,从而证明了该方法的准确性。

研究人员表示,RFdiffusion是对目前蛋白质设计方法的一次综合改进,能产生总长度达600个残基的结构,复杂性和准确度都比之前更高,未来对该方法的进一步改进将能设计出复杂程度更高的新蛋白。

分享到: