8 月 22 日消息,科技媒体 The Decoder 昨日(8 月 21 日)发布博文,报道称罗格斯大学的一项研究表明,OpenAI 公司的 GPT-4 语言模型能高精度模拟简单的氨基酸和蛋白质结构。
相关研究成果发表在《Scientific Reports》上,该科研团队使用 GPT-4 AI 语言模型,探索其在基本结构生物学任务中的表现,结果发现该 AI 模型可以准确预测分子结构。
科学家们要求 GPT-4 建立 20 种标准氨基酸的三维结构模型,在反馈结果中准确地预测了原子组成、键长和角度,不过 GPT-4 在模拟环状结构和立体化学构型时却出现了错误。
在另一项实验中,GPT-4 被要求模拟常见的蛋白质结构元素--α-螺旋的结构,需要集成 Wolfram 插件进行数学计算,结果模型与实验确定的 α-螺旋结构相当。
此外,GPT-4 还分析了抗病毒药物 Nirmatrelvir 与 SARS-CoV-2 主要蛋白酶之间的结合。该模型正确识别了参与结合的氨基酸,并准确指定了相互作用原子之间的距离。
由于 GPT-4 并不是专门为结构生物学任务开发的,因此这些能力非常突出。研究人员指出,GPT-4 的建模方法尚不明确。它可以使用训练数据集中的现有原子坐标,也可以从头开始重新计算结构--要得出明确的结论,还需要进一步的广泛研究。
研究人员表示,AlphaFold 3 等专用人工智能工具可以预测更复杂的结构,而 GPT-4 则有望完成基本的结构生物学任务。这种建模能力目前还很初级,实际应用有限。
尽管如此,研究小组表示,这项研究开创了将这种技术应用于结构生物学的先例。研究人员建议进一步研究生成式人工智能的能力和局限性,可以在结构生物学领域之外,进一步探索 AI 在其他潜在的生命科学领域的应用。