谷歌开源诺奖化学模型 Alphafold-3
谷歌终于开源了万众期待的蛋白质预测模型——AlphaFold-3。上个月,谷歌DeepMind联合创始人兼首席执行官Demis Hassabis能拿下诺贝尔化学奖,靠的就是AlphaFold-3。
全球顶级科学期刊《Nature》也进行了重磅推荐,这将对全球科研领域产生重大影响,生物、化学、医药的科学家们可以在本地部署AlphaFold-3,可以极限缩短新药、疫苗等研发进程。
谷歌本次开源AlphaFold-3模型非常非常低调,甚至都没有发布一篇新闻,只是在原来文章上进行了一段很小的文字说明:
2024年11月11日更新,我们已发布了AlphaFold 3的模型代码和权重供学术用途,以帮助推动科学研究。
AlphaFold-3的主要功能包括,能够对多种生物分子的结构进行预测,涵盖蛋白质、核酸(包括 DNA 和 RNA)、小分子、离子以及修饰残基等几乎所有在蛋白质数据库(PDB)中存在的分子类型。
在蛋白质结构预测方面,AlphaFold 3 展现出了极高的准确率,在预测蛋白质单体结构时,能够准确地确定蛋白质的三维折叠方式,包括二级结构α - 螺旋、β - 折叠等精确位置和走向,以及三级结构中各个结构域的相对位置和取向。
AlphaFold 3 在处理复杂结构方面表现出色,能够应对具有大量残基和多种分子组成的生物分子复合物。例如,在预测由数千个残基组成的蛋白质 - 核酸复合物结构时,它可以有效地整合蛋白质和核酸分子的信息,准确地构建出整个复合物的三维结构模型。
对于具有高度对称性或重复结构单元的复合物,如核小体等,AlphaFold 3 也能够准确地捕捉到其结构特征,包括组蛋白与 DNA 的相互作用、核小体之间的排列方式等。
在药物研发领域,AlphaFold 3可以帮助研究人员快速筛选潜在的药物靶点,通过预测靶点蛋白的结构,揭示其可能的活性位点和结合口袋,为药物设计提供重要的结构基础。
在药物分子设计阶段,AlphaFold 3 能够预测药物分子与靶点蛋白的结合模式,评估药物分子的亲和力和特异性,从而指导药物化学家进行分子优化,提高药物的疗效和安全性。
同时可以对药物分子与靶点蛋白复合物结构的准确预测,帮助研究人员理解药物作用机制,预测药物的副作用和耐药性机制,为药物研发的各个阶段提供关键的结构信息支持。
模型架构方面,AlphaFold 3在AlphaFold 2的基础之上进行了重大更新。尤其是引入了Pairformer模块替代原有的Evoformer模块,AlphaFold 3显著减少了多重序列比对(MSA)的处理量,使得模型能够更加专注于学习分子间相互作用的关键特征。
这一变化不仅提高了计算效率,更重要的是,它赋予了模型更强的泛化能力,使得AlphaFold 3能够在处理各类生物分子时都能保持高水平的准确性。
AlphaFold 3还通过引入扩散模块,直接预测原子坐标的创新设计,进一步增强了模型的功能。传统的结构预测方法往往依赖于氨基酸特定框架或侧链扭转角来进行预测,这在一定程度上限制了模型处理不同分子类型的能力。而AlphaFold 3的扩散模块直接操作于原子坐标层面,采用了一种更加直观且物理上更为合理的建模方式。
这种方法不仅简化了模型架构,避免了对复杂规则的依赖,还使得AlphaFold 3能够无缝处理各种类型的生物分子,无论是蛋白质、DNA、RNA还是小分子配体,都能提供精准的结构预测结果。
此外,AlphaFold 3在训练方法上也进行了重要的改进。通过采用跨蒸馏技术,AlphaFold 3能够利用由AlphaFold-Multimer v.2.3等高性能模型生成的大规模伪标签数据进行训练。这种策略不仅解决了高质量训练数据不足的问题,还进一步提升了模型的鲁棒性和泛化能力。
经过这样的训练流程后,AlphaFold 3不仅在标准测试集上表现出色,还能很好地应对那些罕见或复杂的生物分子复合体结构预测任务,显示出其强大的适应性和可靠性。
实验结果表明,经过这样的训练流程后,AlphaFold 3不仅在标准测试集上表现出色,还能很好地应对那些罕见或复杂的生物分子复合体结构预测任务,显示出其强大的适应性和可靠性。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
RWKV 通过几万 token 的 CoT 解决几乎 100% 的数独问题
RWKV 做 CoT 特别有优势,因为推理速度和显存占用与上下文无关。即使做几百万 token 的 CoT 也不会变慢或额外消耗显存。 RWKV 社区开发者 @Jellyfish042 训练了一个用于解决数独谜题 的专用 RWKV 模型 Sudoku-RWKV ,项目的训练代码 和数据制作脚本均已开源。 GitHub 仓库:https://github.com/Jellyfish042/Sudoku-RWKV Sudoku-RWKV 使用 700k 条数独专用的 COT 数据进行训练,数据总量约 25B(250 亿) token。这些数据均使用仓库内的 generate_sudoku_data.py脚本自动生成。 100% 准确率 在 Jellyfish042 的测试中,Sudoku-RWKV 对最高 50 个空单元格的数独实现了 100% 的准确率。 高达 50 个空单元格的数独,解题难度会呈指数上升,而 RWKV 模型通过几万个 token 的 CoT 仍然可以实现近乎 100% 的解题率。 什么是数独 数独是一种逻辑游戏,玩家需要根据 9×9 盘面上的已知数字,推理出所有剩余空格...
- 下一篇
VMware Fusion 和 Workstation 现在对所有用户免费
2024 年 5 月,VMware 面向 Mac 的 Workstation Pro 和 Fusion Pro 面向个人用户免费提供,只有商业客户才需要购买专用许可证。 几个月后的今天,VMware 又宣布了一项消息: 该公司将向包括商业、教育和个人用户在内的所有人免费提供其管理程序软件。 随着这项宣布的发布,VMwareWorkstation Pro 和 Fusion Pro 不再提供购买服务,所有用户现在可以免费使用 Fusion 和 Workstation。 与此同时,持有商业许可证的现有客户在协议到期前仍可继续使用。 在此之后,客户仍可继续使用产品,但无法获得故障排除支持。 随着 VMware Workstation 和 Fusion 转向完全免费模式,VMware 将通过社区访问、产品文档和知识库文章为用户提供必要的文档和支持。 展望未来,VMware 承诺将继续投资于新功能,提供性能可靠的及时更新,并优化产品以"提供更大的价值"。 这一转变为我们用户社区内的协作、反馈和发展提供了令人兴奋的可能性。 我们迫切希望看到我们的产品将如何增强新老用户的能力。 感谢您参与我们的发展历...
相关文章
文章评论
共有0条评论来说两句吧...