牛津大学生物医学工程

编辑:乔杨 好困

【新智元导读】5月发布的AlphaFold 3有论文、没代码,让许多机构和团队纷纷开启了「复现AF3」的工作。率先做出成果的,是一家成立不到一年的初创Ligo,3位创始人全都是牛津大学的本科生。

谷歌DeepMind5月发布的AlphaFold 3同时席卷了生物界和计算机科学界,被认为是「有诺奖潜力的成果」。

成就如此卓著、意义如此重大,AF3的成果公开自然让众多科学家翘首以盼。

然而,DeepMind团队却泼下了一盆巨大的冷水。他们只放出了论文,并没有公布任何相关的代码或模型权重。

AlphaFold是一项千载难逢的突破,对生物科学产生了巨大影响。我认为它的作者最终会获得诺贝尔奖,因为他们解决了一个70多年来一直无法破解的巨大问题。我基本上每天都在工作中使用它,指导药物发现和实验上有用的HBV聚合酶的工程设计。

最新版本的AlphaFold3比以前更强大。它已经在我的实验室中揭示了HBV RNA最初如何与聚合酶结合的结构。不幸的是,他们更改了此版本的使用许可,限制了其用于药物发现。

如今刚刚过去不到4个月,初创公司Ligo宣布——他们已经完成了AlphaFold 3开源复现的工作。

项目地址:https://github.com/Ligo-Biosciences/AlphaFold3

这个成果相当激动人心,也得到了Figure创始人Brett Adcock的转发。

Ligo团队表示,他们正在使用AlphaFold 3的想法来进行酶设计,于是顺便开启了支线任务——复现AF3。

作为生物分子的结构预测模型,AF3主要可以用于三类任务:

预测蛋白质结构预测药物-蛋白质相互作用结构预测核酸-蛋白质复合物结构

这是结构建模技术的根本进步,整个生物科技行业理应从中受益。其应用范围广泛,包括:

CRISPR基因编辑技术:科学家可以准确看到DNA如何与「剪刀」Cas蛋白相互作用癌症研究:预测潜在药物如何与癌症靶标结合,AF3论文的亮点之一就是预测KRAS抑制剂与其靶标的复合物抗体/纳米抗体的靶向预测:AlphaFold3在这一类分子上的准确性比现有的最佳工具提高了两倍

而此次Ligo发布的模型是在单链蛋白质上训练的,可以完成上述三项功能中的第一项,即预测蛋白质结构,其他两个功能将在不久后完成训练并发布。

GitHub仓库中目前仅公开了代码,但团队表示,一旦训练和基准测试完成就会发布权重,而且会使用Apache 2.0许可证,实现「真正的开源」!

项目地址:https://github.com/Ligo-Biosciences/AlphaFold3

如何「复刻」AlphaFold 3?

由于DeepMind在论文中发布了模型的完整架构,以及每个组件的伪代码,因此任何团队都有权复现。

但复现这件事,说起来容易,做起来难。

Ligo选择将其完全翻译为PyTorch代码,其中涉及到不少逆向分析和重构工作,远多出他们的想象。

复现过程中,他们也发现了原始论文中存在的多个问题,会干扰训练,恰好是深度学习领域的关注点,因此一并放出,供社区参考。

1. MSE损失缩放公式有误

如下图所示,公式中使用的是加号而非乘号;如果使用加法,就无法在高噪声水平下正确降低权重,且MSE在初始化时不是单位化的。

这与Karras等人2022年发表的论文不同,可能只是一个笔误。

原文地址:https://arxiv.org/abs/2206.00364

2. 论文中省略了原DiT包含的残差层

代码中将其添加了回来,并对两种情况进行了对比实验,发现引入残差层可以改善梯度流和收敛性。

3. 当前形式的MSA模块中存在无效层,

如果使用论文所述的MSA模块的通信步骤,最后的配对加权平均和转换层无法对配对表示(pair representation)做出贡献,因此没有梯度。

代码使用了AlphaFold2中ExtraMsaStack的顺序;另一种解决方案是使用权重共享,但论文中是否有此操作尚不明确

除了复刻模型,Ligo团队也在探索更加快速高效的实现方式。

比如,重用了OpenFold的三角注意力(triangular attention),还将初代AF提出的MSARowAttentionWithPairBias重用于DiT,这是AF3论文中没有提及的操作。

下面这个动画由Ligo复现的模型生成(未使用模板),模型仅使用了8个A100 GPU训练 10 小时。

分析显示,尽管进行了优化,但模型超过60%的操作仍然受限于内存。因此除了扩展到更多功能,团队还在借鉴ScaleFold的理念,致力于实现一个更具扩展性、更高效的方案。

「闭源」惹众怒,3位本科生率先复现

作为一种生物分子结构预测模型,AlphaFold 3大大加速了蛋白质结构的绘制,解决了一个70多年来一直无法破解的巨大问题,因而对科学进步具有极其重要的意义。

研究人员可能需要用读完一整个博士的时间(4~6年)才能建模出一个结构,但AlphaFold 3只需几分钟,即可获得与实验精度相当的预测结果。

但除了博客和论文外,DeepMind只开放了一个服务器,允许科学家们进行非商业用途的使用,每天调用上限为20次。

网站地址:https://gdm-alphafold.corp.google.com/welcome

之所以如此一反常态,「捂紧」AF3的成果,很可能是有商业盈利用途的考量。

他们和新成立的子公司Isomorphic Labs正在进军药物研发领域,以满足大型制药公司的需求。

今年年初,Isomorphic Labs已经与诺华和礼来签订了价值30亿美元的合同,而最新的AF3的开发也有Isomorphic Labs的贡献,可被用于加速药物发现。

虽然为了商业盈利也无可厚非,但这种做法引起了科学家们的强烈不满。

文章地址:https://undark.org/2024/06/06/opinion-alphafold-3-open-source/

AF3发布之后的短短两天,就有600多名科学家联名向Nature递交了一封公开信,指责谷歌DeepMind的这种做法不符合科学进步的原则。

同时也是在批评Nature——为什么在没有公开代码时接收了论文。

在反对的声浪下,DeepMind没有顶住压力,随后改口表示,会在6个月内公布模型及权重。

Nature也不得不站出来回应,原原本本地向研究者们交代接收论文的考量和依据。

文章地址:https://www.nature.com/articles/d41586-024-01463-0

然而,很多反对者依旧不买账,毕竟在争分夺秒的研究领域,6个月实在太久;而且DeepMind出于合作方Isomophic Lab的盈利目的,很可能只会放出「阉割版」。

因此,除了Ligo,很多实验室和机构都开始了破解、复现AlphaFold 3的工作。

文章地址:https://www.nature.com/articles/s41586-024-07487-w

Ligo所借鉴的OpenFold团队就是其中之一,由哥伦比亚大学助理教授Mohammed AlQuraishi领头。

他们此前就对AlphaFold 2进行过复现和重新训练,成果在今年5月刚刚被Nature接收,代码也如数公布。

原文地址:https://www.nature.com/articles/s41592-024-02272-z

仓库地址:https://github.com/aqlaboratory/openfold

就在发推宣传这项成果时,Alquraishi表示,AlphaFold 3项目在进行时了。

此外,GitHub上的开源大佬、旧金山的独立软件工程师Phil Wang也组织起了一个众包开源项目,同样是用PyTorch复现AlphaFold 3,正进行得如火如荼。

项目地址:https://github.com/lucidrains/alphafold3-pytorch

本科生 VS DeepMind

有如此多的竞争者,能在不到4个月的时间率先复现AF3,Ligo这家初创究竟是什么来头?

这家YC系初创成立于去年12月,总部位于伦敦,3位创始人都来自牛津,且有丰富的研究经历。

CEO Edward Harris曾在普林斯顿大学入读计算机科学系,之后在2021年转入牛津医学院,目前正辍学全职创业。

进入牛津前,Harris曾在墨西哥创办外卖平台Abas2Go,目前年营业额超过120万美元。

CSO Emily Egerton-Warburton目前在牛津分子和细胞生物化学系学习,曾获得英国皇家化学学会颁布的化学奥赛金奖。

CTO Arda Goreci是牛津大学生物医学系的学生,2023年凭借计算生物学方面研究成果入选Google Cloude Research Innovator计划,他也是AF3开源项目的主要参与者和领导者。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/33043.html

(0)
上一篇 2024年10月12日
下一篇 2024年10月12日

相关推荐

  • 世界医学专业排名

    “王大爷,最近在新闻里看到一条消息,说全球最佳医院排名又出来了,美国医院占了前三,我们中国的医院一所都没进前一百。这是真的吗?为什么会这样呢?我们的医疗水平真的差这么多吗?”这个春日的早上,家住成都的58岁王大爷在小区健康讲座上向社区医生提了个问题。周围的叔叔阿姨们也凑过来,眼里满是疑问和不解。 一则国际权威榜单引发了无数中国患者和医疗人士的关注和讨论。难道…

    2025年11月11日
  • 美国最好美术学院

    "根据国家非物质文化遗产保护中心2023年度报告,热贡艺术作为中国首批入选联合国教科文组织人类非物质文化遗产代表作名录的传统美术项目,其市场价值在过去五年增长了215%,其中由杰出青年传承人创作的唐卡作品年均升值率达28.3%。"——《中国非物质文化遗产发展白皮书(2023)》 在青海同仁隆务河畔的热贡元旦唐卡画院,一场关于传统与创新的对…

    2026年1月8日
  • 加拿大保姆学校

    我是梅姐,山东人,现在在加拿大做高端家政。 34岁以前,我的人生和所有60、 70后一样,在附近上完小学中学,然后分配工作。从三班倒的车间工人,最后到办公室,以为一辈子就是这样的轨迹。 但我是个不“安分”的人,不甘做个只会围绕生活不停旋转的陀螺。 2002年,我毅然摔破了自己的“铁饭碗”,开始拼尽全力追求梦想,后来远赴加拿大打工,一干就是十多年。并在50岁的…

    2025年7月16日
  • 广东以色列理工学院一年学费多少_广东以色列理工学院一年学费多少钱

    广东以色列理工学院一年学费9万5。 广东以色列理工学院一年学费95000,但是毕业生超过50%能够入读世界排名前30的院校,97%能人读世界排名前100的院校,比如斯坦福大学、加州大学伯克利分校、帝国理工、哥伦比亚大学。而分数只要刚过特控线,只招收物理类考生。这样的院校你愿意填报吗?你们还想听什么学校打在评论区。 选择中外合作的大学一定要看外方院校的实力,而…

    2024年3月5日
  • 江南大学在国内的档次

    \r 提起江南大学,很多人第一反应可能是“低调”,但你可能不知道,这所位于无锡的高校,其食品科学与工程学科连续多年稳居世界第一,轻工技术与工程也高居世界第二。这样的成绩,不仅在国内遥遥领先,放眼全球同样耀眼。\r江南大学用实力证明:不靠“985、211”光环,也能在国际舞台上独占鳌头。选择江南大学,或许比你想象的更有前途! \r\r\r\r\r\r 江南大学…

    2025年9月9日
  • 吴颖和瞿铭(吴颖瞿铭 医院)

    当地时间7月18日下午,美国伊利诺伊州皮奥里亚联邦法院宣布,由于陪审团未能就死刑判决达成一致,章莹颖案被告布伦特·克里斯滕森被判处终身监禁,不得假释。由7男5女组成的陪审团中,有10人认为应判死刑,但2人坚持终身监禁,根据美国法律不能完全一致,就不能判处死刑。自2017年6月9日章莹颖失踪,至今已经769天。 在本案中,美国联邦检方以及章莹颖的家人坚持要求判…

    2023年9月25日
  • 麦克马斯特大学相当于国内哪个大学

    在福州,越来越多怀揣梦想的学子将目光投向海外,期望在更广阔的学术天地中绽放光彩。“福州留学”正成为一股热潮,而加拿大的麦克马斯特大学凭借其独特魅力,吸引着众多福州学子的关注。在全球化教育的大背景下,了解这所大学与国内 985 高校的实力对比,以及它的留学申请条件,对于有意向的同学来说至关重要。今天,就跟着“福州立思辰留学”一起来深入了解一下吧。 实力大比拼:…

    2025年5月14日
  • 三一学院中国学生有哪些人

    2020年的高考刚刚结束,当考生们还在紧张地等待公布考试分数时,这个来自上海世界外国语中学的IB男孩李沐阳,早已提前“跳级”拿到了剑桥大学三一学院数学系的offer。 事实上,他是今年唯一一名被三一学院数学系无条件录取的中国学生。不仅如此,他还拿到了剑桥大学和三一学院的本硕连读双料奖学金。与此同时,帝国理工学院、伦敦大学、澳洲国立大学、圣安德鲁斯大学、爱丁堡…

    2025年1月10日
  • 纽约时装学院学费多少

    美国教育质量高众所周知,但高额的留学费用让众多学子直呼“爱不起”! 事实上,美国不同院校之间的学费有着巨大差异,那哪些院校是“学费刺客”?哪些院校是性价比之王呢? 23所美国热门「大U&艺术院校2023-2024学费」汇总来啦!快来pick出与你的“才力与财力”双契合的梦校! 热门艺术院校费用汇总 费用最高院校堪比最低院校的2倍! 01.罗德岛设计学…

    2024年6月23日
  • 华东政法大学和西南政法大学哪个好

    \r 提起法学名校,华东政法大学和西南政法大学无疑是全国考生心中的“王牌”选择。两校同为政法类院校翘楚,历史底蕴深厚,师资力量雄厚,但在综合实力上究竟谁更胜一筹?从学科评估、科研成果、就业数据到社会影响力,这两所高校各有千秋。\r选择哪所院校,不仅关乎个人发展,更关系到未来法学之路的宽广与高度。用一组权威数据,带你看清这场“政法双雄”的真实差距。 \r\r\…

    2025年9月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信