DeepSeek打破历史!中国AI的“Nature时刻”

中国大模型,首登Nature封面。

9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。

Nature在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”

中国AI大模型的“Nature时刻”

自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。

DeepSeek以其公开性和透明性打破了这一局面。DeepSeek-R1模型的研究论文最早于今年年初发布在预印本平台arXiv上。自今年2月14日向Nature投递论文至今,历经半年,8位外部专家参与了同行评审,DeepSeek-R1推理模型研究论文终获发表,完成了从预印本到Nature封面的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度和可重复性的可喜一步。

因此,Nature也对DeepSeek的开放模式给予高度评价,在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”全球知名开源社区Hugging Face机器学习工程师Lewis Tunstall也是DeepSeek论文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的潜在风险。”

据了解,DeepSeek本次在Nature上发表的论文较今年年初的初版论文有较大的改动,全文64页,不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行了全面评估。

其中,在训练成本方面,R1-Zero和R1都使用了512张H800GPU,分别训练了198个小时和80个小时,以H800每GPU小时2美元的租赁价格换算,R1的总训练成本为29.4万美元(约合人民币209万元)。不到30万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可谓实现了极大的降本。

关于R1发布最初时所受到的“蒸馏”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型输出的结果,作为监督信号再去训练另外一个模型。R1发布时,OpenAI称它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。

R2何时问世引发关注

自今年年初发布R1以来,DeepSeek在全球树立了开源模型的典范,但过去数月,外界对于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有关。

值得注意的是,今年8月21日,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。据DeepSeek介绍,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。

由于R1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek强调DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,而UE8M0 FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表态一度带动国产芯片算力股股价飙升。

中国银河证券研报指出,DeepSeek从V3版本就开始采用FP8参数精度验证了其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟制程(12-28nm)上接近先进制程英伟达GPU的算力精度,DeepSeek-V3.1使用UE8M0 FP8 Scale参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同换取数量级性能的提升,国产算力芯片将迎来变革。

(文章来源:证券时报)

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/58662.html

(0)
上一篇 2025年9月18日
下一篇 2025年9月19日

相关推荐

  • 世界大学排名2023最新排名前300

    2023年结束后,4大世界著名教育评估机构开始了大学排名。 其中英国的QS世界大学排名、泰晤士高等教育等多年盘踞全球排行榜前列,而上海的软科世界大学排名近日也正式公布。 看到中国大陆高校在全球面前,表现不可小觑。 总共有30所高校入围,其中两所大学甚至打破985高校垄断,一跃进入前30名。 四大排名机构。 随着时代的发展,不仅中国高校之间会进行排名,以较高录…

    2025年2月11日
  • 澳洲移民中心(澳洲移民中心官网)

    随着经济的发展,中国人的生活水平得到很大的提高,留学生的数量也是日渐攀升。加之澳大利亚的福利政策诱人,越来越多人在毕业以后选择移民到澳大利亚,想要去到澳洲享受优美的环境感受不一样的氛围。那么问题来了,准备移民的小伙伴们都知道澳洲移民局的地址吗?今天,四川留学360来给大家科普一下澳洲各州的移民局地址所在。 1.澳洲移民局SW(新南威尔士州) Sydney C…

    2023年9月13日
  • 英国艺术留学(英国艺术留学一年费用)

    最近有很多同学来私信留学君,想要去英国读艺术类专业申请条件是什么?不知道要提前多久准备?什么时候提交申请材料呢?今天留学君就来和大家聊聊! 废话不多说,上干货! 在国内学艺术专业的同学普遍英语不是很好,对于专业好但语言不好的申请人,可以选 择提前去学校的国际学习中心学习有针对性的学术预科或语言课程。 艺术留学要准备哪些申请材料? 1、专业课成绩及奖项  在校…

    2023年11月21日
  • 新西兰黑飘(新西兰黑飘多少钱)

    今天新西兰人发现这新年第一天,天有异象,原来种种是拜澳洲所赐,以下转自天维网。 原创: 天维采编组 新西兰天维网 今天 新西兰是世界上 最早迎接新年第一缕晨光的国家之一 来新西兰观看新年日出 也是极其有意义的事情 然而2020年, 新西兰的第一场日出 却赫然是一轮血日当空! 上面那幅图是奥克兰以东的激流岛上拍的 而这是今天早上的基督城 基督城往东方向的Ban…

    2023年11月20日
  • 厦门理工学院国际教育学院

    中国国际大学生创新大赛(2024)总决赛及同期活动10月12日至15日在上海举行。期间,厦门理工学院参赛项目《德峰科技——新能源汽车动力电池在线检测技术服务商》获得金奖。据悉,这是该校自获得第三届中国“互联网+”大学生创新创业大赛金奖以来,时隔七年再次荣膺国赛金奖。 厦门理工学院此次获奖项目由创新创业园区牵头组织,团队主要成员来自计算机与信息工程学院、机械与…

    2024年11月20日
  • 韩国西江大学怎么样_韩国西江大学怎么样啊

    随着赴韩留学人数的增加,越来越多的韩国院校被我们所了解到,这也让我们眼花缭乱,不知道该选择哪所大学来作为自己的目标院校。而且更是对于韩国的某一所学校怎么样,值不值得去就读往往都没有一个很清晰的概念。今天我们就来一起揭秘一下韩国著名的西江大学到底如何吧! 一、学校介绍 韩国西江大学是韩国著名的大学,位于首尔的市中心新村地区,交通便利,毗邻延世大学、梨花女子大学…

    2024年3月6日
  • 美国高中费用

    再不出去,你的巅峰就只剩CBA板凳。 \r 李悦洲一句美国高中不如CBA,把家长群炸成两半。 \r\r 有人拍手,说国内训练更系统;有人冷笑,说孩子再信就废了。 \r 我扒了全美高中排名前十的比赛录像,一节打完,两边折返跑了22次,平均心率187。 \r 同年龄段CBA青年队,热身完才到170。 \r 数字摆这儿,谁硬一目了然。 \r 更狠的是赛程。 \r …

    2025年10月14日
  • 日本文化服装学院入学条件

    ✨ 服装设计梦的你,到底该选哪所? 文化服装学院(Bunka)和武藏野美术大学(Musashino Art),两所日本顶级设计院校,风格却截然不同!今天就来深度对比,帮你找到最适合自己的那片天空~ 文化服装学院:时尚界的黄埔军校 适合人群: 100%确定热爱服装设计,想成为行业专家(设计师/制版师/买手等) ✅ 极致专精 课程围绕“服装”展开,从设计、制版到…

    2025年11月26日
  • 哥大学士服

    央广网天津8月26日消息(记者刘阳)“我们一家三代有四位天大人,此刻回归天大校园,亲切、振奋又倍感光荣!”又是一年迎新季,柴澍靖迈入天津大学校门,成为海洋科学与工程学院博士新生,再度开启“天大的旅程”。 “舅爷毕业于天大建筑工程专业,父亲本硕都毕业于天大机械学院,爱人毕业于天大软件工程专业。”柴澍靖无不自豪,“跨越数十年,我们一家都做了同样的选择——成为天大…

    2025年5月13日
  • 深圳大学设计类专业分数线

    各省教育考试院陆续发布2023年艺术类统考合格分数线,本文整理了全国23个省市近2年的各类型艺术类统考(含联考)专业的分数线供考生参考。 1. 浙江、宁夏、江苏、湖南省统考分数线保持稳定 下图展示的21个省市的56个艺术类专业的合格线未发生变化,浙江、宁夏、江苏大多统考招生专业未调整统考合格线。2022-2023年湖南省各艺术类专业的合格线完全一致,近2年均…

    2024年1月13日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信