DeepSeek打破历史!中国AI的“Nature时刻”

中国大模型,首登Nature封面。

9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。

Nature在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”

中国AI大模型的“Nature时刻”

自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。

DeepSeek以其公开性和透明性打破了这一局面。DeepSeek-R1模型的研究论文最早于今年年初发布在预印本平台arXiv上。自今年2月14日向Nature投递论文至今,历经半年,8位外部专家参与了同行评审,DeepSeek-R1推理模型研究论文终获发表,完成了从预印本到Nature封面的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度和可重复性的可喜一步。

因此,Nature也对DeepSeek的开放模式给予高度评价,在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”全球知名开源社区Hugging Face机器学习工程师Lewis Tunstall也是DeepSeek论文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的潜在风险。”

据了解,DeepSeek本次在Nature上发表的论文较今年年初的初版论文有较大的改动,全文64页,不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行了全面评估。

其中,在训练成本方面,R1-Zero和R1都使用了512张H800GPU,分别训练了198个小时和80个小时,以H800每GPU小时2美元的租赁价格换算,R1的总训练成本为29.4万美元(约合人民币209万元)。不到30万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可谓实现了极大的降本。

关于R1发布最初时所受到的“蒸馏”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型输出的结果,作为监督信号再去训练另外一个模型。R1发布时,OpenAI称它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。

R2何时问世引发关注

自今年年初发布R1以来,DeepSeek在全球树立了开源模型的典范,但过去数月,外界对于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有关。

值得注意的是,今年8月21日,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。据DeepSeek介绍,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。

由于R1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek强调DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,而UE8M0 FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表态一度带动国产芯片算力股股价飙升。

中国银河证券研报指出,DeepSeek从V3版本就开始采用FP8参数精度验证了其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟制程(12-28nm)上接近先进制程英伟达GPU的算力精度,DeepSeek-V3.1使用UE8M0 FP8 Scale参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同换取数量级性能的提升,国产算力芯片将迎来变革。

(文章来源:证券时报)

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/58662.html

(0)
上一篇 2025年9月18日
下一篇 2025年9月19日

相关推荐

  • 考上中国矿业大学意味着什么

    \r 提到中国矿业大学,许多人第一反应就是“挖矿”,仿佛毕业生的未来都与矿井紧密相连。但事实真的如此吗?随着学校学科布局的不断优化,如今的中国矿业大学早已突破传统“矿业”标签,涵盖了能源、环境、信息、管理等多个领域。\r无论是前沿科技还是热门行业,矿大学子都能找到属于自己的舞台。毕业后,他们的选择远比你想象的丰富多元。 \r\r\r\r\r\r 根据中国矿业…

    2025年9月16日
  • 哥伦比亚大学排名风波

    当地时间12日,《美国新闻与世界报道》杂志发布了最新“2023年美国大学排名”,受此前数据造假丑闻影响,哥伦比亚大学的排名从去年的第二位猛降至第十八位,据报道,哥大已发表声明,承认有关排名数据造假。 哥伦比亚大学在一份声明中称,学校向《美国新闻与世界报道》杂志提交的以供其在2021年大学排名中参考的数据确有不实之处,同时解释是因为采用了“过时和不正确的统计方…

    2025年8月18日
  • 巴黎索邦大学qs世界排名

    \r 提到拉丁语专业,很多人第一反应是“冷门”,但在全球化和学术研究不断深入的今天,掌握拉丁语却成了通向古典学、历史学、语言学等领域的“金钥匙”。\r国内外多所知名高校设有拉丁语或古典语言专业,培养了大批精通古典文化的人才。对于有志于深造的同学来说,选择一所实力强劲的大学,无疑是迈向专业高峰的关键一步。 \r\r\r\r\r\r\r 以下为拉丁语专业较为著名…

    2025年8月22日
  • 澳洲悉尼大学地址

    悉尼大学位于新南威尔士州首府悉尼,主要校区紧靠新南威尔士的首府悉尼市中心西南,靠近中央车站及唐人街,离中心商业区仅5分钟的路程,悉尼大学是澳洲澳洲成立最早、最古老的学校,成立于1850年,至今已有近170年的历史,是澳洲历史上第1个高等学府。 悉尼大学办学条件 悉尼大学开设全澳大利亚最广泛,数目最多的课程给学生攻读,开设澳大利亚最多的硕士及博士研究课程。现有…

    2025年2月19日
  • 乔治梅森大学中南大学

    高考在即,为帮助广大高考生及家长深入了解学校办学特色、人才培养模式和校园文化,5月31日,对外经济贸易大学举办2025年校园开放日暨高招咨询会。活动面向全国的考生和家长开放,2000余人到校参观和咨询,64万人线上观看直播。 校长“领衔” 直播探校 “校长直播”活动中,校长赵忠秀详细介绍了学校的办学历史,并结合国家经济形势,解读未来人才培养需求。他指出,对外…

    2025年8月23日
  • 隆德大学qs世界排名

    众所周知,北欧名校——瑞典隆德大学,是一所各方面都很优秀,综合实力非常强的大学,今年在2025QS排名第75位。其实,隆德大学在其他方面的排名也非常优秀。 我们来看一下,还有哪些方面的排名是大家甚少知道的。 隆德大学QS世界大学可持续发展排名第3位 隆德大学在 QS 世界大学可持续发展排名中继续攀升,该排名对世界各地大学的可持续发展进行排名。 隆德大学目前在…

    2026年1月13日
  • 留学日本一年总费用多少人民币

    说到日本留学,怎么能不讲费用呢,费用一直以来都是日本留学的一张“王牌”,我们素以性价高闻名,身上的标签也非常多,五万能去,留学鄙视链,穷鬼大乐园,反正一提到就像日本不要钱就能去留学似得,可事实上一年的费用一点都不少,今天就给大家细细盘算一下,全网最细,建议收藏点赞先点好。 在日本留学期间所需支出的费用一般有:学费、房费和生活费。 ①学费 第一年大部分学生就是…

    2025年12月30日
  • 英国帝国理工大学化学工程学院

    专业概况 长安大学化学工程与工艺专业是国家级一流本科专业建设点,并通过工程教育专业认证。本专业办学定位明确,以服务区域经济和行业发展为宗旨,培养专业基础扎实、工程实践能力强的高素质工程技术人才。专业学制4年,授予工学学士学位,不涉及专业分流。高考改革省份物理、化学为必考科目。 师资队伍 本专业现有教师33人,其中包括国家及省部级各类人才计划获得者、国家教学名…

    2025年8月25日
  • 波士顿东北大学世界排名

    排名差不多,都位于波士顿,波士顿大学计算机科学硕士 VS 东北大学计算机科学硕士,哪个好?下面小编来给大家对比介绍。 波士顿大学 MS in Computer Science 学校介绍 波士顿大学(Boston University),简称BU,创办于1839年,其主校区位于波士顿市中心查尔斯河河畔,与哈佛大学、麻省理工学院隔河相对。波士顿大学在全球享有一流…

    2025年11月13日
  • 法国高中排名

    市内六区高中教育资源概览 天津市内六区(和平区、河西区、南开区、河东区、河北区、红桥区)在全市教育资源中占据核心地位,是优质高中的集中区域。“市五所”指的是南开中学、天津一中、耀华中学、实验中学和新华中学,它们是全市顶尖高中,高考成绩优异,竞赛实力强劲,在全市范围内具有广泛的影响力。“市九所”则是在“市五所”的基础上,增加了天津中学、第四中学、第七中学和第三…

    2025年11月5日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信