DeepSeek打破历史!中国AI的“Nature时刻”

中国大模型,首登Nature封面。

9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。

Nature在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”

中国AI大模型的“Nature时刻”

自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。

DeepSeek以其公开性和透明性打破了这一局面。DeepSeek-R1模型的研究论文最早于今年年初发布在预印本平台arXiv上。自今年2月14日向Nature投递论文至今,历经半年,8位外部专家参与了同行评审,DeepSeek-R1推理模型研究论文终获发表,完成了从预印本到Nature封面的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度和可重复性的可喜一步。

因此,Nature也对DeepSeek的开放模式给予高度评价,在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”全球知名开源社区Hugging Face机器学习工程师Lewis Tunstall也是DeepSeek论文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的潜在风险。”

据了解,DeepSeek本次在Nature上发表的论文较今年年初的初版论文有较大的改动,全文64页,不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行了全面评估。

其中,在训练成本方面,R1-Zero和R1都使用了512张H800GPU,分别训练了198个小时和80个小时,以H800每GPU小时2美元的租赁价格换算,R1的总训练成本为29.4万美元(约合人民币209万元)。不到30万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可谓实现了极大的降本。

关于R1发布最初时所受到的“蒸馏”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型输出的结果,作为监督信号再去训练另外一个模型。R1发布时,OpenAI称它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。

R2何时问世引发关注

自今年年初发布R1以来,DeepSeek在全球树立了开源模型的典范,但过去数月,外界对于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有关。

值得注意的是,今年8月21日,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。据DeepSeek介绍,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。

由于R1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek强调DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,而UE8M0 FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表态一度带动国产芯片算力股股价飙升。

中国银河证券研报指出,DeepSeek从V3版本就开始采用FP8参数精度验证了其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟制程(12-28nm)上接近先进制程英伟达GPU的算力精度,DeepSeek-V3.1使用UE8M0 FP8 Scale参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同换取数量级性能的提升,国产算力芯片将迎来变革。

(文章来源:证券时报)

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/58662.html

(0)
上一篇 2025年9月18日
下一篇 2025年9月19日

相关推荐

  • 爱丁堡大学在哪

    爱丁堡大学则位于爱丁堡市中心,是公认的欧洲最富吸引力的城市之一,于2012年击败伦敦、巴黎、罗马等城市被世界旅游业联合会授予欧洲最佳旅游目的地城市,也是英国主要的社交、文化中心。爱丁堡市是历史名城,有许多名胜古迹,如艺术长廊和音乐厅、苏格兰皇家博物馆、皇家植物园、苏格兰国家图书馆、圣伍德皇宫、议会大厦、圣支来大教堂、爱丁堡古城堡等等。 爱丁堡大学QS世界排名…

    2024年7月3日
  • 中国大学排名前十名要多少分

    根据2024年校友会中国大学排名,北大、清华、复旦这三所高校如同璀璨的明珠,继续在众多院校中脱颖而出,成为全国一本大学的领头羊。这些学校不仅在学术研究上具有卓越成就,更是无数学子梦寐以求的求学之地。 在传统高考省份,这三所高校无疑是文科和理科的热门选择。2023年贵州的录取数据显示,文科一本大学的分数线在545分到679分之间,而理科则在459分到684分之…

    2024年11月13日
  • 坦波夫国立大学世界排名

    人民网北京1月10日电 北京时间1月10日凌晨,奥瑞金在俄罗斯开启了2020年丝路联赛的征程,在坦波夫市对阵目前积分榜排名第20位的坦波夫队,这场较量也将是争夺季后赛名额的关键战役。奥瑞金在大部分常规时间握有主动权的情况下,遭到主队顽强阻击,在常规时间战成1-1的情况下,最终点球落败。 坦波夫队来自俄罗斯坦波夫市,主场为水晶滑冰棺,可容纳1500人,是一支2…

    2025年8月20日
  • 赫特福德大学航空航天

    这是一所英国留学名校 素有“企业家和工程师的摇篮”之称 在世界范围内都享有很高的声誉 它就是——赫特福德大学 院校概况 赫特福德大学是英国一流大学之一,拥有500多个专业,提供学士、硕士到博士阶段的各种课程,有来自100多个国家的2000多名国际学生。该校以“商业实战精神”而著名,致力于提高学生的就业创业能力,与工商企业界紧密合作,帮助学生打造企业最需要的职…

    2024年12月8日
  • 经济学专业排名(经济学专业排名全国排名)

    以下是2023年中国大学经济学专业排名前一百,其中排在第一位的是中国人民大学,排在第二位的是北京大学,排在第三位的是南开大学。 南开大学简称“南开”,位于天津市,创办于1919年,是国家“985工程”“211工程”重点建设高校,为国际公立大学论坛成员,是“学府北辰”之一。其国家级特色专业有经济学、工商管理、金融学等等。2022年南开大学在浙江省的最低录取分数…

    2023年10月14日
  • 哥伦比亚大学位置怎么样

    说到哥伦比亚大学,近几年可以说是“新闻不断”。 先是承认数据造假、紧接着是退出U.S.News排名….但是就算是经历过种种风波后,哥伦比亚大学在U.S.News排名上依旧稳居Top 20行列内。 哥伦比亚大学(Columbia University in the City of New York),简称哥大,是纽约州最古老的高等教育学府,是美国历…

    2024年10月24日
  • 英国名校大学排名

    前不久,英国大学生评价网站StudentCrowd发布了2024英国最佳大学排名。 和英国其他大学排名不同, StudentCrowd排名主要根据学生评价得出,评分维度与学生就读体验息息相关,比如校园环境设施、wifi网速、俱乐部社团、学生会、就业服务等。 由于学生需要用验证大学邮箱才能登录,StudentCrowd确保了每个评价真实可靠、能真正反映学生对学…

    2024年11月7日
  • 美国留学的学校排名

    留学美国30万家庭的钱包难题:8万刀学费砸下去,别只盯着藤校光环了。 刷到最新留学榜单一堆人上头冲藤校,真替普通家庭捏把汗。 去年30万中国学生挤进美国校园,但多少人查过UIUC工程毕业生起薪比布朗文科高40%? 哥大金融工程硕士毕业签华尔街的不少,可你知道他们同学里多少人靠刷盘子还学贷? 醒醒吧,现在选校早不是看QS数字的游戏。 UIUC计算机系中国人扎堆…

    2025年8月25日
  • 马来西亚货币(马来西亚货币兑换人民币汇率)

    新华社北京9月12日电 中国外汇交易中心9月12日受权公布人民币对美元、欧元、日元、港元、英镑、澳元、新西兰元、新加坡元、瑞士法郎、加元、林吉特、卢布、兰特、韩元、迪拉姆、里亚尔、福林、兹罗提、丹麦克朗、瑞典克朗、挪威克朗、里拉、墨西哥比索及泰铢的市场汇价。 9月12日人民币汇率中间价如下: 100美元 719.86人民币 100欧元 779.52人民币 1…

    2023年10月26日
  • 土耳其签证怎么办理_土耳其签证怎么办理流程

    进去土耳其电子签证申请系统官网:https://3w.evisa.gov.tr/zh/别的其它全是假网站,注意别被骗。将语言改为中文后就可以开始输入信息:第一步:申请首页点击“开始申请”,注意点两次(不要连续)1. 国家/地区选中国,普通护照,输入验证码点保存并继续进入下一步2. 到达日期是签证有效期的开始日期,可以比实际到达时间提前几天,签证有效期是180…

    2024年3月7日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信