OpenAI如何叩响AGI之门:12天12场直播 秀出哪些新肌肉

当地时间12月5日-20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播,从首日的满血版o1模型重磅发布,再到期待许久的Sora Turbo正式发布,最终又以新一代推理模型o3收官,OpenAI CEO山姆·奥特曼(Sam Altman)还在四场直播中现身站台,我们似乎离AGI(Artificial General Intelligence,通用人工智能)又更近了一步。

CNBC评价称,这次连续12天直播的噱头是OpenAI将焦点转向其技术并为其产品造势的一种方式。这是公司积极发展计划的一部分,因为它要与创业公司和科技巨头争夺生成式人工智能市场的更大份额。不过,这次活动在某些方面因其强有力的年终宣传而受到称赞,但也有人批评其炒作成分多于实质内容。

《纽约》杂志评价称,目前OpenAI正面临内部领导层变动、与微软的资源紧张关系,以及对AGI进展的争论,此次活动在展示新产品和功能的同时,也表现出一定的防御性。

让我们来一起回顾OpenAI叩响AGI之门的这12天。

第1天(当地时间12月5日):满血版o1模型和ChatGPT Pro

山姆·奥特曼现身首场直播

正式版o1提升了推理逻辑能力。可以解决国际数学奥林匹克资格考试中83%的问题(GPT-4o在该测试中的得分只有13%)。

响应时间得到改善。在演示中,研究人员向o1提了一个问题:列出罗马帝国在公元2世纪的统治者,包含其在位时间和成就。o1花了将近18秒来回答,远低于4o模型,比o1-preview的速度提高了约60%。

解锁多模态图像识别功能。能够转录笔迹、测算相对大小,甚至可以解释如何将随机零件装入更大的机器中。

满血版o1的响应时间得到改善

同时,当天还推出了ChatGPT Pro订阅计划,每月200美元,提供了无次数限制使用o1、高级语音模式等模型的权限。

大部分评论对完整版o1的推出表现得较为积极,不过也有用户吐槽在缺少高级功能的现在,o1仍然只是一个“预览版”,也有用户对当天的更新中没有免费产品表示了不满。

对于ChatGPT Pro,有分析指出,这进一步证明了大模型的“烧钱”速度,在愈发激烈的AI竞赛中,OpenAI急需通过o1模型来证明自己。

第2天(当地时间12月6日):强化学习微调(RFT,Reinforcement Fine-Tuning)

用户能够利用少量的训练数据,也能在特定领域快速构建专家级模型。

OpenAI的研究员称,强化微调并不是单单教模型输出,它的运作方式是,当模型发现一个问题的时候,研究者给模型空间仔细思考这个问题,然后评估模型给出的最终解答,运用强化学习,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路。

强化微调后的o1-mini,在top@1(正确答案在列表第1个位置的概率)、top@5(正确答案在列表前5个位置的概率)和top@max(输出中包含正确答案的概率)指标上,表现都明显胜过性能更加强大的o1。

强化微调后的o1-mini与o1性能对比

OpenAI高级副总裁Mark Chen表示,强化微调能力预示着小体量模型也能“从高中水平跃升至专家水平”,为企业和科研单位提供了强大的工具。

第3天(当地时间12月9日):Sora Turbo正式发布

OpenAI发布Sora Turbo

Sora Turbo可以生成1080p、最长20秒的视频,支持横屏(16:9)、正方形(1:1)和竖屏(9:16)多种常见比例,并且可以对生成的视频进行Remix(重混):替换、删除或重构视频中的元素,Re-cut(重新切割):找到最佳的一帧再进行延展,循环剪辑,混合:将两个视频进行无缝合并剪辑,故事板剪辑:精准指定每个帧的输入,风格预设:预设创建视频的风格等操作。

奥特曼表示,最令他兴奋的一点是与其他人共同创作的便捷性,感觉就像是一个有趣的新事物。大家可以将Sora看作视频版的GPT-1。

根据网友实测反馈,对物理规律的理解并不够好,仍会出现人的手部不自然、文字乱码、动物跑着跑着就飞起来等情况。

也有外媒指出,Sora发布未能达到最初预期,尽管OpenAI努力推出更快、更实惠的版本,但最终产品缺乏预期的高级功能。与ChatGPT的早期阶段进行比较,Sora目前更像视频编辑软件,而非突破性的AI。

美联社则指出,像Sora这样的文生视频AI工具被认为是制作新的娱乐和营销视频时节省成本的方式,但也引发了人们对其在政治和其他领域是否容易冒充真人的担忧。OpenAI发布Sora限制了对人物的描绘,防止了如冒充和深度伪造等滥用情况的出现。

第4天(当地时间12月10日):Canvas升级

Canvas是OpenAI在今年10月推出的全新功能,OpenAI将其定义为 “使用 ChatGPT 编写和编码的全新工作方式”。

Canvas在单独的窗口中打开,用户和ChatGPT就项目进行协作,不仅仅是通过对话,而是共同创作和完善想法。

可以协作编辑文档,修改标题、添加表情符号、调整文本长度等。

Canvas还支持Python代码运行和调试,能直接查看文本和图形输出,并且ChatGPT能辅助调试并提供修改建议,用户可以快速迭代代码。

Canvas界面

外媒对Canvas都给予了积极评价,认为有效提升了用户与AI在写作和编码方面的协作体验,标志着AI工具在人机交互领域的又一进步。

第5天(当地时间12月11日):ChatGPT正式集成到苹果系统

ChatGPT正式接入苹果系统

ChatGPT正式集成到苹果系统中,用户可通过Siri访问ChatGPT功能,并支持语音控制设备。

当Siri判断ChatGPT能够更好地满足用户请求时,会自动将请求转发给OpenAI的系统。用户操作前需先启用该功能,以便保障隐私。

苹果的智能写作工具引入ChatGPT能力。用户不仅能优化、总结文档,提取关键信息,还能从零开始创作全新文档,甚至结合DALL-E图像生成技术在撰写过程中融入图片。

用户还可以轻触苹果的“相机控制”按钮完成视觉智能相关任务,例如快速识别眼前物品,或深入了解所看到的内容,进行翻译、总结等。

路透社指出,此次发布正值圣诞节假日购物旺季,也是公司一年中销售利润最丰厚的时期,或许对于苹果产品的销售带来影响。目前苹果智能功能的推出速度缓慢,也引发了一些投资者对iPhone 16销售周期力度的担忧。

第6天(当地时间12月12日):增强ChatGPT高级语音模式

GPT-4o多模态能力得到进一步加强

GPT-4o增强多模态能力,推出实时视频理解功能,还推出限时圣诞老人语音模式。

用户可直接输入音频,理解并直接输出音频,可以把手机图片或短信等展示给ChatGPT,它将解读并分析这些内容,协助用户回复消息、工作等。

第7天(当地时间12月13日):Projects功能发布

Project界面

Project(项目)支持用户将文件、聊天记录等信息集中到一个“Project”中,与OpenAI竞争对手Anthropic此前推出的Claude新功能有异曲同工之处。

可进行文件上传、设定个性化指令等操作,也支持将过往聊天记录添加到项目中,定制ChatGPT的对话。创建新对话时也能自动搜索项目中的其他信息,进行更精准的回答。此外,还支持Canvas界面,能通过ChatGPT Search轻松接入互联网。

第8天(当地时间12月16日):ChatGPT Search开放

ChatGPT Search正式向所有用户开放,优化了搜索速度和准确性,新增语音搜索功能与地图集成,全球同步上线,提升实时信息获取体验。

以更自然、更会话的方式提问,ChatGPT可以选择用网络信息进行回复。如果深入追问,ChatGPT会考虑您聊天的全部上下文,提供更好的答案。

ChatGPT Search演示对话

新媒体集团VoxMedia总裁评价称,ChatGPT Search有望更好地突出值得信赖的新闻来源的信息并对其进行归属,使受众受益,同时扩大提供优质新闻的出版商的影响力。

第9天(当地时间12月17日):o1 API正式版

OpenAI称o1 API为功能更强大的模型、新的定制工具,可提高性能、灵活性和成本效益的升级。

支持函数调用、结构化输出和视觉功能;更新支持低延迟自然对话体验Realtime API,可进行简单的WebRTC集成,GPT-4o音频的定价降60%,GPT-4o mini音频费率降为1/10;支持偏好微调,可根据用户和开发人员的偏好更轻松地定制模型;同时还推出了新的Go和Java SDK测试版。

Realtime API界面

OpenAI给这一天的发布取名为“为开发人员准备的节日礼物”。

第10天(当地时间12月18日):推出ChatGPT热线

只要电话拨通免费号码就能免费使用ChatGPT15分钟

发布1-800-CHAT-GPT服务,支持WhatsApp即时通讯,同时只要电话拨通免费号码,OpenAI将通过热线提供15分钟的免费ChatGPT使用时间。

OpenAI首席产品官凯文·韦尔(Kevin Weil)在表示:“我们才刚刚开始让每个人都能更方便地使用 ChatGPT。”

有外媒试用了该服务后报道称,AI语音非常逼真,但通话时间限制为每月15分钟,且或许会存在隐私安全问题。

第11天(当地时间12月19日):ChatGPT桌面版新增跨应用访问功能

ChatGPT桌面版支持跨应用访问

ChatGPT桌面版可读取其他应用程序中的数据,实现实时协作。新增了更多编程环境和生产力工具的支持,可以与 Apple Notes等无缝对接,并支持在使用桌面应用时开启高级语音模式(该功能需要用户手动为每个应用开启)。

第12天(当地时间12月20日):o3模型发布

OpenAI的12天12场直播收官发布推理模型o3系列

发布最新推理模型o3和o3-mini,推理能力大幅提升,支持多模式推理。

据介绍,在编码测试SWE-Bench Verified中,o3性能比o1高出22.8%;在Codeforces竞技编程中得分为2727分,相当于位列第175名的人类选手,甚至超过了OpenAI的首席科学家(2655分);在数学竞赛AIME 2024和专家级科学问题基准测试GPQA Diamond中成绩都得到明显提升;而在令很多AI和数学家都束手无策的最难数学和推理挑战FrontierMath中,o3解决了25.2%的问题,其他模型均未超过2%。

OpenAI还表示正使用一种新技术“慎重对齐”(deliberative alignment),来使o3等模型符合其安全原则。

弗朗索瓦·肖莱对于o3不同计算模式的测试结果

ARC-AGI(通用人工智能抽象与推理语料库)发起者、Keras(用Python编写的高级神经网络API)之父弗朗索瓦·肖莱(Francois Chollet)认为,虽然o3给人留下了深刻印象,是迈向AGI的一个重要里程碑,但并不就是AGI,仍然有相当多非常简单的ARC-AGI-1的任务是o3无法解决的,同时还有迹象表明ARC-AGI-2对o3来说仍极具挑战性,“这表明在不涉及专业知识的情况下,创建对人类来说容易但对人工智能来说不可能的不饱和、有趣的基准仍然是可行的。当创建这样的测试变得完全不可能时,我们将拥有AGI”。

路透社对此评价称,o3的发布表明了OpenAI与谷歌等竞争对手的竞争日趋激烈,双方都在努力创造能够解决复杂问题的更智能模型。谷歌在12月早些时候发布了第二代人工智能模型Gemini,旨在能够在人工智能技术竞赛中夺回领先地位。

此外,在OpenAI发布o3后,华尔街日报发表了一篇名为 “人工智能的下一次重大飞跃落后于时间表,而且昂贵得令人发指 ”的文章,指出OpenAI在其代号为 “猎户座 ”的新人工智能项目中遇到了诸多问题,项目进度落后,而且耗资巨大。文章也指出了对于“数据瓶颈”的担忧:“目前尚不清楚何时或能否成功,世界上可能没有足够的数据让它变得足够聪明”。

奥特曼则转发了该篇文章表达了不满之情。

第13天的彩蛋(当地时间12月22日):Plus用户Sora限时(圣诞假期)无限使用

奥特曼宣布,12月下旬,随着圣诞假期的到来,人们从工作中解脱出来,OpenAI的算力将不再紧张,因此将在假期内为所有Plus用户提供无限的Sora访问权限。

山姆·奥特曼的推文

在OpenAI连续密集发布的新品中,不难发现,ChatGPT Pro的推出进一步证明了大模型的“烧钱”速度,多模态、定制化、隐私这些“安全易用”相关内容被多次强调,也体现出OpenAI急需通过更强的模型产品来证明自己。

可以看到的是,AI竞赛愈发激烈。谷歌、Pika等竞争对手也在这12天内发布了各自的新产品进行“狙击”,而OpenAI面临的最大挑战莫过于曾经的联合创始人埃隆·马斯克(Elon Musk),马斯克目前旗下拥有了人工智能初创公司xAI,并准备在特朗普政府中发挥重要影响。

(文章来源:澎湃新闻)

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/39430.html

(0)
上一篇 2024年12月24日
下一篇 2024年12月24日

相关推荐

  • 浙大爱丁堡大学19年分数线

    学校概况 浙江大学是一所历史悠久、声誉卓著的高等学府,坐落于中国历史文化名城、风景旅游胜地杭州。浙江大学的前身求是书院创立于1897年,为中国人自己最早创办的新式高等学校之一。120余年来,浙江大学始终秉承“求是创新”为校训的优良传统,以天下为己任、以真理为依归,逐步形成了“勤学、修德、明辨、笃实”的浙大人共同价值观和“海纳江河、启真厚德、开物前民、树我邦国…

    2024年11月10日
  • 出国劳务咨询(韩国出国劳务咨询)

    近日,北京丰台警方经过缜密侦查,远赴安徽打掉一出国劳务诈骗团伙,抓获嫌疑人18名。 诱人广告引人上当 “出国务工,月入4至10万,零门槛,总有岗位适合您。”看到这诱人的广告语,李女士动心了。 2022年9月,在湖北做月嫂的李女士无意中看到一条出国务工广告,虽说对目前的收入还算满意,但是国外这“触手可及”的数倍月薪,何不闯一闯呢。李女士尝试联系广告中的因私出入…

    2023年10月20日
  • 经济日报:依法从严打击证券违法活动

    因顶风违规减持,上市公司我乐家居大股东遭证监会重罚。近日,证监会通报于范易及其一致行动人违规减持“我乐家居”股票案调查进展,拟依法没收于范易及其一致行动人违法所得1653万元,并从严处以3295万元罚款,彰显了监管部门从严打击证券违法活动的决心。 依法从严打击证券违法活动是维护资本市场秩序、发挥资本市场枢纽作用的重要保障。在中共中央政治局会议提出“要活跃资本…

    2023年10月8日
  • 剑桥大学申请新通道

    自年后开始,中国大陆地区2-6月的雅思、托福考试纷纷被取消。 3月,英国政府宣布取消2020年5-6月全球范围内包括A-Level在内的所有夏季考试。同月,原定于今年5月进行的IB全球统考也被取消,学生最终成绩转而基于从前考试数据、个体学校数据、学科数据等历史数据给出。而七月IB成绩一公布就引发了轩然大波。IB考试计分规则的公正性备受质疑,迄今为止已有数万名…

    2024年11月7日
  • 红砖大学和罗素大学哪个好

    同学们在选择英国院校时,经常会看到“罗素集团成员”、“红砖大学”、甚至是“平板玻璃大学”这样的名头。 听起来感觉都挺厉害的吼,但具体啥意思就…… 这些名头都代表什么,对于申请有多大的参考价值?想要了解这些,就来和汇英小编一起看看吧! 罗素大学集团Russell Group 罗素集团成立于1994年,目前有24所英国成员院校,罗素这个名字,则来自于伦敦罗素广场…

    2025年4月11日
  • 中国政法最厉害的大学

    说中国政法大学排名?可以理解为中国政法大学这所院校,在全国大学中的排名是多少?也可以理解为中国政法大学这所院校,在全国政法类院校中的排位是多少?还可以理解为,中国的政法类院校的全国排位顺序是怎样的? 先说中国政法大学这所院校,在全国大学中的排名是多少?国政法大学在全国所有院校总排名第71位,在北京市的大学中排名第18位。别看全国大学排名他不在最前端,但做为非…

    2024年12月26日
  • ctb竞赛(ctb竞赛官网)

    为什么他们 都在参加CTB 提起有料、有趣的高中生国际竞赛, 一定少不了CTB创新研究挑战赛。 这档由哈佛主办的创新型赛事,对申请有着极大的帮助。据统计,70%就读于美本名校的中国学生都参加过CTB。这其中也包括近百位被哈佛、耶鲁、MIT等顶尖名校录取的幸运儿。 社会影响力大 CTB项目方案多次进入政府提案。 评委团很牛 它的评委团很牛,近百位评委都来自哈佛…

    2023年10月24日
  • 纽约市的大学有哪几所

    每年都有不少学生和家长在考虑留学时,首先想到的就是北美地区。美国、加拿大拥有众多世界知名的高等学府,但具体有哪些学校值得关注?它们的特色是什么?今天我们就来梳理一下北美的顶尖大学,帮你理清择校思路。 美国:名校云集,选择多样 美国的大学数量庞大,既有常春藤联盟这样的老牌名校,也有不少新兴的科研强校。哈佛、耶鲁、普林斯顿这些名字大家耳熟能详,它们以学术严谨、师…

    2025年5月28日
  • 金融监管总局召开会议 部署落实城市房地产融资协调机制相关工作

    1月26日,金融监管总局召开会议,部署推动落实城市房地产融资协调机制相关工作。金融监管总局党委书记、局长李云泽出席会议并强调,要深入贯彻落实中央金融工作会议精神,加快推动城市房地产融资协调机制落地见效,更加精准支持房地产项目合理融资需求,促进房地产市场平稳健康发展。金融监管总局党委委员、副局长肖远企主持会议。中央财办、中央金融办、国务院办公厅相关司局负责同志…

    2024年1月29日
  • 特朗普称已为俄乌问题设最后期限 届时美国态度或生变

    据央视新闻,俄罗斯国防部4月24日通报称,俄军控制了顿涅茨克地区的博格丹诺夫卡居民点,该居民点为乌军重要防御支点。在过去24小时俄军使用高精度武器及无人机,对乌航空和航天工业、机械制造、火箭燃料及火药生产企业实施了集群打击,俄方称所有预定目标均被命中。 乌克兰武装部队总参谋部称,当天以来,前线地区共发生98起战斗,俄军在波克罗夫斯克方向发动39次进攻,乌军已…

    2025年4月25日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信