美国大学教授年薪多少

智东西

编译 | 王欣逸

编辑 | 程茜

智东西12月12日消息,昨天,斯坦福大学研究团队发布最新研究,在探查斯坦福大学工程学院网络漏洞的测试中,他们新推出并开源的Multi-Agent(多Agent)框架ARTEMIS表现超越了90%的人类专家,全面超越现有的Agent框架,而其实际成本约为人力的1/14。

ARTEMIS具备动态提示生成、任意子Agent调用和自动漏洞分级评估功能,在实际应用中,它能完成复杂的网络任务,可以对网络进行扫描,找出潜在漏洞和软件安全隐患,并探寻利用这些漏洞的方法。

本次实验,研究人员让ARTEMIS与10名人类渗透测试专家、多个现有的Agent框架共同执行任务,让他们对斯坦福大学工程学院的网络进行探查,但不得实际入侵,以此来全面评估他们的探查能力。结果显示,基于OpenAI的GPT-5的ARTEMIS框架综合表现位列第二,共发现9个有效漏洞,提交有效率达82%,其表现优于十位人类参与者中的九位,全面碾压其他Agent框架,包括基于同一底层模型GPT-5的单Agent自主框架Codex和CyAgent。

P为人类网络安全专业人员;A1、A2分别是ARTEMIS两个不同配置的框架,前者基于GPT-5,后者基于集成模型;CO、CS和CG分别是使用GPT-5模型作为基础来运行的单Agent自主框架Codex、使用Claude Sonnet 4模型作为基础来运行单Agent自主框架CyAgent和使用GPT-5模型作为基础来运行CyAgent。

除了拥有与顶尖渗透测试专家相当甚至超越的性能之外,ARTEMIS把成本也打下来了,搭载GPT-5的ARTEMIS框架每小时成本约为18美元(约合人民币127.1元),约为美国渗透测试员时薪的1/14。

不过,论文指出,ARTEMIS还存在处理基于图形用户界面(GUI)的任务时有困难、比人类更高的误报率等短板。

该论文现已发布在arXiv上,题为《将AI Agents与网络安全专业人员在真实世界渗透测试中的表现进行比较(Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing)》。

论文地址:https://arxiv.org/abs/2512.09882

一、综合排名第二,全面碾压现有Agent框架,还能提升原始模型性能

研究人员建立了ARTEMIS框架下的两个对照组,以评估不同配置下的ARTEMIS框架性能。一个是使用OpenAI的GPT-5作为监督器和子Agent的A1,另一个是使用集成模型作为监督器、Anthropic的编程模型Claude Sonnet 4作为子Agent的A2,集成模型包括了以下模型:OpenAI的推理模型o3和o3 Pro、Anthropic的编程模型Claude Sonnet 4和Claude Opus 4,以及谷歌的Gemini 2.5 Pro。

从结果来看,A2在和一众人类渗透测试专家、现有的Multi-Agent框架的比较中位列第二名,共发现9个有效漏洞,提交有效率达82%,其表现优于10位人类参与者中的9位。A1则打败了5名人类参与者,位列第七名。

除ARTEMIS外,分数最高的Agents框架CO(基于GPT-5的Codex)仅超越了两位人类参与者,而CS(基于Claude Sonnet 4的CyAgent)和CG(基于GPT-5的CyAgent)落后于所有人类参与者,CS的总得分仅为A2的四分之一。

从漏洞的质量来看,人类参与者发现的Critical(关键)漏洞占据了更大的比例;ARTEMIS框架的两个配置A1和A2发现的关键漏洞比例更小,且误判的内容相对较多;A1和A2虽然提交了相同数量的漏洞,但A1的正确率仅为55%,关键漏洞仅占18%,而A2的关键漏洞占比则达到了45%,这表明不同的模型组合和配置对框架整体性能有影响,A2的多模型架构可能在处理复杂任务和减少误报方面更为有效。

在时间上,人类参与者和ARTEMIS框架的表现也不尽相同。ARTEMIS框架表现出了长时间、持续、但间歇性产出的节奏,在提交漏洞之间通常有更长的间隔时间;人类参与者则呈现出了高度可变、依赖灵感和集中爆发的节奏。他们的活跃时间(通过键盘输入判断)和漏洞提交时间点分布不均匀。

值得一提的是,ARTEMIS和人类最根本的区别是,ARTEMIS在发现一个值得关注的目标后,会立即在后台启动一个专用的子Agent去探测它,同时主线继续进行其他工作,在峰值时,ARTEMIS可以达到8个子Agents并行运行。

此外,从网络安全基准测试Cybench的表现来看,在基于GPT-5的Artemis框架和Claude 4.5 Sonnet、GPT-5等模型能力对比中,ARTEMIS以48.6%的成功率位列第二,仅次于Claude 4.5 Sonnet(55%),且略高于其底层模型GPT-5(45.9%)。

这一结果意味着,ARTEMIS框架在解决网络安全问题中,具备与顶级大模型相当的能力,且在一定程度上提升了基础模型的性能。

二、由监督器、子Agent、分级器组成,成本仅为人类专家的1/14

现有的针对网络安全AI Agent的研究主要有三类:一是PentestGPT等需要人类引导等半自主框架;二是Codex、CyAgent等能独立运行但能力有限的单Agent自主框架;三是Incalmo、MAPTA等Multi-Agent(多Agent)自主框架。

论文中提到,ARTEMIS是一个复杂的Multi-Agent框架,被设计用来对真实世界的生产系统进行长周期、复杂、渗透性测试,该框架目前已开源。

它有三个核心组件:一个监督器,负责管理工作流;一组任意子Agents集群,负责执行具体任务;一个漏洞分级器,负责漏洞验证。

ARTEMIS借鉴了现有编程Agent的设计,并通过任务列表、笔记系统和智能摘要机制,达到了比现有Agent持续运行时间更长的能力。在分配任务时,其自定义提示生成模块会为子Agent创建任务特定的系统指令。因此,ARTEMIS有着动态生成系统提示、上下文管理和分级报告等功能的优势性。

此外,ARTEMIS在经济成本上也相当占优。以基于GPT-5的ARTEMIS框架A1来看,论文指出,A1每小时成本约为18.21美元(约合人民币128.6元),按每周40小时计算,其年化成本约为3.78万美元(约合人民币26.7万元)。

而人类渗透测试人员的每日收费通常在2000至2500美元左右(约合人民币1.41万元至1.77万元),按每日工作8小时计算,时薪约为250美元至312美元(约合人民币1765元至2204元),是ARTEMIS框架每小时成本的14倍多;市场上美国渗透测试员的的年薪平均为12.5万美元(约合人民币88.29万元),是ARTEMIS框架年成本的3倍多。即使是使用每小时成本更高的A2(约为59美元,约合人民币416.7元),其成本也低于人类专家。

三、具备执行技术,短板是找不到漏洞和GUI限制

不过,据《华尔街日报》报道,ARTEMIS并非完美无缺,在误报率上,A2误报了18%的漏洞,A1失误的更多。除了失误外,ARTEMIS还完全遗漏了一个大多数人类测试人员能轻易发现的明显漏洞。

ARTEMIS频繁提交漏洞报告,却很少发现目标漏洞,而且总是发现低严重性、低复杂度或无法利用的漏洞。这种遗漏与误报的背后,可能与ARTEMIS的决策逻辑有关。论文指出,ARTEMIS框架提交漏洞报告次数的增加与未发现目标漏洞存在相关性,这可能是因为ARTEMIS在主机上发现其他漏洞后便转移了目标。

研究人员称,ARTEMIS的瓶颈在于识别漏洞模式而非技术执行能力。在中、高等级的提示下,ARTEMIS成功找到了大部分目标漏洞,这表明ARTEMIS具备漏洞的技术执行能力。当提示信息减少,仅提供低等级、仅信息和仅主机提示时,ARTEMIS成功率急剧下降,即它的自主识别攻击入口和识别漏洞的能力不足。此外ARTEMIS还存在行为不确定性,在“未经身份验证的远程控制台访问”这一任务中,ARTEMIS在高等级提示下依然任务失败,在中等级和仅主机提示下却能完成任务。

此外,ARTEMIS还存在一个关键限制,作为基于命令行和文本分析的AI,它无法通过图形用户界面(GUI)与浏览器进行交互。

斯坦福大学工程学院系统与网络安全负责人亚历克斯·凯勒(Alex Keller)称:“此前斯坦福大学的网络从未遭受过AI程序的攻击,此次实验似乎是弥补斯坦福大学网络安全漏洞的一种有效方式。在我看来,实验的益处远大于任何风险。”

斯坦福大学计算机科学教授丹·博内(Dan Boneh)为该研究提供了建议:“鉴于全球大部分代码都未经过安全漏洞测试,ARTEMIS等工具将帮助网络安全专业人士发现并修复比以往更多的代码漏洞。”此次测试,ARTEMIS就发现了斯坦福大学存在的一个有安全问题的过期网页。

结语:正探索多Agent框架的配置优化与架构迭代

在真实环境中与人类的渗透测试和基准测试Cybench均显示,ARTEMIS不仅在其在复杂现实任务中达到了可与顶尖人类专家持平甚至超越的能力,在显著优于其他现有Agent框架的同时还做到了不损害模型的原始能力,并在原始模型上实现了能力的提高。

为软件开发者与白帽黑客提供协作平台的机构HackerOne的调研报告指出:当前已有70%的安全研究人员开始采用AI工具辅助漏洞挖掘。

AI在自动化网络攻击领域正在走向实战应用。研究人员称,他们未来将持续探索这一领域,创建可运行的环境副本,对不同的Agent架构、配置和模型进行消融实验,优化基础设施,还将与企业合作开展漏洞赏金计划等。

来源:《华尔街日报》、arXiv

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/69786.html

(0)
上一篇 2025年12月26日
下一篇 2025年12月26日

相关推荐

  • 爱丁堡大学博士生专业设置

    全国人民翘首以盼的高考已经落下帷幕。但是,对于很多学子而言,高考是人生的起点,是伴随我们一起拼搏走过的人生精彩旅程,无论成绩多少,高考都不会是梦想的终结者。 羽翼初丰欲远翔,高考成绩并不局限于申请国内的大学,英国的众多高校已经宣布接受中国高考成绩,高考出分后可以直接申请英国本科。比如剑桥大学、爱丁堡大学、伦敦政治经济学院、南安普顿大学、格拉斯哥大学等等。 英…

    2024年1月8日
  • 39所985大学排名前39吗

    985大学是很多同学都想要报考的院校,因为这些院校都是我国综合实力最为强劲的一批院校。但985大学中也还是有排名的,小编就在本文为大家带来全国39所985大学排名及录取分数线。 一、2021年全国39所985大学最新排名 小编根据2021年校友会中国大学排名,为大家整理出2021年985大学排名,先为大家详细介绍排名前三的院校,供大家参考。 1、北京大学 综…

    2024年11月21日
  • 雅思口语练习(练雅思口语的app哪个好)

    #学问分享官# 各位烤鸭考前如何练习口语呢? 狂刷话题库? 死记硬背? 都为伊消得人憔悴了, 分数还是不忍直视? 今天Vicky带大家解锁雅思口语练习新姿势, 别丧了,快上车吧! Tip1.先听后写 ✕ 先把自己组织的答案写下来,然后再按照稿子讲出来。 ✓ 先回答问题并且录下来,然后再根据录音内容一个字一个字地写下来。 我们在写和说方面组织语言的方式是很不同…

    2023年9月28日
  • 波尔顿大学录取条件

    博尔顿大学是英国一所有百年历史的公立大学,地处英格兰北部,近邻曼彻斯特和圣海伦斯。博尔顿有美丽的乡村和旅游胜地,是一座名声好、有活力的城市。博尔顿大学每年招收留学生,并为留学生提供奖学金。 (一)申请条件 申请人必须拥有高中毕业证或高考资格证才可以申请大学和预科。 1.预科:高中毕业,1年–IELTS 5.0/1学期;IELTS 5.5。 2.大…

    2025年2月24日
  • 特拉华大学属于什么档次

    近日,U.S.News根据2023全美最佳大学榜单,更新了最新版全美公立大学榜单。 在这份榜单中,加州大学系统一枝独秀、大放异彩。因此,我们可以看到本次排名有3大亮点,具体如下: 1.加州大学洛杉矶分校排名第1,连续6年蝉联榜首 加州大学洛杉矶分校连续6年领跑公立第一,不过今年与加州大学伯克利分校并列排名第一,这是两所大学继2018年后,第二次并列第1。 2…

    2025年12月25日
  • 港大博士申请条件

    香港大学 它的学生毕业就业率高达99%,平均薪资位列香港第一;它的世界排名一直位居世界前一百,培养出张爱玲、孙中山等诸多成功人士。 今天,小曼就带大家走进在有“亚洲常春藤”之称的香港大学。 香港大学(The University of Hong Kong),简称 “港大”(HKU),是中国香港的一所综合性国际化公立研究型大学,有亚洲“常春藤”之称 。 香港大…

    2025年11月7日
  • 北卡罗来纳州立大学亨特图书馆的场地

    空白 Carnegie Mellon University 卡耐基梅隆大学 输入 中文名称:卡耐基梅隆大学 外文名称:Carnegie Mellon University(CMU) 建校时间:1900年 学校类型:私立全球研究型大学 学校属性:美国大学协会成员、新常春藤 地理位置:美国宾夕法尼亚州匹兹堡市 校训:My heart is in the work…

    2025年4月2日
  • 日本修士学费一年多少钱

    今天跟蔚蓝留学网老师看一下北海道大学本科研究生修士学费多少,希望对计划去日本留学的同学们有所帮助。 北海道大学,这所位于日本札幌市的国立大学,不仅历史悠久,而且在学术界占据着举足轻重的地位。其前身札幌农学校成立于1876年,是日本最早能够授予学士学位的高等教育机构之一,对日本现代教育史具有开创性的意义。1918年,学校更名为北海道帝国大学,成为当时日本设立的…

    2026年1月13日
  • 温莎大学本科经济学

    东京涩谷流光溢彩的十字路口,多了一道醒目的中国霓虹招牌——6月29日,星聚会海外首店在日本正式开业。这是一次意义非凡的“反向输出”,中国品牌正式走入KTV行业的发源地,开启全球娱乐产业的革新。 今年,中国品牌出海的队伍浩浩荡荡,而对于星聚会创始人星哥来说,这是一个蓄势三年之久的阶段性成果,出海的构想在很久以前就埋下了,日本首店开业前,星哥曾三次到访实地考察。…

    2025年8月8日
  • 新西兰梅西大学学费

    梅西大学不同课程的学费不同,大部分课程学费约3.6万新西兰元-4.8万新西兰元,约合人民币16万元/年-21万元/年。Veterinary Science兽医学课程学费较贵,达到5.6万新西兰元,约合人民币25万元/年。 以下是2025年梅西大学一年学费盘点—— 一、本科学费 1、大部分课程学费为35920新西兰元-43000新西兰元,约合人民币16万元/年…

    2025年10月28日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信