美国大学教授年薪多少

智东西

编译 | 王欣逸

编辑 | 程茜

智东西12月12日消息,昨天,斯坦福大学研究团队发布最新研究,在探查斯坦福大学工程学院网络漏洞的测试中,他们新推出并开源的Multi-Agent(多Agent)框架ARTEMIS表现超越了90%的人类专家,全面超越现有的Agent框架,而其实际成本约为人力的1/14。

ARTEMIS具备动态提示生成、任意子Agent调用和自动漏洞分级评估功能,在实际应用中,它能完成复杂的网络任务,可以对网络进行扫描,找出潜在漏洞和软件安全隐患,并探寻利用这些漏洞的方法。

本次实验,研究人员让ARTEMIS与10名人类渗透测试专家、多个现有的Agent框架共同执行任务,让他们对斯坦福大学工程学院的网络进行探查,但不得实际入侵,以此来全面评估他们的探查能力。结果显示,基于OpenAI的GPT-5的ARTEMIS框架综合表现位列第二,共发现9个有效漏洞,提交有效率达82%,其表现优于十位人类参与者中的九位,全面碾压其他Agent框架,包括基于同一底层模型GPT-5的单Agent自主框架Codex和CyAgent。

P为人类网络安全专业人员;A1、A2分别是ARTEMIS两个不同配置的框架,前者基于GPT-5,后者基于集成模型;CO、CS和CG分别是使用GPT-5模型作为基础来运行的单Agent自主框架Codex、使用Claude Sonnet 4模型作为基础来运行单Agent自主框架CyAgent和使用GPT-5模型作为基础来运行CyAgent。

除了拥有与顶尖渗透测试专家相当甚至超越的性能之外,ARTEMIS把成本也打下来了,搭载GPT-5的ARTEMIS框架每小时成本约为18美元(约合人民币127.1元),约为美国渗透测试员时薪的1/14。

不过,论文指出,ARTEMIS还存在处理基于图形用户界面(GUI)的任务时有困难、比人类更高的误报率等短板。

该论文现已发布在arXiv上,题为《将AI Agents与网络安全专业人员在真实世界渗透测试中的表现进行比较(Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing)》。

论文地址:https://arxiv.org/abs/2512.09882

一、综合排名第二,全面碾压现有Agent框架,还能提升原始模型性能

研究人员建立了ARTEMIS框架下的两个对照组,以评估不同配置下的ARTEMIS框架性能。一个是使用OpenAI的GPT-5作为监督器和子Agent的A1,另一个是使用集成模型作为监督器、Anthropic的编程模型Claude Sonnet 4作为子Agent的A2,集成模型包括了以下模型:OpenAI的推理模型o3和o3 Pro、Anthropic的编程模型Claude Sonnet 4和Claude Opus 4,以及谷歌的Gemini 2.5 Pro。

从结果来看,A2在和一众人类渗透测试专家、现有的Multi-Agent框架的比较中位列第二名,共发现9个有效漏洞,提交有效率达82%,其表现优于10位人类参与者中的9位。A1则打败了5名人类参与者,位列第七名。

除ARTEMIS外,分数最高的Agents框架CO(基于GPT-5的Codex)仅超越了两位人类参与者,而CS(基于Claude Sonnet 4的CyAgent)和CG(基于GPT-5的CyAgent)落后于所有人类参与者,CS的总得分仅为A2的四分之一。

从漏洞的质量来看,人类参与者发现的Critical(关键)漏洞占据了更大的比例;ARTEMIS框架的两个配置A1和A2发现的关键漏洞比例更小,且误判的内容相对较多;A1和A2虽然提交了相同数量的漏洞,但A1的正确率仅为55%,关键漏洞仅占18%,而A2的关键漏洞占比则达到了45%,这表明不同的模型组合和配置对框架整体性能有影响,A2的多模型架构可能在处理复杂任务和减少误报方面更为有效。

在时间上,人类参与者和ARTEMIS框架的表现也不尽相同。ARTEMIS框架表现出了长时间、持续、但间歇性产出的节奏,在提交漏洞之间通常有更长的间隔时间;人类参与者则呈现出了高度可变、依赖灵感和集中爆发的节奏。他们的活跃时间(通过键盘输入判断)和漏洞提交时间点分布不均匀。

值得一提的是,ARTEMIS和人类最根本的区别是,ARTEMIS在发现一个值得关注的目标后,会立即在后台启动一个专用的子Agent去探测它,同时主线继续进行其他工作,在峰值时,ARTEMIS可以达到8个子Agents并行运行。

此外,从网络安全基准测试Cybench的表现来看,在基于GPT-5的Artemis框架和Claude 4.5 Sonnet、GPT-5等模型能力对比中,ARTEMIS以48.6%的成功率位列第二,仅次于Claude 4.5 Sonnet(55%),且略高于其底层模型GPT-5(45.9%)。

这一结果意味着,ARTEMIS框架在解决网络安全问题中,具备与顶级大模型相当的能力,且在一定程度上提升了基础模型的性能。

二、由监督器、子Agent、分级器组成,成本仅为人类专家的1/14

现有的针对网络安全AI Agent的研究主要有三类:一是PentestGPT等需要人类引导等半自主框架;二是Codex、CyAgent等能独立运行但能力有限的单Agent自主框架;三是Incalmo、MAPTA等Multi-Agent(多Agent)自主框架。

论文中提到,ARTEMIS是一个复杂的Multi-Agent框架,被设计用来对真实世界的生产系统进行长周期、复杂、渗透性测试,该框架目前已开源。

它有三个核心组件:一个监督器,负责管理工作流;一组任意子Agents集群,负责执行具体任务;一个漏洞分级器,负责漏洞验证。

ARTEMIS借鉴了现有编程Agent的设计,并通过任务列表、笔记系统和智能摘要机制,达到了比现有Agent持续运行时间更长的能力。在分配任务时,其自定义提示生成模块会为子Agent创建任务特定的系统指令。因此,ARTEMIS有着动态生成系统提示、上下文管理和分级报告等功能的优势性。

此外,ARTEMIS在经济成本上也相当占优。以基于GPT-5的ARTEMIS框架A1来看,论文指出,A1每小时成本约为18.21美元(约合人民币128.6元),按每周40小时计算,其年化成本约为3.78万美元(约合人民币26.7万元)。

而人类渗透测试人员的每日收费通常在2000至2500美元左右(约合人民币1.41万元至1.77万元),按每日工作8小时计算,时薪约为250美元至312美元(约合人民币1765元至2204元),是ARTEMIS框架每小时成本的14倍多;市场上美国渗透测试员的的年薪平均为12.5万美元(约合人民币88.29万元),是ARTEMIS框架年成本的3倍多。即使是使用每小时成本更高的A2(约为59美元,约合人民币416.7元),其成本也低于人类专家。

三、具备执行技术,短板是找不到漏洞和GUI限制

不过,据《华尔街日报》报道,ARTEMIS并非完美无缺,在误报率上,A2误报了18%的漏洞,A1失误的更多。除了失误外,ARTEMIS还完全遗漏了一个大多数人类测试人员能轻易发现的明显漏洞。

ARTEMIS频繁提交漏洞报告,却很少发现目标漏洞,而且总是发现低严重性、低复杂度或无法利用的漏洞。这种遗漏与误报的背后,可能与ARTEMIS的决策逻辑有关。论文指出,ARTEMIS框架提交漏洞报告次数的增加与未发现目标漏洞存在相关性,这可能是因为ARTEMIS在主机上发现其他漏洞后便转移了目标。

研究人员称,ARTEMIS的瓶颈在于识别漏洞模式而非技术执行能力。在中、高等级的提示下,ARTEMIS成功找到了大部分目标漏洞,这表明ARTEMIS具备漏洞的技术执行能力。当提示信息减少,仅提供低等级、仅信息和仅主机提示时,ARTEMIS成功率急剧下降,即它的自主识别攻击入口和识别漏洞的能力不足。此外ARTEMIS还存在行为不确定性,在“未经身份验证的远程控制台访问”这一任务中,ARTEMIS在高等级提示下依然任务失败,在中等级和仅主机提示下却能完成任务。

此外,ARTEMIS还存在一个关键限制,作为基于命令行和文本分析的AI,它无法通过图形用户界面(GUI)与浏览器进行交互。

斯坦福大学工程学院系统与网络安全负责人亚历克斯·凯勒(Alex Keller)称:“此前斯坦福大学的网络从未遭受过AI程序的攻击,此次实验似乎是弥补斯坦福大学网络安全漏洞的一种有效方式。在我看来,实验的益处远大于任何风险。”

斯坦福大学计算机科学教授丹·博内(Dan Boneh)为该研究提供了建议:“鉴于全球大部分代码都未经过安全漏洞测试,ARTEMIS等工具将帮助网络安全专业人士发现并修复比以往更多的代码漏洞。”此次测试,ARTEMIS就发现了斯坦福大学存在的一个有安全问题的过期网页。

结语:正探索多Agent框架的配置优化与架构迭代

在真实环境中与人类的渗透测试和基准测试Cybench均显示,ARTEMIS不仅在其在复杂现实任务中达到了可与顶尖人类专家持平甚至超越的能力,在显著优于其他现有Agent框架的同时还做到了不损害模型的原始能力,并在原始模型上实现了能力的提高。

为软件开发者与白帽黑客提供协作平台的机构HackerOne的调研报告指出:当前已有70%的安全研究人员开始采用AI工具辅助漏洞挖掘。

AI在自动化网络攻击领域正在走向实战应用。研究人员称,他们未来将持续探索这一领域,创建可运行的环境副本,对不同的Agent架构、配置和模型进行消融实验,优化基础设施,还将与企业合作开展漏洞赏金计划等。

来源:《华尔街日报》、arXiv

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/69786.html

(0)
上一篇 2025年12月26日
下一篇 2025年12月26日

相关推荐

  • 苏州利物浦大学附近有哪些街

    昨日,雅思考试主办方英国文化教育协会(British Council)官宣,新的雅思机考考点将落户在苏州的西交利物浦大学。西交利物浦大学雅思机考考点的首场考试将于1月22日举行,今天晚上8点整在NEEA官方网站正式开放报名。 西交利物浦大学雅思机考考点可提供雅思考试(IELTS)及用于英国签证及移民的雅思考试(IELTS for UKVI)两种机考服务,计划…

    2025年9月4日
  • 5亿吓懵宁王?两大超级龙头跳水 华为产业链彻底爆发 什么情况?

    市场内外,大事不断! 市场方面,有两大意外:一是牧原股份大跳水,二是宁德时代大跌。有传闻称,牧原股份大裁员并且内部实行承包制度,自育自繁自养养殖模式或将调整。而宁德时代方面,则有券商下修三季度对公司的盈利预测,从原先115亿调整到110亿。 今天市场上为数不多的亮点是“华为产业链”,华为汽车概念股大面积涨停。从游资的反应来看,这个题材的持续性可能会比较强。那…

    2023年10月15日
  • 美国康奈尔大学公共管理学

    康奈尔大学公共管理硕士专业为期两年,重视跨学科课程教育与人才培养,面向渴望应对复杂公共政策领域挑战的人士。作为常春藤高校联盟中规模最大、最多样化的大学之一,学生大大受益于其杰出的师资力量和员工资源丰富的知识广度和深度。康奈尔大学公共管理硕士专业的毕业生在广泛领域取得事业成功,包括教育、医疗、刑事司法、可持续发展和经济政策等。 康奈尔大学公共管理硕士专业申请要…

    2025年8月21日
  • 办理澳大利亚签证需要多久

    澳大利亚跟美国加拿大这些北美国家对比的话,有其独特的气候等优势,特别是冬天的加拿大实在是太冷了,所以很多人不管是旅游还是留学等,都会优先考虑去澳大利亚。现在去澳大利亚签证好办理吗?澳洲签证需要多久,关于这些问题需要具体签证具体分析,如果你想初步的有一个比较全面的认识,可以透过咱们客服了,在小程序,口袋模板。因为此处不能直接留,谢谢配合。 网友分享: 被问到最…

    2024年4月22日
  • 雪城大学qs世界大学排名

    天气越来越冷了,大家是不是觉得出门上学或上班越来越难了? 不仅国内如此,在北半球留学的留子们也一样。 特别是在美国留学的小伙伴,地方选得好,一夜冰封不是梦! 今天就和Vicky一起来看看美国哪些学校冬季特别冷吧,怕冷的小伙伴申请季可要好好权衡哦! 01 美国的冬季 美国冬季最冷的地区主要是3块,东北部、中西部、大平原区。 其中,东北部代表城市有纽约、波士顿、…

    2025年11月28日
  • 印第安纳州德堡大学好吗

    身为国际生,有时候会觉得自己是被美国大学排挤的一生,要好的 Offer 没有,学费主打一个狮子大开口,Financial Aid 却是抠抠搜搜。但是别担心!还是有些大学对国际生非常大方的,不仅提供 Need-based Financial Aid(基于需求的经济援助),还提供 Merit-based Financial Aid,即基于表现颁发的奖学金。好心的…

    2024年8月3日
  • 广东理工汽车学院南海校区地址

    1月17日上午,历时3天半的省十三届人大三次会议圆满完成各项议程,在广州胜利闭幕。 在昨天(16日)举行的广东省第十三届人民代表大会第三次会议举行的记者会上,省大湾区办负责人,广州、深圳、珠海、佛山、惠州、东莞、中山、江门、肇庆9市市长或分管副市长就如何推动、参与粤港澳大湾区建设等问题回答记者提问。 省人大代表、佛山市委副书记、市长朱伟现场介绍了佛山参与粤港…

    2025年3月27日
  • 法国巴黎第七大学怎么样

    名气能给一个人,一所学校带来的东西,实在太多了。 名字能给气质加分,人且如此,高校亦然。反之则可能成为拖累项。 除了清北复交一众名字响当当的高校,对于那些不够知名的学校来说,人们判断它的好坏,大多是通过从地理再到校名含义进行的表面剖析。 常用套路有,“xx大学”要比“xx学院”高级,学校名字以“中国”打头的自然不会差。大区打头的绝对要比省份命名的高级,比如“…

    2025年2月7日
  • 开普敦大学相当于国内哪所大学

    非洲许多国家属于第三世界,经济发展水平不高,教育程度也相对落后。然而,在非洲某些国家,却拥有悠久的高等教育历史,其中更是有始建于中国唐朝的大学,令人不可思议。下面,我们就来列举一下非洲最古老的10所大学,一起涨一涨姿势: 10. 加纳大学,1948年 加纳大学是加纳最早建立的大学之一,目前拥有超过4万名学生: 9. 伊巴丹大学,1948年 伊巴丹大学是尼日利…

    2025年8月21日
  • 澳门留学中介_澳门留学中介费一般收多少

    谁懂啊,澳门留学在国内真的太少见了!!! 小编前阵子偶然看到有同学说想要去澳门留学,但是没有看到很多的宣传,对留学中介和澳门留学都不太了解。所以今天给大家总结出来了澳门的留学优势,以及找可信中介的方法! ♯澳门留学优势♯ ⑴适应速度快 在澳门读书,一般用粤语或普通话沟通,基本不存在语言障碍,文化环境类似,不会产生出国留学的孤独感。 ⑵治安好,安全性高 澳门目…

    2024年3月12日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信