更为关键的是, 它并非仅仅着眼于能否引发崩溃, ExploitBench构建了「五层能力阶梯」。
每一层都存在着具有确定性的自动验证器进行打分, 并非依靠大语言模型去充当裁判, 也不是依赖人工审核。
结果呢?
把GPT-5.5甩开了一个时代
在有着人类提示的那种模式之下, Claude Mythos Preview的得分被均分为9.90/16, 在总共41个漏洞里头, 有21个漏洞达到了T1的标准。
GPT-5.5均分5.51,T1只有2个。

更恐怖的是全自主模式的表现。
Mythos分数近乎没往下掉 , 完全靠自身 平均得分9.55 , 与有人所提示的9.90之间差距极其微小。
意味着在浏览器漏洞利用这件关于Mythos的事上, 几乎不需要人类予以协助。
拥有4.30的GPT-5.5处于全自主模式, 其他模型, 没有任何一个能触及到可以被称为T1的边缘状态。
不得不说,这个差距已经不是「领先」能形容的了,这是断层。

不过代价同样令人震惊, Mythos跑完一百二十二个episode耗费了大约三万六千四百二十八美元, GPT - 5.5跑一百二十三个episode仅仅花费了约三千零七十五美元, 形成了十二倍的价差。
有着英国AI安全研究所之称的AISI独立自主进行相关测试后也核实确认了这样的类似结论, 即Mythos的确更具备优势然而代价极其高昂。
这同样意味着一种微妙的可能性, 倘若OpenAI乐意投入更多算力, 那么性能方面的差距就有这样一种可能, 即有可能被缩小。

人类追了一年,它仅129轮破了
ExploitBench的核心作者Seunghyun Lee, 其自身乃是一名硬核安全研究员。
曾经提交过20多个浏览器day0漏洞, 40多个防御绕过情况。他逐一条目地仔细审阅了Mythos所相关的对话记录, 给出的评价是:
思索推测方面的破绽, 查验假定内容, 排解调试之际的疑难状况, 撰写辅助性质的脚本, 寻觅绕开V8沙箱的途径……
完全就是我对一个相当称职的浏览器安全研究员的预期。

以下三个案例,每一个都足以让安全圈侧目。
Case 1:破解人类一年没解开的「CVE悬案」
CVE - 2024 - 0519, 是一个存在于在野环境里被歹徒利用但却压根儿没有任何公开报道, 也不存在任何公开详尽说明其利用途径的相关凭证或演示样本可查的漏洞。
安全社区将其称作「CVE Cold Case」, 多个研究团队付诸尝试, 历经超过一年的时间范围, 各次全部遭遇失败。
Mythos在10轮测试中,有1轮成功复现。
在历经129轮的LLM调用之后, 又经过154次的工具调用, 它达成了根因分析, 引发了差异行为, 并获取到了T3沙箱内的原语。
这个存在的漏洞, 其PoC直至现在都未曾公开, 研究的团队特别地没有去披露Mythos的具体exploit路径。
一个人类顶级团队花一年没搞定的事,AI用一次对话解决了。
情形二: 将仅适用于ARM64的存在毛病的大口子, 致使其在x86 - 64上重新出现并恢复使用情况。
关于CVE - 2024 - 7965, 该为V8 Turboshaft JIT编译器方面存在的漏洞。
能够公开获取的资料当中, 仅仅存在ARM64这一架构上的利用方案, 而最初报告该情况的那个人自己都曾表示, 「对于此漏洞被处于非官方、非法渠道利用这种状况感到十分诧异」。
在x86 - 64这个环境下, 鉴于寄存器高32位于截断操作的时候会被清零, 所以利用起来是极其困难的。

名为Mythos的事物, 没有选取JavaScript这条途径行走, 而是转变到WebAssembly这里来呢。
在第13次进行尝试时, 它借助Liftoff栈槽的load/store尺寸存在的差异, 构造得出可控的高位出现污染。
发生了第14次, 致使T4出现崩溃的情况;出现了第15次, 达成了获得64位索引的Wasm内存访问的结果;接下来的几步, 毫不费力地达成了实现对T2进行任意读写这种情况。
Case 3:用随机数状态恢复实现稳定exploit
CVE-2023-6702,一个V8类型混淆漏洞。
将其予以利用之时, 需要对JSGlobalProxy的hash值作出预测, 这个有关于HASH的数值是依靠伪随机来产生生成的, 传统采取的办法是堆喷射以及概率碰撞, 这种方式虽然能够运用但却是不稳定的。
Mythos在10轮测试中,5轮成功拿到T3原语。
当中的四轮, 采用了常规概率的方案, 然而存在一轮, Mythos选择了一条被人类专家都予以否决的路径:
它察觉到, 能够借助恢复V8的逐隔离区XorShift128+RNG状态, 精准地对未来全部伪随机操作作出预测。

怎样做才具体呢, 先是借助Math.random()去恢复依照上下文的RNG, 接着反演MurmurHash3, 然后一直回溯找到依照隔离区域的RNG, 随后构建GF(2)矩阵来做高斯消元, 最终完全恢复128位的状态。
Lee在私下之际, 与原始exploit的创作者探讨过此方案, 他俩最终皆因复杂度实在过高, 进而选择了放弃, 然而, Mythos却是以干脆利落的劲头予以了执行。
这一刻,Anthropic不再「雪藏」
将目光回转过去看, Anthropic先前的那种“雪藏”以及迟疑, 它们其中并非仅仅只是对于LLM越狱风险所存在的忌惮, 反而更加像是在凝视ASI深不见底的深渊之际所生出的本能般的一种战栗, 存在于此, 有着这样的表现。
今儿个, 这从未如此沉闷拘束过的, 那最为顶级最为悍猛的野兽, 马上就要依托于Google Cloud的根基之上, 全然挣脱枷锁束缚了。

Mythos的解除限制, 绝非仅仅只是Anthropic于商业竞争里朝着OpenAI所打出的一张起关键作用的牌, 它更犹如一个刺耳的、能引起人警觉的信号:
在数字世界的黑暗森林里开云真人app官方版入口,开云真人app官网入口开云app官方最新下载地址,由机器主导的攻防时代已经到来。
当超级人工智能开始, 以从前所没有过的维度, 独立自主地进行挖掘, 去理解甚至重构, 我们赖以生存的底层系统时。
人类开运真人app下载苹果版,开运真人app下载,真的做好准备迎接ASI的降临了吗?
参考资料:
https://x.com/AiBattle_/status/2055762242373558477
https://the-decoder.com/new-benchmark-shows-claude-mythos-and-gpt-5-5-can-develop-real-browser-exploits-autonomously/
https://exploitbench.ai/blog/human-observations/

标签: Claude新模型 GPT-5.5对比 漏洞利用能力 ExploitBench测试 AI安全研究员
还木有评论哦,快来抢沙发吧~