Anthropic 模型进化太猛了,天天这么搞,即强又快,能不焦虑吗
https://red.anthropic.com/2026/mythos-preview/
因为能力太强,进攻性太突出,Anthropic 担心如果广泛可用,会被恶意利用加速网络攻击。
它有多强?
自主发现零日漏洞(zero-day)
能在主要操作系统(Linux、FreeBSD、OpenBSD)、浏览器(Firefox 等)、FFmpeg 等软件中发现老旧但未修复的漏洞。例如:
- 发现 27 年前的 OpenBSD SACK 漏洞。
- 发现 17 年前的 FreeBSD NFS 远程代码执行漏洞。
- 发现 16 年前的 FFmpeg H.264 漏洞。
- 还能发现 Linux 内核的本地权限提升漏洞等。
自主编写利用代码(exploit)
能写出复杂的利用链,包括:
- ROP 链、JIT 堆喷射(heap spraying)、权限提升。
- 将已知 N-day 漏洞转化为可实际执行的 PoC(概念验证)代码。
- 链式利用多个漏洞(2-4 个漏洞组合),绕过 KASLR 等保护,实现更高权限控制。
逆向工程
能对闭源软件进行逆向,重建部分源代码并找出漏洞。
基准表现
在内部测试(如 OSS-Fuzz 语料库)中,崩溃和控制流劫持次数远超 Opus 4.6。在 Firefox 漏洞利用测试中,Mythos 成功率大幅领先(181 次 vs Opus 的 2 次)。

具体内容可以看开头链接。个人觉得这么强大的模型,以至于不能放出来,那内部该藏有多强的东西啊,十分焦虑了。
好啊好啊