Anthropic 披露 Glasswing 首月成果：AI 发现超 1 万个高危漏洞

Anthropic 在其 Project Glasswing 项目启动一个月后公布了初步成果，该项目与大约 50 家合作伙伴共同努力，已经在重要的软件系统中识别出超过 10,000 个高危和关键级别的安全漏洞。

根据参与 Project Glasswing 的团队反馈，Claude Mythos Preview 模型在漏洞发现方面取得了显著成效，部分团队的效率提升了十倍以上。目前，项目的瓶颈已经从漏洞的发现转移到漏洞的验证、披露和修复流程上。

Cloudflare 公司报告称，他们在关键路径系统中发现了 2000 个漏洞，其中 400 个被归类为高危或严重级别，并且其误报率低于人工测试。

Mozilla 在 Firefox 150 版本中修复了 271 个漏洞，这一数字是使用 Claude Opus 4.6 测试 Firefox 148 版本时发现漏洞数量的十倍以上。

在外部评估中，Mythos Preview 模型同样表现出色。英国 AI Security Institute 确认该模型是首个能够端到端攻破两个网络攻防靶场的模型。

独立安全平台 XBOW 评价称，该模型在网页利用基准测试中的表现远超现有模型，并展现出极高的准确性。

根据 Anthropic 的博文，该公司近几个月来已对超过 1000 个开源项目进行了扫描，总共发现了 23,019 个漏洞（包括中危和低危），其中模型评估认为有 6,202 个属于高危或严重级别。

目前，已有 1,752 个高危或严重漏洞经过人工复核，其中 1,587 个被确认为真实漏洞，真实率为 90.6%。在这些被确认的真实漏洞中，有 1,094 个仍被判定为高危或严重级别，占比 62.4%。

根据当前的人工复核命中率估算，即使不再发现新的漏洞，最终也可能识别出近 3,900 个开源的高危或严重漏洞。

漏洞的修复工作是真正的挑战。Anthropic 指出，从发现高危或严重漏洞到最终补丁上线，平均需要两周时间。部分开源项目的维护者甚至表示需要放慢披露的速度，因为他们处理 AI 生成漏洞报告的能力已接近极限。