Skip to main content

腾讯玄武实验室阿图因 AI 在 CyberGym 测试中超越 Mythos腾讯玄武实验室宣布,其研发的阿图因 AI 在加州大学伯克利分校主导的 CyberGym 网络安全基准测试中获得 84.0% 的得分,超过 Anthropic 的 Claude Mythos Preview

  1. 腾讯玄武实验室阿图因 AI 在 CyberGym 测试中超越 Mythos

    腾讯玄武实验室宣布,其研发的阿图因 AI 在加州大学伯克利分校主导的 CyberGym 网络安全基准测试中获得 84.0% 的得分,超过 Anthropic 的 Claude Mythos Preview。该工具基于可本地部署的开源模型 GLM-5.1 构建,消耗的预算不到 Mythos「玻璃翼计划」的 0.1%。

    阿图因 AI 还在 curl、gnark、OpenSSL、Python cryptography、Java bc-java 等重要项目中发现了多个 Mythos 未检出的高危逻辑漏洞,评分最高达 9.3。在伯克利 BVI 真实世界漏洞榜单中,阿图因 AI 的严重漏洞严重程度排名第 1,总数排名第 5。

    腾讯玄武实验室

    🌸 在花频道 · 茶馆水群 · 投稿通道
    🤣 268 👍 56 🤯 20 ❤️ 11 🖕 10 👎 8 😁 3 🥰 1 🤩 1