Skip to main content

DeepSeek 梁文锋署名论文获 ACL 2025 最佳论文奖 相关结果将用于下一个前沿模型DeepSeek 梁文锋作为通讯作者与北京大学等联合发表的论文在 ACL 2025 颁奖典礼上荣获最佳论文奖

  1. DeepSeek 梁文锋署名论文获 ACL 2025 最佳论文奖 相关结果将用于下一个前沿模型

    DeepSeek 梁文锋作为通讯作者与北京大学等联合发表的论文在 ACL 2025 颁奖典礼上荣获最佳论文奖。该论文提出的原生稀疏注意力(NSA)机制通过算法与硬件协同优化,将长文本处理速度提升 11 倍,性能还超越了传统全注意力模型。

    一作袁境阳透露这项技术可将上下文长度扩展到 100 万 tokens,将被应用到下一个前沿模型中。结合论文发表于 DeepSeek-R1 推出之后,外界猜测该技术将用于下一代 DeepSeek-V4 及 DeepSeek-R2。在各项基准测试中,NSA 预训练的 27B 参数模型在 9 个评测指标中有 7 个超越全注意力基线。

    量子位 | 论文原文

    🍀频道 🍵茶馆 📮投稿
    👍 373 🐳 65 🤯 12 ❤️ 10 👎 8 🤣 6 🤷‍♂ 3 2