Skip to main content

ICLR 2026 审稿系统揭示 AI 评审比例达 21%在顶级人工智能会议 ICLR 2026 的审稿系统中,大模型参与评审的比例引发广泛关注

  1. 科技圈🎗在花频道📮
    研究发现去年 14% 生物医学摘要或经 AI 辅助撰写 《科学进展》发布的一项新研究指出,2024 年发表的生物医学研究摘要中,约有七分之一(14%)可能是在人工智能(AI)的辅助下完成。该研究分析了 PubMed 数据库中 150 万篇摘要,发现超过 20 万篇包含大型语言模型(LLM)常用的特定词语。 研究团队并未采用传统的 AI 检测模型,而是通过识别“多余词汇”来评估 AI 的影响。这些词汇在 ChatGPT 于 2022 年 11 月普及后出现频率显著增加,多为风格性词语而非内容性名词,例如…
    ICLR 2026 审稿系统揭示 AI 评审比例达 21%

    在顶级人工智能会议 ICLR 2026 的审稿系统中,大模型参与评审的比例引发广泛关注。卡内基梅隆大学教授 Graham Neubig 基于 Pangram Labs 使用 EditLens 工具对公开的 7.58 万条评审意见进行分析,预测结果显示,其中约 21% 的评审被判定为完全由 AI 生成,约 35% 不同程度经 AI 修改,约 43% 被判定为人类独立撰写。被判定为 AI 生成或经 AI 修改的评审,其平均评分与字数均高于完全人类评审。EditLens 由学术团队提出并在 Pangram Labs 平台中部署,其相关论文本身也作为 ICLR 2026 投稿之一。

    分析指出,AI 审稿或将成为科研流程的新常态,学术界正面临自动化与伦理平衡的挑战。

    ICLR 官方此前发布了被广泛认为极为严格的 LLM 使用政策,要求作者和评审披露对 AI 的任何使用,否则可能构成对伦理规范的违反,其本人投稿也可能面临拒稿风险。此事件突显出 AI 在学术评审中的深度渗透。不同顶会对此采取不同策略:CVPR 2025 明令禁止使用 AI 撰写评审和元评审,NeurIPS 2025 在强调保密前提下允许有限使用 LLM,并要求在 LLM 构成研究方法一部分时说明使用方式;美国癌症研究协会在明令禁止评审使用生成式 AI 并配合检测工具监测后,短期内检测到的疑似 AI 评审比例一度明显下降。


    ICLR 2026 | AACR | ICLR blog

    🍀在花频道 🍵茶馆 📮投稿新鲜事
    6 👎 69 😁 21 ❤️ 5 emoji 4