NVIDIA 推出 Nemotron 3 Nano Omni,统一视觉、音频和语言处理,采用 30B-A3B 混合专家架构,无需为不同模态部署独立模型。该模型在复杂文档智能、音视频理解等六个排行榜领先,AI 代理吞吐量较其他开放 omni 模型最高提升 9 倍,支持 1920×1080 原生输入分辨率。已获富士康、Palantir 等采用,Hugging Face 等平台可获取。
NVIDIA Blog
🌸 在花频道 · 茶馆讨论 · 投稿通道
👍 113 ☃ 13 👎 5 ❤️ 4 👏 2