DeepSeek 于 2025 年 12 月 31 日在 arXiv 公开了名为 mHC(Manifold-Constrained Hyper-Connections)的新架构,并于 2026 年 1 月 1 日出现在 Hugging Face Papers 页面。该架构能让大模型训练过程中的超连接更加稳定,同时保持其性能优势。
相关技术论文已在 Hugging Face Papers 页面收录。mHC 架构通过流形约束的超连接技术,缓解大模型训练中连接稳定性的不稳定问题,相关实验结果已在论文中报告。
Adina Yakup | Hugging Face
🍀在花频道 🍵茶馆聊天 📮投稿
👍 348 🐳 90 ❤️ 13 😁 7 🤔 6 💊 4 🍾 2 😇 1