Skip to main content

科技圈🎗在花频道📮

【莫谈国事】 大家多多分享
• 禁止推广/黑产/刷屏/色情/ NSFW
• 禁止黄赌毒/宗教/政治/键政
• 禁止撕逼/人身攻击/阴阳怪气

群聊: @ZaihuaChat
备用频道:@zaihuatg

侵权/解封/帮助:
@zaihuaAskBot
广告合作:
@zaihua_ad_bot
终极反馈 @zaihua_bot
  1. 腾讯混元 Hy3 preview 模型发布并开源

    腾讯正式发布并开源混元 Hy3 preview 语言模型。作为架构重建后的首个混合专家模型(MoE),该模型总参数量达 295B,激活参数 21B,支持 256K 上下文长度。其核心能力定位于复杂推理与智能体(Agent)应用,在数学、科学等理工科推理任务及代码开发场景中表现显著提升。

    受模型架构与推理框架深度协同影响,Hy3 preview 的推理性能大幅优化,其中 CodeBuddy 等产品首 token 延迟降低 54%。目前该模型已在元宝、腾讯文档、QQ 等多个内部产品上线,并同步在 GitHub、HuggingFace 等平台开源。腾讯云亦配套推出 API 及定制化 Token Plan,个人版定价最低 28 元/月。

    腾讯混元

    🌸 在花频道茶馆讨论投稿通道
    👎 22 3 😁 2
  2. DeepSeek 开源 TileKernels 算子库,支持 NVIDIA Blackwell 架构

    DeepSeek 开源高性能 GPU 算子库 TileKernels,该项目基于 TileLang 开发。该库针对大语言模型(LLM)的训练与推理进行了深度优化,其算子性能已接近硬件计算强度与内存带宽的极限。

    TileKernels 涵盖了 MoE 路由、FP8/FP4 量化及多种融合算子,并已在 DeepSeek 内部环境投入使用。该库目前适配 NVIDIA SM90 及最新的 SM100(Blackwell)架构,运行环境要求 CUDA 13.1 及以上版本。

    GitHub

    🌸 在花频道茶馆讨论投稿通道
    🐳 135 👍 13 6 👎 6 🏆 1
  3. 群组或者评论消息举报使用方法。

    • 使用 /spam 消息会发送的复核群组,管理复核后会处理。
    @admin 会呼叫所有管理。
    40 😱 8 😁 3 👍 2 👏 2 🙉 2 🌭 1