Skip to main content

DeepSeek开源周第 3 天:DeepGEMMDeepGEMM 是一个用 CUDA 编写的库,旨在实现干净高效的具有细粒度缩放的 FP8 通用矩阵乘法(GEMM),支持普通和混合专家(MoE)分组 GEMM

  1. DeepSeek开源周第 3 天:DeepGEMM

    DeepGEMM 是一个用 CUDA 编写的库,旨在实现干净高效的具有细粒度缩放的 FP8 通用矩阵乘法(GEMM),支持普通和混合专家(MoE)分组 GEMM。安装时无需编译,通过轻量级即时(JIT)模块在运行时编译内核。

    X | Github

    📮投稿 ☘️频道 🌸聊天 🗞𝕏
    🔥 258 👍 69 🐳 8 ❤️ 7 👎 6 👏 2 👌 1