Skip to main content

DeepSeek 开源 TileKernels 算子库,支持 NVIDIA Blackwell 架构DeepSeek 开源高性能 GPU 算子库 TileKernels,该项目基于 TileLang 开发

  1. DeepSeek 开源 TileKernels 算子库,支持 NVIDIA Blackwell 架构

    DeepSeek 开源高性能 GPU 算子库 TileKernels,该项目基于 TileLang 开发。该库针对大语言模型(LLM)的训练与推理进行了深度优化,其算子性能已接近硬件计算强度与内存带宽的极限。

    TileKernels 涵盖了 MoE 路由、FP8/FP4 量化及多种融合算子,并已在 DeepSeek 内部环境投入使用。该库目前适配 NVIDIA SM90 及最新的 SM100(Blackwell)架构,运行环境要求 CUDA 13.1 及以上版本。

    GitHub

    🌸 在花频道茶馆讨论投稿通道
    🐳 201 👍 25 👎 8 6 ❤️ 2 🏆 2