Skip to main content

DeepSeek 发布 OCR-2 光学字符识别模型DeepSeek 在 Hugging Face 平台发布 DeepSeek-OCR-2 光学字符识别模型

  1. DeepSeek 发布 OCR-2 光学字符识别模型

    DeepSeek 在 Hugging Face 平台发布 DeepSeek-OCR-2 光学字符识别模型。该模型支持动态分辨率处理,默认配置为 (0-6)×768×768 + 1×1024×1024 分辨率,可处理文档转换、图像 OCR、图表解析等多种任务。

    模型基于 transformers 框架,支持 NVIDIA GPU 推理,要求 Python 3.12.9 和 CUDA 11.8 环境。用户可通过不同提示词实现文档转 Markdown、图像 OCR、图表解析等功能。项目在 GitHub 提供了模型推理加速和 PDF 处理的详细指导。

    Huggingface

    🍀在花频道 🍵茶馆聊天 📮投稿
    🐳 357 👍 83 👎 13 ❤️ 11 😁 6 🥰 3 👀 3 🤗 2