Skip to main content

Claude Code 挖掘简报从泄露的 Claude Code 的源代码来看,多方向信息渠道为我们带来了一些有意思的观察,我们总结当前时间可以关注的一些内容

  1. 科技圈🎗在花频道📮
    GitHub 出现 Claude Code 非官方还原仓库,称从公开 npm 包还原 4756 个文件 GitHub 上出现名为 claude-code-sourcemap 的非官方仓库,项目通过公开 npm 包 @anthropic-ai/claude-code 附带的 source map 文件 cli.js.map 中的 sourcesContent 字段,还原出 Claude Code 2.1.88 的 TypeScript 源码,共 4756 个文件,其中包括 1884 个 .ts 与 .tsx…
    Claude Code 挖掘简报

    从泄露的 Claude Code 的源代码来看,多方向信息渠道为我们带来了一些有意思的观察,我们总结当前时间可以关注的一些内容。当然我们相信更多的内容和借鉴意义在于 Claude 模型本身如何被合理的使用,这是代码中体现的工程价值,这种能力有助于任何想要持续挖掘和理解 Claude 系列模型的工程师。

    以下是当前挖掘的部分信息:

    1. 新模型
    src/utils/model/model.ts:388:体现出的 capybara-v2-fast(1m),但是之前提到的 Mythos 系列模型并没有展现。
    src/constants/prompts.ts:204:展现出该模型的一些特点:
    对 \n\nHuman: 停止序列敏感、v8 版本有过度注释倾向(29-30% 虚假声明率)、受保护的思考块(protected-thinking block)。
    详细信息参考 X 推文
    src/utils/undercover.ts:48-49:Opus 4.7 / Sonnet 4.8 在泄露的代码中不作为实际存在的模型出现,而是作为未发布版本的示例,所以可以认为这两个系列的模型的更新需要观察,同时可能需要分析 capybara 模型同现有模型的关系。


    2. 风控与遥测机制
    收集的核心信息为:deviceId(
    设备唯一标识(持久化 UUID)
    )、sessionId(会话标识)、email、organizationUuid、accountUuid、subscriptionType、rateLimitTier、firstTokenTime(首次使用时间戳)、githubActionsMetadata(GitHub Actions 环境元数据),此外还会上报:环境元数据(系统信息: platform ,platform_raw, arch, node_version, terminal, package_managers, runtimes 以及一系列的部署环境标识)、进程指标、使用情况(不做过多展开)。


    3. 仓库指纹(URL Hash)策略
    获取 Git remote URL 后进行标准化,然后 SHA256 哈希取前 16 个字符以 rh 的字段上报,这也是为何我们不建议使用 Claude Code 直接链接仓库进行分析的原因,当然,还有一些潜在的 Prompt 识别策略等共同促使我们发出警告。


    4. 彩蛋:

    🌸 在花频道|茶馆讨论|投稿通道
    👍 104 ❤️ 27 😁 9 👏 1