Claude Code 的缓存究竟住在哪里

发布时间：2026/7/2 19:08:31

我们在使用 Claude Code 做长会话开发时，经常会看到一个现象，同一个项目里连续追问时，前几轮可能比较慢，等系统提示、项目规则、工具定义、历史消息这些内容稳定下来，后面的响应会明显顺滑。很多人会自然地去本地目录里找缓存，怀疑它是不是藏在~/.claude下面，或者是不是某个会话文件被 Claude Code 反复读取。这个直觉只对了一小半。Claude Code 的本地目录确实会保存会话记录、项目状态和一些运行数据，但这里讨论的 prompt caching 并不住在本地机器上。它发生在服务端，准确地说，发生在最终承载模型推理请求的那套基础设施里。这件事要从 Claude Code 的请求路径说起。Claude Code 每次和模型交互，都不是把某个神秘的本地状态直接交给模型，而是把当前回合所需的上下文重新组织成一次网络请求。这个请求里会包含系统提示、项目上下文、工具定义、历史消息、工具结果以及本轮输入。prompt caching 的价值正在这里，它让服务端识别这些请求开头部分里那些连续重复的内容，并把已经处理过的 prefix 复用起来。Anthropic 的文档把 prompt caching 描述为一种从 prompt 的特定 prefix 恢复处理的机制，用来减少重复任务和稳定 prompt 元素带来的处理时间与成本。缓存放在哪里，不由 Claude Code 这个 CLI 单独决定，而由认证方式和请求最终流向决定。使用 Claude API key、Claude 订阅账号，或者 Claude Platform on AWS 时，请求进入的是 Anthropic 相关基础设施，缓存也随之放在 Anthropic 侧的服务端缓存体系里。这里的关键词不是本地，而是 serving infr

Claude Code 的缓存究竟住在哪里

相关新闻

GPT-4的1.8万亿参数与2%稀疏激活：MoE架构工程真相

Ubuntu 18.04 + Ansible 部署高可用 etcd 集群实战指南

MuleSoft如何实现企业级AI编排：LLM与业务系统的语义融合

网约车司机接单派单功能总结

计算机毕业设计之jsp教师招聘网的设计与实现

可信前端之路-代码保护

内蒙古本地实体企业线上获客指南：GEO + 官网 + 短视频组合打法

短视频穿搭爆款抓取程序，实时提取高播放单品特征，输出品牌提前上新清单。

终极指南：3步永久保存iPhone微信聊天记录到电脑的免费工具

LV3296与PIC18F45K22的UART通信与USB扩展方案

AI初创生存指南：6个月完成可信度验证闭环

多模态+推理链+RAG 2.0+智能体：工业级AI系统落地四支柱