
6月30日美团正式发布了新一代基础大模型 LongCat-2.0并宣布将对外开源。作为业界首个全程在五万卡国产算力集群上完成预训练到推理全流程的万亿参数模型LongCat-2.0 的问世不仅标志着“国模国芯”全流程闭环的实质性突破更为全球开发者在 Agentic Coding智能体编程领域提供了全新的基础设施。国模国芯全栈协同验证国产算力极限LongCat-2.0 最大的硬核亮点在于其训练底座的“全国产化”。该模型总参数量高达 1.6T预训练数据规模超过 30T tokens。面对万卡级训练中的硬件故障、通信异常等挑战美团团队自2023年起与国产算力厂商协同攻坚通过自研确定性算子、弹性扩缩卡和自动故障恢复等机制将月均日故障率降低70%以上训练 MFU模型算力利用率提升1.5倍最终实现了稳态日吞吐超 1T tokens 的卓越表现。这证明了国产算力不仅能“训出”万亿模型还能保障其在真实任务中的稳定运行。架构创新让算力用在“刀刃”上在模型架构设计上LongCat-2.0 采用 MoE混合专家架构并围绕真实 Agentic Coding 任务进行了多项原创设计零计算专家Zero-Computation Expert业界首创的 Token 级动态激活机制。在处理代码任务时简单的 Token如标点、常见助词直接路由至零计算专家不占用算力而复杂推理 Token 则自动激活更多专家。这使得模型在 33B~56B 的动态激活范围内大幅降低了推理成本。LSA 稀疏注意力机制原生支持 1M百万级超长上下文。通过智能筛选关键信息将长文本计算量从平方级降至线性级使得 Agent 能够一次性“看见”并精准定位整个中型微服务项目。MOPD 多专家融合架构融合了 Agent Experts专攻工具调用与自主纠错、Reasoning Experts深耕数学与 STEM 推理和 Interaction Experts优化指令遵循由门控网络根据任务类型动态调度全面提升综合表现。性能领跑登顶全球开发者调用榜单在正式开源前LongCat-2.0 的预览版已通过 OpenRouter 平台面向全球开放。凭借在代码生成与自动化编程上的强劲实力该模型迅速跻身全球大模型调用量前三。在 Hermes、Claude Code 等主流 Agent 框架中其月调用量分列全球第一和第二成为最受全球 Agent 开发者欢迎的模型之一。在权威评测中LongCat-2.0 同样表现优异。在考察深层工程能力的 SWE-bench Pro 中获得 59.5 分超越了 Gemini 3.1 Pro、GPT-5.5 和 Claude Opus 4.6在真实终端指令交互评测 Terminal-Bench 2.1 中取得 70.8 分展现了在真实运维与开发环境中的稳定执行力。全面开源赋能全球开发者生态为了回馈全球开发者社区美团官方宣布将于近期在多平台同步开源 LongCat-2.0 的 Infra 框架、推理引擎以及模型参数等核心技术。这一举措将极大降低企业级 AI Agent 的落地门槛加速 Agentic Coding 在复杂办公场景与软件工程中的闭环应用。