LongCat-2.0(龙猫2.0) - 美团万亿参数AI大模型，新用户可获得1000万免费Token

LongCat-2.0(龙猫2.0)是美团在2026年6月30日发布的万亿参数大模型。它受关注不是因为跑分最高，而是因为做了一件之前没人做成的事——在不依赖任何英伟达GPU的前提下，从零开始训练出一个万亿参数级别的模型，并跑通了从训练到推理的全流程。

核心规格

架构：MoE(混合专家)，总参数1.6万亿，每个Token平均激活约480亿参数

上下文窗口：原生支持100万Token，可以一次性处理百万字级的输入

训练规模：在超过5万张国产算力卡上完成预训练，消耗超过35万亿Token的数据

国产算力这条路

LongCat-2.0的真正价值不在参数大小，在于它验证了一件事：国产算力卡能做万亿模型的预训练。

业内普遍判断国产算力卡单卡显存小、通信带宽弱、软件生态不成熟，撑不起这么大模型。LongCat团队从2023年开始做国产算力适配，花了三年时间，从千卡起步逐步扩到5万卡，把算子适配、通信优化、分布式稳定性这些基础问题一件件啃下来。

几个关键指标：自动故障恢复让月均日故障率降了70%以上;训练算力利用率提升了1.5倍，稳态日吞吐突破1万亿Token。国产算力单卡性能虽然仍落后于英伟达顶级产品，但计算正确性和精度已经能满足大模型训练需求，局部指标甚至略优。

模型能干什么

LongCat-2.0预览版曾以匿名身份“Owl Alpha”接入OpenRouter，截至6月底总调用量跻身全球前三，在Claude Code上的月调用量仅次于Claude Opus 4.8。

评测数据上，编程场景SWE-bench Pro得分59.5，超过Gemini 3.1 Pro(54.2)和GPT-5.5(58.6)，略低于Claude Opus 4.6(57.3);SWE-bench Multilingual得分77.3，与Claude Opus 4.6(77.8)持平;真实终端指令交互评测Terminal-Bench 2.1得分70.8。

技术社区普遍的看法是：Agent核心能力接近Claude Opus 4.6，落后于最新的Claude Opus 4.8，编程能力略优于智谱GLM-5.1但落后于GLM-5.2，文案和其他能力不算突出。

几个有意思的设计

LongCat-2.0有几个原创做法。零计算专家：模型根据Token复杂度动态分配算力，简单的Token跳过矩阵运算节省资源，复杂的Token自动调用更多专家。LongCat稀疏注意力：把长文本处理的计算量从平方级降到线性级，保证百万级上下文窗口下的响应速度。MoE稀疏度达到97%，团队认为再扩充专家池带来的增益已经很小了。

开源与成本

美团宣布近期会开源Infra框架、推理引擎和模型参数。训练和推理成本低于全球其他万亿参数级别的大模型。模型在OpenRouter上目前免费向开发者开放，Cache命中的Token也不计费，实际消耗速度比同尺寸模型慢不少。

谁适合用

如果你做AI应用开发，可以把它看作一个在Agent和编程任务上能力接近第一梯队、完全免费、且不依赖英伟达硬件的选项。代码迁移、AI Agent搭建、自动化任务执行这些场景内测反馈还不错。文案、创意写作这类能力目前不是它的强项，做内容生成类应用需要先实测判断是否够用。

LongCat

LongCat是什么?