LongCat是什么?
LongCat-2.0(龙猫2.0)是美团在2026年6月30日发布的万亿参数大模型。它受关注不是因为跑分最高,而是因为做了一件之前没人做成的事——在不依赖任何英伟达GPU的前提下,从零开始训练出一个万亿参数级别的模型,并跑通了从训练到推理的全流程。
核心规格
架构:MoE(混合专家),总参数1.6万亿,每个Token平均激活约480亿参数
上下文窗口:原生支持100万Token,可以一次性处理百万字级的输入
训练规模:在超过5万张国产算力卡上完成预训练,消耗超过35万亿Token的数据
国产算力这条路
LongCat-2.0的真正价值不在参数大小,在于它验证了一件事:国产算力卡能做万亿模型的预训练。
业内普遍判断国产算力卡单卡显存小、通信带宽弱、软件生态不成熟,撑不起这么大模型。LongCat团队从2023年开始做国产算力适配,花了三年时间,从千卡起步逐步扩到5万卡,把算子适配、通信优化、分布式稳定性这些基础问题一件件啃下来。
几个关键指标:自动故障恢复让月均日故障率降了70%以上;训练算力利用率提升了1.5倍,稳态日吞吐突破1万亿Token。国产算力单卡性能虽然仍落后于英伟达顶级产品,但计算正确性和精度已经能满足大模型训练需求,局部指标甚至略优。
模型能干什么
LongCat-2.0预览版曾以匿名身份“Owl Alpha”接入OpenRouter,截至6月底总调用量跻身全球前三,在Claude Code上的月调用量仅次于Claude Opus 4.8。
评测数据上,编程场景SWE-bench Pro得分59.5,超过Gemini 3.1 Pro(54.2)和GPT-5.5(58.6),略低于Claude Opus 4.6(57.3);SWE-bench Multilingual得分77.3,与Claude Opus 4.6(77.8)持平;真实终端指令交互评测Terminal-Bench 2.1得分70.8。
技术社区普遍的看法是:Agent核心能力接近Claude Opus 4.6,落后于最新的Claude Opus 4.8,编程能力略优于智谱GLM-5.1但落后于GLM-5.2,文案和其他能力不算突出。
几个有意思的设计
LongCat-2.0有几个原创做法。零计算专家:模型根据Token复杂度动态分配算力,简单的Token跳过矩阵运算节省资源,复杂的Token自动调用更多专家。LongCat稀疏注意力:把长文本处理的计算量从平方级降到线性级,保证百万级上下文窗口下的响应速度。MoE稀疏度达到97%,团队认为再扩充专家池带来的增益已经很小了。
开源与成本
美团宣布近期会开源Infra框架、推理引擎和模型参数。训练和推理成本低于全球其他万亿参数级别的大模型。模型在OpenRouter上目前免费向开发者开放,Cache命中的Token也不计费,实际消耗速度比同尺寸模型慢不少。
谁适合用
如果你做AI应用开发,可以把它看作一个在Agent和编程任务上能力接近第一梯队、完全免费、且不依赖英伟达硬件的选项。代码迁移、AI Agent搭建、自动化任务执行这些场景内测反馈还不错。文案、创意写作这类能力目前不是它的强项,做内容生成类应用需要先实测判断是否够用。
评论区
我要评论
评论列表