3月31日,智谱(HK:02513)发布上市后首份年报。2025年,公司实现总收入7.24亿人民币,同比增长131.9%,居国内大模型厂商收入规模首位;综合毛利率41%,显著高于行业平均水平。报告期内,MaaS API平台度经常性收入(ARR)升至17亿元,同比增长60倍;平台毛利率同比提升近5倍至18.9%,盈利能力大幅改善。
智谱MaaS商业化爆发的背后,是公司对“智能上界”的极致追求。2025年,GLM-4.5至GLM-5-Turbo的高频发布,持续蝉联全球开源模型第一、中国模型第一。2026年一季度,智谱API涨价83%后,调用量不降反升,市场依然供不应求。智谱首次提出Token架构能力(Token Architecture Capability,TAC),将其定义为“智能调用量×智能质量×经济转化效率”的乘积。随着企业TAC需求的持续增长,智谱MaaS平台正在成为连接基座模型与产业应用的基础设施。2026年公司将进一步探索智能上界的突破,引领范式创新以及作为底座持续输出高质量Token。
商业化场景爆发,Maas API业务ARR约17亿元
全球顶尖AI公司Anthropic的指数级增长,印证了API商业模式的巨大潜力。智谱的商业化路径与Anthropic高度一致,即以模型智能为核心壁垒,以API为主要产品形态。2025年,智谱凭借GLM系列在“智能上界”侧的代际领先与推理侧的极致成本优化,实现了从开发者生态到全球化的全面爆发。智谱MaaS平台ARR约17亿元,在过去一年提升60倍。同时实现业务盈利水平的大幅改善,API业务毛利率提升近5倍至18.9%。
智谱旗舰基座模型GLM-5发布后24小时内,即获得字节跳动TRAE、阿里巴巴Qoder、腾讯CodeBuddy、美团CatPaw、快手万擎、百度智能云及WPS Office等头部平台产品的官方接入。目前,中国前十大互联网公司中,有9家深度调用GLM模型。截至2026年3月,智谱的平台注册企业及用户突破400万,服务全球超过218个国家及地区。
此外,2025年智谱率先在国内推出GLM Coding Plan(编程套餐),凭借模型的高质量编码能力,全球付费开发者数量快速突破24.2万,Token调用量6个月涨了15倍。2026年2月,即使上调价格30%并取消首购优惠,编程套餐依然保持供不应求的态势,成为全球增长速度最快的AI编程服务之一。
作为国内在Agent领域布局最早的模型厂商,从全球首个手机Agent AutoGLM到国内首个一键安装的AutoClaw,智谱正在定义Agentic AI的智能范式。2026年3月,继Coding Plan之后智谱推出Claw Plan,上线仅两天订阅用户即破10万,上线20天订阅用户突破40万,验证了智能体长链路任务的巨大商业空间。
在全球化维度上,智谱实现了Token在全球范围内的价值变现,屡次模型发布在国际市场广受关注,目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock、Fireworks、Cerebras等全球顶尖云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台,位列OpenRouter付费模型排名第一。GLM已成为国际知名Coding平台(如Windsurf)、知名CodingAgent平台(如OpenCode)的默认模型。当前,智谱已成为国内付费Token消耗量最高的厂商之一。
跻身国际第一梯队,一季度“量价齐升”
智谱MaaS商业化爆发的背后,是智谱对“智能上界”这一AGI时代第一性的极致追求。2025年,智谱完成从氛围编程(Vibe Coding)到智能体工程(Agentic Engineering)的行业范式跨越。GLM-4.5、4.6、4.7到GLM-5、5-Turbo的高频发布,持续蝉联全球开源模型第一、中国模型第一,在全球模型中仅次于GPT、Claude和Gemini,稳居第一梯队。此外,GLM-5在Artificial Analysis Intelligence Index榜单达到50分,这是开放权重模型首次达到这一高分。
此外,智谱独创的Slime框架实现异步强化学习效率革命,配合自研算法让模型从超1万个真实软件工程环境高效学习,支撑起全球首款OpenClaw基座模型GLM-5-Turbo的诞生。同时,GLM-5完成国产芯片软硬协同设计,通过创新量化策略将显存占用压缩至极限,单台国产服务器即可稳定部署,成本降低50%,在国产芯片上实现比肩国际顶级芯片的推理效率,构建起“智能上界+自主计算底座”的技术闭环。
凭借超强模型效果,智谱在2026年一季度API涨价83%后,调用量不降反升,市场依然供不应求。这一“量价齐升”的罕见态势,显示出客户为更确定的生产力付费的高度意愿。
TAC重塑AI价值,聚焦高质量Token输出
展望2026,智能范式将从轻量化的 Vibe Coding(氛围编程)向工业级的 Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与 Token 调用的指数级增长。
当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为TAC(Token Architecture Capacity,Token 架构能力)。TAC=智能调用量×智能质量×经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为Token架构师,在给定预算下构建复杂Agent系统并驱动大模型完成复杂Agent系统的自主运行。智谱的目标是成为提升全社会TAC的基础设施,让每一滴Token都能转化为可交付的经济增量。
摩根大通指出,中国AI需求加速扩张,模型能力成为核心竞争要素。凭借上市首份财报的亮眼表现,智谱展示出强劲的技术实力与商业化落地能力,以及面向AGI的长期增长价值。(文夕)