
近日有消息称,月之暗面Kimi完成新一轮融资,金额约20亿美元,投后估值突破200亿美元。这是月之暗面成立以来规模最大的单笔融资。
近段时间以来,多家大模型企业的投融资加速。从DeepSeek、月之暗面到阶跃星辰,均在短短数周内完成了大额融资或传出重磅消息。
大模型赛道融资热度攀升,背后反映了一个现状,即无论是训练下一代万亿参数模型,还是进行大规模商业化推广,都需要巨额资金支持。
近两年来,从最初的“百模大战”,到如今资本热潮,反映出了国内大模型赛道竞争核心的变化。如今,大模型企业不局限于比拼参数,更是比拼商业化、“Agent(智能体)化”。
掀起资本热潮
今年4月,一则震惊投资圈的消息传出:DeepSeek要开启首轮外部融资。目前,DeepSeek尚未官宣融资。但这让投资热潮迅速被点燃,毕竟在很长一段时间里,DeepSeek都是AI大模型赛道中的“拒绝融资派”,这意味着行业发展或将发生变化。
随后,有消息传出月之暗面完成约20亿美元新融资,阶跃星辰即将完成近25亿美元融资。5月7日,无问芯穹宣布再获得超7亿元融资。
而智谱、MiniMax两家大模型企业已在港股上市。截至5月14日收盘,智谱的港股市值4860亿港元,此前智谱市值一度破5000亿港元;MiniMax市值达2302.9亿港元。
有专家表示,当前大模型赛道已进入残酷的淘汰赛阶段。无论是训练下一代万亿参数模型,还是进行大规模商业化推广,都需要巨额资金支持。这一轮融资不仅是资金的注入,更是资源、场景和战略的全面整合。
比拼Agent能力
近年来,国内AI行业从最开始的“百模大战”,到如今资本追捧,这反映出行业不仅是技术比拼,更是商业化、资金、人才各方面的比拼。这场演变的本质,是从“谁能做出大模型”到“谁能用好大模型”的赛道切换。
在这两年时间里,大模型企业在技术上也有了极大的跃升。以DeepSeek为例,今年4月,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。其中,相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。
智谱的GLM-5.1旗舰模型,大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。
月之暗面近期发布并开源Kimi K2.6模型,带来行业领先的代码、长程任务执行和Agent集群能力。其中,Kimi K2.6其长程编码能力也得到显著提升,在测试中可以不间断编码13小时,编写或修改超过4000行代码,完成复杂系统的开发和优化。
MiniMax则对Agent进行了整体升级,升级后的Agent叫做Mavis—MiniMax as a Jarvis。具体更新包括上线Agent Teams,MiniMax Agent桌面端现在支持多个Agent并行工作,用户可以创建不同角色的Agent,让它们组成一个团队协作完成任务,适合那些又长又复杂、一个Agent搞不定的任务。
不难看出,相比两年前,如今Agent成为了关键词,各大模型也得到了全方位的“升级”。业内人士表示,从“百模大战”到如今,大模型的“进化”显著。如果说过去的AI是一个能聊天的工具,现在的模型正在变成能推理、懂多模态、会上手干活的“智能助手”。