中国大模型这一年:“大浪淘沙”后“由有到专”
来源:证券时报网作者:创业资本汇 周春媚2024-12-27 10:17

即将过去的2024年,中国大模型经历了什么?获得了什么?又将面临什么挑战?

最近,随着OpenAI长达12天的“马拉松式”新品发布会告一段落,这家全球瞩目的大模型明星独角兽企图霸占全球科技媒体的头条,但除了Sora等个别关注度高的新品外,实际并未掀起太大的涟漪。与两年前发布堪称AI领域“原子弹”的ChatGPT-3.5相比,大模型过去一年的“进化”恰如这场漫长的发布会,小步快跑、持续迭代,却难以再现令人眼前一亮的巨大飞跃。

将目光收回国内,中国大模型在经历去年白热化的“百模大战”后,今年又迎来了“大浪淘沙”,竞争格局趋于稳定,呈现互联网大厂与初创公司“共舞”的局面。随着大模型技术演进曲线趋于平缓,怎样落地成为被摆在台面、亟待解决的问题,不同行业玩家开始调整各自的业务重点与前进方向,这或将在2025年迎来更为激烈的“生死战”。

技术演进曲线走向平缓,行业竞争格局走向收敛

“OpenAI年末的线上发布会,从侧面说明了基础模型的能力可能已到达了一个临界点,技术进步的曲线已从陡峭走向平缓。”一名人工智能行业资深从业人士在接受证券时报记者采访时表示。

在大模型领域,Scaling Law(规模定律)被普遍推崇。所谓Scaling Law,指的是随着参数规模、训练数据集及计算资源越多,大模型的性能将越好。然而,业内开始形成的一个共识是,大模型规模已到达一定程度,加上高质量训练数据逐渐枯竭,大模型能力的进化速度与去年相比有所放缓,能力并没有十分明显的提升。

不过,虽然指数级的能力增长未在今年复现,但国产大模型在技术层面始终在进步。对国内大模型行业来说,技术迭代速度放缓是件好事,领跑的人速度变慢,追赶者就获得了更多的时间窗口。今年6月,在全球权威测评中,阿里通义千问Qwen2-72B超越美国最强开源模型Llama3-70B,问鼎全球性能最强的开源模型;12月,字节跳动火山引擎对豆包大模型家族进行全面升级,其中通用模型Pro已全面对齐OpenAI最新的GPT-4o模型。

“经过两年的发展,中国大模型在技术上取得了长足的进步。各大厂商和研究机构纷纷推出新一代大模型,不仅在参数规模上有所提升,更在算法优化、性能提升等方面取得了显著成果。”北京社科院研究员王鹏向证券时报记者表示。

在2023年初野蛮生长期的“百模大战”之后,行业在2024年经历了一场大浪淘沙,行业竞争格局从分散走向“收敛”。咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、云计算巨头及人工智能创业公司主导。

一方面,中国大模型创业公司在2024年形成了相对稳定的“六小虎”格局,智谱AI、月之暗面、MiniMax、百川智能、零一万物和阶跃星辰在投资机构一轮又一轮的资金加持下,迅速成长为AI独角兽。其中,智谱AI、月之暗面、百川智能均已跻身估值“200亿俱乐部”,这一速度是上个时代“AI四小龙”们所望尘莫及的,显示了大模型时代技术演进与融资历程的加快。

另一方面,中国的传统互联网巨头们也在表演“大象起舞”。百度是最早布局大模型的大厂,今年11月举行的百度世界2024大会上,百度首席技术官王海峰透露大模型产品文心一言的用户规模已达到4.3亿。动作稍慢的腾讯和字节跳动今年也在全力加大对大模型的投入,腾讯在今年5月推出了基于混元大模型的AI助手APP腾讯元宝,字节跳动也凭借着流量投放的优势让旗下的AI大模型应用“豆包”活跃用户数在短时间超越一众竞争对手。

“这反映了当前中国大模型市场的多元化和竞争性。”针对传统巨头与初创公司“共舞”的现象,王鹏向记者表示,创业公司的优势则在于创新能力强、反应速度快、市场敏感度高等,能够更快地捕捉市场机会和技术趋势,推出更具创新性和差异化的产品和服务。而互联网大厂资金雄厚、技术积累丰富、用户基础广泛,同时还能够通过自身的生态系统和资源整合能力,为大模型的发展提供更加广阔的空间和机会。“二者各有优劣,谁能脱颖而出还需要看各自的技术实力、市场策略和执行能力。”王鹏说。

产业链上下游处境分化,模型厂商发展路径分野

据咨询机构赛智时代研究报告,大模型产业链主要包括上游基础层、中游模型层和下游应用层。其中,基础层主要包括算力和数据,模型层主要包括通用大模型和行业大模型,应用层主要包括生活消费应用、产业经济应用和公共服务应用等。

值得注意的是,2024年,一级市场的大模型产品也频频引爆二级市场,相继诞生了Kimi概念股、智谱AI概念股和豆包概念股,开了A股市场以创业公司设立概念板块的先河。“这反映了市场对于人工智能长期发展潜力的认可以及对未来盈利模式的乐观预期。”天使投资人、资深人工智能专家郭涛在接受证券时报记者采访时表示。在这些概念板块中,不仅包括为产品提供算力支持及数据服务的厂商,也包括在主要产品中接入该大模型以实现产品升级的各行业公司。

与全球芯片巨头英伟达在AI大模型的风口下营收与股价齐飞一样,随着国产大模型的加快发展,各大厂商在AI算力扩展、AI芯片采购以及数据中心升级领域的资本开支持续增加,产业链上游尤其是算力基础设施率先受益。Wind数据显示,年初以来,算力概念指数累计涨幅达47.66%,服务器概念指数累计涨幅达84.03%。“资本市场的表现往往基于对公司基本面和行业趋势的综合判断。”郭涛认为,相关概念板块的优异表现,表明投资者普遍认为随着大模型技术的不断进步和应用场景的丰富,对高性能计算能力和专业基础设施的需求将持续增长,从而带动相关产业链上下游企业的业绩增长。

与产业链上下游相比,处于中游的模型厂商却普遍面临盈利困境。一方面,从云服务商手中购买算力开支巨大;另一方面,产品商业化目前仍处于探索阶段,远未能形成稳定和足够覆盖成本的收入。同时,以字节火山引擎、阿里云、百度云为代表的云厂商在2024年掀起了大模型价格战,降价幅度普遍达到90%以上,有的甚至直接免费。云厂商的目的是通过降价,以大模型来获取云客户,但价格战让一些资金实力本就不足的厂商“雪上加霜”。

在激烈的市场竞争中,尤其是在互联网大厂直接下场“搏斗”的2024年,AI大模型创业公司告别同质化竞争,发展路径开始分野。例如,很早就开始探索商业化的智谱AI主要发力B端市场,而主打大模型应用的月之暗面则以C端市场见长,MiniMax发力多模态与海外市场,百川智能目前的精力主要聚焦在医疗模型和产品领域。

政策密集催化前景可期,行业从淘汰赛走向生死战

今年3月,开展“人工智能+”行动首次被写入2024年《政府工作报告》,人工智能被赋予了实现技术变革、推动产业深度转型升级的重要意义,也成为当前加快培育新质生产力的重要抓手。

今年以来,各地人工智能产业相关政策密集出台。例如12月18日,深圳印发《深圳市打造人工智能先锋城市的若干措施》,其中提出每年发放最高5亿元“训力券”、5000万元“语料券”、1亿元“模型券”等真金白银的措施,以超常规力度促进人工智能产业的快速发展。除此以外,北京、上海、成都等城市也不断加大产业支持力度,彼此间你追我赶。

“大模型厂商的角逐,已经不仅仅是投资机构之间的竞争,而是已经上升到各个城市产业布局、发展规划的层面。”一名资深的创投行业从业者向证券时报记者表示,投资人在与一些一线城市政府官员交流时,往往惊诧于他们对行业的了解之多、认识之深,而且全国多地都已设立人工智能产业投资基金,AI独角兽背后往往也站着国资背景的股东。

“当前,人工智能政策环境趋于友好,政府加大支持力度,促进了产学研用协同创新,为大模型的发展提供了良好的生态土壤。”郭涛表示,政策的持续催化,为AI大模型的发展前景增添了较强的确定性。展望2025年,相关领域的投入依然有望持续增加,带动国产大模型在技术创新上的继续深化和应用场景的进一步拓展。

如果说2023年的“百模大战”是“从无到有”,那么2024年国产大模型所经历的“大浪淘沙”则是“由有到专”,而进入2025年,行业或将从“淘汰赛”进入到更激烈与残酷的“生死战”。中国科学院院士、清华大学计算机系教授张钹曾公开表示,即使大模型落地之后,也只有少数企业能活下来,因为暂时还没有那么大的市场,而且中国在AI投入的资本并没有那么大,还极度分散。“必须集中资源,因为我们的资源本来就少。”张钹说。

虽然人工智能代表着未来已经成为行业共识,但是谁能够引领这个未来却依旧悬而未决。以大模型“六小虎”为例,虽然它们取得了亮眼的成绩,但同时也面临着巨额资金的持续投入、技术商业化落地等挑战。同时,在经历了2024年火箭般的融资速度后,它们的估值已经达到了较高的水平,明年的融资可能会面临一定的调整压力。“一方面,高估值可能导致部分投资者持谨慎态度;另一方面,创业公司需证明其商业模式的可持续性和盈利能力以吸引后续投资。预计下一阶段融资将更加注重公司的核心竞争力和市场表现,而非单纯依赖概念炒作。”郭涛表示。

校对:王朝全

责任编辑: 冉超
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换