左手刚刚融资,右手就发大模型,马斯克重金打造的Grok 4,正式面世!
7月10日,特斯拉创始人兼首席执行官马斯克旗下的人工智能公司xAI正式发布了Grok 4。在将近1小时的发布会直播中,xAI发布了这个系列的两款模型,分别是Grok 4(单智能体版本)和Grok 4 Heavy(多智能体版本),其中后者支持4个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大规模的计算资源以完成更复杂、更精密的任务。
作为xAI在2023年推出首代大模型以来的第四次重要更新,Grok 4在“人类的最后考试”(Humanity's Last Exam)取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,被称为“世界上最强AI模型”。
据xAI的研究人员介绍,Humanity's Last Exam测试总共有2500个问题,包括数学、自然科学、工程以及所有人文学科,问题广泛且都是博士甚至高级研究水平,极具挑战性,但Grok 4在这些问题上都可以得到很好的分数。
“在所有学科上,Grok 4比博士还强——没有例外。”马斯克在直播中表示,虽然Grok 4目前还没有发现新科学或新的物理定律,但这只是一个时间问题,他相信Grok 4可以在今年内实现科学新发现。
此外,据发布会披露,在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项测评中,Grok 4都超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。
价格方面,Grok 4目前仅对付费用户开放。输入每100万tokens价格为3美元,输出每100万tokens价格为15美元。值得注意的是,xAI还推出了迄今为止最昂贵的AI订阅计划——每月300美元的Super Grok Heavy,这一价格也超过了OpenAI最贵的200美元Pro会员月费。
业内人士分析称,从Grok 2到Grok 3,再到如今的Grok 4,xAI的训练计算量实现了惊人的百倍增长。发布会披露,Grok 4的训练是在一个拥有超过20万张H100 GPU的超级计算机集群上完成的,是Grok 3时期的两倍。更重要的是,xAI改变了训练策略,将更多的算力投入到“推理能力”的专项训练上。相比于Grok 2,Grok 4的训练量提升了整整100倍。
因此,Grok 4所取得的优异性能,离不开马斯克“烧钱”打造的超级计算机集群的算力支撑。2024年6月,xAI宣布在美国田纳西州孟菲斯建造超级计算机以训练其人工智能大模型Grok。该系统初期配备20万个英伟达GPU,马斯克还计划将GPU规模最终扩大到100万个。这一项目已投入数亿美元,未来仍需持续投入大量资金。
值得注意的是,一周以前,xAI刚刚完成了100亿美元的融资,其中包括50亿美元债务融资和50亿美元股权融资。在本轮融资中,摩根士丹利担任了50亿美元债务融资的顾问,并表示其债务融资获得超额认购,吸引了全球债务投资者参与。摩根士丹利强调,xAI还另外获得了50亿美元战略股权融资,“债务与股权组合有效降低综合资本成本,大幅拓展xAI的可融资渠道”。
高昂的算力支出让xAI承受着巨大的成本压力。据外媒援引消息人士报道,xAI目前每月“烧钱”高达10亿美元,其在构建先进大模型方面的成本远远超过收入增长。对于这一报道,马斯克曾公开表示,这类巨额亏损在整个人工智能行业并不罕见,主要源自高昂的服务器建设和芯片采购成本。
在AI大模型的竞赛中,融资与技术研发犹如车之两翼,只有充足的资金储备才能支撑高成本的技术研发,只有技术持续取得突破才能支撑进一步的融资。在Grok 4发布不久前,OpenAI也透露了可能在今年夏天发布GPT-5。不可否认,Grok 4是xAI发展过程中的又一个里程碑,但追逐AGI的道路依然漫长。在马斯克庆祝Grok 4取得的卓越成绩时,下一个“最强AI模型”或许已经在路上。
校对:王朝全