当地时间2月17日晚,特斯拉首席执行官埃隆·马斯克(Elon Musk)发布了新一代人工智能模型Grok 3。
这一款被马斯克称为“好得可怕”的人工智能模型誓言对最前沿的AI研发发起挑战。其团队声称,Grok 3的性能已经优于竞争对手的尖端模型。
创造“最智能”的AI
Grok这个词来自于罗伯特·海因莱因的小说《异乡的陌生人》,由在火星上长大的人物所使用的,表示对某事有完整而深刻的理解,其中,同理心是这种理解的重要组成部分。
Grok 1于2023年初发布,是马斯克旗下初创企业xAI推出的首款人工智能聊天机器人。2023年年中,xAI在Grok 1的基础上推出了Grok 2。这一代模型在多个方面进行了重大改进,然而,在众多优秀大模型层出不穷的2023年,Grok 2的问世并没有掀起太大水花。
去年4月,马斯克就产生了创造“最智能”AI的想法。在他看来,成功创造最好的人工智能的唯一途径就是创建自己的数据中心。
xAI拥有一台用于训练AI的“Colossus超级计算机”,这台计算机在8个月内就搭建完成,搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源——是Grok 2的10倍。
此外,xAI与戴尔达成价值50亿美元的协议,为Grok 3提供人工智能服务器。此次交易旨在满足Grok 3和其他人工智能应用不断增长的计算需求。
Grok 3不是一个模型,更确切地说,它是一个模型系列。Grok 3 mini是Grok 3的缩小版,可以更快地回答问题,但代价是准确性会有所损失。
Grok 3的初步训练大约一个月前完成,此后团队一直致力于将推理能力集成到当前的Grok 3模型中。不过目前,该模型仍处于早期阶段。已经发布的只是Grok 3推理模型的一部分。与此同时,开发人员还在训练迷你版的论证模型。
多项评估高分
产品发布之前,马斯克就在X个人主页上发帖宣布,“Grok 3将成为地球上最聪明的AI”,并承诺,其性能将超越任何目前可用的其他人工智能产品。
Grok 3于线上发布时,有超过10万人观看了这一AI新玩家的上线演示。在Grok 3发布的问答环节中,xAI还回答了观众关于最新AI模型的一些问题,比如问Grok是女孩还是男孩。
“Grok就是你想要他成为的任何人”,马斯克回答道,“人们会爱上Grok,可能性是1000%!”
xAI声称,Grok 3在AIME(评估模型在数学问题样本上的表现)和GPQA(测试博士级物理、生物和化学问题的模型)等测试中优于GPT-4o。xAI还称,Grok 3的早期版本在Chatbot Arena中也获得了高分。
而Grok 3的两个变体,Grok 3 Reasoning和Grok 3 mini Reasoning,可以仔细地“思考”问题,类似于OpenAI的o3-mini和中国公司DeepSeek的R1等“推理”模型。
推理模型在产生结果之前会仔细地进行自我测试,这有助于它们避免模型通常面临的一些陷阱。
xAI声称,Grok 3 Reasoning在多项流行测试中的表现优于o3-mini的最佳版本(o3-mini high),包括新的AIME 2025数学测试。
xAI还现场演示了Grok 3的推理+编程能力,其中一个问题是“生成3D动画代码,演示从地球发射、着陆火星,然后在下一个发射窗口返回地球的过程”。
经过近两分钟的思考,Grok 3生成了可以直接跑起来的python代码,3D动画可以运行,但是否正确还有待验证。
xAI还称,Grok 3最具人文色彩的方面之一就是它的创造力。其开发了一款新游戏的概念,该游戏巧妙地结合了俄罗斯方块和Puyo Puyo的元素,展示了其在科学和技术之外的领域,如娱乐和艺术领域的潜力。根据马斯克的说法,Grok 3正在创造俄罗斯方块和宝石迷阵的混合体。
Grok 3的最后一个新功能是代理/智能体(Agent)。发布会演示的是新产品DeepSearch,基于Grok 3的搜索引擎,它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够反馈正确的信息”。
未来发展计划
目前,X上的Premium Plus订户将是第一批获得Grok 3访问权限的群体。此外,如果想要抢先体验新功能,也可以通过Grok应用程序和grok.com网站单独订阅Super Grok。
Super Grok还可以在新的DeepSearch搜索引擎中解锁额外的注意事项及搜索查询,并添加无限的图像生成功能。
尽管Grok 3被马斯克誉为“地球上最聪明的AI”,但它在早期测试中仍然暴露出一些局限性。
在正式发布之前,几名X平台用户表示自己可以提前体验Grok 3。他们发现,尽管该模型能够正确回答一些困难的谜题,并生成HTML和JavaScript代码,但是它在编写代码时仍然存在一些细节上的疏漏,出现了bug。
几周后,Grok 3模型将与DeepSearch功能一起出现在xAI企业API中。马斯克表示,几个月后,xAI将开源Grok 2。
“我们的总体做法是,当下一个版本完全准备好时,我们将发布开源的最新版本”,马斯克说。
他向用户承诺一周内会推出“更精美的版本”。“我们还在开发语音交互功能,以便进行对话。我今天尝试了一下,效果很好,尽管还需要一些工作。我们的目标是让它可以像人一样交谈。我认为这将是使用Grok 3的最佳体验之一”。
记者:袁源