一则消息突然引爆。
今日,小米系集体爆发,小米集团一度大涨超5%,金山云一度大涨超18%。消息面上,小米大模型微信公众号称,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。
当前,AI大模型竞争再度进入白热化。4月29日,阿里巴巴通义千问发布了新版Qwen3系列模型。同一天,世界首富马斯克也宣布,下周Grok 3.5早期测试版将向SuperGrok订阅者发布。
券商机构分析认为,国内外大模型能力差距缩小,国产算力芯片持续进化,国内头部互联网厂商加大Capex投入,为国内AI突围之路奠定了基石。伴随国内外巨头大模型持续迭代,C端或有望迎来杀手级应用。
全线大涨
4月30日,小米系全线拉升,小米集团盘中一度大涨超5%,金山云一度大涨超18%,金山软件最高涨超6%。
与此同时,港股云计算板块持续拉升,截至午间收盘,金蝶国际涨4.7%,中国软件国际涨2.72%,阿里巴巴-W涨1.48%
据“小米大模型”公众号消息,今日,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。
据介绍,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo以7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
官方称,在相同RL训练数据情况下,MiMo-7B的数学&代码领域的强化学习潜力显著领先。iMo-7B全系列模型均已开源。
小米技术团队表示,MiMo的核心突破在于预训练与后训练阶段的协同优化。在预训练阶段,模型通过挖掘高质量推理语料并合成约2000亿tokens专项数据,采用三阶段渐进训练策略,累计训练量达25万亿tokens。
后训练阶段则引入创新强化学习技术,包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略,有效提升模型在复杂任务中的稳定性。技术团队还开发了“Seamless Rollout”系统,使训练效率提升2.29倍,验证速度加快1.96倍。
值得注意的是,小米官方表示,MiMo-7B在相同强化学习训练数据下,数学与代码领域的表现显著优于当前业界广泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。
目前,小米已在HuggingFace平台开源MiMo-7B全系列4个模型,并发布详细技术报告。
值得一提的是,就在小米宣布“Xiaomi Mimo”开源前,阿里巴巴通义千问于4月29日凌晨发布了新版Qwen3系列模型,包括2个MoE模型和6个dense模型。
通义千问表示,作为Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Qwen 3模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。
Qwen 3融合了推理与非推理能力,在逻辑分析和创意生成等任务中表现卓越。预训练数据量达到约36万亿 tokens,并通过多轮大规模强化学习与精细优化,在推理、工具调用、指令遵循及多语言能力等方面显著提升。
“AI大模型大战”再起
值得注意的是,AI大模型竞争再度进入白热化。
4月29日,马斯克在社交平台上宣布,下周,Grok 3.5早期测试版将向SuperGrok订阅者发布,它是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。马斯克称,Grok是从第一原理推理并得出互联网上根本不存在的答案。
2025年以来,全球AI大模型的竞争愈发激烈,据不完全统计,在过去119天内,中美十家主要大模型公司就发布或更新了14款基础大模型。
国际市场调研机构Artificial Analysis发布的报告显示,美国大模型虽然目前还领先,但中国的差距在不断缩小。
西部证券指出,AI大模型能力提升和使用成本下降是主旋律,多模态或逐步成为未来基础模型的标配,进一步拉动算力需求。国内外大模型能力差距缩小,国产算力芯片持续进化,国内头部互联网厂商加大Capex投入,为国内AI突围之路奠定了基石。
开源证券认为,AI Agent为以大语言模型(LLM)为驱动,具有自主理解、感知、规划、记忆和使用工具的能力,能自动执行复杂任务的系统。不同于传统人工智能,AI Agent具备通过独立思考、调用工具逐步完成给定目标的能力。看好AI Agent应用将在2025年多点开花,其中AI Agent有望在B端率先商业化,电商、营销、CRM、金融、法律等场景加速落地。伴随国内外巨头大模型持续迭代,C端或有望迎来杀手级应用。
天风证券表示,通义千问体系在模型能力、硬件能力及生态建设上保持领先,已实现全模态覆盖,成为全球最大模型开源生态。其自主算力体系较强,覆盖通用计算与智算需求,在自主可控行业具有优势。AI Agent市场规模有望超万亿,通义千问凭借在B端资源禀赋及深厚技术积淀,已发布多行业垂直生态体系,有望成为B端Agent链主,相关生态体系公司或将受益。
排版:王璐璐
校对:陶谦