随着国内开源大模型能力的快速跃升,业界普遍将2026年定义为AI应用商业化大年。而中国市场恰恰因为具备成熟的硬件供应链和研发人才储备,正密集开启新硬件形态探索。
这场变革不仅意味着更快的产品迭代与更激烈的市场竞争,更深层次上,它呼唤从底层技术到产品化思维、直至完整生态体系的系统性构建。
开源大模型是其中一个关键要素。近日,阿里云发布多模态交互开发套件,集成千问、万相、百聆三款通义基础大模型,预置十多款生活休闲、工作效率领域的Agent和MCP工具,可适配AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备。
阿里云通义大模型业务总经理徐栋接受21世纪经济报道等记者采访时指出,大模型时代的商业模式,除了在线Chatbot、Agent之外,硬件可能是其中快速能形成商业闭环的场景,在过去一年,已经有很多新硬件生长起来。
“我们很看好2026年能看到很多新的智能硬件品类。”他续称,这些品类有可能成为新的入口,不仅是手机、汽车、眼镜。因为相比之下,手机更多是接收人的单向输入,但更多关乎“记忆”的事可以交给其他硬件完成。
这就不难理解近期多家互联网大厂陆续下场投身智能硬件的动作:在大模型时代,一场关于大模型底座到软硬件生态聚合能力的战役正在悄然打响。
2025年国内开源大模型能力突飞猛进,为诸多新硬件的诞生奠定了坚实基础。“百镜大战”、AI手机助手竞速都只是其中冰山一角,围绕更丰富硬件形态的探索已经在加速开启。
创业公司方面,已经有让人惊艳的智能录音设备、各类型AI萌宠进入市场,互联网大厂也在积极下场探索硬件,除了巨头们争相看好的智能眼镜赛道之外,近日飞书还与安克创新联合推出一款新形态录音设备,显示出跨界融合趋势。
Omdia智联互通资深分析师巨其然对21世纪经济报道记者分析道,软件与硬件厂商之间的界限确实在逐渐模糊,其根本驱动力在于以LLM(大语言模型)为代表的AI软件厂商亟需新的应用载体。这已不再局限于传统的应用界面层面,而是让硬件成为AI入口的承载平台,能够为AI提供更丰富、更直接的数据采集。
“基于LLM赋能的具备AI Agent功能的智能终端,有望成为未来竞争的核心载体。长期来看,这一趋势或将重塑传统消费电子产业的商业模式:从依赖一次性销售和售后维修的硬件盈利模式,转向以软件服务订阅和生态服务为主导的长期付费模式。”巨其然续称。
受访时,徐栋则分析道,将大模型技术与硬件相结合,有望催生新的体验,进而在此前饱和的互联网流量市场外,拓宽流量边界。此外,大模型与新形态硬件的结合,有望为传统硬件交互方式添加新入口(例如智能眼镜之于汽车),完善生态内的用户体验闭环。
然而,当前AI硬件普及仍面临门槛。徐栋指出,成本偏高与用户隐私顾虑是主要制约。此外,垂直场景的模型实用性尚未完全释放,其开发范式有待转变,如今两三人甚至单人团队也能实现高效创新;模型能力方面,伴随模型泛化与工具调用能力持续提升,硬件创新有望迎来新一波爆发。
不仅是小型移动终端,在大终端方面,“物理AI”在今年也是备受诸多芯片大厂关注的落地方向之一,其中关键市场就涵盖具身智能和智能驾驶。
徐栋对21世纪经济报道记者分析,具身智能还处在发展早期,被分为拟人化、工业机械臂、家庭服务等路线。“除了工业机器人之外,销售规模化还比较有限。”他续称。
但也正因该产业尚且处在发展早期,目前关于具身智能的大模型技术路线,还存在VLA(Vision-Language-Action视觉语言动作模型)还是世界模型的路线分歧。
据称,阿里云在该领域与硬件厂商从两个方向推进合作。
相对成熟的是多模态交互,例如旗下Qwen3-Omni原生全模态大模型受到多家头部具身智能公司关注,希望借此完善交互能力,甚至借助其多语言、拟人性、低延时等能力赋能产品出海。

在技术路线方面,徐栋对记者透露,阿里云关于VLA模型后续会发布相关研究,涉及不同尺寸模型。“我们认为这种模型与自动驾驶会有关联。但适用于自动驾驶场景的VLA与具身智能在下达任务方面不太相同,但理念层面接近。这条路线我认为还在相对早期。”
他进一步指出,因为VLA模型在数据、架构、任务泛化性等方面与文本模型完全不同,其天然需要技术进行假设、构建实验环境,需要足够多的实验才能推进,否则会过拟合。“预计在2026年下半年,会看到一些有意思的架构,但具备泛化能力的VLA还需要一些时间。”
对于物理AI的远景,徐栋强调,阿里云正从“云上IT”转向深入客户业务场景。尤其在工业制造等领域,大模型将带来更强泛化性与任务延展性,其潜在影响可能远超当前预期。
在大模型时代,原有的软硬件生态体系和运行逻辑也正发生深刻变化。这不仅牵涉产业链的协同模式,更关乎商业闭环的落地实践。
这也是云服务厂商正在牵头构建生态的核心逻辑。
徐栋举例道,在深圳硬件产业链方面,通信方面有蓝牙、蜂窝相关公司,也有提供低算力的芯片或模组厂商,部分厂商已在试图自己构建小模型,但也面临时延、安全、效果等挑战。考虑至此,阿里云不如参与进来,通过提供一站式开发套件,协同方案方案商、模组厂商、芯片企业者,将技术能力逐层传递至下游硬件厂商,补全产业闭环。
根据介绍,阿里云发布的多模态交互开发套件,自动集成丰富模板,支持“拖拉拽”式开发,可快速实现玩具、闹钟、眼镜等硬件的AI功能开发;在计费模式方面,将原本按Token计量改为按硬件终端收费的类似License模式,让硬件厂商的成本核算更可控;同时保障基线体验,简化模型调用复杂度,提供工程最佳实践,同时具备可扩展性;在此基础上,再整合阿里整体生态中的能力。

在徐栋看来,大模型的开源赋能,并未削弱硬件厂商的差异化竞争力,反而催生出新的竞争维度。
以录音设备为例,考虑到不同硬件产品的麦克风、扬声器位置不同,在差异化环境中,对语音识别系统等能力有个性化要求,由此,部分硬件厂商会考虑自研相关模型能力进行尝试,同时在硬件层面进行定制化探索,以此优化体验;同时,厂商还会开发专属小工具,精准降低用户使用成本,而通用模型短期内难以替代这类场景化工具。
此外,先发优势成为硬件厂商构建壁垒重要因素之一,多聚焦碎片化刚需场景的硬件,初期可能未受广泛关注,但凭借对特定人群需求的捕捉,能快速积累核心用户,形成用户习惯与品类定义权。
2026年作为AI应用商业化的关键之年,智能硬件产业正迎来“硬件创新+生态重构”的双重变革。一方面,一众创业公司在积极挖掘细分场景的细分场景AI硬件变革机会,另一方面,云厂商也在试图以更丰富的角色,介入硬件、软件和生态等多个层面,挖掘新的入口和流量机会。一场新变局正在酝酿。