AI智能体,代替人类操作手机、电脑和汽车,以及一切可能的设备。
11月29日,国产大模型“六小虎”之一的智谱AI举办Agent开放日活动,展示其在AI智能体方面最新的技术成果。在活动现场,智谱AI首席执行官张鹏发布了新升级的AutoGLM以及GLM-PC,并邀请了荣耀、华硕、小鹏这三家代表手机、电脑、汽车的客户,分享如何通过接入智谱GLM大模型,让设备变得更加智能。
Wind显示,截至收盘,智谱AI指数上涨2.55%,概念股普遍上涨。其中,金现代盘中涨超10%,海天瑞声涨近6%,凌云光涨超5%,值得买涨超4%,中科金财涨超3%。
AutoGLM新升级:可自主执行超50步操作
“绝大部分人已经意识到,大模型不是简单的聊天机器人,所以我们期待它能够超出语言交互,做更多事情。”开放日活动上,张鹏表示。
事实上,在一个月前的10月25日,智谱AI就发布了AI手机端的AutoGLM,迅速引起广泛关注,并与此前的月之暗面一样搅动二级市场,产生了“智谱AI概念股”。自10月28日起,智谱AI概念股逆势走强,当天创业黑马、首都在线、豆神教育、传智教育、正和生态等相关概念股涨停。
AutoGLM是其大模型GLM第一个产品化的智能体,只需接收简单的文字或者语音指令,就可以模拟人类操作手机。从其发布的视频来看,用户向手机语音传递命令后,AutoGLM会经过用户授权,自动打开目标APP,执行相关命令,可以实现的功能包括在淘宝上购买一款历史订单产品、在携程上预订酒店、在美团上点外卖、在微信群里领取老板发的红包等功能,开启了人机交互的新范式。
在淘宝上购买一款历史订单产品
在微信群里领取老板发的红包
新升级的AutoGLM较一个月前实现了一系列进步:一是在手机上具备了更多的能力,可以挑战更高难度的操作、支持更长的流程,甚至毫无打断地执行超过50步的操作;二是可以实现跨APP操作,比如可以在刷社交媒体的同时唤起购物APP;具备短口令能力,例如用户只需要说一句“点咖啡”,智能体就能自动采取对应行动,减少超长复杂指令。
在今天的开放日活动现场,张鹏进行了现场演示。他向手机发出了“帮我创建一个面对面的群聊,数字是1129”的指令,屏幕上的手机界面显示,AutoGLM自动唤起微信、输入数字、直接进群。除此以外,他还发出了“帮我在智谱开放日的群聊里发一个2万元的红包,数量为100个,名字为‘AI给你发的第一个红包’”的指令,该发红包的指令也得到顺利执行。
不过,AutoGLM并非没有“翻车时刻”。例如,现场在执行面对面群聊任务时,由于现场进入群聊的人员太多,超过了人数限制,而AutoGLM由于速度不够快,导致无法进群,最终只能由工作人员将其手动拉入群聊,这是智谱AI此前未能预料到的情况,显示AI智能体还有进一步进化的空间。
除了手机以外,张鹏还发布了面向个人电脑的GLM-PC。据介绍,GLM-PC是能够操作电脑的生产力助手,具有发送信息、网页总结、文档处理、预定和参加会议、远程和定时操作等能力。例如,下班后领导让发一份客户研报,用户可以在PC开机的状态下,远程让GLM-PC自动执行相关的操作,还可以帮助用户定时发出文档等。
张鹏在现场也演示了GLM-PC的功能。他发出了“在智谱开放日活动中发布一个文件,文件是今天活动的新闻稿”“帮我去王心凌的微博点个赞,并且发一个评论”等指令,屏幕上的界面显示,智能体完成了相应的操作。
值得注意的是,在以上任务的关键步骤,例如支付款项、发送文件等环节,需要人工进行确认。“这是为了进一步保证整个操作环节的安全性。”张鹏强调。他表示,随着AI能力的持续提升,它们能驾驭越来越多的应用程序,适配多样化的操作系统,可以说是大模型通用操作系统。“智谱已经与多家手机厂商和PC厂商实现深度合作,并与高通、英特尔等芯片厂商展开合作,联合训练端侧大模型。”张鹏说。
AI智能体接管“一切硬件设备”
“理论上,AutoGLM可以完成人类在可视化电子设备(电脑,手机,平板……)上能做的任何事。”智谱AI表示。一名业内人士向证券时报记者分析称,AutoGLM执行诸如订外卖、领红包等个性化的指令时,需要获得用户个人信息使用权限才可执行。这也意味着,智谱AI作为软件服务提供商,需要与更多的第三方硬件厂商达成更全面的合作,才能让AI智能体真正在端侧落地。活动现场,张鹏宣布AutoGLM将启动大规模内测,将尽快上线成为面向C端用户的产品。同时,AutoGLM宣布启动“10个亿级APP免费Auto升级”计划,邀请APP伙伴联合探索自己的Auto新场景。
活动现场,荣耀AI技术总监王作健表示,荣耀将智谱GLM系列大模型应用在各个设备的业务场景中,未来将在三个关键技术能力上进行长期深入合作,一是面向复杂场景的任务智能体、二是面向更广泛的UI理解和自动交互规划执行的能力,三是端云协同的多模态理解和生成的大模型。
华硕AIPC智能生态负责人钟怀圣表示,华硕和智谱共同打造云一体的AIPC智能助手“小硕知道”和“豆丁知道”。其中,“小硕知道”将应用在华硕的灵耀和无畏系列笔记本上,涵盖了AI绘画、AI识图功能,而且用户可自如调节屏幕亮度、蓝牙、音量等,并控制打开第三方软件。据介绍,“小硕知道”将在2025年第一季度上线。
小鹏汽车座舱智能语音/智能化业务负责人廉磊表示,小鹏和智谱共同打造了小P智能语音助手。例如只需说出“你好,小P”,即可激活语音助手,无论是调节车内温度、导航到目的地、播放音乐,还是询问天气,小P都能迅速响应并执行命令。
AI智能体想象空间逐步打开
今年以来,AI Agent(AI智能体)成为生成式AI领域的一个热词,被视为AI落地的重要载体。所谓AI智能体,就是具备AI能力的一个智能实体,既可以是硬件装置,也可能是软件系统,可以感知环境、进行决策、执行任务。“通俗来讲,AI智能体就像是一个有智商、有情商、能理解、会帮忙的小助手,不仅能理解人类语言,而且还能通过学习和数据分析提高自己在特定领域的技能水平。”北京通用人工智能研究院先进技术中心副主任陈浩表示。
今年7月,百度创始人李彦宏在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上就表示,智能体是开发最简单的AI应用,也是他最看好的AI应用的发展方向,医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自己的场景和特有经验、规则、数据等,做出各种智能体。微软创始人比尔·盖茨也曾公开表示,智能体不仅会改变人类与计算机的互动方式,还将颠覆软件行业,带来自图形用户界面诞生以来最大的计算革命。比尔·盖茨还称,智能体将会像过去的Android、iOS和Windows一样,成为下一个平台。
当前,国内外科技巨头在AI智能体领域频频发力,均取得了显著的进展。国内厂商方面,除了智谱AI以外,字节跳动发布了一款AI智能体耳机Ola Friend。该耳机可接入豆包大模型,单耳6.6克,售价1199元。用户戴上耳机后,无需打开手机,只需喊出关键词“豆包豆包”,便能唤起豆包进行对话。百度也于最近发布了首款搭载中文大模型的原生AI眼镜小度AI眼镜,用户可以通过语音与眼镜进行交互,向它提问或下达指令。
国外科技大厂也屡获突破。去年年底,Meta发布内置Llama大模型的智能眼镜Ray-Ban Meta。苹果、Midjourney等公司也在探索头显与AI的结合。前不久,据彭博社报道,OpenAI将在明年1月推出智能体“Operator”(操作员),为用户自动执行任务,用户只需在电脑上下达指令,智能体就会自动帮助用户编码、订餐、做攻略等。
银河证券研报指出,大模型从“训练”向“推理”演绎,AI智能体将成为通往通用人工智能时代的必经之路。随着大型模型快速迭代升级,基于大型模型技术的AI智能体迎来了快速发展的阶段。AI智能体的崛起正重塑AI产业链并带来投资新机遇。预计到2028年,中国AI代理市场规模将激增至8520亿元,年复合增长率达72.7%。AI智能体产业链是多元化且高度协同生态系统,未来市场空间广阔,同时将推动APP生态逐渐向端侧生态转变,将成为AI应用发展新趋势。
校对:陶谦