大模型基本上消除了幻觉、超级应用还没有出现、智能体是AI应用的最主流形态即将迎来爆发点……在11月12日举办的百度世界2024大会,李彦宏对于AI的诸多最新研判出炉。
大模型基本消除幻觉
“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,李彦宏在百度世界2024大会上表示。
“幻觉”是AI大模型的专用语言,幻觉问题是大模型广泛应用的最大限制之一。此前不少AIGC产品喜欢“一本正经的胡说八道”,导致AI输出可信度不高。
截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。李彦宏表示“这个增速超出预期”,说明AI是真需求。他感慨,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。
在AI应用的发展趋势上,李彦宏表示,智能体是AI应用的最主流形态,即将迎来爆发点。他依次讲解了公司、角色、工具和行业四大类智能体,将做智能体类比为PC时代做网站、或是移动时代做自媒体账号,“不同之处是智能体更像人、更智能,更像你的销售、客服和助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
发布两大AI技术
会上,百度发布文心iRAG和无代码“秒哒”两大AI技术。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码技术“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
解决文本生成幻觉问题背后的技术就是RAG,即检索增强。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。
目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,影响了AI的实用性。
针对上述问题,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。同时展示的“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。
消除大模型的幻觉,也是AI应用爆发的基础。在李彦宏看来,今天,基础大模型能力就绪,即将迎来AI应用的群星闪耀时刻。
此外,无代码工具“秒哒”是一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。它可以帮助更多人、更多企业打造出数百万“超级有用”的应用。李彦宏总结说,这意味着每个人自己就能指挥多个智能体来协同完成任务,“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”
智能体是下一个应用爆发点
“今天,全球所有顶尖科技公司都在关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。”李彦宏表示,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。
他以公司类智能体举例,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。
此外,李彦宏展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如百度文库和百度网盘联合打造的工具类智能体“自由画布”,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”在李彦宏看来,智能体的门槛低、天花板高,既能让人人都上手,又能做出复杂强大的应用。当天,他展示了文心智能体平台的TOP100智能体,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体。
校对:杨舒欣