云栖大会自2009年开始举办,至今已历经14届,大会持续聚焦计算技术创新前沿。10月30日下午,在2023云栖大会即将开幕之际,证券时报·e公司记者来到杭州云栖小镇,提前打卡展区亮点。
据悉,本届云栖大会以“计算,为了无法计算的价值”为主题,设置“算力馆”、“人工智能+馆”和“产业创新馆”三个主题展馆,并呈现500余场并行话题、提供沉浸式科技体验,展示了云+AI技术创新的最新进展。本次大会展区规模超4万平方米,参展企业超过200家。
阿里云负责人向记者介绍,大模型展区是今年云栖大会的一个亮点。“去年云栖大会还是以算力为核心,没有对大模型进行过多展示,但今年以来国产大模型百花齐放,从年初到现在,国内大模型的发展来到一个重要节点,就是大模型的认知能力已经得到较大的提升,通义千问生成的内容回答和通义万相生成的图像质量都体现了这一变化。”
记者在“人工智能+馆”现场看到,阿里云自研的通义千问、通义万相、通义智文等通义大模型家族成员纷纷亮相。其中,通义千问在本届云栖大会进一步升级,阿里云通义千问负责人介绍,一是扩大了通义千问背后的参数规模,二是上线新的多模态理解能力,三是通义千问App当前已上架各大安卓应用市场,在苹果应用市场也即将上架。
回顾“通义”大模型的发展历程,阿里云于2022年9月发布自研大模型“通义”大模型;今年4月正式对外发布“通义千问”;7月宣布AI绘画创作大模型“通义万相”开启定向邀测;8月宣布“通义千问”正式开源;9月宣布“通义千问”大模型已首批通过备案,并正式向公众开放。
在“通义万相”展台,记者看到该模型可辅助人类进行图片创作,目前有基础文生图、相似图片生成和图像风格迁移三大功能。相关负责人介绍,当前该模型已有企业接入使用,如金山办公当前已与阿里云达成合作,将“通义万相”模型接入金山文档使用当中,在文档中输入关键词就可生成对应配图。
“发展到当前这个节点上,大模型的参数规模在变大、算法能力在增强,大模型变得更聪明了,这是一个明显的趋势。”阿里云负责人对记者表示。
除了通义大模型家族外,现场还有基于大模型所衍生的一系列创新应用,记者看到,在今年暑假曾火爆一时的妙鸭相机也在“人工智能+”展馆露面。妙鸭相机是一款AIGC应用,用户需花费9.9元,通过上传20张个人照片生成数字分身,以及不同妆造、场景、角度的AI写真照。妙鸭相机负责人表示,这款应用背后的逻辑是为用户提供一个生成式人像模型,该模型通过20张照片学习用户的面部的轮廓外观、五官及其他面部细节,最终形成数字分身及AI写真照。
阿里云负责人表示,妙鸭相机与“通义万相”的能力在某种程度上有相似之处。一张AIGC相片的生成,需要GPU算力支撑,作为国内第一批云原生的AIGC应用,妙鸭相机对算力的需求较高,生成高质量的“写真”相片之前,要对用户上传的图片进行微调训练,算法需要在短时间内完成针对性的在线推理。
在“产业创新馆”中,记者看到该馆被分成智能交互、手机、汽车、游戏、政府上云等区域,共有超过200家企业参展本届云栖大会,各大区域均不乏上市公司身影,中国移动、中国电信、金山办公、传音控股、一汽集团、长城汽车、吉利汽车、电魂网络和网易等纷纷在列。
传音控股负责人向记者介绍,传音控股主营新兴市场移动设备业务,在本次云栖大会上,公司展示的主要产品一是传音云生态平台Dlight Cloud,该平台具有多云平台、融合CDN、智能短信、在线支付等功能;二是展示AIGC在非洲市场的应用,传音提供为非洲用户提供服装、头饰、妆容、头像、风格等个性化、独特造型建议和快捷变装体验,帮助用户随时随地尝试各种风格,助力非洲链接AI新世界。
一汽集团带来了基于阿里云大模型开发的GPT-X大模型,据负责人介绍,该模型结合了汽车行业与“红旗”品牌双重特点,基于中国一汽云原生技术架构及数据底座,构建大模型分层能力,重塑各领域业务模式,实现效能增长。
具体来看,GPT-X包括GPT-BI(商业智能系统)、GPT-销售讲师、GPT-产品说明书、视觉大模型质检助手等。一汽集团负责人表示,在上述模型的应用下,公司在业务流出中无需再等待BI报表开发,可通过问答随时随地获取数据结果;全面提升店端销售及服务能力,每年可减少销售培训50场;在关键生产环节有AI视觉监控,全面提升生产质量与效率。