“金融行业作为人工智能应用要求高、场景丰富,是大模型技术和算法突破的沃土。今天发布金融大模型,体现了你们在这方面的技术积累,我也十分期待你们在未来推动大模型应用在金融领域的探索和实践,从而带动和加速金融数字化和智能化的发展。”中国工程院院士倪光南在8月28日金融大模型发展论坛暨马上消费金融大模型发布会上如是表述。
中国工程院院士倪光南在马上消费大模型发布会上演讲
本次论坛以“数智融合,渝见未来”为主题,云集了谭建荣、倪光南、孙茂松和杨新民四位院士及100多家金融机构,携手马上消费金融股份有限公司(下称马上消费),共同探讨金融大模型的未来。
论坛上,马上消费重磅发布了全国首个零售金融大模型——“天镜”,寓意大模型是人类智慧的镜像,推动金融机构高质量发展。基于此,中国信通院、重庆国家应用数学中心和马上消费牵头发起,阿里云、百行征信、北京火山引擎科技有限公司、中关村科金、毕马威、复旦大学金融科技研究院、朴道征信、腾讯云、中国科学院自动化研究所等联合倡议发起的“金融大模型可信安全验证与联合创新行动计划”。
马上消费发布首个零售金融大模型“天镜”
谭建荣、孙茂松、杨新民等院士与马上消费蒋宁共论金融大模型的可信、安全
“今年年初的ChatGPT非常直面,我们感觉到无所不能,但是坦诚讲,在工业领域、金融领域,大模型还有四个关键的难题。”马上消费首席信息官蒋宁开局就直面通用大模型和金融大模型的本质区别。
他表示,大模型目前还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信和基础设施的能力四大难题。他举例表示生成大模型,最大的困难是满腹经纶,回答错了他可以不承担风险,比如自动驾驶,它的刹车、提速、转弯、看灯,外界环境都在变化,对象车在变化,所以绝对不能出错,1%的错都会造成生命财产的损失,这就是金融大模型和传统大模型最大的区别。生成式模型它不能做解释,但是金融大模型最主要的模型叫做判别性,它需要做决策,交易决策。
拿马上消费的风控来讲,我们有将近2000个模型,20万张表,每天都在变化,但环境不管如何发生变化,让我们的模型错一个,非常不容易,这就要做到可控、安全。这背后是因为马上消费作为以科技驱动的头部持牌消费金融机构,积累了1.79亿的用户,有超2000个模型,10万+变量,近50PB的多模态、高质量的数据等,通过在这些自身数据上做模型精调对齐训练,同时再用推理加速技术实现模型可控,从而相比其他企业更懂金融。
马上消费首席信息官蒋宁在金融大模型论坛上演讲
这方面,也引发了与会院士和专家的共鸣。
关于安全的风险,中国工程院院士、浙江大学求是特聘教授谭建荣举了个例子,北京老太太接到远在美国孙子的视频电话,图像、声音都是孙子的,结果却被诈骗了,因此他说“人工智能时代,眼看的不一定是事实,大家要提高警惕。”而马上消费能探索金融大模型,说明了是行业的领头羊,有了数据和模型,才能从不确定的关系转变为确定的关系,从变量中找出不变量。
中国工程院院士、浙江大学求是特聘教授谭建荣在马上消费大模型发布会上演讲
而应对AI风险方面,全国政协委员、国际系统与控制科学院院士、重庆国家应用数学中心主任杨新民院士表示,随着大模型的开放开源,深度合成技术的非法使用存在加速积聚的风险。他特别提到了“与马上消费率先在金融领域进行原创性探索”,包括加强深度防伪验证系统,包括人脸识别及生物特征识别验证系统的活体检测、Deepfake伪造检测、对抗攻击与防御、深度学习可解释性等。
针对提升大模型应用的可信实践,中国信息通信研究院副总工程师王爱华在致辞中表示“可信人工智能实践的路径逐步清晰。人工智能发挥作用越大,它对于安全可信的要求也是越高的。当从业者自身把安全和一些问题作为发展第一要务的时候,说明这个技术在整个领域会进行应用。”
三纵三横 “天镜”大模型四大核心应用场景亮相
在“天镜”大模型发布会上,蒋宁表示,马上消费已形成“三纵三横”的大模型发展技术布局,并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域,进一步推动金融数字化转型产生实质性的飞跃。
所谓三纵,是指实时人机协作、多模态智能、数据决策智能,在数据领域实现智能化,实现结构性数据判别式模型的综合能力。三横即是指持续学习、模型合规、组合式AI形成安全、合规、可信的鲁棒性技术能力,确保让模型越用越聪明,同时更稳定、更安全可控。
他表示:“我们希望在任何情况下,它给客户的回答,给所有的员工的回答是合规的,并且在任何不可预期的情况下它的结果是稳定的,这来源于马上今天几千个模型,上万个变量形成的模型。”
欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松非常认可蒋宁的人机协同观点,他认为“大模型的基本定位还是智力劳动者的助手,它不会把一个行业整体取代。生成式人工智能的特点,它一定会出错。因为通用大模型对文本语言比较重视,对数字其实不敏感,所以ChatGPT有时候经常乱说,而金融数据很多都是结构化知识图谱,所以大模型在金融领域有很多挑战。马上消费做了一个很好的示范作用,开了一个好头。”
基于三纵三横,马上消费人工智能研究院院长陆全围绕引爆企业的数据潜能,打造全能数字员工这一核心,对天镜大模型在汇集智慧、唤醒知识、众创价值、数字分身四大应用场景进行了现场路演和解说:
汇集智慧方面,主要是应用在人工客服场景,通过大模型提炼萃取一线优秀人工坐席客服经验,汇聚成群体智慧,从而拥有一对多服务客户的能力,也可作为人工坐席的辅助角色,帮助推荐、优化回答。据悉,该模型已运行近3个月,意图理解准确率达91%,相较于传统AI的68%有较大提升;客户参与率61%,高于传统模型43%的参与率,也高于人工坐席平均28%的水平;
唤醒沉睡知识主要是高效解决了提取、利用非结构化文档中的数据资料的痛点。例如,将企业招股书、财报、经济预测数据等文件上传后,天镜大模型可以深入解析金融领域专业术语、同时查询定位多个不同文档、洞悉金融图表隐含的信息和强大归纳总结能力;
众创数据价值主要是为了降低使用数据的门槛。天镜大模型SQL生成平台不再需要代码等专业指令,可直接向AI说大白话,天镜自动理解需求、展开检索、生成答复,按照人的意思去完成数据挖掘的任务。当前,天镜每日线上SQL生成数量650多次,线上SQL生成可执行比例53.4%,SPIDER标准数据集EX得分75.2,线上使用者满意反馈比例82.3%,表现领先行业。
数字人方面,陆全希望打造的“数字外表+智慧大脑+情感内心”三合一数字人,擅理解,有温度,懂心理的智能秘书,或不休不眠的智能“打工人”。他希望能让每个员工都能轻松拥有自己的数字分身,上传自己的资料并定制一些参数后,只需5分钟的训练数据就可以生成“另一个我”,随时可以被唤起,成为人人都拥有的超级助手,代替员工完成大量工作。
论坛上,蒋宁表示马上消费已经在金融领域跑出了“马上速度”,未来已来,马上消费将持续拓展虚实共生,做可信开放的数字融合体。
据了解,本次论坛由重庆两江新区管委会、重庆市科学技术局、重庆市经济和信息化委员会、重庆市人力资源和社会保障局、重庆市地方金融监督管理局、重庆市大数据应用发展管理局、重庆市科学技术协会共同主办,马上消费、两江产业集团承办,北京中关村科金协办。(CIS)