上海钢联日前在接受机构调研时表示,公司计划在一季度借助DeepSeek-R1快速蒸馏出全新的“宗师”行业大模型,并将其切换为“小钢”数字智能助手的基座模型。据介绍,完成上述工作后,公司会跟现有“小钢”进行比较,根据测试情况,会在二季度正式开放给用户体验。
“小钢”数字智能助手是上海钢联基于大语言模型及AIGC技术的前沿探索成果,去年8月,“小钢”正式上线。通过与智能助手交互对话的方式,“小钢”能为客户提供查价格、读资讯、写报告、问百科、找商机等内容服务,此外还具备了市场分析、多模态生成和智能客服等功能,并辅助文章阅读,为用户提供AI摘要。
不久前,上海钢联宣布,“小钢”数字智能助手1.6版本对话使用的次数已经超30000次、使用用户数5000余人,生成的内容每天都服务在大宗商品行业各个领域。值得说明的是,“小钢”数字智能助手1.6版本依赖于“钢联宗师”大语言模型的支撑,进一步拓展了大语言模型的功能应用。同时,在大模型语料方面,上海钢联打造“大模型数据标注平台”,为模型的预训练、垂类能力的形成,提供了基础数据保障。
具体而言,2024年,“钢联宗师”大语言模型成功完成钢联Agent底层架构设计,并同时打造了8个Agent智能体。在大模型语料方面,上海钢联打造“大模型数据标注平台”,通过平台标注了48.5万条大宗商品行业标准知识语料,并基于用户真实历史检索记录,标注、审核、形成逾10万条高质量对话意图语料,为模型的预训练、垂类能力的形成,提供了基础数据保障。
“近期DeepSeek-R1开源推理模型的推出,我们认为这样一款低成本、强推理能力的模型,对大宗商品语义理解的复杂性,能有更好的处理能力,已开始部署相关工作。”上海钢联日前在接受机构调研时表示,公司的内部计划是借助DeepSeek-R1 快速蒸馏出全新的“宗师”模型,并切换“小钢”数字智能助手的基座模型,提高“小钢”的推理能力,和用户更好交互,更好地去做查询、知识整理、报告生成等工作。第二步基于DeepSeek的改造完成后,会把“小钢”的能力整合到EBC平台中服务行业的大客户。
据了解,上海钢联技术团队已完成小钢全面接入DeepSeek API,并完成对应的测试评估,效果好的AI摘要功能已经切到DeepSeek提供服务,同时也已经完成DeepSeek-R1 32B 模型私有化部署;当前正在基于钢联“宗师”过往训练中积累的高质量语料进行训练和微调工作,预计2月底前完成DeepSeek版新“宗师”行业模型的研发工作。上海钢联同时强调,未来也可能存在其他不确定因素,请投资者关注业务发展不及预期的风险。
上海钢联表示,将深化在AI智能化上的布局,开启新的探索路径,借助行业数据治理能力、行业大模型特色语料的积累、大模型的应用和落地等能力和经验,进一步拓展底层模型的应用范围,为用户提供定制化大模型应用,助力大宗商品行业的智能化发展。(厉平)
校对:冉燕青