DeepSeek大放异彩 AI迎来“破圈时刻”
来源:上海证券报作者: 柴刘斌 郭成林2025-02-07 08:40

郭晨凯 制图

“刚刚我还在用DeepSeek-R1模型测试本地知识库,它的文本生成能力比预期的更好。”2月6日,心动公司媒体公关总监陈承对上海证券报记者说。

1月20日,DeepSeek正式发布DeepSeek-R1模型,并同步开源模型权重。DeepSeek模型的横空出世掀起行业浪潮,多家公司迎来“破圈时刻”:在软件端,一批上市公司宣布接入DeepSeek,加速自身AI应用产品升级;在硬件端,端侧AI迎来加速发展契机,2025年或将出现一波AI硬件创业浪潮。

在昆仑万维董事长兼CEO方汉看来,DeepSeek的高性价比模型证明了,只要算法先进,训练成本跟推理成本都可以大幅度下降。这将会刺激整个大模型行业快速落地,对于整个行业非常有益。从行业长期发展来看,DeepSeek对下游应用落地起到很好的促进作用,所有和编程、数理推断相关的行业,如金融、互联网、法律等领域,都会得到极大发展。

中小企业涌入 AI迎来“破圈时刻”

据了解,DeepSeek-R1的训练费用不到OpenAI GPT-4o的十分之一,且API定价仅为OpenAI o1的三十分之一。这意味着中小企业和个人开发者也能够轻松使用这种高性能的人工智能技术。

蚁智岛科技采用DeepSeek的服务已有半年之久,见证了其版本从v1到v3再到R1的更迭。蚁智岛科技CEO隋阔认为,DeepSeek最核心的影响是让AI“破圈”了,凭借产品硬实力,很多圈外人得以迅速了解这一产品形态。“春节回来后不少老板主动联系我,想加速推动AI在企业的落地。虽然还是有理解上的差异,但是DeepSeek接受度大大提高。”

市场对于DeepSeek的浓厚兴趣,也体现在各行各业的加速布局中。

上海钢联在2月5日发布的调研纪要中提到,DeepSeek-R1开源推理模型成本低、推理能力强,对大宗商品语义理解的复杂性,能有更好的处理能力。公司表示,希望尽快把基于DeepSeek的“小钢”做出来,在一季度借助DeepSeek-R1快速蒸馏出全新的“宗师”模型,并切换“小钢”的基座模型。

2月6日,智云健康宣布将DeepSeek-R1模型接入公司自研医疗人工智能系统“智云大脑”。这一举措将增强智云医疗大脑的数据挖掘能力,提高慢病管理效率。

中信证券发布研报称,DeepSeek是国内AI生态级的突围,有望带动国内AI全产业的快速发展。同时,其开源与低成本的特性亦有望赋能AI应用厂商,加速推动端侧AI落地。

也有专家提出,未来,大部分的企业或个人都可以轻松地本地化部署DeepSeek,随后DeepSeek对于AIGC类公司的影响将逐渐下降。企业的竞争力依然取决于自身的AI应用场景与产品。

“行业需要在算法迭代与芯片制造和设计上更进一步,才能真正进入世界先进水平之列。”方汉告诉记者。

隋阔表示,DeepSeek的“破圈”是一个利好,随着算力、算法、数据等其他环节的迭代优化,会有更大的应用前景。DeepSeek开源了R1的训练方法和流程,大幅提升了训练效率,但如果企业要训练依旧是“天价”。蒸馏模型依旧更适合企业,高质量数据依旧是核心。

端侧AI加速跑激活硬件生态

事实上,相较于AI软件,此次由DeepSeek带动的端侧AI加速发展,有望大幅激活AI硬件的商业化生态。

受访的业内人士告诉记者,端侧AI能优化硬件性能,提高运算速度、降低延迟,同时实现更复杂任务与增强交互,并支持更多离线等应用场景,全面提升AI硬件的能力与价值。2025年将是AI眼镜、AI玩具等AI硬件行业发展的重要一年。

从技术层面来看,DeepSeek模型采用改进的算法和架构,实现了算法、框架和硬件的优化协同,提高了模型在端侧设备上的运行效率,使端侧AI部署变得更加具有普惠性。同时,通过知识蒸馏,将大模型的能力高效迁移到轻量化模型上,开发者可快速将其AI能力部署至硬件设备并针对场景定制化,降低了智能产品的AI功能集成门槛。

Rokid投资者关系负责人方雨晴表示,在智能眼镜行业,企业是否接入大模型主要取决于Token(词元)价格、平台稳定性和响应速度等因素。企业可以在前期选择多个AI大模型供用户自由选择。从行业来看,AI软硬件公司普遍期待DeepSeek等国产或开源大模型能有更好的发展,有助于降低行业开发周期和投入。据介绍,Rokid专注于AR智能眼镜的软硬件研发,并已与通义千问等多模态大模型建立合作关系。

华安证券研报表示,目前不少国内手机整机厂商推出端侧AI功能。基于DeepSeek-R1在推理能力上表现出色,该模型若能进入AI智能终端,将形成具有强大AI功能的产品,有望提升用户体验,增强产品吸引力,在与其他厂商的竞争中更具优势。

从产业链来看,DeepSeek也有利于SoC芯片和存储等行业的发展。

“从行业的长期发展来说,DeepSeek会催生上游的推理芯片跟训练芯片的大幅进步。”方汉说。

泰凌微副总经理、COO金海鹏对记者表示,随着蒸馏技术的成熟,可以预见在泰凌微AI芯片上运行的模型也会更强大。不过,这些目标无法在短期内达到,需要时间的积累。公司未来或将在技术适配与优化、应用场景融合与生态合作方面与DeepSeek有交集。从行业来看,DeepSeek推动端侧AI成本降低,使整个端侧AI市场需求增长,从而将带动端侧AI芯片公司的市场拓展。

在AI硬件的商业化落地中,有了DeepSeek也并非高枕无忧。

人形机器人被视为AI硬件应用的终极集成形态。DeepSeek如果被植入人形机器人中,是否会迎来更大的商机?对此,国内一家机器人公司的相关负责人认为,DeepSeek属于ChatGPT的大类别,目前还无法深度驱动人形机器人。

陈承也表示,DeepSeek尽管在文本处理方面十分突出,但目前多模态功能尚属短板,因而使用场景更聚焦于文本处理及其衍生场景。

责任编辑: 胡青
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换