DeepSeek重塑算力生态 国产算力迎新机遇
来源:经济参考报作者:吴蔚2025-02-20 07:35

DeepSeek引发的冲击波仍在持续:不仅多个平台宣布接入DeepSeek,各个行业也密集搭上这趟“快车”。尽管DeepSeek通过优化算法显著降低算力需求,但因其高性价比助推AI普及,使得算力需求反而呈现指数级膨胀。对于国内算力产业而言,DeepSeek的创新带来了一个可以和英伟达在生态上平起平坐的机会,国产算力迎来一波新发展机遇。

DeepSeek持续“扩圈”

一石激起千层浪。短短一个月时间,从科技大厂到政务部门、从汽车企业到手机厂商,各行各业都在积极拥抱DeepSeek。

2月16日,百度搜索和文心智能体平台宣布将全面接入DeepSeek。搜索用户可免费使用DeepSeek和文心大模型深度搜索功能,文心智能体平台的开发者也将随时调用DeepSeek模型创建并调优智能体。

百度并非第一家接入DeepSeek的搜索平台。近日,部分微信用户发现,微信搜索已经上线“AI搜索”功能,并接入DeepSeek-R1提供的“深度思考”服务。腾讯方面表示,微信搜一搜在调用混元大模型丰富AI搜索的同时,已正式灰度测试接入DeepSeek。被灰度到的用户,可在对话框顶部搜索入口,看到“AI搜索”字样,点击进入后,可免费使用DeepSeek-R1满血版模型,获得更多元化的搜索体验。

同在2月16日,深圳市宣布,基于政务云环境面向全市各区各部门正式提供DeepSeek模型应用服务,实现了基于DeepSeek的人工智能政务应用一体化赋能升级。而此前,广州、呼和浩特、赣州、无锡等地政务部门也已宣布部署应用DeepSeek,推动政务服务智能化,涵盖公文写作、民意速办、城市治理等领域,提升政务处理质效,助力智慧城市建设。

互联网头部应用和政务服务平台的接入表明,DeepSeek已经触达了最广泛的用户群体。数据显示,随着访问使用量急速上升,DeepSeek已经成为目前最快突破3000万日活跃用户量的应用程序。

不仅如此,包括华为、阿里、百度、腾讯、京东等在内的多家云平台早已宣布接入DeepSeek大模型,吉利、岚图、智己、长城、广汽、长安、奇瑞等约20家车企宣布DeepSeek“上车”,DeepSeek应用已覆盖电信、云计算、金融、汽车、手机等多领域。

业界人士认为,DeepSeek的快速出圈在于打破了大模型领域“越强越贵”的成本诅咒,以高性价比、高效率实现了大模型的低成本工业化,而且在通过底层架构创新降低成本的同时,以开源策略构建生态护城河,提供了突破算力限制的可行路径,也宣告了自ChatGPT引发新一波人工智能热潮以来,全球大模型行业“暴力堆算力”时代的终结,推动了从基础研究到商业应用的人工智能全产业链变革。

算力需求仍将增长

DeepSeek以更低的成本和算力需求实现了世界一流的模型性能,打破了全球人工智能产业“堆算力”的路径依赖,同时也在考问产业发展方向:未来是否仍有必要大规模投资算力?

正如经济学家杰文斯所言,技术进步虽然提高了资源的使用效率,但需求的增加常常会导致总消耗量反而增加。业界专家认为,这个在第一次工业革命时提出的“杰文斯悖论”将同样应验在大模型时代:瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升,如今DeepSeek将大模型推理成本压缩了97%,全球的算力需求却将因其高性价比反而呈现指数级膨胀。

国际数据公司IDC联合浪潮信息日前发布的《2025年中国人工智能计算力发展评估报告》提出,DeepSeek通过其先进的算法优化和高效的模型性能,激发了新的应用场景的需求,显著拉动了数据中心、端侧及边缘计算的应用发展。

天风证券研报认为,DeepSeek通过技术创新,降低硬件依赖,缩短训练时间,大幅削减投资、开发与运营成本,让更多下游应用公司有机会涉足大模型业务。同时,开源理念也打破了技术壁垒,让开发者能轻松获取资源,针对自身业务定制开发,助力大模型在各行业落地。

事实表明,DeepSeek比以往任何一款大模型产品都更快进入普通消费者的手机端,也比其他大模型更快落地到开发者或者企业端。业界人士表示,一方面,DeepSeek的高浓度技术创新,充分发挥了硬件有效算力,说明稳定可靠的算力底座仍是模型创新的关键;另一方面,很多中小企业都能用得起这样的大模型,训练成本的下降可能会暂时减少对算力的需求,但大模型变得更加经济,会使原本因为模型成本太高而不打算使用大模型的企业加入进来,从而增加了算力需求。

向来嗅觉敏锐的资本市场闻风而动。早在蛇年春节前,DeepSeek引发的上涨行情就开始发酵,算力全产业链迎来一波上涨行情,多家券商研报提醒投资者关注“算力短缺”带来的产业链机遇。

算力产业专家表示,未来大模型将呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。其中,“技术摸高”是指人工智能头部企业将坚定投入预训练基础模型创新,关注高效、稳定、开放的算力底座,极致性能、稳定可靠的算力集群,以及深度开放的算力平台和生态;“工程创新”是指DeepSeek这类新范式降低了后训练和模型蒸馏的门槛,企业更关注便捷、易用、高性价比的算力平台,兼顾成本与性能的蒸馏、微调方案,以及便捷的部署和敏捷业务上线。

国产算力迎新机遇

面向DeepSeek热潮带来的应用需求,国内算力产业积极投入DeepSeek系列模型适配,进一步强化面向大模型的国产软硬件支撑能力,加速推动软硬件协同创新。

2月4日,DeepSeek系列大模型正式上线昇腾社区,开发者可一键获取DeepSeek系列模型,并支持昇腾硬件平台上开箱即用。

事实上,作为面向“端、边、云”的全场景AI基础设施,昇腾早在DeepSeek模型发布之初就已深度参与其中。2024年12月26日,DeepSeek-V3发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理。今年春节以来,多家企业相继官宣基于昇腾成功上线DeepSeek相关服务。

三家基础电信企业悉数全面接入DeepSeek开源大模型:移动云基于昇腾生态全版本、全尺寸、全功能支持DeepSeek系列产品,全面上线13个中国移动智算中心;电信天翼云“息壤”智算平台从昇腾硬件、推理引擎到模型服务支持DeepSeek-R1满血版至轻量化蒸馏模型灵活部署;联通云基于联合创新和自研加速引擎,构建昇腾智算底座,与DeepSeek-R1模型深度对接。

此外,AI基础设施企业潞晨科技推出了基于昇腾算力的DeepSeek R1系列推理API及云镜像服务,硅基流动上线了基于华为云、昇腾云服务的DeepSeek-V3、DeepSeek-R1;算力系统软件服务商清程极智也完成了昇腾DeepSeek-R1满血版适配……据介绍,当前已有超过30家软硬件企业基于昇腾推出DeepSeek一体机方案,超过80家企业基于昇腾上线DeepSeek,昇腾已助力20余省市AICC(公共算力服务平台)启动部署DeepSeek系列模型,全国超70%区域可获取服务。

据悉,在训练方面,昇腾是目前国内业界唯一从预训练到微调以及强化学习能力全流程适配的DeepSeek的AI训练平台;昇思MindSpore支持DeepSeek-V3预训练、微调、推理全流程开箱即用、实现天级复现。在推理方面,DeepSeek小专家创新架构,带来通信耗时及专家负载不均挑战,昇腾双机并行推理+专家负载均衡,助力DeepSeek模型推理吞吐性能提升超30%。此外,昇腾提供AI开发全流程服务,帮助企业周级部署DeepSeek,实现快速上线。

业界人士认为,对于国内算力产业而言,现在出现了一个巨大的可以和英伟达在生态上平起平坐的机会。此前,全球算力生态的锚点在英伟达的CUDA体系,如今DeepSeek绕过这一锚点,所有厂商站在了同一起跑线上,国内算力产业迎来了新的发展机遇。谁能在此时基于更新的生态锚点快速构建出新的支持能力,支持好客户,支持好伙伴,支持好开发者,谁就可能迎来新发展甚至是更高速的发展。

责任编辑: 胡青
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换