DeepSeek带动算力需求分层 智算中心迎新变局丨人工智能·AI瞭望台
来源:证券时报网作者:周春媚2025-02-21 08:45

走进博大数据位于深圳前海的智算中心,一座造型方方正正、蓝白相间的建筑格外引人注目。就在这座智算中心的机房里,一排排智算机柜整齐排列,服务器高速运转,进行着复杂的数据分析与计算任务。

宋春雨/摄

“作为融合算力服务商,我们在自有的算力集群上部署了DeepSeek-R1671B全量版本供客户使用,通过直接提供AI模型给用户,创造市场上的算力需求,从而拉动我们智算中心高密机柜和算力服务的销售。”博大数据副总裁白旭告诉证券时报记者。

随着国产大模型DeepSeek火爆出圈,最近一段时间以来,来自各行各业的许多公司宣布部署DeepSeek大模型,应用端的算力需求迎来大爆发。业内人士分析称,DeepSeek通过降低AI应用门槛,推动算力需求从“训练主导”转到“推理主导”。面对崭新的行业变局,智算中心需加快转型,从简单的算力提供商转向专业服务商,提供覆盖算力全生命周期的专业服务,提高算力资源利用效率。

DeepSeek部署热潮带动算力需求提升

最近一段时间以来,企业部署DeepSeek的热情仍然十分高涨。证券时报记者注意到,多家上市公司密集宣布已完成DeepSeek大模型的相关部署工作。

例如,海看股份2月18日在互动平台表示,公司已在自研的AI智能审核平台等垂类模型中部署接入DeepSeek模型,对自有平台进行微调和优化。同日,卓创资讯也发布消息称,已完成DeepSeek系列大模型的本地化部署,且正基于DeepSeek-R1模型,运用蒸馏技术,着力打造大宗商品行业大模型。

“DeepSeek很重要的一个意义,是对普通大众进行了AI的科普及推广。各行各业的人都知晓这款大模型,也纷纷去尝试使用。这种集中的访问与使用,带动了算力需求的爆发。”中昊芯英解决方案架构师顾立程在接受证券时报记者采访时表示,今年春节以来,很多客户都在询问公司智算中心与DeepSeek的适配情况。“目前,我们的智算中心已经能运行DeepSeek模型的各种蒸馏版本,并且表现都是非常不错的。”顾立程说。

宋春雨/摄

DeepSeek作为一款开源大模型,凭借高性能与低成本的优势,极大地降低了AI应用的门槛,正成为下游许多AI应用公司及终端厂商部署AI模型的优先选项。以不久前正式接入DeepSeek-R1大模型的智慧芽为例,该公司是一家科技创新信息服务商,公司技术负责人告诉证券时报记者,DeepSeek等开发的开源模型,确实可以帮助企业降低前期开发投入,尤其是可以节省高昂的基础设施试错成本。

记者采访了解到,企业的需求不仅是本地化部署DeepSeek大模型,还有许多公司会基于DeepSeek大模型,依托自有行业数据进行定制化开发,训练垂类模型或构建专业应用。

“印象深刻的是一家律师事务所,客户希望我们能协助他们利用自有的行业数据对DeepSeek进行定制化开发,构建自有的专业领域智能应用,我们目前正在协同合作伙伴努力满足客户的需求。”白旭表示,DeepSeek有助于加速国内企业数字化转型,政府、金融、制造等行业客户因AI应用场景(如智能审批、数字孪生)的扩展,对高密机柜和边缘算力设备的需求会大大增加。

从“训练主导”到“推理主导”,国产算力芯片厂商迎利好

训练成本低廉,这是DeepSeek区别于其他大模型的一大核心优势。虽然DeepSeek并未公开R1模型确切的训练成本,但根据此前V3模型发布时发表的论文,V3训练成本仅为557.6万美元,约为Meta开源大模型训练成本的十分之一。

据记者采访了解,大模型主要分为训练和推理两个阶段,训练是指用大量数据训练大模型,通常需要极高的计算能力和存储资源;推理是指将训练好的模型应用于实际任务,如提问并生成文本、识别图片与视频等。

“传统大模型训练如同吞噬算力的黑洞,单次训练成本动辄数千万美元的巨额投入,筑起了只有科技巨头才能逾越的技术壁垒。算力军备竞赛加剧了全球GPU资源的争夺战,形成了基础模型研发的高度中心化格局。”上海经邑产业数智研究院副院长沈佳庆向证券时报记者表示,DeepSeek打破了这种既定的秩序,将推动算力需求的重新分层,过去高度集中的训练算力需求会开始向应用端的推理算力需求扩散。

“早在去年年初,我们就预判智算中心的算力需求结构将从‘训练主导’转向‘推理主导’。大模型训练出来后要做到有用、能用、好用,DeepSeek成功地做到了这一点从而爆火。”白旭表示,目前国产算力芯片厂商与国内OEM(原始设备制造)厂商合作推出DeepSeek一体机,国内各大云平台也纷纷上线DeepSeek模型服务,这都大大降低了大模型应用的使用门槛。

除了带动推理芯片需求增长外,DeepSeek对国产算力芯片厂商的利好,还来自于技术层面。顾立程告诉记者,在DeepSeek推出以前,国内大模型处于一个“百花齐放”的状态。“中昊芯英作为一家AI芯片设计及国产算力硬件平台解决方案商,涉及大量的大模型适配需求。而随着国内大模型的逐渐聚焦,会加速我们在算力硬件平台及软件大模型全国产解决方案上的定型与市场化。”顾立程说。

事实上,自1月末以来,从云基础设施服务商到国产算力芯片厂商,都在紧锣密鼓地适配DeepSeek大模型。云基础设施服务商方面,华为云、腾讯云、阿里云、百度云等主流的云厂商均已宣布DeepSeek相关模型上架,可供开发者部署调用,中国移动、中国电信、中国联通三大基础电信企业也全面接入DeepSeek。国产芯片公司也“闻风而动”,据证券时报记者不完全统计,包括天数智芯、摩尔线程、海光信息、云天励飞、壁仞科技、燧原科技、沐曦、昆仑芯等在内的十余家国产芯片公司都已相继宣布适配DeepSeek模型服务。

从提供算力到专业服务,智算中心迎转型机遇

DeepSeek的崛起,引发了人们对于未来算力需求的广泛关注。最近一段时间以来,二级市场中的算力板块和相关个股也迎来了较大的波动。

沈佳庆认为,短期内,由于DeepSeek降低了训练成本,会使得训练环节对大规模算力的需求出现下降,从而将资源投入到具体解决方案的研发。“但中长期来看,DeepSeek一是会提升推理、微调的算力需求,使一部分原来用于训练环节的闲置算力获得应用;二是会刺激基础大模型加速迭代,对算力的需求或将出现增长。”沈佳庆表示。

业内人士普遍认为,DeepSeek对智算中心将构成长期利好。但在DeepSeek带来“泼天富贵”之前,业内对于各地踊跃建设、遍地开花的智算中心却存有疑虑。据记者采访了解,近年来,由于人工智能产业的蓬勃发展,全国掀起了规划建设智算中心的热潮,大大小小的智算中心如雨后春笋般在全国遍地开花。最近,国际数据公司(IDC)与浪潮信息联合发布的《中国人工智能计算力发展评估报告》显示,2024年中国智能算力规模同比增长了74.1%,显示了我国在智算领域的大力投入。

然而,一些智算中心存在着利用程度不高、供需错配的问题。沈佳庆分析称,从供应侧来看,为响应国家与地方产业规划的政策导向,加之政府鼓励,电信、IT软硬件等领域国央企和大型民企,秉承“适度超前”的原则,开展大规模的智算中心建设,导致市场供给出现井喷;从需求侧来看,市场需求虽有增长,但没有出现明显井喷。“一是国产软硬件在效能、适用领域等方面还有差距,应用效果不及预期;二是在产业发展初期,技术还未成熟,企业从理性角度出发,购买产品或服务时要考虑多重因素,相对而言会比较谨慎。”沈佳庆说。

算力闲置,曾困扰国内不少智算中心,而DeepSeek或有助于缓解这一难题。“就像当年移动互联网普及一样,当大模型真正成为大家习惯使用的工具,到时就将迸发出非常庞大的算力需求。”顾立程表示,提前布局智算中心,才能保证需求真正爆发时,智算中心能够承载得住这“泼天的流量”。

对于智算中心而言,DeepSeek还带来了新的发展方向和机遇。据白旭介绍,智算中心的产品模式已不再局限于高密机柜和算力服务的提供,而是可以直接部署模型应用给企业使用。

“智算中心应从简单的以硬件建设为主,转向以提供专业服务为主的新发展阶段。”沈佳庆认为,算力从一种基础资源,到真正变成普遍应用的生产力工具,中间还有梗阻,这些也是智算中心能够发力的市场机遇。“通过提供覆盖算力全生命周期的专业服务,与产业链上不同的主体合作,提供包括算力调度、计量、优化、微调、封装、维护、二次开发等在内的一揽子解决方案,将有效推动算力服务在各行各业的渗透应用,从而扩大整个智算中心的市场需求。”沈佳庆说。

校对:王朝全‍‍‍

图片

责任编辑: 冉超
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换