我们需要更多的DeepSeek。
“中国距离追上ChatGPT还有多远?”
过去几年里,这是几乎每个中国大模型从业者们都被反复拷问的话题。
2025年初,这个问题被重新解构。 “来自东方的神秘力量”搅动全球科技圈,一度带崩芯片股,也引领了持续一个月的“DeepSeek热”。从巴黎到迪拜,近期所有国际性AI大会都在讨论它,尽管它并未参加。
风投机构a16z创始人安德森将DeepSeek R1描述为“人工智能的斯普特尼克时刻”,斯普特尼克是苏联在1957年先于美国发射的人造卫星。 ScaleAI创始人亚历山大·王的观点更激进:过去十年来,美国可能一直在AI竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
压力之下,海外AI巨头近期动作频频,谷歌端出了热乎的新产品Gemini2.0系列,xAI发布了马斯克口中“地球上最聪明的人工智能”Grok 3,为坐稳大模型王座,OpenAI也变得焦虑,CEO在线投票征集开源方案。
以DeepSeek为代表的中国模型看起来追上甚至部分超越了一向领先的海外模型。QuestMobile数据显示,DeepSeek日活跃用户已在2月1日突破3000万大关,成为史上最快达到这一里程碑的应用。随后,全球最大的代码托管平台GitHub显示,DeepSeek的Star量(星标)超过了OpenAI。
全球在人工智能领域长期角力进入新阶段,全球的大模型实力差距到了重估的时候。
通往罗马的路不只有一条
自2022年底ChatGPT发布以来,中国AI的主流叙事一直是“追赶”。过去一两年,当被问及我们离OpenAI有多远时,有从业者给出的答案还是代差两三年。2025年,这个问题的答案会更乐观。
“通往罗马的路并不是只有一条,可能有很多风景更优美的路径。”枫清科技创始人兼 CEO 高雪峰对第一财经记者表示, DeepSeek-R1 将很多方面的研究创新性地组合在一起,并真正实验,达成了现在的效果,的确是一件值得让全球关注的创新性研究成果。
复旦大学计算机科学技术学院教授邱锡鹏则用“令人震惊”形容R1系列中的R1-Zero,以往大模型团队复刻GPT-o1时会遇到如何拿到训练数据的重要问题,而R1-zero证明了纯RL就能增强模型推理能力。“这让人产生非常大的遐想,打开了思路:未来是不是有很大的机会能通过大规模RL在推理路线上超越o1?”邱锡鹏说。
CIC灼识咨询执行董事董晓雅在接受记者采访时认为,DeepSeek的爆火意味着中国的AI已大幅拉近了与美国技术的差距。“DeepSeek证明中国能够在既有的技术框架下,通过局部创新与大规模系统级工程优化,实现对国际领先水平的追赶甚至超越。”
而从AI从业者的感知来看,今年年初曾前往硅谷的光轮智能创始人谢晨对第一财经记者说,他发现硅谷在AI领域的认知其实和国内顶尖创业者的认知并没有太大差异,且形成了相当程度的共识。例如,“预训练不行了,要转向后训练”、“RLHF很关键”、“具身智能前景广阔”等,其实这些在国内早已有深入讨论,硅谷正在“祛魅”。
不只是DeepSeek,复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任肖仰华对第一财经记者表示,单纯从国内外模型的效果上来看,我们的差距已经比较微弱。无论是黑马大模型Deepseek还是大厂派的通义千问系列,从模型效果上看,都已经非常接近海外顶尖模型。
如果看向模型榜单,中国AI势力不容小觑。全球知名AI模型评测平台Chatbot Arena(大模型竞技场)公布的最新一期榜单显示,Top11名单中(包含部分并列的模型,总数不止11个),国内4家大模型厂商共有6款产品上榜,包括排在第5位的推理模型DeepSeek-R1,第8位的通义千问Qwen2.5-Max,并列第10位的DeepSeek-V3、Qwen-Plus-0125和智谱AI的GLM-4-Plus-0111,阶跃星辰的Step-2-16K-Exp排在11位。
大模型竞技场是业界公认的榜单之一,采用匿名方式将大模型两两组队,交给用户进行盲测(提出任何相同问题),根据真实对话体验对模型能力进行投票。这份榜单部分可以代表中国大模型在全球市场的竞争力。
分领域来看,在基座大模型领域,通义千问旗舰版模型Qwen2.5-Max模型挤进了基座模型TOP5,排在前面的是xAI最新发布的Grok-3,谷歌旗舰模型Gemini 2.0 Pro、OpenAI最新的GPT-4o模型,以及谷歌通用模型Gemini 2.0 Flash。DeepSeek-V3作为基座模型排在第6位。
在推理模型领域,DeepSeek的R1已经挤进全球开闭源推理模型TOP3,在榜单中仅次于谷歌的推理模型Gemini 2.0 Flash Thinking,超过OpenAI的o1。
除了榜单外,从在专利、顶会论文等维度来看,中国在大模型赛道上也展现出强大的竞争实力。
根据去年7月发布的《2023全球人工智能创新指数报告》显示,在主要国家人工智能顶级论文数量和主要国家人工智能专利授权数量上,中国远高于美国。
其中,顶会顶刊论文中国作者数量从2018年的328人增长到2022年的1674人,与美国的差距正逐渐缩小。在主要国家人工智能顶级论文数量占比上,中国占比36.7%,美国占比22.6%。
专利领域同样竞争激烈。上述报告称,在主要国家人工智能专利授权数量占比上,中国占比34.7%,美国占比32%。
近日记者从知识产权信息服务商智慧芽获得的数据显示,2020年至2024年期间,美国在人工智能领域累计申请8.4万余件专利,其中2.4万余件已获授权;同期中国在人工智能领域累计申请77.6万余件专利,其中29.9万余件已获授权,分别是美国的9.23倍和12.45倍。
这些领域,中国AI仍需追赶
DeepSeek的横空出世,让全球看到了中国AI技术的潜力,但这场爆火背后,业界仍需直面与美国AI产业的差距。这既体现在AI企业数量、技术、算法等显性维度,也体现在创新土壤与生态体系的深层结构之中。
根据《全球数字经济白皮书(2024年)》,截至2024年一季度,全球AI企业中美国占34%,而中国仅占15%。尽管中国AI企业数量不少,但与美国相比仍有较大差距。
上述报告还显示,截至去年7月,全球人工智能大模型有1328个(包含同一企业、同一模型的不同参数版本),美国大模型数量位居全球第一,占44%,位居第二的中国大模型数量占比为36%。
而在AI独角兽规模中,在2023年到2024年第一季度,全球AI独角兽已有234家,新增数量为37家,占新增独角兽总量的40%,其中,美国AI独角兽120家,中国AI独角兽71家。
AI目前仍是高度依赖资金投入的烧钱行业,在投融资方面,中美存在不小差距。
过去一年里,全球AI领域投资呈现爆发式增长,CB Insights报告显示,去年全球 AI 领域融资总额达1004亿美元,同比增长79.61%,占全球融资总额的69%。其中,美国依然是AI投资的主要力量,AI初创企业融资额约占全球70%,以伊隆·马斯克的xAI、OpenAI和Anthropic等为代表的美国AI公司获得了数十亿美元的巨额投资。中国在2024年的AI初创企业融资额仅占全球融资额的7%,远远低于美国。
一位聚焦中美市场的AI创业者告诉第一财经记者,目前美国一级市场仍是繁荣的状态,一方面表现在VC基金绝对数量多,另一方面表现在创投生态完善。从pre-seed一直到A轮甚至B轮,美国VC们形成了一条“流水线”似的投资孵化链条,为早期创业公司保驾护航,提供了更多的确定性。
另一位AI创业者对记者举例,自己在硅谷观察到,一些AI初创团队的创始人来自斯坦福、MIT 等名校,通常三五人组成小团队、开发一款产品,并构建一个宏大故事,美国投资人态度宽容,即使团队商业路径还未想清楚,也能拿到 50~80 万美元的种子轮融资,而在国内同阶段可能很难达到这种规模。此后在天使轮阶段,即便商业化尚未完善,也能拿到 500~800 万美元的投资。
在此前为数不多对外发声中,DeepSeek创始人梁文锋提到,他的团队不会过早设计基于模型的应用,而会专注在大模型上,目标是做研究、做探索。此前DeepSeek也在找不同出资方谈,但接触下来感觉很多VC对做研究有顾虑,VC有退出的需求,希望尽快做出产品商业化,而按照DeepSeek优先做研究的思路,很难从VC获得融资。
刘知远也以DeepSeek为例,称这是一个非常技术理想主义、以AGI(通用人工智能)为梦想组建的团队,拥有一个由技术长期主义推出来的结构。“中国已经到了这样一个阶段,需要有更多像DeepSeek这样的团队,但是又不像DeepSeek这么有钱,能不能让他们踏踏实实地做一些创新?这非常值得我们思考。”
“我们需要更多的DeepSeek”
DeepSeek的爆火并非终点,而是中国AI从单点突破迈向“系统能力构建”的起点。
大模型生态社区OpenCSG(开放传神)创始人陈冉对记者提到建设生态的迫切性,有了模型,需要建生态。“单点有了,但没有面,没有网状生态。”
高雪峰同样认为,在基础算法研究的沉淀上,在大生态圈的建设方面,以及在硬件基础设施的创新与追赶方面,我们都需要继续付出更多的努力。
他表示,DeepSeek将普惠 AI 的基准水平拉齐到了最前沿的水准。当全球越来越多用户, AI 技术生态就会明显倾向国内优秀开源模型,“可以明显看到,普惠 AI 的风已经在中国吹响,各个城市的大中小型企业都在寻求用 DeepSeek的开源技术来实现自身的智能化场景,这会对模型甚至硬件的发展带来不可估量的正向影响。”
高雪峰认为,当国内真正涌现出非常多具备行业特定推理能力的优秀模型与行业知识体系时,我们会真正具备与任何领先的 AI 技术竞争的实力,因为国内在数据整合,知识整合的方面有先天优势。
“雪球就这么滚起来了”。盘古智库学术委员、FutureLabs未来实验室首席专家胡延平对第一财经记者提到,DeepSeek引爆市场带来巨大的信心提振,有助于接下来形成良性的开源生态循环, 而接下来一个重要的方向是国产算力要能够跟上,形成生态软硬件协同。
此外,从技术创新的角度看,肖仰华认为,关键不在于我们是否属于第一阵营,而在于是否是第一。
“想要与海外顶尖模型竞争,在效果上接近的同时,能否做到成本更低、服务更优、响应更快、场景适配更好也很重要。”肖仰华对记者表示,在达到当前性能接近的成果之后,国内模型已具备与头部模型竞争的可能性,但还要看很多其他因素。
“AGI容易形成类似于差之毫厘、失之千里的效应,即使在某个领域以微弱优势领先,但AI是一种基础能力,在千行百业无处不在的应用中,会放大这一微弱的领先优势。”因此,国内模型并不能满足于现阶段的成果。
他同时也认为,AI是全方位的,“例如在具身智能、在千行百业的应用,我们的亮点仍然不多,但是美国已经取得了很多世界级的成果。”他补充道,“我们还需要更多的Deepseek。”
“此前,国内外大模型公司都在追随OpenAI,DeepSeek-R1追上o1后,国内面临的下一个问题变成了,下一步需要自己走一条全新的路或找到全新的创新点。这是未来看中美差距的关键点。”张俊林说。
开创性的突破也需要容忍失败的勇气。张俊林提到,国内存在做原始创新的可能性,前提是有这种企业文化:不着急赚钱,在宽松环境下做各种尝试。目前看,国内只有DeepSeek有这种环境,但如果其他企业能复刻这种环境,将推动国内大模型团队创新甚至反超OpenAI。
肖仰华认为,市场投入结构和效率或许需要改变。
他对记者提到,中国在AI方面的资源、资本投入并不少,但主要是自上而下的规划和创新,作为辅助的是民营企业和民间投入的科技创新。
“此次Deepseek的成功,让我们意识到,来自民营小微企业等市场主体自发地创新难能可贵,可能是整个国家科研科技创新体系中非常宝贵的一分子。” 肖仰华说,优化投入效率和投入结构很重要。初创企业、小微企业和民营企业是具有创新活力的,是他们的好奇心和创造力成就了这次突破,全社会需要“呵护”这种创新。