DeepSeek低调上新:友好度跃升
来源:21世纪经济报道21财经APP作者:孔海丽2025-03-26 12:36

DeepSeek低调发布了DeepSeek-V3模型的更新版本——DeepSeek-V3-0324。

没有主动传播,但引起了AI行业的一阵波澜,一个值得关注的信息点在于,该版本仍然基于V3的模型,改进训练方法后,大幅提高了推理类任务的表现水平,在数学、代码类相关评测集上取得超过GPT-4.5的得分成绩。

多维度性能改进

DeepSeek-V3-0324参数量为6850亿,较上一版本的6710亿略有增加。模型在代码、数学推理等能力上实现了提升,尤其在代码领域表现突出。在Aider的多语言基准测试中,DeepSeek-V3-0324成绩达到55%,较前代版本明显提升,成为仅次于Sonnet3.7的非推理类模型第二名,代码能力甚至可与Claude 3.7 Sonnet相媲美。

亲民部署与开源升级

除了性能提升,DeepSeek-V3-0324在部署方面也表现出优势。该版本模型采用宽松的MIT开源协议,且可直接部署在M3 Ultra的Mac Studio上,这意味着大模型开发应用的门槛更进一步降低。苹果机器学习工程师Awni Hannun 基于MLX框架和4-bit量化,在 512GB M3 Ultra上实现了超过20 token/s的运行速度,将模型磁盘占用空间减少到352GB。

相比之前的自定义许可证,新协议还支持开发者自由修改、分发模型,支持模型蒸馏和商业化应用,进一步推动了AI技术的共享与创新。

冲击行业格局

从国内市场来看,AI领域“六小龙”在DeepSeek的冲击下出现分化。Quest Mobile1月数据显示,当月DeepSeek日活超越豆包,Kimi退居第三,月之暗面受到的冲击较为明显。而腾讯因全面拥抱DeepSeek,在基础模型领域实现追赶。

在国际市场,DeepSeek的技术突破也引发了诸多讨论。英伟达因DeepSeek的热度,股价震荡下行,投资者担忧DeepSeek的技术进步会降低市场对英伟达昂贵硬件的需求,以至于黄仁勋近日在GTC大会上特意强调:“DeepSeek带来的并不是硬件需求的减少,反而会推动对强大硬件的需求。”黄仁勋话音刚落,传来腾讯增购数十亿元芯片的消息,这些需求主要就是包括布置DeepSeek在内的大模型带来的。

与此同时,业内共识在于,DeepSeek的火爆,表明中国在基础设施软件工程等领域取得了领先地位。

此次DeepSeek-V3-0324的更新,并非市场此前期待的DeepSeek-V4或R2。但从发布时间和技术特点来看,市场猜测,DeepSeek-R2有可能在不久后上线。R2有望进一步提升模型的推理能力,持续改写AI产业的竞争格局,推动各行业智能化变革走向深入。

责任编辑: 胡青
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换