万众期待的R2还没来,但R1又变得更强了。
继两个月以前发布DeepSeek-V3-0324模型后,DeepSeek传来最新动作——完成了R1模型的小版本试升级。升级后的模型在官方网站、APP、小程序测试(打开深度思考)就能体验,API接口和使用方式保持不变,这意味着用户无需切换和进行任何操作,就可以感受和体验最新的R1模型。
与此前发布DeepSeek-V3-0324时同步披露模型细节,介绍包括推理、前端开发、中文写作、中文搜索等几个方面的能力优化不同,此次更新,DeepSeek官方并没有公布版本更新的具体内容。
但这一低调的“小版本试升级”背后,可能是一次“核弹级”的能力升级。据用户实测,更新后的R1编程能力有了明显提升,无论是网页生成、小游戏制作,还是复杂的绘图板Bug修复、图片画廊灯箱效果,R1都展现了极强的代码生成、理解和修正能力,甚至可以与最近发布的编程新王Claude4相媲美。
例如,有用户使用更新后的DeepSeekR1创建一个世界时钟面板,要求展示不同时区的当前时间并支持时区切换。更新版R1在审美和代码完成度上较之前的版本又上了一个台阶,制作出了效果相当惊艳的世界时钟面板。
此外,DeepSeek还出色地完成了包括制作"贪吃蛇"游戏前端页面、生成动态的星空夜景、创建一个科技资讯网站等多项任务。此外,还有网友在著名代码测试平台LiveCodeBench中表示,更新后的R1带来了远超预期的能力提升,与OpenAI最新的o3模型高版本不相上下。
对于大模型而言,编程能力具有极为重要的价值,也是各个顶尖大模型厂商竞相追逐的焦点。4月底,据外媒报道,OpenAI正在推进对AI辅助编程创业公司Windsurf的一笔30亿美元收购,若收购能顺利达成,将成为OpenAI迄今为止最昂贵的一次收购行动。业内人士分析,这一动作表明OpenAI旨在提升编程能力短板,从而与微软、Anthropic等具备强大编程能力的竞争对手抗衡。
此外,近期多家厂商都推出了新版模型,重点都放在编程能力的升级上。例如,谷歌5月初正式推出Gemini2.5Pro“I/O”特别版,回应开发者社区对实际编程和界面设计效能的强烈需求,谷歌DeepMind首席执行官更是盛赞其为“我们迄今构建的最强编程模型”。Anthropic公司在5月23日推出了ClaudeOpus4和ClaudeSonnet4新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步,更是以“自动写代码7小时”而刷新世界纪录,被誉为新“编程王”。
自从在今年春节前后爆火后,DeepSeek一直保持着低调的作风,而业界则一直关注并讨论DeepSeek何时将推出R2模型。4月底,有传闻称,其R2大模型的参数规模被曝达到惊人的1.2万亿,相比前代R1的6710亿参数几乎翻倍。此外,此前市场普遍推测R2将在5月份推出,但未获得官方证实,截至目前R2模型亦还未有推出迹象。
有分析指出,虽然DeepSeek低调地表示这是“小版本试升级”,但其模型能力的提升,放在OpenAI、谷歌、Anthropic等大模型公司,基本都会以全新一代的整数模型来命名并进行高调发布。DeepSeekR1升级版本编程能力的提升,展现了追赶国际一线水平的强大竞争力,意味着国内开发者可以直接使用,同时能获得更低成本、更适合中国用户需求的服务。
校对:姚远