昨夜,美芯片股暴跌!DeepSeek发布新模型,白宫也发声!
来源:证券时报网作者:周春媚2025-01-28 08:16

AI永不眠。‍

由于DeepSeek的R1大语言模型引发了华尔街对于美国公司模型成本的质疑,以及人工智能股票泡沫破裂的恐慌,美股掀起科技股抛售潮。芯片巨头英伟达当日收盘股价暴跌约16.86%,单日市值蒸发约6000亿美元,博通下跌17.4%,超威半导体公司下跌6.37%,美光科技下跌11.67%,台积电跌13.23%,微软下跌2.14%。此外,人工智能领域的衍生品,如电力供应商也受到重创,美国联合能源公司股价下跌20.85%,Vistra的股价下跌28.33%。

白宫人工智能和加密货币总管David Sacks在X上发帖称,DeepSeek R1的表现显示人工智能竞争将非常激烈,也证明美国总统特朗普废除拜登行政命令是正确之举。Sacks说拜登用行政命令束缚了美国的人工智能公司。他还说:“我对美国充满信心,但我们不能自满”。

在用R1模型震撼硅谷和暴击华尔街之后,DeepSeek又在深夜放大招。1月27日晚间10点左右,梁文锋在社交平台上X上表示,DeepSeek新版本即将发布。三个多小时后,人工智能开源社区HuggingFace就显示,DeepSeek发布了参数大小从10亿到70亿不等,名为Janus-Pro和JanusFlow的一系列开源多模态模型。

本次发布的新模型,重点在于文生图能力方面。其中,70亿参数的Janus-Pro-7B在GenEval和DPG-Bench基准测试中,以80%和84.2%的准确率测试结果,击败了OpenAI的DALL-E3和StableDiffusion模型等顶尖的图像生成模型。据了解,该项目采用MIT许可证开源,开发者可以通过开源社区GitHub获取完整代码。DeepSeek团队还表示,Janus-Pro的简洁设计和卓越性能,使其有望成为下一代统一多模态模型的重要选择。

据DeepSeek发布的报告介绍,Janus-Pro先进模型是此前发布的Janus的改进版本。相较于Janus,Janus-Pro包含了优化的训练策略、扩展的训练数据以及扩展到更大的模型规模。通过这些改进,Janus-Pro在多模态理解和文本到图像指令跟随能力方面取得了显著进步,同时提升了文本到图像生成的稳定性。

具体来说,Janus-Pro作为一种新颖的自回归框架,将多模态理解和生成统一起来,将视觉编码解耦,以实现多模态理解和生成。它通过将视觉编码解耦为单独的路径来解决以前方法的局限性,同时仍然使用单一、统一的转换器架构进行处理。

值得注意的是,DeepSeek透露,对于1.5B/7B这两个参数的模型,整个训练过程在16/32节点的集群上进行,每个节点配备8块NvidiaA100(40GB)GPU,1.5B/7B模型的训练时间约为7/14天。也就是说,DeepSeek花了两周在256块英伟达A100,就训练出了击败了OpenAI的DALL-E3和StableDiffusion的模型。

DeepSeek还在报告中展示了具体的效果。例如,使用“一条金色的寻回犬安详地躺在木质门廊上,周边铺满了秋天的叶子”和“一个有雀斑的年轻女人戴着一顶草帽,站在一片金色的麦田中”,Janus-Pro-7B都能够准确捕捉提示中的语义信息,生成合乎逻辑且连贯的图片。不过,尽管包含大量图像细节,Janus-Pro-7B目前仅支持生成分辨率为384×384的图像。

除此以外,Janus-Pro-7B还具备图像识别功能。根据展示的案例,当给Janus-Pro-7B提供一张图片,并问它“猜猜这是哪里”时,Janus-Pro-7B能够根据图片特点猜测其中展示的是中国杭州的西湖,特别是著名的三潭映月岛,并进一步分析称,“图片中的建筑是三潭印月的亭子,周边是平静的湖水,远处是连绵的山脉。西湖是中国著名的旅游景点之一,以其美丽的自然景观和丰富的历史文化而闻名。”

事实上,DeepSeek一直在多模态领域进行探索。去年,DeepSeek就推出了一种基于自回归的多模态理解与生成统一模型Janus,将视觉编码解耦,以实现多模态理解和生成。进入2025年,公司将Janus进一步升级至Janus-Pro。而在此前接受媒体采访时,当被问及公司在实现通用人工智能的过程中有哪些坐标,梁文锋表示DeepSeek押注了三个方向,一是数学和代码,二是多模态,三是自然语言本身。

目前,DeepSeek的C端应用主要聚焦于文本能力,还无法生成图片或者识别图像。记者昨天曾让DeepSeek生成一幅春节贺岁图片,但DeepSeek仅给出了图片创作的色调、原色等建议,并表示它还无法直接生成图片,“你可以根据此描述使用AI绘图工具如DALL·E、MidJourney等生成”。随着Janus-Pro的发布,用户或许很快也可以使用DeepSeek进行图像、视频等领域的创作。


校对:陶谦

责任编辑: 阙福生
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换