智谱开源年第一弹:开源首个能生成汉字的开源文生图模型CogView4
来源:证券时报网作者:周春媚2025-03-04 13:20

3月4日,国产大模型创业公司智谱开源首个支持生成汉字的开源文生图模型CogView4。据悉,CogView4在 DPG-Bench基准测试中的综合评分排名第一,在开源文生图模型中达到SOTA(State-Of-The-Art,是指在某一领域或任务中,某个模型或方法达到了当前最优的性能水平)。

综合来看,CogView4具有两大技术领先性。首先是支持中英双语提示词输入,擅长理解和遵循中文提示词,是首个能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。

例如,在由CogView4生成的其中一张图片案例中,一只可爱的小猫嗅着花香,图片中出现了“早安,morning”的中英文词语组合。CogView4能够将中英文字符自然地融入画面,使海报、文案配图创作更加便捷。

此外,CogView4擅长理解和遵循中文提示词,例如能够画出古诗文中的意境。在“野径云俱黑,江船火独明”“好雨知时节,当春乃发生”等诗歌提示词下,CogView4能够准确地生成富有中国古典韵味的意境图片。

截屏2025-03-04 12.47.30.png

其次是支持输入任意长度提示词,能够生成范围内任意分辨率图像,不仅使用户创作更加自由,也提升了训练效率。例如,用户不仅可以用故事作为超长提示词,生成四格漫画,还能使用几百字的超复杂提示词,生成精细的画面,更能够契合用户的创作需要。

此外,CogView4也是首个遵循 Apache 2.0协议的图像生成模型。据了解,Apache 2.0协议允许开发者自由使用、修改和分发软件,是开源领域最宽松的一种协议模式。最新的CogView4-6B-0304版本将于3月13日上线智谱清言。

记者注意到,昨日智谱宣布完成最新一笔金额超10亿元人民币的战略融资时,同时宣布2025年将是智谱的开源年。作为国内最早的开源大模型公司,智谱表示,公司始终致力于推动AI普惠,接下来还将陆续开源基础模型、推理模型、多模态模型、Agent模型等。

校对:吕久彪

责任编辑: 孙孝熙
声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担
下载“证券时报”官方APP,或关注官方微信公众号,即可随时了解股市动态,洞察政策信息,把握财富机会。
网友评论
登录后可以发言
发送
网友评论仅供其表达个人看法,并不表明证券时报立场
暂无评论
为你推荐
时报热榜
换一换
    热点视频
    换一换