随着DeepSeek的火爆,多家百亿量化也纷纷加入AI战局。
近日,量化巨头九坤携手微软团队成功复现DeepSeek-R1,还首次发现了语言混合(例如中英文夹杂)会显著降低推理能力等问题,引发市场关注。
另一量化巨头宽德则在2月24日发布了智能学习实验室人才招聘通知,宣称该实验室将朝着整个人工智能的星辰大海启航。
据券商中国记者了解,DeepSeek和梁文锋的横空出世,使得整个量化行业备受鼓舞,不仅在投资上能给客户创造收益,还可以进行科技创新。
九坤携手微软复现DeepSeek-R1
DeepSeek让整个量化圈都在摩拳擦掌。
近日,量化巨头九坤携手微软团队成功复现DeepSeek-R1。复现成功定义为:长思维链(Long CoT)能够自然涌现;跨领域ood泛化,比如在数学题上有显著提升。该团队在网上公开了论文,主要由微软亚洲研究院、九坤投资和其他独立人员合著。
据了解,该团队还首次发现了,输出长度与推理性能提升无关,语言混合(例如中英文夹杂)会显著降低推理能力,reasoning tokens(推理标记)确实有提升推理性能等多个问题。
值得注意的是,该团队还开源了完整的超参调优经验,RL算法设计,代码数据等。
“我们的Logic-RL团队主要成员,从上次小打小闹的三人组升级到了五人阵容,不过大家还都是大三大四本科生。新来的两位大佬为此工作作出了巨大贡献。”该作者在知乎上作完整的技术报告解读时表示。
值得注意的是,此前海外出现了一波复现DeepSeek的狂潮。回顾每次的复现过程,多个团队都发现了不同的规律和问题,比如来自清华、CMU和IN.AI的研究团队此前发现,可验证奖励函数对增长CoT至关重要,共同推动开源的DeepSeek不断强大。
据券商中国记者了解,九坤早就成立了AI Lab,一直以来都在致力于开放地参与前沿AI技术研究,不仅长期探索通用技术并推动其场景应用,还在多个细分领域开展了多元化研究拓展,全力加速AI在应用领域的落地。
公开信息显示,九坤在数据、算法、算力方面有技术储备和人才储备,自2020年起先后建立了人工智能实验室、数据实验室和水滴实验室,分别进行相关领域的研究,并于2021年与粤港澳大湾区数字经济研究院合作成立“九坤-IDEA”联合实验室,在数字金融领域探索合作与发展新模式。
宽德向AI的星辰大海启航
除了九坤以外,另一量化巨头宽德投资也正式下场入局AI。
2月24日,宽德投资在官方公众号发布了宽德智能学习实验室人才招聘通知,称该实验室将致力于实现超级科技助手,汇聚顶尖AI人才,专注于研发通用性超级助手,追求技术复利与持续性领先。
“WILL是宽德投资独立孵化的创业型实验室。始于但不局限于金融场景,WILL将朝着整个人工智能的星辰大海启航。WILL的使命追求以超级人工智能加速科学发现与技术发展。”宽德称。
从宽德发布的招聘公告来看,该实验室旨在寻找怀有科学理想且追求极致的顶尖AI研究者与工程师,主要招聘AI研究员和AI工程师,实习和全职皆可,地点为北京、上海以及远程。
值得注意的是,人工智能人才无疑是当下的香饽饽,不少量化机构不惜重金网罗。据某第三方招聘平台的信息显示,某量化大厂招聘AI Infra工程师负责人,开出了年薪可达500万元上下的薪酬。
据券商中国记者了解,宽德投资是近年来发展最为迅猛的量化巨头。过去两年,在量化行业最为惨淡之际,该私募仍然持续扩张,获得渠道的力推。
去年四季度,该私募的管理规模突破400亿元,晋级为行业新的六巨头之一。比如,在去年底的中证A500指增产品备案争夺战中,宽德投资一家就备案了20多只,几乎占据当时市场份额的一半以上。
创新需要技术理想和利润之上追求
DeepSeek和梁文锋的横空出世,让各行各业都相当振奋,尤其是量化行业备受鼓舞。量化机构们发现,他们不仅在投资上能给客户创造收益,还可以进行科技创新、甚至可以实现科技报国。
“最前沿的技术可以把各行各业都改造一遍,而量化投资就是前沿技术在资本市场的探索和实践——金融行业垂类模型应用。比如量化私募就是围绕资产管理做的金融行业垂类模型应用,比如银行券商可以围绕财富管理做金融行业垂类模型应用。”上海某量化私募负责人表示。
不过,该负责人也表示,“就目前来看,其他量化私募还处于刚刚布局阶段,宣传大于实质,和幻方这样躬身入局,创始人梁文锋全情投入完全不一样。梁文锋是一个极致的理想主义者,有着利润之上的追求,这样才能实现真正的创新。”
2023年4月,幻方宣布成立DeepSeek,探索AGI(通用人工智能,Artificial General Intelligence)的本质,多年以来,幻方坚持把营收的一大部分投入人工智能领域,建设领先的AI硬件基础设施,进行大规模的研究,探索人类未知的奥秘。
但不少人认为幻方要用“AI”炒股。当时幻方的CEO陆政哲回复券商中国记者表示,“其实我们做的比大家理解的大得多,AI方面我们很多积累,所以可以跨过去做大模型。我们本身就要做更大价值的事,要超越投资,却被人曲解成AI炒股。”
现在来看,DeepSeek的成功在意料之外,也在情理之中。梁文锋曾在给西蒙斯及其团队著作的书《解开市场的人》写的序言中表示,每当我工作中遇到困难时,“一定有一种方法可以模拟价格。”
对于所有入局AI的量化大厂而言,必须有着对AI的技术理想主义、情怀,有着超越利润之上的追求,才能有机会实现真正的创新。最后,用《模仿游戏》中一句经典的台词来鼓励所有致力于硬核创新的人,“有时候正是那些无人看好之人,成就了无人能及之事”。
校对:吕久彪