-
2025-07-04 12:35
投资者_1500377049000:董秘您好近期公司披露了密集减持公告,有媒体报道公司主营业务二季度出现问题DS等AI新技术减少了数据标注的必要性,公司高管股东实控人密集减持是不看好公司未来发展么?二季度公司业绩增速能保持么?公司密集减持为何不考虑找机构股权询价转让方式减少对二级市场冲击,而是要二级市场跟大宗交易迫不及待减持呢。希望公司考虑到广大股东利益,股东高管实控人个人资金同时都需要这不是巧合吧?
海天瑞声:尊敬的投资者,您好:1、公司股东及高管的减持行为均严格遵守证监会及交易所相关规定,已提前披露减持计划,且减持比例、方式等符合监管要求。本次减持主要系股东自身资金需求。公司实控人及管理层始终坚定看好行业前景,并持续通过战略投入巩固核心竞争力。 2、DeepSeek等AI新技术并未减少数据标注的需求,反而推动了行业向更高阶、更专业化的方向发展: (1)需求升级:大模型产业化加速,在金融、医疗、法律等专业领域,高质量标注数据的需求持续扩大,需要行业专家深度参与; (2)模态拓展:DeepSeek为大语言模型,为文本模态,但未来AI正从单一文本向多模态(语音、视觉等)演进,也会催生增量数据需求; (3)质量要求:随着模型精度提升,对数据标注的准确性、一致性要求更高,数据标注难度增加。 3、公司上半年经营情况正常并持续向好,具体财务数据请以后续披露的定期报告为准。4、公司股东在减持方式上综合考量了流动性、效率及市场影响。本次减持采用集中竞价和大宗交易两种方式,其中大宗交易并不通过二级市场减持,不会直接影响二级市场价格。5、公司始终将中小股东权益置于重要位置,近期已通过分红等方式回馈投资者。后续也将加强减持管理,尽可能减少减持带来的对二级市场的影响。再次感谢您的建议!公司管理层将继续勤勉尽责,以扎实的业绩回报投资者信任。
-
2025-05-23 13:35
投资者_1635060718000:Google Meet作为谷歌旗下的视频会议平台,近年来通过深度融合AI技术持续升级功能,尤其在2025年开发者大会上推出了多项创新功能,成为远程协作领域的重要工具。尤其是AI驱动的实时语音传译,并保留原说话者的音色、语调和情感。该功能通过AI生成与用户声线匹配的翻译语音,实现跨语言对话的自然流畅。公司是否提供此大模型的数据?或者公司有对同声传译相关的业务吗?
海天瑞声:尊敬的投资者,您好:Google一直以来是公司的重要客户,公司确实有为其提供过多语种智能语音相关的数据产品或服务,但公司相关数据是否用于其Google meet,还请以Google发布的相关信息为准。需要特别说明的是,我司虽不直接开展同声传译业务,但通过提供的多语种语音数据,能够并已经有效帮助提升全球多款头部AI模型的多语种语音识别能力,这些能力可被应用于同声传译等场景。感谢您对公司的关注。
-
2025-04-03 16:21
投资者_1743393072663:贵公司有没有开发知识库(联网搜索)产品?
海天瑞声:尊敬的投资者:您好,我司已开展知识库方向的研发工作,未来择机考虑投入商业场景。感谢您的关注!
-
2025-04-03 16:21
投资者_1675823816000:请问董秘,美国对中国加征关税后,对我们公司的海外业务有何影响?
海天瑞声:尊敬的投资者:您好,海天瑞声目前已经有3个海外子公司:美国子公司、新加坡子公司、香港子公司。公司的AI数据业务在海外市场的推广可以基于多个海外子公司完成,从未、也将不受美国新关税政策的影响。感谢您的关注!
-
2025-03-12 17:58
投资者_1741180456757:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公司计划在未来再进行部署,计划将DeepSeek应用于什么具体的业务呢?我们投资者非常期待您的回复,谢谢!
海天瑞声:尊敬的投资者:您好,目前公司已经完成DeepSeek本地化部署,主要用于公司数据内部的生产业务,辅助公司进行数据预标注,进一步提升数据生产效率,降低处理成本。感谢您的关注!
-
2025-02-21 11:31
投资者_1583225085000:国家数据局明确公共数据需‘供出来、用起来’,并发布智能网联汽车等20个示范场景。公司作为AI训练数据龙头,是否已通过技术平台(如自动化标注)或合资公司(如河北数海)参与相关场景建设?在公共数据授权运营的政府指导价框架下,公司如何通过降本增效提升盈利能力?
海天瑞声:尊敬的投资者,您好:(1)目前公司数据产品/服务可服务于智能驾驶、内容生成、机器人、智慧医疗、智慧教育、智慧金融等22种创新应用场景。智能驾驶一直以来都是公司重要业务板块。以智能驾驶为例,公司在数据处理平台以及算法上进行持续投入,目前已具备3D点云语义分割、BEV(鸟瞰图)、千万大点云以及4D标注等各类行业前沿数据标注能力,同时平台集合各类前沿算法,在数据处理工具迭代以及算法赋能方面均处于行业领先水平,目前,公司智能驾驶服务客户数量已经超过90家。(2)公司持续进行算法投入,积累了各领域的算法模型超过200个,应用于公司内部的数据生产过程,旨在提升数据处理效率、形成规模效应,进而实现降本增效。
-
2025-02-21 11:31
投资者_1583225085000:DeepSeek的低成本API策略可能推动更多中小企业使用大模型,进而催生数据标注的长尾需求。请问公司是否已通过平台化、自动化技术降低服务成本,以捕捉此类增量市场?目前中小客户收入占比是否有提升趋势?
海天瑞声:尊敬的投资者,您好:(1)公司持续进行算法投入,积累了各领域的算法模型,应用于各类数据生产过程,旨在提升数据处理效率、形成规模效应,进而实现降本增效,以更好获取市场认可,捕捉增量市场。(2)相关收入数据,还请您参考公司即将发布的2024年年度报告,感谢您的关注!
-
2025-02-21 11:31
投资者_1583225085000:DeepSeek近期发布的模型强调多模态数据与垂类场景的深度适配。请问公司在智能语音、自然语言处理等领域积累的多语种、多音色标准化数据集,是否已针对此类大模型的训练需求进行优化?未来是否会推出适配MoE(混合专家)架构的专项数据产品?
海天瑞声:尊敬的投资者,您好:(1)公司在智能语音、计算机视觉以及自然语言等多模态领域积累深厚,公司相关数据集产品和服务已为国内外众多多模态大模型的研发提供支持。(2)MoE等算法架构将会发挥其优势,进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。截至24年6月,公司已积累超过1,650个标准化数据集产品,可服务于各类大模型架构的开发;同时,公司也可提供大模型各类架构下的数据定制服务。
-
2025-02-21 11:31
投资者_1583225085000:DeepSeek-R1模型在规则性任务中减少了对标注数据的依赖,但公司强调垂类领域仍需高质量数据。请问公司在医疗、法律等专业领域的专家知识积累能否转化为与DeepSeek合作的差异化优势?是否已探索合成数据与人工标注的融合方案?
海天瑞声:尊敬的投资者,您好:(1)DeepSeek目前不是公司客户。目前,公司已为部分大模型厂商提供医疗和法律相关数据处理服务,相关数据处理经验将为公司拓展垂类标注服务奠定重要基础,在未来大模型向垂向拓展时,更好抓住市场机遇。(2)数据合成技术虽然可以作为数据采集的有效辅助,但也存在较强的局限性,会降低真实世界各类特征的训练效果,因此目前仅可作为数据采集的一种辅助方式。合成数据可以认为是人工智能行业发展到一定阶段的必然产物。从目前数据服务行业来讲,以计算机视觉场景为例,合成数据主要应用于某些高危的、罕见的corner case的模拟训练当中,但合成数据毕竟是由机器生成的虚拟数据,其数据质量以及真实性仍无法替代真实场景数据,因此按照目前的技术路线,绝大多数企业仍在使用真实场景数据进行模型训练。但公司会紧密关注合成数据技术的发展,根据最新的行业动态及时调整公司业务布局。
-
2025-02-21 11:31
投资者_1583225085000:公司是否评估过DeepSeek大模型(尤其是其推理优化与合成数据技术)对训练数据需求的影响?未来是否有计划针对DeepSeek的模型架构(如MoE、强化学习)开发定制化数据集,以提升双方技术协同性?”
海天瑞声:尊敬的投资者,您好:(1)Deepseek推出了一系列模型,其中V3模型依然使用了预训练、以及SFT等训练方式,其中预训练阶段的token使用量达到了14.8T,远超GPT4等同类可比大模型预训练阶段的数据使用量,且在后训练阶段也使用了一定规模的标注数据,这也更加说明海量以及高质量数据对于基础模型能力提升的重要意义。(2)关于让大家震撼的R1模型,基于目前的公开信息来看,其部分优势体现在推理类任务上,尤其是那些具备较强的规则性、可以推导的任务类型上,确实不需要大量的人工标注,但是对于其他领域(尤其是更为广阔的垂向领域)的复杂问题,依然需要观察,我们认为高阶的数据专家的参与依然非常重要。(3)此外,数据质量不仅影响模型获取和表达知识的能力,还决定了模型生成内容的风格和准确性,帮助DeepSeek实现了在输出端的文采能力提升。 其一,高质量数据可以提升模型表达和推理能力。优质数据包含准确、连贯且富有表现力的语言样本。例如,包含CoT数据可以引导模型在推理时进行反思,进而在生成回答时展现出清晰的逻辑和优美的语言表达。这正是DeepSeek模型能够生成既准确又具有华丽文风的关键因素之一。其二,高质量数据可以降低噪音和确保一致性。数据中的错误、噪音或不一致信息会导致模型生成内容出现语法或逻辑问题。高质量的数据则能有效减少这些问题,使模型更好地学习到语言规律,从而提高整体生成质量。 其三,高质量数据可以提升泛化能力。数据的多样性和全面性使得模型在面对不同领域和任务时都能生成高质量的回答。丰富且准确的样本帮助模型在多种场景下自如切换风格,无论是精炼的技术解答还是文采斐然的创意写作,都能游刃有余。(4)往未来看,MoE等算法架构会发挥各自优势,进一步助推模型向产业端发展,真正让大模型技术深入滲透到各个行业中,这一过程中必将凸显专业知识的直要性,需要更多数据、以及数据专家的参与,因此我们看好并期待未来大模型在各行业百花齐放的局面。