今年是中国改革开放四十周年。改革再出发,风起好扬帆。值此改革开放四十周年之际,《证券时报》推出“壮阔东方潮改革奋楫时”大型专栏,邀请政府部门官员、知名专家学者和行业领军人物献计献策,涓滴成流,汇聚成新时代改革开放的磅礴大潮。

第20期“改革开放同龄人”王小川:享受变革 创造新的时代

王小川,现任搜狗首席执行官(CEO),前搜狐高级副总裁兼首席技术官(CTO)。全国政协委员、九三学社中央委员。他以创新为己任,先后发明了5亿多用户使用的搜狗输入法、搜狗搜索等互联网标志性产品,被公认为中文信息化的重大突破。

第20期 “改革开放同龄人”王小川:享受变革 创造新的时代

王小川,现任搜狗首席执行官(CEO),前搜狐高级副总裁兼首席技术官(CTO)。全国政协委员、九三学社中央委员。他以创新为己任,先后发明了5亿多用户使用的搜狗输入法、搜狗搜索等互联网标志性产品,被公认为中文信息化的重大突破。

参与互联网建设

1999年,还在读大三的我,开始参与到互联网信息技术的建设当中来。

那年端午节,“校友录”的三位创始人在学校里找到我,让我去他们的团队做兼职。先是花了8个月,把校友录的新闻板块建立起来,当时网页浏览量每天能达到4000万,成为了仅次于三大门户的中国第四大网站。随后我又接到了新的任务:为ChinaRen做站内搜索系统。当时我组织了一个8人小组,花了3个月的时间做出了“孙悟空”搜索系统,提供网站搜索、网站排行榜、关键词查询、域名查询等服务,成为中国首个具有语义分析能力的提问式搜索引擎。这是我和搜索系统的首次“结缘”。那时候,自己完全沉浸在自己开发网站的乐趣中,心无旁骛。

到2000年10月底,ChinaRen被搜狐收购,我也就成了搜狐的员工,只是因为还没毕业,所以依然是兼职身份。2003年9月硕士毕业之后,我正式加入了搜狐。有一天,老板张朝阳把我叫到办公室,问我:“你以前做‘孙悟空’,现在重新开发一个独立的搜索引擎,一年时间能不能搞定?”

于是我开始组建搜狐研发中心,正式开发搜索引擎。2004年的8月3日,我们正式推出了拥有独立知识产权的搜索引擎——搜狗。

在挑战中成长

搜狗的发展并不是一帆风顺的。搜索是一个竞争激烈的赛道,自2003年搜狗成立以来,我们经受了诸多的质疑,但我们将很多个不可能变为可能,这中间经历了五次突破。

第一个是技术突破,在2003年建立研发中心,诞生搜索。我们当时面临的问题是,搜狐基本上没有一个完整的技术体系,老板只给了6个名额,我把这6个全职名额替换成了12个清华兼职学生,并且只用了11个月的时间研发出了搜狗搜索引擎。

第二个是产品突破,在2006年发布搜狗输入法。当时搜索流量上不去,我们以为是产品做得不够好,但在做搜索的过程中我们积累了大量的词库,具备了做输入法产品的能力,在这种情况下,我们研发了搜狗输入法,产品一经推出就得到市场上很大的好评,让我们重拾信心。后来输入法成为了国民输入法,深受网民喜爱,并被公认为中文信息化的重大突破。

第三个是渠道突破,我们在2008年推出搜狗浏览器。输入法刚推出时虽然市场反响很好,但第一年市场份额只有2%,这件事让我开始反思,看来光有技术有产品是不够的,酒香也怕巷子深,渠道也很重要。于是我们组建了BD(商务拓展)团队,通过在华军、太平洋下载站等多个渠道进行推广,使得输入法的市场份额持续上升,第二年就达到了40%,至2009年更达到了70%。输入法的成功推广给了我很大启发,让我明白,好的产品是基础,但还需要借助渠道的力量,让用户知晓、使用和接受。由此,我想到用浏览器这一渠道把搜索推荐给用户。于是我们研发了搜狗浏览器,利用“输入法-浏览器-搜索”三级火箭模式,成为了搜索行业追赶破局的一个成功模式。

第四个是体制突破。2010年,搜狗分拆独立,从一个部门成长为一个公司,搜索份额与收入也开始爆发增长,而这样的高速增长持续至今。

第五个是资本突破,2013年,我们引入腾讯注资。腾讯搜搜业务和其他相关资产并入搜狗:包括搜狗搜索成为腾讯网站、QQ导航在PC端默认的搜索引擎;同时,搜狗搜索成为移动QQ浏览默认搜索引擎;腾讯还用其他多个渠道增加搜狗全平台搜索流量。从此,电脑端实现三分天下格局,移动搜索方面,搜狗也成为了行业唯一的颠覆者。

回眼望去,已经有不少搜索公司退出了赛场。而我们历经五次突破后,已成长为仅存的能在电脑端和无线领域同时攻城略地的挑战者。

坚持发力AI

我们两年前还开始了面向未来的布局。

毫无疑问,未来的颠覆性技术力量是人工智能(AI),而人工智能桂冠上的明珠是对语言的处理,这是人工智能里最难突破也最有价值的部分。从狭义的人工智能到广义的人工智能,语言是中间的交界点,因为语言是通用人工智能时代推理和知识的载体,语言可以承载我们的感知,将听觉、视觉获取的信息转化为文字。它不仅是人机交流的核心,也是承载知识和思考的关键所在。此外,文字本身也能建立问答、对话和翻译的能力。

搜狗是为语言理解而生的,除了搜索引擎对语言理解有无尽的追求,搜狗更有市场份额绝对领先的输入法产品,也专注在自然语言的计算与处理。正因为有输入法和搜索,我们具备了啃这块骨头的能力。

搜狗的AI布局非常清晰且专注:以语言为核心,基于对自然语言的交互和计算,我们希望将搜索升级到问答系统,将输入法升级到对话系统,并通过翻译将中文世界与全世界连接。

在2016年4月,搜狗还向清华大学捐赠1.8亿元,联合成立了天工智能计算研究院,用以研发人工智能的前沿技术。这些投入与专注,带来了搜狗在语音识别、语音合成、图像识别、机器翻译、自然语言理解、智能问答等方面的持续突破。

语音方面,作为国内第一大语音输入应用,搜狗输入法的每日语音输入峰值已超3.6亿次,识别准确率超97%;图像方面,搜狗OCR图像识别准确率超到96%,在2018年国际顶级赛事Pascal VOC中以77分成绩打破世界最好成绩;世界机器翻译学术大赛2017WMT上,搜狗获得中译英、英译中双向机器翻译全球第一;2018NLPCC比赛shared task 4-spoken language understanding,搜狗语义理解技术获得第一名。

搜狗不仅在AI技术积累上取得了阶段性进展,更率先推进AI的实用化落地,尤其在翻译领域。在2016年第三届乌镇世界互联网大会上,我们发布了全球首个商用神经网络机器翻译系统——搜狗机器同传,随后为包括GMIC(全球移动互联网大会)、全球人工智能技术大会等数百场国内外会议提供了支持;凭借翻译技术,我们推出了全球首个跨语言检索引擎,在英文搜索中我们能够对英文结果网页进行全文的中文翻译,目前还支持对日语和韩语的信息检索;在手机输入法里我们支持用户在聊天场景下语音和文字输入的翻译;2017年发布搜狗翻译APP,支持语音翻译、文字翻译、图片翻译等多种翻译形式,仅半年时间就成为行业头部产品;今年更是推出了搜狗旅行翻译宝与搜狗录音翻译笔两大AI战略硬件。