搜狗要做语音交互的“知音”,人工智能战略布局再升级

语音争夺战已经缓缓拉开序幕。原因?在许多领域,它都比键盘越来越有存在感。

享有“互联网女皇”之称的玛丽•米克尔在2016年的互联网趋势报告中,213页的演示文稿有23页都在讲语音。她认为,语音正在被重塑,成为人机交互的新范式,不仅语音搜索正在成为搜索的重要分支,语音交互在各种垂直领域的应用也在日益变多。

一边是女皇预测语音会成为核心交互方式,一边是科技公司在这一领域持续大力投入。

1、搜狗“知音”的应用场景和市场价值

8月初,搜狗语音发布了不仅“能听会说”,还具有“能理解会思考”的智能语音交互引擎技术“知音”,刷新了外界对于人工智能技术发展的认知。首先,“知音”解决了用户在说话过程中因语速过快而导致的吞音问题,语音识别错误率相对下降30%以上,语音识别速度提升3倍。其次,“知音”能够在语音交互的过程中支持用户修正错误的识别结果,用户可以使用自然语言进行改错。

据搜狗CTO杨洪涛介绍,搜狗从2012年开始研发智能语音技术,并在2013年开始进行深度学习。目前搜狗的智能语音技术已经成功应用到搜狗的全线产品中,随着搜狗在自然交互与知识计算方面的不断完善,加之与行业内其他领先企业的深度合作,“知音”将会布局到更多的终端入口,在物联网、车联网、人工智能等各个方面以“任务+应用”的形式在特定场景上发力,如汽车和智能家居。

不过,搜狗的智能语音技术不是一个卖技术的商业模式。搜索引擎公司在背后能够提供的不仅仅是语音交互,它本质上是技术应用对企业和用户产生价值的一个过程。对信息的掌握和服务的整合产生的价值,将会极大的满足和促进市场的需求。

2、为什么说搜狗公司本质上是一家人工智能公司

搜狗公司并不是要“研发”人工智能,它本身就是做人工智能的公司。

从产品上,搜索引擎其实是人的大脑的外延,搜索引擎要理解用户的需求,在海量的信息里找到答案;搜狗的产品矩阵丰富,数据和技术实现了深度结合。”知音“的底层,就是搜狗拥有的国内最大规模的语音语料。

从技术上,人工智能近十年来本质上是机器学习技术的发展,搜狗拥有的服务器数量、运算能力、积累的数据,让它成为人工智能技术的全能选手,诸如自然语言理解、舆论语音识别、知识图谱都是搜索引擎里大量使用的技术。

搜狗现在一天可以产生12万个小时的语音,一年产生出来的数据就将近5千万小时的数据。用搜狗自己的话说,“这块技术无论从人才储备还是数据积累,搜狗都足以笑傲行业。”

3、未来三到五年的重点方向:自然交互+知识计算

搜狗两个核心产品,一个是输入法,一个是搜索引擎。前者是信息输出,后者是信息获取。但光靠打字是有瓶颈的,尤其在万事万物联网之后,需要更多的设备进行交互,在表达方式上就会从文字走向语音。

自然交互和知识计算是整个交互引擎中研发难度最大、也最能体现差异化的部分。能否把自然交互和知识计算做好,是衡量搜索引擎的产品体验和技术水平的重要标尺。自然交互,指的是让机器能够很好地理解人的自然表达,搜狗智能语音技术就是自然交互工作的一种。知识计算,指的是要把互联网上海量的信息、知识提取、呈现和存储,而且能做运算和推理,辅助用户做出更好的决策。

搜狗对人工智能的“痴迷”,可以一直向上追朔到公司掌门人身上。搜狗CEO王小川是前沿科技的忠实拥泵。今年3月,当谷歌人工智能AlphaGo以4:1击败韩国棋手李世石,王小川宣布全公司放假一天,甚至将那天定为搜狗的“狗胜节”。当微软HoloLens出来的时候,他也第一时间发表对产品和行业的看法,观点鲜明又不乏理论支撑。

王小川曾在知乎的一篇贴子里写道“不要用评价人的方法来评价机器的人工智能的能力,完全是不同的模式。”他还援引老罗的话称:“人工智能就像一列火车,它临近时你听到了轰隆隆的声音,你在不断期待着它的到来。他终于到了,一闪而过,随后便远远地把你抛在身后”。

随着人工智能浪潮的来临,以及物联网场景下应用需求的不断扩大,产业规模将持续快速增长。搜狗适时推出“知音”引擎,不仅有利于其在即将迎来的行业爆发的竞争格局中占得良机,对整个智能语音行业的技术革新也具有深刻意义。

(下载iPhone或Android应用“经理人分享”,一个只为职业精英人群提供优质知识服务的分享平台。不做单纯的资讯推送,致力于成为你的私人智库。)

文章所涉及判断和结论为作者个人观点,并不代表经理人分享立场。