在人机交互发展的几十年中,几乎每十年就有一次重大革新;如今,智能手机带来的人口红利将尽,语音成为了人机交互的新范式。

记者:何婧/主编:张浩

深度报道/共3180字/阅读6分钟

项目名称:飔拓

主营业务智能人机交互系统研发商

融资情况:2015年获北京东方国狮基金天使轮投资,2016年获光谷人才基金A轮投资

关键词:人工智能、自然语言处理、语义理解、『Jimmy之父』

受访人:武汉泰迪智慧科技有限公司总裁助理张俊祺

语言智能是人工智能皇冠上的明珠

《圣经》中记载了这样一个故事,说巴比伦人想建造一座塔直通天堂,建塔之人都说着同一种语言,齐心协力,心意相通。没想到此举惊动了上帝,于是上帝改变并区别了他们的语言,使他们因语言不通而不得不放弃建塔的计划。后来人们把这座塔叫作『巴别塔』,而『巴别』的意思就是『分歧』。

随着人工智能时代的到来,机器翻译因其强大的语言转化能力一度被视为『重建巴别塔』之举。而人工智能中最重要的一个部分为认知智能,即机器对语言的理解、运用甚至推理能力,这一切都基于自然语言处理技术(NLP)。

当云计算、大数据、机器学习尤其是深度学习算法进一步发展,自然语言处理技术结合各个应用系统及垂直领域的NLP+时代一定是大势所趋。

武汉飔拓科技成立于2014年,据总裁助理张俊祺介绍,最初团队只有两位创始人,李成华博士与刘丽君博士,二人一同完成了从本科到博士后的学业。李成华更是从2004年就在从事自然语言处理、语义分析方面的研究,其后的学术生涯也都是攻克这方面问题,曾师从『人工智能之父』,马文·明斯基,可以说是在这一领域深耕已久。

飔拓创始人 李成华

公司成立伊始,李成华便收到了京东的邀请,希望他出席担任其深度神经网络实验室的首席科学家,负责京东智能客服机器人Jimmy的开发。考虑到进入京东这样的巨头企业,可以接触到行业内最尖端的技术,并拓宽国内的相关渠道,李成华接受了这个offer。完成了客服机器人Jimmy的研发后,在2016年初便回归了飔拓全身心投入自己的创业项目。

或许正是在京东的这段经历,让李成华看到了人机交互领域的市场延展性。

在人机交互发展的几十年中,几乎每10年就有一次人机交互的重大革新,从最初的物理手柄按键;随后以PC端为代表的,通过鼠标、键盘输入文字进行交互;而进入移动互联网时代,通过多点触控的方式在触摸屏幕上进行操作成为交互的主流方式;如今,智能手机带来的人口红利将尽,语音成为了人机交互的新范式。

技术本身是无法产生价值的,只有将技术融合进硬件产品当中才能形成市场。

于是飔拓在去年3月份推出了『智能语音交互平台』,将语义理解技术与以智能对话机器人为代表的消费级电子产品相结合,实现智能语音多轮对话,变革人机交互方式。

利用垂直场景打突围

纵观整个语义分析市场,虽然受行业天然的门槛限制,入局者似乎并没有那么多。但是也不乏图灵机器人、Pepper机器人这样林林总总的产品。『然而市场上大多数机器人只能完成单轮对话,无法形成交互氛围,想要解决这个问题首先必须要有垂直场景的设定。』

『人与人之间的交谈话题非常广泛,对于智力水平仅相当于5-6岁的儿童的机器人来说,很难掌握所有话题的交互。』因此飔拓在系统中对话题和语境作出了一定的限定,在系统中内置该语境中常会出现的对话,再针对该语境完善知识库。

其次,要完成多轮对话,仅仅是知识库的积累还远远不够。飔拓在平台中内置了一套多轮对话管理系统,让系统对人与机器的每一次交互进行记录,作为后续的语境基础。在此基础上,平台不仅可以进行上下文理解,甚至可以实现倾向性分析和语言匹配等功能。

多轮对话不等于是人和机器的自说自话,而是基于精准的语义和语境的理解。在这方面,飔拓有着得天独厚的技术优势。

飔拓核心成员之一曾是专攻机器阅读与编写的人工智能企业Maluuba的核心开发人员。据张俊祺介绍,『Maluuba是一家加拿大本土的初创型AI企业,去年被微软收购了。然而在2016年,他们就已经能够开发出一套接近自然人的阅读、理解能力的人工智能系统,他们这套系统在当时已经强于谷歌和Facebook的类似系统。』基于『机器阅读』技术,系统能够快速、精确的从文章中抽取问题的答案,形成自然的交流氛围。

无论是复合场景的应用还是精准流畅的多轮对话,都离不开扎实的语义理解技术做支撑。

最初人们通过两种独立的思路来进行自然语言处理,一种是基于人类语言规则的理性主义,另一种则是基于大量数据统计的经验主义。然而理性主义的鲁棒性极差,对于规则的标准度依赖性极高,对经验主义来说,又不可能无限量的获取语言数据进行统计学习。

因此,飔拓重构了整个交互系统,平台采用AlphaGO同类型的深度神经网络办法,构建大型神经网络集群,模拟出人类的思维过程,通过上万神经节点的交叉计算达成高精度的智能识别及应答效果,掌握了行业内领先的技术优势。再结合爬取、付费以及网络公开信息的调用,这三方渠道的数据。充分发挥了理性主义和经验主义方法的各自优点,完成数据的精准调用和高效转化。

实际应用方面,飔拓语义交互平台主要为硬件提供智能升级服务,例如智能家居、机器人应用、车载系统以及智能穿戴设备等。

当前,『飔拓智能语音交互平台』已经与软银、康力优蓝、穿山甲机器人等多家知名硬件厂商达成了合作。平台拥有多领域的人机交互应用与场景,例如医疗、政务、金融等。同时,也和百度、京东、小米等大厂达成战略合作,为其应用的开发提供平台和技术支撑。

而飔拓最初采取项目式的合作形式,却让团队走了不少弯路。『去年9月份之前,我们一直是根据客户需求提供定制化服务,以项目形式进行系统的开发,再接入厂商的硬件设备。这一过程耗时耗力,所以我们决定要将产品标准化、通用化。』

随后飔拓将业务模式转变为软件+硬件+芯片+模块的形态,『经过授权后,厂商即可将它们的产品终端接入我们的平台做智能化处理,以调用次数进行收费。』在产品标准化后,2018年两个月的收单量便几乎赶超了去年一整年。

从底层架构开始布局

除了『智能语音交互平台』外,飔拓还有两款产品:

1. SDP企业级大数据平台,主要定位数据底层架构和数据管理系统

2. Alnspir分布式机器学习平台,提供数据挖掘、分析、预处理及可视化功能

目前数据挖掘业务主要覆盖金融、医疗、广告精准营销和政府舆情等领域,尤其针对需求量最大的舆情领域,飔拓推出了智能交互舆情系统,把智能语义交互功能深入舆情系统,将传统的舆情分析做了智能化升级。用该平台做舆情分析时,无需触摸操作,用语音就能从后台调出资料进行多维度的展示。

SDP和Alnspir除了作为产品拆分提供外,最重要的功能是对大数据底层架构的支撑。『我们从最底层就开始铺设自己的布局,不希望因为用别人的架构导致因为某些设计不匹配让我们的应用不顺畅。这样有一个数据中心的存在,对我们产品的完整性和未来发展都有益处。』

对于未来的规划,张俊祺表示,飔拓还是会更多的专注于消费级电子产品。『虽然像智能音箱、智能蓝牙耳机这些都是锦上添花的产品,并不是生活刚需,然而随着大众生活质量的提升,类似产品的购买成本也不高,消费级电子产品的市场需求已定会越来越大。』

然而当前行业还处在并停滞在『弱人工智能』阶段,即有智能没智慧,有智商没情商,有专才而无通才。上下文衔接不连贯、词义消歧等问题仍然是行业当前的桎梏。

虽说智能语音为C端提供了全新的交互方式,各家企业均在在智能手机、车载交互系统和家具领域广泛布局,但实际使用情况却并不理想。『很多产品给行业内的人看,他们会觉得已经很厉害了,但对于用户来说,不好用就是蠢。所以会有这么多叫好不叫座的现象,专家都说好,但就是没人买。』

因此,B2B是比较适合现阶段人工智能商业化的发展模式。飔拓目前即是通过和B端企业合作来优化产品、推广品牌,等待行业进一步成熟后再产出自有2C 产品。

目前飔拓已经与国内音箱巨头企业三诺达成合作,为其硬件设备做批量的智能化升级。同时,与亚马逊中国的合作也正在谈判之中。

『最开始的机器人蠢的没法跟他说话,到现在多轮交流比较顺畅,这个过程走了一年半。按照这个进度,可能5年内会用户接受度会有一个显著的提升。』

二十一世纪的今天,我们正处在一个以互联网为主要标志的海量信息时代,自然语言处理在我们生活中扮演着愈发重要的角色。例如以百度、谷歌为代表的搜索引擎成为了我们获取信息的重要渠道,机器翻译也从实验室走入了寻常百姓家,带有语言识别功能的手机正大行其道。

然而这些都仍处在NLP的基础应用阶段,如果语言智能实现突破,跟它同属认知智能的知识和推理就会得到长足发展,进而推动整个人工智能体系的进步。

- End -

精彩文章回顾 ☟

协作机器人会在武汉突破么? | 靠智能导游切入景区经济是个好生意吗? | 作为投资人,无形的东西比有形的东西更重要 | 打破刚兑,私募才有春天 | 踩上VR第一波浪潮的中国游戏开发商 | 发乎情的咖啡,如何不止于赔 |雄安县永远也不会成为下一个陆家嘴 | 楚商集团李璟璟:“走心”投资,“掘金”医药 |枫红资产万杰:理工男的并购经 | 光谷和硅谷的差距,不在产业,而在金融

原创内容,未经同意,严禁转载。

裸泳已进驻今日头条、新浪、网易、腾讯快报、搜狐、九派等,敬请关注

(下载iPhone或Android应用“经理人分享”,一个只为职业精英人群提供优质知识服务的分享平台。不做单纯的资讯推送,致力于成为你的私人智库。)

文章来源:头条号-裸泳投融