AI智能助手“小不点” 让心想到事成仅一句话

2017-05-08 14:23:00 来源: 南方都市报(深圳)
0
分享到:
T + -

(原标题:AI智能助手“小不点” 让心想到事成仅一句话)

4月11日,乐视发布了最新的自学习AI生态手机乐Pro3。其中,最令人印象深刻的环节并非手机本身,而是通过一句指令即可为乐迷发送红包的全新功能。

590ff205f323e.jpg


不同于传统的智能助手只是简单的语音识别触发操作,这款名叫“小不点”的智能助手不仅能够快速实现复杂的语音指令,随意打开第三方APP并直达深层界面,还有自主学习能力,通过观察和学习用户如何通过正常操作应用,使其某项功能变得越来越聪明。

一个让用户“从心想到事成就一句话”的智能语音助手,或将使手机成为最懂你的AI机器人。而本次人工智能在手机领域的试水,也引发了行业众多关注和思考。

语音助手大战硝烟不断,人工智能是手机下一个风口?

近几年,人工智能在手机行业频频触电,已被看作未来手机发展的重要方向之一,也是今年新上市手机产品的主打功能。不仅是乐视,我们在很多品牌手机中都发现了人工智能的身影。

如苹果iPhone的 Siri 和微软Windows phone搭载的Cortana,融合了语音识别、语义识别等技术。2016 年推出的谷歌Pixel旗舰新机搭载的Google Assistant、今年的三星S8的 Bixby 等新型智能助理又体现了情景感知、深度学习等技术,让语音助手不再只是机械式地与用户互动,而是能够智能化的分析和感知用户思想。

市场研究公司Fivesight日前发布的报告显示,约有72%的用户已将虚拟助手作为对搜索引擎的补充。科技市场研究公司Fivesight Research发布的2017年第一季度《美国用户搜索偏好报告》则显示,Siri已成为仅次谷歌之后的第二大移动“搜索引擎”。

市场推动下,智能语音助手将成长为下一代的搜索核心,以及新生态的核心。现在的众多应用将部分甚至全部后端化,这也是苹果、谷歌、微软、三星等主流智能手机纷纷进军人工智能语音助理领域的一大原因。

可以预见,2017年的手机行业将迎来“人工智能年”,厂商们希望通过全新的智能化体验来抢占更多的用户和市场份额。有国际巨头等珠玉在前,其他厂商必须也要迅速跟进才能获得市场竞争优势。

当前智能助手“鸡肋”般存在,仍待交互革命

此前,当人们谈及手机智能助手时,最大诟病之一无疑是其只支持少数被选定的任务,永远带着隔靴搔痒的意味。人们始终没有养成大量使用的习惯,成为了很多人手机中的“鸡肋”。

以Siri来说,问一句“中国的首都是哪里”,它只会傻傻地推送一堆网页;让它打开微信发个红包它也做不到,只能做到打开微信,整个过程中还重复了好几次“对不起,我没听懂”,“抱歉,我不太确定你说了什么”……至今Siri仅能实现打电话、打开程序、设置闹钟等简单操作,语音操控仅触及一级页面,因此Siri的作用,仅限于调戏,实用性乏善可陈。

相比Siri一类“手机宠物”式的趣味性产品, “小不点”则代表了实用型产品。趣味性产品,是给用户提供甜点,而工具性产品,则是解决用户的痛点。

“小不点”的出现刚好解决了我们面临的两个痛点,一是手机里装的APP越来越多,翻找麻烦;二是超级应用的出现,让常用功能藏得很深。有了“小不点”,用户就可以省去翻找APP的麻烦,也不必知道想要的功能在哪,直接跟她说你的诉求,让它去做就行了。

“小不点”开启应用去操作化时代,加速手机对生活的改变

“小不点”的强大之处主要有两方面,第一是模拟点击直达深层操作。通俗点讲,“小不点”可以通过模拟人的点击操作,触及应用的二三层页面,目前绝大多数语音助手仅触及一级页面,为什么“小不点”可以做到与众不同?

让我们先来看看包括Siri在内的语音助手的工作原理,基本上都是分三步走。

第一步:语音识别,把你说的话翻译成文字。

第二步:自然语言理解,把文字解读成行为。

第三步:调用各应用API来完成指令。

对于一个语音助手开发者来说,前两步,比的是AI技术,第三步,比的就是BD能力了。并且这第三步甚至比AI技术本身都更加耗时耗力,并且阻碍限制颇多。而“小不点”则不需要API——换句话说,语音指令的实现,不需要各类应用给你“开后门”。当“小不点”在完成第一步语音识别、第二步自然语言理解之后,第三步,它便开始“模仿人”进行操作——打开你手机里已有的APP,进行模拟点击动作,直至完成你要实现的动作。

58f597a0307c3.jpg


在乐视手机发布会现场,“小不点”展示了面对用户发出的语音命令从而实现多级操作的“绝活”。例如,打开语音助手发出发红包指令,小不点会进行模拟点击即可直达支付界面,省去了繁琐的操作步骤;发出观看《三生三世十里桃花》的指令,即可按照人的操作习惯,打开视频现场观看。这意味着小不点已经可以跨越各大APP的技术衔接门槛,实现了语音指令直达2-3级操作,并有着较高识别率,这一点相比普通的语音助手进步很大。

WechatIMG19.jpeg


不仅如此,“小不点”另一大亮点还在于“自带学习功能”。

常有这种场景:你说了一句话,语音助手搞不懂,这时对于Siri等助手,你只能悻悻地自己动手,但对“小不点”而言,当它听不懂时,会向你展示“学习”按钮,你按下之后,它便会记住你接下来的一系列操作动作,录制完整路径,记住你的语音与动作之间的关连——下一次,当你再说同样的话,它就学会了。

WechatIMG17.jpeg


这样一来,可以说,理论上“小不点”的语音控制能力,已经可以覆盖到手机中任意一款应用。可以实现各种极其具体的功能。如果说之前的语音助手开开玩笑还可以,功能上就是半吊子,“小不点”的出现确实是让“语音”真正成为了一种切实可用的交互方式。

首创“对话图形界面” 让人机交互更简单自然

“小不点”最大的创新跟突破点在于可以让用户自定义语音与动作之间的关连,为了可以实现这种体验,“小不点”首创了“对话图形界面”,让人机交互更自然。。

计算机与人类并不使用同一种语言。所以为了之间的交互成为可能,我们依赖于图形化的用户界面(GUI)。其友好的图标和可点击使人类与计算机进行无障碍沟通。但是GUI同样有着天然的屏障:人们必须去学习如何使用他们。

更糟糕的是,我们正在迫使GUI进入移动界面世界,不同的屏幕上的N次点击让人们开始变得眼花缭乱。复杂性的激增,使得图形界面面临越来越严峻的考验。

随着技术的发展,语言识别和处理效率的提高改善,交互方式其实可以更直观,简单而又高效,我们现在需要的是能够简单地与我们的设备进行交谈,语言是最自然的方式,毕竟我们天天都在说话。这就是“对话式界面(CUI)”。

但由于人工智能和云计算等技术的限制,对话界面仍然是一个低频场景。那么,为什么不在应用程序留下了一个值得信赖的GUI支持与用户的交谈呢?也就是说把图形用户界面(GUI)和对话用户界面(CUI)合二为一,即“对话图形界面“,更加简单高效地链接人类对手机的需求和手机应用里的各项功能。

操作小不点看起来很简单,但是背后的每一项技术都是一个浩大的工程,除了对话图形界面,还包括了语音识别、自然语意处理、机器学习以及动作模拟。这四种技术让小不点能自然地操作应用内的功能,完成用户期望。

结语:

有想像过吗?若是有一种智能助手,在你说出「去首都机场时」就直接帮你叫了辆车,在你说出「x月x日去上海」时帮你查好了机票,在你拍了完美食物照片并说「我想让我朋友看到这些照片」时帮你自动发了朋友圈。世界是不是突然变得更完美了一些?

logo.png


“小不点”之父奇点机智(Naturali)创始人兼CEO邬霄云称:“我们希望你直接说出心中所想,我们即可帮你实现。小不点的存在,就是因为我们相信人与机器的互动可以更简单、更方便。“


(原标题:AI智能助手“小不点” 让心想到事成仅一句话)

netease 本文来源:南方都市报 责任编辑:王晓易_NE0011
分享到:
跟贴0
参与0
发贴
为您推荐
  • 推荐
  • 娱乐
  • 体育
  • 财经
  • 时尚
  • 科技
  • 军事
  • 汽车
+ 加载更多新闻
×

辽宁铁岭一居民楼内惊现2亿元钞票 用坏3台点钞

热点新闻

猜你喜欢

阅读下一篇

返回网易首页返回新闻首页
用微信扫描二维码
分享至好友和朋友圈
x