软件 语音识别技术:有用还是痛苦?

语音识别技术:有用还是痛苦?

目录:

Anonim

您是否曾经打电话给一家公司寻求帮助或支付账单,却只想听到一个想要与您交谈的悦耳动听的声音来打招呼-却听不懂您在说什么? 或者也许您拥有一部iPhone,而Siri最初看起来像是一个好盟友,但您已经意识到有时(好吧,老实说,经常)她只是不了解它? 语音识别技术(VRT)也被称为语音转文本,陷入了一个普遍的陷阱:它具有令人难以置信的超酷潜力(男孩,我们正在为此扎根),但更常见的是,这是一种磨牙沮丧地运动。


语音识别曾经属于科幻小说领域,从1950年代的婴儿期开始发展,当时贝尔实验室Audrey系统被设计用来识别单一语音中所说的数字,如今发展成为我们现在与之互动的对话电子的现代网络。每天-结果不一。

与人类对话,请按0

现在,当今的许多企业都使用称为交互式语音响应(IVR)的系统来处理客户服务呼叫。 最常见的用法是用于语音导航菜单,但是一些公司使用IVR系统,该系统可以访问客户帐户信息并回答一些小问题。 菜单IVR软件通常具有有限的词汇,可能仅限于“是”,“否”和数字。 更复杂的系统可以识别公司特定的单词和短语。


这些系统之所以变得越来越流行-至少对于企业而言,原因很简单:它们具有成本效益。 根据《华尔街日报》 2010年的一份报告,到达一个代理商的典型客户呼叫成本在3到9美元之间,而通过自动化系统处理的呼叫仅花费5至7美分。 而且,当然,计算机程序不会感到疲劳,生病或对客户感到沮丧(尽管客户肯定会对他们感到沮丧!)。


幸运的是,这并不总是意味着IVR会将工作从人们手中夺走-或至少所有人都从呼叫中心消失了。 这些语音激活的帮助程序可以通过拨打电话和回答简单的问题来提高人类客户服务代表的工作效率。


当然,对于与这些技术进行交互的人类用户而言,并非总是一帆风顺。 技术正在帮助改善IVR技术中的常见问题,例如口音问题,但是自动系统被解雇仍然是在线上的常见主题。 查看有关配备语音识别功能的电梯的喜剧短片,该视频突出了IVR系统故障可能产生的挫败感。

个人电话应用:Siri,Google Now

大多数人都熟悉智能手机的语音识别。 尽管大多数最新的手机型号都带有VR,但当苹果公司在2011年推出Siri时,它们的受欢迎程度和声名狼藉,而Siri则是讽刺性的,语音激活的iPhone 4S“个人助手”。Google很快创造了一个直接竞争对手:Google现在适用于Android Jelly Bean OS。 两种系统均具有女性声音和复杂的识别功能,可让用户使用随便的语言与电话“交谈”。


但是,尽管这些系统比以前的系统更加复杂和功能强大,但它们也表明该技术还有很长的路要走。 关于Siri失败的笑话已成为流行的网络模因。 一名男子甚至起诉苹果,指控其虚假宣传Siri的功能。


也许这就是为什么在苹果公司将Siri创建为先进且内容丰富的同时,VR软件也显得有些傲慢的原因。 例如,如果您讲1968年电影《 2001:太空漫游》中电影史上最臭名昭著的情报技术热线之一-“打开吊舱门”-Siri会回答电影中的任一回答热线,“对不起(您的名字),我恐怕无法做到这一点,”或更讽刺的是,“我们情报人员显然永远不会辜负自己。”


以名称呼叫您只是试图使Siri更易于爱用,更加人性化的功能之一。 VR助手可以按照语音命令进行呼叫,听写和发送文本,执行Internet搜索信息,查找附近的商店,提供行车路线等,而无需触摸任何东西。 电话会同时说出答案并显示在屏幕上。


Google Now(Android Jelly Bean平台的VR部分)与Siri非常相似。 该系统通过将随意的语音转换为命令来提供相同的广泛识别功能,这些命令使用户可以拨打电话,发送文本,运行搜索,执行计算和转换,获取单词定义,设置警报,播放歌曲以及获取地图和方向。


使用Siri和Google Now这样的个人语音助手,好处显而易见。 从呼叫,发短信到搜索和娱乐,一切都变得更快,更轻松。 只需说出您想要的内容,(大多数情况下)VR应用程序就会为您抓取它。 VR的无人值守技术在驾驶时特别有用。 尽管许多人谴责Siri的缺陷,并且作者辩称Google Now从本质上影响用户生活的能力有点令人讨厌,但大多数人仍然觉得这些未来技术非常酷。


当然,像Siri和Google Now这样的个人电话应用程序还远远不够完美-尽管它们确实显示了该技术在未来的发展方向。 这意味着,即使Siri给出了错误的答案,我们也可能会笑并原谅她,因为她知道下一个版本会更好。

VR跌落的地方

如果您在致电公司时遇到过IVR,则可能已经注意到某些沟通障碍。 一些程序使用自动语音转语音语音,会误读单词并使事情难以理解。 其他人则存在敏感性问题,如果您的声音太大,太柔和或没有仔细发声,则该软件将无法处理您所说的话。


另外,许多人仍然不喜欢与机器交谈。 如果您在IVR上进行一些搜索,您会遇到一些人将各种方法汇总在一起的列表,这些方法绕过了IVR系统并成为“真实的人”。 该解决方案的范围从“对操作员保持按下0”到“向机器发誓,直到它吸引人为止”。 结果,IVR系统最近的许多发展都围绕着使它们更适合人类使用。 使声音更富有同情心,减少机械手,使系统更易于导航,并让呼叫者知道整个过程从头到尾要花费多长时间。 这表明更好的技术只是这里的一半。 另一半则是吸引用户与机器对话。

未来是什么样子的

尽管存在这些挑战,语音识别技术仍在不断进步。 Siri和Google Now之类的应用程序(包括缺陷和全部功能)在性能上仍然令人印象深刻,并且多家公司正在将VR功能扩展到其他应用程序。


例如,Dragon NaturallySpeaking语音到文本软件的创建者Nuance已经开发了用于电视和汽车的语音控件,并且该技术的版本已集成到某些三星电视和某些福特汽车中使用的SYNC娱乐系统中。


随着Google和Apple继续为他们的语音识别技术找到新的用途,我们可能会越来越多地与从电视机到烤面包机的各种日常机器通信。 而且,科幻小说似乎又是正确的。 我们只希望那些聪明的作家对一件事是错误的。 如果这些机器要接管,那么下次您要求Siri“打开吊舱门”时,您可能会遇到很多麻烦。

语音识别技术:有用还是痛苦?