没有屏幕的翻译机,你真敢用吗

什么样的科技产品是好的?相信很多人有各种答案,但是其中一个答案相信没人能反驳:那就是能给你带来“安全感”的产品……那么,今天我们将介绍一个黑科技——人工智能翻译机的正确打开方式。

实时反馈的背后 无处不在的安全感

相信在日常生活中你经常会遇到类似的场景:当你在餐馆点餐完毕之后,有时服务员没有重复一遍所有菜名来和你确认就下单,这时会有上错菜的情况;当你带着耳机唱歌或者说话的时候,通常旁边的人会觉得有失水准或者声音很大。这是因为你发出的声音没有传到自己耳朵,失去对声音的实时反馈,而无法校验和调整导致的。

这些行为其实都是人们要获得对于事物行为过程中的实时反馈而带来的安全感。如果人失去了实时反馈都会变得如此糟糕,那么,人工智能翻译机失去对语音识别的确认的话,会是多么恐怖的一件事啊。

智能语音翻译机 离“放心”还有多远?

判断科技产品是否好用,其实是考察其“放心”程度。比如在当前非常火爆的人工智能语音交互领域,语音识别是否准确,用户说的话能否被准确执行都是考察产品的核心要素。

然而作为沟通艺术的语言本身,是具有多样性和多义性,在真实地应用场景中还有许多复杂的情况,如环境噪音,用户的语气情绪,上下文语境、方言、口语等。那么在当前语音识别准确率还没有达到100%的时候,显然语音识别会出现错误的情况。

比如某款翻译机产品,四川阿姨出国游,找酒店服务员说:“我找不到我的鞋(hái)子了”,翻译机识别为“我找不到我的孩子了”,如果有屏幕的话,就可以及时的校验和纠正,免了一场误会;如果没有屏幕的话,会直接翻译为”I can’t find my baby.”,这会让酒店人员大为惊慌,也许,就开启了一场人在囧途的旅行。

那么,用户如何才能实时发现和修改呢?通过前文的分析,我们可以知道,这需要一个实时回馈纠错机制来解决。这也是我们是否能够获得足够的安全感和放心的一个关键因素所在。

带屏幕的智能机器 绝不是为了好看

盘点目前中国的人工智能翻译机行业,主要有分音塔科技的准儿翻译机和科大讯飞的晓译、译呗翻译机,二者在中英互译上准确率不相上下。而准儿翻译机在实际使用体验上的准确率则更高,这就得益于分音塔科技行业首推的带屏幕智能翻译机。

分音塔科技历经两年,进行了4次迭代的智能硬件产品——准儿翻译机,配置LED触摸屏可直接校准识别内容(转化为汉语),可以规避在某些特定场合答非所问出现尴尬的情况;另一方面,还可以通过屏幕有助于加深理解对方的表达。如本来是点餐说“水饺多少钱”,而机器却识别成了“睡觉多少钱”,结果翻译成英文的“How much is sleep”,如果有屏幕就可以及时发现并纠正,免得闹出了笑话。像这种还算是普通的小错误,如果重要事情识别错误可能会造成更大的麻烦。

分音塔也计划推出离线翻译功能。离线识别和离线翻译的准确率由于数据和运算能力的原因,要远低于在线识别和翻译。那么屏幕就更加重要了。因为识别率越低,出错的概率就越大。如果离线翻译没有屏幕进行校对,闹笑话的可能性就大大增加了。

除了智能翻译机,在语音交互其它智能领域也都不同程度佐证了“带屏”这一现象。

亚马逊的智能音箱Echo 大卖,第一代和第二代Echo音箱没有屏幕,Echo虽然拥有上千种功能,但是大部分功能用户并不会使用,用户使用亚马逊Echo的最多功能是闹钟、查天气和播放歌曲三个功能。可最近最新的Echo第三代增加了显示屏幕,它没有脱离 Echo 系列语音交互的本质,但却通过一块屏幕对前者的缺点进行了有力补充。让语音交互本身的便利性得以发挥的同时,又能保证信息反馈的直观性和准确性。

还有,Vinci 近日宣布推出升级版 1.5 版本,一款带有屏幕的自带音乐播放功能的智能耳机。显然,屏幕是 Vinci 语音交互的一种重要补充。

综上,在人工智能语音交互现初级阶段,屏幕就是针对语音识别部分建立的一个校验纠错机制,是现阶段人工智能语音智能产品是否“靠谱“的判断标准之一。

关键词: 翻译机 屏幕