怎么看待如今的语音助手?

在许多的科幻电影中,机器人被描述的与人类无异:无论是其外观,还是其说法方式,都看不出与人类的差别,甚至产生一段“人机恋”。不过就现阶段而言,机器人尚未发展到这种程度,特别是若要机器人与人类产生恋情,声音与交流将是非常关键的一环。为了让语音助手的发声更像人类,从而能进一步提升这类产品对消费者的吸引力,众多巨头都做了很多努力,希望让语音助手的发声更自然,也更口语化,就像你在与真人交流那样,从而为消费者带来更真实、更贴近生活的语音助手。

谷歌用机器学习优化语音助手谷歌近期就发布了全新的AI语音合成器,一个名为“Cloud Text-to-Speech”的服务,能让语音助手听起来更自然更口语化,服务于需要语音合成服务的开发者或企业,无论是应用、网页还是虚拟助理均可使用。其特别之处在于,“Cloud Text-to-Speech”通过谷歌旗下人工智能子公司DeepMind开发的WaveNet来驱动。

据了解,DeepMind的AI语音合成技术是目前行业最先进、最可实现的技术之一:大部分语音合成器(包括Siri)都使用了“连接合成”技术——程序会储存单个音节,然后再将其组合到一起,形成单词和句子,虽然这种方法近年来不断进步,但听起来还是非常呆板生硬。相比之下,WaveNet使用了机器学习来从头生成语音。

实际上,WaveNet分析了一个巨大人类语音数据库的波形,并以每秒2.4万个样本的速度对其重新创建,从而能让我们感受到一些微妙的变化,包括口音和唇音等。它之前已经被整合到Google Assistant中(尽管只支持英文和日文),现在则拥有了更多选择。谷歌表示,新服务可提供12种语言的32种不同声音能力,而且用户可以定制高音和语速等细节

微软苹果等也要让语音助手像人类据了解,微软同样利用机器学习等技术让Cortana声音更接近人类:Cortana会根据用户当前对话情景进行情感分析,从而控制自己的语音和语调,产生相应语气。此外,Cortana更像人也与其声音来源(Jen Taylor,为《光环》游戏Cortana配音)有关,“就闲聊部分,全部都是Jen Taylor的声音;其他部分将由其他声音混合使用”。

苹果在iOS 11发布时这样评价SIri,“它很自然!一点都不像机器人!”这是因为和过去相比,siri说话时会在句子间加入更多的停顿,更多的长音,更轻快的语调变化,因此它将会比过去更流畅,更像“人”;此外在学会一门新语言的过程中,Siri团队试图找到每一个音所有的说法,比如连读、轻读、重音、长音、升调、降调等等。

亚马逊Alexa拥有比较明显的机器人口音,为此亚马逊升级过语音合成标记语言标签,希望能为Alexa带来低声说话,停顿,咒骂,以及整语音的速度、音量和声调等,从而能听上去不那么像是机器人。三星在中文版Bixby 2.0发布会上也强调,Bixby “能听会看懂你心”,是一款真正“会说人话”的语音助手。语音助手的竞争很激烈在人机交互方面,语音助手正在引领AI为主导的下一代人机交互时代,引发了众多科技公司的竞逐:国内的百度搜狗科大讯飞,以及国外的微软谷歌苹果亚马逊等公司都非常重视语音交互技术,试图让语音交互变得更为实用,从而能争夺新时代下的超级入口。

据媒体报道,Spotify也正测试其语音助手,将让消费领域的语音助手之争变得更加激烈。科技公司也瞄准了语音助手在企业领域的前景。前段时间,IBM正式发布了沃森助手(Watson Assistant),可以置于多种平台,如汽车、酒店或家电等。据IBM称,Watson是一个企业助理,旨在帮助企业提高他们的消费者体验。

亚马逊则于去年11月公布了企业版Alexa,允许企业开发定制功能,并把Alexa置入各种产品中。可以预见,无论是技术研发,还是产品落地,各大公司都会针对语音交互技术展开激烈竞逐。语音助手走向成功仍需进化虽然语音助手的发展正如火如荼,但必须要承认,语音助手想要真正成功仍需进化。比如亚马逊Alexa智能音箱发出的怪笑事件,就引发了不少用户恐慌,凸显出语音助手技术的不完善:特别是某些情况下,即使没有语音唤醒,Alexa设备也发出了莫名其妙怪笑声。

语音助手不够“智能”也是老生常谈的话题(目前的语音助手不过是个高端玩具),包括回答问题的准确性、理解用户需求、提供个性化建议等等。事实上,依然有不少用户并未接触到语音助手,或折即使有时候,但频率较低,都表明了语音助手还有较长的路要走。写在最后隐私问题也是语音助手发展路上不容忽视的问题,比如Siri近期被曝出的“能在设备锁定时读取隐藏信息,并可能将读取到的信息公之于众”的漏洞,就让不用担心:伴随着语音助手的进一步普及,提供语音助手服务的公司真能保证隐私不被泄露吗?若发生这类问题,又该如何是好呢?毕竟当语音助手足够智能时,消费者的许多隐私都会被它掌握,相信到时候隐私泄露的风险也将是用户难以承受的。

Alexa语音有情绪的吗?

推出人工智能语音助手以来,亚马逊一直努力让Alexa和人类之间的语音交互更加自然。今天,这家电商巨头已经朝着这个方向迈出了一大步,为Alexa推出了情感和新的说话风格。这些新功能已经面向开发人员推出,预计将很快和消费者见面。在Alexa Skills Kit博客今天更新的文章中,亚马逊详细介绍了这些新的情绪和说法方式。

这些情绪和说话方式均由该公司的“神经文字转语音”技术提供支持。现在,Alexa可以以激动或失望的音调来响应查询,这两种查询都可以以高中低三种不同的强度来使用。例如,当用户正在玩游戏并获得正确答案时,开发人员可能会选择让Alexa以高强度的激发音响应用户。 {!-- PGC_VIDEO:{"thumb_height": 360, "file_sign": "df8d5476909059bc0cd0a3f26203cd5a。

为何Siri等语音助手都是女性?

包括Siri,Alexa,Google Assistant,Cortana和Bixby在内,几乎所有语音助手的默认声音都是女性。尽管有助于人们对人工智能的刻板印象,甚至还激发了极具浪漫主义的电影《她》,但是隶属于出版商Vice的创意机构Virtue希望挑战这个主流趋势,推出了默认为男性声音的语音助手--Q。

该语音助手Q是该公司同Copenhagen Pride,Equal AI,Koalition Interactive和thirtysoundsgood等公司和机构共同努力的成果。在Q的网站上写道:“科技公司正继续给他们的语音助手性别化,希望赢得消费者的青睐并鼓励用户使用。但是男性声音更具权威性,可用于银行和保险等情景中,而女性声音则更倾向于服务向导工作。

”为了开发Q,Virtue与哥本哈根大学的语言学家和研究员AnnaJørgensen合作。他们录制了5个非二次元人的声音,然后软件将录音调制到145-175赫兹之间,这个范围被研究人员认为是中性。此外Virtue已经邀请了4600人进行调查,以进一步完善语音效果。访问:http://www.genderlessvoice.com/。

人工智能语音助手利弊,是否有自我学习能力?

智能语音已经成为我们生活的一部分了。比如手机上的导航软件,里面有各种明星合成的声音,来帮你指路;很多新闻APP,都有虚拟主持人的语音播报;你可能已经买了不少智能家居,通过语音就能控制音乐、灯光、温度;你常去的酒店、医院、小区这些地方,已经有一些机器人能帮你打下手,而且是用语音操控的。智能语音第一次改变了人和工具之间的关系。

原来呢,是人类去适应工具,而智能语音出现以后,这件事就变成让工具去主动适应人。人工智能是否具有自我学习能力?人工智能就是模仿了这套记忆机制,科学家利用人脑中神经网络的原理,让计算机自主地建立不同神经元之间的联结。再通过外部的反馈,来让机器调整联结的方式,自我优化参数。在整个学习过程中,机器就像人类那样,在大量的经验数据中获取信息。

这就相当于也给机器设置了一个大脑,让机器有了自主学习的能力。既然人工智能要靠不断接受外部信息来实现进化,那么教它的“老师”自然也是越多越好,“老师”越多,信息输入也就越多。那怎么尽可能多地输入信息呢?最好的方法就是降低信息输入的门槛,没有门槛更好。智能语音的安全隐患拿智能音箱来说,表面上看起来,只有你说出关键词的时候,才能够唤醒它。

但你又怎么知道,自己私密的谈话,没有被偷偷记录下来呢?智能语音很像一个随时待命的士兵,听见你说的唤醒关键词后就会立即开启,也就是说,它一直都在默默地听着你说的每一句话。仔细想想,是不是觉得很恐怖?也有人说,“买一个智能音箱,实际上是在花钱让一家大型科技公司监视你。”在隐私方面,还有一个更加严重的问题,就是对我们的安全威胁。

当智能设备的权限越来越大,收集的数据越来越多,跟我们的生活关系越来越紧密的时候,就会存在另一个风险:被黑客入侵。只要黑客获取了你的登录账号和密码,他就能听到你的全部信息。毕竟技术的发展不是一下子就成熟的,所以理性的看待新技术不用过度的恐慌。毕竟看到了问题就会有各种解决方案,我个人还是看好智能语音的。。

亚马逊推出的Alexa语音定制服务有何特点?

亚马逊今日宣布,该公司将与品牌方展开合作,以帮助其定制自己的 Alexa 新技能,比如 TTS(文本转语音)。如果项目得到顺利推进,那我们或许可以很快身临其境地体验到 KFC 餐厅中山德士上校的 Alexa 语音回复,而不是默认的 Alexa 讲述人。【来自:Amazon,via TheVerge】据悉,Alexa 的品牌定制语音服务,是通过 Amazon Polly 语音合成平台提供的。

此前,这项服务已经提供了基于神经网络的文本转语音(TTS)服务,以便企业能够为 Alexa 设备应用如假包换的语音。现在,亚马逊正在提供基于网络的中性 TTS 技术,以根据品牌方与亚马逊的合作,挑选特型演员的声音来录制和定制语音。去年 9 月,亚马逊曾与“神盾局长”塞缪尔·杰克逊(Samuel L. Jackson)达成过类似的合作。

Adobe面向Alexa设备推出的XD skill工具是什么?

今天Adobe面向Alexa语音助手推出了一套新的原型语音工具和Adobe XD技能,并且将XD整合到Echo Dot或Echo Show等Alexa设备上。这家总部位于圣何塞的软件公司最新推出的设计工具能够在所有装备亚马逊Alexa语音助手的所有设备上导出和预览语音原型。 {!-- PGC_VIDEO:{"thumb_height": 360, "file_sign": "8a6e411f3a5972b3aa19084fefa9a379。


文章TAG:语音  助手  alexa  Alexa  内置  
没有了