前沿科技创业的驱动者

继创造AlphaGo之后 谷歌DeepMind让机器人的声音更像人

谷歌下属Deepmind宣布在计算机合成语音上迈出了重要的一步。据FT报道,DeepMind发布的最新研究成果WaveNet使得计算机生成的语音与人类声音间的差异缩小了一半。

Deepmind 在其博客中写到“让人类和机器对话是人机交互领域长久以来的梦想”。

在英文和中文进行的盲测中,听者普遍认为,相比谷歌任何现存的运用不同科技手段的文字-语音转换程序,WaveNet生成的语音都更加自然。

据公司相关人员透露,WaveNet还没被应用到谷歌任何产品中。该系统需要强大的计算能力来合成语音,所以近期之内应该不会被用到“现实场景”中去。

DeepMind是一家专注于人工智能的公司,于2010年成立于伦敦,并在2014年被谷歌以4亿英镑(约合5.32亿美元)收购。

WaveNet所采用的技术和现存人工声音合成器有根本性的不同。WaveNet通过的是实际产生的声波而非语言本身,将文本转换成声音。该系统通过神经网络来模拟人脑,直接用音频的原始波形建模。这背后来自每秒高达16000个样本波形的强大数据库的支持。此外,每一个样本都需要基于之前的样本来建立对于声波样式的预测。DeepMind的工作人员表示,“这确实是非常有挑战性的任务。”

很多现有的人工声音合成器多是先录制大量的人声语音片段,建立一个大型数据库,并将这些语音片段重新组合成完整的话语。这样生成的声音接近真实人声,但并不完全自然。而缺点在于如此产生的声音并不能被简单地更改。据DeepMind透露,另外一些系统可以完全电子化地生成声音,这样尽管声音可简单地被操作修改,但并不接近真实的人声。

在人工智能里,尽管人们似乎一直以来对语音识别更有兴趣,而冷淡了计算机语音合成这一冷门的领域。但各大科技公司都不放过应用越来越普遍的人机交互。亚马逊苹果微软和谷歌的母公司Alphabet都投入了个人数字化助手同客户进行互动。

今年早些时候,DeepMind的人工智能AlphaGo击败了韩国围棋大师李世石,引起了人们广泛的关注。谷歌一直都对将如何运用其人工智能技术守口如瓶,称已经利用这些技术降低了其数据中心40%的电量,剩下的钱足以让谷歌收购来自伦敦的DeepMind。谷歌还表示,DeepMind使得从YouTube到谷歌广告产品的一系列服务得到了明显的改善。

文  华尔街见闻

分享到:

相关推荐

  • 1476328757463781

    酷!首个“太空国家”成立 想加入吗?

      内容摘要 从今以后,地球上又多了一个“国家”——“太空国家”。这支团队的领导者是航空国际研究中心的创立者Igor Ashurbeyli,项目旨在利用最先进科学技术创造一个保护全人类的屏障,阻挡来自太空的人为或自然的威胁。   据英国《每日邮报》报道,世界上首个“太空国家”成...

  • 1473063343626113

    鼓励!鼓励!狗狗只能听懂赞美的话

      内容摘要 主人都会觉得自己的宠物聪明,能理解自己的话和情绪。最新研究发现表明,人与狗之间交流时,词汇和语气很重要。研究还指出,狗可以识别大约1000多个词汇。   下次再表扬宠物时,使用一些它们懂得的积极词汇或是词组,再用表扬的语气对宠物说。最新研究发现...

  • 微信截图_20160912175144

    SME助力|中国声谷·人工智能产业高峰论坛

    点击活动详情,报名参加活动

  • 60e7443d25b7fabb27ec666f65c4db38

    人能不能活过150岁?美国两位科学家打了个赌

    Steven Austad(左)打赌认为人能活到150岁;Jay Olshansky则持相反观点。 美国两名研究人员在2001年曾打赌是否有人寿命可以达到150岁,16年来,科学家曾经押下的赌注已经增加到600美元。如果这些资金以当前的兑换率增长,那么赢家的后代在2150年将可得到数亿美元。 这场友好的打赌从2000年开始,当...

  • a79af40bf1086d5196d9a5ee4ae1c1c5

    鼻子拯救膝盖? 鼻软骨或可嫁接膝盖软骨

    对于膝关节受伤的人而言,最有希望的新软骨来源可能是他们的鼻子。 瑞士医生首次将取自鼻腔的软骨嫁接到膝盖严重损伤的患者身上。众所周知,膝盖连接组织撕裂会引发疼痛,甚至骨关节炎。 现在,医生能使用特定手段修复软骨:移植或注射取自尸体或患者自身健康部位的膝盖软骨细胞。或者他们会在骨...

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SME 前沿科技创业的驱动者