设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 数据 创业者 手机
当前位置: 首页 > 创业 > 经验 > 正文

微软云更新语音服务,对标谷歌、亚马逊

发布时间:2020-04-03 17:24 所属栏目:29 来源:中国软件网
导读:2020年4月3日消息,近日,微软Azure宣布在其认知服务中更新新的TTS功能(从文本到语音),该功能具有一套新的人工智能API和SDK,使得开发者可以根据自己的品牌制定应用和语音服务。此次功能更新包括三种风格,分别是新闻广播、客户服务、数字助理。微软方面
2020年4月3日消息,近日,微软Azure宣布在其认知服务中更新新的TTS功能(从文本到语音),该功能具有一套新的人工智能API和SDK,使得开发者可以根据自己的品牌制定应用和语音服务。此次功能更新包括三种风格,分别是新闻广播、客户服务、数字助理。微软方面承诺,该功能听起来极为接近自然对话,符合人类声音模式和语调。

 

微软在其博客中写道,基于一个强大的基础模型,微软的神经TTS声音非常自然、可靠以及富有表现力。通过迁移学习,神经TTS模型可以从不同的说话人身上学习不同的说话风格,使声音变得细腻。

微软云更新语音服务,对标谷歌、亚马逊

新闻广播的声音就是大家在电视或广播新闻广播中可能听到的一种“专业语调”,它没有任何方言的痕迹,使用标准的广播发音,一种不漏掉字母的发音形式。

 

除了微软Azure认知服务外,微软还表示,新闻风格的语音还可以在微信收听微软文档,可以大声朗读Word、PowerPoint和Excel文档,并生成用于在线培训、新闻播客等的音频。它也在Bing移动应用程序中,当用户使用语音搜索功能进行搜索时,将听到使用新闻广播语音的新闻摘要。

 

客户服务风格的语音则具有一种“友好”和“吸引人”的语调,微软称这种语调是针对涉及需要客户支持的场景而调整的,比如,报告、索赔。相比之下,数字助理语音有两种风格,一种是聊天风格,适用于随意交谈;另一种是专业风格,适用于车内数字助理等应用程序。它主要适用于转发天气预报、导航方向、提醒和其他信息的场景中。

 

除针对特定场景优化的语音功能之外,微软今天早上还发布了几种新的情感功能,这些功能可以调整来表达不同的情感,以适应特定的环境。这是一种让人愉悦或感同身受的功能,在中国属于抒情风格,微软称之为“真挚的”语调,主要用于优化阅读散文或诗歌的方式。

 

该功能包括英文和中文两种,而情感功能有英文、中文和巴西葡萄牙语。微软指出,这些风格可以通过微软语音工作室内的自定义神经语音功能进行定制,从而使品牌能够构建从新场景中受益的独特语音。

 

中国软件网认为,一直以来,微软研究院十分重视AI技术的研发,包括TTS、NLP等在内核心语音技术。而微软在中国从2019年起,先后与央视新闻等新闻、企业机构展开语音定制合作,取得不错的市场效果。

 

此外,2019年,谷歌云文本语音服务中首次推出了31种人工智能合成的WaveNet语音和24种新的标准语音。而亚马逊近期推出了一个服务品牌Voice,它利用人工智能生成定制发言人,并通过亚马逊的云服务Amazon Polly提供多种语音风格和情感风格,将文本转换成语音。可以预见,无论在云端,还是在AI语音领域,三者的竞争将会进一步加剧。

 

 




(编辑:ASP站长网)

    网友评论
    推荐文章
      热点阅读