微软智能语音合成支持 147 种语言 / 方言,提供 449 个声音

微软 Azure 神经网络版文本转语音服务(Neural TTS)作为 Azure 认知服务下的一项强大的语音合成功能,开发人员可使用 AI 将文本转换为逼真的语音。自其面世以来,Azure Neural TTS 已被应用于各种使用场景,包括电子书、语音助手、视频音频制作、界面朗读等等。微软智能语音合成支持 147 种语言 / 方言,提供 449 个声音

现在,通过新语言扩展,微软 Azure 神经网络版文本转语音服务总共支持 147 种语言 / 方言。此外,还发布了 46 个新的平台预制声音,以及更多的情感支持。至此,Azure 神经网络文本转语音服务声音家族共提供 449 个声音供客户选择。

微软 Azure 神经网络文本转语音服务现在新增 2 种语言:巴斯克语和亚美尼亚语。公共预览版推出两种新的中文语言方言:吴语和粤语。

Azure 语音合成服务为每个语言都提供了至少一个女声和一个男声。但是,在实际使用中,很多场景需要用到多个声音来实现多样性或者进行多角色自然对话。现在,微软带来了 46 个新声音的公开预览,这包括英语(澳大利亚)、西班牙语(西班牙)、韩语(韩国)和日语(日本)。这些新声音覆盖了不同的角色和年龄,可以为不同的业务场景带来更多的选择。这些声音目前可以在 3 个 Azure 数据中心使用:美国东部、西欧和东南亚。

越来越多的场景需要根据不同的内容来表达不同的风格和情感。微软还在不断地赋予更多的语言和声音多种不同的情绪风格,包括支持更轻松的聊天或表达欢快的情感。

在 2022 年 5 月,微软 Azure 在英语(美国)预览版中发布了 5 个新声音和 10 种语音风格,并在 2022 年 6 月预览了西班牙语(墨西哥)、意大利语和葡萄牙语(巴西)的若干新声音。微软将把这些声音和风格进一步在更广泛的服务区域进行提供。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索