前言说明
目前市面上的文字转语音项目还是挺多的,不过很多转换后都达不到我们理想的效果,唯独一款良心且好用的应该当属微软旗下的语言认知服务了,不过需要认证万事达或者visa信用卡,这一步就难倒了很多国内用户了,因为我们大家就算有信用卡也多半是国内的,所以很多人都为之头疼,基于以上残酷的事实所以我们开发了一款在线免费使用的在线文字转语音工具供大家使用!
源码下载
- 文本转语音源码(API合成版):微软TTS文本转语音(语音合成)项目前端+接口源代码-360模板吧 (360mb.net)
- 文本转语音源码(SDK合成版):在线文本转语音工具(微软版)-360模板吧 (360mb.net)
免注册使用版,调用的官方接口,所以可以免费使用,但接口不是很稳定,注册版是独立的key,主要区别就这个,所以自己看需要哪一个!
功能说明
目前开发的功能是采用官方的TTS接口,功能上和azure官网的基本一致,该有的功能都有,就比如:语言选择、全功能人物、发音语气、音速调节、音调调节等等,而且也支持SSML高级功能,这个功能可以说是最强的存在,支持多人配音,不管是用来为自己的剪辑视频配音还是门店的大促销配音亦或是为小说配音,都是强大的存在!
常用事件
这里我们会单独写一篇微软文字转语音(语音合成)常用事件的处理说明,如:停顿说明、多音字处理,请点击下面按钮查看详细的说明和解释
微软文字转语音常用事件处理我们新增了一个批量停顿,默认会在"。?!;"自动添加停顿,停顿时间可选
如何使用
基本使用:
一般文本模式很简单,文字打上去或复制后粘贴上去,然后设置各个参数,先点击“试听播放”等待预加载,预加载完成后,按钮就会变为“立即下载”,然后下载即可,没什么难的。
高级模式:
文本转语音SSML模式,大家可以点击文本转语音工具页的SSML选项看看,然后我们依葫芦画瓢即可,默认的是单人模式,看默认的就好,下面看看如何使用多人模式,多人模式同样可设置各个选项,不过是以代码的格式,就比如(可复制进SSML里试听):
单人样本参考
<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US">
<voice name="zh-CN-YunyangNeural">
<mstts:express-as style="narration-professional">
<prosody rate="24%" pitch="0%"> 就在云韵脸颊苍白略微变淡时,萧炎却是陡然收回目光,眼中那一霎的柔软在顷刻间消失殆尽,取备代之的,是极其浓郁的狠厉与杀意,他早就说过,没有任何人能够阻止他击杀云山,即便这人,是与他关系颇为复杂的云韵!</prosody>
</mstts:express-as>
</voice>
</speak>
多人样本参考
<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US">
<voice name="zh-CN-YunyangNeural">
<mstts:express-as style="narration-professional">
<prosody rate="24%" pitch="0%"> 就在云韵脸颊苍白略微变淡时,萧炎却是陡然收回目光,眼中那一霎的柔软在顷刻间消失殆尽,取备代之的,是极其浓郁的狠厉与杀意,他早就说过,没有任何人能够阻止他击杀云山,即便这人,是与他关系颇为复杂的云韵!</prosody>
</mstts:express-as>
</voice>
<voice name="zh-CN-YunfengNeural">
<mstts:express-as style="cheerful">
<prosody rate="7%" pitch="0%"> “云韵,萧家的血债,必须有人来尝还!”</prosody>
</mstts:express-as>
</voice>
<voice name="zh-CN-XiaoshuangNeural">
<mstts:express-as style="chat">
<prosody rate="7%" pitch="0%"> 淡漠的声音轻轻的从萧炎嘴中吐出,旋即飘飘荡荡的在广场之上响起。</prosody>
</mstts:express-as>
</voice>
</speak>
参数说明
- oice name="zh-HK-HiuMaanNeural" (zh-HK-HiuMaanNeural表示发音人)可参考《语音合成》或官网说明
- prosody rate="49%" pitch="0%"(rate表示语速,pitch表示音调)
- mstts:express-as style="serious"(serious表示发语气)
其他说明
停顿:在需要停顿的地方加上“<break time="2000ms" />”也就是2秒,如:
本工具由3 6 0模板吧采用微软语音合成项目开发的<break time="2000ms" />专业收费版文本转语音工具,本工具广泛用于新媒体运营,其中SSML为高级模式,支持多人配音
多音字:在需要改变文字的的地方加上“<phoneme alphabet="sapi" ph="shan 4">单</phoneme>”shan 四声,如:
隋朝末年,<phoneme alphabet="sapi" ph="shan 4">单</phoneme>雄信参加瓦岗起义,跟随魏公李密,授左武候大将军,参加偃师之战。兵败归降王世充,授大将军。对抗唐军进攻,险些杀害秦王李世民。
语言语音
不同的国家或地区有不同的语音(发音人),这个可以自定义添加,源码都是开源的,如果需要添加更多不同国家或地区的语言或发音人,自己添加就好了,这里我只写大陆和特别地区的发音,完整的还是需要结合官网查看,官网写得更详细,参考现有的矩阵结合官网说明语音支持。
大陆地区:
编号 | 代码 | 人物 | 性别 | 版本 |
---|---|---|---|---|
1 | zh-CN-XiaoxiaoNeural | 晓晓 | 女 | 正式版 |
2 | zh-CN-YunyangNeural | 云扬 | 男 | 正式版 |
3 | zh-CN-XiaochenNeural | 晓辰 | 女 | 正式版 |
4 | zh-CN-XiaohanNeural | 晓涵 | 女 | 正式版 |
5 | zh-CN-XiaomoNeural | 晓墨 | 女 | 正式版 |
6 | zh-CN-XiaoqiuNeural | 晓秋 | 女 | 正式版 |
7 | zh-CN-XiaoruiNeural | 晓睿 | 女 | 正式版 |
8 | zh-CN-XiaoshuangNeural | 晓双 | 女 | 正式版 |
9 | zh-CN-XiaoxuanNeural | 晓萱 | 女 | 正式版 |
10 | zh-CN-XiaoyanNeural | 晓颜 | 女 | 正式版 |
11 | zh-CN-XiaoyouNeural | 晓悠 | 女 | 正式版 |
12 | zh-CN-YunxiNeural | 云希 | 男 | 正式版 |
13 | zh-CN-YunyeNeural | 云野 | 男 | 正式版 |
14 | zh-CN-XiaomengNeural | 晓梦 | 男 | 预览版 |
15 | zh-CN-XiaoyiNeural | 晓伊 | 女 | 预览版 |
16 | zh-CN-XiaozhenNeural | 晓甄 | 女 | 预览版 |
17 | zh-CN-YunfengNeural | 云枫 | 男 | 预览版 |
18 | zh-CN-YunhaoNeural | 云皓 | 男 | 预览版 |
19 | zh-CN-YunjianNeural | 云健 | 男 | 预览版 |
20 | zh-CN-YunxiaNeural | 云夏 | 女 | 预览版 |
21 | zh-CN-YunzeNeural | 云泽 | 男 | 预览版 |
香港地区:
编号 | 代码 | 人物 | 性别 | 版本 |
---|---|---|---|---|
1 | zh-HK-HiuMaanNeural | 曉曼 | 女 | 正式版 |
2 | zh-HK-HiuGaaiNeural | 曉佳 | 女 | 正式版 |
3 | zh-HK-WanLungNeural | 雲龍 | 男 | 正式版 |
台湾地区:
编号 | 代码 | 人物 | 性别 | 版本 |
---|---|---|---|---|
1 | zh-TW-HsiaoChenNeural | 曉臻 | 女 | 正式版 |
2 | zh-TW-HsiaoYuNeural | 曉雨 | 女 | 正式版 |
3 | zh-TW-YunJheNeural | 雲哲 | 男 | 正式版 |
特别注意:预览版声音只在美国东部、西欧和东南亚这三个区域提供。
说话风格
DavisNeural、JaneNeural、JasonNeural、NancyNeural 和 TonyNeural 的愤怒、欢快、兴奋、友好、充满希望、悲伤、大喊大叫、惊恐、不友好和低语风格只在美国东部、西欧和东南亚这三个服务区域提供。 若要了解如何配置和调整神经网络声音风格和角色,请参阅语音合成标记语言。
风格 | 说明 |
---|---|
advertisement-upbeat | 用兴奋和精力充沛的语气推广产品或服务。 |
affectionate | 以较高的音调和音量表达温暖而亲切的语气。 说话者处于吸引听众注意力的状态。 说话者的个性往往是讨喜的。 |
angry | 表达生气和厌恶的语气。 |
assistant | 以热情而轻松的语气对数字助理讲话。 |
calm | 以沉着冷静的态度说话。 语气、音调和韵律与其他语音类型相比要统一得多。 |
chat | 表达轻松随意的语气。 |
cheerful | 表达积极愉快的语气。 |
customerservice | 以友好热情的语气为客户提供支持。 |
depressed | 调低音调和音量来表达忧郁、沮丧的语气。 |
disgruntled | 表达轻蔑和抱怨的语气。 这种情绪的语音表现出不悦和蔑视。 |
embarrassed | 在说话者感到不舒适时表达不确定、犹豫的语气。 |
empathetic | 表达关心和理解。 |
envious | 当你渴望别人拥有的东西时,表达一种钦佩的语气。 |
excited | 表达乐观和充满希望的语气。 似乎发生了一些美好的事情,说话人对此非常满意。 |
fearful | 以较高的音调、较高的音量和较快的语速来表达恐惧、紧张的语气。 说话人处于紧张和不安的状态。 |
friendly | 表达一种愉快、怡人且温暖的语气。 听起来很真诚且满怀关切。 |
gentle | 以较低的音调和音量表达温和、礼貌和愉快的语气。 |
hopeful | 表达一种温暖且渴望的语气。 听起来像是会有好事发生在说话人身上。 |
lyrical | 以优美又带感伤的方式表达情感。 |
narration-professional | 以专业、客观的语气朗读内容。 |
narration-relaxed | 为内容阅读表达一种舒缓而悦耳的语气。 |
newscast | 以正式专业的语气叙述新闻。 |
newscast-casual | 以通用、随意的语气发布一般新闻。 |
newscast-formal | 以正式、自信和权威的语气发布新闻。 |
poetry-reading | 在读诗时表达出带情感和节奏的语气。 |
sad | 表达悲伤语气。 |
serious | 表达严肃和命令的语气。 说话者的声音通常比较僵硬,节奏也不那么轻松。 |
shouting | 就像从遥远的地方说话或在外面说话,但能让自己清楚地听到 |
sports-commentary | 用轻松有趣的语气播报体育赛事。 |
sports-commentary-excited | 用快速且充满活力的语气播报体育赛事精彩瞬间。 |
whispering | 说话非常柔和,发出的声音小且温柔 |
terrified | 表达一种非常害怕的语气,语速快且声音颤抖。 听起来说话人处于不稳定的疯狂状态。 |
unfriendly | 表达一种冷淡无情的语气。 |
试听所有人物发音效果:语音库
视频演示
- 视频文件太大,可到阿里网盘在线查看https://www.aliyundrive.com/s/34yBxtw72r3
在线使用
点击“文本转语音”即可在线使用文字转语音功能,如有疑问可加入交流群反馈,我们也会一直不定时更新维护,另外模板吧也推出了语音转文本工具,大家可在在线工具栏出找到!
评论(0)