|
|
Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS
Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,...
关键点:
1
00:00:08,933 --> 00:00:11,700
大家好,Qwen3 tts 做了更新
2
00:00:11,733 --> 00:00:14,466
集成了 0.6B和1.7B模型
3
00:00:14,533 --> 00:00:15,733
可以任意切换
4
00:00:16,533 --> 00:00:19,000
修复反馈的英语的数字发音问题
5
00:00:19,866 --> 00:00:21,866
增加中文多音字控制
6
00:00:22,466 --> 00:00:23,900
增加批量任务
7
00:00:24,533 --> 00:00:25,600
双击开始
8
00:00:28,533 --> 00:00:30,700
默认可以上传参考音频
9
00:00:43,233 --> 00:00:45,466
设备是 4060 笔记本
10
00:00:45,466 --> 00:00:47,266
显存占用 3G 左右
11
00:01:08,333 --> 00:01:10,966
这里默认是自动侦测目标语言
12
00:01:11,600 --> 00:01:14,000
但是英语的数字发音会有问题
13
00:01:23,833 --> 00:01:26,500
只需把目标语言选择英语即可
14
00:01:35,733 --> 00:01:38,733
选择目标语言后,读音会更精准
15
00:01:52,800 --> 00:01:54,933
这里可以控制模型参数
16
00:01:55,533 --> 00:01:57,366
这里可以控制多音字
17
00:02:03,800 --> 00:02:05,200
直接访问接口
18
00:02:12,533 --> 00:02:14,133
如果需要指定语言
19
00:02:14,200 --> 00:02:15,766
那么传入 lang 参数
20
00:02:21,833 --> 00:02:23,666
这里是批量任务模版
21
00:02:23,666 --> 00:02:25,200
有各种默认参数
22
00:02:25,233 --> 00:02:26,600
根据需求修改
23
00:02:36,733 --> 00:02:38,133
点击批量任务
24
00:02:40,666 --> 00:02:41,766
上传模版
25
00:02:50,233 --> 00:02:52,100
结果在批量任务目录
26
00:03:20,066 --> 00:03:22,100
以上,感谢您的观看
27
00:03:22,133 --> 00:03:24,066
这里是刘悦的技术博客
- 下载次数:
- 0
- Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,...
-
本地下载
|
|