71

主题

-9

回帖

312

修为

创始合伙人

积分
603
Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,批量任务,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,文字转语音,TTS


Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,...

Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,...




关键点:


1
00:00:08,933 --> 00:00:11,700
大家好,Qwen3 tts 做了更新

2
00:00:11,733 --> 00:00:14,466
集成了 0.6B和1.7B模型

3
00:00:14,533 --> 00:00:15,733
可以任意切换

4
00:00:16,533 --> 00:00:19,000
修复反馈的英语的数字发音问题

5
00:00:19,866 --> 00:00:21,866
增加中文多音字控制

6
00:00:22,466 --> 00:00:23,900
增加批量任务

7
00:00:24,533 --> 00:00:25,600
双击开始

8
00:00:28,533 --> 00:00:30,700
默认可以上传参考音频

9
00:00:43,233 --> 00:00:45,466
设备是 4060 笔记本

10
00:00:45,466 --> 00:00:47,266
显存占用 3G 左右

11
00:01:08,333 --> 00:01:10,966
这里默认是自动侦测目标语言

12
00:01:11,600 --> 00:01:14,000
但是英语的数字发音会有问题

13
00:01:23,833 --> 00:01:26,500
只需把目标语言选择英语即可

14
00:01:35,733 --> 00:01:38,733
选择目标语言后,读音会更精准

15
00:01:52,800 --> 00:01:54,933
这里可以控制模型参数

16
00:01:55,533 --> 00:01:57,366
这里可以控制多音字

17
00:02:03,800 --> 00:02:05,200
直接访问接口

18
00:02:12,533 --> 00:02:14,133
如果需要指定语言

19
00:02:14,200 --> 00:02:15,766
那么传入 lang 参数

20
00:02:21,833 --> 00:02:23,666
这里是批量任务模版

21
00:02:23,666 --> 00:02:25,200
有各种默认参数

22
00:02:25,233 --> 00:02:26,600
根据需求修改

23
00:02:36,733 --> 00:02:38,133
点击批量任务

24
00:02:40,666 --> 00:02:41,766
上传模版

25
00:02:50,233 --> 00:02:52,100
结果在批量任务目录

26
00:03:20,066 --> 00:03:22,100
以上,感谢您的观看

27
00:03:22,133 --> 00:03:24,066
这里是刘悦的技术博客


昨天 21:52 上传
下载次数:
0
Qwen3-TTS-AllinOne,4G显存可用,多音字控制,英文数字发音纠正,...
本地下载
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

© 2001-2026 BBS.Monster