|
|
Qwen3-TTS-1.7B,6G显存可用,音色保存,接口API调用,支持超长文本,支持50系显卡,语速调节,音频超分降噪,接入开源阅读,文字转语音,TTS,阿里开源,自定义端口
Qwen3-TTS-1.7B,6G显存可用,音色保存,接口API调用,支持超长文本...
线上镜像:https://www.compshare.cn/images/ ... _yy_bilibili_lyblog
接口格式:http://localhost:9880/?text=你好,测试一下&speaker=四川方言
其他参数:chunk batch speed
关键点:
1
00:00:08,933 --> 00:00:09,800
大家好
2
00:00:09,866 --> 00:00:13,300
阿里最新开源的 Qwen3 tts 1.7B 模型
3
00:00:13,400 --> 00:00:16,966
支持多国语言和自定义声音的创建和设计
4
00:00:17,666 --> 00:00:19,300
适合甜品卡使用
5
00:00:19,933 --> 00:00:22,400
双击 开始 自动启动接口服务
6
00:00:22,966 --> 00:00:24,000
目标文本
7
00:00:24,600 --> 00:00:25,700
参考音频
8
00:00:42,466 --> 00:00:46,166
设备是 4060 笔记本 显存占用5G左右
9
00:01:23,000 --> 00:01:24,400
支持多国语言
10
00:01:34,600 --> 00:01:36,300
这里可以保存音色
11
00:01:42,733 --> 00:01:45,233
下一次直接用保存的音色推理
12
00:01:47,266 --> 00:01:50,233
这里可以根据指令来创建自己的音色
13
00:01:50,966 --> 00:01:52,366
输入测试文本
14
00:02:06,433 --> 00:02:08,133
保存设计好的音色
15
00:02:18,966 --> 00:02:20,533
支持自定义方言
16
00:02:40,200 --> 00:02:45,433
这里可以直接使用接口服务
17
00:02:53,733 --> 00:02:55,933
接入开源阅读的朗读引擎
18
00:04:20,400 --> 00:04:22,366
以上,感谢您的观看
19
00:04:22,400 --> 00:04:24,333
这里是刘悦的技术博客
- 下载次数:
- 8
- Qwen3-TTS-1.7B,6G显存可用,音色保存,接口API调用,支持超长文本...
-
本地下载
|
|