AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

嘟先生 · 昨天 01:29

Qwen3-TTS玩法再升级！社区大神解锁“多角色对话”功能。告别繁琐的音频切片与合成，一套工作流实现自动剧本分角、多音色克隆与无缝对话生成。做播客、广播剧、有声书从此无需剪辑，一个人搞定一个剧组！

一、Qwen3-TTS多角色配音介绍
之前给大家分享了个最新的语音新技术Qwen3-TTS，这玩意很有意思，语音设计、声音克隆、自定义语音等功能，可玩性很高。
最近我看有一些技术主把多人语音也实现了，这下功能更全了。
今天来分享下如何使用。
可以在线先体验：
工作流：Qwen3 TTS最新多角色配音
体验地址：https://www.runninghub.cn/post/2 ... inviteCode=rh-v1093

二、相关安装
插件这次改了，用派佬的插件：https://github.com/flybirdxx/ComfyUI-Qwen-TTS
模型和之前的一样。

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

直接推荐用1.7B的，显存占用也不高。
网盘也给大家提供了模型网盘，下载后放到路径：modelsqwen-tts

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

三、使用说明

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

上面就是这次的关于多人语音的工作流了
核心的是下面这图只有
Qwen3-TTS VoiceClonePrompt节点用来传入参考的音频声音，然后接入到Qwen3-TTS RoleBank节点中，这里要记得给对应的角色起个名字。
最后传入到Qwen3-TTS DialogueInference中。

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

传入多个角色模型，在最终的Qwen3-TTS DialogueInference你需要把这个对话写进来，类似下面这样的文案：
旁白：深圳城中村出租屋楼道，深夜11点，灯光昏黄，阿东拖着疲惫身躯上楼，丽姐倚在自家门口等他，深圳的夜藏着无数打拼的身影，阿东攥着皱巴巴的销售报表，背影被灯光拉得单薄。而倚门的丽姐，妆容精致，一身丝质睡袍，与周遭的烟火气形成鲜明反差。

丽姐：阿东，又忙到这会儿？

阿东：丽姐，您还没睡。

丽姐：看你天天这么拼，累坏了吧。其实啊，不用逼自己太紧。

旁白：丽姐的暗示直白，阿东却红了耳根，低头攥紧了公文包。

阿东：谢谢丽姐关心。我还年轻，想靠自己多拼拼，踏实。

丽姐：倒是我多嘴了。快回去休息，房租的事不急。

阿东：谢谢丽姐！我先回去了。

旁白：看着阿东匆匆进屋的背影，丽姐轻叹。一个渴望用捷径卸下疲惫，一个执着用努力扎根城市，两种选择，藏着各自的坚守。

是不是很简单，角色设定和文案里面只要角色名称匹配上，系统就可以自动区分了，还是很方便的。
来听一下我跑的效果，我弄了旁白、丽姐、阿东三个音色。
上面这个是直接重新设计音色。

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

大家也可以自己传入已有的音色

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

两种方案都行的。

案例展示
我就跑了一个案例，大家听听。

整段音频里面很好的区分了三种音色，非常的Nice~

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

注意事项
补充下之前那个音乐模型HeartMULA音乐模型的更新，发布了新模型，效果会更好一些，直接更新下插件然后下载新模型就好。

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

下载模型的时候把这2个下载即可，也丢网盘了，去之前对应文章里面获取网盘链接。

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

工作流里面只要改个参数。

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

AI 播客神器！基于 Qwen3-TTS 的多人对话工作流，对话感真实到可怕

浏览过的版块