|
Qwen3-TTS玩法再升级!社区大神解锁“多角色对话”功能。告别繁琐的音频切片与合成,一套工作流实现自动剧本分角、多音色克隆与无缝对话生成。做播客、广播剧、有声书从此无需剪辑,一个人搞定一个剧组! 一、Qwen3-TTS多角色配音介绍之前给大家分享了个最新的语音新技术Qwen3-TTS,这玩意很有意思,语音设计、声音克隆、自定义语音等功能,可玩性很高。 最近我看有一些技术主把多人语音也实现了,这下功能更全了。 今天来分享下如何使用。 可以在线先体验: 二、相关安装插件这次改了,用派佬的插件:https://github.com/flybirdxx/ComfyUI-Qwen-TTS 模型和之前的一样。
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
直接推荐用1.7B的,显存占用也不高。 网盘也给大家提供了模型网盘,下载后放到路径:modelsqwen-tts
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
三、使用说明
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
上面就是这次的关于多人语音的工作流了 核心的是下面这图只有 Qwen3-TTS VoiceClonePrompt节点用来传入参考的音频声音,然后接入到Qwen3-TTS RoleBank节点中,这里要记得给对应的角色起个名字。 最后传入到Qwen3-TTS DialogueInference中。
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
传入多个角色模型,在最终的Qwen3-TTS DialogueInference你需要把这个对话写进来,类似下面这样的文案: 旁白:深圳城中村出租屋楼道,深夜11点,灯光昏黄,阿东拖着疲惫身躯上楼,丽姐倚在自家门口等他,深圳的夜藏着无数打拼的身影,阿东攥着皱巴巴的销售报表,背影被灯光拉得单薄。而倚门的丽姐,妆容精致,一身丝质睡袍,与周遭的烟火气形成鲜明反差。
丽姐:阿东,又忙到这会儿?
阿东:丽姐,您还没睡。
丽姐:看你天天这么拼,累坏了吧。其实啊,不用逼自己太紧。
旁白:丽姐的暗示直白,阿东却红了耳根,低头攥紧了公文包。
阿东:谢谢丽姐关心。我还年轻,想靠自己多拼拼,踏实。
丽姐:倒是我多嘴了。快回去休息,房租的事不急。
阿东:谢谢丽姐!我先回去了。
旁白:看着阿东匆匆进屋的背影,丽姐轻叹。一个渴望用捷径卸下疲惫,一个执着用努力扎根城市,两种选择,藏着各自的坚守。
是不是很简单,角色设定和文案里面只要角色名称匹配上,系统就可以自动区分了,还是很方便的。 来听一下我跑的效果,我弄了旁白、丽姐、阿东 三个音色。 上面这个是直接重新设计音色。
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
大家也可以自己传入已有的音色
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
两种方案都行的。 案例展示
我就跑了一个案例,大家听听。
整段音频里面很好的区分了三种音色,非常的Nice~
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
注意事项
补充下之前那个音乐模型HeartMULA音乐模型的更新,发布了新模型,效果会更好一些,直接更新下插件然后下载新模型就好。
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
下载模型的时候把这2个下载即可,也丢网盘了,去之前对应文章里面获取网盘链接。
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
工作流里面只要改个参数。
AI 播客神器!基于 Qwen3-TTS 的多人对话工作流,对话感真实到可怕
|