🎙️ TTS 引擎横评 · EP0 发刊词

同一段《权力的常识》EP0 文稿,多引擎 + 多音色对比。重点关注:自然度、AI味、节奏感、情感表达

⚠️ LongCat 是旧版本(全文 ~6分钟),Qwen3-TTS 只取了开头 ~1分钟做快速对比。
听感差异明显的话,确定引擎后再跑全文。

🔻 基线对照:LongCat(当前方案)

LongCat · 知性学姐 基线

当前正在用的方案,全文 ~6分钟


🆕 Qwen3-TTS(阿里通义 · 49 种预置音色)

① 晨煦 Ethan Qwen3-TTS

温和男声,适合知识分享

② 芊悦 Cherry Qwen3-TTS

清亮女声,默认音色

③ 墨讲师 Elias Qwen3-TTS

讲师风格,沉稳有力

④ 凯 Kai Qwen3-TTS

年轻男声

⑤ 不吃鱼 Nofish Qwen3-TTS

特色男声

⑥ 沧明子 Eldric Sage Qwen3-TTS

精品百人系列,古风/沉稳

⑦ 阿闻 Neil Qwen3-TTS

精品百人系列

⑧ 晓东 Dylan Qwen3-TTS

北京口音,接地气


🎤 声音克隆对比(用你的参考音频)

以下两个用 VoxCPM 克隆你提供的参考音频(女-单人播客.wav / 男-单人播客.wav),短文本测试。
Qwen3-TTS 声音克隆今天 HF GPU 配额用完了,明天补上。

⑨ VoxCPM 克隆 · 女-单人播客参考音频 VoxCPM 女·克隆

用你录制的女声参考音频做声音克隆

⑩ VoxCPM 克隆 · 男-单人播客参考音频 VoxCPM 男·克隆

用你录制的男声参考音频做声音克隆


未能测试的引擎(HF GPU 排队超时 / 需注册):
Qwen3-TTS 声音克隆 — 今天 HF ZeroGPU 配额用完,明天自动重试
• Chatterbox Multilingual(ResembleAI)— GPU 排队超时
• GLM-TTS(智谱)— HF Space 已暂停
• Fish Audio S2 — 需注册 API Key(注册送 8000 credits)
• CosyVoice(SiliconFlow)— 需注册(送 ¥14 额度)

建议操作:挑出你觉得最自然的 1-2 个音色,我用那个引擎跑全文 EP0。