让角色开口说话:对话语音生成功能

Noveble 的对话语音功能:自动识别章节中的对话,为每个角色分配稳定声线,支持逐句播放和重新生成。

5 分钟阅读
作者: @sukitly

阅读对话密集的章节时,你可能会遇到一个小麻烦:眼睛在看字,脑子却要不停切换"这是谁在说话"。多角色同框时尤其明显,一不留神就要倒回去找上一段。

Noveble 的对话语音功能可以帮你解决这个问题:自动识别章节中的对话,为每个角色配上声音,点击即可播放

对话识别

"把引号里的句子读出来"听起来简单,实际上有不少挑战:

  • 引号格式多样:中文用 " ",日文用 「 」,有些作者还会混用
  • 不是所有引号都是对话:内心独白、引用、书名都可能带引号
  • 说话人经常省略:作者不会每句都写"某某说",需要从上下文推断

Noveble 采用 代码提取 + AI 判断 的方案:

  1. 先用规则把候选片段切出来,确保位置准确
  2. 再让 AI 判断哪些是真正的对话、谁在说话、应该用什么语气

这样既保证了对话位置的精确性,也能正确过滤掉非对话内容。

角色声音匹配

为了让不同角色的声音可区分,Noveble 会参考角色档案中的信息(性别、年龄、性格等),为每个角色分配稳定的声音。同一个角色在不同章节出现时,声音保持一致。

对于每句台词,AI 还会生成表演提示:语速快慢、情绪强度、停顿位置等,让声音更自然。

如果某句不满意,可以单句重新生成,每句最多 3 个版本可选。

交互式演示

点击下方工具栏的"对话语音"按钮,体验对话识别和语音播放:

Demo Chapter

The neon lights bled into blurry halos through the rain. Lin Yuan pushed open the bar door, its metal hinges screaming in protest. The bartender behind the counter looked up, red light flickering in his mechanical eye: "Back again? Third time this month." Lin Yuan didn't answer, walking straight to the corner booth. A figure in a black hood was already waiting there. "Did you bring it?" A hoarse voice emerged from under the hood. Lin Yuan slid a chip across the table: "Here's what you wanted. Five million neurons worth of memory backup." The hooded figure reached out with a hand covered in circuit patterns, examining the chip against the light: "Good. This should be enough for me to remember who I am."
这是一个演示组件,用于展示对话语音生成的界面。实际功能会调用 AI 实时生成语音。

如何使用

在章节阅读页面:

  1. 生成语音:点击"对话语音"按钮,AI 自动识别并生成
  2. 播放:每段对话旁边有播放按钮
  3. 重新生成:不满意可以单句重试,每句最多 3 个版本
  4. 关闭:再次点击按钮,恢复纯文本模式

立即访问 Noveble 体验对话语音生成功能。