Пусть персонажи заговорят: синтез голоса для диалогов

Функция Dialogue Voice в Noveble автоматически распознаёт диалоги в главе, назначает каждому персонажу стабильный голос и поддерживает построчное воспроизведение и повторную генерацию.

13 мин чтения
автор @sukitly

Когда читаешь главу, где много диалогов, возникает маленькая проблема: глаза читают текст, а мозг постоянно переключается — «кто сейчас говорит?». Особенно это заметно, когда в сцене много персонажей: стоит на секунду отвлечься — и приходится листать назад, чтобы найти предыдущую реплику.

Функция Dialogue Voice в Noveble решает это: она автоматически распознаёт диалоги в главе, подбирает голоса для персонажей и воспроизводит реплики по клику.

Распознавание диалогов

«Просто прочитать то, что внутри кавычек» звучит просто, но на деле есть несколько сложностей:

  • Много форматов кавычек: китайский использует " ", японский — 「 」, а некоторые авторы смешивают разные стили
  • Не все кавычки — это диалог: внутренний монолог, цитаты и названия книг тоже могут быть в кавычках
  • Говорящий часто не указан: авторы не пишут «сказал(а) X» в каждой реплике — приходится выводить из контекста

Noveble использует подход извлечение правилами + оценка ИИ:

  1. Сначала правила выделяют кандидатные фрагменты, чтобы точно сохранить позиции
  2. Затем ИИ решает, где настоящий диалог, кто говорит и какая интонация подходит

Так мы сохраняем точность позиционирования диалогов и корректно отфильтровываем недиалоговый контент.

Подбор голоса персонажу

Чтобы разные персонажи звучали различимо, Noveble опирается на данные профиля (пол, возраст, характер и т. д.) и назначает каждому персонажу стабильный голос. Если тот же персонаж появляется в других главах, голос остаётся одинаковым.

Для каждой реплики ИИ также генерирует «подсказки актёрской игры»: темп речи, интенсивность эмоций, места пауз — чтобы звучание было естественнее.

Если какая-то реплика не нравится, её можно перегенерировать отдельно — до 3 вариантов на одну строку.

Интерактивная демонстрация

Нажмите кнопку «Dialogue Voice» на панели ниже, чтобы попробовать распознавание диалогов и воспроизведение голоса:

Демо-глава

The neon lights bled into blurry halos through the rain. Lin Yuan pushed open the bar door, its metal hinges screaming in protest. The bartender behind the counter looked up, red light flickering in his mechanical eye: "Back again? Third time this month." Lin Yuan didn't answer, walking straight to the corner booth. A figure in a black hood was already waiting there. "Did you bring it?" A hoarse voice emerged from under the hood. Lin Yuan slid a chip across the table: "Here's what you wanted. Five million neurons worth of memory backup." The hooded figure reached out with a hand covered in circuit patterns, examining the chip against the light: "Good. This should be enough for me to remember who I am."
Это демонстрационный компонент для показа интерфейса генерации голоса диалогов. Фактическая функция будет вызывать ИИ для генерации голоса в реальном времени.

Как пользоваться

На странице чтения главы:

  1. Сгенерировать голос: нажмите «Dialogue Voice» — ИИ автоматически распознает и сгенерирует
  2. Воспроизвести: рядом с каждой репликой есть кнопка проигрывания
  3. Перегенерировать: если не нравится — повторите для одной реплики (до 3 вариантов)
  4. Выключить: нажмите кнопку ещё раз, чтобы вернуться к режиму «только текст»

Зайдите на Noveble, чтобы попробовать синтез голоса для диалогов.