캐릭터에게 목소리를 부여하기: 대화 음성 합성

Noveble의 Dialogue Voice 기능은 챕터의 대화를 자동으로 감지하고, 각 캐릭터에 일관된 목소리를 할당하며, 문장별 재생과 재생성까지 지원합니다.

7분 읽기
저자 @sukitly

대사가 많은 챕터를 읽다 보면 작은 불편이 생깁니다. 눈은 글자를 따라가는데, 머릿속은 계속—"지금 누가 말하는 거지?"—를 전환하느라 바빠지죠. 여러 캐릭터가 한 장면에 함께 등장할수록 더 두드러지고, 잠깐만 집중이 흐트러져도 이전 대사를 찾느라 다시 위로 스크롤하게 됩니다.

Noveble의 Dialogue Voice 기능은 이를 해결합니다: 챕터 속 대화를 자동으로 감지하고, 캐릭터마다 목소리를 배정한 뒤, 클릭 한 번으로 재생합니다.

대화 감지

"따옴표 안의 문장을 읽으면 되지"라고 생각하기 쉽지만, 실제로는 어려운 점이 많습니다:

  • 따옴표 형태가 다양함: 중국어는 " ", 일본어는 「 」를 사용하고, 일부 작가는 혼용하기도 합니다
  • 따옴표가 모두 대화는 아님: 내면 독백, 인용, 책 제목도 따옴표를 사용할 수 있습니다
  • 화자가 자주 생략됨: 매 문장마다 "누가 말했다"를 쓰지 않기 때문에 문맥 추론이 필요합니다

Noveble은 규칙 기반 추출 + AI 판정 방식을 사용합니다:

  1. 먼저 규칙으로 후보 구간을 잘라 위치를 정확히 잡고
  2. 그다음 AI가 실제 대화인지, 누가 말하는지, 어떤 톤이 적절한지 판단합니다

이 방식으로 대화 위치의 정확도를 유지하면서, 비대화 내용도 올바르게 걸러낼 수 있습니다.

캐릭터 음성 매칭

캐릭터별 목소리가 구분되도록 Noveble은 캐릭터 프로필(성별, 나이, 성격 등) 정보를 참고해 각 캐릭터에 안정적인 목소리를 할당합니다. 같은 캐릭터가 다른 챕터에 등장해도 목소리는 일관되게 유지됩니다.

또한 각 대사마다 AI가 연기 지시를 생성합니다—말하기 속도, 감정 강도, 멈춤 지점 등—더 자연스럽게 들리도록 돕습니다.

만약 특정 대사가 마음에 들지 않으면 해당 문장만 다시 생성할 수 있고, 문장당 최대 3가지 버전을 선택할 수 있습니다.

인터랙티브 데모

아래 툴바에서 "Dialogue Voice" 버튼을 눌러 대화 감지와 음성 재생을 체험해 보세요:

데모 챕터

The neon lights bled into blurry halos through the rain. Lin Yuan pushed open the bar door, its metal hinges screaming in protest. The bartender behind the counter looked up, red light flickering in his mechanical eye: "Back again? Third time this month." Lin Yuan didn't answer, walking straight to the corner booth. A figure in a black hood was already waiting there. "Did you bring it?" A hoarse voice emerged from under the hood. Lin Yuan slid a chip across the table: "Here's what you wanted. Five million neurons worth of memory backup." The hooded figure reached out with a hand covered in circuit patterns, examining the chip against the light: "Good. This should be enough for me to remember who I am."
이것은 대화 음성 생성 인터페이스를 보여주는 데모 컴포넌트입니다. 실제 기능은 AI를 호출하여 실시간으로 음성을 생성합니다.

사용 방법

챕터 읽기 페이지에서:

  1. 음성 생성: "Dialogue Voice"를 클릭하면 AI가 자동으로 감지 및 생성합니다
  2. 재생: 각 대화 구간 옆에 재생 버튼이 있습니다
  3. 재생성: 만족스럽지 않다면 문장 하나만 재시도(문장당 최대 3버전)
  4. 끄기: 버튼을 다시 눌러 텍스트 모드로 돌아갑니다

Noveble에서 대화 음성 합성을 지금 바로 체험해 보세요.