Skip to the content.

Gemini TTS

Google Gemini AI를 사용한 고품질 TTS 기능입니다.


Gemini TTS란?

Google의 Gemini AI 모델을 사용하여 자연스러운 음성을 생성합니다.

특징

특징 설명
고품질 음성 자연스러운 억양과 발음
다양한 음성 30개의 음성 중 선택
오디오 캐싱 재생 속도 향상
스타일 커스터마이징 음성 스타일 지정 가능

요구사항


설정

TTS 제공자 변경

  1. 뷰어에서 TTS 버튼 클릭
  2. TTS 설정에서 “Gemini” 선택

API 키 확인

Gemini TTS를 사용하려면 Gemini API 키가 등록되어 있어야 합니다.

API 키 설정 참조


음성 선택

Gemini TTS는 30개의 다양한 음성을 제공합니다.

음성 목록 예시

음성 이름 특성
Zephyr 밝고 경쾌한 톤
Puck 활기차고 생동감 있는
Charon 차분하고 정보 전달형
Kore 부드럽고 따뜻한
총 30개 음성

음성 선택 방법

  1. TTS 설정 열기
  2. “음성” 섹션에서 음성 선택
  3. 각 음성의 특성 확인 후 선택

: 소설 장르에 맞는 음성을 선택하면 청취 경험이 향상됩니다.


사용 방법

재생 시작

Android TTS와 동일한 방법으로 사용합니다.

  1. 뷰어에서 TTS 버튼 클릭
  2. 오디오 생성 후 재생 시작

생성 과정

오디오 생성 중...
━━━━━━━━━━░░░░░░░░░░
청크 3/8 처리 중

참고: 첫 재생 시 오디오 생성에 시간이 걸릴 수 있습니다.


미니 플레이어

Gemini TTS는 청크 단위로 재생되어 미니 플레이어가 표시됩니다.

미니 플레이어 기능

버튼 기능
▶️/⏸️ 재생/일시정지
⏮️ 이전 청크
⏭️ 다음 청크
진행바 현재 위치 표시/이동

청크란?

긴 텍스트를 여러 부분으로 나누어 처리합니다.


오디오 캐싱

캐싱이란?

생성된 오디오를 저장하여 재생 시 다시 생성하지 않습니다.

장점

캐시 표시

회차 목록에서 캐시된 회차는 🔊 아이콘으로 표시됩니다.


TTS 프리캐시

읽기 전에 미리 오디오를 생성할 수 있습니다.

설정

소설별 설정에서:

  1. 소설 상세 > 설정
  2. TTS 프리캐시 토글 ON

동작

  1. 미리 받기(Prefetch)와 함께 작동
  2. 다음 회차 다운로드 + 번역 + TTS 생성
  3. 회차 전환 시 즉시 재생 가능

주의: API 비용이 추가로 발생합니다.


TTS 모델 선택

Gemini TTS에서 사용할 모델을 선택할 수 있습니다.

모델 옵션

모델 설명
gemini-2.5-flash-preview-tts 빠른 속도, 낮은 비용 (기본)
gemini-2.5-pro-preview-tts 높은 품질, 높은 비용

설정 방법

  1. TTS 설정 시트 열기
  2. “TTS 모델” 드롭다운에서 선택

스타일 프롬프트

음성 스타일을 커스터마이징할 수 있습니다.

스타일 프롬프트 모드

소설별 설정에서 3가지 모드를 선택할 수 있습니다:

모드 설명
OFF 스타일 프롬프트 사용 안 함
AUTO 기본 스타일 프롬프트 사용
CUSTOM 사용자 지정 프롬프트

스타일 자동 생성

“자동 생성” 버튼을 클릭하면 AI가 소설에 맞는 스타일 프롬프트를 자동으로 생성합니다.

커스텀 프롬프트 예시

차분하고 부드러운 목소리로 읽어주세요.
감정 표현을 풍부하게 해주세요.
활기차고 밝은 톤으로 읽어주세요.
대화 부분은 캐릭터별로 다르게 표현해주세요.

청킹 설정

텍스트를 나누는 방식을 설정합니다.

소설별 설정

설정 설명 기본값
최소 청크 길이 청크 최소 길이 3,000자
최대 청크 길이 청크 최대 길이 10,000자
청크 간 대기 시간 청크 사이 대기 100ms

청크 크기 조절

설정 효과
작은 청크 빠른 시작, 잦은 끊김
큰 청크 느린 시작, 자연스러운 흐름

API 타임아웃

TTS 생성 시간 제한을 설정합니다.

소설별 설정

  1. 소설 상세 > 설정
  2. TTS API 타임아웃 조정
용도
60초 빠른 실패
180초 일반 (기본)
300초+ 긴 텍스트

최소 30초, 최대 900초(15분)까지 설정 가능


비용 관리

비용 발생

Gemini TTS는 API 호출마다 비용이 발생합니다.

비용 절약 팁

  1. 캐싱 활용: 같은 회차 재생 시 캐시 사용
  2. 필요한 회차만: 불필요한 프리캐시 비활성화
  3. Android TTS 병행: 간단한 확인은 Android TTS 사용

사용량 확인

설정 > API 사용량 통계에서 TTS 사용량 확인


Android TTS vs Gemini TTS

항목 Android TTS Gemini TTS
음성 품질 기본 고품질
음성 선택 시스템 제공 30개 음성
비용 무료 유료
오프라인 지원 미지원 (캐시 제외)
시작 속도 즉시 생성 후 시작
캐싱 없음 있음
스타일 조절 제한적 자유로움

사용 시나리오

시나리오 추천
빠른 확인 Android TTS
품질 중시 Gemini TTS
오프라인 Android TTS
장시간 청취 Gemini TTS (캐싱)
비용 절약 Android TTS

문제 해결

“오디오 생성에 실패했습니다”

해결:

  1. Gemini API 키 확인
  2. 인터넷 연결 확인
  3. 할당량 확인
  4. 타임아웃 증가

오디오가 끊김

해결:

  1. 네트워크 상태 확인
  2. 청크 크기 조정
  3. 캐시된 오디오 사용

캐시가 작동 안 함

해결:

  1. 저장 공간 확인
  2. 앱 캐시 권한 확인

음질이 기대와 다름

해결:

  1. 다른 음성 선택
  2. 스타일 프롬프트 조정
  3. 청크 크기 최적화

← Android TTS 목차로 →