Gemini TTS
Google Gemini AI를 사용한 고품질 TTS 기능입니다.
Gemini TTS란?
Google의 Gemini AI 모델을 사용하여 자연스러운 음성을 생성합니다.
특징
| 특징 | 설명 |
|---|---|
| 고품질 음성 | 자연스러운 억양과 발음 |
| 다양한 음성 | 30개의 음성 중 선택 |
| 오디오 캐싱 | 재생 속도 향상 |
| 스타일 커스터마이징 | 음성 스타일 지정 가능 |
요구사항
- Gemini API 키
- 인터넷 연결
- API 비용 발생
설정
TTS 제공자 변경
- 뷰어에서 TTS 버튼 클릭
- TTS 설정에서 “Gemini” 선택
API 키 확인
Gemini TTS를 사용하려면 Gemini API 키가 등록되어 있어야 합니다.
→ API 키 설정 참조
음성 선택
Gemini TTS는 30개의 다양한 음성을 제공합니다.
음성 목록 예시
| 음성 이름 | 특성 |
|---|---|
| Zephyr | 밝고 경쾌한 톤 |
| Puck | 활기차고 생동감 있는 |
| Charon | 차분하고 정보 전달형 |
| Kore | 부드럽고 따뜻한 |
| … | 총 30개 음성 |
음성 선택 방법
- TTS 설정 열기
- “음성” 섹션에서 음성 선택
- 각 음성의 특성 확인 후 선택
팁: 소설 장르에 맞는 음성을 선택하면 청취 경험이 향상됩니다.
사용 방법
재생 시작
Android TTS와 동일한 방법으로 사용합니다.
- 뷰어에서 TTS 버튼 클릭
- 오디오 생성 후 재생 시작
생성 과정
오디오 생성 중...
━━━━━━━━━━░░░░░░░░░░
청크 3/8 처리 중
참고: 첫 재생 시 오디오 생성에 시간이 걸릴 수 있습니다.
미니 플레이어
Gemini TTS는 청크 단위로 재생되어 미니 플레이어가 표시됩니다.
미니 플레이어 기능
| 버튼 | 기능 |
|---|---|
| ▶️/⏸️ | 재생/일시정지 |
| ⏮️ | 이전 청크 |
| ⏭️ | 다음 청크 |
| 진행바 | 현재 위치 표시/이동 |
청크란?
긴 텍스트를 여러 부분으로 나누어 처리합니다.
- 각 청크는 개별적으로 오디오 생성
- 청크 단위로 캐싱
오디오 캐싱
캐싱이란?
생성된 오디오를 저장하여 재생 시 다시 생성하지 않습니다.
장점
- 재생 시 즉시 시작
- API 비용 절약
- 오프라인 재생 가능 (캐시된 부분)
캐시 표시
회차 목록에서 캐시된 회차는 🔊 아이콘으로 표시됩니다.
TTS 프리캐시
읽기 전에 미리 오디오를 생성할 수 있습니다.
설정
소설별 설정에서:
- 소설 상세 > 설정
- TTS 프리캐시 토글 ON
동작
- 미리 받기(Prefetch)와 함께 작동
- 다음 회차 다운로드 + 번역 + TTS 생성
- 회차 전환 시 즉시 재생 가능
주의: API 비용이 추가로 발생합니다.
TTS 모델 선택
Gemini TTS에서 사용할 모델을 선택할 수 있습니다.
모델 옵션
| 모델 | 설명 |
|---|---|
| gemini-2.5-flash-preview-tts | 빠른 속도, 낮은 비용 (기본) |
| gemini-2.5-pro-preview-tts | 높은 품질, 높은 비용 |
설정 방법
- TTS 설정 시트 열기
- “TTS 모델” 드롭다운에서 선택
스타일 프롬프트
음성 스타일을 커스터마이징할 수 있습니다.
스타일 프롬프트 모드
소설별 설정에서 3가지 모드를 선택할 수 있습니다:
| 모드 | 설명 |
|---|---|
| OFF | 스타일 프롬프트 사용 안 함 |
| AUTO | 기본 스타일 프롬프트 사용 |
| CUSTOM | 사용자 지정 프롬프트 |
스타일 자동 생성
“자동 생성” 버튼을 클릭하면 AI가 소설에 맞는 스타일 프롬프트를 자동으로 생성합니다.
커스텀 프롬프트 예시
차분하고 부드러운 목소리로 읽어주세요.
감정 표현을 풍부하게 해주세요.
활기차고 밝은 톤으로 읽어주세요.
대화 부분은 캐릭터별로 다르게 표현해주세요.
청킹 설정
텍스트를 나누는 방식을 설정합니다.
소설별 설정
| 설정 | 설명 | 기본값 |
|---|---|---|
| 최소 청크 길이 | 청크 최소 길이 | 3,000자 |
| 최대 청크 길이 | 청크 최대 길이 | 10,000자 |
| 청크 간 대기 시간 | 청크 사이 대기 | 100ms |
청크 크기 조절
| 설정 | 효과 |
|---|---|
| 작은 청크 | 빠른 시작, 잦은 끊김 |
| 큰 청크 | 느린 시작, 자연스러운 흐름 |
API 타임아웃
TTS 생성 시간 제한을 설정합니다.
소설별 설정
- 소설 상세 > 설정
- TTS API 타임아웃 조정
| 값 | 용도 |
|---|---|
| 60초 | 빠른 실패 |
| 180초 | 일반 (기본) |
| 300초+ | 긴 텍스트 |
최소 30초, 최대 900초(15분)까지 설정 가능
비용 관리
비용 발생
Gemini TTS는 API 호출마다 비용이 발생합니다.
비용 절약 팁
- 캐싱 활용: 같은 회차 재생 시 캐시 사용
- 필요한 회차만: 불필요한 프리캐시 비활성화
- Android TTS 병행: 간단한 확인은 Android TTS 사용
사용량 확인
설정 > API 사용량 통계에서 TTS 사용량 확인
Android TTS vs Gemini TTS
| 항목 | Android TTS | Gemini TTS |
|---|---|---|
| 음성 품질 | 기본 | 고품질 |
| 음성 선택 | 시스템 제공 | 30개 음성 |
| 비용 | 무료 | 유료 |
| 오프라인 | 지원 | 미지원 (캐시 제외) |
| 시작 속도 | 즉시 | 생성 후 시작 |
| 캐싱 | 없음 | 있음 |
| 스타일 조절 | 제한적 | 자유로움 |
사용 시나리오
| 시나리오 | 추천 |
|---|---|
| 빠른 확인 | Android TTS |
| 품질 중시 | Gemini TTS |
| 오프라인 | Android TTS |
| 장시간 청취 | Gemini TTS (캐싱) |
| 비용 절약 | Android TTS |
문제 해결
“오디오 생성에 실패했습니다”
해결:
- Gemini API 키 확인
- 인터넷 연결 확인
- 할당량 확인
- 타임아웃 증가
오디오가 끊김
해결:
- 네트워크 상태 확인
- 청크 크기 조정
- 캐시된 오디오 사용
캐시가 작동 안 함
해결:
- 저장 공간 확인
- 앱 캐시 권한 확인
음질이 기대와 다름
해결:
- 다른 음성 선택
- 스타일 프롬프트 조정
- 청크 크기 최적화
| ← Android TTS | 목차로 → |