# APNG Lip Sync Tool 개발기 - v9: TTS 통합

## 개요

Google TTS (gTTS)를 사용하여 텍스트를 음성으로 변환하고, 음성 길이 정보를 추출합니다.

## TTS 엔진

```python
from gtts import gTTS
from pydub import AudioSegment

def generate_speech(text: str, output_path: str, language: str = "ko") -> dict:
    """Generate speech audio from text."""
    tts = gTTS(text=text, lang=language)
    tts.save(tmp_path)

    # Get duration using pydub
    audio = AudioSegment.from_mp3(tmp_path)
    duration_ms = len(audio)

    return {
        "success": True,
        "path": str(output_path),
        "duration_ms": duration_ms,
        "text": text
    }
```

## 타이밍 정보 생성

```python
def generate_speech_with_timing(text: str) -> dict:
    """Generate speech and phoneme timing information."""
    speech_result = generate_speech(text)
    timings = estimate_phoneme_timings(text, speech_result["duration_ms"])

    return {
        **speech_result,
        "timings": timings
    }
```

## 지원 언어

- 한국어 (ko) - 기본
- 영어 (en)
- 일본어 (ja)
- 중국어 (zh-CN)

---

*다음: v10 - 텍스트 → 발음기호 변환*