# APNG Lip Sync Tool 개발기 - v9: TTS 통합 ## 개요 Google TTS (gTTS)를 사용하여 텍스트를 음성으로 변환하고, 음성 길이 정보를 추출합니다. ## TTS 엔진 ```python from gtts import gTTS from pydub import AudioSegment def generate_speech(text: str, output_path: str, language: str = "ko") -> dict: """Generate speech audio from text.""" tts = gTTS(text=text, lang=language) tts.save(tmp_path) # Get duration using pydub audio = AudioSegment.from_mp3(tmp_path) duration_ms = len(audio) return { "success": True, "path": str(output_path), "duration_ms": duration_ms, "text": text } ``` ## 타이밍 정보 생성 ```python def generate_speech_with_timing(text: str) -> dict: """Generate speech and phoneme timing information.""" speech_result = generate_speech(text) timings = estimate_phoneme_timings(text, speech_result["duration_ms"]) return { **speech_result, "timings": timings } ``` ## 지원 언어 - 한국어 (ko) - 기본 - 영어 (en) - 일본어 (ja) - 중국어 (zh-CN) --- *다음: v10 - 텍스트 → 발음기호 변환*