# Gemini CLI와의 여덟 번째 만남: 비용 절감 전략 (2) - 토큰 최적화 기술 지난 단계에서는 글쓰기 작업의 목적에 맞는 Gemini 모델을 선택하는 것이 비용 효율성에 중요하다는 것을 알아보았습니다. 이번 단계에서는 비용 절감의 또 다른 핵심 요소인 '토큰 최적화'에 대해 다루겠습니다. 토큰 사용량을 최소화하는 프롬프트 작성 기술은 비용을 절감할 뿐만 아니라, 모델의 응답 품질과 속도까지 향상시킬 수 있습니다. --- ## 1. 토큰이란 무엇이며, 왜 중요한가? 대규모 언어 모델(LLM)은 텍스트를 토큰(Token)이라는 단위로 처리합니다. 토큰은 단어, 단어의 일부분, 구두점 등 다양한 형태를 가질 수 있습니다. 예를 들어, "안녕하세요"는 하나의 토큰일 수 있고, "Hello, world!"는 "Hello", ",", " world", "!" 등으로 여러 개의 토큰으로 나뉠 수 있습니다. **토큰이 중요한 이유:** * **과금의 기준:** Gemini 모델은 입력(프롬프트) 토큰과 출력(응답) 토큰의 양에 따라 비용이 청구됩니다. 토큰 사용량이 많을수록 비용이 증가합니다. * **처리 속도:** 모델이 처리해야 할 토큰 수가 많을수록 응답 시간이 길어집니다. * **컨텍스트 한계:** 모델이 한 번에 처리할 수 있는 토큰의 총량(컨텍스트 창 크기)에는 제한이 있습니다. 불필요한 토큰은 이 제한을 빠르게 소모하여, 모델이 중요한 정보를 놓치게 할 수 있습니다. ## 2. CLI에서 효율적인 프롬프트를 작성하는 기술 Gemini CLI를 사용할 때 토큰을 최적화하기 위한 구체적인 전략은 다음과 같습니다. ### 2.1. 명확하고 간결하게 지시하기 불필요한 수식어, 인사말, 배경 설명은 토큰을 낭비합니다. 핵심 지시 사항을 명확하고 간결하게 전달하세요. * **비효율적인 예:** "제가 지금 블로그 글을 쓰고 있는데, 너무 길어서 요약이 필요해요. 혹시 이 긴 글을 세 문장으로 아주 간결하게 요약해 주실 수 있을까요? 감사하겠습니다." (많은 불필요한 대화체) * **효율적인 예:** "다음 텍스트를 세 문장으로 요약해 줘." ### 2.2. 구체적인 형식으로 응답 요청하기 모델에게 특정 응답 형식을 요구하면, 모델이 불필요한 서론이나 결론 없이 요청한 내용만 간결하게 생성하도록 유도할 수 있습니다. 이는 출력 토큰 절감에도 효과적입니다. * **비효율적인 예:** "블로그 주제 아이디어 좀 알려줘." (모델이 서술식으로 길게 설명할 수 있음) * **효율적인 예:** "블로그 주제 아이디어를 5가지 불릿 포인트로 작성해 줘." ### 2.3. 필요한 컨텍스트만 제공하기 `--file` 옵션으로 파일을 첨부할 때, 파일 전체 내용이 아니라 모델이 작업을 수행하는 데 정말로 필요한 부분만 포함하도록 문서를 미리 정리하는 것이 좋습니다. * **예시:** 특정 섹션의 요약이 필요하다면, 파일 전체를 첨부하는 대신 해당 섹션만 추출하여 모델에 전달합니다. (또는 `v2`에서 다룬 것처럼 파일 전체를 첨부하되, 프롬프트에서 "이 문서의 [특정 섹션]을 요약해 줘"와 같이 명확히 지시합니다. 모델의 이해도를 믿되, 불필요한 정보 탐색 시간을 줄이는 것이 목표입니다.) ### 2.4. 단계별로 질문하고 반복적으로 다듬기 (Feat. `v3` 대화 컨텍스트) 하나의 거대한 프롬프트로 모든 것을 해결하려 하기보다, `v3`에서 배운 대화 컨텍스트를 활용하여 단계별로 질문을 던지고 응답을 다듬는 것이 토큰 최적화에 유리합니다. 각 질문과 응답은 짧지만, 전체 대화는 목표를 향해 나아갑니다. * **예시:** 1. `gemini ask "블로그 게시물 초안을 작성해 줘."` 2. `gemini ask "방금 작성된 초안의 서론을 좀 더 흥미롭게 수정해 줘."` 3. `gemini ask "결론 부분에 미래 전망을 추가해 줘."` ### 2.5. 템플릿 활용 자주 사용하는 프롬프트 패턴이나 지시 사항은 템플릿화하여 사용하세요. 이를 통해 매번 프롬프트를 작성하는 시간을 절약하고, 일관된 품질과 효율적인 토큰 사용을 유지할 수 있습니다. ## 3. CLI에서 토큰 사용량 (추정) 확인하기 현재 Gemini CLI가 직접적으로 토큰 사용량을 표시하는 기능이 없을 수 있습니다. 하지만 다음과 같은 방법으로 토큰 사용량을 추정하고 효율적인 프롬프트 작성에 활용할 수 있습니다. * **입력 텍스트 길이 가늠:** 일반적으로 영단어 1개는 약 1.3~1.5 토큰으로, 한글은 1글자당 약 0.5~1 토큰으로 추정됩니다. 입력하는 프롬프트와 파일 내용의 길이를 대략적으로 가늠해 볼 수 있습니다. * **SDK를 통한 사전 토큰 계산:** 만약 Python 등 SDK를 사용하여 토큰 수를 미리 계산하는 코드를 작성할 수 있다면, 실제 API 호출 전에 프롬프트의 토큰 수를 파악하여 최적화에 도움을 받을 수 있습니다. (이는 CLI 사용법의 직접적인 내용은 아니지만, 효율성 증대를 위한 고급 팁입니다.) ## 4. 요약 토큰 최적화는 Gemini CLI를 활용한 글쓰기 작업에서 비용을 절감하고 효율성을 극대화하는 매우 중요한 기술입니다. 명확하고 간결한 지시, 구체적인 응답 형식 요청, 필요한 컨텍스트만 제공하는 등의 프롬프트 작성 기술을 익히면, Gemini 모델을 더욱 스마트하게 활용할 수 있습니다. 다음 단계에서는 이러한 토큰 최적화 및 모델 선택 전략을 활용하여, 실제 블로그 포스트를 자동으로 생성하는 실용적인 예제를 다루어 보겠습니다.