🎯 Lv 2⏱ 12분
비용 의식하면서 쓰기
🎯 토큰·캐싱 절약법

코리의 한 마디
AI 비용은 "입력 토큰 × 단가 + 출력 토큰 × 단가"로 결정돼. 공식 하나만 알면 줄일 길이 보여.
핵심 정리
1) 입력 짧게: 불필요한 인사·반복 컨텍스트 제거. 같은 시스템 프롬프트 매번 보내지 말고 캐싱.
2) 출력 짧게: "5문장 이내", "불릿 3개"로 길이 명시. 안 적으면 모델은 길게 답하는 경향.
3) 모델 라우팅: 분류·검색은 가벼운 모델, 생성만 큰 모델. 작업 단계별 분리.
4) Prompt Caching: 같은 시스템 프롬프트가 5분 안에 재호출되면 입력 단가가 90% 할인되는 모델도 있어.
5) 스트리밍 + 조기 중단: 사용자가 만족하면 중단 가능한 UI로 평균 출력 토큰 자체를 줄여.
출력 길이 강제 한 줄
다음 글을 한국어로 5문장 이내, 핵심만 요약해줘. 군말 없이.
1분 점검
AI 비용을 가장 효과적으로 줄이는 방법이 아닌 것은?
직접 써보기0 / 1000