🎯 Lv 2⏱ 12분

비용 의식하면서 쓰기

🎯 토큰·캐싱 절약법

코리의 한 마디

AI 비용은 "입력 토큰 × 단가 + 출력 토큰 × 단가"로 결정돼. 공식 하나만 알면 줄일 길이 보여.

핵심 정리

1) 입력 짧게: 불필요한 인사·반복 컨텍스트 제거. 같은 시스템 프롬프트 매번 보내지 말고 캐싱.

2) 출력 짧게: "5문장 이내", "불릿 3개"로 길이 명시. 안 적으면 모델은 길게 답하는 경향.

3) 모델 라우팅: 분류·검색은 가벼운 모델, 생성만 큰 모델. 작업 단계별 분리.

4) Prompt Caching: 같은 시스템 프롬프트가 5분 안에 재호출되면 입력 단가가 90% 할인되는 모델도 있어.

5) 스트리밍 + 조기 중단: 사용자가 만족하면 중단 가능한 UI로 평균 출력 토큰 자체를 줄여.

출력 길이 강제 한 줄

다음 글을 한국어로 5문장 이내, 핵심만 요약해줘. 군말 없이.

1분 점검

AI 비용을 가장 효과적으로 줄이는 방법이 아닌 것은?

직접 써보기0 / 1000