LLM 토큰 단가 1년 변동
운영에 쓰던 모델의 토큰 단가가 1년에 어떻게 바뀌었는가.
운영 알람 봇 + RSS 요약 봇이 쓰는 모델의 1년 청구서를 정리.
| 시기 | 모델 | 입력/M | 출력/M | 운영비/월 |
|---|---|---|---|---|
| 25년 9월 | Sonnet | $3 | $15 | $23 (사고 포함) |
| 25년 9월 | + caching | $3 / $0.3 | $15 | $4.5 |
| 26년 4월 | Sonnet 4 | $3 | $15 | $5.8 (더 긴 RSS) |
알아낸 것
- 단가 자체는 한 해 동안 별로 안 떨어졌다. 모델이 더 빠르고 똑똑해진 만큼 한 작업에 필요한 토큰 자체가 줄었다.
- caching 이 가장 큰 절감. system prompt 의 90% 가 캐시 hit 으로 들어간다.
다음에는 다르게 할 한 가지
LLM 비용 전략을 짤 때 단가 변동을 기대하지 말고 토큰 사용량 자체를 줄인다. 그게 항상 더 빠른 절감이었다.
🛒 이 글과 어울리는 추천 상품
위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.