← 모든 글

LLM 토큰 단가 1년 변동

운영에 쓰던 모델의 토큰 단가가 1년에 어떻게 바뀌었는가.

운영 알람 봇 + RSS 요약 봇이 쓰는 모델의 1년 청구서를 정리.

시기모델입력/M출력/M운영비/월
25년 9월Sonnet$3$15$23 (사고 포함)
25년 9월+ caching$3 / $0.3$15$4.5
26년 4월Sonnet 4$3$15$5.8 (더 긴 RSS)

알아낸 것

  • 단가 자체는 한 해 동안 별로 안 떨어졌다. 모델이 더 빠르고 똑똑해진 만큼 한 작업에 필요한 토큰 자체가 줄었다.
  • caching 이 가장 큰 절감. system prompt 의 90% 가 캐시 hit 으로 들어간다.

다음에는 다르게 할 한 가지

LLM 비용 전략을 짤 때 단가 변동을 기대하지 말고 토큰 사용량 자체를 줄인다. 그게 항상 더 빠른 절감이었다.


🛒 이 글과 어울리는 추천 상품

위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.