운영 알람을 한국어로 요약했더니 생긴 일
영문 알람을 한국어 한 줄로 요약하니 응답 속도가 느려졌다 — 그리고 더 큰 문제 한 가지.
운영 알람 (Sentry, Cloudflare, Uptime) 을 LLM 으로 한국어 한 줄로 요약해 슬랙에 흘려보냈다. 9월부터 두 달 운영한 결과.
좋았던 것
- 알람 평균 처리 시간이 줄었다. 영문 stack trace 를 안 읽고 한국어 한 줄만 보고 분류 가능.
- 야간 알람은 특히 효과가 컸다. 잠결에 영문 trace 를 읽는 부담이 사라졌다.
안 좋았던 것 — 응답 지연
알람 발생 → LLM 호출 → 슬랙 게시. 평균 2.4초. 그 사이에 같은 사건의 알람이 슬랙에 먼저 영문으로 흘러들면 순서가 뒤집힌다. 한국어 요약이 사건 1분 후에 나타나는 경우도 봤다.
해결은 단순했다. 요약을 동기 호출하지 않고, 영문 알람을 그대로 먼저 슬랙 boundary 채널에 보내고 → thread 로 한국어 요약을 붙인다. 사용자는 메인 채널에서 영문 알람을 그대로 보고, 한국어가 필요한 사람만 thread 를 연다.
더 큰 문제 — “이 알람 이미 봤어요”
같은 사건이 30분 안에 다섯 번 알람으로 들어왔다. LLM 은 매번 정직하게 한국어 한 줄을 새로 만들었고, 슬랙은 알람 다섯 줄로 시끄러워졌다.
dedup 키 = (error_type, file:line) 5분 윈도우. 같은 키는 thread 로만 들어가게.
다음에는 다르게 할 한 가지
LLM 으로 알람을 가공할 땐 알람 채널 디자인을 먼저 한다. 어떤 알람이 메인에 가는지, 어떤 게 thread 에 머무는지, dedup 윈도우는 얼마인지 — 이걸 정한 다음에 LLM 호출이 들어가야 한다. 거꾸로 하면 LLM 이 “더 시끄러운 봇” 이 된다.
🛒 이 글과 어울리는 추천 상품
위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.