← 모든 글

자동화했는데 더 느려졌다

자동화가 오히려 발목을 잡았던 세 가지 사례와 그때 배운 것

막상 돌려보니

올해 팀에서 자동화를 세 건 걷어냈다.

  • 슬랙 알림 라우팅 봇: 조건 분기가 18개까지 늘었다. 결국 담당자가 누군지 봇도 몰랐다. 사람이 멘션 하나 치는 게 30초, 봇 디버깅은 2시간.
  • PR 리뷰 체크리스트 자동 생성: 템플릿이 PR 성격을 못 읽었다. 핫픽스에도 15개 체크박스가 붙었다. 리뷰어가 형식만 맞추고 내용은 안 봤다.
  • 온콜 에스컬레이션 스크립트: 페이저가 울리면 자동으로 슬랙 스레드 생성 + 담당자 멘션 + Jira 티켓 오픈. 실제 장애 때 세 곳에서 서로 다른 맥락이 쌓였다. 상황 파악에 10분 더 걸렸다.

세 건 모두 초기에 “사람이 반복하는 게 싫어서” 만들었다.

자동화가 실패하는 패턴

보통은 자동화 자체가 문제가 아니다. 예외를 과소평가한 게 문제다.

처음엔 입력이 깔끔하다. 시간이 지나면 예외가 생긴다. 예외를 처리하려면 분기가 늘고, 분기가 늘면 유지 비용이 사람 비용을 넘긴다. 그 시점을 대부분 놓친다. 왜냐면 자동화는 “일단 돌아가고 있으면” 아무도 안 보기 때문이다.

확인해볼 신호:

  • 스크립트가 마지막으로 수정된 게 6개월 전인데 아무도 리뷰 안 했다
  • “이 케이스는 수동으로 처리해” 라는 주석이 두 줄 이상
  • 담당자가 바뀌었는데 자동화 문서가 없다

이 중 하나라도 해당하면 그 자동화는 이미 부채다.

다음 한 가지

새 자동화 만들기 전에 “이게 6개월 후에도 예외 없이 돌아갈 입력인가” 한 줄 먼저 적기로.


🛒 이 글과 어울리는 추천 상품

위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.