글 목록 · 2 / 5
-
테스트가 늘어도 신뢰가 줄어드는 이유
flaky test 와 false positive 가 팀의 테스트 신뢰를 어떻게 무너뜨리는가
-
Logs, Metrics, Traces — 셋 다 못 하면 이 순서로
관찰 가능성 3종을 한꺼번에 못 깔 때, 실제로 어디부터 손대야 하는지 정리.
-
staging은 언제부터 prod의 사촌이 됐나
env 동기화 부채가 쌓이는 패턴과 한 가지 대응.
-
자동화가 오히려 느렸던 세 번의 기억
자동화가 항상 빠른 건 아니다. 막상 해보면 사람이 더 빠른 경우가 있다.
-
온보딩 첫 주: 뭘 읽게 할 것인가
신규 입사자에게 건네는 문서 우선순위 — 덜 주는 게 더 주는 것
-
Post-Mortem 24시간 규칙 — 또 못 지켰다
사후 보고서 미루기 패턴을 3년째 반복 중. 이번엔 왜인지 들여다봤다.
-
Migration Script, 한 번 더 돌려도 안전한가
멱등성 체크리스트 — 두 번 돌려서 망한 경험을 정리했다.
-
Postgres logical replication 첫 실험
읽기 부하 분리를 위한 logical replication 한 주의 함정.
-
알람이 너무 많으면 알람이 없는 것과 같다
임계값을 낮게 잡아 알람 홍수가 난 뒤, 숫자 하나 바꾸는 데 왜 이렇게 오래 걸렸나.
-
온보딩 첫 주: 읽힐 문서 3개만 고르는 법
신규 입사자에게 뭘 먼저 읽힐지 — 우선순위 기준 정리
-
의존성 업그레이드: 한 번에 몰아치기 vs 조금씩 밀기
dep upgrade 는 전략이다. 타이밍과 단위를 틀리면 롤백도 못 한다.
-
로그·메트릭·트레이스, 셋 다 못 하면 이 순서로
관찰 가능성 3종을 동시에 못 깔 때 어디서 시작할지 실전 우선순위.
-
알람이 너무 많으면 알람이 없는 것과 같다
노이즈로 가득 찬 알람 채널을 정리하며 임계값 재설정 기준을 다시 잡은 기록
-
자동화했는데 더 느려졌다
자동화가 오히려 발목을 잡았던 세 가지 사례와 그때 배운 것
-
자동화의 손익분기점
반복 횟수만 보면 틀린다. 자동화 비용의 진짜 항목을 따진다.
-
LLM 응답이 들쭉날쭉할 때
같은 입력에 매번 다른 응답 — temperature 를 출력 슬롯마다 분리한 사연.
-
Migration Script, 한 번 더 돌려도 괜찮아?
멱등성 없는 migration script 가 새벽 장애를 부른다. 체크리스트 정리.
-
사후 보고서를 또 미뤘다 — 패턴 해부
post-mortem 24시간 룰을 왜 매번 어기는지, 이유보다 구조를 본다.
-
온보딩 첫 주, 읽을 것 줄이기
신규 입사자에게 던져주는 자료가 많을수록 아무것도 안 읽힌다.
-
config 파일, 환경변수, DB — 어디에 둘지 헷갈릴 때 쓰는 기준
설정 매체 3가지를 언제 어떻게 고르는지, 실제 판단 기준을 정리했다.