Что такое incident management?

Middle
235 просмотров
AFK Offer AI

Incident management — процесс обработки сбоев в production. Цикл: обнаружение (алерт) → оценка severity → реагирование (on-call) → митигация → коммуникация (status page) → postmortem. Severity уровни: SEV1 (всё лежит), SEV2 (деградация), SEV3 (minor). Postmortem — разбор без blame: что случилось, timeline, root cause, action items. Для Go-сервисов важно: хорошие логи и метрики ускоряют time-to-resolve, а graceful degradation снижает severity инцидента.

Следующий вопрос

Как тестировать middleware?