Что такое on-call и как правильно его организовать?

Senior
201 просмотров
AFK Offer AI

On-call — дежурство когда ты первым реагируешь на production инциденты. Правильный on-call: runbooks для типичных алертов, алерты только на actionable проблемы (не на шум), rotation чтобы не выгорать, compensation за ночные вызовы, постоянное улучшение системы для снижения нагрузки. PagerDuty/OpsGenie для маршрутизации. Метрика успеха: снижение числа alerts over time через automation.

Следующий вопрос

Что такое iptables и как работает цепочка правил?