On-call — дежурство когда ты первым реагируешь на production инциденты. Правильный on-call: runbooks для типичных алертов, алерты только на actionable проблемы (не на шум), rotation чтобы не выгорать, compensation за ночные вызовы, постоянное улучшение системы для снижения нагрузки. PagerDuty/OpsGenie для маршрутизации. Метрика успеха: снижение числа alerts over time через automation.
Что такое on-call и как правильно его организовать?
Senior
201 просмотровAFK Offer AI
Что такое iptables и как работает цепочка правил?