Что такое chaos engineering?

Middle+
290 просмотров
AFK Offer AI

Chaos engineering — практика намеренного внесения сбоев в production-систему, чтобы убедиться, что она их переживает. Netflix придумал Chaos Monkey, который случайно убивает инстансы в продакшене. Звучит безумно, но идея в том, что если система не выдерживает контролируемый хаос — она тем более не выдержит реальный сбой. Проверяют всё: падение серверов, задержки сети, переполнение диска, потерю пакетов. Перед запуском хаос-эксперимента формулируешь гипотезу ("система переживёт потерю одного узла БД"), потом проверяешь. Это для зрелых команд — сначала нужны мониторинг, алерты и автоматическое восстановление.

Следующий вопрос

Как написать generic функцию?