Chaos engineering — намеренное введение отказов для проверки устойчивости системы. Принципы (Chaos Monkey): формулировать гипотезу о steady state, вводить controlled failure, наблюдать за отклонением от steady state, делать выводы. Инструменты: Chaos Monkey (Netflix, random EC2 termination), Gremlin (enterprise, разные типы атак), LitmusChaos (k8s native, CNCF). Начать: простые эксперименты в staging (убить pod, задержка сети), потом production в business hours с быстрым rollback. Chaos Hub в LitmusChaos — готовые эксперименты.
Что такое chaos engineering и как начать?
Senior
296 просмотровAFK Offer AI
Чем ENTRYPOINT отличается от CMD в Dockerfile?