Retry storm — это когда множество клиентов одновременно ретраят запросы к проблемному сервису, создавая лавину нагрузки и усугубляя ситуацию. Сервис чуть затормозил → клиенты получили таймауты → все ретраят → нагрузка удвоилась → сервис совсем лёг → ещё больше ретраев. Решения: exponential backoff с jitter (каждый клиент ретраит в разное время), retry budget (ретраить не более 10% от общего числа запросов), circuit breaker (вообще перестать стучаться). Без этих мер retry — главный враг стабильности.