Как защитить систему от каскадных сбоев?

Senior
299 просмотров
AFK Offer AI

Каскадный сбой — когда падение одного сервиса тащит за собой остальные. Защита многослойная: таймауты на все внешние вызовы (без таймаутов горутины зависают навечно), circuit breaker (перестать стучаться в мёртвый сервис), bulkhead (изолировать ресурсы — отдельный пул соединений для каждого сервиса), graceful degradation (отдавать кэшированные данные вместо ошибки), rate limiting, retry budget. В Go важно всегда передавать context с таймаутом и правильно обрабатывать context.Canceled.

Следующий вопрос

Что такое NOWAIT?