Как настроить auto-scaling правильно?

Middle

296 просмотров

AFK Offer AI

Auto-scaling уровни: HPA (Horizontal Pod Autoscaler) — по CPU/memory/custom metrics, KEDA для event-based (queue depth, etc.), Cluster Autoscaler — добавляет/убирает ноды. Настройка HPA: targetCPUUtilizationPercentage=70 (не 90 — нода перегрузится раньше масштабирования), minReplicas=2 для HA, maxReplicas ограничивает costs. Тест: load test и наблюдать как HPA реагирует. Warmup период для нод (provisioning time 2-3 мин) — учитывать в capacity buffer. Scale-in cooldown — не убирать ноды слишком быстро при spike.

Следующий вопрос

Как ограничить ресурсы контейнера и зачем?