Auto-scaling уровни: HPA (Horizontal Pod Autoscaler) — по CPU/memory/custom metrics, KEDA для event-based (queue depth, etc.), Cluster Autoscaler — добавляет/убирает ноды. Настройка HPA: targetCPUUtilizationPercentage=70 (не 90 — нода перегрузится раньше масштабирования), minReplicas=2 для HA, maxReplicas ограничивает costs. Тест: load test и наблюдать как HPA реагирует. Warmup период для нод (provisioning time 2-3 мин) — учитывать в capacity buffer. Scale-in cooldown — не убирать ноды слишком быстро при spike.
Как настроить auto-scaling правильно?
Middle
271 просмотровAFK Offer AI
Какие классы хранилища есть в S3 и когда их использовать?