Как дебажить flaky deployment?

Middle
251 просмотров
AFK Offer AI

Flaky deployment — иногда успешный, иногда нет. Собрать данные: логи всех попыток, есть ли паттерн (время суток, нагрузка). Частые причины: race condition при startup (readiness probe слишком агрессивный), intermittent network (timeouts при скачивании образов), resource constraints (нода перегружена), health check не соответствует реальной готовности приложения. В k8s: увеличить failureThreshold и initialDelaySeconds у readiness probe. Проверить terminationGracePeriodSeconds — приложение успевает graceful shutdown. kubectl rollout history для истории.

Следующий вопрос

Как diагностировать проблемы с сетью в Kubernetes?