Что такое distributed tracing и зачем он нужен?

Senior
286 просмотров
AFK Offer AI

Distributed tracing отслеживает путь запроса через несколько сервисов. Каждый сервис добавляет span в trace с timing, metadata, errors. Trace ID пробрасывается через заголовки (W3C Trace Context). Позволяет: найти узкое место в цепочке вызовов, увидеть где именно 200ms latency, коррелировать ошибки между сервисами. Инструменты: Jaeger, Zipkin (open-source), Tempo (Grafana), Datadog APM. OpenTelemetry SDK инструментирует приложение автоматически (для Go, Java, Python, JS). Sampling: записывать 10-100% трейсов в зависимости от нагрузки.

Следующий вопрос

Как работают requests и limits для CPU и памяти?