Distributed tracing отслеживает путь запроса через несколько сервисов. Каждый сервис добавляет span в trace с timing, metadata, errors. Trace ID пробрасывается через заголовки (W3C Trace Context). Позволяет: найти узкое место в цепочке вызовов, увидеть где именно 200ms latency, коррелировать ошибки между сервисами. Инструменты: Jaeger, Zipkin (open-source), Tempo (Grafana), Datadog APM. OpenTelemetry SDK инструментирует приложение автоматически (для Go, Java, Python, JS). Sampling: записывать 10-100% трейсов в зависимости от нагрузки.
Что такое distributed tracing и зачем он нужен?
Senior
286 просмотровAFK Offer AI
Как работают requests и limits для CPU и памяти?