Отправляешь запрос и если через threshold (например p95 латенси) нет ответа — шлёшь дублирующий запрос на другой сервер. Берёшь первый пришедший ответ, второй отменяешь. Уменьшает tail latency за счёт ~5% дополнительного трафика. Важно: операция должна быть идемпотентной и read-only. В Go: запускаешь две горутины с общим каналом результата, select на первый ответ, cancel context второго.
Как реализовать hedged requests?
Senior
46 просмотровAFK Offer AI
Что такое result type?