Используешь context с таймаутом, чтобы не держать горутину вечно. Для реально долгих операций — возвращаешь 202 Accepted с ID задачи, а обработку делаешь асинхронно. Клиент потом поллит статус по ID или получает результат через webhook/websocket. В Go контекст пробрасываешь через всю цепочку вызовов.
Как обрабатывать long-running requests?
Middle
168 просмотровAFK Offer AI
Что такое memory model в Go?