В Go встроен пакет net/http/pprof — подключаешь его, и на эндпоинте /debug/pprof появляются CPU-профиль, heap-профиль, горутины и прочее. Дальше делаешь go tool pprof и смотришь flame graph или top функций. Для нагрузочного тестирования можно снять профиль во время теста и увидеть, где тратится время.