P50 — типичный запрос, медиана. P99 — самый медленный из 100 (кроме одного). P999 — один из тысячи. Чем выше перцентиль, тем сложнее оптимизировать. P99 часто в 5-10 раз хуже P50 из-за GC пауз, сетевых ретраев, cold cache. Для пользовательских API целься в P99 < 200ms. P999 важен для high-frequency систем.