DBSCAN — density-based кластеризация. Параметры: eps — радиус окрестности, min_samples — минимум точек для core point. Core point — min_samples соседей в eps. Border point — в окрестности core point, но сам не core. Noise — ни core, ни border. Плюсы: не нужно задавать k, находит кластеры произвольной формы, определяет выбросы (label -1). Минусы: чувствителен к eps и min_samples, плохо с кластерами разной плотности. HDBSCAN — улучшенная версия, автоматически подбирает eps. Подбор eps: kNN distance plot — ищем "колено".