Как кодировать категориальные признаки?

Middle
313 просмотров
AFK Offer AI

Label Encoding: LabelEncoder — категории в числа (red=0, blue=1). Для ordinal признаков (low, medium, high). One-Hot Encoding: pd.get_dummies() или OneHotEncoder — бинарные столбцы. Для nominal признаков (цвет, город). Target Encoding: среднее целевой переменной по категории — мощный, но risk of leakage. Ordinal Encoding: OrdinalEncoder — для упорядоченных. Binary Encoding: категория → двоичный код. Frequency Encoding: частота категории. Для деревьев: LabelEncoder достаточно. Для линейных моделей: One-Hot обязателен. Высокая кардинальность (1000+ категорий) — target/frequency encoding.

Следующий вопрос

В чём разница между SQLAlchemy Core и ORM?