Label Encoding: LabelEncoder — категории в числа (red=0, blue=1). Для ordinal признаков (low, medium, high). One-Hot Encoding: pd.get_dummies() или OneHotEncoder — бинарные столбцы. Для nominal признаков (цвет, город). Target Encoding: среднее целевой переменной по категории — мощный, но risk of leakage. Ordinal Encoding: OrdinalEncoder — для упорядоченных. Binary Encoding: категория → двоичный код. Frequency Encoding: частота категории. Для деревьев: LabelEncoder достаточно. Для линейных моделей: One-Hot обязателен. Высокая кардинальность (1000+ категорий) — target/frequency encoding.
Как кодировать категориальные признаки?
Middle
313 просмотровAFK Offer AI
В чём разница между SQLAlchemy Core и ORM?