Что такое PCA (Principal Component Analysis)?

Middle
268 просмотров
AFK Offer AI

PCA — снижение размерности, находит направления максимальной дисперсии. Проецирует данные на главные компоненты (ортогональные оси). PCA(n_components=2) — оставить 2 компоненты. explained_variance_ratio_ — сколько дисперсии объясняет каждая компонента. Обычно выбирают n_components, покрывающих 95% дисперсии. Применение: визуализация (2D/3D), preprocessing перед моделью, сжатие изображений. Нужно масштабирование перед PCA! components_ — направления (можно интерпретировать). Минус: теряется интерпретируемость признаков. IncrementalPCA — для больших данных. t-SNE и UMAP — для визуализации (нелинейные).

Следующий вопрос

Как использовать Docker для Python-разработки?