Категории: target encoding, утечки и устойчивые схемы
🔒 Sign in to use this
Категориальные признаки: как объяснить «Москву» нейросети
Нейросети работают с числами. «Москва», «Берлин», «Токио» — не числа. Задача кодирования: превратить категорию в число так, чтобы не внести ложный порядок. Если сказать модели Москва=1, Берлин=2, Токио=3 — она решит что Токио «больше» Москвы в три раза. Это неправда. Выбор правильного метода кодирования серьёзно влияет на качество модели.
Content is available with subscription.
Get full access to all courses on the platform for one year with a single payment.
▼
▼
Unlike other platforms that charge per course, here you get everything for one price, and after one year of use there will be no automatic charge for the following year.
🔒 Sign in to use this