Data Science Contest Сбербанка

Недавно стартовал новый конкурс по анализу данных. В помощь новичкам, которые захотят поиграться его данными, вот презентация, которую я обсуждал со своими магистрами на прошлом занятии, а вот код, с помощью которого получены все графики. Кстати, большие ipynb-файлы с гитхаба лучше смотреть с помощью nbviewer, например так.

sberbank

ECOC

ECOC — это «Error-Correcting Output Code». Пишу, поскольку мои студенты не знают, как этот зверь применяется в машинном обучении.

Допустим, Вы решаете задачу классификации с L (L>2) классами, а у Вас есть только бинарные классификаторы (т.е. решают задачу с двумя классами). Как быть? Читать далее