Завершился очередной ежегодный турнир студентов и аспирантов по анализу данных Data Science Game (в этом блоге был его анонс). В этом году отборочный этап прошли 3(!) российские команды: сборные МФТИ, МГУ и Сколтеха. Удивительно, но все они уехали домой с наградами! С чем их и поздравляем!
Первое место заняли представители МФТИ:
- Михаил Трофимов,
- Александр Гущин,
- Филипп Пушняков,
- Станислав Семёнов.
На втором месте — ребята из Кэмбриджа, Сколтех третий, а приз за самое красивое решение достался МГУшникам. В финале соревновались 20 команд (см. иллюстрацию с эмблемами вузов и флагами стран). Необходимо было решить задачу предсказания реакции на предложения страховой компании (несбалансированные классы ~ 1% положительных примеров, 3 млн. обучающих примеров, около 30 признаков, качество оценивалось по logloss). Как всегда, не обошлось без «провалов»: в данных был признак, по которому однозначно восстанавливался ответ, но когда организаторам про это рассказали, использовать этот признак в решении было запрещено…
Напомню, что в прошлом году тройка победителей выглядела так: 1) МГУ (Россия), La Sapienza (Италия), Telecom Paristech (Франция), это был первый подобный турнир. Таким образом, в DSG Российские команды не отдают соперникам первое место. И, я думаю, понятно, в каких вузах искать «датамайнеров»;)
Ах, да, надо же похвастаться и приобщиться к успеху: среди победителей этого года (как, впрочем, и прошлого) один магистр и один аспирант работают под научным руководством автора;)

А можно где то увидеть решения победителей по несбалансированным классам ?
Они опубликованы ?
Я думаю, что их не опубликуют.
Последняя ML-тренировка в Яндексе была посвещена этому соревнованию. Все российские команды что-то там рассказывали. Запись есть на youtube: https://www.youtube.com/watch?v=YSkFS1pfCG0
[…] году чемпионами стали представители ВМК МГУ. В 2016 — МФТИ. В этом году ВМКашники вернули себе чемпионство, имена […]