По традиции в последнюю пятницу сезона в московском офисе Mail.Ru Group собираются любители наук о данных. Ровно через неделю — 27 мая в 18:30 по адресу Ленинградский проспект, 39, стр. 79 можно будет послушать следующие доклады:
- H2O на Spark: как мы пили газировку и чуть не захлебнулись (Дмитрий Носов, Rambler&Co)
- Кросс-девайс сопоставление файлов cookie: «вероятностный» подход (Алексей Куренной, Тинькофф)
- Глубокое обучение и извлечение признаков в прогнозировании временных рядов (Павел Филонов, «Лаборатория Касперского»)
- Решение задачи Search Results Relevance (на платформе Kaggle) (Александр Дьяконов, ВМК МГУ)
Подробнее на официальной странице (там же — регистрация).
Я расскажу о решении той самой задачи, что была на практическом семинаре по анализу данных в прошлом году. Логично, чтобы участники послушали про какое-нибудь хорошее решение (а это вошло в десятку), но вот как-то не получалось рассказать (второго семинара по АД не было). Решил, что если не сейчас, то будет совсем поздно. Информации о супер-методах, больших ансамблях, часах настройки на Амазоне не ждите. Как всегда: всё предельно просто, в несколько строчек кода, используя лишь одну хитрость (ответ алгоритма должен быть похож на то, что от него ожидают).
Слайды: здесь.
А вот и “видео”:
Добрый день, Александр!
А видеозапись выступлений где-нибудь опубликована?
Да, на http://it.mail.ru/ выкладываются видео, связанные с событиями в Mail.ru. Этого пока нет, но скоро, наверное, появится — я тогда дам ссылку.
Всё — появилось видео. Добавил ссылку.