Спецсеминар

Как-то забыл сделать разные анонсы мероприятий начала учебного года… Начал работу мой спецсеминар с мудрёным названием «Алгебра над алгоритмами и эвристический поиск закономерностей». Будет проходить на ВМК МГУ по четвергам в ауд. 637, начало в 18:00 (к этому времени обычно собираемся, а сами доклады ~18:20).

seminar Читать далее

Майская волна спроса

Прошли майские праздники, а они очень примечательны с точки зрения статистики продаж. Про многие товары говорят, что у них «периодический спрос». Например, перед первым сентября покупают учебники, канцелярию, ранцы и прочие «школьные товары». В остальное время года спрос на такие товары невелик (на некоторые он возрастает в начале каждого семестра). Именно поэтому различные прогнозаторы настраивают на статистику нескольких лет (чтобы поймать закономерности, связанные с определённым временем года). Но при прогнозировании спроса на конкретные товары (а не на группу) редко удаётся не только использовать подобные закономерности, но и вообще, обнаружить.

waves

Читать далее

Экзамены на ВМК (зима-2016)

В этом году на факультете ВМК МГУ впервые начали массово учить магистров. Раньше 5 лет готовили специалистов, бакалавриат и магистратура тоже были, но наборы в них были небольшие, и основные усилия ППС были направлены на специалистов. А теперь специалистов нет:) Читать далее

Прогноз появления рёбер

Есть такая задача — Link Prediction Problem, на русский язык нет однозначного перевода, но что-то типа «прогнозирование появления/исчезновения рёбер». В статическом варианте проблемы — дан граф (как правило, социальной сети), необходимо предсказать, какие рёбра в нём появятся в ближайшее время (и/или какие удалятся). В динамическом может быть дано несколько графов (в разные моменты времени) и прогноз может потребоваться на разные моменты времени. В варианте с фиксированным тестом — задано множество пар вершин, для которого нужно дать прогноз (например, какие из этих пар станут рёбрами). Из-за того, что чаще рассматривают графы соцсетей, возникает интересная терминология, например, смежные вершины называются друзьями, вершина, смежная с двумя другими вершинами, — их общим другом и т.д.

graph Читать далее

Прогноз визитов клиентов

Когда-то на kaggle.com была задачка от dunnhumby: про прогноз визитов клиентов и сумм их покупок. Сейчас данные недоступны. В рамках курса магистрам ВМК МГУ и ПЗАДа я рассказываю о методах решения подобных задач. О них можно почитать Читать далее

ПЗАД новый набор 2015

Начался очередной отбор на мой спецкурс «Прикладные задачи анализа данных» (PZAD). Все подробности на странице спецкурса.

Напоминаю, что

  • курс начинается каждый год осенью,
  • главная фишка курса — практика решения задач (в том числе на платформах Kaggle и AlgoMost),
  • это единственный курс в мире, в котором один из топа Кэгла делится своим опытом решения задач и который прослушали несколько текущих топ-решателей Кэгла,
  • каждый год в курс добавляется новая тема (в прошлом году — анализ соцсетей).

Конкурс на курс всегда большой, поэтому выполняйте все требования на странице курса, в частности

  • необходимо знание машинного обучения,
  • необходим минимальный опыт участия в соревнованиях по анализу данных.

На странице курса есть список допустимых соревнований. В прошлом году он был обширен, в этом так не будет. Сейчас там всего одно соревнование (я включаю туда только те, которые сам хорошо изучил, чтобы было потом их полезно обсуждать).

Что ещё интересного:

  • возможно, в этом году набор будет последним.

Часть курса переходит в магистерскую программу на факультете ВМК, а часть будет читаться в рамках договорённостей с компанией «Аналитика плюс» (пока планы такие).

DrivenData: наши снова в призах

На недавно завершившемся соревновании по аналитике в области здравоохранения второе место среди более чем ста участников занял Александр Гущин. Недавно он также был вторым на российском соревновании компании АлгоМост по классификации химических экспериментов. Вдвойне приятно: Александр недавний ПЗАДовец и студент автора блога.

Поздравляем Александра и желаем дальнейших успехов!

Kaggle: наши в тройке

Недавно завершилось соревнование Microsoft по классификации вредоносных программ. Российская команда вошла в тройку (среди 377 участников). Приятно, что все бронзовые призёры в прошлом ПЗАДовцы. Имена героев:

Решение ребят описано в форуме. Также скоро будет доклад на конференции.

Поздравляем и желаем дальнейших успехов!

Напомню, что до этого последний российский успех на Кэгле — вхождение в тройку Михаила Сиверского на соревновании по социальным сетям (кстати, в рамках последнего ПЗАДа).