Как-то забыл сделать разные анонсы мероприятий начала учебного года… Начал работу мой спецсеминар с мудрёным названием «Алгебра над алгоритмами и эвристический поиск закономерностей». Будет проходить на ВМК МГУ по четвергам в ауд. 637, начало в 18:00 (к этому времени обычно собираемся, а сами доклады ~18:20).
ПЗАД
Майская волна спроса
Прошли майские праздники, а они очень примечательны с точки зрения статистики продаж. Про многие товары говорят, что у них «периодический спрос». Например, перед первым сентября покупают учебники, канцелярию, ранцы и прочие «школьные товары». В остальное время года спрос на такие товары невелик (на некоторые он возрастает в начале каждого семестра). Именно поэтому различные прогнозаторы настраивают на статистику нескольких лет (чтобы поймать закономерности, связанные с определённым временем года). Но при прогнозировании спроса на конкретные товары (а не на группу) редко удаётся не только использовать подобные закономерности, но и вообще, обнаружить.
Экзамены на ВМК (зима-2016)
В этом году на факультете ВМК МГУ впервые начали массово учить магистров. Раньше 5 лет готовили специалистов, бакалавриат и магистратура тоже были, но наборы в них были небольшие, и основные усилия ППС были направлены на специалистов. А теперь специалистов нет:) Читать далее
Прогноз появления рёбер
Есть такая задача — Link Prediction Problem, на русский язык нет однозначного перевода, но что-то типа «прогнозирование появления/исчезновения рёбер». В статическом варианте проблемы — дан граф (как правило, социальной сети), необходимо предсказать, какие рёбра в нём появятся в ближайшее время (и/или какие удалятся). В динамическом может быть дано несколько графов (в разные моменты времени) и прогноз может потребоваться на разные моменты времени. В варианте с фиксированным тестом — задано множество пар вершин, для которого нужно дать прогноз (например, какие из этих пар станут рёбрами). Из-за того, что чаще рассматривают графы соцсетей, возникает интересная терминология, например, смежные вершины называются друзьями, вершина, смежная с двумя другими вершинами, — их общим другом и т.д.
Прогноз визитов клиентов
Когда-то на kaggle.com была задачка от dunnhumby: про прогноз визитов клиентов и сумм их покупок. Сейчас данные недоступны. В рамках курса магистрам ВМК МГУ и ПЗАДа я рассказываю о методах решения подобных задач. О них можно почитать Читать далее
ПЗАД итоги предварительного отбора
По результатам соревнований прослушать курс приглашаются обладатели следующих ников: Читать далее
ПЗАД новый набор 2015
Начался очередной отбор на мой спецкурс «Прикладные задачи анализа данных» (PZAD). Все подробности на странице спецкурса.
Напоминаю, что
- курс начинается каждый год осенью,
- главная фишка курса — практика решения задач (в том числе на платформах Kaggle и AlgoMost),
- это единственный курс в мире, в котором один из топа Кэгла делится своим опытом решения задач и который прослушали несколько текущих топ-решателей Кэгла,
- каждый год в курс добавляется новая тема (в прошлом году — анализ соцсетей).
Конкурс на курс всегда большой, поэтому выполняйте все требования на странице курса, в частности
- необходимо знание машинного обучения,
- необходим минимальный опыт участия в соревнованиях по анализу данных.
На странице курса есть список допустимых соревнований. В прошлом году он был обширен, в этом так не будет. Сейчас там всего одно соревнование (я включаю туда только те, которые сам хорошо изучил, чтобы было потом их полезно обсуждать).
Что ещё интересного:
- возможно, в этом году набор будет последним.
Часть курса переходит в магистерскую программу на факультете ВМК, а часть будет читаться в рамках договорённостей с компанией «Аналитика плюс» (пока планы такие).
DrivenData: наши снова в призах
На недавно завершившемся соревновании по аналитике в области здравоохранения второе место среди более чем ста участников занял Александр Гущин. Недавно он также был вторым на российском соревновании компании АлгоМост по классификации химических экспериментов. Вдвойне приятно: Александр недавний ПЗАДовец и студент автора блога.
Поздравляем Александра и желаем дальнейших успехов!
Kaggle: наши в тройке
Недавно завершилось соревнование Microsoft по классификации вредоносных программ. Российская команда вошла в тройку (среди 377 участников). Приятно, что все бронзовые призёры в прошлом ПЗАДовцы. Имена героев:
- Михаил Трофимов (был вторым в кэгловском Авито)
- Дмитрий Ульянов (побеждал здесь и здесь)
- Станислав Семёнов (12й в рейтинге Кэгла)
Решение ребят описано в форуме. Также скоро будет доклад на конференции.
Поздравляем и желаем дальнейших успехов!
Напомню, что до этого последний российский успех на Кэгле — вхождение в тройку Михаила Сиверского на соревновании по социальным сетям (кстати, в рамках последнего ПЗАДа).