Простые методы анализа данных

Недавно меня попросили выступить с лекцией на открытии одного хакатона, обычно я не очень люблю подобные мероприятия (они не очень продуманы, задачи искусcтвенные и с ликами, победителей определяют по «качеству» презентаций и т.п.). Но это мероприятие проходило в МГУ, поэтому я решил поддержать начинание в стенах родного университета. Чтобы рассказать что-то релевантное всем слушателям, которые могли быть очень неоднородны по знаниям и умениям, я выбрал тему, которую пропагандировал несколько лет назад… решать можно (и часто нужно) простыми методами, буквально в несколько строк. Ниже сокращённое описание доклада.

simple.jpg

Читать далее

Avito + Telstra + BNP

Кто ещё не смотрел — советую посмотреть видео с последних тренировок по машинному обучению. Очень хорошие доклады:

nizhibitskiy Читать далее

DS Meetup (весна, 2016)

По традиции в последнюю пятницу сезона в московском офисе Mail.Ru Group собираются любители наук о данных. Ровно через неделю — 27 мая в 18:30 по адресу Ленинградский проспект, 39, стр. 79 можно будет послушать следующие доклады:

mailru

Читать далее

Практический семинар по АД. Постскриптум.

Закончился семинар по анализу данных, организованный ребятами из Mail.ru. Несколько моих наблюдений и выводов.

1. Желающих участвовать было много. Я ставил на 80, но оказалось гораздо больше. Поэтому организаторам пришлось отсеивать по месту в лидерборде. На мой взгляд, отсев получился даже мягким… в форуме были готовые решения, которые преодолевали нужный порог.

2. Участники были очень неоднородны. Как оказалось, некоторые даже особо не поняли задачу (ещё раз подтверждает, что условия отбора мягкие). С другой стороны, были очень опытные спортивные аналитики: Семёнов, Трофимов, Дрёмов, которые изначально не рассчитывали на плотную работу на семинаре. Большинство опытных после докладов ушло (впрочем, организаторы это предвидели).

3. Совсем слаженной работы в группах не получилось. Наверное, надо, чтобы в каждой группе был опытный человек, который бы всем и руководил. Возможно, стоит формировать группы до мероприятия и продумывать (руководителю) сценарий работы с учётом возможностей членов группы. Кстати, по правилам кэгла нельзя просто так работать в группах, т.к. это обмен кодом и идеями между командами, поэтому нужно было запостить результаты групповой работы, но это так и не было сделано…

Зато впервые организовано подобное мероприятие. Читать далее

Современные задачи анализа данных

Меньше чем через 20 часов буду делать доклад в ВШЭ. Анонс доклада находится здесь (правда, там название не совсем правильное: «методы» вместо «задачи»).

UPD18.06.2015: Здесь выложена информация о состоявшемся докладе.

May 2015 meetup

Каждую последнюю пятницу сезона компания Мэйл.ру собирает любителей науки о данных. Обычно с 18:00 в офисе компании на Ленинском слушают четыре 30-минутных доклада (+вопросы), а потом обсуждение и общение. Атмосфера очень приятная, а ребята из Мэйл.ру большие молодцы! Мероприятие однозначно рекомендую. Следующее должно быть ровно через неделю. Подробности здесь.

Дискретные модели в теории управляющих систем

Завтра выступаю на 9-й Международной конференции «Дискретные модели в теории управляющих систем». Я на неё не подавался и в последнее время не занимаюсь классической дискреткой. Но так получилось, что конференция посвящена 90-летию со дня рождения С. В. Яблонского. И на ней хотели видеть представителя нашей кафедры. Поэтому был заявлен пленарный доклад с авторами Ю.И. Журавлёв и А.Г. Дьяконов (на подстраховке). Подстраховка сработала;) и завтра буду делать обзор про методы построения дизъюнктивных нормальных форм по матрице нулевых наборов (на ВМК МГУ где-то в 11:20). Вот слайды. Читать далее

Deep plankton learning — road to the top

В ближайший понедельник (30 марта) на моём спецсеминаре выступит Александр Рыжков с рассказом от том, как он занял 13 место из более чем 1000 участников соревнования National Data Science Bowl (классификация изображений планктона) на платформе Kaggle. Очень неплохо, учитывая, что Александр только начал плотно знакомиться с технологией Deep Learning.

Потом добавлю сюда ссылку на слайды.

Летние научные школы 2015

Традиционная Школа «Управление, информация и оптимизация», Солнечногорск МО, 14-20.06.2015

приём заявок — до 5 апреля 2015, школу активно рекламировал Воронцов, с этого года есть направление «Математическая статистика, анализ данных и машинное обучение»

Машинное обучение и интеллект, Санкт-Петербург, 29.07.2015 — 05.08.2015

приём заявок — до 31 марта 2015, долгое время нет программы школы 😦

IX Российская летняя школа по информационному поиску «RuSSIR 2015», Санкт-Петербург, 24-28.08.2015

приём заявок — до 20 апреля 2015, тема – анализ социальных сетей, будут крутые докладчики, например Santo Fortunato.

Если знаете ещё хорошие мероприятия по DS этим летом — присылайте, я пополню список.

Спектральная теория графов

Завтра (23 марта) на своём спецсеминаре я сделаю доклад про СТГ (Spectral Graph Theory). Эта теория изучает свойства графов с помощью анализа собственных значений / собственных векторов / характеристических многочленов матриц, которые связаны с графами (матрица сопряжённости, матрица Лапласа, беззнаковая матрица Лапласа и т.п.). Читать далее