Data Science Contest Сбербанка

Недавно стартовал новый конкурс по анализу данных. В помощь новичкам, которые захотят поиграться его данными, вот презентация, которую я обсуждал со своими магистрами на прошлом занятии, а вот код, с помощью которого получены все графики. Кстати, большие ipynb-файлы с гитхаба лучше смотреть с помощью nbviewer, например так.

sberbank

Питон (Python)

Сейчас практически все, кто занимается анализом малых данных, делают это с помощью Питона… а ведь ещё 5 лет назад не было пакетов типа scikit-learn и единственной средой с реализованными бустингом, случайным лесом и т.п. оставался R (+ RStudio, т.к. никаких ноутбуков тоже не было). Или приходилось реализовывать все алгоритмы «с нуля», что я и делал в том же Matlab-е. Ещё были разные программки на С/С++ типа libSVM, SVMlight

%d0%bf%d0%b8%d1%82%d0%be%d0%bd

Читать далее

Алексей Нефёдов

Продолжаем серию интервью в данном блоге. Как показывает статистика, это самые популярные посты. Сегодня переносимся за океан, узнаем для каких задач применяют анализ данных там и познакомимся с обаятельным человеком — Алексеем Нефёдовым, автором SVM tutorial (обязательно к прочтению для всех, кто учит машинное обучение).

nefedov Читать далее

Спецсеминар

Как-то забыл сделать разные анонсы мероприятий начала учебного года… Начал работу мой спецсеминар с мудрёным названием «Алгебра над алгоритмами и эвристический поиск закономерностей». Будет проходить на ВМК МГУ по четвергам в ауд. 637, начало в 18:00 (к этому времени обычно собираемся, а сами доклады ~18:20).

seminar Читать далее

Matlab

Начал выкладывать слайды своего курса ПЗАД. В его рамках я рассказываю также и про связку Matlab, R, Python (последнее время без R — в зависимости от настроения). Так получилось, что работать в Матлабе мне всегда нравилось: в своё время быстро перешёл на него с С, великолепная графика и помощь. Из минусов только отсутствие хороших библиотек для машинного обучения и платность.

matlab Читать далее

Российские вузы — самые лучшие

Завершился очередной ежегодный турнир студентов и аспирантов по анализу данных Data Science Game (в этом блоге был его анонс). В этом году отборочный этап прошли 3(!) российские команды: сборные МФТИ, МГУ и Сколтеха. Удивительно, но все они уехали домой с наградами! С чем их и поздравляем!

flags Читать далее

В начале сентября

В выходные первых двух недель сентября состоятся крупные встречи DS-сообщества.

2 сентября  в офисе Mail.Ru очередной Moscow Data Science Meetup.

10-11 сентября в Яндексе третий по счёту Data Fest.

Везде нужна предварительная регистрация.

meetups