Недавно стартовал новый конкурс по анализу данных. В помощь новичкам, которые захотят поиграться его данными, вот презентация, которую я обсуждал со своими магистрами на прошлом занятии, а вот код, с помощью которого получены все графики. Кстати, большие ipynb-файлы с гитхаба лучше смотреть с помощью nbviewer, например так.
Месяц: Октябрь 2016
Питон (Python)
Сейчас практически все, кто занимается анализом малых данных, делают это с помощью Питона… а ведь ещё 5 лет назад не было пакетов типа scikit-learn и единственной средой с реализованными бустингом, случайным лесом и т.п. оставался R (+ RStudio, т.к. никаких ноутбуков тоже не было). Или приходилось реализовывать все алгоритмы «с нуля», что я и делал в том же Matlab-е. Ещё были разные программки на С/С++ типа libSVM, SVMlight…
Алексей Нефёдов
Продолжаем серию интервью в данном блоге. Как показывает статистика, это самые популярные посты. Сегодня переносимся за океан, узнаем для каких задач применяют анализ данных там и познакомимся с обаятельным человеком — Алексеем Нефёдовым, автором SVM tutorial (обязательно к прочтению для всех, кто учит машинное обучение).
Спецсеминар
Как-то забыл сделать разные анонсы мероприятий начала учебного года… Начал работу мой спецсеминар с мудрёным названием «Алгебра над алгоритмами и эвристический поиск закономерностей». Будет проходить на ВМК МГУ по четвергам в ауд. 637, начало в 18:00 (к этому времени обычно собираемся, а сами доклады ~18:20).