Графовые нейронные сети

2021/12/302022/01/04 alexanderdyakonov обзор глубокое обучение, граф, машинное обучение, нейросеть, GNN

Мы расскажем про популярный класс нейронных сетей – графовые сети. Манера повествования позволит понять, как они устроены, даже новичкам в машинном обучении, однако обзор видов сетей и конструкций в них представлен достаточно полный, с использованием специальных терминов. Прямо сейчас есть несколько отличных источников по графовым сетям (см. ссылки в конце), однако этот материал у меня давно лежал (нет, правда, красивых картинок) и перед новым годом появилось время сделать заметку, поэтому я решил его опубликовать.

Читать далее →

Скоринговые ошибки (Proper Scoring Rules)

2020/12/282020/12/28 alexanderdyakonov обзор бинарная классификация, вероятность, качество, метрика качества, ошибка, энтропия

Продолжаем рассказывать про функции ошибки и функционалы качества, сегодня поговорим о функциях, которые «заставляют» алгоритм выдавать вероятности принадлежности к классам. Рассчитано на читателей, которые освоили предыдущие посты по этой теме.

Читать далее →

Аугментация для текстов (Text Augmentation)

2020/11/092020/11/09 alexanderdyakonov обзор аугментация, NLP, синонимы, текст

Похоже, на русском языке нет полного обзора по современным методам аугментации при работе с текстами, поэтому появился этот… На английском языке есть несколько очень хороших, но здесь удалось осветить более свежие научные работы. Целевая аудитория обзора — начинающие в NLP.

Читать далее →

Самообучение (Self-Supervision)

2020/06/032020/06/04 alexanderdyakonov обзор contrastive learning, downstream task, машинное обучение, обучение без учителя, самообучение, pretext task, pseudo label

Сейчас расскажем о самообучении – способе многому научить модель без ручной разметки и, в некотором смысле, отказаться от глубокого обучения при настройке модели для решения нужной Вам задачи. Материал требует среднего уровня подготовки, даётся много ссылок на оригинальные работы.

Читать далее →

Проблема калибровки уверенности

2020/03/272020/04/09 alexanderdyakonov обзор вероятность, калибровка, focal loss, энтропия

Удивительно, но нигде нет хорошей обзорной работы по всем методам калибровки модели — процесса в результате которого «чёрные ящики» не просто качественно решают задачу классификации, но ещё и правильно оценивают свою уверенность в выданном ответе. Этот обзор не начального уровня — необходимо представлять, как работают и используются алгоритмы классификации, хотя автор существенно упростил изложение, например, обошёлся без условных вероятностей в определениях (из-за чего немного пострадала строгость изложения).

calibration2

Читать далее →

Итоги OneTwoTrip Contest

2020/01/28 alexanderdyakonov обзор бустинг, опрос, lightgbm, соревнование, статистика, xgboost

Недавно завершилось соревнование «OneTwoTrip Contest» на платформе Boosters. Здесь представлено некоторое саммари результатов.

соревнование

Читать далее →

Токенизация на подслова (Subword Tokenization)

2019/11/292019/11/28 alexanderdyakonov обзор NLP, сегментация, слово, текст, токен, токенизация, subword, tokenization

Эта заметка для более продвинутых в ML (в отличие от основной массы предыдущих постов): для тех, кто постигает таинства анализа текстов, поскольку речь пойдёт о предобработке текстовых данных, которая может улучшить качество в некоторых задачах.

subword

Читать далее →

Нейронные обыкновенные дифференциальные уравнения

2019/06/13 alexanderdyakonov обзор ОДУ, нейросеть, эссе

На конференции NeurIPS 2018 одной из лучших работ была признана статья «Neural Ordinary Differential Equations». Это нестандартный пост для блога, который, впрочем, может положить начало традиции… я выкладываю несколько обзоров на русском языке этой статьи и прошу читателей помочь выбрать мне лучшие.

ODE

Читать далее →

Визуализации

2016/11/082016/11/08 alexanderdyakonov обзор ВМК, МГУ, визуализация, kaggle

В рамках университетского курса даю своим студентам несколько заданий по визуализации. Первое (простое) — найти интересные визуализации в Интернете (не обязательно связанные с анализом данных) и объяснить почему они интересны. Второе (сложное) — взять реальные данные с платформы Kaggle и принять там участие в конкурсе по визуализации (там можно в разделе Datasets создавать т.н. Kernels, за которые могут голосовать другие участники). Теперь, что из этого получилось в этом году…

friends — Рис. взят с сайта http://www.facebookstories.com

Читать далее →

Geek Picnic 2016

2016/06/192018/09/03 alexanderdyakonov обзор искусство, наука, geek picnic, технологии

Сегодня побывал на фестивале о науке, технологиях и искусстве Geek Picnic. Он ещё будет проходить завтра, а потом в Питере. Поэтому для тех, кто думает, ходить или нет: мой фотоотчёт.

Читать далее →

	alexanderdyakonov к записи Случайный лес (Random For…
	alexanderdyakonov к записи Логистическая функция ошибки
	alexanderdyakonov к записи AUC ROC (площадь под кривой…
	alexanderdyakonov к записи Случайный лес (Random For…
	Ульяна к записи Случайный лес (Random For…
	Ilias Tuktarov к записи AUC ROC (площадь под кривой…
	lapkin25 к записи Логистическая функция ошибки

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Анализ малых данных

КвазиНаучный блог Александра Дьяконова

обзор

Графовые нейронные сети

Скоринговые ошибки (Proper Scoring Rules)

Аугментация для текстов (Text Augmentation)

Самообучение (Self-Supervision)

Проблема калибровки уверенности

Итоги OneTwoTrip Contest

Токенизация на подслова (Subword Tokenization)

Нейронные обыкновенные дифференциальные уравнения

Визуализации

Geek Picnic 2016