Журавлёв Юрий Иванович

2022/02/092022/02/09 alexanderdyakonov жзл ВМК, Журавлёв, МГУ, РАН, биография, интервью, математика

14 января ушёл из жизни мой учитель, глава большой научной школы академик Юрий Иванович Журавлёв. Это пост памяти о нём – о том, чему я научился у Юрия Ивановича и за что ему благодарен. В конце – ссылки на интервью и видео.

Читать далее →

Графовые нейронные сети

2021/12/302022/01/04 alexanderdyakonov обзор глубокое обучение, граф, машинное обучение, нейросеть, GNN

Мы расскажем про популярный класс нейронных сетей – графовые сети. Манера повествования позволит понять, как они устроены, даже новичкам в машинном обучении, однако обзор видов сетей и конструкций в них представлен достаточно полный, с использованием специальных терминов. Прямо сейчас есть несколько отличных источников по графовым сетям (см. ссылки в конце), однако этот материал у меня давно лежал (нет, правда, красивых картинок) и перед новым годом появилось время сделать заметку, поэтому я решил его опубликовать.

Читать далее →

Эссе по курсу «Глубокое обучение»

2021/09/232021/09/23 alexanderdyakonov образование deep learning, глубокое обучение, лекции, нейросеть, студенты

Для тех, кто больше любит читать, чем смотреть и слушать, немного материалов по глубокому обучению…

Читать далее →

Работа DS: зарплаты, занятость и желания

2021/06/212021/06/21 alexanderdyakonov работа Data Science, опрос, статистика

Подводим итоги опроса по работе аналитиков данных, который ранее запускали на телеграм-канале. Спасибо всем, кто принял участие! Было желание опросить 1000 человек, к тому же в предварительном опросе приняло участие гораздо больше, но заполнить гугл-форму для многих оказалось чуть сложнее, чем пройти один опрос в телеграме. Всё равно, получился один из самых больших опросов в сфере Data Science.

Читать далее →

Дисбаланс классов

2021/05/272021/07/27 alexanderdyakonov образование бинарная классификация, дисбаланс, класс, классификация, метрика качества

Рассмотрим ситуацию несбалансированных классов – что нужно уточнить при выработке стратегии решения задачи классификации, какие стратегии бывают, как отвечать на вопрос про дисбаланс на собеседовании. Приведём результаты экспериментов, дадим код и практические советы. Уровень для читателя — средний (достаточно знать основы машинного обучения и иметь небольшой опыт в решении задач классификации).

Читать далее →

Scikit-Learn: тонкие вопросы о реализации методов машинного обучения

2021/03/042021/03/05 alexanderdyakonov код алгоритм, машинное обучение, питон, программирование, python, scikit-learn

Рассмотрим несколько с виду простых вопросов об алгоритмах машинного обучения и их реализации, на которые, однако, немногие смогут верно ответить (можете попробовать сами – не читая объяснений, также в посте приведены дополнительные вопросы специально оставленные без ответа). Материал для среднего уровня (тех, кто уже знает ML и библиотеку sklearn).

Читать далее →

курс «Прикладные задачи анализа данных»

2020/12/302020/12/30 alexanderdyakonov образование анализ данных, курсы, пзад, kaggle, спецкурс

На сайте появилась новая вкладка «Курсы», а главное, выложены материалы этого года (слайды и видео) курса ПЗАД, который читается для студентов ВМК МГУ, а ниже немного об истории курса.

Читать далее →

Скоринговые ошибки (Proper Scoring Rules)

2020/12/282020/12/28 alexanderdyakonov обзор бинарная классификация, вероятность, качество, метрика качества, ошибка, энтропия

Продолжаем рассказывать про функции ошибки и функционалы качества, сегодня поговорим о функциях, которые «заставляют» алгоритм выдавать вероятности принадлежности к классам. Рассчитано на читателей, которые освоили предыдущие посты по этой теме.

Читать далее →

Аугментация для текстов (Text Augmentation)

2020/11/092020/11/09 alexanderdyakonov обзор аугментация, NLP, синонимы, текст

Похоже, на русском языке нет полного обзора по современным методам аугментации при работе с текстами, поэтому появился этот… На английском языке есть несколько очень хороших, но здесь удалось осветить более свежие научные работы. Целевая аудитория обзора — начинающие в NLP.

Читать далее →

Дистилляция данных (Data Distillation)

2020/10/212020/10/22 alexanderdyakonov исследования data, distillation, градиентный спуск, данные, дистилляция, нейросети

Расскажем об одном DL-подходе к задаче сокращения размера выборки, а на самом деле, даже более амбициозной задаче — создания синтетических данных, хранящих всю полезную информацию о выборке.

Читать далее →

	alexanderdyakonov к записи Случайный лес (Random For…
	alexanderdyakonov к записи Логистическая функция ошибки
	alexanderdyakonov к записи AUC ROC (площадь под кривой…
	alexanderdyakonov к записи Случайный лес (Random For…
	Ульяна к записи Случайный лес (Random For…
	Ilias Tuktarov к записи AUC ROC (площадь под кривой…
	lapkin25 к записи Логистическая функция ошибки

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Анализ малых данных

КвазиНаучный блог Александра Дьяконова

Автор: alexanderdyakonov

Журавлёв Юрий Иванович

Графовые нейронные сети

Эссе по курсу «Глубокое обучение»

Работа DS: зарплаты, занятость и желания

Дисбаланс классов

Scikit-Learn: тонкие вопросы о реализации методов машинного обучения

курс «Прикладные задачи анализа данных»

Скоринговые ошибки (Proper Scoring Rules)

Аугментация для текстов (Text Augmentation)

Дистилляция данных (Data Distillation)