Дисбаланс классов

2021/05/272021/07/27 alexanderdyakonov образование бинарная классификация, дисбаланс, класс, классификация, метрика качества

Рассмотрим ситуацию несбалансированных классов – что нужно уточнить при выработке стратегии решения задачи классификации, какие стратегии бывают, как отвечать на вопрос про дисбаланс на собеседовании. Приведём результаты экспериментов, дадим код и практические советы. Уровень для читателя — средний (достаточно знать основы машинного обучения и иметь небольшой опыт в решении задач классификации).

Читать далее →

Скоринговые ошибки (Proper Scoring Rules)

2020/12/282020/12/28 alexanderdyakonov обзор бинарная классификация, вероятность, качество, метрика качества, ошибка, энтропия

Продолжаем рассказывать про функции ошибки и функционалы качества, сегодня поговорим о функциях, которые «заставляют» алгоритм выдавать вероятности принадлежности к классам. Рассчитано на читателей, которые освоили предыдущие посты по этой теме.

Читать далее →

Кривые в машинном обучении

2019/08/292019/08/31 alexanderdyakonov образование AUC, бинарная классификация, кривые, метрика качества

Этот пост продолжает тему оценки качества алгоритмов машинного обучения для решения задач классификации. Рассмотрим кривые «полнота-точность», Gain, Lift, K-S (machine learning curves) и таблицу для анализа доходности. Самое главное — мы определим все кривые через уже знакомые нам понятия, часто используемые в ML (а не как обычно: для каждой кривой придумывается своя терминология).

ML_curves

Читать далее →

Функционалы качества бинарной классификации

2019/05/312019/07/03 alexanderdyakonov образование бинарная классификация, качество, классификация, метрика качества, оценка качества, полнота, F-мера, точность, функция ошибки

Этот пост продолжает серию про функции ошибки и функционалы качества в машинном обучении. Сейчас разберёмся с самой простой подтемой — как измерять качество чёткого ответа в задачах бинарной классификации. Уровень для чтения — начальный;)

Читать далее →

Функции ошибок в задачах регрессии

2018/10/232018/12/31 alexanderdyakonov образование качество, метрика качества, ошибка, регрессия, функция ошибки

Сегодня будет сделанный с любовью обзор функций ошибок и функционалов качества в задачах регрессии.

pic_err2_05

Читать далее →

Логистическая функция ошибки

2018/03/122018/09/03 alexanderdyakonov образование классификация, метрика качества, оценка качества, ошибка, logloss, регрессия, функция ошибки

Эту функцию называют также «логлосс» (logloss / log_loss), перекрёстной / кросс-энтропией (Cross Entropy) и часто используют в задачах классификации. Разберёмся, почему её используют и какой смысл она имеет. Для чтения поста нужна неплохая ML-математическая подготовка, но даже новичкам я бы рекомендовал почитать (хотя я не очень заботился, чтобы «всё объяснялось на пальцах»).

logloss

Читать далее →

	alexanderdyakonov к записи Случайный лес (Random For…
	alexanderdyakonov к записи Логистическая функция ошибки
	alexanderdyakonov к записи AUC ROC (площадь под кривой…
	alexanderdyakonov к записи Случайный лес (Random For…
	Ульяна к записи Случайный лес (Random For…
	Ilias Tuktarov к записи AUC ROC (площадь под кривой…
	lapkin25 к записи Логистическая функция ошибки

Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Анализ малых данных

КвазиНаучный блог Александра Дьяконова

метрика качества

Дисбаланс классов

Скоринговые ошибки (Proper Scoring Rules)

Кривые в машинном обучении

Функционалы качества бинарной классификации

Функции ошибок в задачах регрессии

Логистическая функция ошибки