Работа DS: зарплаты, занятость и желания

Подводим итоги опроса по работе аналитиков данных, который ранее запускали на телеграм-канале. Спасибо всем, кто принял участие! Было желание опросить 1000 человек, к тому же в предварительном опросе приняло участие гораздо больше, но заполнить гугл-форму для многих оказалось чуть сложнее, чем пройти один опрос в телеграме. Всё равно, получился один из самых больших опросов в сфере Data Science.

Читать далее

С Новым 2019 годом!

По ежегодной традиции поздравляю всех читателей блога с праздником! Немного статистики, небольшой подарок читателям, а также, как я обещал, разберём итоги и правильные ответы Странного теста.

stat2018

Читать далее

День нашей смерти

Недавно в рамках одного проекта по анализу кардиограмм выяснил, что статистические свойства этих сигналов меняются не только от каких-то ожидаемых причин, связанных с работой сердца и общим состоянием (усталостью, нагрузкой и т.п.) Ещё их начинает буквально «колбасить» в определённые дни, например, в день рождения. Как сказали кардиологи: это связано с нашими биоритмами и раз в год в один и тот же день — наш день рождения — происходит перестройка организма. Этот день самый опасный с точки зрения нашего состояния. Мне показалось это странным: всегда воспринимал конкретную дату рождения как случайную величину, но если эта теория верна, то в этот день (и в некоторый отрезок времени после него) выше вероятность умереть… было решено проверить эту гипотезу.

smert

Читать далее

Тяжёлые хвосты

В курсе теории вероятностей и матстатистики много говорят про нормальное распределение, а потом немного пугают практикой… Дескать, в жизни не всё нормально и встречаются распределения похожие на «нормальный холмик», например, «распределения с тяжёлыми хвостами». Типичным представителем подобного вида распределений является распределение Коши.

Обнаружил, что практически никто их аналитиков не понимает, а чем же всё-таки плохо распределение Коши, кроме того, что у него нет (конечного) матожидания. Ну нет и нет, подумаешь…
hvost2

Читать далее

Хитрое тестирование

Немного тервера. Предположим, Вам надо протестировать воду нескольких водоёмов на чистоту, точнее, отсутствие в ней определённого редкого химиката (вероятность  p того, что он «загрязнит» водоём мала). У Вас есть супер-тест, который по пробе воды определяет в ней наличие химиката (со 100%-й точностью). Вы взяли пробы воды из N водоёмов и должны точно указать, в каких водоёмах он есть.

pic

Читать далее

Почти юбилей

Примерно месяц назад я начал вести этот блог. При этом не объяснился, зачем… Просто показалось, что это удобно — иметь место, где можно поместить объявление или памятку (хотя бы для себя).

Я думал, что буду постить 2-3 раза в месяц, но это случилось 12 раз. Возможно, скоро надоест:)

Я думал, что аудитория будет небольшой (~15 посетителей за неделю), но в среднем его просматривают 20 человек в день (максимум — 65, минимум — 2).

Я думал, что аудитория будет состоять из моих студентов и коллег, но основной приток идёт из Фейсбука (которым я раньше не пользовался). Интересно, что Контактик уступает в два раза.

Судя по кликам, посетителям не интересны обзоры из серии «Мир анализа данных» или «Мир программирования», а вот ссылки на конкретные видяшки, страницы конференций, слайды и пр. пользуются популярностью.

Продолжаю эксперимент!

Спасибо всем, кто читает. Надеюсь, это как-то делает Вас лучше.