Выношу на общественный суд свой очередной «шедевр» — научно-популярный текст
состоящий из трёх поучительных историй «Какие знаки зодиака обманывают?», «Так ли хороши оранжевые машины?», «Когда вступать в брак?», которые иллюстрируют некоторые типичные ошибки в интерпретации данных. Написано простым языком, поскольку работа выставлялась на конкурс STRF (финалист конкурса). Также обращаю внимание, что этот текст продолжает серию «Шаманство в анализе данных», состоящую из работ
- Шаманство в анализе данных (2011),
- Введение в анализ данных (2012),
- Чему не учат в анализе данных и машинном обучении (2013).
Ну, и есть уже менее популярные (предназначенные для специалистов) тексты типа
которые можно найти на моём сайте.
Самые распространённые комментарии об этих pdf-ках это, как ни странно, замечания, что автор не пользовался TeXом. Для тех, кому форма важнее содержания, поясняю, что все работы написаны не просто так, а на различные конкурсы научно-популярных статей. В частности, (1)-(2) брали призы Потанина. Автор вообще любит разные конкурсы, это является дополнительным стимулом и независимой оценкой творчества. Поэтому, в данном случае требования STRF были: Word, 1.5 интервал и т.п. Они все соблюдены. Перевёрстывать в TeXe считаю лишней тратой своего времени.
Все замечания, пожелания и предложения можно писать в комментариях. Критика приветствуется.

Александр Геннадьевич, пример с браком очень хорош. Прям «жжете».
Область causal relations действительно интересная, в прошлом году была опубликована хорошая научно-популярная статья на эту тему: https://medium.com/the-physics-arxiv-blog/cause-and-effect-the-revolutionary-new-statistical-test-that-can-tease-them-apart-ed84a988e , ссылающаяся на http://arxiv.org/abs/1412.3773
При этом стоит отметить, что победитель упомянутого соревнования на Kaggle эти методы не использовал: https://www.kaggle.com/c/cause-effect-pairs/forums/t/5643/sharing-methods/
На графике невыплат кредитов (рис.5) едва заметна периодичность (синусоида) невыплат разными знаками зодиака в одном квартале. Причем максимум невыплат знака в одном квартале приходится на минимум в другом.
Это, конечно, навскидку. Есть ли у Вас возможность проверить наличие зависимости?
(Возможно, с изменением порядка следования знаков зодиака).
Было бы очень интересно это узнать. Заранее благодарен.
Очень интересное наблюдение. На самом деле, синусоиды там нет. Расскажу секрет. Дело в том, что я не могу публиковать здесь точные цифры (связан с поставщиком данных договором), поэтому я чуть-чуть их менял, но чтобы не менялась суть. Видимо, на подсознательном уровне я сделал это так, что стало похоже на синусоиду. Настоящие графики менее похожи.
[…] широкой аудитории» (как День нашей смерти или Неправильные интерпретации)… скоро будет один пост про статистику в обыденной […]