Неправильные интерпретации

Выношу на общественный суд свой очередной «шедевр» — научно-популярный текст

состоящий из трёх поучительных историй «Какие знаки зодиака обманывают?», «Так ли хороши оранжевые машины?», «Когда вступать в брак?», которые иллюстрируют некоторые типичные ошибки в интерпретации данных. Написано простым языком, поскольку работа выставлялась на конкурс STRF (финалист конкурса). Также обращаю внимание, что этот текст продолжает серию «Шаманство в анализе данных», состоящую из работ

  1. Шаманство в анализе данных (2011),
  2. Введение в анализ данных (2012),
  3. Чему не учат в анализе данных и машинном обучении (2013).

Ну, и есть уже менее популярные (предназначенные для специалистов) тексты типа

которые можно найти на моём сайте.

Самые распространённые комментарии об этих pdf-ках это, как ни странно, замечания, что автор не пользовался TeXом. Для тех, кому форма важнее содержания, поясняю, что все работы написаны не просто так, а на различные конкурсы научно-популярных статей. В частности, (1)-(2) брали призы Потанина. Автор вообще любит разные конкурсы, это является дополнительным стимулом и независимой оценкой творчества. Поэтому, в данном случае требования STRF были: Word, 1.5 интервал и т.п. Они все соблюдены. Перевёрстывать в TeXe считаю лишней тратой своего времени.

Все замечания, пожелания и предложения можно писать в комментариях. Критика приветствуется.

А вот и картинка оранжевой машинки, о которой Вы узнаете из pdf-ки...
А вот и картинка оранжевой машинки, о которой Вы узнаете из pdf-ки…

Реклама

Неправильные интерпретации: 4 комментария

  1. Область causal relations действительно интересная, в прошлом году была опубликована хорошая научно-популярная статья на эту тему: https://medium.com/the-physics-arxiv-blog/cause-and-effect-the-revolutionary-new-statistical-test-that-can-tease-them-apart-ed84a988e , ссылающаяся на http://arxiv.org/abs/1412.3773
    При этом стоит отметить, что победитель упомянутого соревнования на Kaggle эти методы не использовал: https://www.kaggle.com/c/cause-effect-pairs/forums/t/5643/sharing-methods/

  2. На графике невыплат кредитов (рис.5) едва заметна периодичность (синусоида) невыплат разными знаками зодиака в одном квартале. Причем максимум невыплат знака в одном квартале приходится на минимум в другом.

    Это, конечно, навскидку. Есть ли у Вас возможность проверить наличие зависимости?
    (Возможно, с изменением порядка следования знаков зодиака).

    Было бы очень интересно это узнать. Заранее благодарен.

    • Очень интересное наблюдение. На самом деле, синусоиды там нет. Расскажу секрет. Дело в том, что я не могу публиковать здесь точные цифры (связан с поставщиком данных договором), поэтому я чуть-чуть их менял, но чтобы не менялась суть. Видимо, на подсознательном уровне я сделал это так, что стало похоже на синусоиду. Настоящие графики менее похожи.

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s