День нашей смерти

Недавно в рамках одного проекта по анализу кардиограмм выяснил, что статистические свойства этих сигналов меняются не только от каких-то ожидаемых причин, связанных с работой сердца и общим состоянием (усталостью, нагрузкой и т.п.) Ещё их начинает буквально «колбасить» в определённые дни, например, в день рождения. Как сказали кардиологи: это связано с нашими биоритмами и раз в год в один и тот же день — наш день рождения — происходит перестройка организма. Этот день самый опасный с точки зрения нашего состояния. Мне показалось это странным: всегда воспринимал конкретную дату рождения как случайную величину, но если эта теория верна, то в этот день (и в некоторый отрезок времени после него) выше вероятность умереть… было решено проверить эту гипотезу.

smert

Анализ источников по теме показал, что гипотеза-то старая. В англоязычной Википедии есть даже страничка Birthday Effect: эффект дня рождения — это статистический феномен, согласно которому вероятность смерти выше в день рождения и/или в окрестности этого дня. Он тщательно проверяется с 70х годов прошлого века, вот лишь некоторые интересные факты:

  • В выборке почти 3 млн. калифорнийцев, умерших в 1969-90гг, замечено, что мужчины чаще (чем ожидается) умирают за неделю до, а женщины на неделе после дня рождения.
  • В выборке почти 12 млн. швейцарцев наблюдается, что вероятность умереть непосредственно в день рождения на 17% выше ожидаемого (особенно для престарелых). Кстати, у женщин в день рождения чаще (чем обычно) случается сердечный приступ, а мужчины чаще заканчивают жизнь самоубийством.
  • Американцы, которые умирали в 1998-2011гг., на 7% больше ожидаемого делали это в день рождения.
  • Среди киевлян в 90е годы 20 века мужчины в день рождения умирали на 44% чаще, а женщины на 36%.

Отметим, что в некоторые исследователи этот эффект не наблюдали. Скажем, его не было у жителей Германии, умерших от рака с 1995 по 2009 годы, хотя у них был заметен «рождественский эффект». Интересно, что у жителей Англии и Уэльса наблюдается парадокс Симпсона: эффект есть в отдельных группах (скажем, у мужчин и у женщин), но его нет во всей популяции в целом. Честно говоря, первый раз вижу, как парадокс Симсона наблюдается в реальных исследованиях…

Немного про то, что значит «вероятность смерти больше ожидаемой». Интуитивно кажется, что вероятности умереть в разные дни примерно равны. Ну, хорошо, может они зависят от праздников / дней недели (хотя сходу непонятно как). Но рассмотрим планету, на которой в году ровно 2 дня. Пусть вероятность родиться в первый p, во второй — q. Естественно, они могут быть не равны, скажем, первый день совпадает с летом планеты, второй — с зимой, и жители охотнее размножаются летом. Допустим теперь, что вероятность умереть в первый день — a, во второй — b (аналогично, они могут не быть равны). Нетрудно посчитать, что вероятность умереть в свой день рождения на этой планете: (pa+qb)/(a+b-ab), а вероятность умереть в другой день — (p(b-ab)+q(a-ab))/(a+b-ab). Выбором p, q, a, b первую можно сделать существенно больше второй. Таким образом, даже если на нашей выдуманной планете нет праздников и «дней недели», то всё равно, при наличии n дней в году, вероятность умереть в конкретный день года не 1/n (пример можно обобщить и на большее число дней).

Естественно, ставя под сомнение все предыдущие исследования, было решено самим проверить гипотезу (автор блога подключил к этому своего студента Сергея Иванова). Самым трудным делом было достать подходящий датасет (всё-таки даты рождения и смерти это персональные данные, не говоря уже о всякой дополнительной информации: пол, причина смерти и т.п.)

Можно посмотреть на презентацию Сергея, которую он сделал для нашего спецсеминара. Если кратко: мы тоже увидели эффект дня рождения.

Happy Birthday! Берегите себя;)

Реклама

День нашей смерти: 2 комментария

  1. Очень интересное исследование. И презентация смачная.

    Однако, качество данных вызывает большие сомнения. Отчетливая аккумуляция — на всех круглых и полу-круглых возрастах, а также на датах 1 и 15 каждого месяца (обратите внимание, насколько выброс по рождениям больше аналогичнгого по смертям — их лучше учитывают). Обычно это свидетельствует о недостатке точной информации у регистрирующих лиц — людям свойственно округлять. У нас возрастная аккумуляция видна даже в возрастной структуре кавказских республик по данным переписи 2010 года.

    Было бы правильно использовать для подобного анализа данные какого-нибудь современного регистра населения: Швеция, Финляндия, Дания, Эстония… Думаю, что если поискать литературу внимательно, обязательно найдется. Я натыкался на проверку куда более сомнительных гипотез за Шведских данных (Villamor, E., Dekker, L., Svensson, T., & Cnattingius, S. (2010). Accuracy of the Chinese lunar calendar method to predict a baby’s sex: a population-based study: Chinese calendar sex prediction. Paediatric and Perinatal Epidemiology, 24(4), 398–400. https://doi.org/10.1111/j.1365-3016.2010.01129.x
    — а здесь немного писал об этом исследовании http://demoscope.ru/weekly/2015/0665/digest05.php).

    Еще интересно было бы знать чуть больше о методологии. Какие модели вы использовали?

    • Качество данных «вполне естественное», доминирование дат 1 и 15 при рождении как раз подтверждает, что данные брались из настоящих источников: в случае, когда не знают дату рождения часто пишут 1 или 15 (об этом указывается в нескольких статьях по данной теме). Поэтому мы посмотрели также только на этих датах и только без них.

      Данные мы, к сожалению, нашли только те, которые указаны на 15 слайде. В открытом доступе больше ничего подобного нет (чтобы были даты рождения и смерти). Пол пытались определить по имени (тоже не всегда это однозначно делается).

      Я бы не назвал это исследованием — просто посмотрели… относительная малость выборки (по сравнению с ранее сделанными исследованиями) и её качество не позволяют относиться к этому серьёзно и, например, публиковать.

      Всё делал мой студент — без особого контроля с моей стороны. По слайдам видно, что он просто посчитал частоты определённых событий (например, сколько людей родилось/умерло в дату с определённым днём) при определённых срезах (например, берём только мужчин, которые прожили не меньше 45).

      Вижу, Вы задали этот же вопрос на slideshare — попрошу Сергея ответить…

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s