Откуда данные о заболевших

Днём ранее написал про временной сдвиг и природу коэффициента смертности:
http://www.cashin.ru/blog/all/virus-2/

Увидел в Твитере ссылку на заметку ровно с тем же:
https://medium.com/@tabardel/coronavirus-2019-ncov-no-the-case-fatality-rate-is-not-2-48142169a367

Тем временем, Нью-Йорк Таймс публикует ожидания по коэффициентам смертности, и допускает ровно ту ошибку, которую я описал во второй части: сравнивает смертность затихших эпидемий с активно развивающейся:
https://nytimes.com/interactive/2020/world/asia/china-coronavirus-contain.html

Или я чего-то не догоняю, или визуализация вызывает вопросы.
Кидаю вопрос Нассиму Талебу, получаю подтверждение.
https://twitter.com/sergeykashin/status/1225828779748098048

Печальная новость для дизайна:
Высокий графический уровень визуализации данных скрывает опасность — у зрителя создается впечатление надежной и продуманной работы, а на деле работа построена на сомнительном смысловом фундаменте.

Вообще, у меня накопились примеры ошибок в визуализациях, созданных известными командами. Возможно, как-нибудь найду время рассказать. Пугает то, что на известные команды ориентируются другие дизайнеры, которые видят ошибки и думают что так делать окей. Это не окей.

Идем дальше.

Часть 3.
Откуда данные?

Основная масса заболевших — в Китае. Оттуда же почти все цифры. На основе этих цифр все строят статистические оценки и прогнозы.

Возникает вопрос, насколько цифры близки к реальности. Китай может всё, у них есть великий файрвол, тотальный мониторинг и партия.

А когда есть сомнения в данных, действия иногда говорят больше, чем цифры: Китай не стал бы сливать свою экономику, если бы риск был небольшим. Реакция страны на происходящее сильнее, чем можно ожидать только по цифрам. Использование крупных общественных пространств для размещения заболевших, мегазакупки медицинских материалов за рубежом (для Китая-то) — практически военная тема. Это сигнал о том, что реальность может быть хуже.

Заметили две тенденции: до конца января из Китая приходили цифры роста инфицированных по 50% в день, а после 27 января — ровно по 25% в день.
https://twitter.com/salilstatistics/status/1223484153468944384

Инфицирование — случайный процесс. Странно, что поток чисел так ровно ломается с 50% на 25% в один день — непонятно, что произошло именно в этот день. +Непонятно, насколько возможна проблема технического ограничения диагностирования новых случаев — ведь на диагностику нужны ресурсы.

Схожий вопрос к цифрам: очень ровный рост в отчетности — несколько дней подряд точно по квадратичной кривой, будто данные отвешивали вручную:
https://twitter.com/evdefender/status/1224723734680035329

Посмотрим.
P. S. пока я собирал скриншоты, цифры ушли вверх.

 
* * *
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Поделиться
Отправить
Запинить
8 февраля   данные   Коронавирус   риск
Популярное