Журнал Сергея Кашина

Твиттер: http://twitter.com/sergeykashin
Канал в Телеграме: https://t.me/sergeykashin
Инстаграм: https://www.instagram.com/skashin/
Фейсбук: http://facebook.com/real.sergey.kashin
Сайт: http://cashin.ru

Влияние школ на распространение вируса

Поднимаю ссылку на недавнее исследование, где наглядно показано, насколько сильно закрытие школ влияет на скорость распространения вируса.

https://www.thelancet.com/journals/laninf/article/PIIS1473-3099(20)30785-4/fulltext

Красным показаны диапазоны коэффициента воспроизведения (R) без ограничений, синим — при действующих ограничениях. По горизонтали — количество дней с момента начала действия ограничений.

Отправлять детей в школу опаснее, чем пользоваться общественным транспортом, посещать общественные мероприятия, путешествовать, ходить на работу и т. д. Контакты в школах это не только много людей в одном месте. Дети не хотят выглядеть не круто, и поэтому многие избегают ношения масок. Друзья, которые обнимались при встречах до пандемии, продолжают обниматься. В классах вентиляция, практически, на совести учителей. Проветривают на переменах, но 45 минут урока хватает, чтобы поделиться вирусом.

Дети активно двигаются, движение повышает интенсивность дыхания — обмен частицами в обе стороны. Дети не молчат — при громкой речи многократно увеличивается выделение аэрозольных частиц.

Графики показывают коэффиценты по стране в целом. Включена 131 страна. Но важная деталь: на первом из восьми графиков аудитория меньше: школьники и учителя. Остальные семь — без ограничения аудитории.

Школьники, которые без ограничений ходят в школу, пользуются, в том числе, и транспортом. Но не все, кто пользуется транспортом, едут в школу.

Получается, что относительно небольшая выборка населения — ученики и сотрудники школ — генерят более высокое ускорение распространения, чем остальные виды собраний людей. Таким образом, вероятность того, что человек пойдет в школу и заразится, очень высокая.

* * *

Пара слов о показателе R.

Это относительное изменение количества инфицированных за небольшой промежуток времени. Например, в России считают за 4 дня и сравнивают с предыдущими 4 днями.

R = 1 показывает, что скорость не меняется, заражение происходит линейно:
100 + 100 + 100...

R > 1 показывает, что скорость увеличивается, это ускорение.
100 + 110 + 120...

R < 1 показывает снижение скорости.
100 + 90 + 80...

Аналогия с управлением автомобилем:
R — это не скорость, это насколько сильно мы давим на педаль газа или тормоза.

Для победы над инфекцией комплекс всех мер должен привести к показателю R ниже единицы. И не просто достигнуть один раз, а долго удерживать его ниже единицы. В конце будет некому заражать других. По аналогии это нажатие педали тормоза.

По той же аналогии удержание R близко к единице не помогает: не ускоряемся, но и катимся с прежней скоростью.

Вот здесь показываю R с помощью цвета в столбцах:
https://www.cashin.ru/virus/

Страны, где «нажата педаль газа» — краснее.

Понимаю, что график уже выглядит мелковато. Я его сделал, когда еще не нужно было подписывать годы, а числа ещё были шестизначными...

Но общая картинка видна. Россия сейчас аккуратненько притормаживает, но рано радоваться: это слегка притормаживающий быстро несущийся поезд:
https://www.cashin.ru/virus/russia/

Нужен именно комплекс мер, а не какая-то одна:
Вакцины — классно, конечно, но существует проблема производства, распространения, и далее всей цепочки от записи пациента до проведения последнего укола. Это произойдет не быстро, если вы не Израиль. Не все доверяют вакцинам. Не всем её можно ставить.

Можно сказать, но вот в Израиле же смогли? И мы сможем. Но тогда можно сказать, ведь в Сингапуре смогли надеть на всех маски, так чего мы не можем? Это на порядки проще и дешевле! Это история про то, что в реальном мире «хороший дизайн» не всегда приводит к хорошему результату. Вследствие разных сложных обстоятельств.

Маски — тоже классно, не нужно ничего колоть, никаких непроверенных на длительном промежутке времени чужеродных веществ в организме, никаких побочных эффектов. Но людям пока не удалось заставить всех одновременно носить маски. Кто-то носит, а кто-то нет.

Быстрое и недорогое тестирование — тоже хорошо, даже при низкой точности за счет массового применения быстро выявляются инфицированные и их можно изолировать. Но быстрое тестирование у нас, например, почему-то не развивают.

Локдауны — пока самая мощная мера, но и крайне дорогостоящая и тяжелая в воплощении.

Нужно комбинировать меры.

Вероятность — не вероятность

Главная проблема в индустрии визуализации данных: качество графики повышается, а понимание лежащих в основе процессов и их свойств — не особо.

Предыдущие заметки на эту тему:

Миф о криминальных иммигрантах
https://www.cashin.ru/blog/all/vis-fault-1/

Бессмысленные данные
https://www.cashin.ru/blog/all/times-zero/

* * *

Сегодня посмотрим на графику к чемпионату мира по футболу 2018 года.
https://projects.fivethirtyeight.com/2018-world-cup-predictions/matches/

Авторы ведут блог fivethirtyeight.com и периодически строят прогнозы разных событий.

Вот так выглядела оценка вероятностей в матчах по дням:

Вот такая графика появилась к финалу:

Такие вещи сходу нравятся. Как вписаны варианты исхода вничью. Как подобраны цвета. Разделительные линии между таймами. Перетекание команд в финале. В общем, техника визуализации. При забивании гола меняется график, это наводит на мысли о том, что прогноз учитывает ход игры.

Поначалу это внушает доверие. Чаще всего люди примерно с таким впечатлением и уходят, не вникая глубже. А если не уходят, появляются вопросы.

Что произошло вот здесь, в кружочке?

Испанцы забили гол. В самом начале матча. Прогноз стал показывать, что вероятность победы (WIN PROB.) команды Испании резко увеличилась примерно в два раза: с 25% до 48%.

Ладно. Матч только начался и продолжается. В середине тайма снова что-то происходит:

Теперь гол забивает Португалия. Вероятность победы Испании резко снижается более чем в два раза. Вероятность победы Португалии теперь в два раза выше.

Такое происходит еще 4 раза в течение матча — забили всего 6 мячей. Прогноз вероятности прыгает то в одну, то в другую сторону.

В конце происходит совершенно дикая вещь: незадолго до конца матча система показывала вероятность исхода «Португалия победит» как максимальную, на глаз более 80 %. Внезапно (!) испанцы забивают шестой гол. Прогноз вероятности победы Португалии рушится в ноль.

Внимание, вопрос. Почему «вероятность» так сильно прыгает при забивании голов? Вероятность ли это вообще? Авторы явно пишут — да, WIN PROB.

Как на самом деле ведёт себя вероятность? И чем вероятность отличается от текущего счета в игре?

* * *

Давайте так. Представим, начинается чемпионат, и на поле выходят две команды. На трибунах десятки тысяч зрителей, у экранов — миллионы.

Почему команды состязаются друг с другом? Потому что неизвестно, кто победит. Именно в этом интерес.

Иногда одна команда сильнее другой. И, типа, видно, кто победит наиболее вероятно. Но тогда зачем команды выходят на поле? Да потому что всё равно неизвестно! А что если кто-то выложится получше? Потому и состязаются. Шансы есть. Забивай на последней минуте, атакуй, даже проигрывая, никогда не сдавайся, и т. п. Неопределенность заложена в саму суть игры.

Рассмотрим процесс.
Для простоты исключаем ничью, как в финале.
Вот две команды, с какой-то оценкой относительного уровня.
Команда А оценивается как чуть более сильная, чем Б.
Вероятность победы А чуть выше:

Но когда начинается матч, мы не знаем наверняка результат «точно победит команда А». Результат этой игры зависит сейчас от действий конкретных людей на поле. Если хорошая команда будет плохо работать, она не победит. Быть сильной командой недостаточно.

Начинается матч, и менее сильная команда Б забивает гол. Как авторы нашего прогноза в такой ситуации корректируют прогноз? Они показывают резкое увеличение вероятности победы в матче забившей команды:

Вероятность резко повышается... Чувствуете, что здесь что-то не то?
Может ли команда забить гол? Ну, а зачем ей ещё выходить на поле, а-ха-ха! Конечно, может.

Окей. Может ли команда Б забить не один, а несколько голов? Вот так:

Опять же, почему нет? У них что, ноги отвалились после первого гола? Ноги есть, мяч по-прежнему круглый, всё зависит от действий людей. Напомню, что изначально мы рассматриваем ситуацию, когда командам действительно имеет смысл играть, их шансы изначально близки.

Рассмотрим теперь, что происходит с командой А. Проходит несколько минут, и они... тоже забивают гол.

Сколько голов ещё забьет команда А? Ну как сколько. Это неизвестно. Матч же только начался. Исходная картинка наглядно показывает вполне возможный разброс количества голов за игру: 1, 1, 6:

Потому, вполне может быть так:

Итого, возможности забивать есть у обеих команд:

А может забивать.
Б может забивать.
Как распределяются шансы?

Мы полагаем, что более сильная команда имеет больше шансов. Поэтому смещаем прогноз 50 на 50 (обе могут победить) в сторону сильных. 45 на 55, например.

Но смещаем не слишком далеко, потому что у менее сильной команды тоже есть шанс победить, мы не знаем исхода и поэтому наблюдаем за игрой.

И вот самая интересная деталь, ради которой вся история.
Прогноз вероятности исхода матча — это не то же самое, что счёт игры. Вероятность не прыгает по ходу игры так, как показывают авторы визуализации. Это разные процессы.

Природа счёта известна и проста. Это случайные дискретные события на оси времени:

Какая, в данном случае, природа вероятности победы в матче? Чем она обусловлена?

Начало матча: прогноз вероятности основан только на состоянии команд на момент начала. Игра команд не началась и не влияет на начальный прогноз:

Конец матча: один из пунктов достигает вероятности 100%.
Победа А, Победа Б, Ничья.
Например, победила команда Б:

Что происходило с вероятностью в процессе? Как она менялась? Вряд ли как-то так:

Вероятность менялась как-то нелинейно. Какова природа нелинейности?

В конце матча появляется больше определенности, потому что проигрывающей команде остается все меньше времени на проведение атаки. Возникают физические ограничения, которых не было в середине матча.

Вот тут в конце матча у Аргентины оставалось настолько мало времени, что люди просто не успели бы физически провести мяч в ворота три раза. В конце игры вероятность победы противника при таком счёте стремится к 100%.

В середине и в начале всё по-другому.

Прогноз должен меняться нелинейно. Но авторы предлагают вот такую странную нелинейность: прогноз скачет и в начале, и в середине, и в конце матча чуть ли не от нуля до ста процентов. На большинстве графиков. Их там 64 штуки, гляньте, повторяю ссылку:
https://projects.fivethirtyeight.com/2018-world-cup-predictions/matches/

За примером снова не нужно далеко ходить, всё та же картинка Португалии-Испании показывает, как резко меняется прогноз даже в конце матча:

Вероятность отражает неопределенность. Если даже в конце матча такая неопределенность, и прогноз настолько шумный, то какая же тогда неопределенность в середине матча?

Все эти прыжки «вероятности» говорят ровно следующее и о прогнозе, и о методике: мы не знаем, кто победит.

При такой высокой дисперсии данных ситуация «мы не знаем, кто победит» в числовом выражении сходится к 50 на 50. Или, точнее, с поправкой на оценку навыков команд. В нашем примере, 45 к 55.

Какой прогноз вероятности заслуживал бы больше доверия? Прогноз с корректировкой на неопределенность и высокий шум данных. Данные о забитых мячах — очень шумные случайные переменные.

Данные о пропущенных мячах важны, потому что влияют на моральное состояние команд, и на тактику. Победители часто встают в глухую оборону. Но это слова. Цифры матчей говорят о том, что оборону можно взломать, и именно в этом заключается работа другой команды. И поэтому сохраняется неопределенность, идет борьба, появляются новые победители.

К концу матча остается мало времени на взлом обороны. Когда ты физически не успеешь добежать до ворот три раза. Включается фактор времени. Но это ограничение появляется ближе к концу:

Накладываются другие факторы. Усталость, моральная нагрузка и т. д. Какие-то исзчезают позже других (время: добраться до ворот можно и на 87 минуте матча, поэтому красный график такой крутой в конце), какие-то раньше.

Но в целом история такая, как мы говорили в начале: у обеих команд есть шансы. Обе команды свежие и бодрые в начале матча. Поэтому более корректным будет прогноз с корректировкой по функции оставшихся возможностей. Любой забитый гол не должен приводить к сильным колебаниям вероятности в начале матча.

Если показатель высокодисперсный — вероятности на начальных этапах сходится к 50%. Проще говоря, данные содержат много шума, и вы не знаете, кто победит.

Такой прогноз показывает шум и текущий счёт, а не вероятность:

Более адекватный прогноз учитывает неопределенность и дисперсию входных данных. Первые голы меньше влияют на оценку вероятности. Определенность значительно увеличивается ближе к концу, когда отпадают варианты что-то исправить. Чем ближе к концу, тем сильнее прогноз отклоняется от середины:

Конечно, это проблема для авторов прогноза, которые рассчитывают на массовую популярность. Потому что более адекватный прогноз 1) выглядит не так драматично, 2) все прогнозы окажутся очень похожими друг на друга. А значит, люди не будут охать и пересылать ссылки. Проклятие медиа: нужно поддерживать волну!

Медиа закономерно чаще выбирают первый вариант, к сожалению.

* * *

Итоги

Показанная метрика больше похожа на входные данные, чем на функцию, которая должна строиться на основе этих данных.
x ≠ f(x)

Счет в игре — это x, а не f(x). Если вероятность так трясет в самом начале матча, это признак шума данных и высокой неопределенности. Высокая неопределенность в числовом выражении означает шансы 50 на 50. Графика не учитывает этого свойства вероятности.

Вероятность оказалась не вероятностью. Это какой-то другой показатель, но не вероятность.

* * *

У блога fivethirtyeight.com миллионы читателей. Популярность не означает правоту.

Умножение на ноль: хорошие навыки графического дизайна, аккуратная работа с цветом и типографикой, остроумный способ отображения пространства вариантов во времени матчей — всё это умножается на ноль понимания природы вероятности.

Хочется отдать должное тем, кто непосредственно руками создавал эти графики. Визуально графики так хороши, что их приятно скриншотить и комментировать. Но умножение на ноль даёт ноль.

Рассказывает о самолете

Чел продаёт самолеты. Сам владеет гидросамолетом Айкон А5 (ICON A5), и в этом видео рассказывает о милых деталях, о которых обычно не говорят, представляя подобную технику.

«Я продаю самолеты. Я не инженер, и несмотря на то, что два года летаю на этом самолете, не могу даже назвать себя пилотом. Потому что эта штука настолько простая в обращении, что это сложно назвать пилотированием».

Чтобы всё не пересматривать, вот несколько интересных моментов (там много говорит о своем сервисном обслуживании, и видос подзатянут, в целом).

Боковые стёкла снимаются. И можно лететь, положив на дверь руку, как в тачке, потому что это прикольно. Ссылка на этот момент: https://youtu.be/uTHoBPGrW1U?t=173

Продуманы детали и реальные сценарии использования. Когда крылья находятся в сложенном состоянии для транспортировки, центр масс находится близко к основным стойкам шасси. Поэтому нос самолета легко поднять одной рукой и повернуть носовую стойку в нужном направлении, чтобы откатить самолет. В приподнятом состоянии носовая стойка также автоматически встаёт по центру: https://youtu.be/uTHoBPGrW1U?t=539

Легкость использования и практичность кокпита: https://youtu.be/uTHoBPGrW1U?t=634

Рассказывает, как прыгал в воду из кабины другого гидросамолета. Как было хреново, когда из кабины попадаешь сразу в воду, и как круто, что здесь по бокам есть удобные поплавки: https://youtu.be/uTHoBPGrW1U?t=1455

В общем, некие человеческие штуки помимо цифр про мощность мотора и вместительность в количестве чемоданов.

Прототипирование на деревяшках

Сэнди Монро рассказывал о новом формате ячеек Тесла на примере макета из деревянных цилиндров:
https://www.cashin.ru/blog/all/munro-batteryday/

А сегодня показал макет батареи, собранный на таких цилиндрах, и поделился своими предположениями о способах монтажа ячеек.

Но катодные нитки надо было мотать черные.

Наглядность :-)

Вот это прототипирование ;-)

И там есть вот такая любопытная картинка:

Дизайн обходится относительно недорого, но оказывает большое влияние на продукт. Дизайн в настоящем, глубоком, инженерном смысле.

Умножение на ноль

Сегодня встретил такое:

https://twitter.com/nytimes/status/1331277675869200389

Сложно придумать более бессмысленную тему для инфографики. А когда-то я следовал рекомендациям Тафти и смотрел Нью-Йорк Таймс. Наверное, ребятам сложно держать ритм. Проклятие медиа: каждый день нужно что-то говорить, а сказать нечего.

Умножение на ноль:
Хорошие графические навыки × громкое имя × ноль смысла = ноль.

f(x) = 0

Всё, что ты умножаешь на ноль, превращается в ноль.

(а эта заметка получает прикольный адрес: times-zero ;-)

Что не так с «новыми знаками» — 2

Небольшое дополнение к теме про странные дорожные знаки.
Начало здесь:
https://www.cashin.ru/blog/all/znaki-1/

Продолжение:

Иван Дианов запостил ссылку на картинку про исследование в канале Игоря Штанга:
https://t.me/nobelfaik_from_lj/1466

Когда я вижу слово «исследования», я начинаю напрягаться сильнее, чем когда просто вижу проблему, про которую исследование. Результаты исследований — для многих как проездной билет, результаты приобретают какой-то вес просто потому что кто-то «исследовал», а ты нет. У меня сразу начинают возникать вопросы. Ну-ка ну-ка, и чего там?

Если бы я реально занимался задачей и нёс ответственность, у меня возникли бы вопросы, прежде чем применять результаты исследования на практике.

Я сразу начинаю думать, о какой метрике речь. Не путать х и f(x). Вряд ли цель водителя в том, чтобы увидеть стрелку. Цель в том, чтобы доехать безопасно и куда надо. Повернуть правильно. А это зависит не только от стрелки.

Исследователи пишут: «эффективность стрелок как функция расстояния разборчивости».

Поэтому базовая измеряемая метрика «на каком расстоянии стрелки остаются различимыми» вызывает очень большие вопросы, если мы реально заботимся об f(x), а не об x.

В каком контексте и составе находился проверяемый объект: работает комплекс, а проверяли один объект. Или проверяли как-то в комплексе. Непонятно. Одна стрелка и инструмент в комплексе работают по-разному:

Снова к основной метрике: исследование говорит про оптическую разборчивость. Хотя на само деле важно, куда человек повернул. Ну, допустим. Но у стрелок же разный размер. Взвешен ли результат по занимаемой площади стрелки? Первая стрелка в рейтинге одновременно и самая крупная:

Последняя стрелка, если все стрелки в масштабе, расходует примерно в 2 раза меньше чернил, если мерять на глаз. Но заявленное расстояние разборчивости для неё только в 1,33 раза меньше, чем для первой: 372 фута против 494. Неоднозначно.

Сергей Николаев померил поточнее:
248 %

https://twitter.com/kefiijrw/status/1324413323719413760

Занимаемые стрелками пространства, которые не стоит занимать другими элементами на знаке, тоже сильно различаются:

Внимание к цифрам итоговой метрики. Сам рейтинг, про который и было исследование. Это числа от 372 до 494:

Даже без учета работы знаков в контексте, а не отдельно стрелок, разброс значений не такой и большой. Самая «плохая» стрелка не сказать чтобы катастрофически непригодная.

И снова про главную метрику :-) Самое низкое значение — 372 фута — говорит о том, что именно с такого расстояния стрелка распознавалась, как я понял. Но эта цифра не говорит о других свойствах, например, сколько людей в результате ошиблось на повороте.

Ну а так молодцы, что-то померяли.

Итог примерно такой:
«Большие и толстые стрелки видны дальше, чем маленькие и тонкие».
Ну, ок.

В других условиях проявляются и другие свойства

В русскоязычных соцсетях поднимается волна «вас так волнуют выборы в США, а в России, тем временем, рабство, жопа, и нет выбора».

Пример отборного нытья на эту тему — Cталингулаг. Ну, не знаю, мне такое нытье кажется бесполезным. Наверное, даже вредным, потому что сбрасывает давление пара, которое можно было бы пустить в работу.

Выборы в США интересны не только как выборы. Благодаря сложившемуся балансу, можно видеть бодание разных точек зрения. Совершенно разные люди, разные взгляды и принципы. За людьми стоят разные силы.

Как себя ведут медиа-гиганты. Медиа — это явление, у явлений нет границ. У нас тоже есть медиа-гиганты. Но в наших условиях медиа проявляют другие свойства, условия ведь другие. На примере США можно увидеть проявление других свойств, другие подходы к цензуре и т. д.

Интересно понаблюдать, какую показывают информацию, как её представляют и в каком количестве.

И как блокируют информацию — это, как ни странно, становится явным.

И одно из самых интересных наблюдений — это огромный разрыв между людьми в понимании природы прогнозов и вероятностей.

Переключение между состояниями понимания

Про риск. Вот твиттерская ветка, из которой я сейчас возьму пару твитов как иллюстрацию проблемы.

https://twitter.com/Lee46587076/status/1323194398180454432

Мои сообщения не будут относиться напрямую к людям, которые писали сообщения на скринах. Я просто увидел их рядом и мне это показалось наглядной иллюстрацией к тому, что я сейчас напишу.

Ситуация 1: человек видит риск в том, что он уже видит. Видит, как закрываются бизнесы вследствие вируса. Но не видит, как умирают родственники вследствие вируса. У человека логика такая: бизнесы закрываются → хреново. Здоровье? Ну, страшненько, но в целом норм (поскольку люди редко понимают процесс, который стоит за цифрами).

Ситуация 2: человек теряет близкого. Такой человек вряд ли перейдет или останется в первой категории. В такой ситуации потеря здоровья или жизни выглядит страшнее, чем бизнеса, жизнь — это совсем другой уровень ценности.

Прикол в том, что реальность — одна и та же в обоих случаях. Просто человек переключается из одного понимания-состояния в другое. Риск в природе как был, так и есть. И люди в большинстве своем не умеют видеть риск и сравнивать разные риски.

Проблема: всё ломается лавинообразно и необратимо. Когда теряешь человека, разбираться в рисках уже поздно.

Риск должен оставаться в уме. У тебя никто не умер, ты видишь только ломающуюся экономику? Ну, слава богу, но русская рулетка крутится. Когда риск сработал — уже поздно.

Риск срабатывает моментально.

https://www.youtube.com/watch?v=4k5QHshqnVw

В жизни измерений больше, чем кажется

Я уже начитался мнений про эту визуализацию в духе «классная графика, показывающая, что маски почти не помогают». Графика говорит о диаметрально противоположном. Выходит, графика таки не настолько хороша, раз люди понимают главные идеи наоборот.

https://english.elpais.com/society/2020-10-28/a-room-a-bar-and-a-class-how-the-coronavirus-is-spread-through-the-air.html?fbclid=IwAR1dVlRklL3DYNXGlBGe3qj5ylHikR2og3OmRpWcZ2r4o97qR7xsluCuqbY

Важные моменты:
— Защита — штука многоуровневая и многомерная, работает лучше в комплексе.
— Маски необходимы, но не всегда достаточны. И это не означает, что они не помогают.

Важно понимать, что происходит какой-то сложный процесс с множеством скрытых параметров. При создании визуализации часто ставят многомерность как один из критериев качества: чем больше измерений показано, тем лучше. Опять же, не настолько буквально, но как один из критериев в составе других.

Но самое интересное — что в жизни измерений всегда больше, чем в визуализации. Визуализация — примитивная модель реальности. Жизнь всегда сложнее любой графики. Например, совершенно пальцем в небо: графика никак не затрагивает действия защиты на масштабе и на раундах заражения. Мультиплицирование свойств. Вследствие которого даже малейшая польза масок (или любого другого воздействия вроде проветривания) приводит к снижению передачи вируса по цепи к следующим людям — возникает каскадный эффект умножения свойств на большом масштабе с ходом времени.

Что портит экономику

Многие люди до сих пор думают, что противовирусные ограничения ломают экономику. Экономику ломают болезни и смерти людей, идиоты. И затраты времени, денег, эмоций на лечение и, прости господи, на похороны. И порча здоровья у «выздоровевших» — сердца, легких и мозгов, кому как повезет. И нежелание оставшихся в живых болеть и умирать.

Кофейня закрылась: пиздец, надо ныть на весь двор. А зайти за кофейком в маске — это нет, дорого и тяжело.

Поддержи бизнес, не убивай его клиентов, надевай маску, и не на рот, а на нос, епта. Включай мозг, пока есть что включать.

Это не тот случай, когда каждый сам за себя

У Тёмы Лебедева провал в логике. Он считает вирус не страшным, но согласен с тем, что некоторым людям его стоит избегать (возраст и т. д.). Проблема в том, что вирус распространяется через любых людей. И если ты живешь «без идиотских ограничений», то ты, идиот, участвуешь в сети распространения вируса.

Если в широком круге знакомых людей сейчас мало заболевших — это потому, что моментальное значение охвата вируса сейчас невелико. Но вирус страшен не моментальным значением охвата, а скоростью распространения.

Защищать общественное благополучие, защищая самого себя хотя-бы маской — дело чести. Ходить без защиты и увеличивать коллективный риск — бесчестие. Это как не пользоваться дезодорантом, разрисовывать сиденья в транспорте, включать громкую музыку.

С разницей в том, что неиспользование дезодоранта не перекинется на соседей, а вирус — перекинется, потому что это мультипликативный процесс.

Не защищаться от заразного вируса, потому что лично тебе это кажется не страшным — это насрать на людей вокруг.

Когда расстреливали людей, в расстрелах участвовали группой, чтобы было непонятно, кто именно убил. Снижалась психологическая нагрузка, так говорят. Кто сейчас живет без ограничений — тот в расстрельной бригаде.

Что не так с «новыми знаками»

Илья Бирман ретвитил смешное у Никиты Прокопова:
https://twitter.com/nikitonsky/status/1311374431646658561
Что если бы современным дизайнерам поручили переделать дорожные знаки.

Тем временем: https://новыезнаки.рф
(кириллический домен)
Мне кажется, получилось плохо. Расскажу, почему.

Начну с конца: когда берутся за такую монументальную задачу, условные 50% качества решения зависят от постановки цели, описания и исследования проблемы, постановки задач. Здесь претензия на мега-решение, но не вижу описания, а в чем, собственно, мега-задача.

«Они устарели» — вредительский аргумент. Он не просто слабый, он вредный: что проработало долгое время — доказало работоспособность. Чтобы менять долго работающие вещи, нужны очень веские причины и исследования. Решение должно явно превосходить предыдущее.

Если владелец частного проекта меняет что-то по своему усмотрению — это нормально. Владелец берет на себя все риски. Может сделать хуже — и это его проблемы. Дорожные знаки — история общественная. Дизайн здесь должен работать гораздо строже с постановкой целей и аргументацией.

Мне интересно, ездил ли когда-либо автор этой картинки за рулем. Там странная сносочка «* изображения без проекции (не для трафаретного нанесения на дорожное полотно)». Но мне кажется, что рука вообще не должна подниматься показывать такой стыд даже со сноской.

Моя основная критика — по постановке цели. От цели идет все остальное. Как ты поймешь, хорошо ли получилось?

«Сделали понятнее, аккуратнее и лучше» — лучше в чем?
«Не имеет аналогов в мире» — а с чего вы взяли, что это хорошо?

Про цель. Простая мораль: если бы что-то было, авторы уже рассказали бы с горящими глазами.

Если пойти дальше понимания цели, то здесь и с графикой плохо. Просто плохие решения. Нормальные дизайнеры, думаю, всё поняли уже по первой картинке.

И еще раз, поскольку эта история не частная, а общественная, я считаю нормальным не проходить мимо, а открыто понакидывать. Кто еще заметил, что стрелки — ужас? )

Куда показывает вот эта синяя стрелка? Как определили, что второй вариант лучше первого?

Как люди воспримут кончики стрелок, которые можно спутать с линиями? Это стрелки или странные перекрестки? Концы стрелок не должны выглядеть как сами линии.

Стоимость восприятия: в «новой» стрелке три объекта (левая часть, центр, правая часть) вместо одного (цельная стрелка). Если стрелок две — водителю на полном ходу нужно расшифровать уже шесть объектов.

И еще негативное пространство, возникающее между линиями. Четвертый объект на расшифровку.

Вкус, смысл, суть используемых элементов: в действующем знаке есть аккуратное скругление в стрелке направо. Это единственное скругление на знаке. Оно соответствует физическому смыслу: вот здесь поворачивай. Всё. Автомобили поворачивают плавно, там и дорожное полотно скругляется.

Во втором варианте единственное имеющее смысл скругление забивается бесполезными оформительскими скруглениями кончиков стрелок. Теряется графическая сила, которая заключается в осмысленных различиях дизайна элементов.

Скругления — очередная сезонная болезнь у дизайнеров, помимо начисто отбитого понимания, что такое оптическая компенсация центра по вертикали. Вот пешеход. Было: смотрим на пешехода. Стало: смотрим на белый треугольник. Зачем подчеркивать треугольник?

Как это работает: на действующем знаке углы объектов изображены по-разному. См. Layering and Separation у Тафти для примера. Большой радиус у знака — больше нигде не повторяется. Зебра: в жизни прямые углы, здесь полное соответствие. Пешеход: это иконка, скругление осмысленное.

Треугольник в действующем знаке не спорит со слоями общей рамки и пешехода. В новом предложенном знаке начинается странная игра скруглений треугольника и рамки. Проблема в том, что треугольник проявился как самостоятельная сущность, хотя главное здесь — пешеход.

Прикол, что даже демонстрационная картинка в самом начале страницы наглядно показывает, насколько пухлыми и шумными стали элементы с этими скруглениями. Переваренные пельмешки.

Вот здесь можно было бы поговниться на тему того, что надо чувствовать, что такие нашлепки делать плохо. Но задача решается и без чувств, чисто инженерным подходом: активировав негативное пространство, ты превращаешь один элемент в три, а это ресурс внимания водителя, это плохо.

Вообще мой личный опыт факапов с дорожными указателями говорит о том, что больше проблем не с внешним видом знаков, а с их применением, как проектируется дорога в целом. «Знают» ли знаки о месте, в котором они расположены.

Сколько раз люди уезжают не туда только потому, что указатель не установлен вовремя, или установлен не там, или не учтены соседние повороты! Допустим, знак эстетичный, читабельный, но поздно. Или не видно. И т. п.

Муть со скруглениями идет из тенденции всё скруглять в экранных интерфейсах. Но знаки — это принципиально другая история. Цифровое на порядки легче тестировать и менять. Не сработавшее откатывается обратно за минуту на миллионах пользователей. Со знаками так не прокатит, ребята.

Продолжение:
https://www.cashin.ru/blog/all/znaki-2/

Сэнди Монро о презентации аккумуляторных технологий Теслы

Люблю смотреть, как Сэнди Монро разбирает сложные штуки до деталей и распиливает сами детали, чтобы докопаться до их строения.

Чтобы наглядно рассказать о преимуществах нового формата аккумуляторных ячеек Тесла, чуваки просто взяли и запилили мокап батареи в натуральную величину из пары сотен трубок 46 х 80 мм и поместили рядом с батареей нынешнего формата для сравнения, выглядит офигенно:

И еще пара интересных мыслей в соседнем интервью: Маск, в отличие от большинства, занижает успехи и характеристики, “недопродаёт”, вследствие чего застаёт конкурентов врасплох. Отсылка к Искусству войны Сунь Цзы, ссылка на этот момент:

Монро рассказывает о преимуществах нового формата аккумуляторных ячеек Тесла и поясняет, почему это не всеми оценённое событие очень крутое и на многое повлияет. Ячейка становится жестким структурным элементом, количество ячеек резко снижается, обеспечивается охлаждение именно с торцов — где самые горячие места, снижается сложность, меньше потерь на нагреве электродов и т. д.

Укрупняются компоненты — более цельная батарея, алюминиевое литье всей рамы авто всего из трех частей, снижается количество физических компонентов, связей, соединений. Интересно, что в цифровой среде, в каком-то смысле, процесс противоположный: большие компоненты дробятся на небольшие и универсальные.

Главная проблема в индустрии визуализации данных

Растущее качество графики в современной визуализации данных всё чаще скрывает сомнительные подходы работы с данными, неправильное понимание природы данных, а иногда и грубые математические ошибки.

Бывает, смотришь на историю и сразу веришь показанному, потому что история выглядит уверенно. Видно, что люди плотно поработали. Хочется доверять. Но…

С данными всегда есть проблемы: они многомерные, неоднородные, из разных источников. Они то полные, то неполные. Иногда кажется, что их много, а их мало. И наоборот. Их надо собирать, дополнять, искать в них порядок. Надо решать, как показывать историю. Надо решать, какую именно историю вообще стоит показывать и зачем.

Наименее вероятны проблемы с визуализацией в следующих ситуациях:

— Отображаемый процесс — установившийся. Например, доля бракованного товара в производстве.
— Процесс находится в прошлом, распределения известны. Результаты спортивных состязаний. Состоявшиеся продажи автомобилей по маркам и моделям.
— Распределение данных находится в классе гауссовых. Например, вес и рост людей.

Но всё усложняется, если система — открытая, нелинейная и многомерная (распределение богатства), если распределение процесса степенное, с толстым хвостом (эпидемии и войны), если в деле замешано прогнозирование (результаты будущих выборов).

Такие ситуации требуют критического мышления, логики, математики, понимания свойств. «Визуализировать» недостаточно. Увы, в реальном мире именно такие ситуации как раз наиболее интересны.

Часто в убедительной с виду истории можно найти провал в самом главном. В основном сообщении, в сути. Хочу разобрать пару примеров на эту тему.

В качестве первого примера — статья «Миф о криминальных иммигрантах»,

о связи между нелегальной иммиграцией и преступностью в США.

* * *

https://www.themarshallproject.org/2018/03/30/the-myth-of-the-criminal-immigrant

В статье автор делает вывод, вроде бы основанный на данных. Если копнуть глубже, выясняется, что статья говорит совсем о другом.

О чем говорит статья? Разберем по шагам.

Начинаем прямо с хэдера страницы:
Do immigrants lead to crime? A recent study says no. «Приводит ли иммиграция к преступности? Недавнее исследование говорит, что нет.»

Давайте посмотрим, о чем на самом деле говорит исследование.

Количество иммигрантов (в процентах 2016 г относительно 1980) увеличилось. Уровень преступности (тяжкие) за те же годы уменьшился.

Сходу бросается в глаза небольшое количество точек измерения. Меряли десятилетиями. Тут всего по 4 точки на график на огромный диапазон времени. Это мало для такого масштабного процесса. Просто технически, еще до того как пролистаем страницу ниже.

Непонятно, как собирались данные. Накапливались по 10 лет, или это точечные данные. Если накапливались, почему не показать промежуточные? Автор ссылается на исследование, доступное на платной основе:

https://tandfonline.com/doi/full/10.1080/15377938.2016.1261057?needAccess=true

Как я понимаю парный график: «смотрите, иммигрантов всё больше, а преступности становится меньше». Типа, корреляция.

Но тут проблема: обе переменные многофакторные и нелинейные, значит для выявления корреляции (если она вообще может быть) нужно гораздо больше данных, чтобы подтвердить гипотезу на исторических данных. Супер-мало данных!

Следующий сомнительный момент: статья критикует Трампа на тему «Стены» и нелегальной иммиграции (бандитов, буквально). Но статья разбирает просто иммиграцию, без выделения нелегальной. Не ясно, какая доля преступлений на правом графике совершена именно нелегальными иммигрантами.

Да и более того, справа вообще нет речи об иммигрантах, это общее количество тяжких преступлений.

Трамп в 2018 качал тему именно нелегальной иммиграции: https://twitter.com/realDonaldTrump/status/1086091478168993792

In 2018 alone, 20,000 illegal aliens with criminal records were apprehended trying to cross the Border, and there was a 122% increase in fentanyl being smuggled between ports of entry.

Из того, что снижается некий коэффициент преступности, не следует, что иммигранты совершают меньше преступлений. Технически автор статьи жонглирует множествами иммигрантов вообще, и нелегальных, совершивших тяжкие преступления.

Внизу стоит ссылка на данные ФБР. Но само ФБР предупреждает, что не стоит полагаться только на данные, и приводит список множества факторов, которые нужно учитывать. Только в этом списке 13 пунктов: https://ucr.fbi.gov/ucr-statistics-their-proper-use

В принципе, уже достаточно причин, чтобы забыть про статью:
множества не бьются, многофакторность не учитывается, корреляция ложная, никакой связи между исходными данными и выводами не показано. Но ниже тоже есть интересные моменты )

* * *

Изменение уровней преступности, 1986-2016 годы:

Мозг сразу рисует какую-то такую картинку. Но не торопитесь с выводами )

На графике куча проблем.
Слишком высокий уровень шума данных, чтобы нарисовать себе такой тренд.
Не видно абсолютных значений: в городах разная численность населения.
Графический ход вызывает вопросы: кружочки наслаиваются друг на друга, не видно что под ними.

Хорошо, что кружочки сделаны в векторе в СВГ. Ищем в инспекторе, гасим обводки и цвет, включаем альфу:

И тренд уже не такой явный, и по-прежнему не видно абсолютной численности.

Похожая штука про наслоение кружочков:
http://cashin.ru/blog/all/vizualizaciya-dannyh-na-yandeks-karte/

Ниже — графики по городам, но снова не показана связь между наборами данных. Что показывают, фактически: иммигрантов становится больше, а тяжких преступлений — меньше, и одно не связано с другим.

Данные разорваны больше, чем кажется. Не связаны атрибуты времени и места: преступления не обязательно совершаются сразу по прибытию и в том же месте, где зарегистрирован иммигрант. Ну и ни слова про нелегальных.

К многофакторности добавляется и то, что преступления не только совершаются, их еще и предотвращают. Это еще целая пачка процессов. В большинстве городов стали регистрировать меньше преступлений: лучше борются? Хуже регистрируют? Эти факторы не упоминаются.

Важно, какие города попали в выборку и по какому принципу эта выборка составлялась. В городах ситуация с преступностью может отличаться от пригородов. Городская полиция работает в высокой плотности, на более коротких расстояниях, с новыми техническими средствами, автоматизированным наблюдением и поиском. Такое быстрее внедряется в крупных городах. А на графике мы видим относительно мало мелких городов. Выборка вызывает вопросы.

Если все иммигранты реально оказались классными, графика этого не показывает.

One of the largest decreases in crime occured in MIAMI, where immigration increased:

График слева: «В Майами стало больше иммигрантов».
График справа: «В Майами совершается меньше тяжких преступлений».

Вообще-то, Майами одно из самых богатых мест в США. Полиция в самом богатом регионе поработала успешно? Причин может быть масса. И это ничего не говорит ни о доле участия иммигрантов в общем количестве преступлений, ни о доле нелегальных среди них.

В конце автор утверждает, что данное исследование показало, что иммиграция не приводит к увеличению преступности:

This is not the only study showing that immigration does not increase crime.

Но статья не показала связи между этими двумя явлениями.

Избыточная смертность

Небольшая выписка из статьи об «избыточной смертности» во время пандемии коронавируса,
https://ourworldindata.org/excess-mortality-covid
(Excess mortality from the Coronavirus pandemic COVID-19)

Избыточная смертность (далее пишу без кавычек) = фактически фиксируемое количество смертей — (минус) ожидаемое количество в нормальных условиях в прежние годы.

Например, чтобы узнать количество избыточных смертей в мае, берем сумму всех смертей, зарегистрированных в мае и вычитаем среднее количество смертей в мае за предыдущие 5 лет.

Простыми словами: насколько чаще или реже стали умирать, по сравнению с предыдущими годами. Независимо от причин.

Почему в период пандемии имеет смысл смотреть на показатели избыточной смертности?

— Некоторые страны считают причиной вирус только у тех, кто скончался в больнице.
— Бывает, считают причиной вирус только в том случае, если получен результат теста на вирус. Если результата нет, то не протестированные пациенты не считаются.
— Могут быть проблемы с точностью подсчета смертей, в особенности, в бедных странах.
— Пандемия может приводить к увеличению смертности в сочетании с другими причинами, вследствие ослабления систем здравоохранения, недостатка внимания пациентам с другими болезнями, нехваткой финансовых ресурсов и др.
— Пандемия также может приводить к снижению смертности по определенным статьям.

Расчет избыточной смертности независимо от причины летальных случаев помогает посмотреть под новым углом на эффекты, оказываемые пандемией.

Данные по избыточной смертности доступны лишь для небольшого ряда стран. Эти данные доступны не везде, для сбора требуется точность подсчета и сбора данных в предыдущие годы.

Далее приводятся ссылки на несколько публикаций по избыточной смертности по разным источникам.

Файненшиал Таймс (Financial Times)

https://www.ft.com/content/a26fbf7e-48f8-11ea-aeb3-955839e06441
Статическая визуализация.
Более 10 стран, Европа, США, Израиль, Южная Африка. 10 городов.

* * *

Экономист (The Economist)

https://www.economist.com/graphic-detail/2020/04/16/tracking-covid-19-excess-deaths-across-countries
Интерактивная визуализация.
Европейские страны, несколько городов.
Европейские данные разбиты по возрастам.

* * *

Евромомо (Euromomo)

https://euromomo.eu/graphs-and-maps
Интерактивная визуализация.
Европейские страны.
с разбивкой по возрастам.

* * *

Нью-Йорк Таймс (New York Times)

https://www.nytimes.com/interactive/2020/04/21/world/coronavirus-missing-deaths.html
New York Times’ work
Статическая визуализация.
Более 10 стран, Европа, США, Эквадор, некоторые города.

«Коллективный иммунитет» — смертоносная некомпетентность

Отвечал Саше Мядзелю уже месяц назад на вопрос про Швецию (скрин). Так и вышло — много смертей от ковида, в несколько раз больше, чем у соседей. На Швецию теперь все показывают пальцем, как на плохой пример. Про говорящих о «коллективном иммунитете» (Herd immunity) вообще крутят пальцем у виска. Стремление к воображаемому иммунитету ценой гарантированной смерти огромного количества людей — смертоносный идиотизм, психопатия и некомпетентность.

В Швеции люди начали сами дистанцироваться еще до официальных ограничений, люди сделали это до «приказа», были графики резкого снижения посещаемости общественных мест. Нехороший, но ожидаемый вывод: этого оказалось недостаточно. К сожалению, тактики «каждый сам за себя» недостаточно. Продолжаем душить бизнесы, а толку мало. Нужны общие действия, массовые и синхронные.

Анна Попова, глава Роспотребнадзора, говорит, «Я бы сказала, что мы остановили рост на сегодняшний день». Тут игра слов, потому что слово «рост» все поймут по-разному. У нормальных людей «рост» — это когда что-то увеличивается. «Остановили рост» — значит, роста больше нет. Но что тогда на графике?

Расшифрую: Остановили не рост, а рост роста. Каждый день число выявленных продолжает увеличиваться. Я не знаю, почему слова главы записали как «остановили рост», возможно это было выхвачено из контекста и был неправильно поставлен акцент. И рано говорить «остановили», когда цифры держатся несколько дней. Процесс мультипликативный, в одном месте держатся, в другом взрываются.

Рано радоваться, мягко говоря. Рано выходить в город.

Избегайте контактов с людьми. Старайтесь реже выходить в общественные места. Обходите других людей за несколько метров. Носите маски — не слушайте дураков, которые до сих пор говорят, что маски не помогают. Маска будет вам не помогать в 95% случаев, но в оставшихся 5% спасет жизнь и здоровье вам или кому-то другому.

«Очень плавный, медленный темп прироста»

На картинке количество стран, в которых ежедневный процент прироста инфицированных КОВИД-19 выше, чем в России, за неделю 10-16 апреля 2020, среди всех стран с 20000+ инфицированных.

Если вдруг не загрузилась картинка: 0 (ноль).

Визуализация иллюстрирует заявление главы Роспотребнадзора Анны Поповой: «Я бы хотела сказать, что РФ сохраняет очень плавный, медленный темп прироста, не уходя за 20% ежедневного прироста, и сохраняя его от 14% до 17% в день».

https://www.interfax.ru/russia/704740

Здесь на скриншоте страны, отсортированные только по общему количеству. Столбцы — дни слева направо. Последняя неделя — последние 7 столбцов.
https://www.cashin.ru/virus/confirmedgrowth/

Страны, отсортированные по индексу общего количества * процента роста:

Я, кажется, даже недооценил собственную находку: если проследить сглаженные по двум соседним дням траектории процентного роста, то у России не было конкурентов еще с 31 марта. Более двух недель, каждый день, если подвигать дату. Кажется, есть о чем подумать, даже если полагать, что существуют «стадии», которые другие страны уже «прошли»:
https://www.cashin.ru/virus/timingrate/
Графики показывают не поведение инфекции и не стадии инфекции.
Графики показывают поведение людей.

В статье еще такое:

https://www.interfax.ru/russia/704740
«Попова напомнила, что в эпидемиологии принято считать не абсолютным количеством случаев инфицированных, а относительными показателями в расчете на 100 тыс. населения.

Согласно приведенным ею данным, в РФ показатель на 100 тыс. населения составляет около 17. Это в пять раз ниже, чем в Канаде, в 10 раз ниже, чем в Германии. По словам Поповой, такое сравнение является более корректным.»

Почему я не показываю данные по пандемии из расчета на душу населения:
http://www.cashin.ru/blog/all/no-per-capita/

Изолинии массы × ускорения

Я начал делать свой набор визуализаций о вирусе вот с этой таблицы, сочетающей количество заболевших и процент прироста по дням. Это было 19 марта. Сейчас она работает по адресу:
https://cashin.ru/virus/confirmedgrowth/

В на этой странице самое интересное — третий метод сортировки. Там всего 5 вариантов сортировки, третий называется Confirmed and growth %.

Что это? Технически это процент увеличения за день относительно вчерашнего, умноженный на общее количество на текущий день.

Я как-то об этом писал, но, наверное, не сделал достаточного акцента и не разъяснил. У этого метода сортировки есть физический смысл. Это сила: масса, умноженная на ускорение. Аналоги этих величин — общее количество заболевших и процент роста.

Почему количество играет роль массы: чем больше количество заболевших, тем большей нагрузкой приходится управлять, это инертность. Масса — мера инертности. Чем выше инертность, тем тяжелее менять ход процесса.

Процент как ускорение: почему не просто скорость? Скорость — это абсолютная величина прироста. Если к 1000 человек добавляется каждый день по 100, то 100 — это скорость. Но если прирост не 10 человек, а 10%, то следующие приросты будут увеличиваться. Если процент роста остается неизменным — это ускорение роста. Каждый день прирост больше предыдущего. Постоянный процент роста говорит об ускорении процесса.

Чтобы определить порядок стран при этом режиме сортировки (он сразу выбран по умолчанию), я перемножаю общее количество и проценты. Когда я придумал этот индекс, я называл его «индексом хреновости». Где ситуация хреновее всего.

Индекс хреновости = индекс силы, действующей на страну. Эта сила двигает страну в нехорошую сторону. В списке более 180 стран. Посмотрим на топ силы прямо сейчас. 8 место — Россия. Выше только Германия, Италия (!), Франция, Великобритания, Турция и США.

Геометрическое представление «индекса силы» — диаграмма процента роста к общему количеству, вот она:
https://cashin.ru/virus/timingrate/
Вертикаль — ежедневный процент, горизонталь — общая сумма.

* * *

Как сопоставить эти две визуализации? Они же показывают одинаковые данные (не считая того, что круги и линии на второй показывают больше данных). В таблице мы видим, что Россия на 8 месте по произведению двух показателей, ускорение × масса. А как сравнить произведения на плоскости в логарифмических шкалах?

Вот топ 8 стран в таблице и те же страны в тех же показателях на плоскости:

Да, мы залетели в эту группу страшных кругов. Наш круг пока небольшой и ещё есть шанс оттуда «упасть». Иран уже, как видите, не попадает — он на 9 месте. На плоскости можно провести линии, которые показывают, насколько далеко зашла страна. Процент роста может быть высоким, но при этом снижаться — скорость еще есть, но ускорение снижается, и точка пойдет вниз.

Если провести изолинии силы по точкам постоянного произведения, получается вот такая история. Несколько линий для примера. Страны, где это сочетание показателей снижается, ныряют вниз и не доходят до следующих изолиний. Здесь видно, что Россия залетела чуть дальше Ирана. И если с набранной массой уже ничего не поделаешь, то ускорение и скорость надо гасить.

И — информация

NYT, которых сегодня хвалят (сами себя, в основном) за великолепную графику со столбом смертей в Нью-Йорке, ох как драматично выходящей за заголовок газеты, пишет пару месяцев назад:

5 февраля: «Ограничения поездок в Китай — хрень полная»

* * *

13 февраля: «психологи (психологи!) говорят, что когда мы реагируем на новый коронавирус не так, как на грипп, это показывает нашу неспособность оценить риск».

* * *
Мне кажется, мы наблюдаем в СМИ явление «что вижу то пою». Вот олени побежали, а вон психологи что-то сказали, а вон 5 тысяч умерло.

В «СМИ» «И» означает информацию. Вместо информации мы видим 1) шум, болтанку, меняющуюся в диапазоне -100%...+100%, 2) не информацию вообще, потому что наблюдение окружающего — это то, что и так видят все, это не информация.

Хорошо или плохо, что писали так, а сейчас пишут сяк? Давайте порассуждаем. Вот NYT написали что-то в феврале. Оказалось, это шлак. Кто-то и так понимал, что это шлак, но для многих это теперь ещё и «оказалось». Но здесь не просто шлак, это еще тысячи людей, которые принимали по этим новостям решения и понесли потери. Это смертоносный шлак.

Теперь стоит ставить вопрос не хорошо ли сейчас писать иначе — типа сейчас-то они пишут норм, а стоит ли вообще слушать этот источник. Это вопрос к аудитории, не к писателям. Зачем слушать такой источник?

Мое восприятие поменялось страшным образом. Я очень люблю визуальную сторону подачи NYT. В части управления визуальными образами и деталями — всегда с удовольствием смотрел и учился. Но теперь, как хорошая маска фильтрует 95—99 % входящего, я фильтрую почти всё почти ото всюду. Вытащили столбец за пределы заголовка? Дизайнер-график молодец, графический ход я запомнил, но не более того.

Сухой остаток: СМИ должны лить плотный поток, иначе не будет обновления, не будет движа. Это проклятие СМИ — поток всегда будет грязным. Будут лить психологов, астрологов, первые обосрут вторых, вторые первых, СМИ как казино — всегда в плюсе. На последних курсах универа «зачетка работает на тебя».

Вдогонку:
http://www.cashin.ru/blog/all/virus-3/
Печальная новость для дизайна, пару месяцев назад.

Полукарантин

Написал это несколько дней назад и не публиковал.

У меня была гипотеза, что власть не вводит в России жесткого карантина, чтобы не сорвать сцепление с народом. Потому что если ввести ограничения резко — народ не поймет и не будет выполнять.

Но читаю обращения Собянина и сомневаюсь. Ниже несколько наблюдений, которые по отдельности вроде и ничего, но в совокупности уже другая история.

***

1) Мэр пишет, какие организации продолжают работать. Их много. Работают организации, где регулярно возникает высокая концентрация людей. Продуктовые гипермаркеты.

2) В магазинах примерно 80% покупателей в масках. Кажется, 80% это много. Но остальные 20% — это не пара человек. При этом дистанцию не соблюдают чаще именно люди без масок.

3) Из телеграм-канала опер-штаба Москвы:
«В категории людей старше 65 лет почти 90% с начала недели остаются дома, лишь 5% выходили на улицу вблизи своего места пребывания.».

Снова та же картина: большинство дома, но 5% выходили. Кажется, что 5% это мало, но в абсолютных числах это очень много.

4) Снова Собянин:
…По его словам, 3 млн посещающих рабочие места составляют четверть населения города.

“Это тот баланс, который нам и надо поддерживать. Мы не можем закрыть весь город, так чтобы вообще все обнулить, но такой баланс, когда две трети находятся дома в самоизоляции, а где-то около четверти передвигаются, — это нормальный баланс, его надо поддерживать и дальше», — подчеркнул мэр Москвы.

***

Общий смысл перечисленных пунктов:
Мы 12 миллионов снизили до 3 миллионов.

В чем тут проблема:
Инфекция передается в точках контакта. У нас эти точки остались прежними: транспорт, места работы, места торговли. Загруженность всего перечисленного снизилась в разы, но сами точки контакта остались.

Представим, что Москва это не 12-миллионный город, а точно такой же 3-миллионный. В точках контакта интенсивность передачи вируса значительно снизится. Это очевидно.

Но вот что уже не настолько очевидно: те 20% людей, которые всё-таки продолжают контактировать с другими, будут поддерживать распространение и передавать вирус тем, кто никуда не ездил. Эта сеть будет работать медленнее, чем если бы по городу ездили вообще все. Но все-таки сеть остается связной сетью. Интенсивность использования сети снижается, но разрыва сети не происходит.

Меня беспокоит, что текущие меры с ограничением 80% людей не остановят развитие инфекции. Да, нагрузка на медицину сгладится, но это только пока. Это похоже не на победу, а на оттягивание более жесткого карантина. Оттягивание не выглядит выгодным: количество инфицированных продолжает увеличиваться, но способность бороться с этим — нет.

Хочу здесь ошибаться.

Маски или нет?

Про маски. Это не про медицину. Это про то, как у людей работает логика и оценка рисков. Люди всё смешивают и теряют из виду главное. И ежу понятно, что в маске дышать тяжелее, чем без нее. Но никто не видел больниц, забитых умирающими от того, что им было жарко дышать в маске. Риски асимметричные: риск ношения маски не сравним с риском не ношения.

Карантин нужен, чтобы не контактировать. Стены и пространство работают барьером. Если всё-таки приходится контактировать, что является барьером? 1) фильтрация воздуха и 2) прочая нательная защита. Дезинфицирующий гель — тоже барьер.

Про маски «только для больных». Кто еще не понял, что первые дни проходят без симптомов? Маска — в первую очередь для нормальных людей. Которые не болеют или думают, что не болеют.

Не нужны никакие исследования (но и они уже есть), чтобы понять, что если по воздуху летает неведомая смертоносная хрень, то лучше её не вдыхать. И не выдыхать на других.

Эффективность масок? Обычная хирургическая фильтрует порядка 80%. Стоит оно того или нет? Представьте, что вам предоставили выбор: вдохнуть 100% смертоносной хрени, или 20% — что выберете?

Масштаб риска: ношение масок в публичных местах — это массовый барьер, ослабление общей сети передачи вируса. Это не про персональный, а коллективный риск. Тут нужны не индивидуальные оценки каждого, типа «ну мне не страшно», или «вы дураки, маска не помогает», а общее решение, потому что речь о коллективной безопасности.

Face masks are reducing COVID-19 infection risk

Respiratory virus shedding in exhaled breath and efficacy of face masks
https://www.nature.com/articles/s41591-020-0843-2

Симуляция траекторий частиц с препятствием и без
https://twitter.com/marekkraft/status/1244755345110634502

COVID-19: WHY WE SHOULD ALL WEAR MASKS — THERE IS NEW SCIENTIFIC RATIONALE
https://medium.com/@Cancerwarrior/covid-19-why-we-should-all-wear-masks-there-is-new-scientific-rationale-280e08ceee71

Не показываю данные по пандемии из расчета на душу населения

https://www.cashin.ru/virus/
Не показываю данные по пандемии из расчета на душу населения, потому что эта метрика может ввести в заблуждение. Имеет значение, сколько людей находится в непосредственном контакте со вспышкой эпидемии. Отображение числа случаев на единицу населения создаст ложное ощущение безопасности для больших стран, ситуация будет казаться лучше, чем на самом деле. Никто в здравом уме не скажет, что ситуация в Нью-Йорке сейчас лучше, чем в каком-нибудь итальянском городке, где вирус выкосил половину жителей.

Основной риск заключен в высокой скорости распространения инфекции. Для отображения скорости распространения знать общую численность населения не нужно.

Еще одна важная деталь: распространяющийся, растущий процесс с содержанием риска некорректно рассматривать так же, как установившийся процесс. Некорректно, например, сравнивать процесс распространения нового вируса с установившимися значениями риска от гриппа или автомобильных аварий.

Частотные распределения уже установившихся процессов известны и стабильны. Распределение нового процесса неизвестно. Но известно, что до принятия странами жестких мер по удержанию вируса распределение укладывалось в класс Парето, статистически демонстрируя «толстый хвост» и экспоненциальный рост с нелинейными эффектами: взрывной характер распространения, перегрузку систем (здравоохранения, в частности), неизвестное влияние на здоровье у выживших. Поэтому не важно, какая численность населения страны, когда мы смотрим на развивающийся, не устоявшийся процесс и хотим понять создаваемый им риск.

Имело бы смысл какое-то отображение числа случаев относительно медицинских ресурсов: как количество случаев соотносится со способностью страны переварить это количество. Но в реальности это было бы сочетанием разных групп данных, каждая из которых очень шумная и крайне ненадежная. Это уже «пережаренные» данные.

По той же причине не показываю ничего, связанного с плотностями населения по городам или как-то еще. Эти данные также были бы «пережаренными». Плотности можно считать и мерять по-разному, и потом будет непонятно, как сравнивать места, где разные формы распределения плотностей. Всё это — ненужное закапывание в болото данных.

Не нужно тонуть в числовой аналитике, когда ситуация очевидна и решения просты:
— вирус крайне заразный,
— заражение приводит к непредсказуемым эффектам второго порядка,
— нужно включить полную паранойю: избегать социальных контактов, носить маску, мыть руки и никого не слушать про то что «ничего страшного». Асимметрия риска: риск от паранойи несоразмерен риску отсутствия паранойи.

Разрешаю использовать свою сборку данных по России

1) Разрешаю использовать свою сборку данных о вирусе по России для визуализации и анализа.
2) Нужна помощь по автоматизации сбора данных.

По пункту 1.
Я собираю данные по России и визуализирую здесь:
https://cashin.ru/virus/russia/
Меня спрашивают, можно ли использовать мою сборку данных — да, можно. Если кто-то хочет подключиться к этому источнику, подключайтесь. Спрашивать у меня отдельного разрешения не нужно. Но будет хорошо, если вы предупредите меня об использовании, чтобы я понимал, на что влияет источник. Напишите мне: cashin@yandex.ru.

Пункт 2.
Нужна помощь по автоматизации сбора данных.
Из того что я нашел, наиболее удобный и быстрый источник по России сейчас — телеграм-канал опер-штаба Москвы: https://t.me/COVID2019_official

Изначально я собирал по отчетам Роспотребнадзора, а сейчас захожу в телеграм-канал штаба. Вручную беру последнюю сводку. Прогоняю через нехитрые скрипты. Пара минут работы с контролем сумм — и данные попадают в общую таблицу:
https://docs.google.com/spreadsheets/d/e/2PACX-1vQxbLiOGzM5mC_lBFk3t3XWp_3ZMsoEObxiQErZAfEqx_DAu9l6Qe2FMdggwD3EVIIcB6m3VwUOH33Y/pub?gid=1542861087&single=true&output=csv

Ручной этап надо выпиливать из процесса.
Поэтому,
— если вы знаете полноценный табличный источник по России, или
— если вы можете помочь автоматизировать сам сбор, построить или раскопать какой-то способ делать это лучше — напишите мне: cashin@yandex.ru.

Пошарьте пост, пожалуйста.

Тем временем, у России траектория не очень, нужно усиливать карантин. Чем плотнее карантин, тем быстрее разберемся.

Группы риска не существует: мы все в одной лодке

Часть 8.

Читаю такое: в связи с риском заболевания вирусом предприятие переводится на удаленную работу. Или, в Москве 300 заболевших, мы считаем риск заболеть низким.

Это полная хрень. Риск не в заболевании кого-то на предприятии. Риск не в том, что лично вы подхватите вирус — это вообще не риск. 30-50 человек у нас каждый день гибнут в ДТП, но дороги никто не перекрывает. ДТП — ваш индивидуальный риск. Если кто-то попал в ДТП, это не вызывает еще тысячу ДТП в районе.

Вирус — риск не индивидуальный, а коллективный и нелинейный. Это значит, что произойдет что-то более масштабное, чем просто вы заболеете. Во-первых, не только вы, во-вторых, не только заболеете.

Посмотрим на процесс в США:
изначально было известно, что в медицинских учреждениях в наличии примерно 40 тысяч аппаратов искусственного дыхания. Казалось, что это много. Но, поскольку увеличивается сама скорость роста инфицированных, количество людей, которым требуются аппараты, растет нелинейно, взрывным образом.

http://www.cashin.ru/virus/confirmedgrowth/

В результате даже в США при такой экономической мощи появляются десятки оупен-сорсных проектов по самостоятельному изготовлению аппаратов искусственного дыхания. Гляньте хотя-бы сюда:

https://medium.com/@RobertLeeRead/analysis-of-open-source-covid-19-pandemic-ventilator-projects-27acf9075f7e

Это только один из примеров нелинейных эффектов второго порядка. На что это повлияет далее — нельзя предсказать. Но точно можно предсказать, что последствия будут невероятно плохими, если нелинейный рост продолжится.

Риск в том, что по мере распространения вируса масштаб увеличивается и это приводит к непредсказуемым последствиям. Вирус уже распространяется, и что люди полагают, что риска нет — больше ничего и не нужно. Этих двух составляющих достаточно.

Обычно, когда говорят про риск, имеют в виду нечто из будущего. А у нас это не будущее, а уже сработавший риск. Теперь это не риск, а реальный процесс.

Есть посев, есть высокий коэффициент передачи. Нужно снижать, иначе...

https://meltingasphalt.com/interactive/outbreak/

* * *
P. S.
С симуляторами нынче есть хорошая и плохая новости.

Хорошая — они наглядно показывают распространение инфекции в зависимости от коэффициента передачи и количества социальных контактов.

Плохая — все симуляторы, которые я видел, после достижения пика за каким-то хреном выводят все случаи в состояние «выздоровевших». Этот ход мне кажется безответственным — складывается впечатление, что если просто немного подождать, все станут выздоровевшими сами собой. Это глупость — никак не отображаются последствия. И их в принципе невозможно показать, потому что это непредсказуемые эффекты второго порядка.

Увы, хорошо «визуализировать» сегодня уже недостаточно.

Возможным решением для авторов таких симуляторов было бы вообще не показывать исход. Показывать только стадию роста. Потому что мы не знаем, что за ней последует.

* * *
Ранее:
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Действия каждого для общей безопасности

Часть 7.

Игнорируя «иррациональные» лично для вас риски, вы навредите самим себе.

Нассим Талеб опубликовал совместную с Джо Норманом заметку о том, что для обеспечения общей безопасности от каждого человека требуются действия, кажущиеся отдельным людям иррациональными и чрезмерными.
https://www.academia.edu/42223846/Ethics_of_Precaution_Individual_and_Systemic_Risk

Понимание изложенных здесь идей и следование им критически важно вследствие повышающейся транспортной связности. Мы как одна большая деревня. Все люди находятся буквально «в одной лодке».

Публикую свой перевод заметки. В заметке есть специфические термины и обороты, которые хочется передать доступнее. Если видите недочеты или ошибки — напишите мне: cashin@yandex.ru

Нассим Талеб и Джо Норман:

Этика предосторожности, индивидуальный и системный риск

Решения для обеспечения мер предосторожности не работают на коллективном и индивидуальном уровне одинаково. Коллективная безопасность может потребовать от каждого человека чрезмерного индивидуального избегания риска, даже если это противоречит собственным интересам этого человека. Это может привести к тому, что человеку придется беспокоиться о рисках, которые не являются для него значительными.

Давайте представим себе риск распространяющейся вирусной эпидемии на ранних стадиях. Риск того, что конкретный отдельный человек подхватит этот вирус, очень небольшой. Ниже, чем при других заболеваниях. Поэтому паниковать и быстро реагировать этому человеку кажется иррациональным. Но если человек не будет паниковать, то это будет способствовать распространению вируса. И это станет серьезным источником системного вреда — для всего общества.

Следовательно, необходимо «паниковать» каждому по отдельности. Совершать действия, которые кажутся чрезмерными, чтобы избежать вреда для всего общества. Даже в тех случаях, когда самому человеку эти действия кажутся невыгодными.

Реагируя «не слишком остро», вы вредите
остальным людям.

Это происходит, когда системный риск мал для отдельного человека, но является общим для всех. В то время как в жизни обычного человека доминируют другие, отдельные риски. Риск попасть в ДТП может быть высоким для отдельного человека, но низким для всего общества.

В таких условиях обычное «рациональное» поведение становится эгоистичным, и даже психопатичным: давать собственные оценки рискам, противоречащие оценкам общественных рисков, и даже создавать новые риски для общества.

Кроме того, краткосрочный и долгосрочный индивидуальные риски связаны друг с другом. В долгосрочной перспективе системный и индивидуальный риски сходятся: если все люди вокруг заражены, риск лично для вас также увеличивается. И снижается вероятность пережить другие болезни. В конечном итоге, игнорируя «иррациональные» лично для вас риски, вы навредите самим себе.

Например, во время пандемии, которая в основном щадит молодых, здоровых людей, отдельное «обычное» заболевание с госпитализацией может стать неизлечимым из-за нехватки ресурсов.

Комментарий
Чтобы представить себе возможную нагрузку на больницы, вспомните набеги покупателей на магазины, пустые полки, очереди и конфликты. Теперь спроецируйте эту ситуацию на больницы!

Далее, для всех представителей общества в условиях социального кризиса возникает много дополнительных рисков, которые не могут быть сведены к первоначальному краткосрочному риску заражения отдельного человека.

В нынешней вспышке COVID-19 такие последствия могут наблюдаться при переполнении больниц и их отделений интенсивной терапии по мере возникновения локальных вспышек. Эти переполнения и другие менее заметные события изменяют динамику пандемии по мере превышения пороговых значений. Риски, которые изначально были небольшими, усиливаются и порождают новые непредвиденные риски, поскольку инфекция оказывает воздействие на всю систему.

По этим причинам будет разумно и этично для всех принимать меры предосторожности одновременно на индивидуальном и местном уровнях.

Распространяющаяся инфекция размывает границу между индивидуальным и общим масштабами: она связывает индивида с коллективом, делая каждого человека потенциальным носителем и источником риска.

Меры предосторожности для взаимозависимых индивидуальных рисков усиливаются экспоненциально и оказываются невероятно высокими на системном уровне.

15 марта 2020 года.
Автор: Нассим Николас Талеб (N. N. Taleb)
Электронная почта: NNT1@nyu.edu

* * *

Перевод с комментариями — Сергей Кашин.

Сидите дома.
Соблюдайте гигиену.
Не участвуйте в переносе инфекции.

Тогда инфекция быстро уляжется
и всё вернется к норме.

* * *
Ранее:
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Вирус распространяется по Москве

Часть 6.

Мне очень жаль, но я оказался прав.
https://twitter.com/sergeykashin/status/1232403789220634625
Тот случай, когда лучше бы нет.

Собянин: подтверждено у 24 человек, 5 из них добавились сегодня (это только в Москве!). Рост 26 % в день. Это только обнаруженные + подтвержденные. Понеслась экспонента, ребята.

https://www.sobyanin.ru/koronavirus-dopolnitelnye-mery-14-03-2020?fbclid=IwAR3qp-LlwyWkSBWK8Hcs4zmYp0nr018mPlP6ujAYhQ1yHyLcqGJj8yxG24Q

Почему количество будет расти дальше по экспоненте: принимаются меры, но это полумеры. Инфекции пофигу, оставляете вы ей 1000 путей, или 100, или 10. Нужен настоящий карантин и самокарантин прямо сейчас. Чем раньше, тем дешевле обойдется.

Почему 24 человека — это курам на смех и стоит ожидать уже сейчас более крупных цифр? Внимание на детали. Некоторые носители — дети, приехавшие после отдыха в Италии. Думайте! С кем эти дети приехали, общались, с кем они сидели в такси и метро и т. д.

Простая математическая истина: чтобы справиться с процессом, растущим по экспоненте, нужны меры с эффектом по более крутой экспоненте. Как ты её ни крути! Нужно обогнать экспоненту.

Цена обгона экспоненты тоже растет по экспоненте. Китай заблокировали, когда было 800 случаев, и они остановились на 80 тысячах. В 100 раз. Чем раньше начать, тем дешевле.

Я участвую волонтером на международном проекте в качестве одного из организаторов. Мы начали с 50 человек, а сейчас нас более 1000 и мы позакрывали кучу мероприятий, фестивалей, конференций и концертов, убедили власти разных округов разных стран ввести карантины.

Пока мы боролись за другие страны. Боюсь, что теперь нам предстоит побороться и за Россию. Хорошо что уже есть опыт.

Главное оружие — карантин. Настоящий, ответственный самокарантин. Не для галочки. Физическое разделение людей для прекращения передачи вируса.

 
* * *
Ранее:
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Риск срабатывает моментально

Часть 5.

Два вида паники:
1) До срабатывания риска, «еще рано».
2) После срабатывания риска, «уже поздно».

Риск срабатывает моментально.
https://twitter.com/sergeykashin/status/1226411692764127232

Риск — это то, на что вы не успеете отреагировать. Это момент, точка, разделяющая время на до и после:

У вас гораздо, гораздо больше вариантов возможных действий до срабатывания риска, чем после:

Ранняя, «преждевременная» паника — абсолютно прагматичная и адекватная реакция на критический риск. Это способ выживания.

 
* * *
Начало истории:
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Риск: ищи то, чего нет на виду

Часть 4.
Риск находится за пределами известных данных.

Ошибка мышления: смотрим на данные, на распределения, частоты, минимумы-максимумы, и думаем, что это отражение реальности. Думаем, что анализируя эти данные, мы изучаем возможные риски. Это неверно и наивно.

Риск находится в будущем, его нет в данных.

Когда идет речь о широком системном риске, типа жизни большого количества людей или защиты крупных активов, полезнее думать не о том, что есть, а о том, чего нет в данных. Что не сказано, не посчитано, чего нет на виду.

О риске говорят не сами данные, а данные в сочетании с сигналами, свойствами и масштабом процесса.

Масштаб процесса:
— Вирусу пофигу, на каком континенте живет человек. Возможная область распространения не ограничена. В сравнении с пожарами: даже если выгорит вся Австралия, Африка от этого не загорится.

Свойства процесса:
— Коэффициент распространения (например, 3 → каждый заболевший заражает еще троих) свойство сильно шумное и нелинейное. Оно зависит от обстоятельств. Транспортная связность мира сегодня выше, чем во время предыдущих эпидемий, и гораздо выше, чем при эпидемии 1918 года, унесшей 50-100 миллионов жизней
https://ru.wikipedia.org/wiki/Испанский_грипп
Поэтому сложно сравнивать эпидемии в принципе.

«Дождь» шутит:
https://www.facebook.com/photo.php?fbid=10219531208704389&set=p.10219531208704389&type=3&theater

— Достаточно, чтобы люди контактировали друг с другом и ездили по миру — это условие выполняется. Несколько дней назад подтвердились заражения у людей, которые никогда не были в Китае:
https://twitter.com/nCOV19/status/1224792740757635073
#Singapore, #Malaysia, and #Thailand confirmed #coronavirus infections Tuesday among citizens who had not travelled to #China, person to person transmission confirmed in these countries.

— До первых симптомов мы не видим признаков заражения. Неизвестно, передается ли заражение до появления симптомов.

— Нет вакцины.

Сигналы процесса:
Очевидно, Китай под напряжением.
— Нагрузка на инфраструктуру: Из-за нехватки мест в больницах пациентов с «легкими симптомами» отравляют на домашний больничный. Публичные места в Ухани переделаны под размещение пациентов. Как в военное время.

— Нагрузка на ресурсы: Китай и сам крупный производитель медицинских масок и мед-материалов, но этих вещей уже не хватает.

— Нагрузка на докторов. Это люди, они не железные. Всё зависит от них.
Доктор умер, отработав 10-дневную смену:
https://twitter.com/nCOV19/status/1225170142251929600
https://www.dailymail.co.uk/news/article-7970475/Coronavirus-doctor-27-drops-dead-working-10-straight-days.html

Лица медсестер после ношения маски в течение всего дня, каждый день, много дней:
https://twitter.com/PDChina/status/1225192378656546822
Просто, чтобы задуматься о напряжении.

Вот мы смотрим на число и видим как оно растет:

Растет и нагрузка на людей. Это как баллон, который всё больше набивают воздухом. У баллона есть предел прочности. Риск не в настоящем, а в будущем. Что будет, если люди не выдержат?

Исходя из перечисленного, странно видеть позиции типа «не надо ничего делать, расслабьтесь и всё будет хорошо». Епона мать, очень хочется надеяться, чтобы действительно было хорошо, и пусть оно так и будет.

От большинства действительно мало что зависит и вполне можно расслабиться.

Но «хорошо» будет благодаря усилиям тех людей, кто сейчас борется, а не тех, кто такой смелый что аж не паникует, зайчик какой. Вот эту деталь хочется не забывать. Эти люди сейчас работают наперегонки со смертью.

 
* * *
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Откуда данные о заболевших

Днём ранее написал про временной сдвиг и природу коэффициента смертности:
http://www.cashin.ru/blog/all/virus-2/

Увидел в Твитере ссылку на заметку ровно с тем же:
https://medium.com/@tabardel/coronavirus-2019-ncov-no-the-case-fatality-rate-is-not-2-48142169a367

Тем временем, Нью-Йорк Таймс публикует ожидания по коэффициентам смертности, и допускает ровно ту ошибку, которую я описал во второй части: сравнивает смертность затихших эпидемий с активно развивающейся:
https://nytimes.com/interactive/2020/world/asia/china-coronavirus-contain.html

Или я чего-то не догоняю, или визуализация вызывает вопросы.
Кидаю вопрос Нассиму Талебу, получаю подтверждение.
https://twitter.com/sergeykashin/status/1225828779748098048

Печальная новость для дизайна:
Высокий графический уровень визуализации данных скрывает опасность — у зрителя создается впечатление надежной и продуманной работы, а на деле работа построена на сомнительном смысловом фундаменте.

Вообще, у меня накопились примеры ошибок в визуализациях, созданных известными командами. Возможно, как-нибудь найду время рассказать. Пугает то, что на известные команды ориентируются другие дизайнеры, которые видят ошибки и думают что так делать окей. Это не окей.

Идем дальше.

Часть 3.
Откуда данные?

Основная масса заболевших — в Китае. Оттуда же почти все цифры. На основе этих цифр все строят статистические оценки и прогнозы.

Возникает вопрос, насколько цифры близки к реальности. Китай может всё, у них есть великий файрвол, тотальный мониторинг и партия.

А когда есть сомнения в данных, действия иногда говорят больше, чем цифры: Китай не стал бы сливать свою экономику, если бы риск был небольшим. Реакция страны на происходящее сильнее, чем можно ожидать только по цифрам. Использование крупных общественных пространств для размещения заболевших, мегазакупки медицинских материалов за рубежом (для Китая-то) — практически военная тема. Это сигнал о том, что реальность может быть хуже.

Заметили две тенденции: до конца января из Китая приходили цифры роста инфицированных по 50% в день, а после 27 января — ровно по 25% в день.
https://twitter.com/salilstatistics/status/1223484153468944384

Инфицирование — случайный процесс. Странно, что поток чисел так ровно ломается с 50% на 25% в один день — непонятно, что произошло именно в этот день. +Непонятно, насколько возможна проблема технического ограничения диагностирования новых случаев — ведь на диагностику нужны ресурсы.

Схожий вопрос к цифрам: очень ровный рост в отчетности — несколько дней подряд точно по квадратичной кривой, будто данные отвешивали вручную:
https://twitter.com/evdefender/status/1224723734680035329

Посмотрим.
P. S. пока я собирал скриншоты, цифры ушли вверх.

 
* * *
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Отставание эффекта от причины

Это мой второй пост на тему того, как люди понимают риск (а люди нихрена не понимают риск) в контексте вирусного заражения как нелинейного процесса.

Ссылки на другие посты — ниже.

Сегодня хочу поговорить о такой ошибке мышления: люди не понимают временного сдвига между причиной и эффектом.

Сейчас сравнивают число зараженных с числом погибших.
На сегодня около 30 тысяч заражены, около 600 погибло.
Типа, 28353 / 565 = 2 % смертности... Это наивно.

Существует временной сдвиг:
3-9 дней от заражения до госпитализации, и еще 5-10 дней от госпитализации до возможной смерти. Даже если брать суммарно одну неделю назад, надо делить другие числа, и получится совсем другой процент.

Те люди, которые заражены прямо сейчас, еще не достигли момента «будет жить или нет».

Что вообще такое — процент смертности? Это соотношение чисел, известных на данный момент. Итоговый коэффициент смертности от вируса ТОРС (SARS, 2003) составил 9,6%. «Итоговый» — потому что эпидемия закончилась.

https://en.wikipedia.org/wiki/Severe_acute_respiratory_syndrome

Что это означает: люди заражались, кто-то умирал, и каждый день — разное количество. Оно колеблется, оно неровное. Типа того:

И вот когда все улеглось, кто смог выздороветь — выздоровел, кто не смог — умер, количество умерших разделили на общее количество диагностированных — это итоговый процент смертности.

Сложно понять, но попробуйте: не существует в природе такой вещи как коэффициент смертности от вируса. В принципе, такой информации нет в природе. Потому что она находится в будущем. Мы видим только фактическую смертность — это то, что уже произошло.

Эпидемия САРС унесла жизни 9,6% заболевших. Это не говорит о том, что так же будет происходить и в будущем. Еще одна (такая же) эпидемия унесет уже другое количество. Но другое не плюс-минус один-два процента, а плюс-минус сколько угодно. Потому что заражение вирусом — это динамический, мультипликативный риск. Это не подбрасывание монетки с двумя сторонами — мы не знаем количества «сторон». Это шанс, многократно умножающийся на невидимые нам обстоятельства с нелинейными свойствами. Мы не знаем.

Но мы знаем, что количество заболевших и умерших, по-крайней мере, растет не медленнее, чем официально объявлено Китаем. Больше — скорее всего, меньше — вряд ли. Потому что Китай это Китай. Об этом далее.

 
* * *
Часть 1.
Мы путаем локальный риск с системным.
http://www.cashin.ru/blog/all/virus/

Часть 2.
Мы не понимаем сдвига во времени между причиной и следствием.
http://www.cashin.ru/blog/all/virus-2/

Часть 3.
Откуда данные?
http://www.cashin.ru/blog/all/virus-3/

Часть 4.
Ищи то, чего нет на виду.
http://www.cashin.ru/blog/all/virus-4/

Часть 5.
Риск срабатывает моментально
http://www.cashin.ru/blog/all/virus-5/

Часть 6.
Вирус распространяется по Москве
http://www.cashin.ru/blog/all/virus6/

Часть 7.
Действия каждого для общей безопасности
http://www.cashin.ru/blog/all/virus-7/

Часть 8.
Группы риска не существует: мы все в одной лодке
http://www.cashin.ru/blog/all/virus-8/

Все заметки на тему коронавируса
http://www.cashin.ru/blog/tags/koronavirus/

Ctrl + ↓ Ранее