Rose debug info
---------------

Журнал Сергея Кашина

Специфика обработки нажатий кнопок в тач-интерфейсах — 2

Ну, в первой части немного размялись, а теперь — к делу! )

Часть 2. Биомеханика сенсорных кнопок

Гипотеза

Непреднамеренное проскальзывание пальца при тапе на сенсорном экране добавляет в интерфейс фактор сложности, сравнимый с трудностью попадания в маленькие элементы.

* * *

Закон Фиттса описывает сложность наведения на цель в пространстве. Но ничего не говорит о самом моменте касания и возможном проскальзывании пальца.

Давайте разберёмся, почему тап — это не просто клик, а другая биомеханическая задача. Посмотрим на вариации закона Фиттса. Сравним работу мышью и пальцами.

Оглавление:
Гипотеза (вы здесь)
Фиттс
    Оригинальная статья
    Модификации закона Фиттса
    Модификация FFitts
    Устройство для эксперимента
Мышь
    Биомеханика
    Фиксация руки
Пальцы
    Видимость цели
    Форма контакта
    Кинетическая цепочка
    Вращательное движение
    Отдельная фаза
Выводы и рекомендации

Фиттс

Оригинальная статья Пола Фиттса 1954 года

http://www2.psychology.uiowa.edu/faculty/mordkoff/InfoProc/pdfs/Fitts%201954.pdf

На Википедии:
https://en.wikipedia.org/wiki/Fitts%27s_law

В переводе на русский:
https://translated.turbopages.org/proxy_u/en-ru.ru.f66b549e-69427f60-bf9f66f5-74722d776562/https/en.wikipedia.org/wiki/Fitts%27s_law

В общем виде закон Фиттса увязывает три вещи:
— Расстояние до цели,
— Размер цели,
— Время движения.

Не буду сюда тащить формулы, смотрите в исходной статье.

В эксперименте Фиттса испытуемые поочерёдно касались стилусами металлических пластин разной ширины, расположенных на определенном расстоянии. Замеряли время, попадания и ошибки.

Важная деталь: это была одномерная задача. Пластины были широкими в перпендикулярном направлении, чтобы исключить ошибки во втором измерении.

Модификации закона Фиттса

Существуют вариации под разные устройства и задачи — 2D, 3D, разные формы целей. По сути, это просто математические модели оценки сложности наведения.

Модификация FFitts

https://www3.cs.stonybrook.edu/~xiaojun/pdf/FFitts.pdf
https://research.google.com/pubs/archive/41645.pdf

FFitts (Finger-Fitts) добавляет фактор абсолютной неточности пальца — «дрожь», fat finger problem. Около 1—1,5 мм, независимо от задачи.

Однако это не относится к величине проскальзывания пальцев при тапе. Модель просто оценивает наведение на элемент. И ничего не говорит о проскальзывании пальца после касания.

Устройство эксперимента Фиттса

Обратим внимание на аппарат в оригинальном эксперименте Фиттса: при касании пластины счётчик фиксировал только первый момент контакта и блокировался до касания противоположной пластины, чтобы не было дублирующих срабатываний.

Эксперимент никак не фиксировал проскальзывания стилуса. Можно было хоть вензеля выписывать — прибор регистрировал только первый момент касания.

Если представить аналогичный эксперимент с механическими кнопками — боковое смещение тоже не имело бы значения: кнопка нажимается в одном направлении. Проскальзывание пальца при этом может быть (уже на поверхности кнопки), но кнопке все равно, если она исправна, конечно.

Мышь.

Микропауза

Биомеханика клика мыши отличается от тапа.
Фазы:
— Движение мыши к цели,
— Микропауза над целью,
— Клик.

Что за «Микропауза над целью»?
Мы не кликаем мышью «вскользь», если только это не специализированный интерфейс или компьютерная игра. Микропауза возникает потому, что курсор виден. И мы ждём визуального подтверждения точного позиционирования. А реакция человека — не мгновенная, она занимает доли секунды. Эта остановка мыши устраняет проскальзывание курсора в момент нажатия.

Фиксация руки

При движении мышью рука часто опирается на стол или подлокотник — это фиксирует локоть и плечо, оставляя для очень точного движения только кисть и пальцы.

Попробуйте эксперимент от обратного:
— Встаньте у рабочего стола.
— Возьмите мышь, не кладя руку на стол. На столе только мышь.
— Попробуйте кликать по мелким элементам — станет заметно сложнее, чем с опорой руки на стол.

Пальцы: биомеханика тапа

Видимость цели

Палец закрывает кнопку, точка контакта не видна. Поэтому человек не ждет визуального подтверждения точности попадания до миллиметра. Тапы по сравнению с кликами — это приблизительные «выстрелы навскидку».

Форма контакта

Палец слегка сдавливается при касании, и мы не видим формы и размера пятна контакта. В зависимости от угла пятно контакта может принимать разные формы, и устройство может по-разному извлекать координаты из этого пятна.

Попробуйте: прицельтесь пальцем точно над кнопкой тачскрина. Коснувшись кнопки, прокатите палец «колесом» немного. Не скользите по экрану, а именно прокатите, как прокатывают для отпечатков. Система воспримет это как перетаскивание (драг), хотя вы не скользили пальцем по экрану. Двигалось пятно контакта.

Кинетическая цепочка

С тачскрином контактирует только кончик пальца. Это конец кинетической цепочки сегментов и суставов руки от плеча и возможно даже выше. Позиция кончика пальца зависит от инерции и движения множества сегментов руки. Более крупных и менее точных, чем пальцы.

Эта длинная цепочка сегментов объясняет, почему в движущемся автомобиле тапы становятся ещё сложнее, например. И почему некоторые кнопки полезно делать механическими. Не только потому, что механика дает тактильную обратную связь. Но и потому, что механическая кнопка является естественным фильтром случайной составляющей движения пальца. Механическая кнопка извлекает одномерную составляющую из трехмерного движения.

Вращательное движение

Все суставы — вращательные. Прямолинейное движение пальца требует незаметной глазу координации сразу нескольких суставов на лету. Для движения кончика по прямой какие-то суставы должны сгибаться, а какие-то другие в то же время — разгибаться. В реальности в движениях пальцев бывают неточности. Механическая кнопка «прощает» это, переводя любое приближение в нажатие.

Отдельная фаза движения

Подход Фиттса, это по сути оценка сложности сближения условного указателя с элементом в N-мерном пространстве. Процесс сближения — стохастический: траектории содержат случайную составляющую. И чем точнее движение, тем меньше отклонение траекторий от идеальной.

Тап добавляет отдельную фазу: вертикальное сближение уже наведённого пальца с поверхностью. Это не мгновенное событие, а процесс со своей стохастикой — случайными отклонениями.

Этой детали вариации формулы Фиттса не учитывают. У Фиттса есть процесс сближения и событие касания. Для сенсорного интерфейса касание — это не событие, а тоже процесс, хотя и незаметный.

Если мы принимаем тот факт, что траектория наведения по Фиттсу — стохастическая, вследствие неточности движения руки и помех реального мира, то в тех же условиях финальную фазу «тап» нужно также считать стохастической.

Выводы и рекомендации

Непреднамеренное проскальзывание при тапе — нормальное, частое и биомеханически неизбежное явление.

На сенсорном интерфейсе для пальцев порог допустимого скольжения без перехода в перетаскивание (драг) нужен не на всякий случай, а на каждый случай.

Для обычных кнопок отслеживать перетаскивание вообще почти никогда не требуется.

В операционных системах (iOS, Android и др.) учет Touch slop есть по умолчанию (UIGestureRecognizer, ViewConfiguration). Настройка Touch slop на уровне 2—3 мм как раз отражает реальную точность, которую можно ожидать от пользователя. Но в кастомных компонентах это свойство легко поменять или забыть настроить.

Когда речь не просто про кнопку, а главную кнопку для миллионной аудитории, хочется обратить на это внимание.

Проблема непреднамеренного запуска перетаскивания в сенсорном интерфейсе влияет на комфорт, а иногда и на безопасность:
— навигаторы в авто,
— медицинские интерфейсы,
— промышленные и другие специализированные интерфейсы.

Это не критика закона Фиттса — он актуален в своей области. Просто для сенсорных интерфейсов к сложности наведения стоит добавить сложность самого касания.

Дизайнерам и разработчикам

При приемке разработанного интерфейса проверяйте поведение кнопок при легком смещении пальца. Особенно для главных действий.

Передайте коллегам в VK Video :-) Мы там смотрим мультики с дочерью и хотим, чтобы кнопка Play запускала ролик, а не сворачивала его.

Пишите вопросы и комментарии в Телеге:
https://t.me/sergeykashin/818

Специфика обработки нажатий кнопок в тач-интерфейсах — 1

...или
как включить мультик.

Дизайнерам и разработчикам сенсорных интерфейсов.

Часть 1.

Тап — касание сенсорного экрана, которое система распознаёт как нажатие, а не как начало перетаскивания.

Если после касания тачскрина палец слегка смещается (скользящий тап) — кнопка уже не срабатывает на нажатие. Вместо этого запускается перетаскивание.

Когда это перетаскивание непреднамеренное, интерфейс чудит. Например, видео сворачивается вместо запуска.

Дочь (4 года) при просмотре мультиков на айпаде в VK Video часто не может с первой попытки запустить ролик. Экран — стандартный айпад. Она пытается нажать на кнопку «плей», и видео то сворачивается, то уезжает непонятно куда.

Примерно как-то так:

Но «плей» — это же просто кнопка. Что с ней еще можно делать? Если это интерфейсный элемент, заведомо предназначенный только для нажатия, зачем вообще пытаться отслеживать на нем событие перетаскивания?

Зачем вообще сворачивать видео путем нажатия на кнопку «плей»?

В обработчике событий настраивается порог допустимого смещения пальца во время тапа. И это пороговое значение должно быть настроено адекватно элементу и возможным сценариям. Касания под углом, в транспорте во время движения, и т. п. Или может просто у человека рука дрожит, мало ли почему.

Кнопка — простой стандартный элемент, она в первую очередь должна нормально нажиматься.

При этом кнопка воспроизведения в VK Video довольно мелкая, и область кликабельности у нее минимальная. И уж ладно это поперек закона Фиттса. Но раз она такая мелкая, то разве не очевидно, что если человек попал пальцем на большом экране в область маленькой кнопки, ТО ОН ХОЧЕТ НАЖАТЬ НА ЭТУ КНОПКУ, а не свернуть видео?

Вспоминаю историю про клавиатуру первого айфона. Эпл впервые делали тач-ввод текста с клавиатуры, и учли неточность движения пальцев. Алгоритм по движениям предугадывал слово, которое хотел написать пользователь, а не брал фактические строгие координаты. Забота в таких деталях по-прежнему встречается редко.

Нужен адекватный порог невосприимчивости к смещению при тапе.
Порог может варьироваться в зависимости от контекста. Например, в зависимости от размера и типа элемента. А кнопка «плей» должна просто нажиматься.

Для стандартных элементов во всех распространенных операционных системах порог обычно уже прописан по умолчанию. Дальше все зависит от корректности разработки в конкретном приложении. Так как бывают кастомные элементы и настройки, в некоторых случаях с этим проблемы.

Продолжение следует в ближайшее время. Лонгрид будет в двух частях. Самое интересное — впереди ) Во второй части разберём биомеханику тапов, почему это важно, и почему всё не так просто, как кажется.

UPD.
Вторая часть, Фиттс, биомеханика тапа, выводы

График SpaceX о периодах полетов на Марс

В свежей «марсианской» презентации Илона Маска быстро и без особых комментариев промелькнуло вот такое изображение. Люди в каментах спрашивали, что это такое и как понимать.

The Road to Making Life Multiplanetary: an update from @elonmusk on SpaceX’s plan to reach Mars
https://x.com/spacex/status/1928185351933239641?s=46&t=Aznj6bmtu-vKadAwRSbTWQ

Пояснительная бригада выехала.

Давайте разбираться. Земля и Марс движутся вокруг Солнца по разным орбитам с разными скоростями.

Орбиты Земли, Марса, и переходная траектория
https://marspedia.org/Earth-Mars_Transfer_Trajectory

Нельзя просто прицелиться с Земли в Марс и полететь напрямую, действует непривычная для нормальных людей орбитальная динамика. Планеты то сближаются, то отдаляются. Период сближения Земли и Марса на орбитах — примерно каждые 26 месяцев. Лететь в период отдаления нет смысла. Нужно лететь, когда сближаются.

Что изображено на диаграмме с полосками

Двухмерный график, вертикальная и горизонтальная оси, вещественные и непрерывные. Цветные линии показывают движение между планетами во времени.

С горизонтальной все просто: это линейная ось времени.
С вертикальной составляющей чуть сложнее. Но об этом поговорим ниже.

Что показывают цветные линии

Люди спрашивали, почему такие цвета, и почему так расположены, что-то вверх, что-то вниз. Есть догадка, что голубое — что-то про Землю, красное — что-то про Марс.

Так и есть. Разгадка — в левой части визуализации. Здесь вокруг 2027 г. только голубые линии. Это первые вероятные полеты SpaceX с Земли на Марс. Каждая линия — движение одного корабля. Красных нет, потому что это первые вылеты, и обратно еще лететь нечему.

Красные показывают движение кораблей от Марса к Земле и появляются только в следующем периоде, через 2 года.

Количество красных линий следующего периода соответствует количеству синих прошлого периода. Сколько прилетело, столько и улетит. Если все успешно долетят :-) И если не будет в планах что-то оставить на Марсе :-)

Почему линии странно сгруппированы

Почему пучки то плотные, то расходятся, и как-то неравномерно? Я не знаю, но могу предположить, что время запусков и посадок как-то распределяется, чтобы все не взлетали и не садились одновременно :-) А пока возникает этот сдвиг во времени запусков и посадок, планеты уже успевают сместиться. Соответственно, дополнительно смещаются и моменты прибытия-отбытия.

Ну и, конечно, это же иллюстрация для публики, а не точный план. Приблизительная иллюстрация того, что в принципе планируется делать.

О способе визуализации

Сам способ визуализации не новый. Он известен с конца 19 века, см. расписания движения поездов Этье́н-Жюля Маре́ (Etienne-Jules Marey).

Расписание поездов между Парижем и Лионом,
Иллюстрация из книги Тафти The Visual Display of Quantitative Information

Теперь о вертикальной составляющей графика

Ключевое отличие марсианской визуализации от классических с поездами заключается в том, что на железнодорожной по вертикали — расстояние, а на марсианской — нет! Железнодорожные станции, в отличие от планет, не летают в пространстве с разными скоростями по орбитам. Расстояние по железной дороге всегда фиксированное.

Минимум, он же ноль — Земля. Максимум, верх — Марс. Расстояние колеблется вследствие постоянного движения по орбитам. Таким образом, ось по вертикали — это не расстояние. Это относительная доля пути, 0 — 100 %.

Если бы вертикальная ось означала расстояние между Землей и Марсом, график выглядел бы иначе.

Посмотрим на график расстояния между Землей и Марсом во времени:

https://www.wolframalpha.com/input?i=distance+between+earth+and+mars
Расстояние между Землей и Марсом в астрономических единицах

Видно, что это расстояние колеблется примерно в 5 раз! От 0,5 до 2,5 единиц. Если бы график полетов опирался именно на расстояние между объектами, он выглядел бы диковато. Верхняя граница, где сейчас Марс, была бы не прямая, а почти синусоидальная примерно в таком масштабе:

График полетов + расстояние между Землей и Марсом

И правда диковато. Но посмотреть на такой вариант было бы любопытно :-) Например, сейчас цветные линии никаким образом не отражают пройденного расстояния.

При этом, выбранный способ для данного мероприятия мне кажется правильным и удачным, потому что
1) прямоугольная форма с визуализацией доли выглядит очень просто, она удобна для презентации;
2) пройденное расстояние в космосе не так важно, как время.

Еще важны скорость и ускорение, но тут движение с условно постоянной скоростью = прямые линии. Потому что начальная скорость набирается за несколько минут, и так же за условные сколько-то минут гасится при посадке. При общем времени полета около 6 месяцев это ничтожно мало. Поэтому прямые линии графиков движения оправданы.

Влияние школ на распространение вируса

Поднимаю ссылку на недавнее исследование, где наглядно показано, насколько сильно закрытие школ влияет на скорость распространения вируса.

https://www.thelancet.com/journals/laninf/article/PIIS1473-3099(20)30785-4/fulltext

Красным показаны диапазоны коэффициента воспроизведения (R) без ограничений, синим — при действующих ограничениях. По горизонтали — количество дней с момента начала действия ограничений.

Отправлять детей в школу опаснее, чем пользоваться общественным транспортом, посещать общественные мероприятия, путешествовать, ходить на работу и т. д. Контакты в школах это не только много людей в одном месте. Дети не хотят выглядеть не круто, и поэтому многие избегают ношения масок. Друзья, которые обнимались при встречах до пандемии, продолжают обниматься. В классах вентиляция, практически, на совести учителей. Проветривают на переменах, но 45 минут урока хватает, чтобы поделиться вирусом.

Дети активно двигаются, движение повышает интенсивность дыхания — обмен частицами в обе стороны. Дети не молчат — при громкой речи многократно увеличивается выделение аэрозольных частиц.

Графики показывают коэффиценты по стране в целом. Включена 131 страна. Но важная деталь: на первом из восьми графиков аудитория меньше: школьники и учителя. Остальные семь — без ограничения аудитории.

Школьники, которые без ограничений ходят в школу, пользуются, в том числе, и транспортом. Но не все, кто пользуется транспортом, едут в школу.

Получается, что относительно небольшая выборка населения — ученики и сотрудники школ — генерят более высокое ускорение распространения, чем остальные виды собраний людей. Таким образом, вероятность того, что человек пойдет в школу и заразится, очень высокая.

* * *

Пара слов о показателе R.

Это относительное изменение количества инфицированных за небольшой промежуток времени. Например, в России считают за 4 дня и сравнивают с предыдущими 4 днями.

R = 1 показывает, что скорость не меняется, заражение происходит линейно:
100 + 100 + 100...

R > 1 показывает, что скорость увеличивается, это ускорение.
100 + 110 + 120...

R < 1 показывает снижение скорости.
100 + 90 + 80...

Аналогия с управлением автомобилем:
R — это не скорость, это насколько сильно мы давим на педаль газа или тормоза.

Для победы над инфекцией комплекс всех мер должен привести к показателю R ниже единицы. И не просто достигнуть один раз, а долго удерживать его ниже единицы. В конце будет некому заражать других. По аналогии это нажатие педали тормоза.

По той же аналогии удержание R близко к единице не помогает: не ускоряемся, но и катимся с прежней скоростью.

Вот здесь показываю R с помощью цвета в столбцах:
https://www.cashin.ru/virus/

Страны, где «нажата педаль газа» — краснее.

Понимаю, что график уже выглядит мелковато. Я его сделал, когда еще не нужно было подписывать годы, а числа ещё были шестизначными...

Но общая картинка видна. Россия сейчас аккуратненько притормаживает, но рано радоваться: это слегка притормаживающий быстро несущийся поезд:
https://www.cashin.ru/virus/russia/

Нужен именно комплекс мер, а не какая-то одна:
Вакцины — классно, конечно, но существует проблема производства, распространения, и далее всей цепочки от записи пациента до проведения последнего укола. Это произойдет не быстро, если вы не Израиль. Не все доверяют вакцинам. Не всем её можно ставить.

Можно сказать, но вот в Израиле же смогли? И мы сможем. Но тогда можно сказать, ведь в Сингапуре смогли надеть на всех маски, так чего мы не можем? Это на порядки проще и дешевле! Это история про то, что в реальном мире «хороший дизайн» не всегда приводит к хорошему результату. Вследствие разных сложных обстоятельств.

Маски — тоже классно, не нужно ничего колоть, никаких непроверенных на длительном промежутке времени чужеродных веществ в организме, никаких побочных эффектов. Но людям пока не удалось заставить всех одновременно носить маски. Кто-то носит, а кто-то нет.

Быстрое и недорогое тестирование — тоже хорошо, даже при низкой точности за счет массового применения быстро выявляются инфицированные и их можно изолировать. Но быстрое тестирование у нас, например, почему-то не развивают.

Локдауны — пока самая мощная мера, но и крайне дорогостоящая и тяжелая в воплощении.

Нужно комбинировать меры.

Вероятность — не вероятность

Главная проблема в индустрии визуализации данных: качество графики повышается, а понимание лежащих в основе процессов и их свойств — не особо.

Предыдущие заметки на эту тему:

Миф о криминальных иммигрантах
https://www.cashin.ru/blog/all/vis-fault-1/

Бессмысленные данные
https://www.cashin.ru/blog/all/times-zero/

* * *

Сегодня посмотрим на графику к чемпионату мира по футболу 2018 года.
https://projects.fivethirtyeight.com/2018-world-cup-predictions/matches/

Авторы ведут блог fivethirtyeight.com и периодически строят прогнозы разных событий.

Вот так выглядела оценка вероятностей в матчах по дням:

Вот такая графика появилась к финалу:

Такие вещи сходу нравятся. Как вписаны варианты исхода вничью. Как подобраны цвета. Разделительные линии между таймами. Перетекание команд в финале. В общем, техника визуализации. При забивании гола меняется график, это наводит на мысли о том, что прогноз учитывает ход игры.

Поначалу это внушает доверие. Чаще всего люди примерно с таким впечатлением и уходят, не вникая глубже. А если не уходят, появляются вопросы.

Что произошло вот здесь, в кружочке?

Испанцы забили гол. В самом начале матча. Прогноз стал показывать, что вероятность победы (WIN PROB.) команды Испании резко увеличилась примерно в два раза: с 25% до 48%.

Ладно. Матч только начался и продолжается. В середине тайма снова что-то происходит:

Теперь гол забивает Португалия. Вероятность победы Испании резко снижается более чем в два раза. Вероятность победы Португалии теперь в два раза выше.

Такое происходит еще 4 раза в течение матча — забили всего 6 мячей. Прогноз вероятности прыгает то в одну, то в другую сторону.

В конце происходит совершенно дикая вещь: незадолго до конца матча система показывала вероятность исхода «Португалия победит» как максимальную, на глаз более 80 %. Внезапно (!) испанцы забивают шестой гол. Прогноз вероятности победы Португалии рушится в ноль.

Внимание, вопрос. Почему «вероятность» так сильно прыгает при забивании голов? Вероятность ли это вообще? Авторы явно пишут — да, WIN PROB.

Как на самом деле ведёт себя вероятность? И чем вероятность отличается от текущего счета в игре?

* * *

Давайте так. Представим, начинается чемпионат, и на поле выходят две команды. На трибунах десятки тысяч зрителей, у экранов — миллионы.

Почему команды состязаются друг с другом? Потому что неизвестно, кто победит. Именно в этом интерес.

Иногда одна команда сильнее другой. И, типа, видно, кто победит наиболее вероятно. Но тогда зачем команды выходят на поле? Да потому что всё равно неизвестно! А что если кто-то выложится получше? Потому и состязаются. Шансы есть. Забивай на последней минуте, атакуй, даже проигрывая, никогда не сдавайся, и т. п. Неопределенность заложена в саму суть игры.

Рассмотрим процесс.
Для простоты исключаем ничью, как в финале.
Вот две команды, с какой-то оценкой относительного уровня.
Команда А оценивается как чуть более сильная, чем Б.
Вероятность победы А чуть выше:

Но когда начинается матч, мы не знаем наверняка результат «точно победит команда А». Результат этой игры зависит сейчас от действий конкретных людей на поле. Если хорошая команда будет плохо работать, она не победит. Быть сильной командой недостаточно.

Начинается матч, и менее сильная команда Б забивает гол. Как авторы нашего прогноза в такой ситуации корректируют прогноз? Они показывают резкое увеличение вероятности победы в матче забившей команды:

Вероятность резко повышается... Чувствуете, что здесь что-то не то?
Может ли команда забить гол? Ну, а зачем ей ещё выходить на поле, а-ха-ха! Конечно, может.

Окей. Может ли команда Б забить не один, а несколько голов? Вот так:

Опять же, почему нет? У них что, ноги отвалились после первого гола? Ноги есть, мяч по-прежнему круглый, всё зависит от действий людей. Напомню, что изначально мы рассматриваем ситуацию, когда командам действительно имеет смысл играть, их шансы изначально близки.

Рассмотрим теперь, что происходит с командой А. Проходит несколько минут, и они... тоже забивают гол.

Сколько голов ещё забьет команда А? Ну как сколько. Это неизвестно. Матч же только начался. Исходная картинка наглядно показывает вполне возможный разброс количества голов за игру: 1, 1, 6:

Потому, вполне может быть так:

Итого, возможности забивать есть у обеих команд:

А может забивать.
Б может забивать.
Как распределяются шансы?

Мы полагаем, что более сильная команда имеет больше шансов. Поэтому смещаем прогноз 50 на 50 (обе могут победить) в сторону сильных. 45 на 55, например.

Но смещаем не слишком далеко, потому что у менее сильной команды тоже есть шанс победить, мы не знаем исхода и поэтому наблюдаем за игрой.

И вот самая интересная деталь, ради которой вся история.
Прогноз вероятности исхода матча — это не то же самое, что счёт игры. Вероятность не прыгает по ходу игры так, как показывают авторы визуализации. Это разные процессы.

Природа счёта известна и проста. Это случайные дискретные события на оси времени:

Какая, в данном случае, природа вероятности победы в матче? Чем она обусловлена?

Начало матча: прогноз вероятности основан только на состоянии команд на момент начала. Игра команд не началась и не влияет на начальный прогноз:

Конец матча: один из пунктов достигает вероятности 100%.
Победа А, Победа Б, Ничья.
Например, победила команда Б:

Что происходило с вероятностью в процессе? Как она менялась? Вряд ли как-то так:

Вероятность менялась как-то нелинейно. Какова природа нелинейности?

В конце матча появляется больше определенности, потому что проигрывающей команде остается все меньше времени на проведение атаки. Возникают физические ограничения, которых не было в середине матча.

Вот тут в конце матча у Аргентины оставалось настолько мало времени, что люди просто не успели бы физически провести мяч в ворота три раза. В конце игры вероятность победы противника при таком счёте стремится к 100%.

В середине и в начале всё по-другому.

Прогноз должен меняться нелинейно. Но авторы предлагают вот такую странную нелинейность: прогноз скачет и в начале, и в середине, и в конце матча чуть ли не от нуля до ста процентов. На большинстве графиков. Их там 64 штуки, гляньте, повторяю ссылку:
https://projects.fivethirtyeight.com/2018-world-cup-predictions/matches/

За примером снова не нужно далеко ходить, всё та же картинка Португалии-Испании показывает, как резко меняется прогноз даже в конце матча:

Вероятность отражает неопределенность. Если даже в конце матча такая неопределенность, и прогноз настолько шумный, то какая же тогда неопределенность в середине матча?

Все эти прыжки «вероятности» говорят ровно следующее и о прогнозе, и о методике: мы не знаем, кто победит.

При такой высокой дисперсии данных ситуация «мы не знаем, кто победит» в числовом выражении сходится к 50 на 50. Или, точнее, с поправкой на оценку навыков команд. В нашем примере, 45 к 55.

Какой прогноз вероятности заслуживал бы больше доверия? Прогноз с корректировкой на неопределенность и высокий шум данных. Данные о забитых мячах — очень шумные случайные переменные.

Данные о пропущенных мячах важны, потому что влияют на моральное состояние команд, и на тактику. Победители часто встают в глухую оборону. Но это слова. Цифры матчей говорят о том, что оборону можно взломать, и именно в этом заключается работа другой команды. И поэтому сохраняется неопределенность, идет борьба, появляются новые победители.

К концу матча остается мало времени на взлом обороны. Когда ты физически не успеешь добежать до ворот три раза. Включается фактор времени. Но это ограничение появляется ближе к концу:

Накладываются другие факторы. Усталость, моральная нагрузка и т. д. Какие-то исзчезают позже других (время: добраться до ворот можно и на 87 минуте матча, поэтому красный график такой крутой в конце), какие-то раньше.

Но в целом история такая, как мы говорили в начале: у обеих команд есть шансы. Обе команды свежие и бодрые в начале матча. Поэтому более корректным будет прогноз с корректировкой по функции оставшихся возможностей. Любой забитый гол не должен приводить к сильным колебаниям вероятности в начале матча.

Если показатель высокодисперсный — вероятности на начальных этапах сходится к 50%. Проще говоря, данные содержат много шума, и вы не знаете, кто победит.

Такой прогноз показывает шум и текущий счёт, а не вероятность:

Более адекватный прогноз учитывает неопределенность и дисперсию входных данных. Первые голы меньше влияют на оценку вероятности. Определенность значительно увеличивается ближе к концу, когда отпадают варианты что-то исправить. Чем ближе к концу, тем сильнее прогноз отклоняется от середины:

Конечно, это проблема для авторов прогноза, которые рассчитывают на массовую популярность. Потому что более адекватный прогноз 1) выглядит не так драматично, 2) все прогнозы окажутся очень похожими друг на друга. А значит, люди не будут охать и пересылать ссылки. Проклятие медиа: нужно поддерживать волну!

Медиа закономерно чаще выбирают первый вариант, к сожалению.

* * *

Итоги

Показанная метрика больше похожа на входные данные, чем на функцию, которая должна строиться на основе этих данных.
x ≠ f(x)

Счет в игре — это x, а не f(x). Если вероятность так трясет в самом начале матча, это признак шума данных и высокой неопределенности. Высокая неопределенность в числовом выражении означает шансы 50 на 50. Графика не учитывает этого свойства вероятности.

Вероятность оказалась не вероятностью. Это какой-то другой показатель, но не вероятность.

* * *

У блога fivethirtyeight.com миллионы читателей. Популярность не означает правоту.

Умножение на ноль: хорошие навыки графического дизайна, аккуратная работа с цветом и типографикой, остроумный способ отображения пространства вариантов во времени матчей — всё это умножается на ноль понимания природы вероятности.

Хочется отдать должное тем, кто непосредственно руками создавал эти графики. Визуально графики так хороши, что их приятно скриншотить и комментировать. Но умножение на ноль даёт ноль.

Рассказывает о самолете

Чел продаёт самолеты. Сам владеет гидросамолетом Айкон А5 (ICON A5), и в этом видео рассказывает о милых деталях, о которых обычно не говорят, представляя подобную технику.

«Я продаю самолеты. Я не инженер, и несмотря на то, что два года летаю на этом самолете, не могу даже назвать себя пилотом. Потому что эта штука настолько простая в обращении, что это сложно назвать пилотированием».

Чтобы всё не пересматривать, вот несколько интересных моментов (там много говорит о своем сервисном обслуживании, и видос подзатянут, в целом).

Боковые стёкла снимаются. И можно лететь, положив на дверь руку, как в тачке, потому что это прикольно. Ссылка на этот момент: https://youtu.be/uTHoBPGrW1U?t=173

Продуманы детали и реальные сценарии использования. Когда крылья находятся в сложенном состоянии для транспортировки, центр масс находится близко к основным стойкам шасси. Поэтому нос самолета легко поднять одной рукой и повернуть носовую стойку в нужном направлении, чтобы откатить самолет. В приподнятом состоянии носовая стойка также автоматически встаёт по центру: https://youtu.be/uTHoBPGrW1U?t=539

Легкость использования и практичность кокпита: https://youtu.be/uTHoBPGrW1U?t=634

Рассказывает, как прыгал в воду из кабины другого гидросамолета. Как было хреново, когда из кабины попадаешь сразу в воду, и как круто, что здесь по бокам есть удобные поплавки: https://youtu.be/uTHoBPGrW1U?t=1455

В общем, некие человеческие штуки помимо цифр про мощность мотора и вместительность в количестве чемоданов.

Прототипирование на деревяшках

Сэнди Монро рассказывал о новом формате ячеек Тесла на примере макета из деревянных цилиндров:
https://www.cashin.ru/blog/all/munro-batteryday/

А сегодня показал макет батареи, собранный на таких цилиндрах, и поделился своими предположениями о способах монтажа ячеек.

Но катодные нитки надо было мотать черные.

Наглядность :-)

Вот это прототипирование ;-)

И там есть вот такая любопытная картинка:

Дизайн обходится относительно недорого, но оказывает большое влияние на продукт. Дизайн в настоящем, глубоком, инженерном смысле.

Умножение на ноль

Сегодня встретил такое:

Сложно придумать более бессмысленную тему для инфографики. А когда-то я следовал рекомендациям Тафти и смотрел Нью-Йорк Таймс. Наверное, ребятам сложно держать ритм. Проклятие медиа: каждый день нужно что-то говорить, а сказать нечего.

Умножение на ноль:
Хорошие графические навыки × громкое имя × ноль смысла = ноль.

f(x) = 0

Всё, что ты умножаешь на ноль, превращается в ноль.

(а эта заметка получает прикольный адрес: times-zero ;-)

Что не так с «новыми знаками» — 2

Небольшое дополнение к теме про странные дорожные знаки.
Начало здесь:
https://www.cashin.ru/blog/all/znaki-1/

Продолжение:

Иван Дианов запостил ссылку на картинку про исследование в канале Игоря Штанга:
https://t.me/nobelfaik_from_lj/1466

Когда я вижу слово «исследования», я начинаю напрягаться сильнее, чем когда просто вижу проблему, про которую исследование. Результаты исследований — для многих как проездной билет, результаты приобретают какой-то вес просто потому что кто-то «исследовал», а ты нет. У меня сразу начинают возникать вопросы. Ну-ка ну-ка, и чего там?

Если бы я реально занимался задачей и нёс ответственность, у меня возникли бы вопросы, прежде чем применять результаты исследования на практике.

Я сразу начинаю думать, о какой метрике речь. Не путать х и f(x). Вряд ли цель водителя в том, чтобы увидеть стрелку. Цель в том, чтобы доехать безопасно и куда надо. Повернуть правильно. А это зависит не только от стрелки.

Исследователи пишут: «эффективность стрелок как функция расстояния разборчивости».

Поэтому базовая измеряемая метрика «на каком расстоянии стрелки остаются различимыми» вызывает очень большие вопросы, если мы реально заботимся об f(x), а не об x.

В каком контексте и составе находился проверяемый объект: работает комплекс, а проверяли один объект. Или проверяли как-то в комплексе. Непонятно. Одна стрелка и инструмент в комплексе работают по-разному:

Снова к основной метрике: исследование говорит про оптическую разборчивость. Хотя на само деле важно, куда человек повернул. Ну, допустим. Но у стрелок же разный размер. Взвешен ли результат по занимаемой площади стрелки? Первая стрелка в рейтинге одновременно и самая крупная:

Последняя стрелка, если все стрелки в масштабе, расходует примерно в 2 раза меньше чернил, если мерять на глаз. Но заявленное расстояние разборчивости для неё только в 1,33 раза меньше, чем для первой: 372 фута против 494. Неоднозначно.

Сергей Николаев померил поточнее:
248 %

Занимаемые стрелками пространства, которые не стоит занимать другими элементами на знаке, тоже сильно различаются:

Внимание к цифрам итоговой метрики. Сам рейтинг, про который и было исследование. Это числа от 372 до 494:

Даже без учета работы знаков в контексте, а не отдельно стрелок, разброс значений не такой и большой. Самая «плохая» стрелка не сказать чтобы катастрофически непригодная.

И снова про главную метрику :-) Самое низкое значение — 372 фута — говорит о том, что именно с такого расстояния стрелка распознавалась, как я понял. Но эта цифра не говорит о других свойствах, например, сколько людей в результате ошиблось на повороте.

Ну а так молодцы, что-то померяли.

Итог примерно такой:
«Большие и толстые стрелки видны дальше, чем маленькие и тонкие».
Ну, ок.

В других условиях проявляются и другие свойства

В русскоязычных соцсетях поднимается волна «вас так волнуют выборы в США, а в России, тем временем, рабство, жопа, и нет выбора».

Пример отборного нытья на эту тему — Cталингулаг. Ну, не знаю, мне такое нытье кажется бесполезным. Наверное, даже вредным, потому что сбрасывает давление пара, которое можно было бы пустить в работу.

Выборы в США интересны не только как выборы. Благодаря сложившемуся балансу, можно видеть бодание разных точек зрения. Совершенно разные люди, разные взгляды и принципы. За людьми стоят разные силы.

Как себя ведут медиа-гиганты. Медиа — это явление, у явлений нет границ. У нас тоже есть медиа-гиганты. Но в наших условиях медиа проявляют другие свойства, условия ведь другие. На примере США можно увидеть проявление других свойств, другие подходы к цензуре и т. д.

Интересно понаблюдать, какую показывают информацию, как её представляют и в каком количестве.

И как блокируют информацию — это, как ни странно, становится явным.

И одно из самых интересных наблюдений — это огромный разрыв между людьми в понимании природы прогнозов и вероятностей.

Переключение между состояниями понимания

Про риск. Вот твиттерская ветка, из которой я сейчас возьму пару твитов как иллюстрацию проблемы.

Мои сообщения не будут относиться напрямую к людям, которые писали сообщения на скринах. Я просто увидел их рядом и мне это показалось наглядной иллюстрацией к тому, что я сейчас напишу.

Ситуация 1: человек видит риск в том, что он уже видит. Видит, как закрываются бизнесы вследствие вируса. Но не видит, как умирают родственники вследствие вируса. У человека логика такая: бизнесы закрываются → хреново. Здоровье? Ну, страшненько, но в целом норм (поскольку люди редко понимают процесс, который стоит за цифрами).

Ситуация 2: человек теряет близкого. Такой человек вряд ли перейдет или останется в первой категории. В такой ситуации потеря здоровья или жизни выглядит страшнее, чем бизнеса, жизнь — это совсем другой уровень ценности.

Прикол в том, что реальность — одна и та же в обоих случаях. Просто человек переключается из одного понимания-состояния в другое. Риск в природе как был, так и есть. И люди в большинстве своем не умеют видеть риск и сравнивать разные риски.

Проблема: всё ломается лавинообразно и необратимо. Когда теряешь человека, разбираться в рисках уже поздно.

Риск должен оставаться в уме. У тебя никто не умер, ты видишь только ломающуюся экономику? Ну, слава богу, но русская рулетка крутится. Когда риск сработал — уже поздно.

Риск срабатывает моментально.

https://www.youtube.com/watch?v=4k5QHshqnVw

В жизни измерений больше, чем кажется

Я уже начитался мнений про эту визуализацию в духе «классная графика, показывающая, что маски почти не помогают». Графика говорит о диаметрально противоположном. Выходит, графика таки не настолько хороша, раз люди понимают главные идеи наоборот.

https://english.elpais.com/society/2020-10-28/a-room-a-bar-and-a-class-how-the-coronavirus-is-spread-through-the-air.html?fbclid=IwAR1dVlRklL3DYNXGlBGe3qj5ylHikR2og3OmRpWcZ2r4o97qR7xsluCuqbY

Важные моменты:
— Защита — штука многоуровневая и многомерная, работает лучше в комплексе.
— Маски необходимы, но не всегда достаточны. И это не означает, что они не помогают.

Важно понимать, что происходит какой-то сложный процесс с множеством скрытых параметров. При создании визуализации часто ставят многомерность как один из критериев качества: чем больше измерений показано, тем лучше. Опять же, не настолько буквально, но как один из критериев в составе других.

Но самое интересное — что в жизни измерений всегда больше, чем в визуализации. Визуализация — примитивная модель реальности. Жизнь всегда сложнее любой графики. Например, совершенно пальцем в небо: графика никак не затрагивает действия защиты на масштабе и на раундах заражения. Мультиплицирование свойств. Вследствие которого даже малейшая польза масок (или любого другого воздействия вроде проветривания) приводит к снижению передачи вируса по цепи к следующим людям — возникает каскадный эффект умножения свойств на большом масштабе с ходом времени.

Что портит экономику

Многие люди до сих пор думают, что противовирусные ограничения ломают экономику. Экономику ломают болезни и смерти людей, идиоты. И затраты времени, денег, эмоций на лечение и, прости господи, на похороны. И порча здоровья у «выздоровевших» — сердца, легких и мозгов, кому как повезет. И нежелание оставшихся в живых болеть и умирать.

Кофейня закрылась: пиздец, надо ныть на весь двор. А зайти за кофейком в маске — это нет, дорого и тяжело.

Поддержи бизнес, не убивай его клиентов, надевай маску, и не на рот, а на нос, епта. Включай мозг, пока есть что включать.

Это не тот случай, когда каждый сам за себя

У Тёмы Лебедева провал в логике. Он считает вирус не страшным, но согласен с тем, что некоторым людям его стоит избегать (возраст и т. д.). Проблема в том, что вирус распространяется через любых людей. И если ты живешь «без идиотских ограничений», то ты, идиот, участвуешь в сети распространения вируса.

Если в широком круге знакомых людей сейчас мало заболевших — это потому, что моментальное значение охвата вируса сейчас невелико. Но вирус страшен не моментальным значением охвата, а скоростью распространения.

Защищать общественное благополучие, защищая самого себя хотя-бы маской — дело чести. Ходить без защиты и увеличивать коллективный риск — бесчестие. Это как не пользоваться дезодорантом, разрисовывать сиденья в транспорте, включать громкую музыку.

С разницей в том, что неиспользование дезодоранта не перекинется на соседей, а вирус — перекинется, потому что это мультипликативный процесс.

Не защищаться от заразного вируса, потому что лично тебе это кажется не страшным — это насрать на людей вокруг.

Когда расстреливали людей, в расстрелах участвовали группой, чтобы было непонятно, кто именно убил. Снижалась психологическая нагрузка, так говорят. Кто сейчас живет без ограничений — тот в расстрельной бригаде.

Что не так с «новыми знаками»

Илья Бирман ретвитил смешное у Никиты Прокопова:

Что если бы современным дизайнерам поручили переделать дорожные знаки.

Тем временем: https://новыезнаки.рф
(кириллический домен)
Мне кажется, получилось плохо. Расскажу, почему.

Начну с конца: когда берутся за такую монументальную задачу, условные 50% качества решения зависят от постановки цели, описания и исследования проблемы, постановки задач. Здесь претензия на мега-решение, но не вижу описания, а в чем, собственно, мега-задача.

«Они устарели» — вредительский аргумент. Он не просто слабый, он вредный: что проработало долгое время — доказало работоспособность. Чтобы менять долго работающие вещи, нужны очень веские причины и исследования. Решение должно явно превосходить предыдущее.

Если владелец частного проекта меняет что-то по своему усмотрению — это нормально. Владелец берет на себя все риски. Может сделать хуже — и это его проблемы. Дорожные знаки — история общественная. Дизайн здесь должен работать гораздо строже с постановкой целей и аргументацией.

Мне интересно, ездил ли когда-либо автор этой картинки за рулем. Там странная сносочка «* изображения без проекции (не для трафаретного нанесения на дорожное полотно)». Но мне кажется, что рука вообще не должна подниматься показывать такой стыд даже со сноской.

Моя основная критика — по постановке цели. От цели идет все остальное. Как ты поймешь, хорошо ли получилось?

«Сделали понятнее, аккуратнее и лучше» — лучше в чем?
«Не имеет аналогов в мире» — а с чего вы взяли, что это хорошо?

Про цель. Простая мораль: если бы что-то было, авторы уже рассказали бы с горящими глазами.

Если пойти дальше понимания цели, то здесь и с графикой плохо. Просто плохие решения. Нормальные дизайнеры, думаю, всё поняли уже по первой картинке.

И еще раз, поскольку эта история не частная, а общественная, я считаю нормальным не проходить мимо, а открыто понакидывать. Кто еще заметил, что стрелки — ужас? )

Куда показывает вот эта синяя стрелка? Как определили, что второй вариант лучше первого?

Как люди воспримут кончики стрелок, которые можно спутать с линиями? Это стрелки или странные перекрестки? Концы стрелок не должны выглядеть как сами линии.

Стоимость восприятия: в «новой» стрелке три объекта (левая часть, центр, правая часть) вместо одного (цельная стрелка). Если стрелок две — водителю на полном ходу нужно расшифровать уже шесть объектов.

И еще негативное пространство, возникающее между линиями. Четвертый объект на расшифровку.

Вкус, смысл, суть используемых элементов: в действующем знаке есть аккуратное скругление в стрелке направо. Это единственное скругление на знаке. Оно соответствует физическому смыслу: вот здесь поворачивай. Всё. Автомобили поворачивают плавно, там и дорожное полотно скругляется.

Во втором варианте единственное имеющее смысл скругление забивается бесполезными оформительскими скруглениями кончиков стрелок. Теряется графическая сила, которая заключается в осмысленных различиях дизайна элементов.

Скругления — очередная сезонная болезнь у дизайнеров, помимо начисто отбитого понимания, что такое оптическая компенсация центра по вертикали. Вот пешеход. Было: смотрим на пешехода. Стало: смотрим на белый треугольник. Зачем подчеркивать треугольник?

Как это работает: на действующем знаке углы объектов изображены по-разному. См. Layering and Separation у Тафти для примера. Большой радиус у знака — больше нигде не повторяется. Зебра: в жизни прямые углы, здесь полное соответствие. Пешеход: это иконка, скругление осмысленное.

Треугольник в действующем знаке не спорит со слоями общей рамки и пешехода. В новом предложенном знаке начинается странная игра скруглений треугольника и рамки. Проблема в том, что треугольник проявился как самостоятельная сущность, хотя главное здесь — пешеход.

Прикол, что даже демонстрационная картинка в самом начале страницы наглядно показывает, насколько пухлыми и шумными стали элементы с этими скруглениями. Переваренные пельмешки.

Вот здесь можно было бы поговниться на тему того, что надо чувствовать, что такие нашлепки делать плохо. Но задача решается и без чувств, чисто инженерным подходом: активировав негативное пространство, ты превращаешь один элемент в три, а это ресурс внимания водителя, это плохо.

Вообще мой личный опыт факапов с дорожными указателями говорит о том, что больше проблем не с внешним видом знаков, а с их применением, как проектируется дорога в целом. «Знают» ли знаки о месте, в котором они расположены.

Сколько раз люди уезжают не туда только потому, что указатель не установлен вовремя, или установлен не там, или не учтены соседние повороты! Допустим, знак эстетичный, читабельный, но поздно. Или не видно. И т. п.

Муть со скруглениями идет из тенденции всё скруглять в экранных интерфейсах. Но знаки — это принципиально другая история. Цифровое на порядки легче тестировать и менять. Не сработавшее откатывается обратно за минуту на миллионах пользователей. Со знаками так не прокатит, ребята.

Продолжение:
https://www.cashin.ru/blog/all/znaki-2/

Сэнди Монро о презентации аккумуляторных технологий Теслы

Люблю смотреть, как Сэнди Монро разбирает сложные штуки до деталей и распиливает сами детали, чтобы докопаться до их строения.

Чтобы наглядно рассказать о преимуществах нового формата аккумуляторных ячеек Тесла, чуваки просто взяли и запилили мокап батареи в натуральную величину из пары сотен трубок 46 х 80 мм и поместили рядом с батареей нынешнего формата для сравнения, выглядит офигенно:

И еще пара интересных мыслей в соседнем интервью: Маск, в отличие от большинства, занижает успехи и характеристики, “недопродаёт”, вследствие чего застаёт конкурентов врасплох. Отсылка к Искусству войны Сунь Цзы, ссылка на этот момент:

Монро рассказывает о преимуществах нового формата аккумуляторных ячеек Тесла и поясняет, почему это не всеми оценённое событие очень крутое и на многое повлияет. Ячейка становится жестким структурным элементом, количество ячеек резко снижается, обеспечивается охлаждение именно с торцов — где самые горячие места, снижается сложность, меньше потерь на нагреве электродов и т. д.

Укрупняются компоненты — более цельная батарея, алюминиевое литье всей рамы авто всего из трех частей, снижается количество физических компонентов, связей, соединений. Интересно, что в цифровой среде, в каком-то смысле, процесс противоположный: большие компоненты дробятся на небольшие и универсальные.

Главная проблема в индустрии визуализации данных

Растущее качество графики в современной визуализации данных всё чаще скрывает сомнительные подходы работы с данными, неправильное понимание природы данных, а иногда и грубые математические ошибки.

Бывает, смотришь на историю и сразу веришь показанному, потому что история выглядит уверенно. Видно, что люди плотно поработали. Хочется доверять. Но…

С данными всегда есть проблемы: они многомерные, неоднородные, из разных источников. Они то полные, то неполные. Иногда кажется, что их много, а их мало. И наоборот. Их надо собирать, дополнять, искать в них порядок. Надо решать, как показывать историю. Надо решать, какую именно историю вообще стоит показывать и зачем.

Наименее вероятны проблемы с визуализацией в следующих ситуациях:

— Отображаемый процесс — установившийся. Например, доля бракованного товара в производстве.
— Процесс находится в прошлом, распределения известны. Результаты спортивных состязаний. Состоявшиеся продажи автомобилей по маркам и моделям.
— Распределение данных находится в классе гауссовых. Например, вес и рост людей.

Но всё усложняется, если система — открытая, нелинейная и многомерная (распределение богатства), если распределение процесса степенное, с толстым хвостом (эпидемии и войны), если в деле замешано прогнозирование (результаты будущих выборов).

Такие ситуации требуют критического мышления, логики, математики, понимания свойств. «Визуализировать» недостаточно. Увы, в реальном мире именно такие ситуации как раз наиболее интересны.

Часто в убедительной с виду истории можно найти провал в самом главном. В основном сообщении, в сути. Хочу разобрать пару примеров на эту тему.

В качестве первого примера — статья «Миф о криминальных иммигрантах»,

о связи между нелегальной иммиграцией и преступностью в США.

* * *

https://www.themarshallproject.org/2018/03/30/the-myth-of-the-criminal-immigrant

В статье автор делает вывод, вроде бы основанный на данных. Если копнуть глубже, выясняется, что статья говорит совсем о другом.

О чем говорит статья? Разберем по шагам.

Начинаем прямо с хэдера страницы:
Do immigrants lead to crime? A recent study says no. «Приводит ли иммиграция к преступности? Недавнее исследование говорит, что нет.»

Давайте посмотрим, о чем на самом деле говорит исследование.

Количество иммигрантов (в процентах 2016 г относительно 1980) увеличилось. Уровень преступности (тяжкие) за те же годы уменьшился.

Сходу бросается в глаза небольшое количество точек измерения. Меряли десятилетиями. Тут всего по 4 точки на график на огромный диапазон времени. Это мало для такого масштабного процесса. Просто технически, еще до того как пролистаем страницу ниже.

Непонятно, как собирались данные. Накапливались по 10 лет, или это точечные данные. Если накапливались, почему не показать промежуточные? Автор ссылается на исследование, доступное на платной основе:

https://tandfonline.com/doi/full/10.1080/15377938.2016.1261057?needAccess=true

Как я понимаю парный график: «смотрите, иммигрантов всё больше, а преступности становится меньше». Типа, корреляция.

Но тут проблема: обе переменные многофакторные и нелинейные, значит для выявления корреляции (если она вообще может быть) нужно гораздо больше данных, чтобы подтвердить гипотезу на исторических данных. Супер-мало данных!

Следующий сомнительный момент: статья критикует Трампа на тему «Стены» и нелегальной иммиграции (бандитов, буквально). Но статья разбирает просто иммиграцию, без выделения нелегальной. Не ясно, какая доля преступлений на правом графике совершена именно нелегальными иммигрантами.

Да и более того, справа вообще нет речи об иммигрантах, это общее количество тяжких преступлений.

Трамп в 2018 качал тему именно нелегальной иммиграции: https://twitter.com/realDonaldTrump/status/1086091478168993792

In 2018 alone, 20,000 illegal aliens with criminal records were apprehended trying to cross the Border, and there was a 122% increase in fentanyl being smuggled between ports of entry.

Из того, что снижается некий коэффициент преступности, не следует, что иммигранты совершают меньше преступлений. Технически автор статьи жонглирует множествами иммигрантов вообще, и нелегальных, совершивших тяжкие преступления.

Внизу стоит ссылка на данные ФБР. Но само ФБР предупреждает, что не стоит полагаться только на данные, и приводит список множества факторов, которые нужно учитывать. Только в этом списке 13 пунктов: https://ucr.fbi.gov/ucr-statistics-their-proper-use

В принципе, уже достаточно причин, чтобы забыть про статью:
множества не бьются, многофакторность не учитывается, корреляция ложная, никакой связи между исходными данными и выводами не показано. Но ниже тоже есть интересные моменты )

* * *

Изменение уровней преступности, 1986-2016 годы:

Мозг сразу рисует какую-то такую картинку. Но не торопитесь с выводами )

На графике куча проблем.
Слишком высокий уровень шума данных, чтобы нарисовать себе такой тренд.
Не видно абсолютных значений: в городах разная численность населения.
Графический ход вызывает вопросы: кружочки наслаиваются друг на друга, не видно что под ними.

Хорошо, что кружочки сделаны в векторе в СВГ. Ищем в инспекторе, гасим обводки и цвет, включаем альфу:

И тренд уже не такой явный, и по-прежнему не видно абсолютной численности.

Похожая штука про наслоение кружочков:
http://cashin.ru/blog/all/vizualizaciya-dannyh-na-yandeks-karte/

Ниже — графики по городам, но снова не показана связь между наборами данных. Что показывают, фактически: иммигрантов становится больше, а тяжких преступлений — меньше, и одно не связано с другим.

Данные разорваны больше, чем кажется. Не связаны атрибуты времени и места: преступления не обязательно совершаются сразу по прибытию и в том же месте, где зарегистрирован иммигрант. Ну и ни слова про нелегальных.

К многофакторности добавляется и то, что преступления не только совершаются, их еще и предотвращают. Это еще целая пачка процессов. В большинстве городов стали регистрировать меньше преступлений: лучше борются? Хуже регистрируют? Эти факторы не упоминаются.

Важно, какие города попали в выборку и по какому принципу эта выборка составлялась. В городах ситуация с преступностью может отличаться от пригородов. Городская полиция работает в высокой плотности, на более коротких расстояниях, с новыми техническими средствами, автоматизированным наблюдением и поиском. Такое быстрее внедряется в крупных городах. А на графике мы видим относительно мало мелких городов. Выборка вызывает вопросы.

Если все иммигранты реально оказались классными, графика этого не показывает.

One of the largest decreases in crime occured in MIAMI, where immigration increased:

График слева: «В Майами стало больше иммигрантов».
График справа: «В Майами совершается меньше тяжких преступлений».

Вообще-то, Майами одно из самых богатых мест в США. Полиция в самом богатом регионе поработала успешно? Причин может быть масса. И это ничего не говорит ни о доле участия иммигрантов в общем количестве преступлений, ни о доле нелегальных среди них.

В конце автор утверждает, что данное исследование показало, что иммиграция не приводит к увеличению преступности:

This is not the only study showing that immigration does not increase crime.

Но статья не показала связи между этими двумя явлениями.

Избыточная смертность

Небольшая выписка из статьи об «избыточной смертности» во время пандемии коронавируса,
https://ourworldindata.org/excess-mortality-covid
(Excess mortality from the Coronavirus pandemic COVID-19)

Избыточная смертность (далее пишу без кавычек) = фактически фиксируемое количество смертей — (минус) ожидаемое количество в нормальных условиях в прежние годы.

Например, чтобы узнать количество избыточных смертей в мае, берем сумму всех смертей, зарегистрированных в мае и вычитаем среднее количество смертей в мае за предыдущие 5 лет.

Простыми словами: насколько чаще или реже стали умирать, по сравнению с предыдущими годами. Независимо от причин.

Почему в период пандемии имеет смысл смотреть на показатели избыточной смертности?

— Некоторые страны считают причиной вирус только у тех, кто скончался в больнице.
— Бывает, считают причиной вирус только в том случае, если получен результат теста на вирус. Если результата нет, то не протестированные пациенты не считаются.
— Могут быть проблемы с точностью подсчета смертей, в особенности, в бедных странах.
— Пандемия может приводить к увеличению смертности в сочетании с другими причинами, вследствие ослабления систем здравоохранения, недостатка внимания пациентам с другими болезнями, нехваткой финансовых ресурсов и др.
— Пандемия также может приводить к снижению смертности по определенным статьям.

Расчет избыточной смертности независимо от причины летальных случаев помогает посмотреть под новым углом на эффекты, оказываемые пандемией.

Данные по избыточной смертности доступны лишь для небольшого ряда стран. Эти данные доступны не везде, для сбора требуется точность подсчета и сбора данных в предыдущие годы.

Далее приводятся ссылки на несколько публикаций по избыточной смертности по разным источникам.

Файненшиал Таймс (Financial Times)

https://www.ft.com/content/a26fbf7e-48f8-11ea-aeb3-955839e06441
Статическая визуализация.
Более 10 стран, Европа, США, Израиль, Южная Африка. 10 городов.

* * *

Экономист (The Economist)

https://www.economist.com/graphic-detail/2020/04/16/tracking-covid-19-excess-deaths-across-countries
Интерактивная визуализация.
Европейские страны, несколько городов.
Европейские данные разбиты по возрастам.

* * *

Евромомо (Euromomo)

https://euromomo.eu/graphs-and-maps
Интерактивная визуализация.
Европейские страны.
с разбивкой по возрастам.

* * *

Нью-Йорк Таймс (New York Times)

https://www.nytimes.com/interactive/2020/04/21/world/coronavirus-missing-deaths.html
New York Times’ work
Статическая визуализация.
Более 10 стран, Европа, США, Эквадор, некоторые города.

«Коллективный иммунитет» — смертоносная некомпетентность

Отвечал Саше Мядзелю уже месяц назад на вопрос про Швецию (скрин). Так и вышло — много смертей от ковида, в несколько раз больше, чем у соседей. На Швецию теперь все показывают пальцем, как на плохой пример. Про говорящих о «коллективном иммунитете» (Herd immunity) вообще крутят пальцем у виска. Стремление к воображаемому иммунитету ценой гарантированной смерти огромного количества людей — смертоносный идиотизм, психопатия и некомпетентность.

В Швеции люди начали сами дистанцироваться еще до официальных ограничений, люди сделали это до «приказа», были графики резкого снижения посещаемости общественных мест. Нехороший, но ожидаемый вывод: этого оказалось недостаточно. К сожалению, тактики «каждый сам за себя» недостаточно. Продолжаем душить бизнесы, а толку мало. Нужны общие действия, массовые и синхронные.

Анна Попова, глава Роспотребнадзора, говорит, «Я бы сказала, что мы остановили рост на сегодняшний день». Тут игра слов, потому что слово «рост» все поймут по-разному. У нормальных людей «рост» — это когда что-то увеличивается. «Остановили рост» — значит, роста больше нет. Но что тогда на графике?

Расшифрую: Остановили не рост, а рост роста. Каждый день число выявленных продолжает увеличиваться. Я не знаю, почему слова главы записали как «остановили рост», возможно это было выхвачено из контекста и был неправильно поставлен акцент. И рано говорить «остановили», когда цифры держатся несколько дней. Процесс мультипликативный, в одном месте держатся, в другом взрываются.

Рано радоваться, мягко говоря. Рано выходить в город.

Избегайте контактов с людьми. Старайтесь реже выходить в общественные места. Обходите других людей за несколько метров. Носите маски — не слушайте дураков, которые до сих пор говорят, что маски не помогают. Маска будет вам не помогать в 95% случаев, но в оставшихся 5% спасет жизнь и здоровье вам или кому-то другому.

«Очень плавный, медленный темп прироста»

На картинке количество стран, в которых ежедневный процент прироста инфицированных КОВИД-19 выше, чем в России, за неделю 10-16 апреля 2020, среди всех стран с 20000+ инфицированных.

Если вдруг не загрузилась картинка: 0 (ноль).

Визуализация иллюстрирует заявление главы Роспотребнадзора Анны Поповой: «Я бы хотела сказать, что РФ сохраняет очень плавный, медленный темп прироста, не уходя за 20% ежедневного прироста, и сохраняя его от 14% до 17% в день».

https://www.interfax.ru/russia/704740

Здесь на скриншоте страны, отсортированные только по общему количеству. Столбцы — дни слева направо. Последняя неделя — последние 7 столбцов.
https://www.cashin.ru/virus/confirmedgrowth/

Страны, отсортированные по индексу общего количества * процента роста:

Я, кажется, даже недооценил собственную находку: если проследить сглаженные по двум соседним дням траектории процентного роста, то у России не было конкурентов еще с 31 марта. Более двух недель, каждый день, если подвигать дату. Кажется, есть о чем подумать, даже если полагать, что существуют «стадии», которые другие страны уже «прошли»:
https://www.cashin.ru/virus/timingrate/
Графики показывают не поведение инфекции и не стадии инфекции.
Графики показывают поведение людей.

В статье еще такое:

https://www.interfax.ru/russia/704740


«Попова напомнила, что в эпидемиологии принято считать не абсолютным количеством случаев инфицированных, а относительными показателями в расчете на 100 тыс. населения.




Согласно приведенным ею данным, в РФ показатель на 100 тыс. населения составляет около 17. Это в пять раз ниже, чем в Канаде, в 10 раз ниже, чем в Германии. По словам Поповой, такое сравнение является более корректным.»

Почему я не показываю данные по пандемии из расчета на душу населения:
http://www.cashin.ru/blog/all/no-per-capita/

Ранее Ctrl + ↓