March 2, 2020

Нам нужна реформа данных!

Вы прекрасно знаете, что шанс умереть в аварии на дороге или улицы у нас значительно выше, чем в Финляндии, Германии, Нидерландах, Швеции и других развитых странах. И это несмотря на меньшую автомобилизацию. проблема не в климате или менталитете, проблема в инфраструктуре, законодательстве и нашем отношении к этой проблеме.

Тема безопасности движения всё чаще поднимается в СМИ и у политиков — это замечательно, мы всё ближе к принятию этой проблей. Чаще всего в качестве решения предлагают перенять шведскую программу нулевой терпимости к смертям, которая доказала свою эффективность в Европе и некоторых городах США.

Но очень часто при обсуждении забывают одну важную деталь: данные. Важно не только перестать воспринимать аварии чем-то нормальным и делать безопасные улицы с дорогами, нужно ещё найти проблему и доказать её решение — это первые шаги, для которых нужно собрать большой массив данных и проанализировать их. От качества этой работы зависит очередность и эффективность работ.

Сложно проводить правильные реформы, когда первые шаги опираются на слабую базу. Городской исследователь Лёля Жвирблис у себя в фейсбуке сегодня как раз рассказала, какие проблемы есть с данными от ГИБДД и как это мешает анализу. Далее её текст:

Неполные и плохо занесённые в базу данные ДТП не позволяют оценивать эффекты от мероприятий в рамках программ по повышению безопасности дорожного движения, в т.ч. нацпроекта «Безопасные и качественные дороги».

Нацпроект в рамках стратегии повышения безопасности, где цель — стремление к нулевой смертности от ДТП к 2030 году. На него выделено до 2024 года 4,8 трлн. рублей, работы в регионах полным ходом. При этом устойчивое снижение смертности только в Москве, где не реализуется ни одна федеральная программа по безопасности, а в некоторых регионах, где реализованы мероприятия нацпроекта, повышается смертность от ДТП. Совпадение? Т.е. что-то не так с подходом к достижению этой цели. А как проверить эффективность подхода с такими данными?

График снижения социального риска гибели в ДТП в Москве

Можно было бы провести статистический анализ ДТП и статистическую и экспертную оценку проектных решений и мер, способствующих снижению количества ДТП. Оценить каждую предлагаемую меру на эффективность и реализуемость. Но невозможно.

Что мы обычно делаем, когда сталкиваемся с анализом на данных ДТП: ставим гипотезу, ищем данные, смотрим частотки в статистике, кидаем на карту, соединяем с другими пространственными данными. С какими проблемами сразу же встречаемся:

Координаты данных ДТП сбиты

С 2016 по 2018 год от 6% до 9% ДТП были вне Москвы. Их приходится возвращать по адресу, но локацию уже не восстановить. А значит, корреляции с другими пространственными данными получать только с бубном. 100% гибддшников должно быть оснащено мобильными устройствами с gps и иметь возможность не вручную заполнять координаты.

Если в Москве эту проблему уже почти решили (благодаря ДИТ), то в России… Кстати, мобильное приложение у московских автоинспекторов не синхронизируется с их внутренней системой ведения аварий и им приходится заполнять данные об одной аварии два раза.

У ГИБДД своё понимание границ Москвы

Нет данных о микромобильности

В карточке ДТП отсутствуют типы ТС новой мобильности — велосипеды, самокаты, гироскутеры. Описание последствий аварии для такого ТС не формализовано.

Мало данных

В карточке есть такая строка, которую заполняют на месте «Объекты улично-дорожной сети на месте ДТП». Там нет двух важных типов инфраструктуры для анализа: велоинфраструктуры и нет внеуличных переходов.

Разбивка по возрастам

Помню, ещё возникали проблемы с исследованием возрастных групп пострадавших, т.е. если мы хотим сделать что-то специально для пожилых или детей, то это так просто из статистики не вытащить.

Что за транспорт

ДТП с общественным транспортом, такси и каршерингом не установить из данных ГИБДД. Для этого надо брать отдельную статистику Мосгортранса, или запрашивать номера такси, потом соединять с номерами в ДТП, в общем — невозможно. Не представляю даже, что творится в российских данных с этим. И говорить о том, что стало больше аварий с такси или каршерингом неправильно без того, чтобы знать сколько автомобилей вообще сейчас в городе (таких данных, как вы уже догадываетесь, нет).

Разные базы с больницами

Не происходит автоматической синхронизации с медицинскими учреждениями: внесение изменений в карточку ДТП о статусе пострадавшего производится в течение месяца по звонку инспектору, который ведёт ДТП, а если это январь, то в течение нескольких дней. Т.е. если ты умер 3 января после ДТП, случившегося 31 декабря, то извини — ты просто без причины умер, если ты умирал 32 дня, то тоже в статистику не попадёшь. Это связано с бюрократической процедурой ведения статистики.

Тяжесть последствий

В данных ДТП очень размытое обозначение тяжести последствий (умер/не умер, обратился в скорую/не обратился). В международных данных это очень важное разделение, т.к. KPI безопасности города — не снижение количества умерших или снижение количества пострадавших, а снижение количества умерших и пострадавших с тяжёлыми последствиями. Тоже нужна синхронизация с медучреждениями.

Проблемы с хранением открытых данных ДТП

Существующая выгрузка открытых данных ДТП позволяет сформировать массив лишь за две недели с ограниченными атрибутами.

Тайна материального ущерба

Полных данных ДТП с материальным ущербом я не видела никогда. А они указали бы на потенциально опасные участки, где аварию с пострадавшим можно было бы предотвратить.

Ужасная методика для очагов аварийности

Отдельно скажу про методику определения очагов аварийности. Она настолько неадекватна, что по ней очаги просто хаотично возникают и так же исчезают. А это, между прочим, главный KPI работы по БДД в Москве, в регионах, возможно, тоже, и завязанный на финансировании. Помимо этого, очаги надо долго согласовывать между ведомствами, тогда как тут надо действовать незамедлительно. Т.е. мероприятия по устранению очага просто хаотично размазываются по городу, т.к. нет оснований считать выбранные места реально опасными.

Специальный рейтинг аварийности улиц и перекрёстков, на основе которого были выявлены самые опасные дороги и перекрёстки Нью-Йорка

В целом нет ничего плохого, что что-то становится безопаснее, но всё же есть реально опасные участки, которые выявляются хорошей методикой и бюджетные деньги лучше было бы пустить на них, чтобы спасти больше жизней.

Мероприятия по увеличению безопасности

Как вообще они выбираются? Почему считается, что они делают город безопаснее, это же ничем не подкреплено, только экспертно. Один эксперт считает, что подземный переход безопаснее, а другой — наоборот. Вот и поговорили.

Попытаемся совместить данные ДТП с другими пространственными данными, чтобы получить ответы на вопросы: действительно ли тип перехода влияет на аварии, камеры фиксации, ширина проезжей части, заборы, кривизна, длина пешеходной фазы светофора? У городских исследователей много вопросов. Но и в других данных есть такие же проблемы — их либо нет вообще, либо неполные: например, нет данных об островках безопасности, нет данных о ширинах полос, кривые данные светофорных фаз (открытых нет), нет открытых полных данных о типах переходов и т.д.

Как можно выделять деньги на мероприятия, которые не доказано несут в себе безопасность для людей? Почему тысячи человеческих жизней и триллионы рублей доверяют людям, которые никак не могут доказать своей эффективности?

Сейчас главным приоритетом нацпроекта «Безопасные и качественные дороги» должна была бы стать институциональная реформа работы с данными ДТП, посвящённая сбору, созданию единой информационной системы между всеми участниками БДД, с возможностью анализировать данные современными способами, сбором необходимых пространственных данных для проверки основных гипотез о безопасности. И только затем можно будет выходить с конкретными проектными решениями на улицы российских городов.