Для решения серьезных транспортных задач, будь то реконструкция вылетных магистралей или создание сети выделенных полос для общественного транспорта, в крупных городах используются транспортные модели этих городов и их пригородов. В правительстве Москвы при принятии управленческих решений тоже используются специальные математические модели. Я о них ничего не знаю, кроме того, что они есть. Но что мне известно наверняка, это то, что модели воспроизводящие ситуацию в Москве с высокой точностью есть в научных лабораториях и я каждый день работаю с одной из них. С помощью такой модели можно, исходя из текущих реалий, оценить будущую загрузку проектируемой дороги, результаты изменения маршрутов общественного транспорта, востребованность прокладки новых трамвайных путей или веток метрополитена.
Предела совершенству, как известно, нет, поэтому наша модель проходит непрерывные циклы улучшения, как в плане принципов математической модели, так и в плане структуры и качества исходных данных. В этой статья я хочу рассказать об исходных данных и как мы их собираем.
Начать, наверно, следует с описания, где же эта модель создается, что это такое и в чем состоят улучшения модели.
Наша лаборатория со сложным названием «Когнитивные методы анализа данных и моделирования» является подразделением Института системного анализа Российской академии наук. Одной из задач лаборатории является создание математической модели прогноза автомобильных и пассажирских потоков в транспортных сетях. Вот такая модель и была создана моим научным руководителем Швецовым В.И. и его коллегами в 1999 году и успешно использовалась в нескольких регионах нашей необъятной родины.
Что такое транспортная модель и моделирование транспортных потоков? Строго говоря, такого понятия как «транспортная модель» не существует, но, тем не менее, этот термин часто употребляется в кругах так или иначе связанных с транспортным моделированием. На деле, разные разработчики вкладывают отличающиеся понятия транспортной модели. Это как слово break в спорте – значение зависит от вида спорта.
Мы под транспортной моделью понимаем модель загрузки транспортной сети, то есть математический инструмент, предназначенный для моделирования транспортных потоков и служащая для их прогноза в транспортных сетях. Говоря транспортная сеть, мы подразумеваем улицы, дороги, линии внеуличного транспорта (метро, монорельс, трамвай), а также маршруты общественного транспорта.
Транспортная сеть Москвы и области
Тогда возникают вопросы: «отлично, вы придумали формулы и алгоритмы чтобы описать поведения участника движения, но откуда вы знаете сколько их и куда они едут?» или «Ну хорошо, вы все знаете куда кто едет, но почему вы считаете, что можете прогнозировать какая будет загрузка проектируемой дороги?» И тут начинается самое интересное.
На деле, вся математика известна с пятидесятых годов, когда различные физические методы (течение жидкости, вероятностные подходы и теория энтропии, законы притяжения масс или заряженных частиц) начали применяться для планирования развития транспортной инфраструктуры и частности для моделирования транспортных потоков. А вот с исходными данным есть сложности, и в их фактической доступности, и в их качестве, то есть надежности, достоверности и репрезентативности. Тут нужно сделать оговорку, чтобы исключить возможное непонимание в дальнейшем повествовании. Исходные данные для микромодлей и макромоделий существенно отличаются.
Исходные данные для микромоделей это частота расположения светофоров, время между переключением сигналов светофоров (точнее, важным является отношения времени разрешающего ко времени запрещающих сигналов), наличие «зеленой волны», пешеходных переходов и др.
Для описания транспортных потоков в масштабах города используются макромодели – именно такую модель разработала наша лаборатория. Макромодели сами делятся на статические, динамические, имитационные, прогнозные, оптимизационные и др. для которых важны такие параметры как:
• общее чисто мест отправления и мест прибытия,
• чисто мест отправления и прибытия в каждом условном районе
• сеть (улично-дорожная сеть, внеуличная сеть, маршруты пассажирского транспорта)
Грубо говоря, этого бы хватило для описания транспортной сети и построения на ней математической модели. Но не тут-то было. Кончено, нужны фактические данные загрузки сети, чтобы проверить адекватность модели. То есть нам должно быть известно не только, сколько людей въехало и выехало из условного района, а сколько из них передвигалось на общественном транспорте, сколько на личном автомобиле и сколько вообще по данной конкретной дороге.
Когда эти данные есть, становится важным добиться максимальной точности модели по среднему количеству участников движения в определенные промежутки времени (например, для периодов: утренний час-пик, день и вечерний час-пик) по всем видам передвижения (общественный транспорт подземный, надземный городской/пригородный и личный автомобиль). Поэтому делают почасовые замеры интенсивности движения на дорогах, то есть количество единиц транспорта в единицу времени и измеряют среднюю скорость их движения, считают входы и выходы в метро, вокзалах и остановках пригородного транспорта.
Вы наверно утром видели людей в синей форме и планшетами в руках на входе в вестибюль метро, которые не безбилетников ловят, а что-то иногда записывают в свои планшеты. Они считаю пассажиропоток. И не смотря на все меры автоматизации, такие исследования все еще проводятся. Хотя пассажиропоток в метро и в пригородных электричках – самый хорошо изученный для транспортной инфраструктуры Москвы со множеством средств автоматического измерения пассажиропотока. Суммарный поток можно получить по числу проданных билетов, данных с турникетов на входе и выходе и специальных детекторов.
Вернемся к моделированию потоков. Модель загрузки транспортной сети требует большого количества исходных данных, получение которых является основной трудностью при разработке модели.
Мы разделяем три группы исходных данных:
• Характеристики транспортной сети (количество полос и качество улиц и дорог, организация движения, маршруты и провозные способности общественного транспорта и др.)
• Размещение объектов, порождающих передвижения (места проживания, места приложения труда, культурно-бытового обслуживания и др.)
• Поведенческие факторы (подвижность населения, предпочтения при выборе способов и маршрутов передвижений и др.)
Характеристики транспортной сети и размещение объектов, порождающих передвижения выявляются по средствам изучения генерального плана Москвы (см. сайт городского портала, справа будут Книга 1, Книга 2, Книга 3 – там подробное описание транспортной сети) или путем прямых замеров (замеры, обычно, происходят тоже не поднимаясь с рабочего места, например через сервис народная карта яндекс карт)
Поведенческие факторы обычно откуда-то берутся, то есть говорят, исторически сложилось, что в среднем человек совершает столько-то поездок в день, или чувствительность по цене (грубо говоря, по времени в пути) по поездкам с такой целью такая-то. Или другой пример слабо, но связанный с поведенческими факторами – это среднее количество людей в одном автомобиле. Почему на 1000 автомобилей приходится 1300 пассажиров включая водителей никто не знает. Но, конечно, проводились исследования, и есть показатели европейских городов, но мы пытаемся время от времени пересматривать эти показатели. Это нужно делать, потому что они меняются и во времени (например, очевидно нельзя опираться на транспортные показатели советской эпохи) и относительно города/страны (высокоточные значения параметров в Германии или Голландии не могут быть применены в Москве, но могут выступать в качестве ориентиров).
Пробел в исходных данных о подвижности населения можно восполнить опросами населения о совершаемых передвижениях. В первую очередь необходимо выяснить, с какими целями люди совершают свои передвижения. Далее предполагается получить ответы на следующие вопросы:
• В какое время люди совершают поездки с определенными целями?
• Какие виды транспорта они при этом используют?
• Какова дальность и длительность таких поездок?
Сейчас наша лаборатория проводит короткий опрос граждан совершающих поездки по Москве, в котором мы просим ответить два вопроса: о целях передвижения и о количестве передвижений для каждого выхода из дома (если выходов больше двух). Кроме того мы просим указать возраст респондента чтобы определить какие возрастные группы нам удалось охватить, а какие нет. Данные по возрастной группе будут считаться «хорошими», если мы будет наблюдать устойчивую картинку распределения результатов с увеличением числа ответов этой возрастной группой. Другими словами, мы увидели какое-то распределения передвижений по целям людей в возрасте 25-35 лет, и после ответа еще 100 респондентов из этой возрастной группы распределение не изменилось, и после ответа еще 100 респондентов тоже. И так для каждой возрастной группы. Так мы хотим решить сразу два задачи: первая практическая – уточнение распределения передвижений по целям и вторая стратегическая – мы хотим понять как современные средства связи могу помочь в сборе такого рода данных. Потому что опросы, это тоже не тривиальная процедура получения данных.
После того как мы убедимся в правдоподобности полученных результатов мы запустим очередной опрос уже с большим количеством вопросов и позволяющий тоньше настроить нашу модель. А почему, спросите вы, так важно знать цели, с которыми люди совершают свои передвижения?
Потому в зависимости от цели у людей различаются стратегии их достижения. Самый простой пример, это то, как вы выбираете где купить хлеб, скорее всего вы не изменяете своего маршрута и покупаете его по пути домой. Когда же ваша цель поехать на работу – если вы уже работаете, то скорее всего (если вы не курьер и т.п.) все ясно куда ехать, но если вы ищете работу, то, наверняка, время в пути будет для вас не определяющим фактором. Тем не менее из двух похожих предложений, у одного из которых явное преимущество по расположению, вы выберите его. То есть с магазином, можно сказать, полная свобода выбора, с местом работы временная дальность отходит на второй план. Чтобы ярче проиллюстрировать наличие зависимости готовности провести время в дороге от цели, с которой нужно ехать, приведу третий пример: это вылет в другой города из аэропорта. В такой ситуации навряд ли у вас вообще есть выбор, в какой аэропорт ехать. Ответ прост, откуда рейс в тот и ехать. Временная дальность тут не играет, практически, ни какой роли.
Получается, что участники движения, двигаясь с разными целям будут по-разному строить свою стратегию передвижения. Поэтому функция описывающая силу притяжения каждого объекта удовлетворяющего какую-то цель должна быть разной. То есть ее коэффициенты будут разными, а вид функции, скорее всего, будет один и тот же. Я пишу скорее всего, потому что целей очень много и возможно существуют какие-то артефакты. Если вы пройдете опрос о ваших целях передвижения в ближайший будний день, то увидите, по окончании статистику, которая показывает сколько людей из общего числа ездят или ходят привести увести ребенка, пользуются услугами гос. органов, ходят в театры, музее (любой досуг) и другие развлечения, уезжают на дачу – стратегии достижения этих целей отличаются, поэтому нам важно разобраться в какой пропорции люди ставят перед собой (или перед ними ставят) те или иные цели.
2. Распределение передвижений по целям
Кроме того, цели передвижений – это практически единственное, что нельзя померить детекторами. Можно поставить на каждой улице детекторы и ответить на вопрос: сколько единиц автотранспорта проехало по каждой полосе, с какой средней скоростью, каковы размеры эти транспортных средств, распределение этих значений по часам и еще что-нибудь, но с какой целью эти товарищи передвигаются, ответить не получится. Это еще одна причина, почему мы решили проводить опросы самостоятельно.
Итак, имея устойчивое распределение передвижений по целям, например такое (а оно наблюдается у нас последние две недели, это около 300 респондентов):
Мы расщепляем полученную статистику по возрастному составу и проверяем устойчивость распределения уже внутри данной возрастной группы. Если эти расщепленные распределения кажутся нам правдоподобными и репрезентативными (то есть, они устойчивы к росту числа респондентов и правдоподобны с учетом статистической погрешности), то опрос принимается успешным и может быть закрыт. Но закрывать мы его, скорее всего, не будем, так как вреда он него нет, а польза от расширения статистки очевидна. Для получения данных о других поведенческих факторах планируется провести дополнительные опросы и добиться их репрезентативности.
В заключении хотелось бы подытожить, что, несмотря на то, что математический аппарат расчетов транспортных моделей известен уже давно, инженеры все еще сталкиваются со сложностями создания адекватных и репрезентативных моделей. Одним из ключевых факторов этого является отсутствие достоверных исходных данных. Часть исходных данных, таких как поведенческие факторы, невозможно получить исходя из документов определяющих развитие городов, и для их нахождения используются прямые замеры или опросы участников транспортной системы. Пример, такого исследования это опрос о целях передвижения граждан по Москве.
Собственно все.
В настоящее время для оценки качества нашей модели и ее улучшения мы используем данные об объемах входа и выхода пассажиров на станциях метрополитена. Эти данные, однако, не дают полной картины пассажиропотоков в метро. Для ее воспроизведения также возможно проведение опроса: респондент в таком случае указывает начальную и конечную станции совершаемых им поездок. Для оценки фактических корреспонденций между любыми двумя станциями в таком случае потребуется очень большое число опрошенных, однако для оценки средней дальности совершаемых поездок подобный опрос вполне пригоден.
P.S. Если вы хотите принять участие в опросе:
Ссылка на опрос на сайте института
Для пользователей с мобильных устройств
Над статьей работали Мазурин Д.С. и Захаров Ю.С. аспиранты ИСА РАН.
Сбор регулярных пожертвований в Ижевск
Собрано 0 из 25 000 рублей