Обзор систем управления светофорами на Lenta.ru: http://lenta.ru/articles/2013/12/04/traffic/
Статья чуть менее чем полностью состоит из матана, но основной смысл в том, что системы регулирования развивались последовательно от ручного управления каждым сигналом каждого светофора и далее через:
-
автоматизацию фаз цикла светофора,
-
учёт времени суток для изменения циклов,
-
учёт ситуации на соседних перекрёстках,
-
учёт ситуации в районе целиком,
-
адаптация светофоров к ситуации в городе,
и вершиной научных достижений сейчас является управление ситуацией (влияние на неё) в городе в целом каждым отдельным светофором в нём.
У нас, как, наверное, никто не удивится, только начало этого пути. Т. е. мы сейчас начинаем переходить к этапу управления циклами светофора в зависимости от времени суток и дней недели и немножко согласованности светофоров соседних перекрёстков.
Вот как это должно выглядеть:
Непрерывный цикл
Одной из первых систем, реагирующих на транспортную обстановку, стала запущенная в 1973 году в Великобритании SCOOT (Split, Cycle and Offset Optimization Technique — техника оптимизации фаз, цикла и смещения). Она же относится и к числу самых распространенных: ее используют более 200 городов по всему миру (.pdf). В названии системы зашифрованы три основных параметра ее алгоритма:
Основные параметры SCOOT |
Cycle |
Продолжительность полного цикла (переключения по порядку всех фаз) светофора |
Split |
Cоотношение времени, выделяемого на каждую фазу (как доля от продолжительности цикла) |
Offset |
Cмещение начала цикла конкретного светофора от заданного для всей системы момента времени (позволяет согласовать циклы разных перекрестков между собой) |
Каждый светофор в системе SCOOT имеет «свои» датчики присутствия автомобилей (один или несколько — для разных полос движения и на разном удалении), установленные «выше по течению». Как правило, сеть улиц делится на звенья — от перекрестка до перекрестка. Начинается каждое звено датчиком, а заканчивается — реагирующим на его показания светофором.
Для принятия решения об изменении главного параметра — длины цикла — компьютер с программой SCOOT вычисляет так называемую степень насыщения всех фаз светофора. Этот показатель представлен как процент используемого «зеленого» сигнала: алгоритм оценивает, сколько еще машин успели бы проехать перекресток, «втиснувшись» в промежутки между автомобилями, которые фиксирует датчик. Задача SCOOT в том, чтобы для самой «загруженной» фазы насыщенность составляла не более 90 процентов.
Помимо этого, один раз в течение цикла программа рассчитывает коэффициент эффективности по сумме вынужденных остановок и времени ожидания автомобилей. В зависимости от значения коэффициента SCOOT принимает решение о том, чтобы удлинить или укоротить на 4 секунды какую-то фазу. Перед началом новой фазы дополнительно согласуется смещение относительно других светофоров — также в пределах четырех секунд.
Далее можно пропустить несколько этапов и написать к чему пришли транспортные учёные просвещённых городов:
Игра в «машинки»
Самый оригинальный подход к регулированию движения в городах предложили в 2011 году в канадском Торонто — MARLIN-ATSC (Multiagent Reinforcement Learning for Integrated Network of Adaptive Traffic Signal Controllers — обучение с подкреплением агентов интегрированной сети адаптивного управления светофорами). Авторы разработки решили уйти от централизованной системы, заменив ее светофорами-агентами — устройствами, которые наделены искусственным интеллектом и общаются между собой для выбора схемы движения.
В программе, которую загружают в каждый светофор, описан Марковский процесс принятия решений, а точнее, его частный случай — Q-обучение. Этот принцип машинного обучения предполагает общение агента (светофора) с системой (дорожного движения). Каждое действие светофора каким-то образом влияет на дорожную ситуацию, об изменении которой можно судить по информации, получаемой с датчиков. Получив эту информацию (так называемое вознаграждение), светофор-агент вычисляет функцию своей полезности Q и в дальнейшем опирается на приобретенный опыт.
Для координации агентов между собой использована теория игр, а именно — стохастическая игра. Во время игры агенты перебирают варианты своих решений (оставить или сменить фазу светофора) и получают вознаграждения (данные о простое автомобилей), основанные на общих решениях. Каждое решение светофора-агента привязано к набору показателей текущего состояния: какая включена фаза, как давно включена эта фаза, какая пробка скопилась по каждому из направлений перекрестка.
«Игроки» должны выработать такие модели поведения, которые приведут к наилучшему общему результату — так называемому равновесию Нэша. Полученные таблицы «полезности» для пар «состояние-решение» и становятся той политикой, которой в дальнейшем будет руководствоваться каждый светофор. «Обучаются» светофоры, естественно, на компьютерной модели, а не в реальных дорожных условиях.
Ну а у нас светофоры большинством водителей пока воспринимаются как досадная помеха, из-за которой все пробки в городе.