Содержание к диссертации
Введение
1. Проблема видеодетектирования транспортных средств 11
1.1. Математическая постановка задачи видеодетектирования 11
1.2. Анализ существующих методов и технологий видеодетектирования транспортных средств 13
1.2.1. Классификация методов детектирования транспортных средств 13
1.2.2. Схемы решения задачи видеодетектирования транспортных средств 15
1.2.3. Видеодетектирование объектов 16
1.2.4. Методы видеодетектирования транспортных средств 28
1.2.5. Качество работы систем видеодетектирования объектов 29
Выводы 33
Постановка задач диссертационного исследования 34
2. Методы и алгоритмы анализа изображений для решения задачи видеодетектирования транспортных средств 36
2.1. Введение 36
2.2. Метод полного покадрового поиска 37
2.3. Метод покадрового поиска с отсечением по областям интереса 38
2.4. Метод видеодетектирования с учетом результатов сопровождения на один следующий кадр 39
2.5. Метод видеодетектирования с учетом результатов сопровождения на несколько следующих кадров 41
2.6. Метод видеодетектирования для восстановления траекторий движения 42
2.7. Метод видеодетектирования с поиском на некоторых кадрах видеопотока 50
выводы 55
3. Программные средства для видеодетектирования транспортных средств 57
3.1. Требования к функциональности программной системы 57
3.2. Высокоуровневая архитектура программной системы 58
3.3. Общая схема функционирования системы 59
3.4. Описание модулей системы
3.4.1. Модуль поиска транспортных средств 59
3.4.2. Модули сопровождения и сопоставления 61
3.4.3. Модуль разметки областей интереса 62
3.4.4. Модуль разметки окаймляющих прямоугольников 63
3.4.5. Модуль формирования траекторий движения на тестовом видео 64
3.4.6. Модуль разметки процента видимости объекта 65
3.4.7. модули визуализации окаймляющих прямоугольников и траекторий движения 66
3.4.8. Модули вычисления количественных показателей качества 66
3.4.9. Средства автоматизации для сбора результатов оценивания качества видеодетектирования 67
3.4.10. Реализация разработанных методов видеодетектирования 67
3.5. Программная реализация 68
3.5.1. Технологии и программные средства 68
3.5.2. Описание основных программных модулей и библиотек 68
выводы 73
4. Применение программных средств для видеодетектирования транспортных средств 74
4.1. Введение 74
4.2. Условия проведения вычислительных экспериментов
4.2.1. Тестовые данные 75
4.2.2. Минимальный процент видимости транспортного средства определенного класса для обнаружения алгоритмом поиска 76
4.2.3. Параметры сопоставления для разработанных алгоритма восстановления траекторий и метода видеодетектирования с учетом результатов сопоставления 81
4.2.4. Тестовая инфраструктура 86
4.3. Анализ качества поиска транспортных средств 86
4.3.1. Сравниваемые методы видеодетектирования 86
4.3.2. Показатели качества поиска объектов 87
4.3.3. Сравнительный анализ качества поиска 87
4.3.4. Анализ состава ошибки поиска транспортных средств 101
4.4. Сравнение и анализ качества сопровождения транспортных средств 109
4.4.1. Тестовые траектории движения 109
4.4.2. Сравниваемые методы сопровождения 110
4.4.3. Показатели качества сопровождения одного объекта 110
4.4.4. Сравнительный анализ качества сопровождения 111
4.5. Применение разработанных методов для видео, полученного в реальных
Условиях 112
4.5.1. Прикладная задача 112
4.5.2. Выбор параметров для применения разработанных методов видеодетектирования 113
4.5.3. Анализ качества видеодетектирования и состава ошибки поиска 118
Выводы 123
Заключение 125
Список литературы 127
- Анализ существующих методов и технологий видеодетектирования транспортных средств
- Метод видеодетектирования с учетом результатов сопровождения на один следующий кадр
- Модуль поиска транспортных средств
- Анализ состава ошибки поиска транспортных средств
Анализ существующих методов и технологий видеодетектирования транспортных средств
Можно выделить два основных подхода к построению полнофункциональных систем видеодетектирования транспортных средств [21 – 23]: поиск и сопровождение областей движения с последующей идентификацией этих областей как транспортных средств того или иного класса («АВТОБУС», «АВТОМОБИЛЬ», «МОТОЦИКЛ» и т.п.); поиск и сопровождение обнаруженных транспортных единиц.
При реализации поиска и сопровождения областей движения работу системы видеодетектирования можно разбить на несколько этапов [112]: 1. Выделение областей движения на текущем кадре видео. 2. Сопровождение (трекинг) областей движения на нескольких последующих кадрах. В процессе сопровождения обеспечивается построение траектории движения для каждой области. Отметим, что в результате перекрытий каждая область может содержать группы объектов. 3. Восстановление параметров объектов: разделение объектов, принадлежащих одной области движения, классификация транспортных средств, определение длины и ши ТС – транспортное средство. Пьезоэлектрические сенсоры позволяют определить вес объекта. рины объекта и других параметров, которые можно вычислить на основании полученной последовательности областей движения и информации о положении камеры. 4. Сопровождение транспортных средств. На данном этапе выполняется построение траекторий движения транспортных средств, выделенных на предыдущем шаге, от момента их идентификации до их выхода из области обзора камеры. В настоящее время большинство известных систем видеодетектирования функционируют согласно данной схеме. Заметим, что схема, основанная на поиске и сопровождении областей движения, работает исключительно в случае неподвижной камеры и постоянного фона. В естественных условиях камера всегда находится под воздействием ветра и осадков, поэтому неподвижность практически недостижима. В таких ситуациях обычно применяется программная стабилизация видео [19, 20].
Схема работы систем видеодетектирования посредством обнаружения и сопровождения объектов не зависит от типа детектируемых объектов (человек, автомобиль, трамвай и др.) и состоит из следующей последовательности действий [21]: 1. Извлечение кадра из потока видеоданных. 2. Предобработка полученного статического изображения – кадра. 3. Поиск положения объекта на изображении и оценка степени достоверности нахождения объекта в данной области. В дополнение на данном этапе в некоторых системах выполняется внутриклассовое деление – классификация объектов в рамках одного рассматриваемого класса. 4. Сопровождение обнаруженных объектов. 5. Анализ результатов поиска и сопровождения (например, оценка направления движения объекта на основании траектории, подсчет числа объектов и т.п.). Функциональность блока анализа результатов в основном зависит от конкретной задачи, которая поставлена перед разработчиками системы видеодетектирования.
При реализации приведенной схемы ядром системы являются модули поиска и сопровождения объектов. Схема является вычислительно более трудоемкой по сравнению с предыдущей, но в процессе ее применения не накладываются ограничения на видеоданные, т.е. возможно использование данных, поступающих с камер, установленных на автомобилях, поскольку приведенный подход обеспечивает независимость процедуры поиска от структуры фона. Далее остановимся на некоторых наиболее распространенных методах поиска и сопровождения.
Методы поиска объектов. Множество методов для решения задачи поиска объектов на изображениях можно разделить на три основные группы:
1. Методы, которые для описания объекта используют признаки, наиболее характерные для объектов [24 – 39]. В качестве признаков могут быть выбраны точечные особенности объекта, либо признаки, построенные для области изображения, содержащей только объект.
2. Методы поиска объектов, соответствующих шаблону [40, 41] – некоторому описанию объектов. 3. Методы определения движения объектов [41 – 47] – выделение движущихся объектов на основании нескольких изображений или кадров видео одной и той же сцены.
Методы, основанные на извлечении признаков. Один из возможных подходов к решению задачи поиска объектов состоит в том, чтобы использовать алгоритмы машинного обучения [24] для построения моделей классов объектов (человек, мотоцикл, самолет, автомобиль, автобус и т.д.) и алгоритмы вывода для определения положения объектов на изображении.
Методы данной группы описывают объект с использованием векторов признаков. Вектора вычисляются на основании анализа функции яркости пикселей. В простейшем случае объект представляется набором интенсивностей пикселей - вектором, количество компонент которого совпадает с разрешением объекта. На практике для описания широко применяется гистограмма ориентированных градиентов (Histogram of Oriented Gradients, HOGs) и ее различные модификации [27]. Также при построении может быть использована контекстная информация (context based) [28, 29], а в некоторых случаях - данные о геометрии и взаимном расположении частей объекта (part-based) [30, 32]. В результате объект описывается набором векторов признаков, а в процессе обучения формируется модель, содержащая наиболее типичные вектора признаков.
Алгоритм вывода также включает два этапа (рис. 1.3):
Построение формального описания объекта - извлечение признаков объекта из тестового изображения. На данном этапе используется такой же алгоритм извлечения, что и при построении модели. При извлечении признаков возникает две основные проблемы:
На изображении может быть много объектов одного класса, а требуется найти всех представителей. Поэтому необходимо просматривать все части изображения. Типичное решение - проход «бегущим» окном (sliding window) от левого верхнего до правого нижнего угла. При этом размер окна определяется размером изображений объекта в тренировочной выборке.
Объекты на изображении могут иметь разный масштаб. Самое распространенное решение - масштабирование изображения, как следствие, построение пирамиды изображений. Поиск объектов в этом случае выполняется на каждом изображении. 2. Определение положения объектов на изображении. Входными данными алгоритма поиска положения являются формальное описание объекта и модель класса объектов. На основании этой информации выполняется сравнение формального описания с моделью. Значение меры сходства можно рассматривать как степень достоверности того, что объект принадлежит классу, который определяется заданной моделью.
Качество работы методов данной группы в основном зависит от того, какие выбраны признаки, т.е. насколько хорошо признаки разделяют классы объектов. В настоящее время можно найти специальные методы, основанные на извлечении признаков, например, для поиска лиц [34 - 36], транспортных средств [37] и пешеходов [27 - 39].
Методы поиска по шаблону. Поиск объектов на основании некоторого шаблона предполагает, что имеется изображение объекта - шаблон - и тестовое изображение, которое сопоставляется с этим шаблоном (рис. 1.4). В простейшем случае в качестве шаблона может выступать матрица интенсивностей цветов, наиболее характерных для объекта. Более сложные методы рассматриваемой группы в качестве шаблона используют наборы векторов признаков (дескрипторы), геометрическое представление объекта [40] или вероятностные модели объектов, которые содержат информацию о распределениях интенсивностей пикселей [25]. Сопоставление (matching) [41] с шаблоном подразумевает сравнение описаний тестового и шаблонного изображений по некоторой выбранной метрике [16] -как правило, выбирается Евклидово расстояние, норма L1, взвешенная свертка квадратичных ошибок, либо корреляция [41]. Отметим, что методы поиска по заданному шаблону эффективно работают при поиске одиночных объектов, т.к. при возникновении перекрытий исчезают некоторые признаки в описании.
Метод видеодетектирования с учетом результатов сопровождения на один следующий кадр
В рамках диссертационного исследования разработаны метод видеодетектирования транспортных средств с учетом результатов сопровождения (2.4, 2.5), метод видеодетектирования для восстановления траекторий движения (2.6), который работает в режиме постобработки на построенном наборе положений, а также метод видеодетектирования, обеспечивающий поиск объектов на некоторых кадрах видео, восстановление положений на промежуточных кадрах и одновременное построение траекторий движения (2.7). Таким образом, программная система должна содержать набор приложений, которые реализуют указанные методы. Для оценки качества разработанных методов необходимо подготовить набор тестовых видео с дорожным движением. С целью автоматизации процедуры выбора параметров алгоритмов, а также для проведения массовых экспериментов и последующего сравнительного анализа качества видеодетектирования необходимым является также разработка вспомогательных утилит.
Реализация методов видеодетектирования предполагает разработку набора приложений, которые для входного видео при заданных параметрах метода формируют множества обнаруженных положений транспортных средств и траекторий их движения. Также необходимо предусмотреть возможность визуализации текущих результатов (положений и траекторий). Количество вводимых параметров алгоритмов следует максимально уменьшить для снижения сложности процедуры работы с системой. Поэтому необходимо разработать средства автоматизации подбора параметров и установить наиболее приемлемые значения с точки зрения задачи видеодетектирования транспортных средств для последующей апробации разработанных методов на представительном наборе тестовых видео.
Подготовка тестовых данных включает в себя разметку положений транспортных средств на каждом кадре видеопотока с учетом их класса, а также разметку траекторий их движения. Для этого необходимо разработать формат хранения разметки, реализовать набор программных приложений и утилит, автоматизирующих процесс разметки исследуемого видео, выполнить разметку нескольких тестовых видео для дальнейшего анализа качества алгоритмов.
С целью апробации результатов в системе необходимо предусмотреть наличие инструментов, позволяющих на основании полученных и размеченных данных о положениях и траекториях объектов оценивать качество поиска и сопровождения. Для обеспечения визуального контроля качества следует подготовить набор приложений для отображения положений и траекторий на видео.
Далее на основании требований, предъявляемых к системе, предлагается высокоуровневое описание архитектуры (3.2), разработанное на базе компонентного подхода. В 3.3 приводится общая схема работы системы. В 3.4 содержится описание назначения отдельных модулей и алгоритмов их функционирования. В конце главы (3.5) дается описание программной реализации, включающее перечень использованных технологий и программных средств, внутреннюю организацию программных библиотек и приложений с указанием логических зависимостей.
Архитектура программной системы разработана на базе компонентного подхода, согласно которому архитектура приложения представляется в виде набора повторно используемых функциональных или логических компонент. При этом компоненты определяют интерфейсы взаимодействия друг с другом [128, 129]. Для представления архитектуры использована модель отношения компонент (relationships model) [129], которая показывает базовые подсистемы и определяет зависимости между ними. Компонентный подход широко используется в процессе эволюционной разработки программного обеспечения [129], т.к. позволяет относительно просто модифицировать имеющийся или добавлять новый функционал.
Модули поиска, сопровождения и сопоставления (рис. 3.1) являются центральными в разработанной программной системе. На базе функционала указанных модулей строится реализация методов видеодетектирования, в частности, рассмотренных и предложенных в рамках диссертационного исследования: метода полного покадрового поиска (2.2), метода полного покадрового поиска с отсечением по областям интереса (2.3), метода видеодетектирования с учетом результатов сопровождения (на один и несколько кадров, 2.4 и 2.5), метода видеодетектирования для восстановления траекторий движения (2.6) , метода видеодетектирования, обеспечивающего поиск на некоторых кадрах видеопотока, восстановление положений на промежуточных кадрах и одновременное построение траекторий (2.7). В процессе поиска объектов в каждом методе присутствует возможность введения удаления окаймляющих прямоугольников, выходящих из областей интереса. Разметка областей интереса осуществляется с использованием соответствующего модуля системы в предположении, что видео получено с неподвижной камеры (допустимы незначительные смещения в результате изменения погодных условия, например, дождя или ветра). Результаты видеодетектирования можно визуализировать в режиме просмотра видео с помощью модулей визуализации окаймляющих прямоугольников и траекторий движения объектов.
Анализ качества работы системы видеодетектирования требует введения модулей подготовки тестовых данных – модуля разметки окаймляющих прямоугольников для транспортных средств разных классов, модуля формирования траекторий их движения и модуля разметки процента видимости объекта на основании разметки положений и траекторий. Тестовое видео с размеченными прямоугольниками также может быть визуализировано. Запуск реализации какого-либо метода видеодетектирования позволит получить набор положений и траекторий, которые в процессе анализа качества необходимо сравнить с разметкой посредством некоторых количественных показателей. Модули апробации результатов качества видеодетектирования предоставляют соответствующий функционал, а вспомогательные утилиты позволяют автоматизировать процесс сбора и систематизации показателей.
Модуль поиска транспортных средств
Далее представлена полная таблица, содержащая результаты вычислительных экспериментов с перечисленными ранее методами (таблица 4.12). Условия и параметры запуска программных реализаций описаны в последнем столбце таблицы. Проанализируем последовательно полученные результаты.
Полный покадровый поиск и поиск с отсечением по областям интереса. Начальные оценки показателей качества. Первый эксперимент подразумевает запуск метода полного покадрового поиска на базе алгоритма Latent SVM. При этом простейший вариант, позволяющий получить начальные оценки качества, состоит в том, чтобы использовать модель необходимого класса, обученную на множестве изображений базы PASCAL VOC 2007 (таблица 4.8, таблица 4.12, эксперимент 1_1). Несложно видеть, что по всем показателям результаты поиска на видео track_09_0-2000 отличаются в худшую сторону. Объясняется этот факт небольшими размерами объектов, вследствие чего алгоритм не может выделить отдельные части, а также значительным преобладанием фонового пространства, что вызывает множество ложных срабатываний. На остальных видео более высокие показатели точности ( до 0.684) и числа истинных срабатываний ( до 0.745) сопровождаются значительным количеством ложных срабатываний. В среднем по трем тестовым видео на 10 кадров будет получено до 32 ложных объектов (( ) ), таблица 4.8, столбец 6. Поскольку камера неподвижна для всех тестовых видео, то естественный шаг к уменьшению количества ложных сраба тываний – применение метода покадрового поиска с отсечением по областям интереса (эксперимент 2_1_1). Из полученных результатов можно видеть, что для track_10_0-2000 такое действие позволило снизить количество ложных срабатываний в среднем, приходя щееся на кадр, от 5.898 до 1.792, т.е. на 10 кадрах вместо 59 ложных объектов будет встречено 18. Для следующих тестовых видео отсечение по областям интереса оказало менее существенное воздействие на результирующие показатели качества. Значение рас сматриваемого показателя снизилось до 26 (( ) ), а показатели средней точности и числа истинных срабатываний изменились незна чительно. Таким образом, применение операции отсечения по областям интереса имеет смысл только в случае, когда фон занимает существенную площадь на двумерном изоб ражении, и незначительная часть объекта заходит на фон.
Полный покадровый поиск. Построение модели, наилучшим образом описывающей свойства класса транспортных средств. Следующий шаг - обучение модели на изображениях объектов, которые реально могут встречаться на тестовых видео. В процессе исследования было обучено несколько моделей на различных наборах данных:
Все объекты класса «АВТОМОБИЛЬ» (CAR), размеченные на видео track_10_5000-7000. Обучались однокомпонентная и двухкомпонентная модели, эксперименты 12 и 1_3 соответственно (таблица 4.9, таблица 4.12). Каждая компонента описывает ракурс объекта.
Только полностью видимые объекты, размеченные на видео trackl 05000-7000. Обучалась однокомпонентная модель (таблица 4.9, таблица 4.12, эксперимент 1_4), т.к. данные по существу содержат объекты одного ракурса, соответствующего виду «три четверти».
Все полностью видимые объекты класса и перекрытые другими объектами из track_10_5000-7000, -4000 изображений без объектов тренируемого класса из PASCAL VOC 2007. Обучались однокомпонентная и двухкомпонентная модели, эксперименты 1_5 и 16 соответственно (таблица 4.9, таблица 4.12).
На данных trackl 05000-7000 и PASCAL VOC 2007 в соотношении 50% на 50%, при этом в базе 1650 изображений объектов и 4250 изображений без объектов тренируемого класса. Также обучались однокомпонентная и двухкомпонентная модели, эксперименты 1_7 и 1_8 - 114 соответственно (таблица 4.9, таблица 4.12).
Из полученных значений показателей качества не сложно видеть, что обучение на всех размеченных объектах видео trackl 05000-7000 приводит к ухудшению средней точности детектирования и показателя числа истинных срабатываний (экспери менты 1_2 и 1_3). Объясняется это тем, что вследствие большого количества частично видимых объектов в разметке модель получается зашумленной и не описывает достаточно хорошо свойства класса. Более низкие показатели для двухкомпонентной модели (эксперимент 1_3) обусловлены еще и отсутствием вариативности ракурса изображений объектов и фоновых изображений в наборе тренировочных данных.
Обучение двухкомпонентной модели (эксперимент 1_8) на тренировочных данных из 1_7 позволило улучшить результаты по сравнению с 1_1. Средняя точность предсказа ния увеличилась с 0.674 до 0.695 на видео track_10_7000-8000 и с 0.591 до 0.607 на track_10_9000-11000. Данный факт объясняется тем, что наличие второй компоненты обеспечило возможность обнаруживать частично видимые автомобили (передняя часть, включающая бампер и решетку радиатора с фарами) в момент входа в кадр. При этом ко личество ложных срабатываний, приходящееся в среднем на кадр, , в худ шем случае составляет 0.169 (track_10_9000-11000) вместо 3.567 (track_10_7000-8000). Последующие эксперименты 1_9 – 1_14 направлены на подбор наиболее оптималь ного параметра алгоритма Latent SVM. Из таблицы видно, что средняя точность предска зания при изменении указанного параметра в пределах от 0.25 до 0.28 практически не изменяется (таблица 4.9, столбец 4). Показатель числа истинных срабатываний меня ется на единицу во втором или в третьем знаке после запятой (таблица 4.9, столбец 5). Аналогично показатель числа ложных срабатываний колеблется на одну-две едини цы во втором или третьем знаке. Выход значения параметра алгоритма поиска за пределы указанного отрезка приводит к заметному снижению показателей качества (экспери мент 1_8, параметр равен 0.024). Отметим, что почти для всех тестовых видео, содержа щих неподвижные объекты (таблица 4.9, эксперименты 1_9 и 1_11, строки 2, 3, 4 и 6), по лучены предельно возможные наилучшие показатели качества ( , , ). Исключением является видео track_10_5000-7000_1044x2000, на котором присутствует неподвижный автомобиль, видимый менее чем на 50%. Процент перекрытия размеченного и обнаруженного окаймляющего прямоугольника для данного объекта находится в пределах от 40 до 50%, поэтому срабатывание алгоритма поиска считается ложным. Такой результат является ожидаемым вследствие того, что минимальный процент видимости для срабатывания алгоритма поиска согласно п. 4.2.2 составляет 50%. Поскольку объект наблюдается на каждом кадре, то и число ложных срабатываний алгоритма поиска, в среднем приходящееся на кадр, равно 1. Таким образом, за счет обучения модели удалось снизить количество ложных срабатываний на кадр в ( 3 3 3) раз по сравнению с исходной моделью (эксперименты 1_1 и 1_9). При этом очевидно, что применение отсечения по областям интереса имеет смысл только при наличии большого пространства, занятого фоном.
Анализ состава ошибки поиска транспортных средств
Параметры алгоритма поиска Latent SVM. Параметры алгоритма поиска транспортных средств являются одними из наиболее важных, т.к. он обеспечивают корректность обнаружения объектов. Необходимо выбрать значения двух параметров:
Параметр модели класса «АВТОМОБИЛЬ», определяющий минимальное значение достоверности присутствия объекта. Следует изменить, поскольку при обучении модели использовались данные, отличные от тех, на которых выполняется поиск.
Параметр алгоритма поиска Latent SVM. Поясним смысл данного параметра. По существу алгоритм поиска для одного и того же объекта может построить несколько окаймляющих прямоугольников с разными значениями оценочной функции. Чтобы убрать подобные дублирования используется «жадный» алгоритм (non-maximum suppression algorithm) [30], который вычисляет коэффициент перекрытия окаймляющих прямоугольников и удаляет положения с меньшим значением оценочной функции и коэффициентом перекрытия, превышающим значение указанного параметра.
Первый параметр можно подобрать, анализируя минимальный процент видимости, при котором срабатывает алгоритм. Объекты на рассматриваемом видео мельче по сравнению с тестовым видео, поэтому вполне ожидаемо, что минимальный процент видимости превысит 50%, полученные в п. 4.2.2. По аналогии выберем изображение транспортного средства из предлагаемого видео (рис. 4.6). Построим таблицу срабатываний алгоритма поиска при различных вариантах перекрытия и проанализируем минимальный процент видимости и значения достоверности. Из полученных результатов (таблица 4.30) несложно видеть, что алгоритм перестает срабатывать на всех типах перекрытий при 70% видимости. При этом 3 типа перекрытия, на которых объект не обнаруживаются, относятся к числу часто встречающихся (3 из 7, что составляет -43%). Поэтому для данного видео минимальный процент видимости составляет 80%. Согласно значениям достоверности, указанным в строке, соответствующей 20% перекрытия, можно сделать вывод, что минимальное значение достоверности (параметр модели класса) можно повысить до -0.245.
Для подбора второго параметра достаточно запустить алгоритм поиска Latent SVM с использованием модели с модифицированным значением достоверности на одном из кадров видео и выбрать значение, при котором получается наилучший результат19. Для рассматриваемого видео параметр алгоритма Latent SVM был выбран равным 0.02. Параметры сопоставления. Определим значения относительного числа коррект ных соответствий. Для этого выберем пару изображений представителя класса «АВТО МОБИЛЬ» (рис. 4.6) на последовательных кадрах видео и выполним сопоставление при разных процентах перекрытия по аналогии с п. 4.2.3. Очевидно, что меньший размер объ ектов рассматриваемого видео приведет к уменьшению числу обнаруживаемых ключевых точек. Заметим, что минимальный процент видимости для обнаружения составляет 80%. При таком проценте видимости обнаруживается в среднем 19 корректных соответствий (таблица 4.31). Несложно видеть, что на этапе разбиения набора положений на траектории необходимо выбирать пороговое значение относительного числа корректных соответ ствий (таблица 4.31, минимальное относительное количество корректных соот ветствий при проценте видимости 80% – 73.91%). На этапе «склеивания» траекторий при выборе аналогичного порога необходимо уменьшить значение. Выберем значение 0.5, соответствующее минимальному относительному числу корректных соответствий при проценте перекрытия 40% – 52.17%, т.к. при большем проценте алгоритм поиска срабаты вает менее чем на половине часто встречающихся типах перекрытия.
Данную процедуру можно выполнить с помощью реализованного в системе инструмента разметки видео, который позволяет изменять значение параметра алгоритма Latent SVM с использованием визуальной компоненты и наблюдать результат работы алгоритма при выбранном значении параметра.
Максимальное изменение направления движения. На видео наблюдается заметное изменение ракурса автомобилей - от момента входа в кадр до момента выхода разница между направлениями может доходить до -30о, рис. 4.7. Худший случай с точки зрения метода видеодетектирования, когда объект входит в кадр, перекрывается другими объектами и снова становится видимым при выходе из кадра. При сопоставлении видимых положений с учетом направления движения необходимо потребовать, чтобы угол между направления не превышал -30о. Поэтому в качестве параметра максимального изменения направления движения выбирается указанное значение.
Полный покадровый поиск. Первый эксперимент состоит в запуске метода полно го покадрового поиска с использованием исходной модели класса «АВТОМОБИЛЬ» (экс перимент 1_1) при условии, что изменяется только параметр алгоритма поиска La tent SVM. Во втором эксперименте задействуется модель с модифицированным мини мальным значением достоверности (эксперимент 1_2). Если сравнить показатели числа ложных срабатываний и числа ложных срабатываний на объект с худ шими показателями на тестовых данных (таблица 4.12, эксперимент 1_9, track_10_9000-11000), то несложно видеть, что первый показатель меньше в 2.64 (0.211 против 0.08) и 3.2 (0.211 против 0.066) раза, а второй – в 3.2 (0.192 к 0.060) и 4 (0.192 к 0.048) соответственно для экспериментов 1_1 и 1_2. Данный результат обусловлен тем, что рассматриваемое видео содержит значительно большее количество транспортных средств класса «АВТОМОБИЛЬ». Как следствие растет и количество истинных срабатываний алгоритма поиска.