Содержание к диссертации
Введение
Глава I Основы информационного обеспечения статистического исследования дорожно-транспортных происшествий в г.Липецке 8
1.1 Анализ ситуации в сфере обеспечения безопасности движения в России и мире 8
1.2 Характеристика Липецка, как крупнейшего промышленного центра ЦЧР 18
1.3 Важнейшие факторы, определяющие уровень безопасности дорожного движения 23
1.4 Дорожно-транспортные происшествия как объект статистического исследования 36
1.5 Система показателей ДТП и источники статистической информации для ее формирования 41
Глава II Анализ дорожно-транспортных происшествий в г.Липецке . 50
2.1 Описание.базы данных 50
2.2 Анализ ДТП 52
2.2.1 Анализ данных об участниках дорожно-транспортных происшествий 56
2.2.2 Анализ дорожных условий в момент совершения ДТП 71
2.2.3 Анализ данных о транспортных средствах, участвовавших в ДТП 77
2.2.4 Локализация ДТП 82
2.3 Анализ влияния метеоусловий на ДТП 84
Глава III Теоретические основы статистического анализа ДТП 87
3.1 Кластерный анализ в классификации случаев ДТП 87
3.2 Дискриминантный анализ в идентификации ДТП 101
3.3 Теоретические аспекты использования искусственных нейронных сетей в статистическом анализе ДТП 106
3.4 Теоретические основы регрессионного анализа данных о ДТП 121
Глава IV Реализация научных результатов исследования 128
4.1 Прогнозирование количества ДТП в г.Липецке 128
4.2 Классификация ДТП с использованием ИНС, методами кластерного и дискриминантного анализа 145
4.3 Разработка модели вероятности возникновения ДТП методами регрессионного анализа 152
4.4 Определение экономической эффективности 157
Основные результаты и выводы 163
Литература 165
- Характеристика Липецка, как крупнейшего промышленного центра ЦЧР
- Анализ данных об участниках дорожно-транспортных происшествий
- Дискриминантный анализ в идентификации ДТП
- Классификация ДТП с использованием ИНС, методами кластерного и дискриминантного анализа
Введение к работе
Актуальность темы исследования. Развитие экономики Российской Федерации характеризуется стремительным ростом автомобильного парка. По итогам 2008 года автомобильный рынок РФ стал крупнейшим в Европе. Значительное увеличение интенсивности дорожного движения привело к увеличению нагрузки на дорожно-транспортную инфраструктуру, которая с каждым годом все хуже справляется со своими функциями. Как следствие - увеличивается количество дорожно-транспортных происшествий (ДТП), возрастает число заторов на улично-дорожной сети (УДС) городов.
Дорожно-транспортные происшествия наносят экономике России значительный ущерб, составляющий в последние годы примерно 3 процента валового внутреннего продукта страны. Причем львиная доля ущерба приходится на затраты, связанные с гибелью или ранением людей в результате ДТП. Решение проблемы обеспечения безопасности дорожного движения (БДД) относится сегодня к наиболее приоритетным задачам развития страны. В то же время в силу объективных причин улично-дорожная сеть не может быть как количественно, так и качественно модернизирована в столь сжатые сроки.
Наиболее действенным подходом для решения сложившейся ситуации является максимально эффективное расходование ограниченных материальных ресурсов для повышения уровня безопасности дорожного движения. Предложенные в диссертационной работе научные элементы новизны исследования актуальны и целенаправлены на решение научно-практической задачи, имеющей важное народнохозяйственное значение.
Цель работы – повышение уровня безопасности дорожного движения на основе использования разработанных теоретико-методических положений и математических моделей.
Для достижения цели поставлены и решены следующие задачи:
проведен анализ существующих методик, определяющих связь между факторами системы водитель-автомобиль-дорога-среда (ВАДС) и количеством ДТП;
создана база данных по ДТП, произошедших с 2000 по 2009 г.г. в г.Липецке;
проведен всесторонний анализ структуры и динамики развития ДТП за указанный период;
разработана методика прогнозирования количества случаев ДТП по месяцам года;
разработана методика классификации и последующей идентификации случаев ДТП;
разработана методика построения зависимости вероятности возникновения ДТП от факторов системы ВАДС.
Объект исследования – процессы функционирования движения транспортных средств на улично-дорожной сети города.
Теоретической и методологической основой исследования послужили научные труды: 1) по проблемам повышения безопасности дорожного движения, снижения количества ДТП и уменьшения негативного воздействия автомобильного транспорта на окружающую среду, 2) по экономике, эконометрике, а так же натурные исследования, методы многомерного статистического анализа.
Научная новизна исследования заключается в разработке следующих теоретико-методических положений, методов и моделей, которые выносятся на защиту, применяемых для обоснования и выбора наиболее эффективных мероприятий повышения уровня БДД:
методика комплексного статистического анализа количества ДТП;
методика прогнозирования количества ДТП с учетом фактора сезонности;
научно-методические подходы и методика классификации совокупности ДТП;
теоретические подходы и методика идентификации ДТП на основе нейросетевых и дискриминантного методов анализа;
научно-методические разработки и математическая модель определения вероятности возникновения ДТП на основе методов многомерного статистического анализа.
Практическая значимость. Разработанные в диссертации теоретико-методические и практические положения, модели и методики составляют научную основу построения систем совершенствования механизмов управления БДД и могут быть использованы Государственной инспекцией безопасности дорожного движения на всех этапах разработки и реализации мероприятий по организации дорожного движения, выборе наиболее эффективных из них, оценке экономического эффекта от принятых мер, а также организациями, занимающимися проектированием улично-дорожной сети городов. Предлагаемые методики, алгоритмы и программы позволяют разработать эффективные управленческие решения и пути повышения уровня системной безопасности транспортных потоков.
Реализация результатов работы. Полученные теоретические, методические и прикладные исследования использовались: при выполнении международного проекта «Решение экологических проблем на транспорте» совместно с Итальянским университетом г. Анконы, Липецкой областной комиссией по обеспечению безопасности дорожного движения, отделом эксплуатации и безопасности дорожного движения “Управления дорог и транспорта” Липецкой области; Управлением Государственной инспекции БДД УВД по Липецкой области; в учебном процессе на кафедре управления автотранспортом Липецкого ГТУ при изучении дисциплин «Безопасность дорожного движения», «Моделирование дорожного движения» и в дипломном проектировании.
Личный вклад автора заключается в формировании идеи и цели диссертационной работы, в постановке задач и их решении, в разработке методологических и теоретических положений для всех элементов научной новизны исследования, новых методов, моделей и подходов к оценке эффективности инновационного потенциала на всех этапах выполнения диссертации – от научного поиска до реализации их на практике.
Апробация работы. Основные положения и результаты исследований доложены, обсуждены и одобрены на: Международной научной конференции «Проблемы эксплуатации и обслуживания транспортно-технологических машин» (Тюмень, 2010 г.); научной конференции студентов и аспирантов ЛГТУ (2010 г.) и заседаниях кафедры управления автотранспортом Липецкого ГТУ (2007-20010 гг.).
Публикации. По материалам диссертации опубликовано 6 печатных работ.
Структура и объем. Диссертация состоит из введения, четырех глав, основных результатов и выводов, списка литературы и приложений на 30 стр., содержит 173 стр. текста, 45 табл., 34 рис. Библиографический список включает 137 наименований.
Характеристика Липецка, как крупнейшего промышленного центра ЦЧР
Липецкая область расположена в центральной части европейской территории России на пересечении важнейших транспортных магистралей страны, в 400 км на юг от Москвы. Она занимает 2-ое место в Центрально Черноземном районе по промышленному потенциалу после Воронежской.
Ведущими отраслями промышленности области являются черная металлургия (57,3% в общем объеме продукции), пищевая промышленность (14,6%) и машиностроение (14,1%). На территории области, в непосредственной близости от областного центра, создана особая экономическая зона федерального уровня промышленно производственного типа "Липецк". Так же созданы особые экономические зоны регионального уровня.
Липецкая область располагает развитой транспортной инфраструктурой. По насыщенности автомобильных дорог область входит в первую десятку регионов России. Современные автомобильные магистрали связали Липецк со всеми сопредельными областными центрами, а также с трассами федерального значения: Москва - Ростов, Москва -Волгоград.
Липецк - крупный индустриальный, научный и культурный центр. По величине и промышленному потенциалу город занимает второе место в ЦЧР. Здесь сосредоточен основной производственный потенциал Липецкой области - до 70% промышленной продукции производится в областном центре.
Город с населением 506 тыс. человек так же является крупным промышленный центром Российской Федерации, что обуславливает значительную интенсивность осуществления как внутригородских, так и
внешних транспортных связей. Наибольшая концентрация внешних транспортных связей г.Липецка приходится на районы Липецкой области. Связи Липецка с населенными пунктами области осуществляются по следующим основным территориальным автодорогам, которые вливаются в магистральную сеть города (см. табл. 8).
Липецк - важная железнодорожная станция на линии Орел-Грязи-Волгоград, узел автомобильных дорог. Все эти факторы способствуют повышенной нагрузке на улично-дорожную сеть (УДС) города.
Липецк, как и абсолютное большинство городов России, не был готов к столь быстрому увеличению парка автотранспорта. Это создает большие проблемы с размещением, техническим обслуживанием и эксплуатацией транспортных средств. К тому же недостаточно развитая дорожная сеть в Липецке и ее невысокое качество приводят к многочисленным дорожно-транспортным происшествиям (ДТП).
В то же время рыночные процессы - структурные изменения в экономике, разукрупнение предприятий, снижение партионности грузов, повышение требований к скорости доставки обуславливают повышение удельного веса автоперевозок в общем объеме перевозок. Происходит устойчивый рост численности автопарка, главным образом за счет увеличения числа личных легковых автомобилей. С 1995 года по 2000 год количество собственных легковых автомобилей в Липецкой области возросло с 77,6 до 132,3 шт. на 1000 человек населения , то есть на 71%. Начиная с 2000 года темпы автомобилизации немного снизились и сейчас составляют примерно 7% в год. Таким образом, на период осени 2008 года в Липецке насчитывалось 224 легковых автомобиля на 1000 человек населения.
Как известно, число ДТП в большой степени зависит от интенсивности движения. Наблюдающийся рост уровня автомобилизации в нашей стране создает принципиально новую ситуацию в градостроительном проектировании. Хотя маршрутный пассажирский транспорт сохраняет ведущие позиции в обеспечении пассажирских перевозок, доля легковых автомобилей в составе транспортных потоков достигает 70-90 %. Многочисленные заторы, возникающие все чаще на УДС Липецка, свидетельствуют о том, что дорожная сеть города недостаточно приспособлена для обслуживания транспортного потока. Это прямое следствие того, что в генеральный план развития города был неправильно заложен расчетный уровень автомобилизации и не был всесторонне проработан вопрос повышения подвижности населения. Соответственно, развитие УДС должно уже сейчас стать одним из важнейших вопросов градостроительной политики.
Объектом исследования является деятельность внутригородского наземного транспорта Липецка: легкового и грузового автотранспорта; общественного транспорта (автобус, троллейбус, трамвай, такси, маршрутные такси); мото - и велотранспорта.
Дорожно-транспортное происшествие (ДТП) - это событие, которое возникло в процессе движения по дороге транспортного средства и с его участием, при котором погибли или ранены люди, повреждены транспортные средства, здания, сооружения, грузы или причинен иной материальный ущерб [84, 98, 112].
Это определение позволяет четко ограничить ДТП от других чрезвычайных ситуаций, которые ежедневно возникают в Липецке.
Анализ данных об участниках дорожно-транспортных происшествий
Участники ДТП делятся на четыре категории: водитель, пассажир, пешеход и иной участник. Данные о количестве участников каждой категории за весь период наблюдения представлены в табл. 11. Количество иных участников ДТП составляет менее 1% от общего числа участников и в таблице не приводится. Диаграмма распределения участников ДТП по категориям представлена на рис.3. В Карточке учета ДТП категория «пассажир» разделена на несколько подкатегорий. Связано это с тем, что в Карточке требуется указывать место нахождения пассажира в салоне автомобиля в момент совершения ДТП в соответствии со схемой, расположенной на карточке (приложение 1). При анализе Карточек оказалось, что для подавляющего большинства пассажиров место не определено. Но по статистике ДТП, совершенных по всей России, наиболее опасным является место в салоне автомобиля справа от водителя (при положении руля слева) [13,26]. В табл.12 представлены данные о степени тяжести последствий ДТП среди участников ДТП различных категорий, на рис.4 дана сравнительная характеристика. Результаты анализа говорят о том, что в ДТП чаще всего страдают пешеходы: последствия ДТП среди пешеходов ведут в 90% случаев к ранениям и 6,5% - к летальному исходу. Пассажиры по тяжести последствий после ДТП следуют за пешеходами. В 75% случаев ДТП пассажиры получают ранения и в 3,6% - последствия ведут к летальному исходу. Последствия ДТП среди водителей, приводят к летальному исходу в 1% случаев и в 21 % - к ранениям.
В табл.13 представлены данные о степени тяжести последствий ДТП среди различных возрастных групп участников (в таблице не указаны участники с неизвестной тяжестью последствий ДТП), на рис.5 — сравнительная характеристика. Наибольшее число погибших в ДТП составили люди в возрасте от 20 до 29 лет (59 человек). Самое высокое число смертельных травм было у людей 60 лет и старше (5,6%), а самое низкое - у детей и подростков в возрасте от 10 до 19 лет (1%). Возраст человека можно разбить на четыре интервала по степени травмируемости от последствий ДТП: 1) наиболее травмоопасный возраст: менее 10 и старше 70 лет; 2) травмоопасный возраст: от 10 до 19 и от 60 до 69 лет; 3) возраст средней травмоопасности: от 20 до 29 и от 50 до 59 лет; 4) возраст относительно малой травмоопасности от 30 до 49 лет. Проведем анализ различных участников ДТП по социальному составу (табл. 14). На рис.6 представлена диаграмма разделения участников ДТП по социальной характеристике. Условным обозначением «Иной» чаще всего обозначаются дети, не посещающие учебные заведения. В колонке «Не указано» представлены данные о водителях, скрывшихся с места совершения ДТП и впоследствии не найденных, а также о лицах чье социальное положение установить не удалось. Как видно из полученных данных, реже всего в ДТП попадают военнослужащие, предприниматели и сотрудники ОВД, чаще всего — рабочие и безработные. Большое количество участников ДТП из последних двух слоев населения объясняется тем, что они имеют на сегодняшний день наибольшее число представителей. Рассмотрим теперь, какая доля участников, из наиболее массово представленных слоев населения, принадлежит к каждой из трех основных категорий. Результаты анализа ДТП представлены в табл.15, графическое изображение — на рис.7. а Пешеход Пассажир Ш Водитель Социальная характеристика Рисунок 7 Доля каждой категории участников ДТП в некоторых социальных слоях населения (2000-2007г.г.) Анализ ДТП показывает, что наибольшее количество водителей, принимавших участие в ДТП - это служащие и учащиеся. Как и следовало ожидать наибольшее количество пострадавших пешеходов среди пенсионеров и учащихся. Эти данные следует учитывать при организации дорожного движения и пропаганде безопасности дорожного движения в Липецке. Рассмотрим характер возникновения ДТП в зависимости от времени нахождения за рулем водителя.
Дискриминантный анализ в идентификации ДТП
После проведения кластерного анализа и определения количества классов ДТП, необходимо соотнести любое случившееся ДТП к одному из уже известных классов ДТП, то есть идентифицировать его. Дискриминантный анализ представляет собой такое средство идентификации. Дискриминантный анализ - это раздел многомерного статистического анализа, содержанием которого является разработка методов решения и идентификации объектов (ДТП) по определенному набору признаков. Этот метод идентификации дает возможность получить одну или несколько функций, обеспечивающих возможность отнесения данного объекта (ДТП) к одной из некоторых групп. Эти функции называются классифицирующими и зависят от значений переменных таким образом, что появляется возможность отнести каждое происшествие к одному из уже известных классов [46]. Пусть имеется множество случаев ДТП Х\,Х2, ...,Хп. Каждое происшествие характеризуется несколькими признаками (переменными) Хі={Хіі,Хі2,..,хіт}, і = 1,п. Для ДТП такими признаками являются природные условия (температура, осадки, туман, гололед и т.п.), состояние дорожного покрытия, состояние транспортных средств (срок службы; положение руля, тип транспортного средства), состояние водителя транспортного средства (пол, возраст, водительский стаж и т.д.). При использовании дискриминантного анализа предполагается, что все множество ДТП при помощи методики классификации уже разбито на несколько классов.
Признаки, которые используются для того, чтобы отличать один класс от другого, называют дискриминантными переменными. Введем следующие обозначения: к - число классов; т - число дискриминантных переменных; пк - число ДТП в классе; п - общее число ДТП по всем классам; При проведении дискриминантного анализа должны соблюдаться следующие условия [89]: 1) число классов: к 2; 2) число ДТП в каждом классе: п 2; 3) число дискриминантных переменных: 0 т (п-2); 4) дискриминантные переменные измеряются по интервальной шкале; 5) дискриминантные переменные линейно независимы; 6) ковариационные матрицы классов примерно равны. Классифицирующая функция представляет собой линейную комбинацию для каждого класса, которая максимизирует различия между классами, но минимизирует дисперсию внутри классов. Она имеет следующий вид где hk— значение функции для класса к; bkj - коэффициенты, которые необходимо определить, j = 0, т. Дорожно-транспортное происшествие относится к классу с наибольшим значением h . Коэффициенты для классифицирующих функций Ъ]д определяются по формуле где ац - элемент матрицы, обратной к внутригрупповой матрице попарных произведений. Постоянный член находится по формуле Выбор функции расстояния между ДТП для классификации является наиболее очевидным способом введения меры сходства для происшествий. В тех случаях, когда переменные коррелированны, измерены в разных единицах и имеют различные стандартные отклонения, целесообразно применять выборочное расстояние Махаланобиса где (X/G]) - квадрат расстояния от данного ДТП до центра класса к; ХІ - і-й случай ДТП с т признаками. Вероятность того, что ДТП является членом класса к, равна: где пк - количество происшествий, вошедших в k-ый класс. Сумма этих вероятностей, часто называемых апостериорными вероятностями, по всем классам равна единице.
Классификация ДТП с использованием ИНС, методами кластерного и дискриминантного анализа
Сформулируем задачу кластерного анализа. В нашем распоряжении имеется 6312 случаев ДТП. Необходимо эффективно разбить эти объекты на ряд групп, таким образом, что: - внутри группы объекты максимально схожи между собой; - группы максимально между собой различаются. Для классификации дорожно-транспортных происшествий методом кластерного анализа воспользуемся данными, взятыми из карточек учета ДТП Управления Государственной инспекции безопасности дорожного движения УВД Липецкой области. В качестве переменных были использованы графы из разделов карточки. Проведем классификацию дорожно-транспортных происшествий иерархическими агломеративными методами. При этом мерой расстояния или метрикой будем использовать евклидово расстояние, а алгоритмом классификации будет выступать метод Уорда, являющийся наиболее предпочтительным, т.к. он приводит к образованию классов равных размеров с минимальной внутриклассовой вариацией. Результаты проведения классификации ДТП методом кластерного анализа, а именно дендрограмма, приведена на рис.33. На дендрограмме дорожно-транспортных происшествий четко выделяются три класса. Значит, образом все ДТП возможно поделить на три однородные группы. Для того, чтобы осуществить такое разделение воспользуемся итеративной процедурой, а именно методом k-средних.
Сущность метода заключается в том, что процесс классификации начинается с задания начальных условий. В данном случае это количество образуемых кластеров и центры этих кластеров. Далее, каждое многомерное наблюдение совокупности относится к тому кластеру, центр которого ближе всех к этому наблюдению. Затем выполняется проверка на устойчивость классификации. Если классификация устойчива, процесс останавливается. В противном случае, происходит очередная процедура разбиения объектов по кластерам. В результате разбиения получили 5 групп ДТП, характеризующиеся присущими только им признаками (приложение 10). Для разработки инструмента автоматической кластеризации случаев дорожно транспортных происшествии введем в массив данных новую переменную «Кластер». В строках данной переменной содержатся номера кластеров, к которым в итоге были отнесены многомерные объекты — случаи ДТП. В первую группу вошли 1615 ДТП, во вторую - 1293 ДТП, в третью - 1900 ДТП, в четвертую - 1344 ДТП, в пятую - 1155 случаев ДТП. Для того, чтобы иметь возможность относить другие ДТП по заданным параметрам к одному из классов, необходимо создать инструмент -классификатор. Решим данную задачу классификации с применением методов искусственных нейронных сетей и дискриминантного анализа. Выбор данных методов классификации объясняется тем, что данные по своей природе крайне неоднородны. При помощи дискриминантного анализа были получены функции классификации для всех выделенных классов дорожно-транспортных происшествий методом последовательного исключения переменных. На основе алгоритма идентификации с использованием метода линейной дискриминации Фишера, методов последовательного включения (исключения) переменных в модель для каждого класса ДТП были построены классифицирующие функции. Для метода последовательного исключения переменных из модели классифицирующие функции имеют следующий вид