Содержание к диссертации
Введение
Глава 1. Анализ системы управления процессом экспертизы безопасности продукции 10
1.1. Характеристика существующего подхода к управлению экспертизой безопасности продукции 10
1.2. Постановка задачи информационного управления процессом экспертизы безопасности продукции 19
1.3. Заключение по главе 1 25
Глава 2. Математическое моделирование описания нормативных требований безопасности продукции в задачах управления процессом экспертизы 27
2.1. Применение методов информационного управления процессом экспертизы безопасности продукции 27
2.2. Анализ методов интерпретации и формализации текстов 31
2.3. Разработка модели нормативного документа 40
2.4. Создание математической модели описания нормативных требований безопасности 41
2.5. Заключение по главе 2 46
Глава 3. Алгоритм формирования объединенной иерархической классификации объектов стандартизации 48
3.1. Постановка задачи объединения классификаций 48
3.2. Разработка алгоритма формирования объединенной иерархической классификации объектов стандартизации 53
3.2.1. Обзор существующих методов построения классификации... 57
3.2.2. Применение метода построения дерева принятия решений 64
3.2.3. Проверка адекватности алгоритма формирования классификаций 66
3.3. Моделирование устойчивости иерархических классификаций 72
3.3.1. Механизм «погрешности измерения» 76
3.3.2. Механизм «четырех вероятностей» 78
3.3.3. Механизм нечеткого вывода 82
3.4. Оценка эффективности применения разработанного комплекса моделей и алгоритмов 82
3.4.1. Оценка эффективности систем управления 82
3.4.2. Оценка сокращения времени проведения экспертизы 85
3.4.3. Оценка эффекта от уменьшения рисков 1-го и 2-го рода 86
3.5. Заключение по главе 3 88
Глава 4. Программная реализация разработанных методов и алгоритмов 91
4.1. Этапы разработки и структура программной реализации 92
4.2. Программная реализация объединенной классификации 95
4.3. Программная реализация пользовательской части информационной системы 106
4.4. Заключение по главе 4 109
Заключение 111
Список используемых сокращений и условных обозначений 113
Список литературы 114
- Постановка задачи информационного управления процессом экспертизы безопасности продукции
- Анализ методов интерпретации и формализации текстов
- Разработка алгоритма формирования объединенной иерархической классификации объектов стандартизации
- Программная реализация пользовательской части информационной системы
Введение к работе
Актуальность темы исследования. В соответствии с Федеральным законом «О техническом регулировании» от 27.12.2002 № 184 – ФЗ, экспертиза безопасности продукции является одним из основных инструментов, которые регулируют ее появление на отечественном рынке. Результаты проведения экспертизы во многом зависят от квалификации специалистов, принимающих решения на ее различных этапах. При этом, как показывает практика, нормативно-правовая документация, содержащая требования безопасности продукции, часто не согласована. Это затрудняет весьма трудоемкое в условии отсутствия автоматизации формирование совокупности нормативных требований безопасности, подлежащей проверке на соответствие и непосредственно зависящей от идентификации исследуемой продукции: отождествления ее конкретного вида с определенной группой объектов стандартизации, требования безопасности к которым заданы в нормативных документах. Допущенные на этих этапах ошибки приводят к несогласованности результатов экспертизы у разных специалистов.
С вступлением в силу 1 июля 2012 г. Технического регламента Таможенного союза, утвержденного 23 сентября 2011 г. № 799, формы подтверждения соответствия на определенные группы продукции изменились. Корректировка нормативной базы инициировала создание новых классификационных группировок объектов стандартизации, что при условии существования нескольких частных классификаций, причем нередко не согласованных, на идентичные объекты стандартизации затрудняет правильность идентификации исследуемой продукции.
Также следует отметить, что практика широкого применения независимой экспертизы для России находится в стадии становления (около 20 лет), поэтому научный подход, базирующийся на применении методов теории управления процессами экспертизы, не развит в достаточной мере.
Для снижения влияния человеческого фактора и повышения эффективности, заключающегося в обоснованности и достоверности результатов проведения экспертизы безопасности продукции, актуальным является применение современных методов управления ее процессами. Таким образом, актуально изменение структуры информированности специалистов с использованием математической модели описания нормативных требований безопасности, основанной на внедрении объединенной классификации объектов стандартизации с иерархической структурой, позволяющей однозначно идентифицировать исследуемую продукцию и обеспечивающей соблюдение единства требований безопасности при формировании их совокупности.
Степень разработанности темы. Проблемы моделирования системы нормативных требований частично учтены в таких проектах, как «Минерва», «Relatus», «Dyana», «Core Language Engine» и др. Решение некоторых информационных задач в области нормативных требований отражены в следующих системах «Стандарт Плюс», «Технорматив», «Консультант Плюс», «Гарант», «КросС-тандарт» и др. Однако эти проекты слишком сложны для их массового применения и ориентированы на достаточно узкие предметные области, отличные от экспертизы безопасности продукции. Математические методы построения классификаций и оценки её качества, развитые в работах А.И. Орлова, Б.Г. Мир-кина, С.А. Айвазяна, Richard A. Berk, Alan J. Izenman и пр., не учитывают специфику в области стандартизации и проведения экспертизы безопасности продукции. Вопросам информационного управления посвящен ряд работ Новикова Д.А.
Объект исследования - процесс экспертизы безопасности однородной продукции, т.е. продукции одного наименования, близкой по ингредиентному составу и соответствующей одним требованиям.
Предмет исследования - методы, модели и алгоритмы принятия решений и обработки нормативной документации, используемой при экспертизе безопасности однородной продукции.
Целью диссертационной работы является повышение эффективности проведения экспертизы безопасности однородной продукции на основе совершенствования информационно-аналитического обеспечения ее процессов.
Для достижения указанной цели решаются следующие задачи:
-
Предложить систему управления экспертизой безопасности однородной продукции с иерархической структурой, позволяющую обеспечить однозначность и достоверность получения ее результатов.
-
Разработать математическую модель для описания нормативных требований безопасности к группе однородной продукции с иерархической структурой для обеспечения однозначной интерпретации этих требований и возможности автоматизировать формирование совокупности нормативных требований безопасности к конкретному виду продукции.
-
Разработать алгоритм формирования объединенной иерархической классификации объектов стандартизации на основе существующих частных для обеспечения сопоставимости требований безопасности, содержащихся в нескольких нормативных документах, к группе однородной продукции с иерархической структурой.
-
Разработать специальное математическое и программное обеспечение системы автоматизации идентификации продукции, поступающей на экспертизу, и формирования соответствующей ей совокупности нормативных требований безопасности.
-
Апробировать результаты работы при проведении экспертизы безопасности однородной продукции с иерархической структурой.
Методы исследований: теория организационного управления и искусственного интеллекта, системный анализ, математическое моделирование, проектирование информационных систем, теория выбора и принятия решений.
Научная новизна:
предложена система управления процессом экспертизы безопасности однородной продукции с иерархической структурой, отличающаяся изменением структуры информированности специалистов на основе использования математической модели описания нормативных требований безопасности, что позволяет повысить эффективность проведения экспертизы;
разработана математическая модель описания нормативных требований безопасности к группе однородной продукции с иерархической структурой, отличающаяся систематизацией требований, содержащихся в нескольких нормативных документах, что позволяет автоматизировать ряд этапов экспертизы;
впервые предложен алгоритм формирования объединенной иерархической классификации объектов стандартизации из частных классификаций, отличающийся использованием модифицированного метода построения дерева принятия решений, что позволяет учесть информацию, содержащуюся в различных нормативных документах.
Работа соответствует паспорту научной специальности: 05.13.10 «Управление в социальных и экономических системах (в технической отрасли)»: пункт 2 «Разработка методов формализации и постановка задач управления в социальных и экономических системах»; пункт 4 «Разработка методов и алгоритмов решения задач управления и принятия решений в социальных и экономических системах»; пункт 6 «Разработка и совершенствование методов получения и обработки информации для задач управления социальными и экономическими системами».
Практическая значимость работы. Создано специальное математическое и программное обеспечение системы автоматизации идентификации продукции, относящейся к группе «Изделия косметические гигиенические моющие» Парфюмер-но-косметической продукции, формирующее соответствующую ей совокупность нормативных требований безопасности. Разработанная информационная система «Эксперт КП» позволяет обеспечить надежность и обоснованность принятия решений специалистами при проведении экспертизы безопасности однородной продукции.
Основные положения и результаты, выносимые на защиту:
-
Система управления процессом экспертизы безопасности однородной продукции с иерархической структурой, обеспечивающая снижение влияния человеческого фактора при ее проведении.
-
Математическая модель описания нормативных требований безопасности к группе однородной продукции с иерархической структурой, позволяющая автоматизировать процесс принятия решения при идентификации исследуемого продукта в условиях его экспертизы с последующим выводом совокупности нормативных требований безопасности.
-
Алгоритм формирования объединенной иерархической классификации объектов стандартизации, систематизирующей требования, содержащиеся в нескольких нормативных документах, и обеспечивающей единство интерпретации этих требований.
Степень достоверности включенных в исследование научных положений, теоретических выводов и практических рекомендаций подтверждается результатами проведенного вычислительного эксперимента и проверкой разработанной информационной системы «Эксперт КП» при внедрении в практику ООО «Центр независимой экспертизы» и испытательный центр «Энтест» г. Энгельс.
Апробация научных результатов. Основные положения докладывались и обсуждались на XII Международной научно-практической конференции «Косметические средства и сырье: безопасность и эффективность» (Москва, 2007), V Всероссийской научно-технической конференции «Искусственный интеллект в XXI веке. Решения в условиях неопределенности» (Пенза, 2007), Международных научных конференциях: «Математические методы в технике и технологиях – ММТТ-21» (Саратов, 2008), «Компьютерные науки и информационные технологии» (Саратов, 2009), «Математические методы в технике и технологиях»: ММТТ-26 (Иркутск, 2013), ММТТ-27 (Тамбов, 2014).
Публикации: по теме диссертации опубликовано 17 печатных работ, в т.ч. 4 – в изданиях, рекомендованных ВАК РФ, получены свидетельства о государственной регистрации программы для ЭВМ и программного обеспечения в Отраслевом Фонде алгоритмов и программ Госкоорцентра РФ.
Личный вклад автора. Предложена схема системы информационного управления процессом экспертизы безопасности однородной продукции с иерархической структурой на основе математической модели описания нормативных требований безопасности [17]. Предложен алгоритм объединения частных иерархических классификаций, соответствующих группе однородной продукции [4, 14, 15]. Разработан программный комплекс для построения объединенной иерархической классификации и анализа ее устойчивости [6] и структура информационной системы для автоматизации ряда этапов проведения экспертизы безопасности продукции [5].
Структура и объем работы. Диссертационная работа состоит из введения, 4 глав, заключения, приложений и списка использованной литературы. Работа изложена на 143 страницах, содержит 23 таблицы, 54 рисунка. Список литературы включает 122 наименования.
Постановка задачи информационного управления процессом экспертизы безопасности продукции
Схема декларирования соответствия с участием третьей стороны устанавливается в техническом регламенте в случае, если отсутствие третьей стороны приводит к недостижению целей подтверждения соответствия.
При декларировании соответствия заявитель (товаропроизводитель) на основании собственных доказательств самостоятельно формирует доказательственные материалы в целях подтверждения соответствия продукции требованиям технического регламента. Таким образом, товаропроизводитель сам заполняет декларацию соответствия (в отсутствии определенной формы бланка) и лишь регистрирует ее в аккредитованном центре сертификации. В данном случае подпись эксперта по сертификации, как независимой стороны, удостоверяющая полноту и достоверность совокупности требований безопасности на характеристики продукции, прошедшие экспертизу, в отличие от оформления добровольной и обязательной сертификации, отсутствует11.
С вступлением в силу 1 июля 2012 г. Технического регламента Таможенного союза (ТС) [95]12 на некоторые группы продукции, например, парфюмерно-косметическую продукцию в потребительской таре, формы подтверждения соответствия ужесточаются (рисунок 1.2), в том числе, накладываются ограничения на субъекты, осуществляющие подтверждение (таблица 1.2). Настоящий технический регламент ТС устанавливает требования к продукции, а также на связанные с ней процессы производства, в целях защиты жизни и здоровья человека, имущества, охраны окружающей среды, а также предупреждения действий, вводящих в заблуждение потребителей относительно ее назначения и безопасности [95]. Кроме того, в техническом регламенте установлен перечень продукции, подлежащей государственной регистрации.
На основании бланков документов всех форм подтверждения соответствия. Утвержден Решением Комиссии Таможенного союза от 23 сентября 2011 г. № 799. Формы подтверждения соответствия
Формаподтверждениясоответствия Субъект, осуществляющий подтверждение соответствия Субъект, формирующий доказательные материалы Декларирование Товаропроизводитель (на основании собственных доказательств) с участием аккредитованной испытательной лаборатории (центра) Товаропроизводитель Государственная регистрация Уполномоченный Стороной (товаропроизводителем) орган в области санитарно-эпидемиологического благополучия населения (т.е. регистрационный орган) Регистрационный орган Государственная регистрация выпускаемой на территории Российской Федерации продукции является более сильной процедурой подтверждения соответствия: 1) по сравнению с декларированием, экспертиза безопасности продукции осуществляется в учреждении здравоохранения с анализом представленной документации (в том числе и совокупности требований безопасности) на предмет ее соответствия требованиям законодательства; 2) производится экспертиза представленной документации (в том числе и по пункту 1) специалистами Роспотребнадзора13 на предмет ее соответствия требованиям законодательства. Таким образом, результаты проведения экспертизы безопасности продукции, особенно при оформлении декларации о соответствии, напрямую При оформлении Государственной регистрации регистрационным органом. на продукцию Роспотребнадзор является зависят от человеческого фактора, тем более что товаропроизводитель является лицом, заинтересованным в продвижении своего товара на потребительском рынке. Кроме того, риск появления потенциально опасной продукции связан с тем, что, наряду с принятием новых технических регламентов на отдельные виды однородной продукции, остаются действующими нормативные документы середины и конца XX века. Поэтому, учет совокупности требований безопасности продукции, рассредоточенных в большом количестве нормативных документов, которые реализуют разные подходы к каждому виду продукции, доминировавшие в разные периоды времени, иногда противоречащие и использующие разные объекты стандартизации (неоднозначность терминологии), в условии отсутствия автоматизации процессов подтверждения соответствия, весьма затруднителен.
В целях снижения влияния человеческого фактора на процесс проведения экспертизы безопасности продукции и для повышения эффективности получения ее результатов, которое обеспечит обоснованность и достоверность соответствия продукции предъявляемым требованиям, рассмотрим применение современных методов управления ее процессами.
Исследование: проводятся испытания и измерения отобранных (в соответствии с законодательством) образцов исследуемого продукта на предмет выявления значений характеристик, предъявленных пунктом 2. Как правило, подобного рода исследования выполняются в специальных аккредитованных испытательных лабораториях (центрах).
Оценка соответствия: сопоставляются значения характеристик, полученных после исследований (пункт 3), со значениями, предъявляемыми в нормативных документах (пункт 2). В случае выполнения требований безопасности, принимается решение о соответствии продукта, в противном случае – мотивированный отказ. 5. Оформление документации: по результатам пункта 4 выдается документ (сертификат, декларация, документ о государственной регистрации) подтверждающий соответствие или несоответствие продукта требованиям безопасности. Изобразим существующую СУ процессом экспертизы безопасности продукции (рисунок 1.3) более подробно (рисунок 1.4).
Так как при существующем регламенте организации экспертизы (рисунок 1.5) каждому специалисту, руководствуясь собственным опытом и практическими наработками, приходится самостоятельно сначала выбирать нормативные документы, относящиеся к исследуемой группе однородной продукции, а затем интерпретировать требования безопасности, содержащиеся в них, то наиболее опасными с точки зрения искажения результатов экспертизы являются первые два этапа. Допущенная в этот момент ошибка приводит к несогласованности результатов экспертизы у разных специалистов. Выделим три основные причины искажений:
Анализ методов интерпретации и формализации текстов
Данная глава состоит из 4 разделов, где подробно описываются возможность и непосредственно алгоритм формирования единой классификации объектов стандартизации из существующих частных классификаций разных нормативных документов, распространяющихся на однородную группу продукции. В разделе 3.1 описана постановка задачи объединения классификаций, учитывающая существующие типовые ситуации соотношений частных иерархических классификаций. Раздел 3.2 посвящен описанию алгоритма объединения частных иерархических классификаций объектов стандартизации с учетом их особенностей. В разделе 3.3 рассматривается вопрос об имитационном моделировании устойчивости построенных классификаций, необходимом для выбора наиболее качественного с точки зрения ошибок классифицирования варианта. В заключительном разделе 3.4 приведена сравнительная оценка эффективности существующей и предложенной системы управления, включающей в свой состав разработанный комплекс моделей и алгоритмов.
Требования безопасности, предъявляемые к какому-либо объекту стандартизации, как показывает практика, рассредоточены в нескольких (иногда порядка десяти) нормативных документах, каждый из которых описывает свою иерархию объектов. Проблема формирования объединенной иерархической классификации возникает при интерпретации требований безопасности, так как от документа к документу их показатели могут включаться друг в друга, дублировать, а иногда и противоречить друг другу. Объединение частных классификаций Dq , относящихся к одной однородной группе объектов стандартизации, обеспечит единство терминологии объектов и позволит систематизировать требования безопасности Tli , рассредоточенные в нескольких документах, при их интерпретации. Факт невозможности построения объединенной классификации, свидетельствующий о противоречии требований, установленных в исследуемых документах, лишний раз подтвердит необходимость доработки соответствующей нормативной базы.
Так как объединенная классификация D будет использоваться в специализированной информационной системе, предназначенной для экспертизы безопасности однородной продукции, то возникает нетривиальная задача – создать её такой, чтобы она удовлетворяла следующим требованиям [11]: 1) единство понимания: применение классификации должно обеспечивать однозначное понимание требований безопасности продукции всеми участниками процесса разработки и использования НД; 2) универсальность, т.е. возможность классификации любого объекта из однородной группы; 3) обеспечение логического вывода: наследование требований подчиненными объектами; 4) устойчивость к появлению новых объектов: появление нового вида продукции в однородной группе по возможности должно легко идентифицироваться, не нарушая существующей классификации объектов стандартизации.
Отметим, что если можно построить несколько вариантов объединенной классификации D , учитывающих исходный набор частных классификаций Dq , то из различных вариантов необходимо выбрать наиболее качественную из них. Критерии качества классификации, используемые при решении различных задач, рассматриваются в работах [17, 54, 70, 78, 79, 93, 119]. Особенностями классификации объектов стандартизации являются [49]: - смешанный характер описания объектов (использование как количественных, так и качественных характеристик); - необходимость обеспечения полноты классификации – учет в классификации всех объектов стандартизации Oi , используемых в НД на данную группу; - иерархическая структура (дерево), обеспечивающая наследование требований безопасности Ти, упомянутых в НД; - непротиворечивость классификации, обеспечивающая однозначность формирования исчерпывающей совокупности требований безопасности к конкретным видам продукции; - естественность - максимальный учет общепринятых представлений об ОС и отношениях между ними. Учитывая эти критерии и особенности, выделим следующие аспекты качества объединенной иерархической классификации объектов стандартизации: 1) доказуемость (обоснованность) результатов классифицирования -предпочтение следует отдать классификации, в которой проще обосновать отнесение объектов к конкретному классу; 2) устойчивость классификации к ошибкам отнесения к классам - небольшие случайные ошибки определения значений классифицирующих признаков, по возможности, не должны влиять на результат классифицирования; 3) учет массовых потоков продукции, подлежащих идентификации: чем чаще происходит отнесение исследуемого продукта к данной классификационной группировке, тем проще должна быть процедура этого отнесения; 4) учет удобства использования идентифицирующих признаков: чтобы снизить общую трудоемкость идентификации объектов и влияние возникающих при этом ошибок, предпочтение следует отдавать классификациям, использующим легко определяемые признаки.
Обзор иерархических классификаций Dq(q = [1,T]), определенных на одном множестве объектов стандартизации Ог (i = [1,ri]), позволил выделить типовые ситуации соотношений классификаций [48]. Опишем их более подробно. 1. Непересекающиеся классификации - одно и то же множество объектов, расклассифицировано с использованием разных признаков, например один признак - цвет, другой - размер объекта (рисунок 3.1).
Разработка алгоритма формирования объединенной иерархической классификации объектов стандартизации
Предположим, что каждый признак Sk рассматривается как нечеткая величина, характеризующаяся своей функцией принадлежности jusk(X). Универсумом, на котором задается /usk(X), является область значений некой измеряемой величины X. Значение nsk(X1) отражает мнения экспертов (например, доля экспертов, считающих, что для данного Х\ признак Sk присущ объекту, т.е. значение признака Sk равно единице).
Фазификация исходных данных происходит путем «разыгрывания» величины X для каждого признака, входящего в нечеткие правила, при этом, статистика значений X должна соответствовать статистике реальных измерений. Классифицирующее дерево рассматривается как совокупность нечетких правил, используемых для отнесения экземпляра к одному из классов. Дефазификация проводится по одному из известных алгоритмов, например, методом центра масс. Таким образом, задача оценки устойчивости классификационного дерева интерпретируется как оценка прогностической способности системы нечеткого вывода. Отметим перспективность развития дальнейших исследований, так как такой подход позволяет учитывать ошибки классификации в их совокупности.
Таким образом, можно сделать вывод, что моделирование устойчивости иерархических классификаций подтверждает преимущества предложенного алгоритма при формировании объединенной иерархической классификации.
Об эффективности различных систем управления (подходы, факторы и критерии оценки) написано в [13-15, 58, 60, 69, 76, 88, 109]. Однако при получении сравнительной оценки нескольких вариантов СУ приходится сталкиваться с рядом трудностей, одной из которых является степень разработанности методов вычисления существующих критериев. Кроме того, отсутствуют правила и показатели предпочтительности одного варианта системы управления над другим. Чтобы сравнить два варианта системы управления процессом экспертизы безопасности продукции: существующую и предлагаемую (учитывающую внедрение разработанных моделей и алгоритмов), вместо точных количественных значений критериев эффективности используем их сравнительные качественные значения по шкале предпочтительности [13, 15]. Оформим критерии и их значения в виде таблицы 3.8 [51]. «Стоимость» понимается оценка части затрат на идентификацию продукции подлежащей экспертизе на соответствие требованиям безопасности ее применения. Так как предлагаемый комплекс моделей и алгоритмов связан непосредственно с этапом идентификации продукции, то будем считать, что стоимости других этапов проведения экспертизы в рассматриваемых системах управления одинаковы. Предлагаемый вариант включает затраты на создание формализованной системы нормативных требований безопасности к иерархическим группам однородной продукции, в то же время средняя стоимость проведения одной идентификации сокращается за счет автоматизации этого процесса в каждой организации. Учитывая это, значение критерия «Стоимость» и в первом и во втором случаях можно принять как «среднюю».
Критерием «Оперативность» можно определить ускорение всех процессов проведения экспертизы. Внедрение предлагаемого комплекса, направленного на снижение влияния человеческого фактора, позволит существенно сократить среднее время идентификации исследуемой продукции и оформления соответствующей документации. Поэтому в первом случае значение критерия «Оперативность» примем как «недостаточную», а во втором – как «достаточную».
Под критерием «Качество» будем понимать оценку снижения ошибок 1-го (отбраковка годной продукции) и 2-го рода (пропуск на рынок потенциально опасной продукции), связанных с некачественной идентификацией исследуемой продукции. Как показывают приведенные выше вычисления, при применении объединенной классификации вероятность подобных ошибок сокращается за счет как однозначности правил идентификации, так и замены самых «зашумленных» измерений более надежными. В связи с этим оценим значение параметра «Качество» в первом случае как «среднее», а во втором – как «высокое».
Критерий «Информативность» позволит оценить сопоставимость и доказуемость результатов проведения экспертизы, так как внедрение предлагаемой надстройки обеспечивает одинаковые результаты у разных специалистов. Это повышает доказуемость выводов экспертов в случае арбитражного разбирательства. Определим значение критерия «Информативность» для первого и второго случая как «ограниченную» и «полную» соответственно.
Среднее время на подготовку одной экспертизы to можно оценить по статистическим данным [16, 79, 84, 107] как отношение ресурса времени сотрудников, занятых идентификацией продукции и подготовкой ее к экспертизе, к количеству экспертиз, проведенных за это время. К сожалению, в этой характеристике нет четкого понимания, на что тратится время. Например, в простых случаях, эксперту достаточно потратить несколько минут, чтобы выбрать один из нормативных документов и выписать из него требования безопасности на исследуемую продукцию. В сложных случаях специалисту приходится проводить целое «расследование», сопоставляя плохо согласованные требования из различных НД и определяя, насколько эти требования применимы к конкретной ситуации. На это могут уйти часы, а иногда и дни рабочего времени.
К сожалению, подробной статистики затрат рабочего времени специалистов в органах экспертизы, как правило, не ведется. Предлагаемый комплекс моделей и алгоритмов как раз направлен на сокращение затрат времени на проведение экспертизы в сложных случаях.
Чтобы хотя бы «грубо» оценить порядок сокращения подобных затрат, воспользуемся соотношением Парето [53, 87, 120]: «На решение 20% задач, обычно затрачивается 80% времени». Будем считать, что 80% экспертиз – это простые задачи и ts – среднее время их решения. Остальные 20% – это сложные задачи, а td – среднее время их решения. Тогда среднее время на подготовку одной экспертизы to можно выразить как взвешенное среднее решения простых и сложных задач:
Программная реализация пользовательской части информационной системы
Проверка исходных данных осуществляется аналитиком после ручного заполнения значений таблицы признаков (рисунок 4.2) с помощью кнопки Пуск. Построение дерева принятия решений На этом шаге список допустимых комбинаций рассматривается как множество наблюдений (обучающая выборка), на котором строится дерево принятия решений. Для сравнительной оценки объединенных классификаций и последующего выбора «наилучшей» из них шаг построения выполняется несколькими способами. Реализуются различные алгоритмы и критерии. 1. Алгоритм Cart, реализующий критерий минимума неоднородности каждого узла (индекс Gini). 2. Алгоритм ID3, реализующий критерий максимального приращения информации при спуске по дереву (Gain). 3. Предложенная автором версия модификации алгоритма ID3, учитывающая неоднородность потоков (массовость) исследуемых продуктов, подлежащих экспертизе. Таким образом, первый и последующие шаги разбиения по расчетным значениям происходят автоматически после проверки исходных данных на непротиворечивость (рисунки 4.4, 4.5).
Каждая классификационная группировка изображается вершиной дерева, в описание которой входят: - ее название; - состояние (обработанная или не обработанная); - указатель на «старшую» вершину; - классификационный признак, используемый при разбиении «старшей» вершины; - значение выбранного признака для данной вершины. Кроме того, для каждой вершины программа может построить список признаков, используемых для формирования этой вершины, и дополнительный список ранее неиспользуемых признаков, значение одного из которых выбирается для дальнейшего разбиения вершины.
В программе организован стек, обеспечивающий построение дерева решений. На первом этапе в стек помещается корневая вершина, при этом каждая новая вершина помечается как не обработанная. Обработка вершины заключается в следующих действиях. Выполняется проверка: является ли выбранная вершина терминальной? Если «да» (терминальная), то вершина помечается как обработанная. Если «нет», то разбиение возможно и формируется список ранее не используемых признаков. Для каждого признака рассчитывается критерий Gain (на основании формул в разделе 3.2). Максимальное значение критерия определяет тот признак, по которому произойдет разбиение. Так образуются две подчиненные вершины, одна из которых удовлетворяет значению «Да», признак = 1, другая – «Нет», выбранный признак отсутствует. В стек помещаются новые вершины, и происходит обработка той, которая является последней. Таким образом, обрабатываются последовательно подчиненные вершины одной ветки.
Результат построения объединенной иерархической классификации Имитационное моделирование процесса классифицирования
На основании исходных данных (рисунок 4.2) для построенных объединенных иерархических классификаций моделируется процесс их сравнительной оценки.
Устойчивость полученного дерева относительно ошибок I-го и II-го рода оценивается после генерации нескольких десятков (30-50) тысяч экземпляров, подлежащих оценке по выбранным параметрам (рисунок 4.8). Для этого автоматически после обращения к кнопке «Построить комбинации» строится набор правил отнесения объектов к одному из классов (терминальной вершине) дерева (лист «Правила») и набор допустимых комбинаций признаков, идентифицирующих вершины дерева (лист «Комбинации»).
По умолчанию предполагается, что количество экземпляров, соответствующих каждой комбинации, равно частоте комбинации. Исходя из этого, рассчитывается число генерируемых экземпляров (сумма частот комбинаций). Чтобы получить устойчивый статистический результат, число экземпляров должно быть достаточно большим, однако время, необходимое для обработки большого количества экземпляров, быстро растет. Кроме того, Excel позволяет сохранить не более 65536 строк на одном листе. Поэтому пользователю предлагается самому оценить количество экземпляров. Чтобы сохранить пропорциональность массовостям, количество генерируемых экземпляров должно быть кратно первоначальному числу. В выпадающем списке «Число экземпляров» приводятся все возможные значения числа экземпляров, кратные начальному, начиная от исходного до ближайшего к максимальному числу строк в Excel. Если выбрано число комбинаций, отличное о начального, программа пересчитывает частоты комбинаций.