Содержание к диссертации
Введение
1. Проблема разработки эффективных средств формирования фактографических данных
1.1. Фактографические системы 17
1.2. Формирование фактографических данных 20
1.3. Анализ прикладных областей
1.3.1. Системы генерирования данных (генераторы) 24
1.3.2. Криминалистика 27
1.3.3. Обучение и тестирование учащихся 36
1.3.4. Инновация и трансфер технологий
1.3.4.1. Инновационные проекты и их показатели 40
1.3.4.2. Анализ патентов и нейросетевых решений
1.4. Существующие схемы систем для формирования фактографических данных 47
1.5. Пути повышения эффективности формирования фактографических данных 54
Выводы 59
2. Сравнительный анализ эффективности информационных систем формирования фактографических данных
2.1. Обобщенная схема автоматизированной информационной системы формирования фактографических данных и алгоритм ее работы 62
2.2. Оценка эффективности информационных систем формирования фактографических данных 73
2.3. Оценка эффективности инновационных проектов
2.3.1. Множество возможных проектов 86
2.3.2. Нейросетевой критерий для оценки эффективности проектов 91
Выводы 98
3. Разработка алгоритмов формирования фактографических данных
3.1. Методы и алгоритмы для формирования фактографических данных 100
3.1.1. Методы, лежащие в основе работы генератора 100
3.1.2. Исследование эффективности алгоритмов 110
3.2. Формирование фактографических данных для тестирования 124
3.2.1. Тестирование экспертов 124
3.2.2. Динамическое тестирование учащихся 137
Выводы 143
4. Разработка автоматизированных систем формирования фактографических данных
4.1. Реализация средств формирования фактографических данных 145
4.2. Области применения и внедрения 147
4.2.1. В области криминалистики 147
4.2.1.1. Стрелянные гильзы и почерковые объекты 147
4.2.1.2. Фальшивые лекарственные средства 151
4.2.1.3. Ценные бумаги (векселя) 155
4.2.1.4. Объекты со специальными метками 159
4.2.2. В области инновации 160
4.2.2.1. Экспертиза инновационных проектов 160
4.2.2.2. Проект «Таможня и перевозки» 167
4.2.3. В области обучения 170
4.2.3.1. АИСФФД для обучения, динамический тест 170
4.2.3.2. Генератор регулярных позиномов 180
4.2.3.3. Средства для саногенетического мониторинга 187
Выводы 190
Заключение 194
Список сокращений и условных обозначений 198
Список использованных источников
- Системы генерирования данных (генераторы)
- Оценка эффективности информационных систем формирования фактографических данных
- Методы, лежащие в основе работы генератора
- Фальшивые лекарственные средства
Введение к работе
Актуальность темы
Анализ области криминалистики показывает, что годовые объемы
работ экспертной службы МВД России составляют более 2.6 млн экспертиз
и исследований1. Практика показывает, что каждая третья
криминалистическая экспертиза способствует установлению причастности
лица к преступлению. Примерно в 85% случаях работа специалистов
(экспертов) обеспечивает создание надежной доказательной базы по таким
преступлениям, как убийства, тяжкие телесные повреждения, разбои,
грабежи и кражи1. Успешные раскрытия преступлений убедительно
показывают, что эксперт является важным, а порой и ключевым звеном в
получении необходимых доказательств. От его профессионализма и умения
выделять признаки объекта (например, почерка или стреляной гильзы)
зависит качество принимаемых решений в рамках используемой им
криминалистической методики. Действительность такова, что имеют место
случаи2 как следственных, так и судебных ошибок, причиной которых
является заключение эксперта. Известно2, что субъективные причины
экспертных ошибок связаны с профессиональной некомпетентностью
эксперта (например, в неправильной оценке идентификационной
значимости признака объекта исследования). В сомнительных случаях
могут назначать повторные экспертизы. Так выполненный анализ
различных почерковедческих экспертиз из архива ЭКЦ МВД России, в том
числе и повторных экспертиз, показал3, что имеют места случаи:
неправильной оценки информативности совпадающих признаков; в
совокупность, обосновывающую вывод, включается недостаточное
количество признаков; при решении идентификационной задачи в
обоснование вывода используется малое (недостаточное) количество
признаков. Возникают различные экспертные ошибки. В связи с этим
имеется практическая потребность в оценке эффективности работы
эксперта с признаками объекта по заданной методике путем проведения его
тестирования, опираясь на один из методов тестирования, а для этого надо
иметь подходящий сформированный (сгенерированный) набор тестовых
объектов с необходимыми признаками на каждом этапе тестирования. Один
из возможных путей решения рассматриваемой проблемы в
криминалистике — разработать и применить фактографическую систему4:
автоматизированную информационную систему формирования
фактографических данных (АИСФФД) для тестирования экспертов.
1 Киташев Э., Мартынов В.В. «Каждая пылинка может стать зацепкой для раскрытия дела…»
//Человек и закон, 2010. — № 1(январь). — С. 87–94.
2 Скрипилева Н.А. О некоторых причинах совершения ошибок при производстве экспертиз и
возможностях их предотвращения //Российский Следователь, 2003. — № 3. — С. 6–8.
3 Комиссаров А.Ю., Пахомов А.В., Соколов С.В. Предупреждение экспертных ошибок при
проведении криминалистической почерковедческой экспертизы. – М.: ЭКЦ МВД России, 2001.
4 Кулик С.Д. Фактографические системы (методы построения, модели, стратегии поиска и
программное обеспечение) /Изд-во Радиотехника (деп. в ВИНИТИ 23.06.2003, №1205-В2003;
Библ. указат. № 8(378), 2003). — М., 2003. — 325 с.
Анализ области инновации показывает, что эффективные средства
обеспечения трансфера результатов научно-исследовательской
деятельности имеют большое значение для успешной реализации
экономического развития нашего государства. Ключевая и порой решающая
роль в этом принадлежит экспертам, выполняющим оценку перспективных
инновационных технических проектов (ТП) по их признакам и
последующий отбор наиболее значимых из них. На практике, как правило,
этот отбор приходится выполнять из большого числа поданных заявок, и
при этом число экспертов и время на принятие решения ограничены. В
итоге резко возрастает нагрузка на одного эксперта, что может стать
причиной экспертных ошибок. Экспериментальные исследования5
зависимости эффективности лица, принимающего решения (ЛПР), от
увеличения объема выполненной работы с учетом ограниченности времени
на принятие решения показывают, что доля правильных решений, как
правило, уменьшается (растет число ошибок). Для уменьшения нагрузки на
эксперта в диссертации предлагается переложить рутинную, менее
квалифицированную работу, на нейросетевое средство, для реализации
которого используется специальный алгоритм формирования
фактографических данных (ФФД).
В этой области, как и в криминалистике, также предлагается использовать средство — АИСФФД. Эта информационная система в автоматизированном режиме эффективно формирует необходимый набор тестовых данных для обучения специального нейросетевого алгоритма, который в дальнейшем используется для сокращения объема работы эксперта на предварительной стадии при массовом анализе ТП.
Анализ области обучения показывает, что необходимо регулярно выполнять тестирование учащихся, время на тестирование которых ограничено. Для повышения эффективности тестирования необходимо наличие большого числа тестовых заданий, и при этом необходимо динамически подстраиваться под текущего испытуемого. На практике формирование тестов требует значительных затрат. Подготовка к тестированию и обработка результатов тестирования порождает большое число фактографических данных (ФД), которые надо как-то формировать (генерировать), обрабатывать и затем хранить. Для реализации этого необходимы эффективные средства, которые в настоящее время отсутствуют или не эффективны.
В этой ситуации, как и в двух других областях, также предлагается использовать средство АИСФФД.
Таким образом, видно, что в различных прикладных областях
(криминалистике, инновации и обучении) имеется практическая
необходимость эффективного формирования ФД. В данной работе в качестве актуального средства предлагается использовать АИСФФД.
В итоге возникшая ситуация требует создания эффективных
5 Кулик С.Д. Учет человека-оператора в контуре АФИПС //Безопасность информационных технологий, 2003. — № 2. — С. 30–39.
автоматизированных средств формирования фактографических данных, разработанных учеными, опираясь на достижения специалистов в криминалистике, обучении и тестировании, теории нейронных сетей и информационных технологий, для повышения эффективности применения методик и работы различных экспертов, а также тестирования учащихся.
Все рассмотренное выше повлияло на выбор темы диссертации,
которая является новым направлением исследования проблемы
эффективного формирования фактографических данных в различных областях (криминалистике, инновации и обучении).
В диссертации автором как ориентир использованы "Основы политики РФ в области развития науки и технологий на период до 2010 г. и дальнейшую перспективу" (от 30 марта 2002 г. Пр-576). Проведенные исследования выполнялись с учетом приоритетных направлений науки, технологии и техники, согласно с "Перечнем критических технологий РФ" (от 30 марта 2002 г. Пр-578; 21 мая 2006 г. Пр-842; от 07 июля 2011 г. Пр-899) и с "Приоритетными направлениями развития науки, технологий и техники" (от 30 марта 2002 г. Пр-577; 21 мая 2006 г. Пр-843; от 07 июля 2011 г. Пр-899). Научно-практические результаты работы ориентированы на реализацию эффективного выполнения различных приказов по МВД России и, в частности, приказа6 № 511 от 29 июня 2005 г. "Вопросы организации производства судебных экспертиз в ЭКП органов внутренних дел РФ" в части практической реализации Федерального закона 73-ФЗ от 31 мая 2001 г. о государственной судебно-экспертной деятельности.
Некоторые результаты могут быть направлены для возможности
реализации на практике приказов Министерства юстиции РФ, в частности:
приказа7 №34 от 03 марта 2006г. "Об утверждении Плана основных научно-
исследовательских работ в области судебной экспертизы, выполняемых
государственными судебно-экспертными учреждениями Министерства
юстиции РФ в 2006 г." в части дальнейшего выполнения этого плана по
обеспечению эффективности судебно-почерковедческой экспертизы;
приказа8 № 241 от 22 июня 2006 г. "Об утверждении норм затрат времени
на производство экспертиз для определения норм экспертной нагрузки
государственных судебных экспертов государственных судебно-
экспертных учреждений Министерства юстиции РФ и методических рекомендаций по их применению". Выполненные научно-технические исследования, направленные на обеспечение эффективности работы
6 Приказ МВД РФ № 511 от 29.06.2005//Эксперт-криминалист, 2006. — № 4. — С. 41–47.
7 Приказ № 34 от 03 марта 2006 г. Министерства юстиции РФ "Об утверждении Плана
основных научно-исследовательских работ в области судебной экспертизы, выполняемых
государственными судебно-экспертными учреждениями Министерства юстиции Российской
Федерации в 2006 г." //Теория и практика судебной экспертизы, 2006. — № 1(1). — С. [27–32].
8 Приказ Министерства юстиции Российской Федерации от 22 июня 2006 г. № 241 "Об
утверждении норм затрат времени на производство экспертиз для определения норм
экспертной нагрузки государственных судебных экспертов государственных судебно-
экспертных учреждений Министерства юстиции Российской Федерации и методических
рекомендаций по их применению" //Эксперт-криминалист, 2008. — № 2. — С. 48–50.
эксперта с фальшивыми лекарственными средствами (ЛС), проведены в ЭКЦ МВД России в рамках выполнения НИР. Экспериментальные научные исследования, связанные с криминалистическим анализом различных объектов, выполнены совместно со специалистами ЭКЦ МВД России. В итоге, полученные в НИР научные и практические результаты обеспечивают возможность в ЭКЦ МВД России эффективной реализации мероприятий "Послания Президента РФ Федеральному Собранию РФ от 12 ноября 2009 г.", а также частично способствуют возможности реализации Программы9 МВД России "Создание единой информационно-телекоммуникационной системы органов внутренних дел" (ЕИТКС ОВД), в частности, дальнейшему ее развитию путем повышения эффективности работы экспертов (специалистов).
Разработка алгоритмов и их программная реализация для принятия решений экспертами были выполнены в области инновации (трансфера технологий — обеспечение трансфера результатов научно-исследовательской деятельности) в рамках Автономной некоммерческой организации Международный научно-технологический парк "Технопарк в Москворечье" для обеспечения эффективного конкурсного отбора проектов программы "Участник молодежного научно-инновационного конкурса" Фонда содействия развитию малых форм предприятий в научно-технической сфере в части практической реализации Федерального закона 217-ФЗ от 2 августа 2009 г. о малых предприятиях при вузах.
Анализ перспективных инновационных нейросетевых технических решений выполнен в рамках плана реализации государственного задания на выполнение научно-исследовательских работ (НИР) по теме "Разработка, программная реализация и внедрение современных технологий диагностики учащихся в рамках комплексной оценки их достижений" в соответствии с государственной программой г. Москвы на среднесрочный период (2012 -2016 гг.); развитие образования г.Москвы ?Столичное образование"): мероприятие 03Г0200 (оказание государственных услуг, выполнение работ государственными образовательными учреждениями высшего профессионального образования г. Москвы); государственное задание ГБОУ ВПО МГППУ на 2012 г.
Научно-практические результаты диссертации в области обучения нашли успешное применение при выполнении важных и актуальных работ, основанием для проведения которых послужили:
постановление Правительства г. Москвы от 5 сентября 2006 г. № 665-ПП "О грантах Москвы в сфере образования";
городская целевая программа развития образования "Столичное образование-5" на 2009 - 2011 гг.;
инициатива Президента РФ "Наша новая школа" (п. 2 "Поддержка одаренной молодежи");
9 Мартынов Е.В. О программе МВД России "Создание единой информационно-телекоммуникационной системы органов внутренних дел" //Вестник ВИПК МВД России. — М., 2008. — № 1(9). — С. 4–8.
Федеральный государственный образовательный стандарт общего образования (раздел "Начальное общее образование"), программа "Высшее профессиональное образование" № 2.
Исследование и разработка средств ФФД в виде генератора полиномов заданной сложности (математического обеспечения адаптивного тестирования и программная реализация пилотных версий адаптивных тестов для учреждений высшего и среднего профессионального образования) выполнены в рамках НИР и инновационных работ в 2010 г.
Все это подтверждает актуальность выбранной темы исследования.
Следующие ученые: Вальд А., Вентцелъ Е.С., Таха X., Галушкин А .И., Тархое Д.А., Финн В.К., Кнут Д., Кулик С.Д., Лютое В.П., Липаее В.В., Раш Г., Российская Е.Р., Рубцова ИМ., Сысоева Л.А., Хайкин С, Даффин Р., Питерсон Э., Зенер К. Лахути ДГ., Соколов А.В. и др. — представили в своих трудах результаты, которые послужили важной теоретической и методологической основой данной диссертации. Эти специалисты с разных сторон рассмотрели близкие проблемы, связанные с данной диссертацией. Несмотря на это поставленная актуальная проблема пока не нашла должного решения в трудах как отечественных, так и зарубежных ученых.
Цель исследований
Предложить научно-технические решения важной задачи — разработки методов и автоматизированных средств повышения эффективности формирования фактографических данных и их применения в прикладных областях: криминалистике, инновации и обучении.
Объект исследований
Объектом исследования является процесс формирования фактографических данных в выбранных прикладных областях и средства его автоматизации.
Предмет исследований
Предметом исследования являются методы и средства повышения эффективности формирования фактографических данных в различных областях (криминалистике, инновации и обучении).
Основные задачи
В диссертации для достижения поставленной цели решены следующие задачи:
-
анализ прикладных областей и обобщенной схемы АИСФФД, разработка критериев и выбор набора показателей для оценки эффективности формирования фактографических данных;
-
развитие существующих методов и разработка новых алгоритмов для формирования фактографических данных в АИСФФД;
-
разработка генераторов (методов, стратегий и алгоритмов), обеспечивающих в криминалистике, инновации и обучении повышение эффективности формирования фактографических данных;
-
реализация АИСФФД в виде комплекса программных средств для поддержки принятия решения в различных областях;
-
проведение сравнительного анализа эффективности разработанных алгоритмов для АИСФФД и аналогичных средств автоматизации для формирования фактографических данных.
Методы исследования
В диссертации применены методы системного анализа, теории принятия решений и последовательного анализа, элементы теории вероятностей и математической статистики, теории нейронных сетей, теории множеств и математического моделирования, а также элементы криминалистики и теории IRT (Item Response Theory).
Научная новизна результатов работы
1. Разработана обобщенная схема АИСФФД, предложен новый набор
частных показателей для принятия решения об эффективности АИСФФД.
2. Представлено обобщение в виде семи основных методов
формирования фактографических данных (ФФД) для АИСФФД.
3. Разработаны новые генераторы (методы, стратегии и алгоритмы)
формирования фактографических данных.
-
Предложена нейросетевая интерпретация для модели Г. Раша.
-
Для ФФД в криминалистике предложен модифицированный алгоритм последовательного анализа для тестирования экспертов.
Новые результаты защищены шестью различными охранными документами Федеральной службы по интеллектуальной собственности (Российского агентства по патентам и товарным знакам (РОСПАТЕНТ)), в том числе и двумя патентами на полезную модель.
Практическая и теоретическая значимость результатов работы
Для целого класса информационных систем — АИСФФД выполнена
(с помощью предложенного набора показателей и критериев) оценка
эффективности методов, стратегий, алгоритмов и средств формирования
ФД. Разработан универсальный (обобщенный) алгоритм ALG-FD
формирования ФД. Для криминалистики предложен модифицированный алгоритм последовательного анализа. На практике он требует примерно в 2 раза меньше объема выборки (и требует поэтому значительно меньше затрат на само тестирование), и его реализация при выполнении некоторых ограничений обеспечивает возможность сокращения (примерно в 2 раза) доли ошибочных решений при использовании почерковедческих методик. Для научной и практической работы ЭКЦ МВД России были получены результаты, связанные с генерированием на изображении заданной метки электрофотографического устройства. В процессе работы над диссертацией совместно со специалистами ЭКЦ МВД России выполнены две НИР и разработаны средства, позволяющие существенно повысить эффективность обучения и работу экспертов, в частности, сократить время поиска информации и принятия решения экспертами-криминалистами при проведении необходимых исследований, связанных с ЛС. На практике для криминалистики это позволяет обеспечить решение задачи эффективной
борьбы с преступностью в различных сферах, где используются результаты экспертизы, криминалистических объектов.
Алгоритм ALG-S генератора GSD позволяет реализовать элементы методики формирования медико-педагогических рекомендаций и сократить время высококвалифицированных специалистов на экспертную оценку результатов саногенетического мониторинга и составление рекомендаций.
Успешная реализация алгоритма ALG-EA (в рамках математического обеспечения подсистемы SSEE) позволяет до десяти раз сокращать время принятия решения экспертом по результатам анализа инновационных проектов. Практическое использование SSEE для конкурсов молодежных инновационных проектов подтвердило возможность ее применения в сфере трансфера технологий. Модифицированный генератор GMFD может быть использован в других областях, например в криминалистике. Разработаны элементы инновационной автоматизированной системы анализа данных и поддержки принятия решений «Аналитика-2000» и АС «БД РД» (в интересах Федеральной таможенной службы России). Для системы «Аналитика-2000» в 1.5 раза уменьшен объем программного кода, требуемого для формирования каждого из регламентных отчетов. Для АС «БД РД» сокращено в среднем в 2 раза время, затрачиваемое на программирование обработки каждого нового разрешительного документа.
Оценка эффективности АИСФФД в области обучения показала, что для 1000 задач АИСФФД формирует фактографические данные более чем в 50 раз быстрее, чем ручной вариант системы, и требует при этом в 10 раз меньше затрат (АИСФФД более эффективна по сравнению с ручным вариантом формирования ФД для 60-ти задач (тестов) и более).
Для формирования фактографических данных в АИСФФД выделены 7 основных обобщающих методов (МУП, МК, МФ, МФТ, МСП, МИР, МУПЭ), предложены стратегии, алгоритмы и показатели, позволяющие в рамках теоретического анализа выполнять необходимую оценку эффективности проектируемых средств для АИСФФД. Полученные оценки теоретической эффективности этих средств (методов, стратегий и алгоритмов) и результаты их исследований позволяют специалистам выполнять на практике необходимый системный анализ в различных областях (криминалистике, инновации и обучении). На основе теоретических результатов диссертационного исследования успешно разработаны необходимые генераторы формирования фактографических данных для таких областей, как криминалистика, инновация и обучение.
На защиту выносятся
Показатели и критерий эффективности для оценки работы АИСФФД и результаты их исследований.
Обобщенная схема АИСФФД и алгоритм ее работы.
Методы и средства для повышения эффективности работы АИСФФД и результаты их исследований.
Стратегии и алгоритмы для формирования фактографических данных в АИСФФД и оценки их эффективности.
Нейросетевая интерпретация для модели Г. Раша.
Результаты исследований формирования ФД в АИСФФД и модифицированный алгоритм последовательного анализа для тестирования экспертов в криминалистике (почерковедов и баллистов).
Результаты практического применения и внедрения АИСФФД.
Достоверность полученных результатов подтверждается
корректностью используемого математического аппарата и тем, что в экспериментальных исследованиях получены результаты, соответствующие теоретическим положениям диссертации.
Апробация работы
Большая часть научно-технических результатов диссертации была представлена на конгрессе, выставках, конкурсах, конференциях, сессиях и семинарах, в числе которых:
IV Международный технологический конгресс "Военная техника, вооружение и современные технологии при создании продукции военного и гражданского назначения" (Омск, 2007 г.); The Third International Conference on Digital Information Processing, Data Mining, and Wireless Communications (DIPDMWC2016), July 06-08, (Москва, 2016 г.); XIII Международная конференция "Цифровая обработка сигналов и ее применение - DSPA-2011" (Москва, 2011г.); XIX, XX Международная конференция "Информатизация и информационная безопасность правоохранительных органов" (Москва, Академия управления МВД России, 2010, 2011 гг.); Международная конференция АСВОМЕД 2007 (Россия, ЦВКС "Архангельское" Министерство обороны РФ, 2007 г.); 3-я, 4-я Международная научно-практическая конференция "Теория и практика судебной экспертизы в современных условиях" (Москва, 2011, 2013 гг.); 12-я Международная научно-практическая конференция "Актуальные проблемы управления -2007" (Москва, 2007 г.); Международная научно-практическая конференция "Судебная экспертиза: Методологические, правовые и организационные проблемы новых родов (видов) судебных экспертиз" (Москва, 2014 г.); Международный семинар "Целевые инициативы в области охраны правопорядка: исследование и идентификация криминалистических объектов", (Москва, 2010 г.); XIII Международная телекоммуникационная конференция студентов и молодых ученых , 2010 г. (работа отмечена дипломом);
VI Всероссийская научно-практическая конференция по криминалистике и судебной экспертизе с международным участием "Криминалистические средства и методы в раскрытии и расследовании преступлений" (Москва, 2014 г.); X Всероссийская выставка научно-технического творчества молодежи НТТМ 2010, Москва, ВВЦ, павильон 75, 29 июня - 2 июля, 2010 г. (работа отмечена медалью НТТМ-2010 за успехи в научно-техническом творчестве); X, XI, XII Всероссийская научно-техническая конференция "Нейроинформатика", 2008, 2009, 2010 гг.; IX, X, XI, XII Всероссийская научная конференция "Нейрокомпьютеры и их применение", 2011, 2012, 2013, 2014 гг. (работа отмечена 3-мя дипломами
и почетной грамотой); XV, XVI, XVII, XVIII, XIX, XXI Всероссийская
научная конференция "Проблемы информационной безопасности в системе
высшей школы", 2008, 2009, 2010, 2011, 2012, 2014 гг.; XXI, XXII, XXIII,
XXV Всероссийская конференция "Информатизация и информационная
безопасность правоохранительных органов", Академия управления МВД
России, 2012, 2013, 2014, 2016 гг.; IV, V, VI Всероссийская научно-
практическая конференция по криминалистике и судебной экспертизе, ЭКЦ
МВД России, 2009, 2011, 2014 гг. (автор награжден медалью ЭКЦ МВД
России); LXVI Всероссийская конференция, посвященная Дню
радио "Научная сессия", РНТОРЭС, 2011 г.; III Всероссийская научно-практическая конференция "Информационные технологии в образовании XXI века" (ИТО-XXI), (Москва, 2013 г.);
IХ межвузовская научно-практическая конференция студентов,
аспирантов и молодых ученых "Молодые ученые столичному
образованию", МГППУ, 2010 г. (работа отмечена дипломом);
Межведомственная научно-практическая конференция "Современные
возможности криминалистического исследования документов", Московский
университет МВД России, 2013 г.; 9-й Конкурс молодежных
инновационных проектов Технопарка МИФИ, 2010 г. (работа отмечена дипломом как победитель); Конкурс УМНИК-2010 "Участник молодежного научно-инновационного конкурса" (Фонд содействия развитию малых форм предприятий в научно-технической сфере), 2010 г. (работа отмечена дипломом и грантом как победитель); Научные сессии МИФИ, 2006, 2007, 2008, 2010, 2012, 2013, 2014, 2015 гг. (работа отмечена 3-мя дипломами);
научные семинары: ВИНИТИ РАН, 2007 г.; НИЯУ МИФИ, 2009, 2012 гг.; ИСЭ МГЮА, 2011 г.
Реализация результатов работы
1. Результаты основных теоретических и экспериментальных
исследований были получены и применены в период 2007 – 2015гг. при
создании и внедрении различных информационных систем (АИСФФД), в
том числе и криминалистического назначения. Успешное практическое
применение подтверждается девятью актами о внедрении. Разработаны и
внедрены 5 автоматизированных систем в различных организациях и, в
частности, в ЭКЦ МВД России, Московском институте открытого
образования (МИОО) Департамента образования г. Москвы, ИСЭ МГЮА
им. О.Е. Кутафина, МГППУ, «ЛайфИТ». Разработано программное
обеспечение объемом более 40 тыс. строк (операторов различных языков
программирования).
2. Для эффективного формирования фактографических данных в
различных областях (криминалистике, инновации и обучении) были
разработаны необходимые средства (методы, алгоритмы, стратегии,
генераторы, системы) и выполнена их реализация. Экспериментальная
проверка показала, что разработанное для этих средств математическое
обеспечение работоспособно и эффективно выполняет поставленные перед
ним задачи. Наиболее актуальные средства нашли успешное применение на
практике, что подтверждается актами о внедрении, например, в ЭКЦ МВД России, МГППУ, АНО «Технопарк в Москворечье», «ЛайфИТ».
3. Эффективность разработанных средств (методов, алгоритмов и
программного обеспечения), интегрированных в АИСФФД, подтверждается
в области криминалистики четырьмя актами о внедрении, выданными ЭКЦ
МВД России и ИСЭ МГЮА им. О.Е. Кутафина, в области инновации —
двумя актами о внедрении, выданными АНО «Технопарк в Москворечье» и
«ЛайфИТ», в области обучения — актами о внедрении, выданными
МГППУ, НИЯУ МИФИ, МИОО, а также ИСЭ МГЮА им. О.Е. Кутафина. Опыт разработки программ и алгоритмов для АИСФФД был успешно использован при создании элементов инновационной автоматизированной системы анализа данных и поддержки принятия решений «Аналитика-2000» и АС «БД РД» (в интересах Федеральной таможенной службы России) для компании «ЛайфИТ», что подтверждается актом о внедрении.
Публикации
Результаты диссертации представлены в 52-х публикациях, в том
числе: 2 монографии (в соавторстве), 11 работ в ведущих рецензируемых
научных журналах, рекомендуемых ВАК РФ, а также 1 работа, включенная
в международные базы данных отслеживания цитируемости Scopus и Web
of Science. При этом получены 4 официальных свидетельства
РОСПАТЕНТа на программы и базы данных и 2 патента на полезную модель.
Структура и объем работы
Системы генерирования данных (генераторы)
В развитие комбинаторного анализа существенен вклад выполненных теоретических исследований Л. Эйлера (см., например, [247] и, в частности, известная [147, 148] его пентагональная теорема, связанная с разбиением чисел. При этом можно полагать, что функция, позволяющая оценить число возможных разбиений, носит фундаментальный характер. С помощью разбиений можно сформулировать [249, с. 78] известный принцип Дирихле, который обычно представляют в терминах размещений предметов по ящикам [249, с. 78]: при любом размещении (r+1) предметов по r ящикам найдется ящик с по крайней мере двумя предметами. Достигнутые результаты, связанные с разбиением, показывают, что разбиение чисел на слагаемые достаточно хорошо изучено, например [145, с. 122], уже известно общее число разбиений числа N на натуральные слагаемые (если нет никаких ограничений ни на сами слагаемые, ни на их число, а два разбиения, отличающихся порядком следования различных слагаемых, считаются различными): общее число разбиений числа N есть 2(N-1). Отметим, что, например, полный перебор всех 2499 разбиений числа 500 на современных вычислительных средствах практически не возможен. Полагают [249, с. 75–76], что задача о разбиениях является значительно сложнее по сравнению с задачами о композициях (композиция — это «упорядоченные разбиения»). Оценка p(n, r) — числа разбиений n ранга r является важной для перечислительной теории разбиений. В связи с этим в данной диссертации при выборе наилучшей стратегии формирования фактографических данных будет предполагаться, что необходимое разбиение уже выполнено и является заданным и в некоторых важных случаях будут получены необходимые оценки, не зависящие от N и его разбиений.
В теории сложности алгоритмов [149, 150] для анализа эффективности [16] алгоритмов используют различные оценки, тщательно исследованы [9] многие алгоритмы и имеются оценки эффективности конкретных алгоритмов, при этом отсутствуют необходимые оценки эффективности стратегий формирования фактографических данных для АИСФФД. Сами оценки получают, используя (при необходимости) целочисленные функции, например [36, с.88–124] функцию антье и ей аналогичные, которые в настоящее время уже хорошо изучены и известны их основные свойства. Далее в диссертации будут использованы подходящие целочисленные функции для получения необходимых оценок эффективности.
В практических задачах формирование ФД связано с той конечной целью, для достижения которой и выполняется само формирование ФД, которое необходимо рано или поздно прекратить. В связи с этим существует проблема определения момента остановки формирования ФД. В целом сама проблема остановки [6, 7, 151, 285] уже достаточно исследована, например [285, с. 3], в теории управления задачи на правило остановки являются достаточно изученными. В развитие теории оптимальных правил остановки значительный вклад внес [7, с. 5–6] А. Вальд, который по сути стимулировал своими работами ее развитие. Важные задачи для практики, такие как последовательная проверка статистических гипотез, выбор наилучшего объекта и другие, согласно работе [285, с. 3] могут быть сформулированы как задачи на правило остановки. Отдельно выделим важную фундаментальную работу А. Вальда [6], в которой решена проблема остановки и сформулировано правило прекращения последовательного анализа (ПА), при этом проблема эффективного формирования ФД (которая возникает на практике в области криминалистики) не получила должного отражения в существующих публикациях как в нашей стране, так и за рубежом. Достигнутые результаты, связанные с проблемой остановки, показывают, что она достаточно хорошо изучена. В связи с этим в данной диссертации проблема остановки полагается уже решенной, и основное внимание будет уделено формированию ФД для реализации очередного шага последовательного анализа А. Вальда в прикладной области — криминалистике. При этом, если потребуется, то следует предложить модифицированный алгоритм ПА для этой прикладной области.
В исследовании операций [3, 4] математическое программирование играет важную роль при разработке информационных систем. Для решения необходимых оптимизационных задач на практике в рамках системного анализа и исследования операций [3, 4] разработчики различных систем используют, например, нелинейное программирование [4, с. 820] и, в частности, геометрическое программирование [4, с. 820–824; 8; 38], связанное с минимизацией позиномов. Можно полагать, что такой раздел математического программирования, как геометрическое программирование достаточно хорошо исследован. Однако на практике для эффективного формирования ФД регулярных позиномов возникает проблема правильной корректировки текущего сформированного позинома для того, чтобы сформировать очередной регулярный позином. Для ее решения необходимо предложить метод (способ) такой корректировки и проверить его на практике. Процессы тестирования и формирования ФД связаны между собой и зависят друг от друга. Плохо обоснованное применение на практике используемых моделей для реализации тестирования испытуемого снижает эффективность как тестирования, так и формирования ФД. В области образования для теории IRT [139, с. 146] хорошо известна модель Г. Раша [65, с. 170, 185; 134; 158; 159], описывающая вероятность успеха в выполнении задания испытуемым как функцию одного параметра. Следуя работе [140, с. 192], можно полагать, что IRT является общепризнанной теорией. Имеются различные интерпретации модели Г. Раша, например [136, 137, 138, 143], которые убедительно показывают наличие проблемы в этой теории (и не исследованные ее области), поскольку отсутствует единая и признанная интерпретация этой модели. Для ее решения необходимо проанализировать существующие интерпретации и предложить новую (более предпочтительную) интерпретацию модели Г.Раша для области — обучения.
В настоящее время известны алгоритмы генерации различных объектов в широких практических областях. Усилиями многих исследователей, например [9, 67], проблема генерации различных комбинаторных объектов [9, с. 329–576] достаточно хорошо изучена и представлена в многочисленных источниках (см. например исторические и иные сведения в фундаментальной работе [9, с. 547–576]). Таким образом, разрозненные алгоритмы или их целые классы различным специалистам удалось изучить и подробно исследовать. Однако при этом исследования, которые выявляют общие методы, принципы или обобщающую основу этих алгоритмов, остались в стороне от внимания как отечественных, так и зарубежных ученых, а сама проблема обобщения не нашла своего окончательного решения. Для ее решения необходимо предложить новое обобщение известных алгоритмов и методов генерации в узкой, но важной для практики научной сфере формирования ФД в заданных прикладных областях: криминалистике, образовании, инновации.
Усилиями математиков, например [2, с. 282; 18, с. 18], А.Н. Колмогорова, В.И. Арнольда был заложен ключевой теоретический фундамент для [1] теории нейронных сетей, важный вклад в которую внес А.И. Галушкин. Анализ различных публикаций (теоретических и практических результатов), например [1, 2, 18, 152, 169, 184, 185, 186], показывает, что нейронные сети могут быть успешно использованы для построения эффективных алгоритмов в различных областях. Как отмечается в [152, с. 5], доказаны необходимые теоремы, показывающие, что есть НС, являющиеся универсальными аппроксиматорами (в том смысле, что с помощью НС в принципе можно добиться необходимого приближения к функции при некоторых ограничениях). Аппроксимация функций и персептрон рассмотрены, например, в [2, с. 171–339]. Необходимо отметить работы Д.А. Тархова, например [18, 152, 169], в которых в частности отмечается, что важную фундаментальную роль представляют результаты, связанные с существованием модели (в заданном классе), для которой ошибка может быть сделана сколь угодно малой. Практическая направленность применения нейронных сетей к задачам моделирования обусловлена в частности тем, что уже доказаны (см. [169, с. 52]) фундаментальные теоремы.
Оценка эффективности информационных систем формирования фактографических данных
Формировать (генерировать) объекты с требуемыми признаками необходимо еще и по другой причине. Так, в 2010 г. личный состав в ЭКП МВД России насчитывал [131] примерно 14 тыс. сотрудников (согласно источнику [91] более 16 тыс. специалистов), имеющих право самостоятельного производства экспертиз, при этом всего допусков на право самостоятельного производства экспертиз определенного типа примерно 50 тыс. Эти специалисты регулярно выполняют большой объем различных экспертиз. Например [132], только отдел почерковедческих исследований ЭКЦ ГУВД по г. Санкт-Петербургу и Ленинградской области выполнил за год более 3 тыс. экспертиз и исследований, а средний годовой объем работы [91] на одного специалиста экспертной службы МВД России составил свыше 160 экспертиз и исследований (при общем годовом числе экспертиз и исследований более 2.6 млн на всю экспертную службу в целом).
Хорошо известно [93], что заключение эксперта не имеет никакой заранее установленной силы и оценивается согласно общим правилам — по внутреннему убеждению (ст. 71 УПК). Специалистами признано, что [93] "внутреннее убеждение эксперта представляет собой субъективно психологическую гарантию правильности выводов, основанную на познанной совокупности фактических данных, установленных в ходе экспертного исследования". В силу различных причин в этом заключении могут быть ошибки (см. табл. П.2.17), а само заключение — ошибочным.
В криминалистике принято [93; 100, с. 155; 117, с. 213], что экспертные ошибки — суждения эксперта или его действия, не соответствующие объективной действительности и поэтому не приводящие к цели экспертного исследования (являются результатом добросовестного заблуждения). Специалисты понимают, что [120] "полностью исключить возможность экспертной ошибки невозможно". Было выяснено [118], что для успешной работы эксперта-почерковеда важна оценка свойств внимания и комбинаторного мышления и были установлены следующие необходимые пороги количества возможных ошибок при тестировании по использованным в работе методикам [118] при оценке: внимания — до 12 ошибок; различительных способностей — до 10 ошибок; комбинаторного мышления —до 15 ошибок.
Эти исследования показали, что на практике возможно установление пороговых значений при оценке подготовленности эксперта-почерковеда для эффективной его работы. Далее это будет учтено в диссертации при реализации последовательного анализа для тестирования эксперта. Исследование и анализ взаимосвязей между почерковедческими навыками (умениями) и личностными качествами испытуемых показало, что к личностным качествам, профессионально важным для работы эксперта-почерковеда, необходимо отнести следующие [118]: высокая «эмоциональная стабильность» — выдержанность, устойчивость; высокий «самоконтроль» — дисциплинированность; низкая «напряженность потребностей» — невозмутимость, расслабленность; низкая «тревожность» — спокойствие, уравновешенность; низкая «общительность» — малообщительность.
Особое внимание исследователей к умению и навыкам правильно выделять признаки почерка неслучаен — анализ показывает, что ошибки эксперта нельзя игнорировать, необходимо иметь средства для их выявления и принятия решения по их компенсации. Впоследствии это будет учтено в данной диссертации и будет подтверждено новыми экспериментальными исследованиями влияния ошибок эксперта на эффективность принимаемых решений с использованием им экспертной методики.
Сложившая в нашей стране практика профессионального отбора экспертов в органах внутренних дел (ОВД), как считают специалисты (почерковеды) [123], "не имеет научного обоснования". Эта проблема еще ждет своего решения. В данной диссертации далее будет предложен один из возможных вариантов ее решения — применение последовательного анализа для тестирования эксперта с целью выяснения возможности его работы с признаками почерка. Наиболее ярко проблема экспертных ошибок отражается в повторных экспертизах (ПОЭК) [93, 121, 122, 132]. Так, анализ [121] более 600 повторных экспертиз, выполненных в 2007 г. государственными судебно-экспертными учреждениями (СЭУ) Министерства юстиции РФ, показал следующее. В 50 % случаях имеются расхождения выводов повторных экспертиз с выводами предыдущих. Для 43 % экспертиз (повторно выполненных после специалистов СЭУ) было выяснено, что из них 36.4 % экспертиз не подтвердили выводы предыдущих (всего в СЭУ было выполнено 873 ПОЭК; наибольшее количество ПОЭК выполнено в РФЦСЭ — 246 (или 28 %) от общего количества ПОЭК, выполненных в СЭУ) [121]. Больше всего ПОЭК (62 %) назначалось по гражданским делам на стадии судебного разбирательства (в основном почерковедческие экспертизы, технические экспертизы документов, бухгалтерские и др.). В СЭУ после иных учреждений и частнопрактикующих экспертов доля ПОЭК составила 29 %.
В целом анализ экспертно-криминалистических подразделений (ЭКП) МВД России показал, что ПОЭК, выполненные после этих ЭКП, составляют [121] наибольшее количество — 315 (75 %) повторных экспертиз. Выяснено [121], что выводы 164 (52 %) ПОЭК не подтвердили предыдущие. При этом почерковедческие ПОЭК, связанные с ЭКП МВД России, составили — 117 экспертиз (37 %), причем 68 из них (или 58 %) не подтвердили выводы предыдущих [121]. Аналогичный анализ [121] экспертных учреждений Министерства обороны России показал, что из 8 выполненных экспертиз выводы трех из них не подтвердили предыдущие выводы.
Одним из возможных средств для решения проблемы, связанной с ошибками экспертов, может являться разработка и применение АИСФФД для решения задачи тестирования и оценки эффективности работы эксперта, например, в области почерковедения. Далее это учитывается в диссертации. Аналогичные исследования ошибок экспертов были проведены и для других объектов криминалистики, например [125], при производстве судебно-баллистических экспертиз. Проведен анализ типичных ошибок судебно-баллистических экспертиз, допущенных практическими работниками и экспертами-стажерами, а также причин таких ошибок (по материалам рецензирования заключений экспертов-стажеров, выполненных в ходе преддипломной практики 2008 – 2009 гг. факультета экспертов-криминалистов (ФЭК) [125]). В ходе этого анализа были установлены виды экспертных ошибок [125].
Методы, лежащие в основе работы генератора
У предлагаемой АИСФФД (рис. 2.2) имеется 4 входа, 4 выхода и два основных пользователя — испытуемый и эксперт. Испытуемым может являться стажер, курсант, студент, школьник, а также непосредственно сам эксперт. Пользователь (эксперт) выступает в роли получателя рекомендаций (на выходе 2), выдаваемых АИСФФД как результат ее работы. Помимо перечисленных пользователей с АИСФФД также работает администратор. Администратор наблюдает (на выходе 1) показатели эффективности работы системы и осуществляет (через вход 1) управляющие действия для начальной настройки, последующей инициализации первичными данными и регулирования процесса функционирования АИСФФД на всем ее жизненном цикле. Испытуемый является основным поставщиком исходных данных (через вход 3) для формирования системой выходных рекомендаций. Выходные данные (на выходах 1-4) формируются в процессе тестирования испытуемого путем его взаимодействия с блоком 1 интерфейса пользователя. Этот блок, как и блоки 2, 3 и 6, содержит в своем составе (соответственно для каждой из трех прикладных областей) три необходимых элемента для обработки данных в АИСФФД, а именно: ПТг — для реализации в криминалистике последовательного тестирования с использованием модифицированного алгоритма Вальда, АТг — для реализации адаптивного тестирования с использованием однопараметрической модели Раша в обучении и НС; — для реализации нейросетевых алгоритмов для первичного анализа инновационых пректов и выдачи рекомендаций экспертам (і є {1, 2, 3} ). Каждый из трех этих элементов успешно опробован в своей области практического применения, в которой он может быть использован наиболее эффективно. Последовательное тестирование, как будет показано в последней главе, применено в области криминалистки на примере признаков букв рукописного текста. Использование модифицированного алгоритма Вальда оправдывает себя в случае с очень большим количеством признаков, выявление которых испытуемым из рукописного документа необходимо эффективно проверить. Адаптивное тестирование используется в образовательном процессе, где количество заданий относительно невелико, при этом необходимо эффективно выявить подготовленность испытуемого. Использование нейросетевых алгоритмов оправдано в области трансфера инноваций для подготовки рекомендаций, которые повышают эффективность процесса анализа описаний инновационных проектов для выявления наиболее перспективных и значимых.
АИСФФД (с помощью входа 4 и выхода 4) взаимодействует с системой формирования самого объекта (СФСО). Наряду со взаимодействием с испытуемым блок 1 интерфейса пользователя предназначен для взаимодействия с системой СФСО в части приема от нее электронных представлений объектов или ответа. В процессе работы с инновационными проектами их электронные представления также поступают в блок 1 интерфейса пользователя (см. рис. 2.2). Блок 1 интерфейса систематизирует, преобразовывает к внутреннему формату поступившие на его вход данные и передает их блоку 2 анализа, тестирования и принятия решений. Блок 1 интерфейса пользователя, получив данные от блока 2, преобразовывает их в визуальные формы и затем предоставляет их для отображения пользователю. В свою очередь, блок 2 анализа, тестирования и принятия решений отвечает за логику работы всей АИСФФД. В этом блоке 2 происходит расчет необходимых данных по всем основным реализуемым в АИСФФД алгоритмам принятия решений и расчета необходимых промежуточных показателей прохождения тестирования и текущего состояния нейросетевых элементов. Блок 2 анализа, тестирования и принятия решений взаимодействует с блоком 5 фактографической базы данных (ФБД) так, что результаты тестирования и принятые решения записываются в ФБД (на англ. яз. ФБД — Factographic Data Base (FDB)), а в свою очередь, необходимые входные данные для алгоритмов анализа, тестирования и принятия решений получаются блоком 2 из блока 5 ФБД. Отметим, что администратор, обращаясь через блок 1, осуществляет необходимые управляющие воздействия по отношению к блоку 2, который направляет данные в блок 3 настройки. Блок 3 настройки формирует задание для блока 4 обобщенного генератора ФД в виде описаний объектов. Описания объектов либо генерируются и результат записывается в блок 5 ФБД, либо они просто извлекаются из ФБД если необходимое описание уже было сгенерировано ранее. Сформированные ФД поступают на вход блока 6 формирования электронного представления объекта (ЭПО), который состоит из ряда прикладных конструкторов ЭПО и соответствующих им баз данных, специфичных для объектов отдельных областей применения АИСФФД. Блок 6 формирования ЭПО на основании поступивших ФД формирует электронное представление объекта и сохраняет ЭПО в блоке 7. Блок 7 хранилища электронных представлений объектов (идентификатор на англ. яз. — Special Data Base (SDB)) накапливает и систематизирует сформированные в рамках АИСФФД задания и рекомендации. Данные в хранилище представляют собой необходимые варианты заданий или рекомендаций, готовых к выдаче испытуемому или эксперту, и запрашиваются блоком 2 в процессе его работы, а также блоком 8 для осуществления возможности взаимодействия с архивом самих объектов вне АИСФФД. Кроме АИСФФД, на рис. 2.2 представлена система формирования самого объекта (СФСО). Данная система является независимой от АИСФФД и не реализуется в рамках данной работы. СФСО представляет собой необходимый архив самих материальных объектов и технических средств для производства таких объектов по их электронному представлению (описанию). Самим материальным объектом в рассматриваемом случае может являться, например, конкретное задание студенту, напечатанное на бумаге, образец рукописного текста, различные криминалистические объекты, такие как гильза или дефектный вексель. СФСО состоит из трех основных элементов: подсистемы обработки объектов, подсистемы создания объектов и архива объектов. Через подсистему обработки объектов происходит взаимодействие с внешними по отношению к СФСО системами, например, с АИСФФД. Взаимодействие СФСО с АИСФФД происходит в рамках двух процессов. Первый процесс заключается в том, что при получении электронного представления объекта СФСО создает сам объект и передает его в архив на хранение и непосредственно испытуемому. В случае, когда по электронному описанию объекта в архиве уже существует объект, то он выдается испытуемому. Второй процесс происходит при передаче в АИСФФД данных о существующих в архиве объектах, а также электронных представлений тех ответов, которые были получены от испытуемых в бумажном виде. Со стороны АИСФФД взаимодействие с СФСО происходит через блоки 1 и 8. Блок 1 интерфейса принимает электронные представления объектов. Блок 8 подсистемы взаимодействия с архивом предназначен для передачи в СФСО электронных представлений, сформированных в АИСФФД объектов. АИСФФД обладает двумя режимами работы, ручным и автоматизированным, а также контуром ускоренной обработки запроса пользователя при отсутствии необходимости генерирования новых образцов объектов (рис. 2.3). АИСФФД переходит в режим ускоренной обработки запросов в случае наличия в хранилище ЭПО такого количества сформированных ранее в рамках АИСФФД объектов, которое позволяет выдать запрашиваемые блоком 2 анализа, тестирования и принятия решений объекты без запуска ресурсно-затратного процесса формирования ФД. До этого был рассмотрен автоматизированный режим работы АИСФФД, включающий в том числе и ускоренный контур обработки, тогда как ручной режим работы АИСФФД подразумевает, что присутствует специалист высокой квалификации или ряд специалистов различной квалификации, которые реализуют работу блоков 1, 2, 3, 4 и 8, при этом функционал блоков 5, 6, 7 перекладывается на СФСО.
Фальшивые лекарственные средства
Основная идея состоит в том, чтобы избежать итераций и за один проход основных шагов получить либо элемент искомого множества Ч , либо, в случае неудачи, выполнить корректировку (обозначенную стрелкой на рис. 3.2, б, а именно: М —» 4і ) неудачного элемента так, чтобы он стал элементом множества Ч . Основные шаги алгоритма (см. рис. 3.2, б) обеспечивают последовательное получение элементов из множества М. Эти элементы могут быть как из множества (M\F), так и из множества Ч1 . Затем, при необходимости, выполняется (если это возможно) корректировка только элементов из множества так, чтобы они стали элементами множества Ч (обычно корректируются ФД). У этого метода есть недостаток: например, на практике для некоторых областей применения не всегда удается выполнить необходимую корректировку, что может приводить к увеличению числа генерируемых элементов. Отметим, что для выбранных областей (криминалистика, инновация, обучение) необходимая корректировка обычно возможна. Далее МК успешно применен в обучении при разработке генератора регулярных позиномов (сведения о позиномах кратко приведены в приложении 1) в рамках геометрического программирования, позволяющего на практике решать некоторые оптимизационные задачи системного анализа и исследования операций. Для этого была сформулирована и доказана (см. приложение 1) следующая лемма.
Данная лемма позволила далее в диссертации разработать алгоритм корректировки нерегулярного позинома для формирования из него регулярного позинома. В случае, когда автоматическая корректировка по какой-то причине невозможна (например, в том случае, когда она не эффективна или отсутствует алгоритм для ее реализации), то можно попытаться применить ручную корректировку. В автоматизированном варианте системы, например в АИСФФД, эта корректировка может выполняться не автоматически, а вручную человеком-оператором. Метод фильтрации (МФ) В основе этого метода лежит модификация метода корректировки, в котором корректировка заменена на фильтрацию (обозначенную на рис. 3.2, в как М#Ч ). Основная идея состоит в том, чтобы избегать итераций и за один более длинный проход основных шагов получать элементы набора G из множества М, а затем просеивать (то есть фильтровать) их с целью отбора из них только элементов искомого множества Ч , при этом элементы множества просто игнорируются. Основные шаги алгоритма (рис. 3.2, в) обеспечивают последовательное получение (один за одним ФД объекта) 104 элементов из множествам. Эти элементы могут быть как из множества (MVP), так и из множества Р. Затем выполняется фильтрация элементов множества (МУР). У этого метода есть недостаток: например, на практике для некоторых областей применения после очередной фильтрации в текущем 7-м наборе Yi остается либо очень мало элементов из искомого множества Ч , либо это множество пусто (Yi = 0, например, когда Рп(? = 0). На практике из-за редкого появления очередного элемента из искомого множества Ч затраты времени на выполнение алгоритма с целью формирования заданного числа искомых элементов могут оказаться значительными, приводящими к снижению эффективности АИСФФД. В этом случае алгоритм генерирования выполняет более длинный проход (большее число шагов), чем в методе корректировки для формирования очередного искомого элемента из множества Ч?. В случае рис. 3.3, а (область пресечения множеств G и Ч/ небольшая) можно ожидать, что элементы множества 4s будут появляться редко.
В случае рис. 3.3, б (область пресечения множеств G и Ч большая) можно ожидать, что при фильтрации элементов множества G чаще будут появляться элементы из множества Y. Необходимо отметить, что для выбранной области (обучения) этот недостаток может быть существенным. Так, при разработке генератора позиномов (представленного далее) с целью генерирования регулярных позиномов в экспериментальных исследованиях по оценке эффективности ФФД этот метод потребовал существенных временных затрат АИСФФД, при этом Р G Ф 0.
В случае, когда автоматическая фильтрация невозможна (например, в том случае, когда она не эффективна или отсутствует алгоритм для ее реализации), то можно попытаться применить ручную фильтрацию. В автоматизированном варианте системы, например в АИСФФД, эта фильтрация при необходимости может выполняться не автоматически, а вручную, то есть человеком-оператором. Однако при этом нагрузка на человека-оператора может сильно возрасти.
В основе этого метода лежат таблицы (или одна таблица), которые в данной работе называются фактографическими таблицами (ФТ). Такое название таблиц связано с тем, что в них содержатся различные ФД объектов АИСФФД. Сами ФТ находятся в фактографической БД в АИСФФД. Основная идея состоит в том, чтобы при активной фазе работы ГФД избегать итераций, которые, по сути, заменяются простой операцией — выгрузкой (выборкой по запросу) из ФБД требуемых элементов множества D (отметим, что в общем случае для данного метода множества D и 4і могут не совпадать, причем Dcf). Это достигается тем, что заранее формируются элементы множества D, а их ФД загружаются (заносятся) в фактографические таблицы ФБД, и при необходимости создаются индексы этих элементов. Такое первоначальное заполнение (загрузка) ФБД для некоторых приложений может потребовать значительных ресурсов. Как правило, это выполняется один раз при настройке АИСФФД на прикладную область применения, что бывает часто целесообразно. Таким образом, однократная малоэффективная работа при заполнении ФБД компенсируется впоследствии многократной эффективной работой АИСФФД на практике при ее эксплуатации. Начальные шаги алгоритма (рис. 3.4, а) обеспечивают получение необходимого числа элементов (ФД объектов) из множества D и запись (загрузку) ФД этих элементов в фактографические таблицы ФБД. Отметим, что на практике могут применяться другие методы для достижения требуемого результата. Основные шаги алгоритма (см. рис. 3.4, а) обеспечивают получение (путем выполнения запроса к ФБД и выборки (выгрузки) данных из ФТ) последовательно элементов из множества D. Иногда для фактографических таблиц ФБД могут потребоваться значительные ресурсы как внутренней (оперативной) памяти ЭВМ, так и внешней — на жестком диске. Необходимо отметить, что для области обучения этого удалось избежать. Так, при разработке генератора полиномов (представленного далее) при реализации динамического тестирования учащихся в экспериментальных исследованиях по оценке эффективности ФФД этот метод не потребовал существенных затрат ресурсов и был успешно применен в АИСФФД на практике.