Содержание к диссертации
Введение
I. Математические аспекты обоснования параллельных технологий в задачах прогнозирования 10
1.1. Анализ временных рядов как случайных процессов 10
1.2. Прикладное применение теоремы Колмогорова 17
1.3. Обоснование возможности применения параллельных информационных технологий прогнозирования 24
Основные результаты 32
II. Концептуальное проектирование автоматизированных систем прогнозирования экспертного типа 33
2.1. Автоматизация проектирования алгоритмических структур на базе семиотического моделирования 33
2.2. Компьютерная поддержка анализа и синтеза алгоритмических решений на этапе концептуального проектирования 49
2.3. Математическое обеспечение концептуального моделирования алгоритмических задач при создании автоматизированных систем прогнозирования 66
2.4. Информационные технологии, использующие вербальные модели информационных потоков 83
Основные результаты 98
III. Информационные основы создания автоматизированных систем прогнозирования экспертного типа на основе параллельных информационных технологий 99
3.1. Формализация описания временных рядов на основе шаблонов
3.2. Моделирование стохастических временных рядов как средство формализации 109
3.3. Поиск однородностей в базе данных, представленных в виде временных рядов 114
3.4. Описание временных зависимостей на основе нейросетевых методов 122
3.5. Информационная поддержка анализа и управления контролируемыми случайными процессами на основе гипертекстовой базы знаний 129
Основные результаты 136
IV. Процедурные и логико-семантические модели экспертной основы автоматизированных систем прогнозироания 137
4.1, Вербально - структурная модель процедуры прогнозирования при нечетких требованиях 137
4.2. Построение экспертной основы в автоматизированных системах прогнозирования 141
4.3. Принципы построения конъюнктивно - дизъюнктивных моделей в рамках экспертной системы автоматизированного прогнозирования 155
4.4. Методические основы логических выводов на основе деления конъюнкто - дизъюнктов при выборе методов прогнозирования 164
4.5. Продукционные экспертные системы прогнозирования 177
4.6. Построение продукционных экспертных систем прогнозирования 181
4.7. Принятие решений в АСП на основе нечеткой экспертной информации ". 189
4.8. Диагностирование экспертных знаний и заключений в АСП 197
Основные результаты 206
V. Методология построения алгоритмических структур параллельных информационных технологий процедур прогнозирования 207
5.1. Классификация механизмов параллельной информационной технологии прогнозирования 207
5.2. Информационно-технологические основы параллелизма в решении задач прогнозирования... 212
5.3. Теоретические аспекты проблемно-ориентированных типовых алгоритмических структур с массивным параллелизмом 217
5.4. Математические основы алгоритмических структур параллельного прогнозирования 223
5.5. Оценивание точности и сходимости результатов прогноза 249
Основные результаты 254
VI. Технологии параллельного использования различных принципов прогнозирования 256
6.1. Диалоговые процедуры при решении задач прогнозирования... 256
6.2. Параллельное применение принципов аналитического и вероятностного прогнозирования 270
6.3. Коллективное использование принципов экстраполяции и математического программирования 279
6.4. Алгоритмические особенности совместного применения «вырожденного» распознавания и регрессионных моделей 283
Основные результаты 289
Заключение 290
Литература 295
- Обоснование возможности применения параллельных информационных технологий прогнозирования
- Математическое обеспечение концептуального моделирования алгоритмических задач при создании автоматизированных систем прогнозирования
- Моделирование стохастических временных рядов как средство формализации
- Построение экспертной основы в автоматизированных системах прогнозирования
Введение к работе
Актуальность темы. Характерной чертой современного этапа создания бортовой аппаратной корабельных (судовых) систем и летательных аппаратов является рост требований к их качеству, соответственно надежности и долговечности. Важность этих свойств ответственной аппаратуры как в вооружении, так и в народном хозяйстве была всегда первостепенной, однако в условиях международной, с одной стороны, открытой конкуренции, с другой стороны наивыгоднейшей кооперации, она возросла многократно. Это объясняется том, что_цена отказа аппаратуры (материальная и моральная) в условиях открытой рыночной экономики возросла значительно.
Современные системы автоматизированного проектирования (CAD-system) автоматизированного технологического производства (САМ-system) и автоматизированные обслуживания процесса эксплуатации (CAE-system) достаточно серьезно повысили культуру создания аппаратуры на всех этапах жизненного цикла аппаратуры, что привело к повышению их качества (надежности, долговечности) на новую ступень. Развитие новых информационных технологий (интеллектуализация информационных систем, экспертные основы компьютерных систем поддержки принятия решений, нейросетевые технологии, технологии нечетких множеств, диалоговые системы и т.д.) явилось объективной потребностью необходимости создания надежных технических, организационно-управленческих, информационных и т.п. систем, функционирование которых необходимо рассматривать интегрирование и взаимосвязано, т.е. используя системный подход.
Эволюция упомянутых систем, применяемых на всех этапах жизненного цикла, продолжается, и улучшение характеристик технической аппаратуры (объектов) может быть также обеспечена «интеллектуальным» обслуживанием, т.е. интеллектуализацией управления процессом проектирования, процессом производства и процессом эксплуатации. К одним из важнейших средств интеллектуализации компьютерных процессов на всех стадиях жизненного цикла является прогнозирование изменения технического состояния объекта. История развития теории прогнозирования имеет более чем 40-летний этап развития как у нас в стране, так и зарубежом. Однако в связи с созданием нового поколения вычислительных систем, операционных систем, программных продуктов и информационно-технологических процедур в решении проблемы прогнозирования открылись новые горизонты.
В настоящее время очевидно, что задачи оценки состояния объектов и процессов, контроля и управления, прогнозирования и принятия решений требуют для своего реального внедрения в конкретную предметную область экспертной основы в соответствующей компьютерной системе.
Это объясняется тем, что решение этих задач в различных областях при1 ложения происходит зачастую при; отсутствии или ограниченности «за-шумленной» текущей информации; отсутствии четких рекомендаций по процедуре анализа той или иной информации; острой необходимости структурирования требований к алгоритмическому обеспечению решений этих задач; несущной целесообразности формализации многих качественных рекомендаций по описанию ситуаций в исследуемой предметной области; обязательном раскрытии семантики взаимоотношений между условиями решения задач (что дано), что требуется получить (цель) и множеством алгоритмов решения (библиотека моделей и алгоритмов); необходимости построения логических зависимостей (моделей) и выводов (заключений) при семиотическом описании фрагментов предметной области; наконец, при требовании принятия решений при нечетких условиях, нечетких данных и нечетких алгоритмах.
Нетрудно увидеть, что применение строго формализованных алгоритмов, традиционно работающих с количественной информацией, в перечисленных условиях затруднено. Нужен подход, повышающий эффективность решения упомянутых задач при столь жестких требованиях, это применение автоматизированных систем, использующих экспертную алгоритмическую основу. Кроме того, с момента появления современных вычислительных средств происходит постоянный процесс их совершенствования. При этом одна из мировых тенденций в развитии вычислительного дела неразрывно связана с созданием высокопроизводительных вычислительных систем на базе фундаментальных принципов распараллеливания и конвейеризации, а также с интеграцией обработки потоков быстро поступающей информации на многопроцессорных системах, комплексах и сетях ЭВМ. Это обусловлено как необходимостью достижения сверхвысокой производительности и надежности вычислительных средств, так и существенного ускорения решения реальных задач, повышения их размерности и точности результатов. В связи с этим происходит процесс создания принципиально новых и пересмотра существующих математических методов и алгоритмов решения задач в различных предметных областях с пересмотром алгоритмического багажа прикладной математики, выдвигаются новые требования к построению и исследованию математических моделей, касающихся различных аспектов параллельной и конвейерной обработки, организации параллельных вычислений. Кроме того, принципы параллельной организации процессов являются не только одним из универсальных способов достижения высокой производительности и надежности вычислительных средств, но и носят достаточно общий характер и присущи процессам различной природы, прежде всего они свойственны системам управления, операционным системам, системам автоматизированного проектирования, геоинформационным системам, системам автоматизирован-
ного контроля и диагностирования, промышленным технологиям, конвейерным и роторно-конвейерным линиям и т.д.
В настоящее время в этой области ведутся интенсивные исследования. Однако, понимание ряда аспектов, связанных с параллельными вычислениями, находится на интуитивном-уровне. Это трудные в математическом отношении проблемы параллельного программирования по расчету оптимальных характеристик как самих вычислительных систем, так и характеристик оптимальной организации большого числа одновременно взаимодействующих параллельных процессов; вопросы границ эффективности и применимости методов распараллеливания и приемов ускорения вычислений; количественная и качественная оценка различных стратегий управления параллельными процессами, включая проблемы синхронизации; проблемы создания эффективных параллельных алгоритмов и соответствующего программного обеспечения с учетом характеристик конкретных систем параллельной обработки данных и др.
Одной из центральных в этих направлениях и во многом объединяющая их является проблема оптимального распределения вычислительных ресурсов и, прежде всего, алгоритмических и программных, так как именно алгоритмы и программы являются не только основными вычислительными ресурсами, но и интегрированными средствами, через которые осуществляются запросы на ресурсы вычислительных систем. Это порождает, в свою очередь, множество параллельно-конкурирующих за их использование процессов. А проблемы оптимальной организации выполнения этого класса процессов относятся к операционному параллелизму, который является «мозгом и сердцем» параллельных вычислений. Поэтому от успешного решения проблем оптимальной организации множества параллельно-конкурирующих процессов зависит не только эффективность реализации заданных объемов вычислений, но и работоспособность и надежность систем в целом.
Несмотря на имеющиеся в этих направлениях результаты до сих пор открытыми остаются проблемы оптимальной организации параллельных вычислительных процессов в условиях ограниченных ресурсов (реальные ресурсы всегда ограничены), проблемы эффективной реализации заданных объемов вычислений в различных режимах их синхронного и асинхронного взаимодействия при сосредоточенной и распределенной обработке в условиях ограниченного параллелизма, проблемы синхронизации множества конкурирующих процессов, проблемы разработки методов решения оптимизационных задач в условиях неограниченного и ограниченного параллелизма при сосредоточенной и распределенной обработке с целью создания условий оптимальной реализации заданных объемов вычислений и критериев эффективности и оптимальности реализации множества параллельно-конкурирующих процессов, проблемы эффективного отображения парал-
лельных алгоритмов и соответствующих программных реализаций с учетом архитектурных особенностей многопроцессорных систем (МС) и вычислительных комплексов (ВК), проблемы разработки и математического обоснования приемов ускорения вычислений на базе принципов распараллеливания и конвейеризации вычислений и др.
Следовательно, разработка математических моделей и методов оптимальной организации конкурирующих" процессов, критериев эффективности и оптимальности реализации заданных объемов вычислений в условиях неограниченного и ограниченного параллелизма в различных режимах синхронного и асинхронного взаимодействия параллельно-конкурирующих процессов при сосредоточенной и распределенной обработке и решение на этой основе проблем и задач оптимального отображения алгоритмов и соответствующих программных реализаций из различных предметных областей, прежде всего логико-комбинаторных, с учетом архитектурных особенностей многопроцессорных систем и комплексов в условиях массового параллелизма, разработка и обоснование приемов ускорения вычисления с повышением точности и достоверности при ограниченной информации является актуальной проблемой компьютерной науки и теории управления.
Цель исследования. Целью диссертационной разработки является разработка методологических принципов построения автоматизированных систем прогнозирования на экспертной основе с применением параллельных информационных технологий при ограниченной информации в процессе эксплуатации многопараметрических судовых комплексов.
Задачи исследований:
Обосновать возможность и необходимость использования прогнозирования для расширения базы данных автоматизированных систем контроля и управления судовыми объектами.
Сформулировать, классифицировать и формализовать основные этапы проектирования автоматизированных систем прогнозирования (АСП) на основе концептуального моделирования проблемной области исследования с учетом ее иерархии и использования различных методов, способов, технологий и алгоритмов, определяющих математические, информационные и информационно-технологические аспекты процесса создания АСП.
Разработать алгоритмические структуры формализации описания временных рядов с учетом их ограниченности и неопределенности с применением процедур моделирования, интеллектуальной поддержки и семантического анализа случайного процесса.
Обобщить и предложить методологические принципы построения экспертной основы в автоматизированной системе прогнозирования с выбором семантической среды и математического аппарата моделей, позво-
ляющих осуществить выбор наилучших алгоритмов прогнозирования и составляющих логико-математическую основу функционирования экспертных систем.
Разработать принципы параллелизма решающих задачу прогнозирования с повышенной точностью и особенно достоверностью в условиях ограниченной информации и неопределенности, с обеспечением сходимости результатов прогноза.
Разработать реализацию информационно-технологических процедур параллелизма, основанных на применении: совокупности математических моделей, использовании множества контролируемых параметров объекта и конкретных алгоритмических структур различного математического аппарата применительно к судовым энергетическим установкам.
Объект исследования. Объектом исследования является процесс создания автоматизированных систем прогнозирования на экспертной основе с использованием параллельных информационных технологий применительно к судовым энергетическим установкам.
Предмет исследования. Предметом исследования являются методы, способы и алгоритмы прогнозирования изменения состояния СЭУ на основе семантических и формальных моделей экспертных систем и информационно-технологических принципов параллелизма.
Научная новизна работы. В диссертации проведено исследование, обобщение и развитие компьютерных методов формального описания и прогнозирования случайных процессов изменения технического состояния судовых объектов:
Обоснована правомерность использования процедур прогнозирования для расширения базы данных автоматизированных информационных систем на основе введенной v -эквивалентности между наблюдаемым и прогнозируемым случайными процессами, удовлетворяющая как минимум эквивалентности и сходимости в среднеквадратическом и обеспечивающая однородность конечномерных распределений (наблюдаемого и прогнозируемого). При этом показано, что прогнозируемое значение, полученное замкнутым линейным многообразием, дает наилучшую аппроксимацию наблюдаемого значения в "смысле минимума квадрата расстояния.
Сформулировано основное содержание этапов проектирования автоматизированной системы прогнозирования на основе концептуального моделирования предметной области прогнозирования с использованием МПС- и EDA-технологий, включающие в себя модель абстракций, конструктивное пространство, процедурную модель и процедуру автоматизации логического моделирования. При этом разработаны: иерархическая теоретико-множественная модель (использующая методы нечеткой математики
и анализа иерархий), графовая (визуальная) модель представления знаний, вербально-табличные модели информационных потоков.
Разработанное в рамках системы управления временными рядами алгоритмическое обеспечение формального описания временных рядов, включает в себя ряд методов (шаблонов IP-индексов, поиска однородно-стей, с нейросетевой технологией, с гипертекстовой базы знаний), охватывающих структурную, информационную, математическую и процедурную стороны формализации с учетом ограниченности и неопределенности наблюдаемых рядов,
При построении элементов экспертной системы прогнозирования разработаны принципы построения конъюнктивно-дизъюнктивных моделей, создающих семантическую среду в предметной области, и методологические аспекты операции деления конъюнкто-дизъюнктов при выборе метода прогнозирования. Разработаны продукционные модели с четкими и нечеткими схемами вывода, используемые в АСП и представляющие логи-ко-математическуго основу их функционирования.
Предложены алгоритмические структуры, позволяющие решать задачу прогнозирования при разнообразных информационно-технологических принципах параллелизма: интегрированном, категорий-ном и факторном; параметрическом и модельном, с оценкой точности, достоверности и сходимости прогнозов.
Разработаны алгоритмы параллельно-коллективного использования методов различных математических аппаратов в диалоговом режиме: аналитического и вероятностного (матричного) прогнозирования; принципов экстраполяции и математического программирования; «вырожденного» распознавания и моделей регрессионного анализа.
Методы исследования. В диссертационной работе используются методы: общей теории случайных процессов, математической статистики и теории вероятностей, теории множеств, теории графов, теории принятия решений, теории искусственного интеллекта, теории прогнозирования, регрессионного анализа, алгебры логики, нечеткой математики.
Практическая ценность заключается в создании комплекса средств алгоритмически-методической поддержки процессов концептуального проектирования автоматизированных систем прогнозирования, позволяющих решать задачи упреждающего контроля и диагностирования, расширения баз данных, уменьшение неопределенности на экспертной основе с применением параллельных информационных технологий.
В процессе выполнения диссертационной работы разработаны алгоритмические структуры, которые используются в научно-исследовательских работах, в целях обучения, а также на предприятиях в качестве компонент автоматизированных систем контроля и управления,
диагностических комплексов и самостоятельно для решения следующих задач:
Компьютерная поддержка процессов формирования требований и многокритериальный выбор моделей и алгоритмов прогнозирования по ограниченной информации (СППР «Выбор методов и алгоритмов» Borland Delphi 6.0, внедренная в холдинговой компании «Ленинец», центре управления полетами ЦНИИ Машиностроения).
Компьютерная поддержка задач прогнозирования, где используется алгоритмически-программный комплекс, содержащий системы: автоматизированную систему прогнозирования MATLAB6.1 - Statistics Toolbox, внедренная в ОАО «Техприбор».
Компьютерная система оценивания точности, достоверности и сходимости результатов прогноза (интеллектуальная система «Exactness», внедренная в НИИ РЭСПЧП «Прогноз»),
Апробация работы. Основные научные и практические результаты диссертационной работы были представлены и одобрены более чем на 10 международных и всероссийских конференциях и семинарах: Всероссийской научно-технической конференции «Методы и средства оценки и повышения надежности приборов, устройств и систем» (г. Саратов, 1996г.); Международной научно-технической конференции «YAWE'94» (Люблин, Польша, 1994г.); Всероссийской научно-методической конференции «Высшее образование в современных условиях» (Санкт-Петербург, 1996г.); Международных научно-технических конференциях «ТРАНС-КОМ-94,97,99,2001» (Санкт-Петербург); Международных научно-технических конференциях «Региональная информатика, Ш-98,2000,2002» (Санкт-Петербург); «Методы и технические средства обеспечения безопасности информации» (Санкт-Петербург, 2002г.); научно-технических конференциях профессорско-преподавательского состава СПГУВК (1994-2002г.г.); кафедральных семинарах «Диагностика технических объектов» (1994-2002г.г.); Международно-техническом семинаре «Прикладная муль-тисенсорика» (г. Иена, Германия, 2001г.) и др.
Публикации. По теме диссертации опубликовано 39 печатных работ, из них; 4 монографии.
Структура и объем работы. Диссертация состоит из введения, шес
ти глав, заключения, приложений и списка литературы, содержащего 141
наименование. Общий объем работы 304 страницы, который включает 87
рисунков и 5 таблиц, приложения страниц.
Обоснование возможности применения параллельных информационных технологий прогнозирования
В прикладном плане применение параллельных информационных технологий прогнозирования (ПИТП) для решения различных задач проблемной области можно обосновать, исходя «из здравого смысла». Основным критериям здесь является достижение больше точности прогноза по ограниченной информации. Однако в теоретическом плане необходимо более строгое обоснование, показывающее возможность и правомерность использования параллельного оценивания одной и той случайной величины различными математическими операциями и описание результатов оценивания конечномерными распределениями.
Как известно, теорема Колмогорова утверждает, что конечномерные распределения процесса определяют вероятность любого борелевского множества в выборочном пространстве. В дискретном случае класс боре-левских множеств в выборочном пространстве достаточно широк, чтобы включать все события, с которыми обычно встречаемся в приложениях. Даже если непосредственное вычисление вероятностей таких событий связано с большими трудностями, мы знаем, что они однозначно определяются конечными распределениями. Если эти распределения известны, вероятностная структура случайного процесса полностью определена.
Раскроем одно из положений, касающееся дискретного случая. Пусть „ и 7}п эквивалентные процессы, тогда „ и г)п имеют одинаковые конечномерные распределения и Р\ п = rjn) = 1 для каждого фиксированного п = 1,2,.... Так как п принимает лишь счетные множество значений, отсюда следует, Р\п= Пп Для всех «-1,2,...)=1.Таким образом, можно сказать, что два эквивалентных дискретных процесса с вероятностью единица тождественны.
Если же %п - наблюдаемый, a rjn - прогнозируемый процессы, то говорить о строгой эквивалентности нельзя. Можно говорить о «прикладной эквивалентности» или но-эквивалентности», В случае о-эквивалентности „ и г}п имеют одинаковые конечномерные распределения и Р = („ = Т]п + ип) = 1 для каждого фиксированного п - 1,2,.... В этом
случае можно говорить об эквивалентности в среднеквадратичном, когда кроме распределений равны и среднеквадратичные отклонения процессов. В результате можно сформулировать следующее определение:
Определение 1.1. Процессы наблюдаемый (/) и прогнозируемый
rj{t) называются о-эквивалентными тогда, когда их конечномерные распределения F{d;,t) и F{j],t) равны, a P( (t) = T](t))- I или p((t) = ф)+ v(t)) = \ для всех п = 1,2,....
Определение 1.2. Процессы наблюдаемый 4(t) и прогнозируемый т}{і) называются эквивалентными в среднеквадратичном, если их конечномерные распределения F(j;,t) и F{j],i) равны, а Р\сгє - J„)- 1.
Уточним, что пространство П точек со, а-поле F множеств из П и вероятностная мера Р(А), определенная для множеств А из ; образуют вероятностное пространство, которое обозначает (Qt F,P). Множества из Т называются прогнозируемыми. Мера Р(Л) определяет распределение вероятностей на С1. Всегда, когда это потребуется, будем полагать, что вероят ностная мера Р(л) пополнена. Под пополнением а-поля F относительно меры Р{Л) будем понимать окончательное расширение класса множеств, на котором определена вероятностная мера-Составляющая u(t) прогнозируемого случайного процесса может интерпретироваться, как точность прогнозирования, которая в статистическом смысле может быть уменьшена при увеличении числа прогнозирующих оценок случайного процесса. Понятие эквивалентности случайных процессов целесообразно использовать для замены наблюдаемого случайного процесса %{t) прогнозируемым процессом Щ). Пусть i»& и , " две пары эквивалентных случайных величин, то из этого определения следует, ЧТО (is77l) = (&»%) ТаК ЧТ0 как ГОВОРИЛОСЬ ВЬІШЄ, ОНО НЄ Противоречит нашему соглашению относительно эквивалентности (по крайней мере и -эквивалентности). И пусть нормой случайной величины будет норма равна нулю тогда и только тогда, когда Р\ = 0} = 1, т.е. когда эквивалентна нулю.
Обозначим через Я конкретное гильбертово пространство. Его элементами являются случайные величины при условии, что эквивалентные случайные величины считаются тождественными.
Из определения нормы (1.5) следует, что сходимость по норме последовательности точек из Я эквивалентна сходимости в среднем квадратичном соответствующей последовательности случайных величин.
Рассмотрим теперь некоторый случайный процесс, понимаемый как семейство случайных величин %{t\ где t меняется в пределах вещественной оси R. Для каждого t случайная величина (t) соответствует определенной точке в гильбертовом пространстве Я, и, когда t пробегает R, мы получаем однопараметрическое семейство точек, или кривую С в Я. Если случайный процесс непрерывен в среднем квадратичном в некоторой точке tQ, кривая С непрерывна в топологии, порождаемой нормой, в точке tQ, так как в соответствии с вышесказанным %(t) — ;(tQ) по норме. Непосредственно из определения пространства Я следует, что двум эквивалентным процессам соответствует одна и та же кривая С. Для применений геометрических свойств гильбертового пространства для изучения прогнозирования случайных процессов важную роль играет следующая теорема, доказанная в [21]. Теорема о проекции. ПустьМ- подпространство в Них - некоторая точка из Я, не принадлежащая М. Тогда х может быть единственным образом представлена в виде x = x + z, где уеМ , a z ортогонально М. Кроме того расстояния d{x,a)) между х и любой точкой со из М удовлетворяет соотношению d(x,a) d{xiy)i причем равенство имеет место тогда и только тогда, когда со = у. Вектор у называется проекцией х на М, a z - перпендикуляром, опущенным из точки х на М. Конечномерные аналоги этих понятий носят наглядный характер. В приведенной теореме для решения исследуемой проблемы х - необходимо интерпретировать как прогнозируемое значение случайного процесса, у - детерминированная, z - случайная составляющие, а М- подпространство наблюдаемых значений процесса. В связи с этим сделаем несколько замечаний о смысле теоремы о проекции в применении к гильбертову пространству случайных величин. Подпространством, порожденное конечным множеством случайных величин ,..., ,, состоит из всех линейных комбинаций величин gj с постоянными коэффициентами. Если - случайная величина, не принадлежащая М, то проекцией на М будет точка с г +...+ сп%п, для которой квадрат расстояний минимален. Задача нахождения проекции, очевидно, соответствует элементарной статистической задаче нахождения коэффициентов регрессии с} относительно вещественных случайных величин ь...,и. Разность %- Cjgj некоррелирована с каждым из %k, т.е.
Математическое обеспечение концептуального моделирования алгоритмических задач при создании автоматизированных систем прогнозирования
d Среди задач моделирования важное место занимают задачи анализа и синтеза стохастических временных рядов (ВР). Совокупность методов моделирования можно разделить на аналитические и алгоритмические методы. Аналитические методы, как правило относящиеся к классическим, применяются для исчерпывающего задания и анализа случайных процессов (СП) с ограниченным набором статистических характеристик (гауссовские процессы, марковские процессы, пуассоновские процессы и т.п.). Найденная адекватная аналитическая модель, описывающая реальный объект, считается крупным научным открытием. Алгоритмические методы перспективны по причинам ориентированности их реализации на ЭВМ и возможности воспроизводить более широкий класс процессов.
Проведенный обзор методов моделирования ВР с заданными статистическими характеристиками позволил выявить алгоритм скользящего описания (АСО) как наиболее перспективный и простой, с точки зрения машинной реализации и возможности воспроизводить большой класс СП с произвольным одномерным законом распределения вероятностей (ОЗРВ), т.е. одним из видов конечномерных распределений, как это было рассмотрено в разделе 1. Базовый метод АСО изображен в схематичной форме на рис. 3.9. [49]. Метод основан на идее изменения порядка следования элементов- исходной реализации х = {х(-к),х(\ -к\...,х(\\х(2),..} СВ = с заданным видом ОЗРВ. Исходная реализация х получается одними из известных Р-методов генерации (блок 1) некоррелированных величин. Первые к значении исходной реализации помещаются в буферное запоминающее устройство (блок 2) U{t)-\tt(t\ і = \,к}= \с(і-к\ і = ОД-і}, а значение х(о) реализации в блок 4 и на выход схемы, это будет первое сгенерированное значение у(6). Следующие значения y(t), t = 1,2,... получаются с помощью последовательности действий: блок 4 передает значение у = y(t-\) в блок 3; блок 3 получает из блока 2 значения U{t) н выбирает из них наиболее близкое к У по некоторому критерию f(u(t),y ), а указатель qit) выбранного элемента передает в блок 2; блок 2 помещает «?(,)(0 на выход схемы и заменяет его новым uqu\\t)= x\t) из блока 1; увеличивается значение / на единицу и очередное значение заносится в блок 4
Схема имеет управляющие параметры: количество к значений в блоке 2, параметры для Р-метода получения СВ й = \-к %\-к - 4\ 4г )-Дальнейшим развитием АСО являются алгоритм скользящего описания с поиском прецедентов и алгоритм скользящего описания с коэффициентом запаздывания.
Большинство из рассмотренных методов моделирования ВР обладают начальным участком нестационарности. Возможно использовать два метода борьбы с этим: метод отбрасывания в реализациях начальных нестационарных значений; метод отыскания и задания начальных условий которые бы обеспечили стационарность реализации с самого начала или учет нестационарной другой моделью, а АСО использовать для центрированных значений.
Рассмотрим алгоритм скользящего описания с коэффициентом запаздывания [50]. Суть его (рис. 3.10) заключается в развитии стандартной схемы АСО (рис. 3.9) путем добавления нового блока 5 и увеличения длины предыстории (блок 4) с одного до g" значений
Схема имеет следующие управляющие параметры: количество к значений в блоке 2, параметры получения реализации x = {x(i-k g"),i = \,2,..} СВ = :,. .,/ = 1,2,...} (параметры генератора), вид ОЗРВ и границы [g ,g"j дискретной СВ ( = { , ,..) получаемой Р2 -генератором. На начальном этапе работы схемы первые к значений реализации х помещаются в блок 2, а последующие g" в блок 4 и считаются значениями предыстории jy(l-/ ),/ = l,g"\ в момент времени t 1. Блоки 1-3 работают также как и в схеме АСО. Отличием работы схемы является способ получения значения У, который представляется последовательность действий: блок 4 получает из блока 5 реализацию g(t) СВ (t) и передает значение у = y(t g(t)) в блок 3.
При к = \,к" \ схема выдает идентичные результаты с базовой схемой АСО (рис. 3.9). Схема позволяет получать реализации с заданным ОЗРВ (полностью совпадающим со. СВ ) и различными управляемыми видами корреляционных зависимостей. Управление производится с помощью критерия /\ЕУ(г),у), длины буфера упорядочения и параметров ОЗРВ случайных величин и ,
Методика исследования участка начальной нестационарности некоторой модели стохастического ВР у/ = y/t,t = l,N$ по ансамблю реализаций х - [х \i \,п), где х = \t),t \,Nj заключается в следующем. Пусть e={6V)(t), j = ltmtt = \,N} - множество оценок характеристик по ансамблю реализаций х процесса ц/ в каждый момент времени t, некоторые из них могут быть представлены в виде:
1) оценки моментак-то порядка: м[(і)= У\\Х\: Г.t - 1
2) оценки центрального момента к -го порядка:
3) оценки стандартизированного к -го центрального момента:Конкурентоспособность разрабатываемых автоматизированных информационных систем (АИС) повышается за счет их непрерывного совершенствования. Изменение и усложнение выпускаемых АИС требует постоянного увеличения объема проектных работ. При этом необходимо минимизировать затраты времени на проектирование, отладку и внедрение. Это достигается за счет автоматизации решения задач на различных этапах жизненного цикла создаваемых алгоритмических структур и информационных систем.
К новым подходам в области автоматизации проектирования относится методология автоматизации интеллектуального труда (МАИТ), поддерживающая создание автоматизированных систем промышленным способом [43].
Процесс проектирования АСП на основе МАИТ (рис. 2.7) обладает рядом преимуществ: -последовательное отображение формальных моделей, прикладной задачи; -наличие моделей как программно-независимых, так и ориентированных на конкретную программно-техническую среду; -наличие закономерностей формирования и отображения формализованных моделей.
В рамках МАИТ требуется методическое обеспечение концептуального моделирования предметных задач, позволяющее фиксировать систему знаний предметной области в виде формализованных моделей и обеспечивающее смысловое единство всех последующих формально-языковых представлений этих задач. Фиксация системы знаний проектных задач в соответствии с указанной методологией осуществляется вручную в форме спецификаций. При этом при переносе информации с диаграмм в спецификации не исключались ошибки, что снижало эффективность всего концептуального моделирования в целом. Поэтому особую актуальность приобретает задача визуального моделирования системы знаний предметных задач при создании АСП транспортного назначения.
Существующие методологии создания автоматизированных систем контроля, диагностики и прогнозирования, используют визуальное представление различных структур разрабатываемой системы.
Среди средств разработки автоматизированных систем существенную роль играет большая группа CASE-средств. Методологии, используемые в CASE-системах, характеризуются большим разнообразием, которое обусловлено различными целями и сферами применения самих методологий. В настоящее время на рынке программных продуктов имеется около 300 различных CASE-систем. Среди них выделяют шесть групп CASE-средств в соответствии с их функциональным назначением: средства анализа, средства анализа и проектирования, средства проектирования баз данных, средства разработки приложений, средства реинжиниринга, вспомогательные средства (в том числе средства документирования). Для сравнительного анализа наиболее типичных представителей перечисленных групп были определены следующие факторы: -этап создания АСП; - среду функционирования; - основные функции; -вспомогательные функции; - надежность; - простоту использования; -эффективность; - возможность настройки; - переносимость; - сопровождение.
Анализ особенностей проектной_деятельности и их влияния на организацию информации и знаний позволил констатировать
- на этапе проектирования аккумулируется и согласовывается информация обо всем жизненном цикле ИС, включающая описание процесса его перспективного функционирования, ограничений на среду и процесс изготовления, условий утилизации и т.д.
- процесс проектирования базируется на комплексе научных, информационно-технических и практических знаний по самых различным фундаментальным и практическим дисциплинам, фиксируемых в виде научно-технической литературы, нормативных и методических материалов, проектной документации и других источников; - проектное решение может быть много вариантным в силу большого объема вычислительной обработки;
- проектная информация представляется в различных формах, где каждая форма это фрагмент модели проектируемой ИС. Увязка всех фрагментов выполняется проектировщиком и в явном виде не фиксируется.
Однако применение CASE-систем к созданию АСП транспортного назначения затруднено в силу того, что эти средства оптимальны для предметных задач небольшой сложности, в которых преобладают информационно-поисковые процедуры над документально организованной информацией с элементами их статистической обработки.
Исходя из полученных результатов анализа существующих методов и средств визуального моделирования, а также требований к средствам создания АСП транспортного назначения, было предложено использовать в качестве основы методологию автоматизации интеллектуального труда (МАИТ) [44].
Моделирование стохастических временных рядов как средство формализации
Раскроем назначение каждого этапа структуры процедурной модели и представим ее вербальную часть, хотя содержательная направленность очевидна из их названия.
Постановка задачи играет большую роль при решении любой задачи, однако в данном случае этот этап особенно важен, так как во многом предопределяет весь ход процесса прогнозирования. Поскольку именно постановка задачи оговаривает ту часть предметной области, в которой «живет» контролируемый объект и то методическое, алгоритмическое и программное обеспечение, которое может быть привлечено к решению задачи.
Анализ объекта прогнозирования предполагает исследование объекта с различных сторон: физической, конструктивно-структурной, надежностно-параметрической, функциональной, информационной, диагностической и т.д. Если все эти аспекты анализа представить в формализованном виде, желательно в аналитической форме - в виде математических моделей, или в виде словесного описания, конструктивных или функциональных блок-схем, чертежей и номограмм, логических схем и др., а также их семантическую взаимосвязь и отношения, то это и будет составлять основу базы знаний.
Формирование базы знаний (БЗ) о контролируемом объекте и процессах деградации предполагает, прежде всего, и организацию базы данных (БД) априорной информации об изменении работоспособности объекта. Эта информация необходима для решения многих вопросов по выбору моделей прогнозирования и их обучению для решения прикладных задач.
Выбор моделей и разработка алгоритмов прогнозирования зависит от множества рассмотренных ниже факторов и представляют собой достаточно сложную интеллектуальную задачу, эффективно решаемую только с помощью экспертной системы. Каждый из приведенных факторов и его варианты по-разному влияют на выбор метода прогнозирования. Однако оптимальный выбор модели можно осуществить на основе созданной экспертами достаточно полно базы знаний и компьютерного алгоритма выбора из этой БЗ наилучшей модели прогнозирования, удовлетворяющей требованиям поставленной задачи.
Обучение моделей прогнозирования по априорной информации требует проверки работы алгоритма по известным процессам изменения состояния объектов. Обучение, как математическая задача, может быть отнесено к классу оптимизационных проблем поиска описаний.
Планирование процедуры прогнозирования заключается в выборе плана проведения диагностического анализа (выборе временных интервалов, числа измерений контролнруемыхттраметров и т.д.). Иными словами, результатом этапа должен быть план действий - частично упорядоченная совокупность действий.
К этапу диагностического анализа в рамках рассматриваемой процедуры не предъявляется каких-либо особых требований. Здесь, прежде всего, необходима разработка диагностического обеспечения; нужно иметь набор (библиотеку) методов и моделей диагностирования, инструментальные средства диагностирования, позволяющие оценить текущее техническое состояние объекта с необходимой точностью.
Организация диалоговой системы подразумевает организацию процедуры общения ЛПР с ЭВМ, как основы АСП. Поскольку процесс контроля и прогнозирования можно интерпретировать как «запрос-ответ», «запрос на производство прогнозирования - выдача результата прогноза», то диалог заложен в самой природе процесса контроля и прогнозирования. При этом диалог существует всегда вне зависимости от объема решаемой задачи и для всех классов задач. Поэтому важна организация диалогового процесса с разработкой ее теоретических и практических основ.
Выбор механизма параллельной информационной технологии прогнозирования зависит от вычислительных возможностей АСП, необходимой точности и достоверности прогноза, существующего объема моделей и алгоритмов прогнозирования в библиотеке экспертной системы АСП. Выбор механизма ПИТП также является весьма сложной задачей.
Идентификацию выбранных моделей и непосредственно прогнозирование по текущим данным осуществляют по алгоритмам, проверенным на стадии обучения по априорным данным при их наличии, т.е. это чисто счетно-вычислительные действия. Число моделей определяется выбранным механизмом параллелизма ПИТП.
Поставленная задача прогнозирования требует оценки точности получаемых результатов (прогноза) и эффективности прогнозирования.
Принятие решения является заключительным этапом и представляет основу для процесса управления, целью которого могут быть действия, направленные на оптимизацию функционирования диагностируемого объекта или улучшения показателей контролируемого процесса.
Если рассматривать внимательно каждый из перечисленных этапов, то можно заметить, что многие этапы описаны качественно, т.е. без представления каких-либо цифр или формализованных условий. Иными словами, многие описания необходимо было представить в семиотическом, семантическом, логическом или каком-либо другом варианте, т.е. учесть нечеткость тем или иным путем. Эти варианты привносят в АСП, а точнее в ее экспертную основы, отобранные специалисты - эксперты, работающие в области диагностирования (прогнозирования) и управления технических объектов.
Построение экспертной основы в автоматизированных системах прогнозирования
При решении задач в предметной области (ПО) прогнозирования комплексно в полном ее объеме приходится рассматривать множество неформализованных вопросов, разрешение которых невозможно на качественном или вербальном уровне. Однако процесс компьютеризации требует обязательно количественных оценок. Например, при выборе наиболее информативных параметров контролируемого объекта (или процесса) нужно отвечать на вопросы: какой параметр наиболее информативный (важный, значимый), сколько их нужно выбрать и какие, как они упорядочиваются (ранжируются) по важности, на сколько важна их коррелируем ость или статистическая независимость. Причем ответы целесообразно давать в какой-либо количественной мере.
Такие же рассуждения можно привести и о создании библиотеки моделей (алгоритмов) прогнозирования, их важности, специфических особенностях, когда и какой необходимо применять и т.д.
По этим и другим вопросам невозможно принимать решения без квалифицированного специалиста - эксперта или целого коллектива экспертов. Иными словами следует создавать экспертные системы прогнозирования (ЭСП) для тех информационных комплексов, которые постоянно и в полном объеме решают задачи технического диагностирования, в том числе и с получением прогноза.
В связи с этим для создания ЭСП в рамках автоматизированных информационных систем контроля и управления необходимо создавать базу знаний (БЗ) для пяти этапов разработки экспертной системы:
проведение системного анализа ПО на предмет применимости технических ЭСП (этап идентификации);
получение знаний о ПО (процессы извлечения и приобретения знаний от экспертов, модель «идеального эксперта») (этап концептуализации);
выбор способов представления знаний (этап формализации);
выбор инструментальных средств (ИнС) для ЭСП (этап формализации);
организация разработки ЭСП (промышленная технология разработки ЭСП) (этапы реализации и тестирования).
Таким образом для каждого из пяти традиционных этапов создания ЭС (идентификация, концептуализация, формализация, реализация, тестирование) необходима сумма конкретных сведений (знаний), требуемая разработчику ЭСП.
Уже при разработке ЭС стало очевидно, что наиболее ответственным этапом является построение БЗ, для чего в общем случае необходим посредник - так называемый инженер по знаниям (или аналитик), который должен обеспечить проведение домашинных этапов разработки ЭСП, за 141
ключающихся, как правило, в анализе предметной области, извлечении знаний из эксперта и их структурировании.
Эти процедуры оказались самыми тяжелыми, поскольку, с одной стороны, чрезвычайно высок уровень требований, предъявляемых к личности инженера по знаниям (высококвалифицированный специалист в вычислительной науке, обладающий способностями к контакту с экспертами, умеющий побудить эксперта поставлять нужную информацию, умеющий отделять главное от второстепенного и т.д.), а с другой - стали наблюдаться трудности с поисками собственно экспертов (например, эксперт испытывает затруднения с четкой формулировкой своих знаний, не всегда расположен полностью делиться знаниями и т.п.).
Поэтому почти одновременно с появлением индустрии ЭС стали разрабатываться автономные системы, автоматизирующие процессы получения необходимой информации от экспертов. Позднее подобные программные средства получили название "оболочек приобретения", а затем -инструментальных средств (ИнС).
Учитывая важность этапа приобретения знаний для разработки ЭСП рассмотрим более детально наиболее ключевые вопросы, связанные с описанными выше процессами.
В большинстве работ по ЭСП приобретением знаний называют процесс получения знаний от эксперта или каких-либо других источников и передача их в ЭС. Однако наряду с термином «приобретение» сегодня широко используются и другие термины для обозначения этого процесса, например; «извлечение», «получение», «добыча», «формирование знаний». В англоязычной литературе по ЭС используются в основном два термина -acquisition (приобретение) и elicitation (извлечение, выявление, установление).
Для преодоления терминологических различий и достижения общности описания этих сложных процессов воспользуемся предположениями о трех стратегиях получения знаний при разработке ЭСП [82], суть которых представлена на рис.4.2.
Наиболее широкую трактовку имеет термин «приобретение». Как показано в работе [60], приобретение знаний может характеризоваться следующими аспектами.
1. Фазы приобретения знаний.
2. Модели приобретения знаний.
3. Номенклатура приобретения знаний.
4. Уровни знаний.
5. Средства отладки знаний.
Аспекты 1 и 2 носят больше методический и технологический характер, аспекты 3 и 4 -теоретический, а аспект 5 имеет специфический характер, определяемый инженерными особенностями разработки той или иной
ЭСП. Рассмотрим подробнее фазы и модели приобретения знаний.
Несмотря на существование различных точек зрения на число фаз в процессе приобретения знаний, большинство исследователей выделяют три фазы отражающих изменение функций участников проектирования ЭСП на данном этапе (т.е. инженера по знаниям и эксперта):
предварительная фаза - это фаза собственно извлечения знаний из источника знаний на домашинных этапах разработки ЭСП (идентификация проблемы, получение знаний, структурирование, формализация); начальная фаза - это фаза приобретения знаний, которая осуществляется на этапе реализации прототипа ЭСП и обеспечивает наполнение ЭСП знаниями об области экспертизы; фаза наполнения - это фаза, выполняемая в основном на этапах реализации и тестирования и связанная с решением таких задач, как: обнаружение неполноты, неточности или противоречивости знаний, используемых ЭСП; извлечение новых знаний, устраняющих обнаруженные «нефакторы»; преобразование новых знаний в вид, понятный ЭСП. Иными словами, в широком смысле под приобретением знаний понимаются все вышеперечисленные фазы, а в узком смысле - только фаза накопления, когда происходит непосредственная передача знаний в действующий прототип ЭСП находящийся на этапах реализации и тестирования.