Введение к работе
Актуальность. Под идентификацией в широком смысле слова будем понимать определение модели объекта на основании использования выборки за-шумлеиных экспериментальных данных ограниченного объема. Методы теории оптимального планирования эксперимента (ТОГО) призваны повышать эффективность решения этой задачи.
Экспансия методов ТОПЭ, как и любой другой относительно молодой научной дисциплины, проходит по известной схеме: от относительно простых объектов, задач к объектам более сложной природы. Например, от рассмотрения моделей линейных по входящим в них параметрам к моделям нелинейным по параметрам, от моделей статики к моделям динамики, от одномерных моделей к многомерным и т.п.
Линейные регрессионные модели. Методы ТОПЭ для данного класса моделей развивались преимущественно по схеме, когда априори задавалась модель объекта и необходимо было спланировать эксперимент по наиболее точному оцениванию параметров модели. При этом молчаливо предполагалось, что модель адекватна. Недостатком планов, синтезированных под конкретную модель, является их тенденция использовать не всю область факторного пространства, в котором можно проводить эксперимент, а концентрировать наблюдения только в нескольких "характерных" точках. Часто это приводит к тому, что по полученному плану можно оценить только одну модель. Однако если структура модели в точности не известна, то на этапе обработки данных нам придется решать задачу структурной идентификации, где оцениваться должны различные модели из некоторого множества. Таким образом, желательно иметь такой план эксперимента, чтобы он позволял оценивать модели из заданного класса. В условиях структурной неопределенности планирование эксперимента, на наш взгляд, следует направлять в том числе и на решение задачи по уточнению структуры модели.
В классическом регрессионном анализе есть некоторые возможности по управлению структурой модели: это прежде всего механизм проверки гипотез о значимости параметров модели. Однако, на наш взгляд, механизм проверки гипотез о значимости параметров не отвечает задаче подтверждения валидности модели. Сейчас все большее число специалистов склоняются к мысли, что ва-лидность рабочей модели необходимо проверять на дополнительной выборке. Активными сторонниками такого подхода являются ученые, работающие в научной школе, созданной А.Г. Ивахненко (Сарычев, Степашко, Юрачковскнй и др.). Развиваемую теорию идентификации моделей они называют теорией самоорганизации моделей. В дальнейшем мы вместо "теория самоорганизации моделей" будем использовать близкие по смыслу понятия "задача структурной идентификации" или " задача структурной оптимизации" моделей.
Критерии выбора (селекции) моделей, использующие дополнительные экзаменационные выборки, получили название внешних критериев. При использовании методов структурной оптимизации на основе внешних критериев есть возможность получать валидные модели оптимальной сложности. Характерно, что при увеличении уровня шума структуры оптимальных моделей смещаются в сторону более простых моделей.
Методы структурной оптимизации исследованы и развиты в основном для моделей с количественными факторами и для случая пассивного эксперимента. Возможно, что привлечение методов ТОПЭ на всех этапах решения задачи структурной оптимизации позволило бы получать более точные решения, и, наоборот, учет структурной неопределенности на этапе планирования эксперимента позволил бы получать более эффективные планы в целях их дальнейшего использования.
Линейные модели с качественными факторами. Традиционно модели данного типа связывают с задачами дисперсионного анализа по Шеффе. Ыа этапе анализа таких моделей, как правило, привлекается аппарат обобщенных обратных матриц, а на этапе синтеза планов эксперимента - комбинаторные алгоритмы (Rao, Searle, Денисов, Маркова, Малютои, Лисенков, Полетаева, Пономарев и др.). Их применение на практике требует квалифицированного сопровождения со стороны математика-статистика. Большой эффект могло бы дать решение проблемы упрощения соответствующих процедур анализа и планирования эксперимента. В принципиальном плане при анализе таких моделей вместо процедур проверки гипотез о незначимое?» факторов (уровней факторов) можно было бы решать задачу структурной оптимизации. Эго особенно важно при построении моделей со смешанными факторами, поскольку эти модели могут быть использованы и том числе и в целях управления пли прогнозирования. Если говорить о планировании эксперимента, то для практики важно иметь возможность строить планы и виде оптимальной выборки необходимого объема из полного факторного эксперимента (ПФЭ).
Многомерные модемі. Переход от одномерного представления отклика системы к многомерному сопряжен со многими трудностями. Усложняется понятие структуры модели, методы оценивания параметров, проверка адекватности многомерной модели. Если многомерные модели генерируются в соответствии с методологией моделирования по принципу "черного ящика", то для выбора их структуры также можно решать соответствующую оптимизационную задачу. Опыта решения этой задачи в многомерном случае практически нет.
Нелинейные модели. Структурная неопределенность, характерная для линейных по параметрам моделей, здесь трансформируется в параметрическую неопределенность. В этом смысле эти два класса моделей эквивалентны друг другу. Стратегии и алгоритмы планирования эксперимента для нелинейных по параметрам моделей должны учитывать имеющуюся параметрическую неопределенность (Федоров, Григорьев, Денисов, Ермаков, Мелас, Круг, Кабанов, Фомин и др.).
Modem динамических систем. Структурная и параметрическая идентификация моделей динамических систем имеет ряд своих особенностей, связанных с большой сложностью моделируемых объектов. В последние годы при решении задач идентификации моделей псе больше внимания уделяется проблемам оптимального планирования эксперимента (Круг, Фатуев, Глазов, Саванов, Круглое, Денисов, Горский, Рапср, Талалай, Федоров, Успенский и др.). Однако опыта алгоритмических и программных разработок в этой области еще не достаточно. Объясняется это и относительно новой областью применения ТОПЭ и большим разнообразием управляемых ресурсов эксперимента, а также спецификой н сложностью постановок задач. Сказанное относится и к моделям стохастических динамических систем. Пионерские работы в области ТОПЭ для этого класса моделей выполнены зарубежными учеными (Goodwin, Gupta, Kalaba, Mehra, Payne, Zarrop и др.). Алгоритмические конструкции, доведенные до программной реализации для этого класса задач, отсутствуют. Неясным также остается вопрос - в какой степени на задаче синтеза оптимального плана сказывается учет стохасгичности моделируемого объекта.
Решение вопросов активной идентификации моделей объектов невозможно без привлечения соответствующего программного обеспечения (ПО). Разработка такого ПО - важнейшая проблема. Поэтому все проводимые исследования в части использования методов ТОПЭ в задачах структурной и параметрической идентификации должны быть связаны с отбором и разработкой соответствующих эффективных алгоритмов, пригодных для программной реализации.
Итак, данная диссертационная работа посвящена развитию существующей теории структурной идентификации моделей с использованием внешних критериев селекции, посредством привнесения в нее идей .и методов ТОПЭ, распространением ее па объекты с качественными факторами и факторами смешанной природы, развитию теории оптимального планирования эксперимента в части учета структурной неопределенности модели исследуемого объекта и разработки вычислительных схем синтеза оптимальных планов эксперимента для моделей динамических систем, что позволит решать задачи моделирования объектов различной природы в реалистической постановке.
Целью исследования является: рассмотрение задачи структурной оптимизации моделей объектов с количественными, качественными и смешанными факторами, с одномерным и многомерным откликом совместно с задачами оптимального планирования эксперимента; разработка эффективных базовых алгоритмов синтеза дискретных оптимальных планов эксперимента для линейных и нелинейных по параметрам многофакторных моделей в условиях структурной или параметрической их неопределенности; разработка алгоритмов оптимального планирования экспериментов для моделей детерминированных и стохастических динамических систем в различных постановках; разработка программного обеспечения решения задач оптимального планирования эксперимента, структурной и параметрической идентификации.
ІІауміїан новизна:
-
Задача структурной оптимизации регрессионных моделей с использованием внешних критериев селекции рассмотрена совместно с задачами оптимального планирования эксперимента.
-
Методы структурной оптимизации распространены на объекты с многомерным выходом, объекты с качественными действующими факторами и с факторами смешанной природы, при этом рассмотрена идентифицируемость используемых линейных моделей. Аналитически найден базис функций, допускающих оценку, для линейных моделей, моделей с двухуровневыми взаимодействиями при произвольном числе качественных факторов и их уровней варьирования, а также для линейных моделей с факторами смешанной природы.
-
Разработан эффективный подход к решению задачи построения оптимальных планов эксперимента для моделей дисперсионного, ковариационного анализа и общих моделей с переключениями.
-
Для решении задач синтеза оптимальных планов эксперимента развиты концепции дискретизации области планирования и последовательного достраивания. В рамках данных концепций разработаны эффективные алгоритмы.
-
Для моделей динамических систем в виде обыкновенных дифференциальных уравнений разработаны вычислительные схемы планирования моментов наблюдений, входных сигналов, модели наблюдения. Для моделей динамических стохастических систем рассмотрены способы вычисления информационной матрицы Фишера, свойства задачи синтеза оптимального плана входного сигнала. Предложены упрощенные схемы вычисления в задаче планирования входного сигнала аналога информационной матрицы.
-
Для решения задачи параметрической идентификации моделей в пространстве состояний предложено использовать комбинированный алгоритм на базе МНК с регуляризацией. Регуляризация достигается выбором оптимального параметра сглаживающего сплайна при минимизации скалярного функционала от вектора ошибок предсказания.
Теоретический значимость. Теоретическая значимость проведенных исследований состоит в том, что показано положительное влияние методов ТОПЭ на решение задачи структурной оптимизации линейных моделей, предложено использовать для конструирования внешних критериев селекции моделей повторные выборки, разработана последовательная композиционная процедура поиска адекватных моделей с привлечением методов планирования экспериментов, отвечающая реалистической концепции моделирования. Предложен подход по определению базиса идентифицируемых параметрических функций и механизм решения экстремальных задач для построении оптимальных планов эксперимента для линейных моделей с качественными и смешанными факторами. Проблему анализа линейных моделей с качественными факторами предложено решать средствами структурной оптимизации. Получены выражения для вычисления элементов информационной матрицы Фишера при планировании входного сигнала для стохастических моделей динамических систем.
Практическая ценность и реализация результатов. Разработанные алгоритмы активной структурной идентификации линейных по параметрам моделей позволяют с единых методологических и алгоритмических позиций решать задачи моделирования объектов с факторами различной природы в реалистической постановке. Они положены в основу развиваемой концепции объективного анализа данных и могут быть использованы при разработке соответствующего программного обеспечения. Разработанный подход планирования эксперимента позволяет просто И эффективно решать задачу синтеза планов эксперимента для линейных по параметрам моделей с качественными и смешанными факторами. Развиваемая концепция дискретизации области планирования в сочетании с методом последовательного достраивания имеет неоспоримые преимущества в практических задачах синтеза планов эксперимента, поскольку позволяет учитывать любые технологические ограничения, факторы различной природы, гибко наращивать объем плана, строить бипланы. Предложенный подход по сплайн представлению входных сигналов позволяет эффективно решать задачи синтеза оптимальных входных сигналов /для широкого класса моделей (модели временных рядов, разностные и дифференциальные уравнения в пространстве переменных состояния). Рассмотренные свойства задачи синтеза оптимальных планов входного сигнала для стохастических моделей динамических систем позволяют резко упростить ее решение. Эго открывает новые практические возможности для конструирования соответствующих алгоритмов и программных систем. С использованием предложенного алгоритма параметрической идентификации моделей динамических систем открывается принципиальная возможность ставить и решать задачу структурной оптимизации моделей данного класса. Разработанное программное обеспечение позволяет эффективно решать практические задачи активной структурной и параметрической идентификации моделей статических и динамических систем. При помощи предлагаемых алгоритмов, методик и программ репины задачи в области активной идентификации авиационных силовых установок, при исследовании параметрической идентификации моделей химической кинетики, термической обработки твердых теплив, моделирования испытаний электроизоляционных материалов. Программное обеспечение внедрено на ряде предприятий, таких как ЛИИ (г. Жуковский). ЦАГИ (г. Жуковский), НЗХК (г. Новосибирск).
Апробации работы. Результаты исследований в период с 1980 по 1997 гг. докладывались и обсуждались на 2-х Международных, 15-ти Всесоюзных и 3-х Республиканских конференциях и симпозиумах.
Публикации. По результатам работ в период с 1980 по 1997 гг. опубликовано 60 печатных работ, в том числе одна Монография.
Структура работы. Диссертация состоит из введения, восьми глав, заключения, списка литературы из 327 названий и 3-х приложений. Работа изложена на 424 страницах, включающих 71 таблицу и 68 рисунка.