Введение к работе
Актуальность темы исследования. Около трех веков в математике безраздельно правил классический гладкий анализ, однако новые, все более усложняющиеся задачи, решаемые научным сообществом со второй половины XX века, все чаще требовали использования негладких функций. Такого рода возникающие проблемы пытались решать, аппроксимируя негладкие функции с некоторой степенью точности гладкими. Но скоро стало очевидно, что такие аппроксимации не могут быть применены для изучения существенно негладких свойств недифферен-цируемых функций (таких, как например нахождение нескольких направлений наискорейшего спуска или подъема), хотя они и позволяют приближенно находить точки экстремума. Поэтому этот подход хотя и помогал эффективно решать ряд задач, не смог обеспечить растущих потребностей исследователей и представлял собой по существу «бегство» от негладкости.
Негладкий анализ занимается изучением свойств функций, не имеющих производной в «классическом смысле», а также множеств, порожденных этими функциями. Можно считать, что научное направление «негладкий анализ» сформировалось в середине XX века в продолжение идей классического гладкого анализа, хотя задачи из этой отрасли математики были поставлены и решены еще П.Л.Чебышевым. Первыми подробно изученными классами недифференцируемых функций явились выпуклые функции и функции максимума. Было показано, что эти функции являются дифференцируемыми по направлениям, откуда, опираясь на производную по направлению, удалось получить локальные аппроксимации таких функций. Дифференцируемость по направлениям негладких функций изучалась в работах Д.Данскина, В.Ф. Демьянова, И.В. Гирсанова, а также С. И. Дудова, Л. И. Минченко. Появилась возможность поиска направлений спуска и подъема, а, значит и построения новых оптимизационных алгоритмов, что повлияло на развитие математического программирования (см., например, работы Ф.П. Васильева, Б.Т. Поляка).
Эти исследования нашли свое отражение в работах В.В. Гороховика, В.Ф. Демьянова, Ф. Кларка, В.Н. Малоземова, Б.Ш. Мордуховича, Б.Т. Поляка, Л.Н. Поляковой, Б.Н. Пшеничного, Р. Рокафеллара, A.M. Ру-бинова, В.М. Тихомирова, Н.З. Шора и многих других математиков и
привели к развитию теории минимакса и выпуклого анализа. Изучение этих классов функций привело к появлению понятия субдифференциала - обобщению «классического» градиента: в точках гладкости субдифференциал совпадает с градиентом, а в точках существенной негладкости (то есть таких, в которых не существует «обычной» производной) субдифференциал превращается в выпуклый компакт. Изучению субдифференциалов в абстрактных пространствах посвящены работы А.Г. Ку-сраева и С.С. Кутателадзе. Оказалось, что необходимым условием безусловного минимума является принадлежность нуля субдифференциалу, а направление наискорейшего спуска есть вектор, направленный от этого множества к началу координат, вдоль которого достигается минимум расстояния от субдифференциала до нуля. Было разработано исчисление, руководствуясь которым можно достаточно просто находить субдифференциалы. Открытие этих объектов повлияло и на развитие математического программирования - появилась возможность строить новые численные методы оптимизации. Успехи в этой области заставили задуматься о поиске обобщений понятия субдифференциала на случай более широкого класса функций. Одной из наиболее успешных попыток в этом направлении явились субдифференциал Шора и его выпуклая оболочка - субдифференциал Кларка. Введение этих понятий позволило изучать произвольные липшицевые функции, но применение этих объектов на практике оказалось затруднительным - они не позволяли получать аппроксимацию функции в точке, давая возможность лишь проверять условия экстремума в ней. Известны и другие попытки, не лишенные указанного недостатка. Среди них субдифференциал Морду-ховича, субдифференциал Мишеля-Пено, приближенные и геометрические субдифференциалы Иоффе, контейнеры Варги. Авторы этих обобщений субдифференциала опирались, как правило, не на производную по направлению, а на некоторые иные конструкции. Кроме того, само построение этих объектов вызывало трудности. Поэтому исследователям пришлось искать компромисс между простотой вычисления объекта и мощностью класса функций, которые этот объект обслуживает. В работах В.Ф. Демьянова и A.M. Рубинова было введено понятие квазидифференциала, позволившее получать положительно однородные аппроксимации функции в окрестности точки. Квазидифференциалы явились полезным объектом для исследования негладких функций - с их помощью удалось выразить условия экстремума, находить направления
спуска и подъема, а следовательно и строить численные методы оптимизации. Но, как выяснилось, квазидифференциальное отображение не является непрерывным, из-за чего возникают трудности со сходимостью численных методов, построенных на его базе. Для того, чтобы избавиться от этого недостатка, были введены кодифферернциалы, позволившие получать аппроксимации функции в окрестности точки в виде суммы максимума и минимума аффинных функций. Кодифференциалы сохранили преимущества квазидифферернциалов (они так же просто вычисляются, множество кодифференцируемых функций совпадает с множеством квазидифференцируемых функций), но ради непрерывности пришлось пожертвовать положительной однородностью. Введение кодифференци-алов позволило строить более совершенные численные методы. Следующим естественным желанием было расширить класс изучаемых функций и попытаться применить хорошо зарекомендовавший себя аппарат кодифференциального исчисления к более широкому классу функций. Далее были введено понятие кодифференциалов второго порядка, изучением которых занималась Э. Капрари. Все это привело к появлению новых инструментов в негладком анализе - коэкзостеров и, явившихся промежуточным этапом на пути к ним, экзостеров. Б.Н. Пшеничным было введено определение верхних выпуклых и нижних вогнутых аппроксимаций (в.в.а. и н.в.а.). A.M. Рубиновым было предложено рассматривать исчерпывающие семейства в.в.а и н.в.а. Демьянов В.Ф. сформулировал определения экзостеров (являющихся обобщением квазидифференциалов), а затем и коэкзостеров (являющихся обобщением кодифференциалов) и развил теорию этих объектов.
Целью диссертации является дальнейшее развитие теории экзостеров и коэкзостеров и их применение к решению новых возникающих задач.
Теоретическая значимость работы состоит в том, что она является дальнейшим развитием исследований в области аппроксимаций негладких функций с помощью аппарата экзостеров и коэкзотеров, впервые условия экстремума выписываются в терминах несобственных экзостеров и коэкзостеров. Эти результаты обобщают результаты В.А. Ро-щиной. Кроме того, в диссертации обобщается теорема A.M. Рубинова о существовании экзостеров.
Практическая значимость работы определяется тем, что в ней получены условия экстремума, которые могут быть использованы при
конструировании новых оптимизационных алгоритмов. Кроме того, как уже упоминалось, класс функций, имеющих коэкзостеры, является более широким, чем класс кодифференцируемых функций. Поэтому приведенное в работе обобщение численного метода мимнимизации негладких функций представляет отдельный интерес.
Основные результаты, полученные в диссертации и выносимые на защиту:
о доказано существование обобщенных экзостеров для произвольных функций, заданных и ограниченных на единичной сфере,
о получены новые условия экстремума в терминах несобственных экзостеров,
о получены условия экстремума кусочно-линейных функций, о выведены условия экстремума в терминах коэкзостеров, о с помощью аппарата коэкзостеров обобщен метод кодифференци-ального спуска для минимизации негладких функций, и доказана его сходимость,
о построено исчисление коэкзостеров второго порядка.
Апробация работы. Результаты, изложенные в диссертации, докладывались и обсуждались на II международной конференции «Control and Optimization with Industrial Applications» (Баку, 2-4 июня 2008 г.), Всероссийской конференции «Устойчивость и процессы управления», посвященной 80-летию В.И. Зубова (г. Санкт-Петербург, 1-2 июля 2010 г.), Всероссийской конференции «Математическое программирование и приложения» Уро РАН (Екатеринбург, 28 февраля - 2 марта 2011 г.), XXXVIII, XXXIX, XL, XLI конференциях «Процессы управления и устойчивость» факультета прикладной математики - процессов управления (г. Санкт-Петербург, апрель 2007 г., апрель 2008 г., апрель 2009 г., апрель 2010 г.), а также на семинарах кафедры математической теории моделирования систем управления (факультет прикладной математики - процессов управления, СПбГУ).
Публикации. По результатам исследований опубликовано 8 печатных работ, две из которых в изданиях, рекомендуемых ВАК.
Структура и объем диссертации. Диссертация состоит из Введения, четырех глав, заключения, списка обозначений и списка литературы. Определения, утверждения, теоремы, примеры, замечания нуме-
руются в соответствии с главой, параграфом, в которых они находятся. Следствия нумеруются в соответствии с теоремами, к которым они относятся. Объем работы составляет 112 страниц. Список литературы включает 73 наименований, 17 рисунков.