Содержание к диссертации
Введение
Глава 1. Общие вопросы моделирования звездных систем 9
1. Понятие математической модели галактики 9
2. Представление наблюдательных данных поверхностной яркостью 13
3. Описание пространственного распределения светимости 17
4. Связь распределения светимости с распределением масс (отношение масса/светимость как функция места и как гросс-параметр) 22
5. Наблюдательные данные для построения динамических моделей 26
6. Интегральное уравнение, связывающее распределение светимости с яркостью. Прямая и обратная задачи. Учет поглощения света 31
Глава 2. Проблемы построения параметрических моделей распределения светимости 38
1. Обзор исследований по построению параметрических моделей " распределение светимости-яркости" 38
2. О точности конкретных моделей 44
3. Математическая постановка задачи 48
4. Обзор методов минимизации функционала 53
Глава 3. Разработка метода решения обратной задачи 65
1. Выбор метода и его модификация 65
2. Описание моделей 70
3. Алгоритм решения задачи 74
4. Проведение численных экспериментов. Результаты вычислений 85
5. Анализ вычислительных погрешностей 98
Заключение 108
Литература 114
Приложение 123
- Понятие математической модели галактики
- Представление наблюдательных данных поверхностной яркостью
- Обзор исследований по построению параметрических моделей " распределение светимости-яркости"
Введение к работе
Актуальность темы. Задача изучения структур галактик является одной из наболее сложных задач астрономии, для ее решения нередко применяют методы моделирования. Первая в науке схематическая модель для нашей Галактики была построена В. Гершелем в конце XVII века, с помощью которой можно было получить общее представление о ее строении на основе звездных подсчетов.
В ходе исследования галактик в числе прочих используется метод моделирования пространственного распределения светимости, где неизвестные параметры моделей ищутся по имеющимся наблюдательным данным. Т.е. решается задача депроекции. Постановка ее не является новой; авторами многих работ предлагались различные методы решения этой задачи для различных моделей галактик и их модификаций. Основные вычислительные трудности здесь заключаются в следующем:
рассматриваемая задача не является корректной (в соответствии с определением Ж.Адамара корректно поставленных задач);
она решается для неограниченных распределений светимости и яркости;
существует проблема единственности полученного решения.
Под неограниченностью в п.2 понимается бесконечность соответствующего распределения.
К проблемам исследования звездных систем подходят по-разному. Например, в работе Dejonghe Н. к рассмотрению предлагаются динамические модели галактик, в качестве минимизируемого функционала выбирается квадратичная функция. Пространственное распределение моделируется линейной комбинацией трех интегралов движения, в которой значения интегралов известны, неизвестными являются только коэффициенты линейной комбинации. Далее идет процесс поиска квадрата разности модельного выражения и наблюдательных данных. Минимум квадратичной и линейной функции найти проще, поэтому предлагаемый метод в общем случае неприменим.
Emsellem Е. и Monnet G. на первом этапе поиска параметров общей фотометрической модели галактики "восстанавливают" поверхностную яркость, применяя PSF (point spread function - функция рассеяния точки), далее представляя ее выражение суммой гауссиан. На втором этапе решается задача депроекции, т.е. непосредственно осуществляется поиск параметров пространственного распределения светимости. Для этого составляется функционал, минимум которого ищется методом наименьших квадратов. Светимость при этом также моделируют разложением в ряд по функциям Гаусса. Единственность решения достигается за счет того, что уровенные поверхности светимости полагают трехосными подобными эллипсоидами. Однако, и здесь рассматривают частный случай пространственного распределения. Подобные модели достаточно часто применяются на практике, но использование их в известной степени упрощает задачу депроекции, поэтому они являются не самым лучшим приближением реальной картины светимости галактик.
Цель диссертационной работы- проведение исследований, направленных на построение численного метода, позволяющего обойти основные сложности, возникающие в процессе решения задачи депроекции. Поэтому основные задачи состоят в следующем:
выбор наиболее приближенной к реальности модели галактики и исследование ее внутренней непротиворечивости;
исследование методов решения этого класса задач и как следствие -создание численного алгоритма по нахождению параметров модельного распределения светимости;
анализ найденного решения и сопоставление полученных результатов с результатами авторов других работ;
оценка адекватности предложенной модели и эффективности построенного алгоритма.
Методика исследования. В работе используются методы математического моделирования, математической статистики и численные методы.
Научная новизна. На примере двух моделей галактик был разработан численный метод решения обратной задачи депроекции. Некорректность ее снимается за счет поиска решения в пространстве параметров модели. Новым в диссертации является создание алгоритма, основанного на комбинации трех оптимизационных методов и добавление к нему процесса генерации компонент вектора, позволяющего уточнить найденные приближения модельных параметров на промежуточных этапах минимизации функционала. Основываясь на анализе полученных результатов и оценке погрешностей, было показано, что для рассмотренного типа моделей галактик построенный алгоритм минимизации нелинейной целевой функции позволяет найти минимум (т.е. параметры моделей) за конечное число шагов и для любого физически правдоподобного вектора параметров модели, выбранного в качестве начального приближения. Кроме того, с помощью этого метода можно улучшить уже полученные результаты посредством варьирования помех в ходе повторной минимизации функционала.
Теоретическая и практическая ценность работы определяется тем, что построенный алгоритм применим для создания и корректировки других параметрических моделей спиральных галактик с нелинейными функциями описания для отыскания неизвестных параметров.
Апробация работы. Основные результаты, представленные в диссертации, докладывались на семинарах кафедры космических технологий и прикладной астродинамики (ПМ-ПУ СПбГУ), на семинарах по звездной динамике К.Ф. Огородникова (MAT-МЕХ СПбГУ) и на следующих научных конференциях: XXX и XXXI конференциях студентов и аспирантов ПМ-ПУ СПбГУ "Процессы управления и устойчивость"(Санкт-Петербург, 1999, 2000); международной конференции "Stellar Dynamics: from Classic to Modern"(Санкт-Петербург, 2000); международной конференции "Order and Chaos in Stellar and Flanetary Systems"(Санкт-Петербург, 2003); всероссийской астрономической конференции ВАК-2004 "Горизонты Вселенной"(Москва, ГАИШ, 2004).
Публикации. Основные результаты диссертации опубликованы в пяти печатных работах и две из них - в журналах, входящих в перечень ВАК.
Структура и объем работы. Диссертация состоит из введения, трех глав, заключения и приложения. Она содержит 131 страницу текста (включая 9 страниц приложения), 24 таблицы, 13 рисунков и список литературы из 118 наименований.
Понятие математической модели галактики
Моделирование - это процесс замещения одного объекта (оригинала) другим (моделью) и изучение свойств модели. Очевидно, что такое замещение производится для упрощения и ускорения изучения свойств оригинала.
В самом общем случае объектом-оригиналом может быть как реальная, так и воображаемая система [52]. Пусть она описывается набором параметров So и характеризуется определёнными свойствами, а их количественной мерой является множество характеристик YQ, при этом свои свойства система проявляет под влиянием внешних воздействий X. Обозначим далее через S все множество параметров, оно вместе со своими значениями отражает внутреннее состояние системы, а именно: структуру и принципы функционирования. Характеристиками этого множества будут, главным образом, её внешние признаки, которые важны при взаимодействии с другими множествами параметров S.
Характеристики S находятся в функциональной зависимости от его параметров. Иначе говоря, система определяется совокупностью множества параметров, функций описания и связей между ними. Каждая характеристика системы уо С Yo определяется чаще всего ограниченным числом параметров: 5ОА С SQ. А остальные параметры не влияют на значение данной характеристики S. И вообще, при исследовании конкретного объекта представляют интерес только некоторые характеристики множества параметров S: у С Уо при известных внешних воздействиях на систему хтп С X. Модель, в принципе, это та же система, со своими множествами параметров (обозначим эти множества через Sm) и своим набором характеристик системы (пусть характеристиками будут Ym).
Как правило, у моделируемого объекта и модели по одним параметрам прослеживается сходство, а по другим - расхождение. Кроме того, замещение одного объекта другим возможно в том случае, если интересующие исследователя характеристики оригинала и модели определяются однотипными подмножествами параметров и связаны одинаковыми зависимостями f с этими параметрами [52]:
Решая (1.1.2), ищут характеристики модели (утп &-ая характеристика, Утп С Ym) при наличии внешнего воздействия на модель хтп, хтп С X, и с учетом модельного времени tm. При этом имеют место такие зависимости: Sm = i {Smi), х = и){хтп) и t = mtm (т - масштабный коэффициент) на всём интервале отдельные периоды времени. Отсюда можно с некоторым приближением сделать вывод о том, что модельные характеристики Ор связаны с характеристиками М зависимостями у0 = (p(ymk), а множество характеристик модели Ymk = {ymk} является отображением множества интересующих исследователя характеристик оригинала y0k = {у0к], т.е. V Yak- утк или ip : Yok - Ymk.
Очевидно, что моделирование имеет смысл, когда у модели отсутствуют признаки оригинала, препятствующие его исследованию.
Что касается математических моделей, то они представляют собой формализованное представление оригинала (моделируемого объекта) с помощью абстрактного языка, т.е. математических соотношений, которые, по возможности, полно отражают процесс функционирования системы. Для составления математических моделей используют любые математические методы, например, алгебраическое, дифференциальное, интегральное исчисления и т.д. К методам абстрактного описания систем относятся также языки химических формул, схем, чертежей, карт, диаграмм и т.п. Выбор вида модели определяется особенностями изучаемой системы и целями моделирования, т.к. исследование модели позволяет получить ответы на определённую группу вопросов. Для получения другой информации может потребоваться модель другого вида.
В [52] математические модели классифицируют как детерминированные и вероятностные, аналитические, численные и имитационные; однако, нас больше интересуют последние три.
Аналитической моделью называется такое формализованное описание системы, которое позволяет получить решение уравнения (1.1.2) в явном виде, используя известный математический аппарат. Численная модель описывается такой зависимостью (1.1.2), которая допускает только частные решения для конкретных начальных условий и количественных параметров моделей.
Имитационной моделью называют совокупность описания системы и внешних воздействий, правил изменения состояния системы под влиянием внешних и внутренних возмущений. Эти алгоритмы и правила не дают возможности использования имеющихся математических методов аналитического и численного решения, но позволяют имитировать процесс функционирования системы и производить вычисления интересующих характеристик.
Процесс построения математических моделей галактик идет по той же схеме, которая была дана выше: точно также между характеристиками исследуемой звездной системы и ее предполагаемой моделью строят зависимости вида (1.1.1) и (1.1.2). В данном случае эти зависимости представляют собой функции описания моделируемой системы с соответствующими параметрами, которые уточняются в ходе вычислений, а также связи между первыми и вторыми.
Представление наблюдательных данных поверхностной яркостью
Понятие яркости в астрономии, как известно, применяется только для протяженных источников (например, галактик, скоплений, туманностей), потому что уже в самом ее определении присутствует площадь излучающей поверхности. Отсюда и происходит название "поверхностная" яркость.
Итак, яркостью В объекта в заданном направлении называют энергию, излучаемую в единицу времени внутри единичного телесного угла элементом поверхности, причем проекция этого элемента на плоскость, перпендикулярную выбранному направлению, имеет единичную площадь [18]. Это определение можно применить для поля излучения в любой точке пространства, и тогда вместо "яркости" вводят термин "интенсивность".
Величина телесного угла, под которым видна проекция излучающей площади, убывает пропорционально квадрату расстояния до источника, поэтому яркость источника не зависит от расстояния до него и измеряется либо как поток с 1 2 дуги видимой поверхности источника, либо в единицах светимости Солнца на площадь в 1пк2:
Почти вся наблюдательная астрономия построена на приеме и анализе электромагнитного излучения, идущего от небесных тел. С этой точки зрения это излучение является, по сути, единственным источником информации о космических объектах. По этой причине результаты исследований поверхностной фотометрии играют далеко не последнюю роль в астрономии. В соответствии с определением Н.Александровича [50], фотометрия - это область оптики, занимающаяся измерением энергии, переносимой электромагнитными волнами оптического диапазона, но ее основные понятия (яркость, светимость, освещенность, поток излучения и т.д.) применимы и для других диапазонов. Исторически так сложилось, что оптический диапазон был первым диапазоном, в котором проводились астрономические наблюдения. Человеческий глаз воспринимает излучение в интервале длин волн от 0.38 до 0.70, с макимумом чувствительности при величине длины волны Л = 0.55 -г 0.59. Поэтому оптическая астрономия занимается исследованием электромагнитного излучения с длинами волн от 0.3 до 10 мкм, что как раз соответствует оптическому окну прозрачности земной атмосферы [50].
Результаты поверхностной фотометрии - это либо таблицы со значениями поверхностной яркости в конкретных точках плоскости, на которую проектируется пространственное распределение светимости, либо графики в виде карт изофот (уровенных линий поверхностной яркости). По изофотам можно гораздо проще и быстрее определить общую структуру исследуемого объекта - его центральные и внешние области, а также приближенно оценить закон распределения поверхностной яркости. К графическим способам отображения фотометрических данных относят и построение одномерных профилей поверхностной яркости /І(Г). Одномерные профили не описывают распределение яркости в галактиках в полной мере, но их успешно используют для качественного анализа структуры галактик. К наиболее распространенным видам профилей относят такие, как фотометрический разрез, эквивалентный профиль, усредненный по азимуту разрез и т.д. [38].
Обзор исследований по построению параметрических моделей " распределение светимости-яркости"
При построении параметрических моделей, согласно [49], может задаваться не только форма изоповерхностей пространственного распределения светимости и связи между функциями описания, но и аналитический вид этих функций, содержащих ряд параметров. Очевидно, что в зависимости от специфики конкретной задачи, от целей, которые ставит перед собой исследователь, изучение ли это физических характеристик галактик, получение каких-то дополнительных сведений об их химическом составе и т.д., рассматриваются самые различные модификации моделей. При этом общее число параметров варьируется и может быть достаточно большим. Если ставится задача построения параметрической модели "распределение светимости-яркости", то часто под этим понимается создание такой функции описания пространственного распределения светимости, которое бы наиболее полно, по возможности, отражало картину распределения светимости конкретной галактики. Например, при исследовании эллиптических галактик, балджей спиральных или центральных областей тех и других, изоповерхности светимости аппроксимируют эллипсоидами, как в [58], [77], [111], [ИЗ]. Яркость в таком случае распределена по степенному закону г г/п, п Є N. В работе [76] рассматриваются разные значения п для центральных областей галактик и выводят связь этих значений от абсолютной звездной величины галактик.
Светимость в дисках спиралей моделируют экспоненциальным законом. Например, для дисковых галактик распределение светимости, предложенное авторами [90] и [91], хорошо описывается выражением вида: где Х»о - светимость в центре диска, h и ZQ - структурные параметры, показывающие концентрацию звездной материи диска в горизонтальном и вертикальном направлениях соответственно, a, R,z - цилиндрические координаты. Если угол наклона і луча зрения к оси симметрии равен нулю, т.е. галактика наблюдается "плашмя", то для этой модели поверхностная яркость записывается .
Различия между модельными распределениями светимости зависят от выбора компонент модели, от угла зрения, под которым наблюдается галактика, затем, ограниченным или нет считают распределение, учитывается ли поглощение света (в формулах (2.1.2), (2.1.3) оно не учитывается), и от многих других аспектов, характеризующих особенности построенных моделей.
Распределение светимости принимают ограниченным, когда для построенной модели расчеты предполагается произвести до какого-то предельного значения: если все вычисления реализуются в пределах некоторого расстояния г от центра, в какой-то части галактики - во внешней или внутренней, или же, если речь идет об относительной светимости, связанной с системой фотометрических параметров Вокулера, изложенной в общих чертах, в частности, в [38].
Что касается разницы в составляющих модели, т.е. в ее компонентах, то главным образом, она обусловлена, во-первых, морфологическим типом исследуемой галактики (ее структурой), и во-вторых, способом задания этих компонент. В обоих случаях исследователь принимает во внимание те особенности исследуемого объекта, которые ставит целью изучить. Соответственно этому определенным образом вводятся такие параметры модели, которые обозначат ее специфику. В отличие от спиральных, эллиптические галактики не имеют структуры, потому, как было сказано ранее, их чаще всего моделируют эллипсоидальным распределением светимости. Для них также могут рассматриваться модели центральных областей. Для галактик SO, промежуточного типа между эллиптическими и спиральными, строятся модели с компонентами "ядро + линза", "ядро + бар + кольцо"и т.п. (см. [7], [38]). Компонентами моделей спиральных галактик могут быть такие: "балдж-f- диск", "балдж +диск + гало", "балдж + диск + бар", "диск+ гало"и т.д.
При исследовании спиральных галактик авторами многих работ часто используется модель светимости (2.1.1), состоящая из одного компонента - диска. Например, в [55] выражением (2.1.1) моделируют поперечное сечение галактики NGC 891 или, иначе, профиль светимости, перпендикулярный к плоскости диска.
В двухкомпонентных моделях, где строятся модели пространственного распределения светимости в балдже и диске, диск, как уже упоминалось, описывается экспоненциальным законом, а балдж -степенным законом Вокулера. Если в исследуемой галактике учитывается поглощение света темной материей, тогда включается еще и компонент, моделирующий пылевой слой. Во многих работах распределение пыли считают однородным, и в этом случае используются модели однородного слоя и поглощающего экрана. В качестве вариантов моделей пылевых слоев, более приближенных к реальности, часто используют модели сандвича и тройную экспоненциальную модель. В последней, в отличие от других, распределения пыли и звезд меняются в вертикальном и горизонтальном направлениях. Их достоинства и недостатки в общих чертах представлены в [38]; применение моделей пылевых слоев для конкретных галактик можно найти, например, в работах [67] и [71].
Приведем в качестве примера еще одну модель распределения светимости в спиральной галактике, состоящей из трех компонент:, диска и пылевой материи [92]. Светимость в балдже моделируется эллипсоидом, так что в проекции на некоторую картинную плоскость изофоты поверхностной яркости получаются эллиптическими. Для диска тоже, как обычно, берется экспоненциальное распределение светимости два характеризуют концентрацию звезд в диске и пыли по горизонтали, а вторые два - их концентрацию по вертикали. Из (2.1.5) видно, что пыль, как и звезды, распределена по экспоненциальному закону, и такая закономерность взята не случайно, потому что, согласно наблюдениям, поглощающие свет эффекты прослеживаются в дисках галактик, а точнее, в спиральных рукавах. Выражение, аналогичное (2.1.4) для светимости диска рассматривалось в [55].
При построении параметрических моделей "распределения яркости -светимости" имеет значение и то, как задаются наблюдательные данные, т.е. поверхностная яркость. Их можно брать из каталогов, и можно также генерировать, создавая искусственные данные наблюдений для разработки модели, при отладке численного алгоритма нахождения ее параметров. Также, как и значения модельного распределения светимости при заданных аргументах, искусственные значения яркости получают в соответствии с каким-то правилом или законом. В зависимости от предполагаемой формы изофот - эллиптической, круговой, ящичной, дисковой, цилиндрической и т.д. - задают их общее уравнение вида (,?/) = const, где ,t) координаты в плоскости проекции. Например, в работе [105] решается задача депроекции для эллиптических галактик нестандартной, отклоняющейся от эллипосида, формы. Очевидно, что изофоты таких галактик (они являются ящикоподобными) явно будут отличаться от эллипсов. В связи с этим для описания внутреннего распределения светимости галактик автор вводит два семейства моделей. Оба семейства содержат эллипсоидальное распре