Введение к работе
Актуальность темы. Вероятностно-статистические методы в настоящее время широко используются при решении различных задач судостроения.
Так, при проектировании судов важную роль играет технико-экономический анализ проектных решений. Необходимость обеспечения оптимальных решений требует совершенствования методов технико-экономических обоснований. Увеличение точности такого обоснования должно привести к более корректному выбору технических и эксплуатационных характеристик судна.
Основным математическим аппаратом для нахождения оптимальных решений на ранних стадиях проектирования является имитационное моделирование, позволяющее сочетать использование статистической информации по эксплуатации серии судов с функциональными зависимостями элементов судна и характеристиками процесса его технического использования и ремонта.
Для того, чтобы получить модель, наиболее приближенную к натуре, необходимо иметь данные по эксплуатации судов, которые в силу ограниченного количества судов в серии нередко представляют собой выборки малого объема. Возникает задача извлечения из малой выборки максимальной информации.
Определение затрат и полезного эффекта при проектировании осуществляется с использованием аппроксимационных моделей, устанавливающих взаимосвязи между элементами судов и величиной затрат на их создание и эксплуатацию. Подобные модели строятся с применением регрессионного анализа, который существенно повышает точность предсказания предстоящих затрат. Особенностями применяемых регрессионных моделей являются: случайность зависимых переменных, неизвестность законов распределений переменных и (или) их явная ненормальность. Это потребовало разработки специальных методов регрессионного анализа. Внедрение в практику модульных принципов проектирования значительно повышает эффективность и качество судостроения и уменьшает эксплуатационные расходы. Предложенное автором использование для этой цели методов многомерной статистики — сокращения размерности и кластерного анализа — дало новые постановки задач модульного судостроения и их обоснованные решения.
Волнение морской поверхности оказывает существенное влияние на деятельность морского транспорта, гидротехнических сооружений, морских портов и т.д. Поэтому нужны надежные данные об ожидаемом состоянии поверхности океанов и морей. Освоение
природных ресурсов шельфовых зон океанов и морей, изучение взаимодействий океана и атмосферы делают исследование морского волнения также необходимым и важным.
Использование наиболее полных стохастических моделей, проведение теоретических обоснований областей их применимости способствует повышению адекватности моделей реальной действительности, достоверности и надежности получаемых результатов. В то же время ряд актуальных проблемных вопросов оставался до настоящего времени недостаточно разработанным, и является объектом исследований в настоящей работе. К таким вопросам относятся: представление взволнованной поверхности "в наиболее общем виде, при котором возможна его гауссовская аппроксимация или аппроксимация рядом Эджворта; расширение класса общих условий возникновения распределений Релея и Максвелла, которыми описывается распределение высот волн и радиусов орбитального движения частиц при волнении моря; определение областей изменения коэффициентов асимметрии и эксцесса, при которых используемые в практике судостроения усеченные и неусеченные ряды Грама-Шарлье и Эджворта неотрицательны; разработка эффективного способа моделирования морского волнения как трехмерного случайного поля.
Статистические характеристики ветра и волн, используемые для оценки ходкости судов, получают в результате обработки экспериментальных данных, при этом имеют место, как правило, выборки большого объема. Выбор метода обработки и анализа таких выборок оказывает существенное влияние на достоверность конечных результатов. При этом на практике следует учитывать не только эффективность, но и устойчивость получаемых оценок, а также трудоемкость их вычисления, что потребовало проведения специальных теоретических исследований.
К важному направлению в области судового оборудования следует отнести проблему надежности судовых устройств и их диагностики.
Разработка методов диагностики технических устройств и принятия на их основе решений о состоянии судового оборудования представляет собой сложную задачу, имеющую много различных постановок. Эта задача решена автором настоящей работы в одной из возможных нестандартных постановок, когда каждый из двух диагностических сигналов наблюдается отдельно.
Совершенствование методов статистического и вероятностного анализа данных, а также разработка новых, более эффективных методов, обеспечивает как повышение качества проектных ре-
шений по созданию судна, так и повышение качества его эксплуатации.
Широкому внедрению методов статистического анализа в задачи судостроения немало способствовали статистические программные пакеты. Анализ существующих пакетов программ статистической обработки одномерных выборок показал, что они не предназначены для выборок малого объема. Но и для выборок большого объема они часто не могут быть использованы для решения многих задач судостроения из-за выявленных принципиальных недостатков.
Устранение недостатков существующих пакетов программ привело к необходимости проведения специальных теоретических и практических исследований и созданию на их основе новых пакетов программ автоматизированной обработки данных.
Таким образом, анализ совокупности научно-технических проблем в области судостроения показал, что большинство из них связано с постановкой и решением ряда нетривиальных математических задач. Необходимо было разработать и исследовать вероятностно-статистические методы, в наибольшей степени учитывающие специфику практического применения.
Совокупность нерешенных проблем потребовала разработки и исследования новой методологии решения практических задач в области статистического анализа выборок любого объема (от малого до большого), а также .вероятностного и регрессионного анализа данных в нетрадиционных постановках.
Работа подводит итог исследованиям автора по созданию и развитию нового научного направления в области применения вероятностно-статистических методов в задачах судостроения и выполнена на основе работ в соответствии с планами НИР ЛКИ: І-9А-970 № ГР 01840048109, П-1-Х-729 № ГР 79036873, П-8-5-Х-894 № ГР 01820084552, А-1012 № ГР 01830053623, А-161 № ГР 0880017387, А-222 № ГР 087009417.
Целью работы является развитие нового перспективного направления в области применения вероятностно-статистических методов в судостроении, заключающееся в разработке и исследовании специальной методологии для решения комплекса задач по статистическому анализу данных и исследованию вероятностных моделей.
Научная новизна работы заключается в решении новых, ранее не исследованных проблем:
— выполнены теоретические исследования по сравнению оценок, найденных традиционными методами, по их асимптотическим дисперсиям для основных типов распределений, используемых
в практике судостроения и выработаны рекомендации по их использованию на практике;
усовершенствован математический аппарат для разработки алгоритмов оценок, в частности, доказаны существование и единственность решений систем уравнений правдоподобия, найдены оптимальные уровни вероятности квантильных оценок, минимизирующие асимптотическую дисперсию оценок;
проведено сравнение оценок параметров распределений по их эффективности и устойчивости, при этом в качестве меры устойчивости выбрана нетрадиционная для математической статистики мера: вариационная производная от асимптотической дисперсии;
показано, что известные модификации методов оценок — такие, как корректный метод моментов и метод одношаговых оценок (ОШ-сценки) — практически не имеют преимуществ перед традиционными методами;
для критерия * для ряда важных распределении выявлены минимальные объемы выборок, обеспечивающие возможность использования значений критических точек и поправок к этим значениям при любых объемах выборок;
разработан алгоритм построения обобщенной гистограммы, близкой к оптимальной, для этой цели исследована взаимосвязь оптимальной ширины окна обобщенной гистограммы с выборочной дисперсией;
проведена систематизация методов получения эффективных и линейных эффективных оценок параметров распределений;
разработан новый метод получения наилучших оценок параметров трехпараметрических семейств распределений, основанный на обобщенном методе наименьших квадратов и методе «складного ножа». Апробация и исследование метода проведены на примере распределений экстремальных значений. Показано его преимущество по сравнению с другими методами при малых объемах выборок;
построены доверительные интервалы наименьшей длины для параметров распределений: нормального, двухпараметрическо-го показательного, равномерного, трехпараметрического распределения Вейбулла, гамма-распределения, рассчитаны таблицы критических точек и предложены аппроксимации их значений;
найдено удобное для анализа общее выражение распределения статистики Диксона для отбраковки резко выделяющихся наблюдений для семейств распределений с параметрами сдвига и масштаба и приведен явный вид этого распределения для законов:
двухпараметрического показательного, равномерного и двойного показательного (логвейбулловского);
проведен обзор, анализ и эмпирическое сравнение специальных критериев согласия, разработаны и исследованы новые критерии для гамма-распределения и распределения Вейбулла, а также модифицированный критерий Манн для распределения Вейбулла и модифицированный критерий Саркади для нормального закона распределения;
разработана и исследована новая концепция различения гипотез о типе распределения на основе уклонения Кульбака-Лейбнера и показано ее преимущество перед используемыми для этой цели коэффициентами асимметрии и эксцесса;
разработан и исследован новый, более эффективный, чем известные, метод проверки гипотезы нормальности по совокупности многих малых выборок на основе предложенного модифицированного критерия Саркади;
на основе проведенных исследований разработана методология статистической обработки выборок любого объема и созданы пакеты программ, апробирована их работа как с использованием методов статистического моделирования, так и на натурной статистике;
разработан и исследован новый, основанный на методе максимального правдоподобия, робастный метод оценивания параметров линейной регрессии при наличии ошибок в зависимых и независимых переменных, подчиненных двухпараметрическому обобщенному распределению показательно-степенного типа. При отсутствии ошибок в независимых переменных частными случаями метода являются метод наименьших квадратов и метод наименьших модулей. Определены достоинства предложенного метода;
найдено асимптотическое распределение числа совпадений двумерной выборки в случае, когда компоненты вектора наблюдаются отдельно. Вместо традиционно используемой линии регрессии введена новая характеристика стохастической связи, более естественная в этой ситуации — линия равных квантилей компонент;
введена и исследована новая мера устойчивости оценок линейной регрессии на основе вариационной производной от асимптотической ковариационной матрицы М-оценок и предложены методы получения оценок с наименьшими потерями в эффективности и устойчивости;
даны новые постановки и решения задач модульного судостроения на основе применения методов многомерной статистики: сокращение размерности и кластерного анализа;
предложен новый метод моделирования трехмерного морского волнения, основанный на неканонических представлениях случайных полей и учитывающий дисперсионное соотношение между частотой волны и волновым числом;
проведены теоретические исследования вероятностных задач, полезных при изучении морского волнения и проектировании судов: даны доказательства асимптотической нормальности сумм зависимых случайных величин и векторов, индексируемых дискретными параметрами; дана новая характеризация законов Релея и Максвелла; определены условия неотрицательности усеченных рядов Грама-Шарлье и Эджворта и унимодальности усеченного ряда Грама-Шарлье; для методов нахождения итогового распределения при случайных параметрах исходного, базирующихся на принципе максимума энтропии, определен тот метод, который обеспечивает согласованность распределений параметров при функциональных преобразованиях;
на основе разработанного в диссертации инструментария решен ряд практических задач из области проектирования и эксплуатации судов различных типов, их энергетических установок и морских инженерных сооружений.
Обоснованность и достоверность научных положений, выводов и рекомендаций, сформулированных в диссертации, базируется на использовании наиболее полных математических моделей изучаемых явлений, применении строгих математических доказательств и методов имитационного моделирования на ЭВМ.
Практическая ценность работы заключается в том, что полученные в ней результаты позволяют более эффективно решать задачи вероятностного и статистического анализа данных, в первую очередь из практики судостроения. Полученные аналитические решения, разработанные и усовершенствованные методы, алгоритмы, программы и практические разработки исследований могут быть использованы также широким кругом специалистов в решении практических задач из других областей техники. Созданные на основе проведенных исследований статистические пакеты программ апробированы на практике и позволяют оптимально использовать натурную статистику, повысить точность принимаемых технических решений.
Реализация работы. Представленные теоретические результаты и программные пакеты были использованы при проведении научно-исследовательских работ в Межведомственном инженерном центре математического моделирования в судостроении (СПб ГМТУ), Учебно-исследовательском центре автоматиэированно-
го проектирования судов и их энергетических установок (СПб ГМТУ), в ЦНИИТС, ЦНИИ «Румб».
Теоретические положения работы применены в учебном процессе в курсах математической статистики, эконометрики, теории массового обслуживания и включены в учебные пособия [12], [13], [23], [29].
Основные научные положения, выносимые на защиту.
1. Совокупность исследований и методологических разработок в области выборок большого и малого объёмов, позволяющих производить эффективный статистический анализ данных для широкого класса распределений с полным набором параметров сдвига, масштаба и формы.
Основу этих разработок и исследований состазляют
а) в области выборок большого объёма:
— систематизация и сравнение оценок параметров распре
делений, полученных традиционными методами, по их асимптотиче
ским дисперсиям;
—- доказательства существования и единственности оценок максимального правдоподобия;
— определение оптимальных уровней квантилей, при кото
рых достигается минимум асимптотической дисперсии квантильных
оценок.
б) в области выборок малого объёма:
разработка инженерного метода расчёта близкой к оптимальной обобщённой гистограммы, основанного на взаимосвязи оптимальной ширины окна гистограммы и выборочной дисперсии;
систематизация методов получения эффективных и линейных эффективных оценок параметров распределений;
разработка нового метода получения наилучших оценок параметров трёхпараметрических семейств распределений;
построение доверительных интервалов наименьшей длины для параметров распределений, наиболее часто используемых на практике, с расчётом таблиц коэффициентов;
анализ и эмпирическое сравнение специальных критериев согласия;
разработка и исследование новых и модифицированных критериев согласия для распределений Вейбулла, гамма и нормального;
разработка метода отбраковки резко выделяющихся наблюдений для широкого класса распределений, отличающихся от нормального распределения с нахождением удобного для анализа общего выражения распределения статистики критерия.
-
Создание на основе полученных результатов сервисных пакетов статистических программ ZACON, UGRAND, ZACMAL, MALIC анализа данных, апробированных на решении практических задач из области судостроения.
-
Совокупность исследований в области развития вероятностных методов и методов многомерной статистики применительно к практике судостроения. Основные результаты в этом направлении заключаются в следующем:
доказательство асимптотической нормальности сумм зависимых случайных величин и векторов, индексируемых дискретными параметрами;
новые параметризации законов распределения Релея и Максвелла;
определение областей изменений коэффициентов асимметрии и эксцесса, обеспечивающих неотрицательность и унимодальность усеченных рядов Грама-Шарлье и Эджворта.
для методов нахождения итогового распределения при случайных параметрах исходного, которые базируются на принципах максимума энтропии, определение метода, обеспечивающего согласованность распределений параметров при функциональных преобразованиях;
разработка нового метода имитационного моделирования трехмерного морского волнения, основанного на неканоническом представлении случайных полей и учитывающего дисперсионное соотношение между частотой волны и волновым числом;
разработка нового робастного метода оценивания параметров линейной регрессии в схеме конфлюэнтного анализа;
нахождение для задач диагностики в нетрадиционной постановке асимптотического распределения числа совпадений верно репродуцированных пар при натуральном совмещении наблюдаемых компонент двумерного случайного вектора, когда компоненты наблюдаются отдельно;
введение и исследование новой меры устойчивости оценок линейной регрессии, основанной на вариационной производной от асимптотической ковариационной матрицы М-оценок, и выработка рекомендаций по выбору оценок с учетом их эффективности и устойчивости;
новые постановки и решения с использованием разработанного инструментария практических задач судостроения по проектированию и эксплуатации судов, их энергетических установок и морских инженерных сооружений.
Апробация работы. Результаты работы докладывались на научных конференциях профессорско-преподавательского состава СПб ГМТУ, научных семинарах ПОМИ РАН, использовались в курсе лекций, прочитанных в Китайском кораблестроительном научно-исследовательском центре (CSSRC, Wuxi, China, 1997), были представлены на следующих научных конференциях: 2-й Вильнюсской конференции по теории вероятностей и математической статистики, 1977; Всесоюзной научно-технической конференции «Проблемы модульного судостроения (Модуль-82)», Ленинфад, 1982; 14-th session SMSSH-85, Varna, 1985; Всесоюзной конференции "Актуальные проблемы вычислительной и прикладной математики", Новосибирск, 1987; Всесоюзной научно-технической конференции "Физико-математическое моделирование при решении проблем гидроаэромеханики и динамики судов и средств освоения мирового океана», XXXIV Крыловские чтения, Ленинфад, 1989; Всесоюзной научно-исследовательской конференции "Повышение эффективности экспериментальных исследований гидромеханики судна для решения проблемных задач в судостроении", Калининфад, 1990; Всесоюзной научно-исследовательской конференции "Методы прогнозирования и способы повышения мореходных качеств судов и средств освоения океана", XXXV Крыловские чтения, Ленинфад, 1991; International Conference Asymptotic in Mechanics (AiM), S.-Petersburg , 1994; 13-th International Conference on Port and Ocean Engineering under Arctic Conditions (POAC'95), Murmansk, 1995; Международной конференции "Современные проблемы прикладной и вычислительной математики" (АМСА-95), Новосибирск, 1995; 2-й международной конференции "Освоение шельфа арктических морей России" (RAO-95), СПб, 1995; 3-й Международной конференции по разработке и коммерческому применению технологий в полярных районах (POLARTECH-96), СПб, 1996; 6-й Международной конференции женщин-математиков, Чебоксары 1998; 3-й Сибирский конфесс по прикладной и индустриальной математике (ИНПРИМ-98), Новосибирск, 1998; 3-я Международная конференция и выставка по морским интеллектуальным технологиям (MORINTECH-99), Санкт-Петербург, 1999.
Публикации. По материалам диссертации опубликовано 67 научных работ в изданиях АН СССР, периодических научно-технических отечественных и иностранных журналах, межвузовских сборниках, трудах международных и всесоюзных конференций и шести учебных пособиях, из них 22 печатные работы опубликованы без соавторов.
Структура п объем работы. Диссертация состоит из введения, шести разделов, заключения и списка литературы. Она содержит 396 страниц, в том числе 55 таблиц, 25 рисунков и библиографию из 421 наименования.