Содержание к диссертации
Введение
Глава 1 Обзор методов таксономии 9
1.1 Основные понятия. Базовые эмпирические гипотезы 10
1.2 Меры близости и сходства 16
1.3 Основные типы процедур кластерного анализа 22
1.3.1 Методы кластеризации полным перебором 22
1.3.2 Кластеризация методами математического программирования 23
1.3.3 Кластеризация на основе матрицы сходств 27
1.3.4 Неиерархические кластер-процедуры 28
1.4 Обзор литературы 35
1.5 Постановка и систематизация задач исследования 43
1.6 Выводы 46
Глава 2 Постановка и методы решения задач оптимальной таксономии 48
2.1 Условные обозначения, определения и допущения: 48
2.2 Содержательные и формальные постановки задач 49
2.3 Выбор математических моделей 56
2.3.1 Метод «Дельфи» 56
2.3.2 Применение таксономии для выбора математической модели 65
2.4 Алгоритмы поиска оптимальной таксономии объектов 68
2.5 Выводы 85
Глава 3 Решение прикладных задач оптимальной таксономии применительно к различным предметным областям 86
3.1 Использование таксономии для поиска эффективных режимов функционирования технологических линий 86
3.1.1 Допущения и принципы 90
3.1.2 Процедура генерации рекомендаций по реализации технологических режимов 90
3.1.2.1 Этапы решения задачи 91
3.1.2.2 Алгоритм выделения рекомендуемых и нерекомендуемых режимов 92
3.1.2.3 Анализ взаимного расположения первых двух таксонов 93
3.1.2.4 Определение основных характеристик выделенных режимов 96
3.2 Использование таксономии для автоматизированного контроля уровня толерантности и напряженности в регионах Северного Кавказа 99
3.2.1 Определения, обозначения 102
3.2.2 Математическая модель поиска напряженности и толерантности 104
3.3 Использование таксономии при прогнозировании персональной успеваемости студентов 110
3.3.1 Допущения и принципы 112
3.3.2 Описание этапов решения задачи 113
3.4 Выводы 116
Глава 4 Постановка и результаты экспериментальной проверки программных комплексов 117
4.1 Поиск оптимальных стратегий изготовления МКПО 118
4.2 Анализ уровня толерантности и напряженности народов Северного Кавказа 122
4.3 Прогнозирование персональной успеваемости студентов 125
Заключение 129
Литература 130
Приложение 141
- Основные понятия. Базовые эмпирические гипотезы
- Содержательные и формальные постановки задач
- Анализ взаимного расположения первых двух таксонов
- Поиск оптимальных стратегий изготовления МКПО
Введение к работе
Существуют различные технологии принятия решений: построение
математических моделей, использование голосования, учет экспертных оценок, таксономия, и т.д.
Наиболее мощной методикой сегодня является принятие решений на базе оптимизационных математических моделей. Достоинством ее является гарантированность получения оптимального решения, а к недостаткам можно отнести её ресурсоёмкость, сложность реализации и требование высокой квалификации лиц, использующих эту технологию. Так, для построения математической модели требуется высокая компетентность исследователя, хорошее знание предметной области разрабатываемой модели, высокая математическая культура разработчиков, навыки работы на ЭВМ и т.д. Тем не менее, несмотря на перечисленные трудности, данный способ является наиболее предпочтительным во многих ситуациях.
Полярной по отношению к этой технологии принятия решений, является другая, более древняя и более простая — таксономия — теория классификации и систематизации сложно организованных областей действительности [1]. Суть таксономии в свое время изложил Демокрит в «Письме ученому соседу»: «Если тебе, мой друг, нужно разобраться в сложном нагромождении фактов или вещей, ты сначала разложи их на небольшое число куч по похожести. Картина прояснится, и ты поймешь природу этих вещей»[2]. Иными словами принятие решения с помощью таксономии сводится к классификации: достаточно отнести объект к одному из таксонов, для компонент которого известно решение. Таким образом, достоинством таксономии является простота, этим объясняется её популярность: на ней базируются различные уставы (например, воинские, монастырские, учебных заведений), кодексы, методы диагностики в медицине и технике и т.п. Особо важное место таксономия занимает в тех отраслях науки, которые связаны с изучением массовых явлений и процессов. Необходимость развития методов таксономии и их использования
продиктована, прежде всего, тем, что они помогают построить научно обоснованные классификации, выявить внутренние связи между единицами наблюдаемой совокупности. Кроме того, методы таксономии могут использоваться с целью сжатия информации, что является важным фактором в условиях постоянного увеличения и усложнения потоков статистических данных [3-9].
Первые публикации по таксономии (кластерному анализу) появились в конце 30-х годов нашего столетия, но активное развитие этих методов и их широкое использование началось в конце 60-х — начале 70-х годов. В дальнейшем это направление многомерного анализа очень интенсивно развивалось. Появились новые методы, новые модификации уже известных алгоритмов, существенно расширилась область применения таксономии. Если первоначально методы многомерной классификации использовались в психологии, археологии, биологии, то сейчас они стали активно применяться в социологии, экономике, статистике, в исторических исследованиях. Особенно расширилось их использование в связи с появлением и развитием ЭВМ и, в частности, персональных компьютеров. Это связано, прежде всего, с трудоемкостью обработки больших массивов информации (вычисление и обращение матриц больших размерностей).
Обычно о необходимости построения таксономии говорят в тех случаях, когда возникает необходимость в систематизации некоторой предметной области, которая оказывается слишком сложной для того, чтобы провести ее систематизацию на основе некоторой достаточно просто выводимой классификации объектов, ее составляющих.
В последнее время потребность в таксономии в самых разных областях проявляется все чаще, прежде всего, в связи с процессами использования новых информационных технологий (НИТ) для обработки информации. В настоящее время практически невозможно найти области научных исследований и практической деятельности, в которых не разрабатывались
бы базы данных (БД) или базы знаний (БЗ). В свою очередь создаваемые БД/БЗ должны удовлетворять определенным требованиям их использования для решения практических задач пользователями систем и/или служить одной из составляющих более сложных систем обработки информации — инструментальных аналитических систем, систем автоматизированного проектирования, систем поддержки принятия решений. И зачастую оказывается, что только предварительные исследования по таксономии соответствующих предметных областей позволяют находить достаточно эффективные и гармоничные решения по систематизации и классификации этих областей, что, в свою очередь, дает возможность разрабатывать эффективные БД с широким диапазоном их возможного использования.
В области создания информационных технологий и автоматизированных информационных систем (ИТ и АИС) необходимость в развитии таксономии осознана достаточно давно. Первые шаги в этом направлении были связаны с систематизацией огромного количества стандартов, регламентирующих развитие вычислительных систем и сетей [10-14].
К недостаткам классической таксономии можно отнести неоднозначность получаемых решений, т.е. возможность получения различных вариантов разбиений, что в значительной мере обесценивает полученное решение.
Таким образом, целью настоящей работы является совмещение сильных сторон математического моделирования и таксономии, то есть дальнейшее развитие оптимизационных подходов применительно к задачам таксономии, включающее создание системы оптимизационных математических моделей, описывающих задачи таксономии, и разработку, а также привлечение существующих оптимизационных процедур для поиска решения на построенных моделях.
Основной идеей работы является разработка математического аппарата и создание на его основе программных средств поиска оптимальных решений для ряда прикладных задач таксономии.
Научная новизна диссертационной работы заключается в:
дальнейшем развитии теоретических подходов оптимальной таксономии, включающих построение математических моделей задач таксономии применительно к различным критериям разбиения и предметным областям, а также выделение алгоритмов поиска оптимальных группировок на построенных математических моделях;
выделение случаев, допускающих применение простых и эффективных процедур поиска оптимальной группировок в задачах таксономии.
разработке методики выбора оптимизационной математической модели применительно к конкретным задачам таксономии.
адаптации развитых теоретических подходов применительно к прикладным задачам из разных предметных областей. В частности разработаны: математическая модель поиска оптимальных режимов изготовления микроканальных пластин; методика оценки показателей толерантности и напряженности в регионах; технология прогнозирования персональной успеваемости студентов в вузе. Практическая значимость работы заключается в разработке пакетов
программ, предназначенных для автоматизации поиска оптимальной
таксономии применительно к различным предметным областям.
В данной работе на защиту выносятся:
содержательные и формальные постановки оптимизационных задач таксономии объектов применительно к различным предметным областям;
алгоритмы поиска решений оптимизационных задач таксономии на построенных математических моделях;
программные средства поддержки поиска решений оптимизационных задач таксономии применительно к различным предметным областям;
результаты экспериментального анализа эффективности созданных
программных средств.
Апробация результатов работы.
Основные положения диссертации докладывались на Межвузовской научно-практической конференции в г. Владикавказ 2001 - «Новые информационные технологии и их применение»; Международной конференции Владикавказ 2002 - «Новые информационные технологии в науке, образовании, экономике»; Международной конференции в г. Владикавказе, 2002 - «Информационные технологии и системы: наука и практика»; Международной научно-технической конференции, Владикавказ, 2003 - «Информационные технологии и системы: новые информационные технологии в науке, образовании, экономике», на ежегодных научно-практических конференциях Северо-Кавказского горно-металлургического института (государственного технологического университета) и на семинарах кафедры автоматизированной обработки информации СКГМИ. По материалам диссертации опубликовано 7 печатных работ.
Разработанные методы построения оптимальных группировок данных внедрены в различных отраслях народного хозяйства, образовании и медицине.
Структура и объем диссертации. Диссертация состоит из введения,
четырех глав, заключения, списка литературы из 121 наименования, приложения, содержит 31 рисунок, 6 таблиц и 144 страницы текста.
Основные понятия. Базовые эмпирические гипотезы
Современные требования к качеству классификации объектов предполагают учет при решении этих задач всех значащих факторов. Так, например, классификация предприятий определенной отрасли в соответствии с условиями их хозяйственной деятельности требует учета технико-экономических факторов (масштаб производства, фондовооруженность, энерговооруженность и т.д.), социальных факторов (квалификация рабочих, текучесть кадров и т.д.), факторов природной и технологической среды (климатические условия, условия сбыта и транспортировки сырья, продукции и т.п.). При этом каждый из факторов может в свою очередь характеризоваться еще несколькими показателями (например, масштаб производства — размером основных фондов, численностью работников и т.д.), что приводит к большому числу признаков, описывающих деятельность предприятия, причем не всегда с достаточной определенностью можно отнести тот или иной фактор к разряду объективных. Все это приводит к тому, что экспертные типологические группировки одних и тех же предприятий, построенные по небольшому числу показателей, зачастую оказываются различными. Различия в классификациях, очевидно, отображаются и в дальнейших теоретических построениях или практических рекомендациях. Таким образом, весьма актуальна разработка методов классификации, учитывающих большой набор признаков и зависимостей между ними. Наиболее действенный количественный инструмент исследования классификации подобных объектов, явлений, описываемых большим числом характеристик, являются методы кластерный анализ, таксономия.,
Таксономия в последнее время существенно расширила диапазон своего применения, интенсивно вторгаясь в ранее недоступные области. К последним можно отнести распознавание образов по эталонам, выбор эффективных режимов технологических процессов, прогнозирование персональной успеваемости учеников и студентов, поиск месторождений полезных ископаемых и ряд других. Группировка объектов (часто употребляют также термины «автоматическая классификация», «самообучение», «кластеризация» и т.д.) по похожести их свойств упрощает решение многих практических задач анализа данных.
Алгоритмы таксономии нашли широкое применение при решении разнообразных прикладных задач.
Кластерный анализ — это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается набором исходных переменных Х\, Х2, ..., Хт. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами (классами, таксонами, сгущениями). В отличие от комбинационных группировок кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно — политетический подход. При этом, как правило, не указаны четкие границы каждой группы, а также неизвестно заранее, сколько же групп целесообразно выделить в исследуемой совокупности. Кластерный анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации. Критерий качества кластеризации в той или иной мере отражает следующие неформальные требования [15]: 1. Внутри групп объекты должны быть тесно связаны между собой. 2. Объекты разных групп должны быть далеки друг от друга. 3. При прочих равных условиях распределения объектов по группам должны быть равномерными. Требования пунктов 1 и 2 выражают стандартную концепцию компактности классов разбиения [16]; требования пункта 3 состоит в том, чтобы критерий не навязывал объединения отдельных групп объектов. Кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы. Строгие математические методы, используемые в математической статистике, разработаны для случаев, когда о распределениях анализируемых генеральных совокупностей известно все, что только может потребоваться в процессе решения задачи: известны виды законов распределений и все их параметры, априорные вероятности появления образов, матрица потерь от ошибок и т.д. К сожалению, при решении реальных задач анализа данных такие условия не встречаются. Для приведения задачи к виду, при котором можно было бы применить тот или иной статистический алгоритм, нужно к имеющейся объективной информации добавить ряд субъективно выбираемых предположений или гипотез. Этот этап привнесения эвристических гипотез имеет место во всех случаях решения реальных задач распознавания образов. Дополнительные гипотезы могут носить общий характер или касаться мелких частностей [17]. Гипотеза компактности (Н) состоит в том, что реализации одного и того же хорошо организованного образа обычно отражаются в признаковом пространстве в геометрически близкие точки, образуя «компактные» сгустки. При всей кажущейся тривиальности и легкости опровержения указанная гипотеза лежит в основании большинства алгоритмов не только распознавания, но и многих других задач анализа данных. Конечно, она подтверждается не всегда. Если, например, среди признаков имеется много случайных, не информативных, то такой случай соответствует плохой организации образов, и точки одного и того же образа могут оказаться далекими друг от друга. Но дополнительно предполагается, что работа по организации образов уже проведена и в многомерном признаковом пространстве найдено такое («информативное») подпространство, в котором точки одного класса действительно образуют явно выделяемые компактные сгустки [16]. Назовем п признаков, входящих в информативное подмножество X, «описывающими», а номинальный (и+1)-й признак z, указывающий имя образа, «целевым».
Содержательные и формальные постановки задач
Как уже упоминалось выше, задача таксономии сводится к разбиению множества объектов с определенными характеристиками на группы. При этом критерием качества полученной группировки служит заданный целевой критерий.
Качество полученной группировки объектов, зависит от многих факторов. Отметим, на мой взгляд, наиболее важные из них: информативность набора признаков объектов; представительность выборки; выбор метрики; критерий классификации; выбор метода классификации выбор алгоритма классификации; S Информативность набора признаков
Очевидно, что для разных задач, набор признаков, по которым исследуется объект, будет различен. Например, в случае, если требуется провести классификацию студентов с целью определения социальных группировок, то значимыми признаками будут 1) пол, 2) возраст, 3) социальная группа, 4) образование, 5) регион проживания, 6) предыдущее место учебы и т.д. Если же целью классификации является определение уровня успеваемости, то значимыми факторами будут все оценки по различным дисциплинам. При этом область знаний той или иной дисциплины также может иметь значение. Таким образом, в зависимости от цели разбиения, значимыми в одной и той же предметной области будут разные факторы. Загоруйко Н.Г. разработал ряд алгоритмов, позволяющих из общего набора признаков выделять информативные [18, 34, 38, 98, 103]. Использование указанных алгоритмов приводит к дополнительному увеличению затрат машинных ресурсов, что не всегда оправдано. При этом отбор первоначального множества признаков также должен производить эксперт, т.е. фактически, в задачах анализа данных от компетентности эксперта во многом зависят и результаты классификации. Таким образом, полностью формализовать данный процесс вряд ли возможно. S Представительность выборки
В таксономии реализуется так называемое обучение без учителя. То есть на первых этапах анализа, возможны ошибки в результатах, однако вероятность ошибок будет уменьшаться по мере накопления базы данных. S Выбор метрики
Существует огромное число различных метрик для оценки близости объектов. Выбор метрики основывается на типах множества признаков, с помощью которых описывается объект. Так, например, для бинарных данных можно использовать расстояние Хемминга, для количественных данных — евклидово расстояние или его квадрат. В случае если признаки разнотипны, измерены в разных шкалах, рекомендуется использовать .-расстояния и т.д. S Критерий классификации Цель классификации определяется условиями поставленной задачи, исходя из которой, и задается тот или иной критерий цели. S Выбор метода классификации Как уже было сказано выше, существуют различные методы классификации: полным перебором, методами математического программирования, иерархическими или неиерархическими кластер 45 процедурами, методами на основе функции плотности и т.д. Выбор метода определяется из требований, предъявляемых к задаче, мощности ЭВМ, объеме выборки, цели классификации и т.д. На основе метода классификации осуществляется выбор алгоритма группировки. S Выбор алгоритма классификации По сути, это последний этап решения задачи. Выбор алгоритма основывается на поставленной цели классификации. Так, например, если требуется разбить объекты на определенное количество групп с целью выявления их типичных представителей, то в зависимости от выбранной метрики при кластеризации, например, неиерархическими кластер-процедурами можно воспользоваться алгоритмами семейства FOREL или KRAB. Если требуется выделить на множестве объектов только наиболее похожие (места скоплений точек), то используется алгоритм KOLLAPS и т.д. Большая часть методов, рассмотренных в данной главе, не дает глобально оптимального решения. Исключением являются методы кластеризации, основанные на методах математического программирования. Однако, важность получения подобного решения очевидна. При этом недостатки, связанные с применением методов математического программирования при кластеризации, связаны с высокими требованиями к мощности ЭВМ, к емкости памяти, ко времени решения задачи и т.д. В этой связи, заметим, что высокопроизводительные машины необходимы для решения всех задач кластеризации (таксономии), так как все они являются задачами большой размерности. Существуют задачи таксономии, для которых определяющим требованием является качество классификации, а время решения задачи не ограничено. Например, анализ результатов социологического опроса и т.д. Очевидно, что в подобных задачах, необходимо получение глобально оптимального решения, что возможно при применении методов математического программирования. В данной работе предлагается сделать акцент именно на них. Таким образом, определено направление исследование - дальнейшее развитие методов кластеризации методами математического программирования. В рамках указанного направления исследования будут рассмотрены следующие задачи: 1. Разработка системы математических моделей, позволяющей формулировать ряд прикладных задач таксономии, как задачи математического программирования;
Анализ взаимного расположения первых двух таксонов
Объектом применения методов оптимальной таксономии ниже является поиск оптимальных сочетаний параметров микроканальных пластин приборов ночного видения (МКП) на технологических переделах.
Цель работы - создание математической модели и соответствующих программных средств, предназначенных для определения набора параметров изготовления МКП, способствующих снижению уровня брака на технологической цепочке производства МКП, а также выдача рекомендаций по соответствующим режимам на переделах.
Следует отметить, что в центре БАСПИК, работа по выявления причин возникновения брака, ведется давно. В некоторых случаях удается определить причину, но чаще нет. Эта работа основывается скорее на интуиции работников. Ситуация усложняется еще и тем, что часто фиксируются новые виды браков.
Для анализа характеристик технологического процесса на предприятии «БАСПИК» используются статистические методы: корреляционный, регрессионный и дисперсионный анализ, оценка взаимосвязи между факторами и параметрами. Расчеты проводятся в приложении Microsoft Excel. Однако, как уже было сказано, результаты подобных исследований не приводят к улучшению качества изготавливаемых объектов. Общее число параметров изготовления на разных технологических линиях равно 30. А число значений параметров в разных случаях варьируется в диапазоне от 2 до 40. Таким образом, общее число возможных комбинаций изготовления МКП превышает 100 млн. Также следует отметить, что некоторые виды браков появляются уже в период хранения МКП. То есть на качество влияют и условия хранения (например, влажность воздуха, температура и т.д.). Помимо этого, для изготовления партии МКП, требуются различные материалы, и часто, они приобретаются у разных производителей. Что в свою очередь, также может отражаться на качестве продукции. В технологическом центре «Баспик» объем набранной статистики гораздо меньше указанной величины. Причем, при анализе взаимосвязи параметров на разных операциях технологического цикла, сравниваются различные два фактора. Другими словами, проводится перебор возможных состояний. Понятно, что при таких условиях проанализировать все возможные состояния и, соответственно, выявить наилучшие на основании статистических подходов невозможно. Преимуществом таксономии является в данном случае то, что имеется возможность: анализировать в совокупности все сочетания параметров изготовления блоков МКП от первой до последней операции. определить конечные результаты изготовления нового блока, то есть процент годных и бракованных пластин в блоке, на ранних операциях путем сравнения текущих его состояний с имеющейся статистикой. для отдельных видов МКП выявить сочетания режимов, однозначно приводящих к браку и наоборот. Следует также отметить, что на ранних этапах применения таксономических приемов, можно и не получить хороших решений. Так как, представительность выборки не велика. Однако если блок с подобными характеристиками ранее не изготавливался, то он добавляется в базу. Таким образом, реализуется одна из основополагающих концепций таксономии — самообучение, обучение без учителя. В процессе работы проводились исследования режимов изготовления МКПО 18-8, МКПО 18-10 за 2002-2003 гг. В результате исследования были разработаны и программно реализованы математические модели определения наихудших и наилучших режимов изготовления МКПО. Разработаны соответствующие структуры баз данных. Основные конструктивные и технико-эксплуатационные показатели: разработанный программный продукт позволяет выделять наборы параметров на каждой операции, при которых появление брака наиболее и наименее вероятно. Степень внедрения: полученные результаты работы предполагается использовать при изготовлении новых МКП. Результаты исследования могут быть применены в учебном процессе в рамках дисциплин «САПР», «Математическое моделирование», «Теория принятия решений». Экономическая эффективность работы состоит в минимизации стоимости МКП путем снижения уровня брака. При выполнении работы были применен комплекс методов, включающий: методы таксономии: гипотезы компактности и X - компактности; понятия расстояния, принятые в таксономии, методы доступа к информации, хранящейся в базах данных различные оптимизационные алгоритмы Как уже было сказано в главе 1, 2 любая классификация объектов производится по определенному целевому критерию. В связи с тем, что в разных прикладных задачах имеются свои цели, свой набор признаков и своя специфика, критерий качества классификации в них будет различен. Так, основная цель данной задачи — повысить качество изготавливаемой продукции. В связи с имеющейся информацией, данная цель может быть переформулирована следующим образом: определить эффективные режимы функционирования технологических линий при изготовлении МКП. Как уже упоминалось ранее, применение таксономии в данном случае позволит 1) путем сравнения текущих наборов изготовления с наборами из базы данных спрогнозировать результат производства на ранних этапах; 2) на основании имеющейся информации выявить режимы изготовления с минимальным (максимальным) выходом брака. Таким образом, этот процесс связан с поиском расстояния между наборами параметров. И качество результата прогнозирования, зависит от степени близости наборов. Нужно учесть, что параметры изготовления МКП разнотипны. Так, например, «печь спекания» характеризуется идентификационным номером, «температура спекания» представлена количественной характеристикой и т.д. Таким образом, для определения близости наборов, необходимо воспользоваться Х-расстоянием и, соответственно, гипотезой X-компактности.
Поиск оптимальных стратегий изготовления МКПО
В главе 4 содержится описание созданных программных продуктов, инструкции по эксплуатации, описание постановок эксперимента применительно к каждому пакету, его результаты в виде таблиц, графиков, диаграмм.
При создании программных пакетов использовалась среда интегрированной разработки Borland Delphi 6.0. Выбор языка программирования сделан на основании его объективных преимуществ по сравнению с другими средствами проектирования программных продуктов, в числе которых:
Система визуального программирования Delphi позволяет быстро и эффективно разрабатывать самые разнообразные приложения, включая и приложения для работы с базами данных. Она имеет развитые возможности по созданию пользовательского интерфейса, широкий набор функций, методов и свойств для решения прикладных расчетно-вычислительных задач. В систему включены также удобные средства отладки. Традиционно Delphi относят к так называемым RAD-системам (Rapid Application Development, быстрая разработка приложений). Однако эта система обладает также практически всеми возможностями современных СУБД, таких как, например, Microsoft Access или Visual FoxPro. Она позволяет создавать приложения с помощью широкого набора инструментальных программных средств, визуально подготавливать запросы к базам данных, а также непосредственно писать запросы на языке SQL. С помощью Delphi можно разрабатывать приложения для работы, как с локальными, так и с удаленными базами данных, включая публикацию баз данных в Internet. Она поддерживает большинство современных технологий создания информационных систем, в том числе многоуровневую технологию клиент-сервер. Все программные продукты являются приложениями баз данных. Однако в каждой подсистеме применяются различные форматы баз данных. Так, в подсистеме поиска оптимальных режимов изготовления МКПО использована база данных Microsoft Access 2000, в системе анализа уровня напряженности и толерантности в регионах Северного Кавказа — база данных Paradox, а в системе прогнозирования персональной успеваемости студентов - база данных SQL Server. Выбор указанных форматов баз данных определялся с учетом требований, предъявляемым к проектам. Экспериментальные исследования проводились с целью проверки эффективности выбранных процедур группировки. Эксперименты проводились на рабочей станции со следующими техническими характеристиками: - Процессор Pentium IV - 2.41 ГГц. - Объем оперативной памяти - 128 мегабайт. - Жесткий диск объемом 40 гигабайт. При запуске программы происходит автоматическое подключение к базе данных. На данном участке работы программы производится открытие и индексация таблиц БД. Благодаря применению объектно-ориентированного подхода удалось создать базовый класс, в котором были реализованы все универсальные методы, выполняющие заполнение, индексацию, поиск в базе данных. На этом этапе происходит выбор режима работы пакета. Необходимо отметить, что при анализе изготовления блоков, в качестве характеристик принимаются все параметры. Многие из них имеют конечное множество значений. Например, параметр Вид спекания может быть одинарным, двойным верхним или двойным нижним. Подобные характеристики должны быть заданы до начала ввода информации об изготовлении. Таким образом, при первом запуске производится настройка системы, она включает в себя определение всех возможных значений следующих параметров: Виды МКПО, Списки операторов, Виды кассет, Список номеров кассет, Виды спекания, Режимы восстановления, Режимы отжига, Режимы ТВО. Примерный вид окна настройки приведен на рис. 4.1. Данная система предназначена для анализа режимов изготовления блоков МКП и выявления рекомендуемых и нерекомендуемых из них. При этом важным моментом является самообучение системы, что, естественно, достигается путем ввода информации о новых блоках. Необходимо отметить, что блок анализируется только в том случае, если он прошел весь технологический цикл, так как каждый блок рассматривается как прецедент. Весь технологический цикл изготовления МКПО состоит из следующих операций: Спекание, Мехобработка, ТХО, ТВВ, Отжиг, ТВО, Металлизация, Выходной контроль. Ввод данных по всем операциям происходит одинаково. На рис. 4.2 приведен вид окна ввода данных.