Содержание к диссертации
Введение
Глава 1. Состояние вопроса, постановка задач диссертационной работы
1.1. Современные тенденции развития компьютерных систем поддержки принятия решений для управления сложными технологическими системами в металлургии
1.2. Модельные и экспертные системы поддержки принятия решений при выплавке чугуна в доменных печах
1.3. Основные задачи распознавания образов и их практическое применение
1.4. Постановка задач диссертационного исследования 44
Глава 2. Технологические основы создания системы прогнозирования теплового состояния доменной печи на основе методов распознавания образов
2.1. Влияние теплового состояния доменной печи на величину содержания кремния в чугуне
2.2. Технологические основы сбора и хранения данных о ходе доменной плавки
2.3. Параметры, характеризующие тепловой режим доменной плавки
2.4. Учет динамики доменного процесса 58
2.5. Анализ зависимости величины содержания кремния от температуры чугуна на выпуске
2.6. Выводы 65
Глава 3. Алгоритмические основы систем распознавания образов
3.1. Представление и подготовка данных для решения задач распознавания образов
3.2. Обоснование выбора методов распознавания образов для прогнозирования теплового состояния доменной печи
3.3. Задача обучения по прецедентам 75
3.4. Задача выбора информативных признаков и совершенствование алгоритмов
3.5. Задача таксономии 91
3.6. Выводы 95
Глава 4. Алгоритмическое и информационное обеспечение прогнозирования теплового состояния доменной печи методом распознавания образов
4.1. Алгоритмическое обеспечение решения задачи прогноза 97
4.2. Построение прогностической модели. Полученные результаты 103
4.3. Выводы 113
Глава 5. Разработка программного обеспечения прогнозирования теплового состояния доменной печи
5.1 Принципы построения и средства разработки системы «Прогноз-ТП»
5.2 Реализация системы «Прогноз-ТП» и описание пользовательского интерфейса
5.3 Выводы 131
Основные выводы 132
Библиографический список 134
Приложения 144
- Модельные и экспертные системы поддержки принятия решений при выплавке чугуна в доменных печах
- Технологические основы сбора и хранения данных о ходе доменной плавки
- Обоснование выбора методов распознавания образов для прогнозирования теплового состояния доменной печи
- Построение прогностической модели. Полученные результаты
Введение к работе
Актуальность работы. Современный этап развития металлургического производства характеризуется разработкой, внедрением и широким использованием компьютерных систем поддержки принятия решения, выполненных на основе методов математического моделирования и экспертных систем. Их применение в сочетании с комплексом прочих программно-аппаратных средств позволяет строить мощные и эффективные системы управления технологическими операциями. Однако при разработке сложных систем часто возникают проблемы, связанные с недостаточной изученностью протекания некоторых процессов. Это значительно затрудняет разработку аналитических моделей и экспертных подсистем в рамках разрабатываемой системы управления.
Не является исключением и доменное производство. Здесь важнейшее значение имеет задача эффективного управления тепловым состоянием доменной печи, которое определяет протекание процесса плавки, ход доменной печи и качество выпускаемого чугуна. В то же время корректировка теплового состояния доменного агрегата требует серьезных энергетических затрат, связанных с расходом дорогостоящего и дефицитного кокса, на экономию которого и направлены основные мероприятия по совершенствованию технологии плавки. Сегодня уровень этой технологии в первую очередь определяется именно расходом кокса. Важным показателем в этой связи является показатель содержания кремния в чугуне на выпуске из печи. Величина и пределы изменения данного показателя являются индикатором теплового состояния горна доменной печи и стабильности процесса доменной плавки.
Проблема заключается в том, что в настоящее время на приемлемом уровне не решена задача своевременного определения и прогнозирования содержания кремния в чугуне. Величина данного показателя определяется со значительной задержкой после выпуска чугуна. Вследствие этого затрудняется своевременная корректировка хода доменной плавки.
Настоящая работа посвящена вопросам разработки алгоритмического и программного обеспечения для прогнозирования теплового состояния доменной печи, а в частности, величины содержания кремния в чугуне, с использованием методов распознавания образов (РО).
Цель работы. Разработка алгоритма и программного обеспечения для прогнозирования теплового состояния доменной печи на основе использования методов распознавания образов.
Задачи исследования:
1. Обоснование выбора методов распознавания образов для решения задачи прогнозирования теплового состояния доменной печи;
2. Сбор, предварительная обработка и оценка качества технологических данных о работе доменных печей;
3. Оценка возможности интеграции математической модели доменного процесса УГТУ-УПИ и методов РО для прогнозирования технологических параметров доменной плавки;
4. Разработка алгоритма прогнозирования теплового состояния доменной печи на основе методов РО и соответствующего программного обеспечения, предназначенного для оперативного решения задачи прогноза.
Методы исследований. Методической основой диссертационной работы является использование многофакторного анализа, в частности методов распознавания образов, а также современных информационных технологий и средств разработки программного обеспечения.
Научная новизна исследования состоит в том, что:
- разработан алгоритм решения задачи прогнозирования теплового состояния (по величине содержания кремния в чугуне) доменной печи;
- построена и апробирована модель в виде коллектива решающих правил, полученных на основе разнородных алгоритмов распознавания образов в признаковых пространствах разной размерности, показавшая при тестировании на реальных данных 81 % совпадения результатов прогноза с фактическими данными;
- предложен новый алгоритм формирования информативных подсистем признаков, учитывающий особенности работы со статистически зависимыми и статистически независимыми признаками;
- в целях повышения качества прогнозирования теплового состояния доменной печи наряду с автоматически измеряемыми показателями процесса плавки использованы комплексные параметры теплового, шлакового и газодинамического режимов, полученные с использованием модели доменного процесса УГТУ-УПИ.
Практическая значимость. Полученные в ходе выполнения работы результаты найдут практическое применение:
- при совершенствовании методов управления ходом доменной плавки, что позволит повысить технико-экономические показатели выплавки чугуна;
- разработке современных интеллектуальных систем управления металлургическими агрегатами;
- преподавании дисциплин для студентов соответствующих специальностей.
Достоверность полученных положений, выводов и рекомендаций основана на применении современной методологии исследований, хорошо зарекомендовавших себя методов анализа данных, а также на совпадении экспериментальных и прогнозируемых значений параметров.
Использование результатов работы. Разработанный алгоритм прогнозирования явился основой практической реализации программного продукта для прогнозирования технологических параметров доменной плавки с использованием методов распознавания образов («Прогноз-ТП»), предназначенного для опытно-промышленного использования инженерно-техническим персоналом металлургических заводов, имеющих доменное производство.
Программное обеспечение передано аглодоменному отделу центра АСУ управления информационных технологий ОАО «ММК» для испытания.
Материалы диссертации внедрены в учебный процесс в ГОУ ВПО УГТУ-УПИ при преподавании следующих дисциплин: - направление 230200 - Информационные системы (дипломированные специалисты). Специальность 230201 - Информационные системы и технологии. Дисциплины:
• Проектирование пакетов прикладных программ;
• Информационные системы в металлургии;
• Моделирование процессов и объектов в АСУТП.
• направление 651300 - Металлургия (дипломированные специалисты). Специальность 150103 -Теплофизика, автоматизация и экология промышленных печей. Дисциплина - Информационные технологии в металлургии. Личный вклад автора состоит в разработке алгоритма прогнозирования теплового состояния доменной печи на основе методов распознавания образов (РО) и создании соответствующего программного обеспечения. Предмет защиты:
- обоснование использования методов РО для прогнозирования теплового состояния доменной печи (по величине содержания кремния в чугуне);
- алгоритм прогнозирования величины содержания кремния в чугуне с использованием методов распознавания образов;
- новый алгоритм формирования информативных подсистем признаков;
- программное обеспечение для оперативного решения задачи прогнозирования теплового состояния доменной печи.
Апробация работы. Материалы исследований доложены на конференциях
- международного уровня:
конференции «Информационно-математические технологии в экономике, технике и образовании». Екатеринбург, 2006;
- всероссийского уровня:
IV Всероссийской научно-практической конференции «Системы автоматизации в образовании, науке и производстве». Новокузнецк, 2003; 6-й Всероссийской научно-технической конференции. Магнитогорск, 2005; 2-й Всероссийской научно-практической конференции «Моделирование, программное обеспечение и наукоемкие технологии в металлургии». Новокузнецк, 2006. Публикации. Основные положения диссертации опубликованы в 10 печатных работах, в том числе в двух научных публикациях в изданиях, рекомендованных ВАК, и пяти докладах в сборниках трудов конференций.
Структура и объем диссертации. Диссертационная работа изложена на 154 страницах машинописного текста, включая 26 рисунков, 11 таблиц, и состоит из общей характеристики работы, 5 глав, заключения, библиографического списка из 143 источников отечественных и зарубежных авторов, 4 приложений.
Модельные и экспертные системы поддержки принятия решений при выплавке чугуна в доменных печах
В истории науки и техники отечественные ученые-доменщики оказались пионерами в создании систем автоматизированного управления технологическими процессами. Еще до появления ЭВМ в 1939 году проф. А.Н. Похвиснев предложил метод расчета "скоростного" теплового баланса для оперативного управления нагревом доменной печи. В середине 50-х, когда еще не производились серийно даже аналоговые машины, проф. В.А.Сорокин с помощью специально для этого изготовленной аналоговой машины предпринял попытку замкнутого управления процессом плавки на одной из доменных печей "Азовстали". С начала 60-х годов в СССР, а несколько позже - и во всем мире был настоящий бум работ по автоматизации управления тепловым режимом доменной плавки. Этой проблемой занимались едва ли все исследовательские коллективы, связанные с черной металлургией. Но практические результаты решения даже в области автоматической стабилизации нагрева чугуна были весьма и весьма скромны. Главная причина была связана с исключительной сложностью доменного процесса и большим количеством неконтролируемых возмущений.
За прошедшие годы принципиальных изменений в области получения практических результатов не произошло. В настоящее время среди существующих на доменных печах мира интегрированных компьютерных систем контроля и управления лишь некоторые включают в свой состав модельные системы управления технологическим режимом доменной плавки [7-12]. Очень редко эти сложные системы оперативного управления доменным процессом тиражируются, так как для эффективной их эксплуатации они должны быть адаптированы к условиям работы конкретной печи. Все подобные модельные системы поддержки принятия решений системы в лучшем случае работают в режиме советчика оператора доменной печи.
С методической точки зрения обычно выделяют два основных подхода к математическому моделированию сложных систем, к каковым относится доменный процесс [13-16]. Первым является подход, при котором модель строится исходя из внутренней структуры явлений, протекающих в системе. В этом случае входные и выходные параметры модели связываются друг с другом на основании универсальных законов сохранения и других фундаментальных физических и физико-химических закономерностей. Детальный обзор существующих математических методов описания доменного процесса, особенностей конструирования математических моделей и их применения выполнен в книге [17].
Зависимости, установленные в результате аналитического описания явлений доменной плавки, отражают общие закономерности процесса, и вследствие этого, обладают большими прогнозными возможностями. В зависимости от степени детализации явлений при аналитическом описании процесса различают балансовые и кинетические модели доменного процесса.
Развитие методов составления и использования тепловых балансов доменной плавки для анализа работы доменной печи и расчета показателей проектируемой плавки рассмотрено в работах [14, 18, 19]. Балансовые модели доменного процесса описывают закономерности тепло-массообмена в самом общем виде. В основе их лежат материальные и тепловые балансы, устанавливающие взаимосвязи между режимными параметрами процесса, показателями работы печи и показателями ее теплового состояния. Низкая достоверность этой информации, связанная с несовершенством способов контроля доменного процесса, приводит к значительным погрешностям модельной оценки [20]. Выполненный Раммом А.Н. [19] анализ влияния погрешностей отчетных данных на результаты расчета показал, что наибольшие погрешности связаны с неточным химическим анализом колошникового газа. Различия моделей доменного процесса и получаемых с их помощью результатов определяется: методами составления балансовых соотношений; подходами к определению величин, характеризующих использование восстановительного потенциала газового потока; структурами моделей и способами решения балансовых уравнений. В работе [17, табл. 5] приведены литературные данные о различных методах балансового расчета доменной плавки для оценки некоторых технологических мероприятий.
Общий тепловой баланс не позволяет оценивать влияние условий протекания процессов теплообмена в объеме печи, так как он рассчитывается по начальному и конечному состоянию системы, т.е. с учетом общего количества выделяющегося и потребляемого тепла. При этом не принимается во внимание, при каких температурах происходит передача тепла от газов к материалу. Поэтому даже при условии малой невязки составляющих общего теплового баланса нельзя ничего сказать о характере протекания процессов в диапазоне от начального до конечного состояния системы. В связи с этим возникла потребность в определении распределения тепла по высоте доменной печи, что можно осуществлять с помощью составления и анализа зональных тепловых балансов. Преимуществом включения зональных тепловых балансов в модели является возможность определения температуры колошникового газа расчетным путем, что обеспечивает большие прогнозные возможности этих моделей по сравнению с моделями, основанными на общем тепловом балансе доменной печи. Однако при этом приходится априорно задаваться степенью завершенности отдельных процессов в различных температурных интервалах. Другая трудность при составлении зональных балансов заключается в принятии определенного перепада температур между шихтовыми материалами и газом в этих зонах и особенно на их границах.
Таким образом, общим недостатком балансовых методов для оценки прогноза теплового состояния доменной печи является необходимость применения эмпирических соотношений, характеризующих эффективность использования тепловой и химической энергии газового потока.
Составление и решение системы дифференциальных уравнений, описывающих закономерности тепло- и массообмена с учетом кинетики протекающих в объеме печи химических реакций лежит в основе кинетических моделей доменного процесса. Современные методы моделирования доменного процесса, положенные в основу этих моделей, сложились в результате развития теории теплообмена в слое с учетом изменения теплоємкостей потоков по высоте печи [21-24]. За последние годы они были дополнены и увязаны с закономерностями процессов массообмена, газо- и гидродинамики и технологическими особенностями доменной плавки [7, 25, 26]. Большой вклад в исследование тепловых явлений доменного процесса внесен уральской школой металлургов-теплотехников, основателями которой являются проф., д.т.н. Б.И.Китаев и проф., д.т.н. Ярошенко Ю.Г. [21-23]. Обстоятельный обзор математических моделей этого класса выполнен в работе [17], где отмечено, что в настоящее время даже при самом строгом теоретическом учете всех особенностей процесса невозможно избавиться от массы коэффициентов, определяемых опытным путем. Из-за вынужденных упрощений (ограничение количества рассматриваемых зон, описание отдельных участков доменной печи, рассмотрение только стационарного состояния) эти модели носят конкретный характер, определяемый поставленными задачами. Это объясняет появление в России и за рубежом целого ряда моделей доменного процесса самого различного назначения [7, 15, 17, 27-31]. К числу наиболее полных моделей доменного процесса можно отнести кинетико-динамическую модель доменного процесса, разработанную в свое время во Всесоюзном институте металлургической теплотехники - ВНИИМТ [7, 32, 33]. Как показывает практика, кинетические модели позволяют решать широкий круг практических задач: получать температурные и концентрационные поля доменной печи при плавке специальных чугунов, вдувании горячих восстановительных газов; оценивать влияние на показатели работы печи таких параметров плавки, как восстановимость, степень металлизации железорудных материалов, реакционная способность кокса; определять общие закономерности динамических характеристик доменной печи по различным каналам.
Технологические основы сбора и хранения данных о ходе доменной плавки
Особенностью реализуемого в данном исследовании подхода к прогнозированию теплового состояния доменной печи является обработка значительных объемов информации о работе доменных печей. Требованиям к обеспечению этими данными удовлетворяют информационные системы, функционирующие на крупных металлургических предприятиях, таких как ОАО «Северсталь», ОАО «Новолипецкий металлургический комбинат», ОАО «Магнитогорский металлургический комбинат», ОАО «Западносибирский металлургический комбинат», ОАО «Нижнетагильский металлургический комбинат» и др. Все данные о работе отдельных доменных печей и доменного цеха в целом собираются и хранятся в специализированных базах данных доменного цеха.
На примере доменного цеха ОАО «ММК» рассмотрим основные элементы автоматизированной информационной системы управления, непосредственно связанные с вопросами сбора и хранения технологической информации о ходе доменной плавки. В рамках информационной системы можно выделить 3 основных канала поступления информации в базу данных:
1. Распределенная подсистема контроля и локального управления (РСКУ) обеспечивает автоматический сбор и передачу в БД информации о работе каждой доменной печи. Вся входная информация разделена на блоки:
- Параметры, требующие периодичности опроса 2-5 секунд (критические параметры), такие как анализ схода шихтовых материалов, время срабатывания подач, перепады давления по высоте печи, давление колошникового газа, горячего дутья, дискретные сигналы и т.д.
- Блок остальных входных данных, автоматически контролируемых непосредственно на печи, включает анализ состава колошникового газа, температуры периферийных термопар, колошникового газа по газоотводам, влажность, температуру, расход и состав горячего дутья, расходы природного газа и технологического кислорода, расходы кокса и железорудных материалов и т.п. Периодичность опроса состояния этих автоматически контролируемых параметров составляет 30-60 секунд. 2. В автоматическом (из АСУ) и полуавтоматическом режимах осуществляется ввод следующих данных: - химический состав железорудного сырья, его физические свойства; - технический состав кокса, его физические свойства; - состав жидких продуктов плавки; - график выпусков продуктов плавки и т.п.
Поступающая из АСУ «Контроль за поступлением сырья в доменный цех» информация о химическом составе и физических свойствах очередной партии сырья, а также информация о результатах химического анализа чугуна и шлака обновляется по мере ее поступления.
3. В автоматическом режиме в БД поступают расчетные показатели доменного процесса, полученные с использованием модели доменного процесса УГТУ УПИ. В свою очередь, исходная информация, используемая при выполнении модельных расчетов, также считывается из БД.
С целью долговременного хранения вся информация в базе данных подвергается усреднению. Основные периоды усреднения, используемые в БД доменного цеха: час, рабочая смена (8 часов), сутки.
Таким образом, база данных является централизованным средством сбора и хранения широкого круга данных о работе доменного цеха. Благодаря этому имеется возможность использовать единый интерфейс получения всех необходимых данных для решения задачи прогнозирования в рамках настоящей работы.
Как было отмечено выше, успешное решение задач классификации в рамках РО требует тщательного формирования подсистемы наиболее информативных признаков, используемой для описания образов. Поэтому для выполнения качественного прогнозирования величины содержания кремния в чугуне необходимо сформировать список параметров, которые бы в совокупности позволяли эффективно определять величину. В данном случае, когда объектом исследования является такой сложный агрегат, как доменная печь, решение задачи выбора информативной подсистемы признаков может быть выполнено следующим образом. Формирование искомой подсистемы признаков следует начать с включения в нее параметров, наиболее значимых по мнению экспертов в исследуемой области. Затем с помощью формальных методов РО можно выполнить корректировку предложенного экспертами набора признаков, используя всю доступную в данном исследовании систему описания.
Работа доменного агрегата характеризуется большим числом параметров, которые, в контексте решаемой задачи, можно разделить на четыре группы: 1) параметры, характеризующие виды, химический состав и физические свойства загружаемых шихтовых материалов; 2) дутьевые параметры и параметры, непосредственно контролируемые измерительной аппаратурой на печи; 3) параметры, характеризующие состав и свойства жидких продуктов плавки: чугуна, шлака; 4) расчетные параметры.
Обоснование выбора методов распознавания образов для прогнозирования теплового состояния доменной печи
За долгую историю существования доменной плавки предпринимались многочисленные попытки решения задачи прогнозирования теплового состояния печи и связанной с ним величины содержания кремния в выпускаемом чугуне с использованием аналитического подхода [94]. Однако до настоящего времени не удалось получить удовлетворительных результатов. Это связано с наличием большого числа факторов, определяющих протекание доменной плавки, и сложным, по-видимому, недостаточно еще изученным влиянием их на выходные параметры доменного процесса. Указанные проблемы затрудняют построение полной аналитической модели доменной печи, которая позволила бы эффективно решить эту и другие актуальные задачи доменного производства, и приводят к необходимости искать другие пути решения. В связи с этим, в данной работе в качестве дополнительного способа решения задачи применяется математический аппарат распознавания образов.
Как отмечалось в разделе 1.2, в распознавании образов существует несколько различных подходов к решению задач обучения классификации. Каждый из них имеет свои сильные и слабые стороны, свои особенности. Применительно к данной задаче пригодными являются направления, связанные с использованием статистических, детерминистских методов, а также коллективных решающих правил. Последнее направление хорошо зарекомендовало себя на практике и поэтому может быть положено в основу разрабатываемой системы прогнозирования. Однако, как следует из его названия, оно не является самостоятельным, а служит средством более эффективного использования других решающих правил, поэтому проблема выбора остается, и она состоит в том, какими методами следует воспользоваться для построения первичных решающих правил для включения в распознающий коллектив: вероятностными (статистическими) или детерминистскими.
Как было указано в теоретическом обзоре, применение вероятностных методов классификации требует наличия предположений о характере закона распределения изучаемых данных. Отсутствие подобной достоверной информации для условий задачи данной работы делает применение вероятностного подхода затруднительным. Отсутствие необходимости учета законов распределения является важным преимуществом детерминистского подхода. Кроме того, по мнению некоторых авторов [62], детерминистские алгоритмы обучения классификации дают более высокие результаты по сравнению со статистическими.
Целью решения данной задачи является отнесение прогнозируемого вектора выпуска чугуна к одному из трех классов выпусков в зависимости от величины содержания кремния. В связи с этим, из множества методов, используемых в РО для решения задач обучения и классификации, для практического решения в здесь применены два метода: метод потенциальных функций и метод классификации на основе комитетов старшинства. Методы позволяют работать с тремя и более классами одновременно, достаточно логичны, понятны и показали хорошие практические результаты решения задачи. Оба метода реализованы в пакете КВАЗАР [59] и хорошо зарекомендовали себя при решении сложных практических задач.
Следует сказать, что двухклассовые (дихотомические) алгоритмы (такие, как алгоритм линейного разделения выпуклых оболочек множеств [95] и алгоритм классификации на основе комитетов большинства [78, 86], также реализованные в пакете КВАЗАР) тоже позволяют решать задачи с числом классов больше двух, но для этого многоклассовые задачи должны формулироваться в виде набора двухклассовых задач. При этом возможны два варианта решения. Рассмотрим их на примере задачи обучения с тремя классами.
В соответствии с первым вариантом в этом случае необходимо построить два дихотомических решающих правила. Одно из них - для отделения первого класса от второго и третьего, рассматриваемых как один образ, а второе - для разделения второго и третьего классов. Процедура распознавания новых векторов при этом выглядит следующим образом. Сначала «работает» первое решающее правило. Если оно относит вектор к первому классу, процедура классификации завершается, а если ко второму (объединенному), то за первым следует еще один шаг распознавания: с помощью второго решающего правила выясняется, к какому классу все же относится распознаваемый вектор - ко второму или к третьему.
В рамках второго варианта строятся три дихотомических решающих правила для разделения каждой пары классов (1-го и 2-го, 1-го и 3-го, 2-го и 3-го). Для распознавания нового вектора его классифицируют с помощью каждого из трех решающих правил. Решение при этом принимается в пользу того класса, за который проголосовали два решающих правила из трех. В случае, если все три голоса отданы за разные классы, решение о классификации не принимается, что можно интерпретировать как отказ от голосования или ответ «не знаю».
В принципе, дихотомический подход может быть применен и к решаемой в данной работе задаче. При этом было бы интересно сравнить результаты его применения с результатами «прямого» решения задачи многоклассовыми методами. Однако из-за трудоемкости обработки больших массивов данных, характерных для данной задачи (порядка 1000 векторов по 60 признаков) от его применения было решено отказаться. Тем более, что он имеет свои минусы: многоступенчатость решения задачи, неравномерность выборок (в первом варианте), что может сказаться на результате, а также вероятность отказа от распознавания (во втором варианте).
Таким образом, для решения задачи прогнозирования величины содержания кремния в чугуне наиболее приемлемым является использование детерминистского подхода по причине отсутствия достоверной информации о законах распределения исследуемых данных. В рамках самого подхода обоснованным является использование методов классификации: метод потенциальных функций и метод классификации на основе комитетов старшинства
Задача обучения по прецедентам (также называемая задачей дискриминантного анализа или задачей обучения с учителем) является наиболее сложной и важной в распознавании образов. Смысл ее решения заключается в том, чтобы в результате анализа материала обучающей выборки (прецедентов) построить решающее правило, которое позволило бы в дальнейшем классифицировать новые экземпляры объектов той же природы, не участвовавшие ранее в процессе обучения. При этом величина вероятной ошибки распознавания может быть получена путем оценки правильности распознавания объектов проверочной (экзаменующей) выборки.
Более строгая постановка задачи обучения по прецедентам выглядит следующим образом. Предположим, известны к классов объектов Xv...,Xk, которые в заданном обучающем множестве XczR" представлены своими конечными подмножествами Xv...,Xk векторов, моделирующих соответствующие объекты из указанных классов; при этом данные подмножества не должны пересекаться: Xir\Xj=0 V/Фj. Задача заключается в том, чтобы построить решающее правило, с помощью которого можно было бы достаточно надежно классифицировать векторы, как участвовавшие в процессе обучения, так и предъявленные впервые.
Построение прогностической модели. Полученные результаты
Разработанный алгоритм (раздел 4.1) решения задачи прогнозирования величины содержания кремния в чугуне был апробирован на реальных данных о работе доменной печи №2 доменного цеха ОАО «Магнитогорский металлургический комбинат». Целевым параметром прогнозирования является величина содержания кремния в чугуне на выпуске из печи. Задача решалась с использованием пакета распознавания образов КВАЗАР [59].
Доменная печь №2 является типичной с точки зрения современного доменного производства и оснащена современными техническими и программными средствами контроля и измерения. Данные о работе печи и загружаемых в нее железорудных и шихтовых материалах собираются в БД доменного цеха предприятия, как это было описано в разделе 2.1.
Актуальность решения задачи прогнозирования, в частности, для этой печи подтверждается анализом изменения величины содержания кремния в чугуне на протяжении 200 часов работы. Как видно из графика (рис. 4.2), величина периодических колебаний данного параметра лежит в диапазоне значений от 0,35 % до 1,25 %.
Список исходных параметров и их структура. В результате выполнения хранимой процедуры был получен массив признаковых векторов. Каждый вектор содержал информацию о величине содержания кремния в чугуне для конкретного выпуска и набор параметров, характеризующих процесс доменной плавки, предшествующий произведенному выпуску. Первоначальный список признаков, вошедших в описание объекта прогнозирования (табл. 4.1), был сформирован на основе экспертных рекомендаций специалистов по доменной плавке и персонала доменного цеха. Из этого списка были исключены параметры, имеющие косвенное отношение к процессу доменной плавки, такие как температура лещади или температура воздуха в помещении цеха. Кроме того, некоторые параметры были исключены как дублирующие после выполнения корреляционного анализа. Всего для решения задачи было отобрано 65 признаков.
Под ошибкой (w) здесь понимается усредненное по всему вектору отношение модуля разности реального и предсказанного значения к разности между максимальным и минимальным значениями известных элементов столбца, содержащего данное значение. Векторы со средней ошибкой w 8% были исключены из дальнейшего обучения как нетипичные. В дальнейшем эти векторы могут быть изучены дополнительно для выяснения природы их девиантности. Причинами отклонений данных векторов могут быть сбои в работе отдельных элементов измерительной аппаратуры, наличие периодов значительной нестабильности в работе печи, а также погрешности, связанные с полуавтоматическим вводом информации об отдельных параметрах. Следует отметить, что в целом невысокий процент (менее 20 % [60]) средних ошибок по векторам свидетельствует не только о хорошем качестве информации об исследуемой области, но и том, что массив данных обладает достаточной для последующего обучения информационной избыточностью.
Формирование выборок. Данные выбранного периода были разделены на две группы векторов. Из меньшей группы была образована выборка для рабочего распознавания - итоговой проверки качества работы распознающего коллектива. Остальные данные использовались для обучения и контроля отдельных решающих правил в соответствии с технологией, рассмотренной в разделе 4.1. Что же касается формирования выборок, то оно производилось как случайным образом, так и с помощью таксономии. При этом в проверочную выборку включалось около 15 % векторов, остальные использовались для обучения.
Выбор информативных подсистем признаков выполнялся, как сказано в разделе 4.1, с использованием разработанного в работе алгоритма. В распознавании образов понятие информативности признака связывают с тем, насколько он полезен для решения задачи разделения множеств. Информативность является относительной характеристикой признака, меняющейся от задачи к задаче, зависящей от объема и состава обучающих выборок, от признакового контекста, т.е. от подсистемы признаков, в которую он входит, а также от используемого метода обучения. И хотя некоторые методы позволяют по результатам анализа значений признака в обучающей выборке оценить его информативность, эта оценка может рассматриваться лишь как весьма приблизительная. Реальная же полезность признака определяется его вкладом в конечный результат решения задачи обучения.
Алгоритм оценки информативности признаков по разности средних значений в классах был использован в данной работе при решении задачи определения индивидуальных временных сдвигов для отдельных параметров.
Также был проведена оценка эффективености использования расчетных параметров, полученных с использованием модели ДП УГТУ-УПИ (рис. 4.4). В целом, включение указанных параметров в информативные подсистемы признаков позволяет повысить результаты обучения на 5-Ю %. Также необходимо отметить, что использование модельных параметров позволяет формировать более компактные системы признаков для достижения удовлетворительных результатов распознавания, что положительно сказывается на скорости работы алгоритмов обучения и распознавания.
Обучение и формирование распознающего коллектива. Для формирования распознающего коллектива решающих правил было выполнено более 300 циклов обучения. С целью включения в коллектив решающих правил было отобрано 9 лучших решающих правил, полученных с использованием метода потенциальных функций, и 2 - с использованием метода комитетов старшинства (табл. 4.3). Проверка эфективности решающих правил производилась на экзаменующих выборках, полученных по результатам таксономии. Такой способ разбиения наблюдений на обучающую и экзаменующую выборки обеспечивает их максимальную репрезентативность. При этом оценка качества решающих правил обычно оказывается несколько завышенной.
Для оценки эффективности распознавания векторов с использованием коллектива из И лучших решающих правил была сформирована выборка из 100 векторов, не участовавших ранее в обучении и контроле. Такая оценка является наиболее приближенной к реальным условиям прогнозирования, в которых распознаваемые векторы являются «новыми» для распознающей системы. При этом был получен следующий результат: 81 % правильной классификации векторов. Полученная эффективность прогнозирования величины содержания кремния в чугуне является приемлемой и соответствует требованиям данного исследования.
Разработанный алгоритм позволяет выполнять прогноз с достаточно высокой вероятностью совпадения прогнозной величины с фактическим значениеми может быть использован для повышения эфективности доменной плавки в целом за счет выполнения своевременных корректировок хода доменной печи.