Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Манашов Андрей Геннадьевич

Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования
<
Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Манашов Андрей Геннадьевич. Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования : Дис. ... канд. техн. наук : 05.03.01 : Иваново, 2004 185 c. РГБ ОД, 61:05-5/1464

Содержание к диссертации

Введение

1. Аналитический обзор 13

1.1. Реализация принципов автоматизации в области применения СОТС в машиностроительном производстве 13

1.2. Физические аспекты процесса резания с применением СОТС 19

1.3. Классификация СОТС 22

1.4. Механизм смазочного действия СОТС 25

1.4.1. Общие представления о смазочном процессе при резании металлов 25

1.4.2. Проникновение смазочной среды в зону трения 31

1.4.3. Капиллярная модель проникновения смазочной среды 39

1.4.4. Многостадийный характер процесса формирования граничного смазочного слоя при резании 47

1.5. Основные положения теории нейронных сетей 49

1.5.1. Биологический нейрон 51

1.5.2. Структура и свойства искусственного нейрона 53

1.5.3. Классификация нейронных сетей и их свойства 56

1.5.4. Обучение нейронных сетей 62

1.5.5. Алгоритм обратного распространения 65

1.6. Среда программирования C++ Builder 5.0 67

1.7. Выводы по аналитическому обзору. Постановка цели и задач исследования 70

2. Построение расчетной модели формирования адсорбционного смазочного слоя на основе капиллярного представления 72

2.1. Аналитическая модель проникновения СОТС 73

2.2. Построение математического описания адсорбционого смазочного процесса на базе капиллярной модели 84

2.3. Разработка компьютерной программы по анализу адсорбции и диффузии в смазочном микрокапилляре 89

2.4. Обсуждение результатов компьютерных расчетов по моделированию адсорбции 94

3. Расчет энергии адсорбции смазочного материала в трибосистеме с помощью пакета программ HYPERCHEM 102

3.1. Оптимизация методом сопряженных градиентов. Алгоритм Полака-Рибьера 102

3.2. Моделирование поверхности и молекул ПАВ 109

4. Принципы построения нейронной сети 119

4.1. Алгоритм обратного распространения применительно к разработанной сети 119

4.2. Шкалирование данных 126

5. Реализация нейросетевой программы 130

6. Эксперимент по обучению нейронной сети 133

6.1. Сравнение работы нейронной сети с данными многофакторной

регрессии 145

Основные выводы 147

Литература

Введение к работе

К настоящему времени роль смазочно-охлаждающих технологических сред (СОТС) в машиностроительном производстве остается весьма высокой, несмотря на появление технологий безотходной обработки, в ходе которых не используются смазочные материалы. Существует достаточное число узлов и деталей машин, которые обрабатываются резанием и к которым предъявляются строгие условия по качеству обработанной поверхности. Достичь желаемого качества невозможно без правильного выбора СОТС.

В последнее время получили широкое распространение гибкие автоматизированные производства (ГАП). Отличие данных производств состоит в их быстром перепрофилировании при смене какой-либо стадии технологического процесса, либо всего процесса в целом без смены оборудования производства, а лишь путем замены его программного обеспечения. В таких производствах, особенно машиностроительных, нельзя обойтись без СОТС, использование которых также должно быть максимально оптимизировано. Поэтому актуальным становится вопрос о правильном выборе и обосновании рационального состава смазочных материалов, применяемых при резании металлов, что позволяет снижать энергозатраты и уменьшать износ контактирующих частей. До настоящего времени эта проблема еще не имеет фундаментальной теоретической базы, ввиду сложности построения достаточно достоверной модели смазочного действия СОТС.

Проблема создания новых эффективных СОТС включает решение следующих задач: исследование механизма действия технологической среды (особый интерес представляет роль воды и кислорода как наиболее распространенных и важных компонентов большинства СОТС), разработка научных принципов целенаправленного синтеза эффективных составов, создание критериев и методик оценки функциональных свойств СОТС.

Поэтому для облегчения задачи выбора наиболее эффективной смазочной среды необходимо использовать компьютерное моделирование и, по возможности, визуализировать некоторые стадии процесса резания.

Для компьютерного моделирования в данном случае ввиду сложности процесса смазочного действия как совокупности абсолютно разных по природе процессов, наиболее целесообразно использовать один из новых вычислительных методов, получающих в последние годы распространение в самых различных отраслях науки — нейросетевое программирование. Известны случаи применения этого подхода в медицинской диагностике, в разнообразных задачах распознавания образов, при оптимизации технических систем.

При таком способе решения сложных задач, возникающих при работе со сложными объектами и процессами, можно не углубляться в каждую из стадий процесса. Модель приобретает вид так называемого "черного ящика", позволяющего предсказывать трибологические характеристики СОТС на основании их физико-химических характеристик. В некотором смысле нейросетевая идеология является развитием идей оптимизационного факторного эксперимента на базе бурного прогресса современной вычислительной техники и теории программирования.

Проблема формирования смазочного слоя на металлической , особенно в условиях ограниченного доступа смазочной среды в контактную область, является задачей такого высокого уровня сложности (по количеству влияющих факторов, по характеру взаимодействия между ними, по разнообразию протекающих при этом физических, химических и физико-химических процессов), которая вряд ли может быть достаточно полно описана в рамках традиционного математического моделирования, и поэтому здесь применение подобных методов «нечеткой логики» является, по нашему мнению, вполне обоснованным и актуальным.

Актуальность работы

Актуальность работы основывается на тенденции автоматизации и компьютеризации большинства процессов и задач, связанных с машиностроительным производством. Составление оптимальных смазочных композиций СОТС до сих пор является в большинстве случаем процессом эмпирическим, теоретическое обоснование и, тем более, численное моделирование этой процедуры находится в начальной стадии. В этом аспекте развитие аналитических и компьютерных методов описания трибологиче-ских свойств СОТС, выявление взаимосвязи между этими свойствами и физико-химическими характеристиками индивидуальных компонентов смазочных материалов (масел, растворителей, присадок) раскрытие природы смазочного процесса — находятся в русле интересов современной технологической науки и являются существенным резервом повышения эффективности металлообрабатывающего производства.

Настоящая работа направлена на решение задач конструирования и оптимизация состава смазочных композиций, содержащих трибоактивные компоненты.

Научная новизна

  1. Построена аналитическая математическая модель формирования смазочного слоя, описывающая явления диффузии и адсорбции, основанная на микрокапиллярном представлении о смазочном процессе при лезвийном резании.

  2. Решена задача расчетной оценки адсорбционной активности трибо-активных компонентов СОТС на основе молекулярного моделирование адсорбции с помощью оптимизационного алгоритма программного пакета "Hyperchem".

  3. Разработан метод описания и диагностики смазочного процесса лезвийного резания, основанный на комбинации аналитического и ней-росетевого подхода, для предсказания трибологической эффектив-

4*

ности компонентов СОТС, исходя из комплекса их физико-химических характеристик.

Апробация работы

Результаты диссертационной работы были доложены на следующих научных конференциях: «Молодая наука — XXI веку» (Иваново, 2001 г.); «Молодая наука в классическом университете (2002, 2003 и 2004 гг.); Научно-технической конференции молодых ученых-физиков. Иваново, Ив-ГУ, 2002; Межвуз. научн. семинаре «Физика, химия и механика трибоси-стем» (Иваново, 2002, 2003 гг.); Всеросс. научно-технич. конф. «Аэрокосмические технологии и оборудование на рубеже веков». Рыбинск, 2002; на заседании кафедры экспериментальной и технической физики ИвГУ (2004 г); Междунар. школе молодых ученых «IV Чистяковские чтения» Иваново, 2004 г.

Публикация материалов диссертации

1. Манатов А.Г., Стадник А.В. Компьютерное моделирование
Т> процесса формирования граничного смазочного слоя в условиях

плотного контакта пары трения // Тез. докл. конф. молодых ученых ИвГУ. Иваново, ИвГУ. 2001. С. 35.

  1. Годлевский В.А, Манатов А.Г. Компьютерная реализация капиллярной модели смазочного действия СОТС при резании металлов // Тез. докл. Всеросс. научно-технич. конф. Ч. 2. Рыбинск, 2002. С. 1.

  2. Манатов А.Г. Компьютерная реализация капиллярной модели смазочного действия СОТС при резании металлов // Молодая наука в классическом университете Тез. докл. научн. конф. фестиваля

^ студентов, аспирантов и молодых ученых. Иваново. Изд-во ИвГУ.

2002. С. 71.

4. Манатов А.Г. Роль молекулярной структуры поверхностно-
активных присадок в их смазочном действии при резании // Физика,

~Ь химия и механика трибосистем. Межвуз. сб. научн. тр. Иваново.

Изд. «Ивановский, гос. ун-т», 2003. С. 65-67.

V.

  1. Манатов А.Г. Компьютерное моделирование процесса формирования граничного смазочного слоя в условиях плотного контакта пары трения // Вестник молодых ученых ИвГУ. 2002. Вып. 2. С. 14— 16.

  2. Годлевский В.А, Манатов А.Г. Компьютерная модель граничного смазочного слоя в капиллярной системе // Тез. докл. междунар. научно-техн. конференции. «Состояние и перспективы развития электротехнологии» 2003. Т. И. С. 120.

  3. Годлевский В.А, Манатов А.Г. Автоматизированная система для расчетной оценки смазочных свойств СОТС // Межвуз. сб. научн. трудов, посвященный юбилею В.Н. Латышева. Иваново, 2004. С. (в печати). Годлевский В.А, Манатов А.Г. Автоматизированная система для расчетной оценки смазочных свойств СОТС // Физика, химия, механика трибосистем. Межвуз. сб. научных трудов. Вып.З. Под ред. Латышева В.Н. Иваново. Изд-во ИвГУ. 2004. С. 30-34.

8. Манатов А.Г., Березина Е.В., Годлевский В.А., Клюев М.В По
строение алгоритма расчетной оценки трибологической активности
компонентов СОТС при лезвийном резании металлов // Сб. тр. мо
лодых ученых ПЛЖК ИвГУ (В печати).

^

Практическая полезность результатов

1. Разработана программа для определения адсорбционной способности того или иного вещества по макропараметрам процесса резания.

  1. Разработана универсальная автоматизированная система для расчета трибологических характеристик СОТС на основании их физико-химических характеристик.

  2. Программа передана для промышленной апробации на химические предприятия, занимающиеся выпуском серийных СОТС: Ивановский Химзавод им. Батурина, ОАО Заволжский химический завод им. Фрунзе; ОАО НПО «Янтарь», г. Иваново.

Физические аспекты процесса резания с применением СОТС

Резание как процесс обработки включает: разрушение металла и образование в результате этого новой поверхности на детали; интенсивную пластическую деформацию удаляемого слоя с превращением его в стружку; пластическую деформацию вновь образованной поверхности детали, распространяющуюся на некоторую глубину [37, 26]. Все эти явления в каждый данный момент локализованы в некоторой области металла, нахо дящейся непосредственно перед передней поверхностью инструмента и примыкающей к его режущим кромкам, перемещающимся относительно обрабатываемой детали в соответствии с кинематической схемой резания [66].

В зонах контакта отходящей стружки и обработанной поверхности изделия с передней и задними гранями инструмента появляются весьма высокие контактные напряжения (на большей части контактных зон) и тяжелые режимы граничного трения, характеризующиеся непрерывным изнашиванием поверхностных слоев. В результате непрерывно образуются участки новых поверхностей и на инструменте [30].

Природа материи, однако, такова, что интенсивные механические воздействия на обрабатываемый и инструментальный режущий материалы оказываются лишь начальным звеном цепи широкого круга физических явлений, между которыми в каждый момент устанавливается определенное динамическое равновесие. В конечном итоге, именно поэтому внешняя среда оказывается одним из существенных факторов, влияющих на все совершающееся при резании процессы [37, 30].

Первым по важности является то, что большая часть механической энергии, расходуемой на резание, превращается в теплоту, разогревает макро-, и микро- и субмикрообъемы обрабатываемой детали, стружки, инструмента. Субмикрообъемы, где возникают температурные вспышки, разогреваются, по крайней мере, до температуры плавления обрабатываемого металла [37]. Казалось бы при такой температуре органические вещества должны распадаться на составляющие фрагменты, «осколки». Но если бы это было так, то в смазочном процессе разные по свойствам, но сходные по химическому составу вещества, например, спирты, эфиры, углеводороды, ароматические соединения — должны были бы оказывать одинаковый смазочный эффект, поскольку их «осколки» были бы примерно одинаковы.

Фактически же, по результатам проведенных экспериментов, можно сделать вывод, что вещества разной молекулярной структуры оказывают разный эффект, на процесс резания, что приводит к выводу, что они не распадаются (или не успевают распасться до совершения ими «смазочного акта») при высокой температуре в зоне контакта [26, 66]. К подобному выводу.приходят и авторы работ [22, 23], предлагающие модель «композитного» трибополимеризованного смазочного слоя, образующего из органических и неорганических компонентов на поверхности инструмента и обрабатываемого материала.

Интенсивная пластическая деформация отделяемого слоя означает глубокие изменения, которые претерпевает кристаллическая ионная решетка металла: она деформируется — изменяются ее параметры, чему соответствует накопление избыточной внутренней энергии. В результате разогревания возрастает амплитуда колебаний ионов относительно центрального их положения, что приводит к увеличению вероятности удаления их из узлов решетки и появлению большого числа вакансий и дислоцированных атомов; в огромной степени возрастает количество других дефектов кристал 11 10 лической решетки, прежде всего дислокаций (до 10 —10 на квадратный сантиметр поверхности) [37].

Образующиеся при резании поверхности на стружке, обрабатываемой детали и инструменте, а также частицы внешней среды чрезвычайно сильно активированы, и именно поэтому они весьма активно взаимодействуют друг с другом. Происходящие при этом реакции и их скорость обусловлены законами неравновесной термодинамики и могут приводить к образованию соединений, существование которых невозможно в обычных условиях [37, 30]. Поскольку новая поверхность стремится обрести термическое равновесие, за процессами активации при трении и износе всегда следуют процессы пассивации [57]

Структура и свойства искусственного нейрона

Нейрон — это составная часть нейронной сети. На рис. 1-9 показана его структура. В состав нейрона входят умножители (синапсы), сумматор и нелинейный преобразователь. Синапсы осуществляют связь между нейронами и умножают входной сигнал на число, характеризующее силу связи, — вес синапса. Сумматор выполняет сложение сигналов, поступающих по синап-тическим связям от других нейронов, и внешних входных сигналов. Нелинейный преобразователь реализует нелинейную функцию одного аргумента — выхода сумматора. Эта функция называется «функция активации» или «передаточная функция» нейрона. Нейрон в целом реализует скалярную функцию векторного аргумента, Математическая модель нейрона описывается соотношениями: =1 (1.9) где Wj — вес синапса (і - 1, ..., п)\Ъ — значение смещения; s — результат суммирования; xt — компонента входного вектора (входной сигнал) (i = 1, ..., п)\ у — выходной сигнал нейрона; п — число входов нейрона;/— нелинейное преобразование (функция активации или передаточная функция) [32].

В общем случае входной сигнал, весовые коэффициенты и значения смещения могут принимать действительные значения. Выход (у) определяется видом функции активации и может быть как действительным, так и целым. Во многих практических задачах входы, веса и смещения могут принимать лишь некоторые фиксированные значения.

Синаптические связи с положительными весами называют возбуждающими, с отрицательными весами — тормозящими. Таким образом, нейрон полностью описывается своими весами w,- и передаточной функцией f(s). Получив набор чисел (вектор) х( в качестве входов, нейрон выдает некоторое число у на выходе. Описанный вычислительный элемент можно счи тать упрощенной математической моделью биологических нейронов — клеток, из которых состоит нервная система человека и животных.

Чтобы подчеркнуть различие нейронов биологических и математических, вторые иногда называют «нейроноподобными элементами» или «формальными нейронами». На входной сигнал (s) нелинейный преобразователь отвечает выходным сигналом f(s), который представляет собой выход нейрона у.

Одной из наиболее распространенных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S - образного вида) т"й7 (1Л0)

При уменьшении а сигмоид становится более пологим, в пределе при а = О, вырождаясь в горизонтальную линию на уровне 0,5, при увеличении а сигмоид приближается по внешнему виду к функции единичного скачка с порогом Є в точке s = 0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0, 1]. Одно из ценных свойств сигмоидной функции — простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем: f (s) = af(s)(l-f(s)). (1.11)

Следует отметить, что сигмоидная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того, она обладает свойством усиливать слабые сигналы лучше, чем большие, и предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон.

Возвращаясь к общим чертам, присушим всем НС, отметим принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения опре деленным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно[43]. «Распараллеливание» расчетов является одним из наиболее действенным методом решения задач, требующих большого объема вычислений. Таким свойством «распараллеливания» обладают и многие нейронные сети.

Построение математического описания адсорбционого смазочного процесса на базе капиллярной модели

Фаза адсорбции в микрокапиллярной модели является завершающей и в некотором смысле наиболее важной в ходе всего процесса формирования граничного смазочного слоя. По этой причине нами для предварительного компьютерного анализа был выбран процесс массопереноса внутри смазочного капилляра. Динамика такого процесса определяется, с одной стороны, диффузией молекул ПАВ в глубь капилляра, а с другой - собственно физической адсорбцией частиц на его стенках. Адсорбция «обедняет» объемное содержание капилляра, фиксирует молекулы на стенках и не дает им диффундировать далее вдоль оси капилляра. В этом смысле два рассматриваемых процесса являются взаимно конкурентными, и их следует рассматривать совместно в рамках одной математической модели.

Пусть мы имеем капилляр с одним концом, в который в итоге микровзрывного испарения «закачана» порция газообразного трибоактивного вещества — ПАВ. Молекулы ПАВ находятся в тепловом диффузионном движении и, сталкиваясь со стенками капилляра, способны на них адсорбироваться. Для описания одновременно протекающих процессов диффузии и адсорбции запишем на основе локального закона сохранения вещества и принципов неравновесной термодинамики систему уравнений (по добный принципиальный подход был предложен А.В. Волковым в работе [15]): \дп _ Рд2п_д/3 ,dt fidx2 dt (2.26) a(fi(n) -Мф)) где п - объемная концентрация вещества; /3 - концентрация адсорбированного вещества; D - коэффициент диффузии; / - длина капилляра.

Первое уравнение представляет собой закон сохранения вещества ПАВ в капилляре. Второе - получено по обычной схеме неравновесной термодинамики и выражает собой пропорциональность между скоростью изменения поверхностной концентрации ПАВ и разностью химических потенциалов ПАВ в объеме капилляра ц(п) и на его поверхности ju(/3). В условиях равновесия химические потенциалы равны между собой и df3/dt=0. Если же ju(n) ju(/3), то dp/dt 0 (ПАВ адсорбируется на поверхности капилляра). Если же ц(п) [л((3), то dfi/dt 0 и происходит десорбция ПАВ с поверхности капилляра. При малых концентрациях ПАВ процесс адсорбции идет вблизи прямолинейного участка изотермы адсорбции, на которой имеет место соотношение: J3o =т (2.27) где v - коэффициент пропорциональности, имеющий смысл тангенса угла наклона прямолинейного участка изотермы адсорбции.

Пусть вблизи равновесия отклонение /? от равновесного значения Д, равно є =/?- /. Тогда функцию JU(J3) =JU(J3O+) можно разложить в ряд по степеням є. Если ограничиться линейными членами разложения и учесть при этом, что в условиях равновесия iu(n)=jii(Po)= ju(vn), получим: =ТЛ-(ф-уп) (2.28) ч -К С учетом этого выражения система (2.26.), дополненная начальными и граничными условиями, примет вид: дп _ тк д2п др dt г1 дх2 & (2.29) t = 0: n=l,j3=0; (2.30) х = 0: и=1; х = \: - = 0 (2.31) дх где Т] - время, необходимое для того, чтобы частица ПАВ в газовой фазе при температуре Т продиффундировала вдоль капилляра длиной /, т2 время адсорбционных процессов на поверхности капилляра, г - время существования капилляра.

Краевые условия показывают, что в начальный момент времени концентрация ПАВ в капилляре равна его концентрации вне капилляра, а на стенках капилляра адсорбированное ПАВ отсутствует. Концентрация ПАВ в паровой фазе (п) на входном конце капилляра (х = 0) совпадает с начальным значением концентрации ПАВ, на другом конце (х = I) поток вещества ПАВ дп/дх равен нулю. Данная система уравнений описывает динамику адсорбционных процессов (в случае одноциклового заполнения капилляра) [21], но она не описывает стадию заполнения капилляра, поэтому была разработана модель смазочного действия, в которую входила бы как стадия заполнения капилляра, так и стадия адсорбции ПАВ из паровой фазы на его стенках. Таким образом, автором настоящей диссертации была предложена для описания диффузионно-адсорбционного капиллярного процесса следующая система дифференциальных уравнений:

Алгоритм обратного распространения применительно к разработанной сети

Рассмотренная процедура может быть легко обобщена на случай сети с произвольным количеством слоев и нейронов в каждом слое. Обратим внимание, что в данной процедуре сначала происходит коррекция весов для выходного нейрона, а затем — для нейронов скрытого слоя, т.е. от конца сети к ее началу. Отсюда и название — обратное распространение ошибки. Ввиду использования для обозначений греческой буквы д, эту процедуру обучения называют еще иногда обобщенным дельта-правилом. [43]

Дадим изложенному геометрическую интерпретацию.

В алгоритме обратного распространения вычисляется вектор градиента поверхности ошибок. Этот вектор указывает направление кратчайшего спуска по поверхности из данной точки, поэтому, если мы «немного» продвинемся по нему, ошибка уменьшится. Последовательность таких шагов (замедляющаяся по мере приближения к дну) в конце концов приведет к минимуму того или иного типа. Определенную трудность здесь представляет вопрос о том, какую нужно брать длину шагов (что определяется величиной коэффициента скорости обучения rf).

При большой длине шага сходимость будет более быстрой, но имеется опасность перепрыгнуть через решение или (если поверхность ошибок имеет особо вычурную форму) уйти в неправильном направлении. Классическим примером такого явления при обучении нейронной сети является ситуация, когда алгоритм очень медленно продвигается по узкому оврагу с крутыми склонами, прыгая с одной его стороны на другую. Напротив, при маленьком шаге, вероятно, будет схвачено верное направление, однако при этом потребуется очень много итераций. На практике величина шага берется пропорциональной крутизне склона (так что алгоритм замедляет ход вблизи минимума) с некоторой константой (?/), которая, как отмечалось, называется коэффициентом скорости обучения. Правильный выбор скорости обучения зависит от конкретной задачи и обычно осуществляется опытным путем; эта константа может также зависеть от времени, уменьшаясь по мере продвижения алгоритма[43].

Обычно этот алгоритм видоизменяется таким образом, чтобы включать слагаемое импульса (или инерции). Этот член способствует продвижению в фиксированном направлении, поэтому если было сделано несколько шагов в одном и том же направлении, то алгоритм «увеличивает скорость», что (иногда) позволяет избежать локального минимума, а также быстрее проходить плоские участки.

Таким образом, алгоритм действует итеративно, и его шаги принято называть эпохами. На каждой эпохе на вход сети поочередно подаются все обучающие наблюдения, выходные значения сети сравниваются с целевыми значениями и вычисляется ошибка. Значение ошибки, а также градиента поверхности ошибок используется для корректировки весов, после чего все действия повторяются. Начальная конфигурация сети выбирается случайным образам, и процесс обучения прекращается, либо когда пройдено определенное количество эпох, либо когда ошибка достигнет некоторого определенного уровня малости, либо когда ошибка перестанет уменьшаться (пользователь может сам выбрать нужное условие остановки).

Классический метод обратного распространения относится к алгоритмам с линейной сходимостью и известными недостатками его являются.: невысокая скорость сходимости (большое число требуемых итераций для достижения минимума функции ошибки), возможность сходиться не к глобальному, а к локальным решениям (локальным минимумам отмеченной функции), возможность паралича сети (при котором большинство нейронов функционирует при очень больших значениях аргумента функций активации, т, е. на ее пологом участке; поскольку ошибка пропорциональ на производной, которая на данных участках мала, то процесс обучения практически замирает).

Для устранения этих недостатков были предложены многочисленные модификации алгоритма обратного распространения, которые связаны с использованием различных функций ошибки, различных процедур определения направления и величины шага и т. п.[43]

Мы уже отметили то обстоятельство, что эталонные значения выходов сети с сигмоидальной функцией должны лежать в диапазоне от нуля до единицы. Причиной этого является то, что выход сигмоидальной функции лежит в указанном диапазоне. Выходы различные функций активации лежат в различных диапазонах. Например, выходные значения функции гиперболического тангенса лежат в диапазоне от -1 до 1. Выходные значения линейной функции не ограничены.

В первых двух случаях необходимо, а в последнем — желательно шкалировать данные таким образом, чтобы они не выходили за пределы соответствующих диапазонов. Несмотря на то, что входные элементы обычно линейны, тем не менее, желательно шкалировать данные перед тренировкой. Одно из преимуществ данной операции состоит в том, что при ее выполнении мы будем вынуждены применять некоторые базовые статистические процедуры, касающиеся распределения тренировочных данных и устранения влияния выбросов в тренировочном наборе данных.

Похожие диссертации на Расчетная оценка смазочного действия органических компонентов СОТС при лезвийном резании металлов на базе микрокапиллярной модели и нейросетевого программирования