Разработан метод синтеза адаптивных систем с оптимальным управлением согласно выбранному критерию качества управления нелинейным объекта и использований нейросетего регулятора для аппро
Trang 1Z Y
ЛЫОНГ ВАН ЛАНГ
СИНТЕЗ АДАПТИВНЫХ РЕГУЛЯТОРОВ
ДЛЯ РОБОТОВ SCARA
НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ
Диссертация на соискание ученой степени
кандидат технических наук
Специальность: 05.13.06 Автоматизация управления технологическими процессами и
производством
Москва - 2006
Trang 2Создание интелектуальных роботов, способных обеспечить выполнением поставленных задач в неполнозаданной (или неопределенной) среде , является чрезвычайно важной проблемой как в чисто научном , так и в прикладном плане Поиски возможных подходов к ее решению продолжаются на протяжении многих лет в
соответствующих профиля различных стран мира Первые практические достижения в этой области были полученны в конце 60-х начале 70-х годов рядом творческих коллективов, доказали принципиальную возможность разработки робототехнических систем с элементами исскуственного интелекта Результаты некоторых экспериментов того периода сохраняют свою значимость и по сей день
Специфика задач управления автономннами роботами , определяется целым набором различнных факторов, главный из которых связан с полпотой исходной информации Контроль за внешней средой и теми возмущениями, которые испытывают робот в процессе своей работы осуществляется датчиками очувствления, вносимами дополнительную неопределенность за счет погрешности измерений При этом система управления роботом должна обладать адаптивными возможностями для выполнения требуемых операции с заданными показателями качества
Однако существующие методы синтеза адаптивных систем управления в большинстве применены имено для линейных объектов Законы настройки параметров управляющих устройств могут быть
Trang 3Применение нейросетевой технологии для построения адаптивных систем связано с способностью обучения и аппросимации любой нелинейной функции с любой точностью Это дает возможность создавать адаптивные системы с оптимальным управлением , которое может быть аппросимированно выходной переменной нейронной сети
Из вышесказанного, следует что разработка метода синтеза адаптивной системы управления роботом-манипулятором на базе нейронной сети является весьма актуальной задачей
ЦЕЛЬ РАБОТЫ состоит в разработке нового метода синтеза
адаптивной системы управления сборочными движениями робота,
функционирования сборочной манипуляционной системы с заданными показателями качества на базе использования нейросетевой тегнологии
Работа в ключает в себя:
1 На основе анализа принципиальных теоретических трудностей, возникающих при построений адаптивных систем управления сложными нелинейно-динамическими объектами , определить подход преодоления этих трудностей на основе применения аппарата нейросетевой технологии
2 Разработать новый метод определения законов адаптации параметров нейросетевых регуляторов и определить структуру адаптивной системы с использованием этого регулятора
Trang 4ДОСТОВЕРНОСТЬ научных результатов, выводов и рекомендации
подтверждается результатами имитационного моделирования и исследований на физической модели Кроме того, новые научные результаты были использованы при проектировании АСАУ несколькими электромеханическими объектами, лабораторные испытания которых подтвердили предлагаемое заданное качества адаптации, устойчивость и быстродействие реализованных АСАУ
НАУЧНАЯ НОВИЗНА
1 Разработан метод синтеза адаптивных систем с оптимальным управлением (согласно выбранному критерию качества управления ) нелинейным объекта и использований нейросетего регулятора для аппросимации этого управления
Trang 5асимптотическая устойчивость
3 Для упрощения реализации АСАУ предложено осуществить процесс адаптации на основе ошибки основного контура и ее производной
4 Проведен синтез адаптивных систем управления роботом – манипулятором
5 Имитационным моделированием и путем испытания физической модели обоснована работоспособность разработанных адаптивных систем при наличий возмущающих воздействий и вариации параметров объекта управления
ОСНОВНЫЕ ПОЛОЖЕНИЯ ДИССЕРТАЦИИ, ВЫНОСИМЫЕ
НА ЗАЩИТУ
1 Метод синтеза адаптивных систем с оптимальным управлением нелинейным объекта и использований нейросетего регулятора для аппросимации этого управления
2 Закон адаптации параметров нейросетего регулятора в адаптивной системе управления при этом обеспечена асимптотическая устойчивость
3 Адаптивная система управления роботом – манипулятором SCARA
Trang 6результаты доведены до уровня удобного для использования при решений прикладных задач
1 Решена задача синтеза адаптивных систем управления манипулятором
роботом-2 Выведен закон адаптации параметров нейросетего регулятора в системе управления роботом SCARA
3 Исследована адаптивная система управления на физической модели
АПРОБАЦИЯ РАБОТЫ
Различные части работы неоднократно обсуждались на научных семинарах, конференциях и съездах во Вьетнаме и за рубежом В том числе: на 8-м и 9-м Научно-техническом совещании Хошиминского политехнического университета (Хомимин 2003, 2005), на Международной конференции International Conference for Mechanical and Automotive Technologies ICMAT 2005 Korea Часть работы также была опубликована в книге Scientific Book “Cutting Edge Robotics”, Vienna University of Technology, 2005, ISBN 3-86611-038-3
Разработанные методы управления успешно использованы в
рамках гостемы № В2004-20-05
Trang 7автоматического управления 1.3 Реализация оптимального управления с помощью RBF-
нейронных сетей 1.4 Постановка задач диссертационной работы
нелинейных динамических объектов 2.3 Двухшаговый метод реализации адаптивных систем
управления 2.4 Управление сборочным роботом от ЭВМ с оптическим
датчиком Выводы к главе II
Trang 8робота SCARA 3.3 Моделирование робота SCARA на основе нейронных
сетей 3.4 Синтез системы управления
3.5 Проектирование АСАУ с помощью искусственных
нейронных сетей 3.6 Синтез нейросетевых адаптивных регуляторов для
Trang 9ГЛАВА 1 ПРЕДПОСЫЛКИ ПОСТАНОВКИ ЗАДАЧ ДИССЕРТАЦИОННОЙ РАБОТЫ
1.1 ОНОВНЫЕ ПРИЦИПЫ ПОСТРОЕНИЯ ТРАДИЦИОННЫХ
АДАПТИВНЫХ СИСТЕМ УПРАВЛЕНИЯ
При решении задачи синтеза системы автоматического управления во многих реальных ситуациях информация о свойствах объекта управления
и внешних воздействиях оказывается недостаточной для построения системы с необходимыми показателями качества Недостаток информации может носить двоякий характер
В первом случае на этапе проектирования структуры и расчета параметров управляющих устройств (УУ) или некоторой его части могут оказаться полностью или частично неизвестными свойства объекта управления (ОУ) и внешних возмущающих воздействий Система управления в процессе функционирования сама должна автоматически восполнить недостающую информацию и по мере ее поступления изменить параметры УУ и возможно структуру так, чтобы показатель качества или достигал экстремального значения, или соответствовал заданным ограничениям При неизменных в последующем свойствах ОУ и внешних воздействий процесс изменения структуры и параметров УУ прекращается, и система работает в обычном режиме
Во втором случае имеются исходные сведения о свойствах ОУ и внешних воздействий, позволяющие синтезировать УУ Однако в процессе работы системы эти свойства в силу различных причин не остаются постоянными Если эти изменения происходят в достаточно большом диапазоне, то управляющее устройство, спроектированное в ориентации на некоторую начальную информацию, в новых условиях уже не обеспечит
Trang 10соответствие показателя качества существующим ограничениям Чтобы ввести показатель качества в заданный диапазон, необходимо синхронно с изменением свойств ОУ и внешних воздействий изменять параметры или даже структуру УУ
Однако независимо от конкретных ситуаций общим для всех отмеченных случаев является тот факт, что система управления в процессе функционирования должна реагировать на изменение свойств ОУ и внешних воздействий На основании результатов обработки информации,
адаптироваться к новым условиям путем изменения параметров УУ или структуры некоторой его части так, чтобы показатель качества каждый раз достигал экстремального значения или находился в заданном диапазоне Для реализации такого режима работы необходимо строить адаптивные системы управления
Вопросам исследования и синтеза адаптивных автоматических систем управления, работающих в условиях структурной и параметрической неопределенности, посвящено достаточно большое количество работ [2,3,7,9,17,27,42,43,47,49,50,60,61,63-66,68-
150-152,157,158,160,161,163,167,175,179,194] В большинстве случаев в адаптивных системах мерой качества (под которой подразумевается точность воспроизведения задающих воздействий или качество переходных процессов) служат некоторые величины или функционалы Описанные в вышеназванных работах адаптивные системы, с одной стороны, обладают рядом общих принципов (наличие основного контура регулирования и контура самонастройки, обязательный сбор информации
об управляемом объекте, наличие процедуры идентификации и процедуры определения закона изменения параметров регулятора), а с другой стороны, характеризуются большим разнообразием в реализации основных
Trang 11процедур самонастройки В связи с этим адаптивные системы можно классифицировать по различным признакам Например, по исходному фактору, обусловливающему принцип самонастройки, можно выделить системы, самонастраивающиеся по: а) сигналам внешних воздействий; б) динамическим характеристикам объектов; в) комбинированные, включающие а) и б) В свою очередь системы типа б) и в) могут быть реализованы с использованием вычислителя параметров объекта, использованием эталонных и настраиваемых моделей, на основе применения анализаторов характеристик объекта или характеристик замкнутой системы Закон определения настройки параметров регулятора может быть основан на использовании поисковых алгоритмов (с применением изучающих сигналов или без них) или реализации вычислительных процедур (аналитические адаптивные системы) Практически для всех типов известных адаптивных систем характерна большая сложность в реализации контура самонастройки, которая зависит
от желаемой точности самонастройки
Структуру адаптивной системы в настоящее время часто формируют в соответствии с прямым и идентификационным подходами [44,61,69] При прямом подходе в составе идеального УУ предусматривается группа настраиваемых параметров, которые должны обеспечить способность системы адаптироваться к изменению свойств ОУ и внешних воздействий При идентификационном подходе предполагается, что характеристики ОУ
и внешних воздействий известны с точностью до группы параметров, которые в процессе работы системы могут изменяться Согласно общим положениям теории автоматического управления определяется зависимость настраиваемых параметров идеального УУ от параметров ОУ
и внешних воздействий [17,49,78], которые в последующем каким-то образом идентифицируют Полученные оценки этих параметров подставляют в выражение для настраиваемых параметров УУ, определяют
Trang 12необходимую их коррекцию, чем и достигают эффекта приспосабливаемости Реализация идентификационного подхода часто приводит к адаптивным системам с настраиваемой моделью, в то время как реализация прямого подхода приводит к адаптивным системам с эталонной моделью [3,49,89]
На рис.1.1 представлена блок-схема адаптивной системы управления с эталонной моделью [49] Основной контур регулирования состоит из регулятора Р, объекта управления ОУ и блока отрицательной обратной связи ГОС Контур самонастройки состоит из эталонной модели М, идентификатора И и устройства самонастройки УСН Роль модели в данном случае состоит в том, чтобы выдавать эталонную информацию о переменных состояния объекта ( ), которые сравниваются с переменными состояния объекта, получаемые с идентификатора
t M Х
( )t
Х В блоке УСН на основе информации о невязке E c( )t , согласно критерию оптимизации определяется оптимальная настройка параметров регулятора, например, в виде вектора β* Для решения этой задачи применяются различные методы в зависимости от способа определения критерия оптимизации настройки J CH, значение которого вычисляется в блоке УСН
В методе стохастической оптимизации для настройки параметров регулятора решается система уравнений:
( )t k( )t[J ( )i t J ( )i t n( )t ] i r
•
β β
где n( )t - погрешность в измерении, обусловленная помехами; r - число параметров настройки; k( )t - некоторый переменный коэффициент
Trang 13t n i
t i
J t
CH
( )t k
( )β t
εнесоответствия желаемого сигнала y з( )t и действительного y( )t , то уравнение, определяющее настройку параметров, имеет вид:
t y t k
i
`
, ,
Trang 14где T i - интервал квазистационарности параметров регулятора
Применение функций Ляпунова позволяет решить задачу обеспечения устойчивости процессов самонастройки или оптимизации процессов самонастройки по заданному критерию качества Как правило, функция Ляпунова строится в виде квадратичной положительно определенной формы [57,147]:
( ) ( )t C t C
0
<
•
Перечисленные выше методы определения законов настройки параметров не являются единственными Однако следует заметить, что рассмотренные примеры демонстрируют сложность этой процедуры, связанной с вычислительными операциями, требующими определенного времени
Пример адаптивной системы управления, где для самонастройки применен анализатор характеристик [49,71,89], показан на рис.1.2 Анализируемой характеристикой является импульсная переходная функция ( )ϖ t , на основании которой вычисляется критерий самонастройки
( )
( t
J ϖ ) и затем определяются корректирующие сигналы для настройки
Trang 15регулятора Для определения ϖ( )t используется метод идентификации, основанный на анализе случайных процессов типа “белого шума” Если случайные процессы являются стационарными, то для определения ( )ϖ t
можно использовать уравнение Винера-Хопфа При входном случайном сигнале g( )t типа “белого шума” корреляционная функция R g( )τ = Φ0δ( )τимеет вид δ-функции и уравнение Винера-Хопфа вырождается в равенство:
( )τ = ϖ( )τ
yg
R , (1.1) где Φ0- интенсивность белого шума В соответствии с (1.1) определяется взаимной корреляционной функцией Поэтому контур самонастройки имеет генератор “белого шума” (ГБШ), многоканальную временную задержку (МКВЗ), многоканальное множительное и суммирующее устройство (МКМСУ), анализатор характеристик (АХ) и устройство самонастройки (УСН)
( )t
R yg
предусматривает введение источника белого шума ГБШ Структура АХ определяется типом критерия J и видом ϖ( )t
Применение модели в адаптивных системах управления очень распространенно, и цели их использования весьма разнообразны Так, на рис.1.3 приведен пример адаптивной системы, в которой имеются две модели системы Одна - эталонная - с передаточной функцией используется для определения желаемого качества работы системы, и другая - с подстройкой параметров под действующую систему для определения функций чувствительности изменяющихся параметров, необходимых для реализации процедуры самонастройки
Trang 16
Р
Рис.1.2 Адаптивная система с анализатором характеристик
Основной контур регулирования представлен передаточной функцией объекта W об( )р и регулятора W R( )p , настраиваемая модель содержит передаточные функции модели объекта W М( )р
( ) − ∫ ∂∂ ( )
i
k i
dJ i
t d
dJ
i
J
ββε
ββ
εε
Путем несложных преобразований можно показать, что
Trang 17( ) ( ) [ ( )] ( ) W ( )p
i W W
W W
W p G p
з
W i p G
i
p
y
R об
M
1 1
В ряде работ большое внимание уделено проблеме синтеза алгоритмов адаптивной настройки: определению формы аналитических выражений закона адаптации и аналитическому доказательству свойств устойчивости АСАУ В этих работах рассмотрен ряд основных схем адаптивного управления: адаптивного управления с эталонной моделью по состоянию [79,141], адаптивного управления с эталонной моделью по выходу с использованием сигнала расширенной ошибки [61], адаптивных систем с неявной эталонной моделью [11,23] и адаптивных наблюдателей [66]
В некоторых работах [61] предложен подход решения задачи построения адаптивных систем управления объектами, где не все параметры объекта известны Рассматривается класс динамических объектов, математическое описание которых имеет вид:
x g t
x W x
f
=
+ +
Trang 18
y ЭМ( )t
- ε М
- y(t) ( )t
Как показывает анализ литературных источников большинство алгоритмов адаптации получено при условии отсутствия возмущающих
Trang 19воздействий и выполнении условия согласования [63,133,139,160,161,175,182] При нарушении условия согласования предложены разные алгоритмы настройки параметров регулятора при различных ограничениях на динамические свойства ОУ [2,156-158,163], что сужает область их применения При высокой степени дифференциального уравнения объекта возникают проблемы, связанные с недоступностью прямых измерений всех координат вектора состояния, что имеет место при управлении по выходной переменной y
Специальные методы управления неопределенными объектами по выходу могут быть условно разделены на две группы: адаптивного управления с расширенной ошибкой [9,114] и адаптивного управления с использованием так называемых алгоритмов адаптации высокого порядка [148,167] Все эти алгоритмы адаптации были получены при существенных ограничениях и различных допущениях о свойствах объекта управления и были применены только для линейных объектов [61]
Практически все известные методы синтеза алгоритмов адаптации параметров регулятора систем управления нестационарными объектами с использованием эталонной модели требуют выполнения гипотезы о квазистационарности параметров объекта управления в течение времени настройки регулятора В действительности, в большинстве случаев, объекты управления не удовлетворяют этому требованию, что может явиться причиной не только значительного отклонения от заданных качественных характеристик системы, но и привести к неустойчивости процедур адаптации параметров
Существующие методы синтеза не позволяют синтезировать алгоритмы адаптации параметров в случае, когда меняются все коэффициенты дифференциального уравнения, описывающего динамику объекта управления Хотя в [49] приведен метод синтеза алгоритмов
Trang 20адаптации параметров регулятора при всех изменяющихся параметрах объекта управления, однако он требует доступа к точке суммирования внутри объекта управления В то же время синтезированные алгоритмы адаптации получаются довольно громоздкими, что приводит к сложности в
их реализации На основании вышесказанного можно заметить, что сложность алгоритмов адаптации характерна для большинства адаптивных систем Поэтому задача создания методов аналитического конструирования адаптивных систем управления нелинейными динамическими объектами с более простой структурой и несложной реализацией вычислительных процедур является весьма актуальной
Из анализа работ, посвященных адаптивным системам управления, можно сделать следующие выводы:
1 Отсутствует универсальный метод синтеза адаптивных регуляторов для нелинейных динамических систем
2 Подавляющее большинство существующих методов синтеза адаптивных систем управления получили применение только для линейных объектов
3 Полученные известными методами синтеза алгоритмы адаптации являются громоздкими, что приводит к значительной трудности при их реализации
4 Для объектов с неточным описанием задача синтеза алгоритмов адаптации по выходной переменной даже при идеальных условиях представляет собой принципиальную теоретическую проблему Решение этой проблемы известно только для частных случаев
Trang 211.2 ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В
ЗАДАЧАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Классические методы синтеза систем управления базируются на хорошо развитом аппарате интегро-дифференциального исчисления, созданном Ньютоном около трехсот лет назад, и преобразовании Лапласа
альтернативное, существующее всего несколько лет, направление в теории автоматического управления, предлагающее иной способ решения этой задачи [58,59,72,101,124,160,162,174,176]
Решающую роль в внедрении искусственных нейронных сетей в сферу управления сыграли работы S Narendra в соавторстве [159] Применение искусственных нейронных сетей в задачах идентификации и управления динамическими объектами нашло широкое распространение благодаря следующим их свойствам:
• способности к обучению и накоплению информации;
• аппроксимирующей способности;
• свойству параллельной обработки сигналов
В системах управления они могут применяться в качестве регуляторов и идентификаторов
Для построения регуляторов и идентификаторов наибольшее применение получили многослойные нейронные сети прямого распространения, в которых информация следует от слоя к слою в направлении движения сигнала, обратное движение запрещено ИНС такого типа получили широкое распространение благодаря простоте структуры, быстродействию за счет параллельной обработки информации, наличию многочисленных разработанных алгоритмов обучения сетей и стандартных программ для их реализации
Нейронные сети в задачах идентификации динамических объектов Аппроксимирующие способности нейронных сетей с динамическими
Trang 22алгоритмами обучения позволяют моделировать сложные нелинейные динамические объекты управления в виде прямых и инверсных моделей по измерениям “вход-выход” объектов [159] Известная в теории идентификации схема с настраиваемой моделью представлена на рис.1.4,б, где НС – нейронная сеть; АО – алгоритм обучения Структурная схема динамики объекта представлена на рис.1.4,а Весовые коэффициенты нейронной сети ) настраиваются из условия минимизации ошибки обучения Нейронная сеть обучается по алгоритму обратного распространения и обученная сеть учитывает влияние на реальный объект внешних возмущений
(l i
Адаптивные системы управления на базе нейронных сетей В работе [72,126,129] предложен подход построения адаптивных систем управления
с эталонной моделью (ЭМ) на базе нейронных сетей Рассмотрены схемы
Trang 23непосредственного (рис.1.6,а) и косвенного адаптивного управления (рис.1.6,б) В схеме рис.1.6,а нейронная сеть играет роль регулятора Она обучается в режиме on-line В результате обучения (настройка параметров) регулятор должен обеспечить нулевую ошибку между желаемым и реальным выходным сигналом ОУ Недостатком этой схемы является большое время реализации процедуры обучения из-за большого количества настраиваемых параметров сети, которое увеличивается по мере сложности объекта управления В другой схеме (рис.1.6,б) первая нейронная сеть выполняет функцию идентификатора, а вторая – регулятора
В [72] предложен вариант построения адаптивной системы управления с оптимизатором Функциональная блок-схема системы представлена на рис.1.7 В этой схеме нейронная сеть воспроизводит динамику объекта управления Оптимизатор (ОПМ) определяет управляющее воздействие, которое обеспечивает минимизацию критерия оптимизации
В заключение следует отметить, что рассмотренные в этом разделе блок-схемы систем управления отражают в целом традиционные подходы
к структурному синтезу систем с нейронными сетями, реализующими прямые и инверсные модели ОУ
Trang 24ОУ
( )y* t -
Trang 25w
( )e t ( )y* t
- б) специализированное инверсное
обучение
АО
ОУ Σ
АО
НС 2
w ( )y t
-
б)
АО нс1
Trang 26• отсутствуют аналитические методы для решения задачи
выбора структуры сетей и количества нейронов в них;
• при формировании законов управления невозможно в рамках
теории нейронных сетей учитывать знания и опыты экспертов; это приводит к мысли об интеграции подходов теории нечетких алгоритмов и нейронных сетей для создания более совершенных систем управления сложными нелинейными динамическими объектами;
• открытым остается вопрос об устойчивости системы
управления с нейрорегулятором;
• как правило, процедура обучения нейронной сети требует
значительного времени, величина которого зависит от количества нейронов
Анализ существующих методов аналитического конструирования оптимальных регуляторов для нелинейных динамических объектов позволяет сделать следующие выводы
Trang 272 Метод АКОР для линейных одномерных динамических систем получил широкое распространение и имеет в математическом плане фактически завершенный характер
3 Применение метода АКОР для нелинейных динамических систем наталкивается на определенные трудности при решении нелинейных дифференциальных уравнений в частных производных Полученные законы управления с помощью методов Летова-Калмана, А.А Красовского и метода синтеза нелинейных агрегированных регуляторов имеют сложные математические формы, что вызывает трудности при их реализации
4 При применении вышеизложенных методов АКОР законы управления определяются с непосредственным привлечением математического описания объектов Поэтому при неполном математическом описании объекта или при изменении его параметров в процессе функционирования системы управления реализация оптимального регулятора невозможна
1.3 РЕАЛИЗАЦИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОМОЩЬЮ
НЕЙРОННЫХ СЕТЕЙ
Как было отмечено, при решении задачи синтеза регуляторов в виде нейронных сетей возникают определенные трудности, связанные с определением параметров регулятора (параметры функций активации) и доказательством устойчивости системы управления в целом Эти трудности обусловлены отсутствием аналитического метода синтеза нейрорегуляторов В связи с этим в настоящее время задача разработки метода синтеза нейрорегуляторов является актуальной Для решения этой задачи предлагается использовать RBF- нейронных сетей, математическая модель которого может быть определена аналитическим выражением
Trang 28Выходной сигнал такого регулятора имеет вид:
( ) ( )
i x u
µ
µλ
(1.2)
Вводим векторную функцию ( ) [ ( ) ( ) L( )]T
x x
x x
j
λ( )x
j
ζ характеризуют функции активации нейронов Это положение позволяет в зависимости от постановки задачи и практической необходимости проводить настройку нейрорегулятора либо только по коэффициентам λj, когда параметры функций активации ζ j( )x остаются неизменными, либо настраивать все параметры регулятора
Была доказана теорема о том, что выходной сигнал нейронной сети в виде (1.4) может аппроксимировать любую нелинейную непрерывную функцию с любой точностью Это позволяет использовать нейрорегулятор для реализации оптимального закона управления, полученного известными методами АКОР При этом параметры нейрорегулятора могут быть определены из условия обеспечения устойчивости системы управления и точной аппроксимации оптимального закона управления Так как составляющие вектора λ линейно входят в уравнение нейрорегулятора
Trang 29(1.4), в качестве его настраиваемых параметров в режиме on-line предлагается принять вектор λ Этот выбор позволяет получить закон адаптации в виде аналитического выражения Задача разработки методологии синтеза АСАУ нелинейными динамическими объектами на базе нейрогуляторов решается в следующей главе
1.4 ПОСТАНОВКА ЗАДАЧ ДИССЕРТАЦИОННОЙ РАБОТЫ
Исходя из вышеизложенного представляется актуальной проблема разработки метода синтеза адаптивных систем управления нелинейными динамическими объектами с неточным математическим описанием и наличием возмущающих воздействий Решение этой проблемы возможно с помощью нечетких алгоритмов и нейросетевой технологии В связи с этим
в диссертационной работе поставлены следующие задачи
1 На основе анализа принципиальных теоретических трудностей, возникающих при построении адаптивных систем управления сложными нелинейными динамическими объектами, определить подход преодоления этих трудностей на основе применения аппарата нейросетевой технологии
2 Разработать метод определения законов адаптации параметров нейрорегулятора и определить структуру адаптивной системы с использованием этого регулятора
3 Обосновать работоспособность синтезируемых адаптивных систем при наличии возмущающих воздействий и вариации параметров объекта
4 На основе разработанной теоретической базы и инструментальных средств синтеза решить задачу синтеза нейрорегуляотра для роботов SCARA
Trang 30ГЛАВА 2 МЕТОДОЛОГИЯ АНАЛИТИЧЕСКОГО СИНТЕЗА
АДАПТИВНЫХ СИСТЕМ УПРАВЛЕНИЯ НА БАЗЕ
НЕЧЕТКИХ РЕГУЛЯТОРОВ
2.1 РАЗРАБОТКА МЕТОДА АНАЛИТИЧЕСКОГО СИНТЕЗА АДАПТИВНЫХ СИСТЕМ УПРАВЛЕНИЯ НА БАЗЕ
НЕЙРОРЕГУЛЯТОРОВ
В данном разделе приведено описание разработанного метода синтеза аналитических адаптивных систем управления нелинейными динамическими объектами, параметры которых известны неточно и изменяются в процессе функционирования
В разработанном методе синтеза предлагается строить адаптивную систему управления на базе нейрорегулятора без блока идентификации и
с подстройкой параметров регулятора на основании закона адаптации, получаемого из решения специального дифференциального уравнения Выбор нейроной сети основан на его способности аппроксимировать нелинейные функции любой сложности с любой точностью и простоте реализации Предлагаемую методику синтеза можно представить в виде трех этапов:
• решение задачи аналитического синтеза оптимального регулятора (закона управления), обеспечивающего оптимизацию выбранного функционала качества управления заданным объектом;
• синтез нейрорегулятора – формирование функций активаций и вывод аналитического соотношения для выходного сигнала;
• аналитический синтез закона адаптации – вывод аналитических соотношений для подстройки параметров нейрорегулятора
Trang 31Исходными данными для решения задачи являются математическое описание объекта управления с той точностью, которая возможна, а так
же определенные возможности измерения переменных состояния и возмущающих сигналов
Этап 1 Для изложения основной идеи метода рассматривается задача синтеза оптимального регулятора для объекта, математическое описание которого имеет вид:
x
x= 1, 2, , ) - вектор переменных состояния; g( )x – нелинейная функция; i( ). – нелинейные непрерывные дифференцируемые функции; ( )t
i
δ - внешнее возмущение; – сигналы управления Принимается, что объект имеет одно управляющее воздействие (m ) В работе предлагается для синтеза оптимального регулятора следующая форма критерия оптимизации:
j u
Ψ
( )0 = 0
Задача оптимизации функционала (2.2) может быть решена на основании уравнения Эйлера При этом функцию Ψ(x) необходимо выбрать с учетом поставленной цели синтеза и динамики объекта управления Согласно уравнению Эйлера семейство устойчивых экстремалей должно удовлетворять уравнению [28]:
i i i
x i dx dt
(2.4)
Trang 32Поставим в (2.4) вместо правые части исходной системы дифференциальных уравнений объекта (2.1), считая, что на входе объекта действует оптимальное управляющее воздействие , тогда выражение для производной функции Ψ можно представить:
f x
x i i x dt
i
n n
+
∂
Ψ
∂ +
+
∂
Ψ
∂ +
f x
x i i x
n i
n n
∑
∂
Ψ
∂ +
i
x i i x x
x
g
u
1 1
1
δ (2.7) Это управление обеспечит перевод изображающей точки x i в пространстве состояния системы из произвольного начального состояния в окрестность многообразия Ψ = 0, так как было определено при условии выполнения уравнения (2.3) Для обеспечения условия асимптотической устойчивости замкнутой системы необходимо выбрать функцию так, чтобы решение системы дифференциальных уравнений (2.3), описывающих движение изображающей точки вдоль многообразия к началу координат было устойчивым Следует отметить так же, что качество системы управления тоже определяется этим многообразием
Этап 2 Нейрорегулятор в виде RBF-сети формирует управляющее воздействие соотношением:
( )x
u = λTζ (2.8)
Trang 33где λ - вектор настраиваемых параметров нейрорегулятора Из (2.8) следует, что значение сигнала управления зависит от составляющих вектора λ , которые неизвестны Нейрорегулятор должен аппроксимировать оптимальный сигнал управления, что означает выполнение равенства:
( )x
u* =λ∗Tζ , (2.9) где λ*- вектор параметров нейрорегулятора, который точно воспроизводит оптимальный закон управления
Согласно изложенной методике предлагаются две структурные схемы адаптивной системы управления, представленные на рис.2.1, где
НР – нейрорегулятор; ОУ – объект управления; БА – блок адаптации Эти схемы отличаются тем, что в одной (рис.2.1,а) схеме управление и адаптации параметров регулятора организуются через обратную связь
по вектору состояния, а в другой (рис.2.1,б) – по вектору ошибки основного контура
Этап 3 На этом этапе решается задача аналитического синтеза закона адаптации, т.е определяются аналитические зависимости, на основании которых проводится настройка параметров нейрорегулятора λ Предлагается решить задачу определения значений коэффициентов λ
из условия обеспечения устойчивости адаптивной системы управления
на основании прямого (или второго) метода Ляпунова
Trang 34е λ
λ( )0
БА
, , 2 , 1
а) эта функция непрерывна вместе со всеми своими частными производными первого порядка в некоторой открытой области, содержащей начало координат;
б) в начале координат функция V(x1,x2, ,x n) принимает нулевое значение;
в) всюду внутри этой области, кроме начала координат, функция
V 1, 2, , отлична от нуля и является знакоопределенной
С учетом поставленной выше задачи предлагается в состав функции Ляпунова ввести слагаемое, содержащее неизвестный параметр Формируем функцию Ляпунова в следующем виде:
j
λ
θθ
γ T
V
2
1 2
1 Ψ2 +
= , (2.10)
Trang 35где θ =λ−λ*; γ - положительный коэффициент Полная производная функции Ляпунова имеет вид:
= +
Ψ
Ψ
γθ
θ
V 1 1 , (2.11) где
i n
n
i dx
(2.12)
Из условия обеспечения асимптотической устойчивости можно вывести аналитическое выражение для определения искомого вектора λ из соотношения:
i x при
+ Ψ
V (2.13)
В последующих разделах выводятся аналитические выражения для определения вектора λ (синтез закона адаптации) при построении адаптивных систем для конкретных классов объектов Здесь следует указать, что согласно представленным преобразованиям предложенный метод построения адаптивных систем позволяет решать задачи управления, когда управляющее воздействие входит нелинейно в описание объекта в пространстве состояний, и при этом управляющих воздействий может быть несколько (например, в случае управления роботом-манипулятором)
Преимущество предложенного метода состоит в том, что он позволяет: во-первых, синтезировать регуляторы для объектов, математическое описание которых известно неточно, во-вторых, учитывать знания и опыты человек-операторов при формировании закона управления Полученные системы управления могут функционировать в условии наличии неконтролируемых внешних и внутренних возмущений
Trang 362.2 СИНТЕЗ АДАПТИВНЫХ СИСТЕМ УПРАВЛЕНИЯ ДЛЯ
МНОГОМЕРНЫХ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ ОБЪЕКТОВ
Многие задачи управления многосвязными технологическими и подвижными объектами имеют несколько каналов управления Поэтому задача синтеза адаптивной системы с нейрорегулятором для многомерного нелинейного динамического объекта является актуальной Пусть динамика объекта описывается системой нелинейных дифференциальных уравнений в форме:
, , , ,
2 1
2 1
n j
j
j j n
x x x
h
y
u x g t
i x x x
x= 1, 2, , - вектор переменных состояния; - управляющие воздействия;
j u
η
, 1
j
y - выходные переменные; δi( )t - внешние возмущения; i( )x , h j( )x , g j( )x - нелинейные непрерывные дифференцируемые функции Требуется синтезировать адаптивную систему, которая обладает асимптотической устойчивостью и обеспечивает минимизацию критерия оптимизации в виде функционала:
min
2 2
j j
, 0
= Ψ
+
Ψj • j (2.16)
Trang 37∂
Ψ
∂ (частная производная от функции Ψj по переменной x i, в уравнении которой участвует управление )
j u
x g i x
t i x i i x
dt
t dy x
x
x x
x x
з j j
j j j j
з j j
n n
j j
j j
i n
i n
∂
Ψ
∂ +
∂
Ψ
∂ + +
∂
Ψ
∂ +
δδ
1
* 1
= +
∑
∂
Ψ
∂ +
∂
Ψ
∂ +
g i x
t i x i i x
з j j
j x j j n
(2.18)
Из уравнения (2.18) можно определить оптимальное управление : *
j u
∑
∂
Ψ
∂ +
i x i i x x
g i x u
з j j
n i
j j
δ
1
, 1
1
*
(2.19)
Trang 38g i x
Оптимальное управление реализуется в адаптивной системе нейрорегулятором, выходные переменные которого аппроксимируют оптимальное управление (2.19) при соответствующей настройке параметра λ В рассматриваемой задаче выходные переменные нечеткого регулятора определяются выражением:
j j
б) параметры нечеткого регулятора λj определяются согласно уравнениям:
−
=
•
j j x j
j j j
Trang 39•
j T
j x j j
g t
i x
i
i
x ,δ * θ ζ , (2.23) где θ j =λj −λ∗j Для доказательства устойчивости замкнутой системы
используется второй метод Ляпунова Формируем функцию Ляпунова в
виде:
∑ +
θθγ1 1
2
2
1 2
1
T j j
Полная производная от функции Ляпунова по времени имеет вид:
∑ +
1
j
T j j j
j j
j
i x x
=
•
ζθ
γ
θ
1 1
j
j j
j j j j
j
T j
e i x x
i x
g t
tlim λ lim γ ζ (2.27)
Trang 40x x g
Шаг 1 Построение структуры адаптивной системы
Задаем функциональной блок-схемы адаптивной системы управления в виде рис.2.2