close

Вход

Забыли?

вход по аккаунту

?

Принцип максимума в негладких задачах оптимального управления с разрывными траекториями.

код для вставкиСкачать
1999
ИЗВЕСТИЯ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ
МАТЕМАТИКА
Є 12 (451)
УДК 517.977
В.А. ДЫХТА, О.Н. САМСОНЮК
ПРИНЦИП МАКСИМУМА В НЕГЛАДКИХ ЗАДАЧАХ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С РАЗРЫВНЫМИ ТРАЕКТОРИЯМИ
1. Введение
Данная работа посвящена доказательству необходимых условий оптимальности в форме
принципа максимума (ПМ) для задачи импульсного управления с траекториями из класса BV
функций ограниченной вариации. Рассматриваемая задача характеризуется измеримой зависимостью по времени и липшицевой по фазовым координатам, а также неоднозначностью реакции
динамической системы на импульсное управление | векторную меру. Последнее обстоятельство
связано с тем, что не предполагается выполнение условия корректности типа Фробениуса [1], [2],
которое гарантирует единственность траектории, соответствующей импульсному управлению и
заданному начальному условию.
Задачи оптимального импульсного управления можно рассматривать как релаксационное
расширение классических задач динамической оптимизации в системе вида
x_ = f (t; x; V; u) + G(t; x; V )v; V_ = kvk;
(1)
u(t) 2 U; v(t) 2 K;
(2)
где U | компакт, K | выпуклый замкнутый конус, управления u(), v() измеримы и ограdP
(v )
ничены, kvk = jvj j, d(z ) обозначает размерность вектора z , второе уравнение в (1) введено
j =1
для учета энергетических затрат на управление. Если не оговорено противное, то термины \измеримость" и \ограниченность" применительно к функциям относятся к мере Лебега L, а все
соотношения, содержащие измеримые функции, считаются выполненными L-почти всюду. Поскольку множество K неограничено, то задачи оптимизации в системе (1), (2) могут не иметь
решения в классе обычных процессов с управлениями из класса L1 измеримых ограниченных
функций и траекториями из класса AC абсолютно непрерывных функций. Естественное расширение задачи получается замыканием (в некоторой слабой топологии) множества обычных
процессов и связано с понятием обобщенного (об.) решения системы (1), (2).
([3]). Пара функций (x(); V ()), непрерывных справа на (t0 ; t1 ] и имеющих
ограниченную вариацию, называется об. решением системы (1), (2), если существует такая последовательность функций fxn (); Vn (); un (); vn ()g, удовлетворяющих на [t0 ; t1 ] системе (1),
(2), что
sup kvn ()kL1 < 1; xn ! x; Vn ! V слабо в BV
Определение
n
(тогда (xn (t); Vn (t)) ! (x(t); V (t)) в точках непрерывности x, V , а также при t = t0 ; t1 ).
Работа выполнена при финансовой поддержке РФФИ, грант Є 98-01-00837.
26
Rt
Заметим, что если положить n (t) = vn ( )d , то в силу теоремы Хелли последовательность
t0
fn ()g можно считать сходящейся к некоторой функции () 2 BV , которая порождает K значную меру Лебега{Стилтьеса d , т. е. d (B ) 2 K для любого борелевского множества B [t0 ; t1 ].
В [3] (см. также [2]) показано, что при стандартных предположениях непрерывности, липшицевости и не более чем линейного роста функций f , G по (x; V ), а также выпуклости годографа,
для любого об. решения (x(); V ()) найдутся K -значная мера Лебега{Стилтьеса d , L- и dV измеримая ограниченная функция u(), L-измеримые функции !s (), определенные для каждого
момента
s 2 Sd(V ) = fs j [V (s)] = V (s) ; V (s;) > 0g
на отрезке [0; ds ] = [0; [V (s)]], такие, что выполняются условия
! s ( ) 2 K
1
= f! 2 Rd(v) j ! 2 K;
k!k 1g;
Z ds
0
!s( )d = [ (s)];
функции (x(); V ()) удовлетворяют системе дифференциальных уравнений с мерой
dx(t) = f (t; x(t); V (t); u(t))dt + G(t; x(t); V (t))dc(t) +
V (t) = var
() +
t0 ;t c
[
]
X
X
[x(s)](t ; s);
s2Sd (V )
st
[V (s)]; V (t0 ;) = 0;
s2Sd (V )
st
(3)
(4)
где c | непрерывная составляющая в разложении Лебега функции ; скачки об. решения в
точках s 2 Sd(V ) находятся из условий
[x(s)] = zs (ds ) ; x(s;); [V (s)] = zV s (ds ) ; V (s;);
(5)
где функции zs ( ), zV s ( ) при 2 [0; ds ] являются решениями предельной системы
dzs = G(s; z ; z )! ( ); z (0) = x(s;);
s Vs s
s
d
dzV s = 1; z (0) = V (s;):
Vs
d
(6)
В исследуемой ниже задаче оптимизации об. решений предположения относительно функций f , G ослаблены, а множество U считается переменным. Это естественно, поскольку при
доказательстве необходимых условий оптимальности факт существования исследуемого решения постулируется, так что условия типа непрерывности по t и роста становятся излишними.
Кроме того, ослабление требований касается в основном функции f , свойства которой при переходе к импульсному линейному управлению играют второстепенную роль и в действительности
допускают ослабление.
Отметим, что наиболее общий ПМ для гладких задач импульсного управления при невыполнении условия корректности получен в [4] методом разрывной замены времени. Необходимые
условия оптимальности при негладкой зависимости входных данных получены в [5]{[7] для более частных вариантов задачи (при отсутствии фазоограничений); в основе их доказательства
лежит применение вариационного принципа Экланда. В данной статье используется интерпретация задачи импульсного управления как специфической многоэтапной задачи динамической
оптимизации и ПМ для задачи управления мультипроцессами [8].
27
2. Постановка задачи
Рассмотрим задачу минимизации функционала
l(b); b = (x(t ;); x(t ); V (t ));
0
1
1
на множестве четверок e = (x(); V (); u(); d ), которые удовлетворяют следующим условиям
допустимости:
1) x(), V () | непрерывные справа на (t0 ; t1 ] функции ограниченной вариации (отрезок
T = [t0; t1 ] фиксирован);
2) u() | измеримая функция, удовлетворяющая ограничению u(t) 2 U (t), t 2 T , где U (t)
| сечение множества U T Rd(u) при фиксированном t, т. е.
U (t) = fu j (t; u) 2 U g;
3) d (t) | K -значная мера Лебега{Стилтьеса на T , т. е. d (B ) 2 K для любого борелевского
множества B T ;
4) компоненты набора e удовлетворяют ограничениям (3){(6) при некотором выборе измеримых функций !s , s 2 Sd (V ), со значениями в K1 ;
5) b 2 C .
Четверки, удовлетворяющие всем перечисленным условиям, будем называть допустимыми импульсными процессами (иногда вместе с соответствующими функциями z i () = zsi (),
zVi () = zV si (), !i() = !si (), si 2 Sd(V ), описывающими скачки траекторий). Через e =
(x(); V (); u(); d ) будет обозначаться допустимый импульсный процесс, исследуемый на оптимальность вместе с соответствующими функциями z i (), z iV (), !i (), si 2 Sd (V ).
Поставленная задача (обозначим ее через P ) будет исследоваться при предположениях:
(A1) множество Sd(V ) конечно и мера d не имеет непрерывной сингулярной составляющей,
т. е.
X
d (t) = v(t)dt +
c i (t ; si );
si 2Sd (V )
причем v() | измеримая ограниченная функция со значениями в K ;
(A2) множество U T Rd(u) борелевское, K Rd(v) | замкнутый выпуклый конус, C Rd(x) Rd(x) R | замкнутое множество;
(A3) при всех (x; V ) функция (t; u) ! f (t; x; V; u) LB-измерима ([9], с. 154);
(A4) существуют окрестность Q множества
graph fx(); V ()g = f(t; x; V ) j t 2 T; x 2 [x(t;); x(t+)]; V 2 [V (t;); V (t+)]g
и число M > 0 такие, что выполняются условие Липшица
jf (t; x; V; u) ; f (t; x0; V 0; u)j M (jx ; x0 j + jV ; V 0j) 8 (t; x; V; u); (t; x0 ; V 0; u) 2 Q U (t)
и условие ограниченности
jf (t; x; V; u)j M 8 (t; x; V; u) 2 Q U (t);
(A5) матрица G непрерывно дифференцируема;
(A6) функция l локально липшицева.
28
3. Формулировка принципа максимума
Введем функции
H (t; x; V; ; u; v) = h ; f (t; x; V; u) + G(t; x; V )vi;
H (t; x; V; ; u) = h ; f (t; x; V; u)i; H (t; x; V; v; ) = h ; G(t; x; V )vi;
H (t; s) = sup H (t; x(s); V (s); (s); u):
0
1
0
u2U (t)
0
Если '(t; x; V; ; v) | заданная функция, то через
'j(si )(si ; zi ; zVi ; pi ; !i )
(7)
будет обозначаться замена переменных (t; x; V; ; v) ! (si ; z i ; zVi ; pi ; !i ) в функции '. Запись типа
H0(t) будет означать вычисление функции H0 вдоль исследуемого процесса e, а запись H0(t; u)
| фиксирование всех опущенных аргументов функции H0 вдоль процесса e (в данном случае
x = x(t), V = V (t), = (t), где (t) | траектория двойственных переменных). Точно так же
следует понимать обозначение 'j(si ) ( ) для функции (7).
Поскольку моменты действия импульсов для допустимых процессов не фиксируются, а зависимость функции f по t лишь измеримая, то для корректной записи условий оптимальности
моментов скачка траектории нам понадобится следующее понятие из теории функций [8].
Пусть I | интервал из R, s 2 I | заданная точка и ' : I ! Rn | измеримая функция.
Определим множество tess
!s '(t) существенных значений функции ' в точке s как совокупность
n
всех векторов 2 R , для которых при любом " > 0
L-mesft j s ; " < t < s + "; j ; '(t)j < "g > 0:
Легко проверить, что если s | точка непрерывности ', то tess
!s '(t) = f'(s)g, а если s | точка
разрыва 1-го рода, то tess
!s '(t) = f'(s;); '(s+)g.
Если g(x; y) | липшицева функция, то символ @g(x; y) обозначает обобщенный градиент
Кларка по (x; y), вычисленный в точке (x; y) ([9], с. 17). Символ co C означает выпуклую оболочку множества C , а NC (b) | нормальный конус к C в точке b ([9], c. 54).
Сформулируем принцип максимума.
Теорема 1. Пусть e | оптимальный процесс в задаче P . Тогда существуют число 2
f0; 1g, функции : T ! Rd(x), V : T ! R и определенные для каждого si 2 Sd(V ) функции
pi : [0; di] ! Rd(x), piV : [0; di] ! R такие, что выполнены следующие условия:
1) нетривиальности
+ j (t1 +)j + j V (t1+)j > 0;
2) функции (), V () кусочно абсолютно непрерывны, на интервалах (si;1 ; si ) удовлетворяют дифференциальному включению
;
; _ (t) ; H1x(t); ; _ V (t) ; H1V (t) 2 @(x;V )H0(t);
функции pi (), piV () абсолютно непрерывны, удовлетворяют уравнениям
dpi ( ) = ;H j ( ); dpiV ( ) = ;H j ( )
d
1
x (si )
d
V (si )
1
и связаны с (), V () условиями допустимости скачка
(si ;) = pi (0); (si +) = pi (di ); V (si ;) = piV (0); V (si +) = piV (di );
3) трансверсальности
( (t0 ;); ; (t1 +); ; V (t1 +)) 2 @l(b) + NC (b); b = (x(t0 ;); x(t1 ); V (t1 ));
29
4) условия максимума
H (t) = umax
H (t; x(t); V (t); u; (t)); t 2 T;
2U t
hHv (t); v(t)i + V (t)kv(t)k = 0 = max
(hHv (t); vi + V (t)kvk); t 2 T;
v 2K
hH j ( ); !i + piV ( );
hHv j si ( ); !i ( )i + piV ( ) = 0 = !max
2K1 v si
2 [0; di]; si 2 Sd(V );
5) условие оптимальности моментов импульса s 2 Sd(V )
0
(
( )
0
(
)
co tess
!s H0 (t; s+) ; co tess
!s H0 (t; s;) 3
8
>
>
<
V (s)]
Z
[
)
H t s ( )d + s ;
1
0
(8)
(9)
0; s = t ;
где s >= 0; s 2 (t ; t );
>
: 0; s = t :
( )
0
0
1
1
Рассмотрим типичный для приложений случай K = R+d(v). Тогда Sd(V ) = Sd( ).
Условие максимума (8) примет вид
Замечание.
(
Hvj (t) + V (t) 0; t 2 T ;
= 0; t 2 Sc ( );
j = 1; d(v);
где Sc ( ) | множество моментов времени, на котором сосредоточена абсолютно непрерывная
составляющая меры ; условие максимума (9) преобразуется к виду
Hvj j(si )( ) + piV ( )
(
0; 2 [0; di ];
= 0; если !ij ( ) > 0;
j = 1; d( ):
При этом, если piV ( ) < 0, то j! i ( )j = 1; при строгом неравенстве на [0; di ] это равносильно
равенству di = jci j.
В гладком случае теорема 1 переходит в ПМ из [4]. Eсли Sd(V ) = ;, то | в ПМ классической
задачи оптимального управления ([10], гл. 2, x 3, c. 98).
Проиллюстрируем применение принципа максимума на следующем примере. Требуется минимизировать функционал
I (d ) = V (1) ; x3(1)
на множестве об. решений управляемой системы
x_ = v ;
x (0) = 0; x (1) = x ;
x_ = x v ;
x (0) = 0; x (1) = x ;
x_ = a(t)x + b(t)x ; x (0) = 0;
v (t) 0; v (t) 0:
1
1
1
1
11
2
1 2
2
2
21
3
1
2
3
1
Здесь
2
(
(
a(t) = a ; t ;
b(t) = b ; t ;
a ; t > ;
b ; t > ;
a ; b < 0, a ; b > 0, < , ; 2 (0; 1) | фиксированные точки и не выполняется условие
1
1
2
корректности.
1
1
2
2
2
30
Использование ПМ в данном примере позволяет получить следующий результат: оптимальная мера имеет только дискретную составляющую
d 1 = x11(t ; s); d 2 = xx21 (t ; s);
11
где s = , если a1 x11 + b2 x21 0, или s = , если a1 x11 + b2 x21 0. В точке импульса эволюция скачка оптимальной траектории происходит таким образом, что сначала увеличивается
x1-компонента и лишь затем x2 -компонента. Соответствующее предельное управление имеет вид
(
(
1
;
2
[0
;
1 ];
!1( ) =
!2( ) = 0; 2 [0; 1 ];
0; 2 (1 ; d];
1; 2 (1 ; d];
где 1 = x11 , d = x11 + x21 x11 .
4. Доказательство принципа максимума
Проведем доказательство по шагам.
Шаг 1. Зафиксируем любое конечное множество моментов времени
S = fs0; : : : ; sN g Sd(V );
в котором
t s < s < sN t ;
0
0
и положим
(10)
1
(11)
1
!i ( ) 2 K произвольно, di = [V (si)] = 0 8si 62 Sd(V ):
(12)
Таким образом, исследуемому процессу сопоставляется множество фиктивных моментов импульса S n Sd(V ), чтобы допустить к сравнению процессы с нефиксированным (но конечным)
числом импульсов.
Полагая для удобства обозначений s;1 = t0 , sN +1 = t1 , обозначим через
xi (); V i (); ui (); vi()
(13)
сужения функций x, V , u, v на отрезок [si;1 ; si ], i = 0; N + 1 (в правых концах отрезков траекторные компоненты доопределяются по непрерывности, так что xi ; V i 2 AC , а ui , vi измеримы).
Рассмотрим теперь задачу оптимального управления PN :
x_ i = f (t; xi ; V i ; ui ) + G(t; xi ; V i)vi ; V_ i = kvi k;
(14)
ui(t) 2 U (t); vi (t) 2 K; t 2 [si;1; si ]; i = 0; N + 1;
1
dzi = G(s ; zi ; zi )!i ; dzVi = 1; !i ( ) 2 K ; 2 [0; d ]; i = 0; N ;
i
i
V
d
d
xi (si) = zi (0); V i (si) = zVi (0); xi (si ) = zi (di ); V i (si) = zVi (di ); i = 0; N ;
1
+1
+1
(16)
di 0; i = 0; N; s; = t ; sN = t ; t s s sN t ;
(17)
2 C; V (t ) = 0; l() ! min;
(18)
1
0
+1
0
(t0 ); xN +1 (t1 ); V N +1 (t1 ))
1
0
0
0
1
где = (x
| концевой вектор.
В задаче PN минимум ищется по всем мультинаборам
= f(si;1 ; si ; xi ; V i ; ui ; vi )gi=0;N +1 ; fdi ; zi ; zVi ; !i gi=0;N ;
0
(15)
31
1
составляющие которых удовлетворяют ограничениям (14){(18).
Исследуемому импульсному процессу e соответствует в силу (10){(13) мультинабор , допустимый ограничениями задачи PN . Обратно, любой допустимый мультинабор задачи PN
порождает допустимый импульсный процесс e задачи P , который определяется соотношениями
x(t) = xi (t); V (t) = V i(t); u(t) = ui (t); v(t) = vi (t); t 2 [si;1 ; si );
d (t) = v(t)dt +
Отсюда вытекает
X
si t
ci (t ; si);
ci
=
Z di
0
!i ( )d:
Предложение 1. Если процесс e оптимален в задаче P , то соответствующий ему мультинабор оптимален в задаче PN .
Шаг 2. Необходимые условия оптимальности для задачи PN и P будут получены применением ПМ для негладкой многоэтапной задачи динамической оптимизации [8]. Постановка этой
задачи и ПМ анонсируются ниже.
Пусть динамика управляемого объекта описывается k управляемыми динамическими системами
y_i = 'i (t; yi ; wi ); wi(t) 2 Wi (t); t 2 i ;
(19)
где yi : i ! Rni | абсолютно непрерывные функции, wi : i ! Rmi | измеримые функции
(управления), Wi (t) = fw j (t; w) 2 Wi g | сечение множества Wi R Rmi при фиксированном
t, отрезки i = [ti0 ; ti1] не фиксированы, ti0 ti1 (случай ti0 = ti1 не исключается). Системы (19)
связаны совместным ограничением типа включения на граничные значения моментов времени
и концы траекторий этапов yi (ti0 ) = yi0 , yi (ti1 ) = yi1 , вектор
;
q = (ti0 ; ti1; yi0 ; yi1 ) i=1;k 2 Q;
(20)
k
Q
а Q R R Rni Rni | заданное множество.
i=1
Четверку (ti0 ; ti1 ; yi (); wi ()), удовлетворяющую системе (19), назовем i-м подпроцессом, а составленный из них упорядоченный мультинабор | мультипроцессом. Допустимые мультипроцессы характеризуются выполнением ограничения (20). На множестве допустимых мультипроцессов рассматривается задача (обозначим ее через PM )
J (q) ! min;
где J | скалярная функция.
Пусть f(T0i ; T1i ; y i (); w i ())gi=1;k | исследуемый на оптимальность допустимый мультипроцесс и выполнены следующие предположения:
(H1) 8 y 2 Rni функция (t; w) ! 'i (t; y; w) L B -измерима, i = 1; k ;
(H2) существуют окрестность Vi графика функции y i () и число M > 0 такие, что для i = 1; k
выполненo условие ограниченности
j'i (t; y; w)j M 8(t; y; w) 2 Vi Wi (t)
и условие Липшица
j'i (t; y0 ; w) ; 'i (t; y; w)j M jy0 ; yj 8 (t; y0; w); (t; y; w) 2 Vi Wi(t);
(H3) множества Wi измеримы по Борелю 8 i = 1; k ;
(H4) множество Q замкнуто;
(H5) функция J локально липшицева.
32
В этих предположениях справедлив следующий ПМ, в котором используются функции Понтрягина
Hi (t; y; pi ; w) = hpi ; '(t; y; w)i:
i
Теорема 2 ([8]). Пусть f(T0 ; T1i ; y i (); w i ())gi=1;k | оптимальный мультипроцесс в задаче
PM . Тогда существуют числа 2 f0; 1g, hi0 ; hi1 2 R и абсолютно непрерывные функции pi :
[T0i ; T1i ] ! Rni такие, что выполняются условия
k
P
1) нетривиальности + jpi (T1i )j > 0;
i=1
2) функции pi удовлетворяют сопряженным включениям
;p_i(t) 2 @y Hi (t; yi (t); pi (t); wi(t)); t 2 [T0i ; T1i ]; i = 1; k;
3) условие максимума
H (t; yi(t); pi (t); w); t 2 [T0i; T1i ]; i = 1; k;
Hi(t; yi(t); pi (t); wi (t)) = wmax
2W (t) i
i
4) условие оптимальности моментов времени T0i , T1i
hi0 2 co t!essT i sup Hi(t; yi(T0i ); pi (T0i ); w) ;
hi
1
0
w2Wi (t)
2 co t!essT i sup Hi(t; yi(T i ); pi (T i ); w); i = 1; k;
1
1
w2Wi (t)
1
5) условия трансверсальности
;
(;hi0 ; hi1 ; pi (T0i ); ;pi (T1i )) i=1;k 2 NQ + @J;
где нормальный конус NQ и обобщенный градиент @J Кларка берутся в точке q =
; i i
(T0 ; T1 ; yi0 ; yi1 ) i=1;k .
Замечания. 1) Если i-я подсистема автономна, то
hi0 = hi1 = sup Hi(yi (t); pi (t); w):
w2Wi (t)
2) Если T0i = T1i , то hi0 = hi1 ([8], с. 1083).
Шаг 3. а) Заметим сначала, что т. к. в задаче PM динамические системы связаны лишь
совместным ограничением на концевые значения моментов времени и траекторий, то наличие
в них общей независимой переменной (t) не играет существенной роли, теорема 2 естественным
образом распространяется на случай различающихся переменных типа времени (в задаче PN
это t и ).
б) Чтобы избавиться в задаче PN от параметров si в предельных подсистемах, положим
dsi = 0; i = 0; N;
d
(21)
и перепишем концевые ограничения, связывающие этапы задачи PN , в эквивалентном виде (с
переобозначением ti0 = si;1 , ti1 = si для i = 0; N + 1)
(x0 (t00 ); xN +1 (tN1 +1 ); V N +1 (tN1 +1 )) 2 C; (xi+1 (ti0+1 ); z i (di )) 2 f(a; a) j a 2 Rd(x)g; i = 0; N ;
(xi (ti1 ); z i (0)) 2 f(a; a) j a 2 Rd(x)g; i = 0; N ; (V i+1 (ti0+1 ); zVi (di )) 2 f(a; a) j a 2 Rg; i = 0; N ;
(V i (ti1 ); zVi (0)) 2 f(a; a) j a 2 Rg; i = 0; N ; (si (0); ti0+1 ; ti1 ) 2 f(a; a; a) j a 2 Rg; i = 1; N ; 1;
(22)
(s0 (0); t10 ; t01 ) 2 f(a; a; a) j a t0 g; (sN (0); tN0 +1 ; tN1 ) 2 f(a; a; a) j a t1 g;
t00 = t0; tN1 +1 = t1; V 0(t00 ) = 0; 0i = 0; di 0:
33
в) Для любого натурального числа j > kv ()k1 положим Kj = K \ Bj , где Bj | замкнутый
шар радиуса j в пространстве Rd(v) , и рассмотрим задачу PNj , которая получается из PN заменой ограничения vi (t) 2 K на vi (t) 2 Kj , связующих концевых ограничений (16), (17), (18) на (22)
и добавлением дифференциальных связей (21) (остальные уравнения динамики не меняются).
Ясно, что исследуемый оптимальный мультипроцесс естественным образом вкладывается в
множество допустимых мультипроцессов каждой задачи PNj , причем является в них оптимальным. Ясно также, что к задаче PNj применима теорема 2.
Шаг 4. Рассмотрим ПМ для мультипроцесса в фиксированной задаче PNj (индекс j у
двойственных переменных для краткости будет опускаться).
а) В роли функций Понтрягина для этапов по времени t и будут выступать соответственно
функции
H i = H (t; xi ; V i ; i ; ui ) + Vi kvi k; i = H1(si ; zi ; zVi ; pi ; !i ) + piV :
Отсюда ясно, что для сопряженных переменных в ПМ войдут следующие дифференциальные
включениe и уравнения:
(; _ i (t) ; H1ix(t); ; _ Vi (t) ; H1iV (t)) 2 @(x;V ) H0i (t); t 2 [si;1 ; si ]; i = 0; N + 1
(разложение функций H i в сумму H0i + H1i аналогично разложению H );
;p_i( ) = izi ( ) = H1x(si )( ); ;p_iV ( ) = izVi ( ) = H1V (si )( );
;p_is( ) = isi ( ) = H1t(si )( ); 2 [0; di ]; i = 0; N:
Очевидно, что эти включениe и уравнения перейдут в сопряженные системы из ПМ для
задачи P . То же самое относится к условиям максимума по управлениям с той лишь разницей,
что максимум по v-компонентам будет браться по множеству Kj , т. е. пока имеем равенство
(H (t; v) + V (t)kvk):
(23)
H1(t) + V (t)kv (t)k = max
v2Kj 1
Кроме того, отметим, что в силу автономности предельных подпроцессов их гамильтониан постоянен вдоль оптимали (замечание 1) к теореме 2). Это дает условие
H1(si) ( ) + piV ( ) = !max
i (; !) = hi
(24)
2K1
при 2 [0; di ] и некотором hi 2 R. Оно совпадает с условием максимума по предельному управлению !i (9) в теореме 1, если только окажется, что hi = 0 8i = 0; N .
Проанализируем остальные условия ПМ в задаче PNj .
б) Обратимся к условиям трансверсальности и нормировки.
Прежде напомним свойства нормального конуса, которые будут нами использоваться [9].
Предложение 2. Пусть C Rm Rn | замкнутое множество, (x; y ) 2 C , тогда
Nf(a;a;b)j(a;b)2Cg(x; y) f(p; q; r) j (p + q; r) 2 NC (x; y)g:
Предложение 3. Пусть C1 Rm , C2 Rn | замкнутые множества, x 2 C1 , y 2 C2 ,
тогда
NC1C2 (x; y) = NC1 (x) NC2 (y):
Используя предложение 3, из условий трансверсальности при = получаем включение
( 0 (t0 ); ; N +1 (t1 ); ; VN +1 (t1 )) 2 @l() + NC ():
C учетом переобозначения концевого вектора b ! и равенств
0
(t0 ) = (t0 ;); N +1 (t1 ) = (t1 +); VN +1 (t1 ) = V (t1 +)
получаем условия трансверсальности из теоремы 1.
34
Используя предложение 2, запишем условия трансверсальности для промежуточных и предельных подпроцессов
i+1 (s ) ; pi (d ) = 0; ; i (s ) + pi (0) = 0; i = 0; N ;
i
i
i
i+1 (s ) ; pi (d ) = 0; ; i (s ) + pi (0) = 0; i = 0; N ;
i
V
V i
V i
V
i
i
+1
i
ps(0) ; h0 + h1 = 0; i = 1; N ; 1;
(25)
(26)
(27)
(
если t < s ;
ps (0) ; h + h 2 Nfa2Rjt0;a g(s ) = f0g;
fa 2 R j a 0g; если t = s ;
(
если sN < t ;
N
N
N
ps (0) ; h + h 2 Nfa2Rja;t1 g(sN ) = f0g;
fa 2 R j a 0g; если sN = t ;
pis(di ) = 0; i = 0; N ;
h 2 R; hN 2 R; V (t ) 2 R;
(
если di > 0;
i
h 2 Nfa2Rja g(di ) = f0g;
fa 2 R j a 0g; если di = 0:
0
1
0
0
0
1
+1
0
0
0
0
0
0
(29)
1
0
1
(28)
1
0
0
1
+1
0
(30)
0
(31)
0
Из условий (25), (26) сразу следуют условия допустимости скачков сопряженных переменных в теореме 1.
Условие нетривиальности для задачи PNj имеет вид
+ j e (t )j + j eN (t )j +
0
+1
0
1
N
X
i=1
j ei (si )j +
N
X
i=0
jpei (di)j > 0:
(32)
Здесь ei = ( i ; Vi ), pei = (pi ; piV ; pis ) и напомним, что e0 (t0 ) = ( (t0 ;); V (t0 ;)), eN +1 (t1 ) =
( (t1 +); V (t1 +)).
Хотя на первый взгляд данноe условие нетривиальности сильнее, чем в ПМ задачи P , они
равносильны в силу линейности и однородности сопряженных включений относительно ei , pei :
допущение = 0, (t1 +) = 0, V (t1 +) = 0 приводит к нарушению условия (32), в чем можно
убедиться путем последовательного рассмотрения включений в обратном времени.
в) Обратимся к условиям оптимальности моментов времени. Начнем с предельных подпроцессов. Заметим, что если di > 0 (т. е. импульс в точке si есть), то hi = 0 в силу (31). Отсюда в
дополнение к условию максимума (24) получаем, что
H si ( ) + piV ( ) = hi = 0 при di > 0; 2 [0; di ]:
1
(
)
Это совпадает с условием максимума (9) в теореме 1.
Согласно теореме 2 числа hi0 , hi1 определяются следующим образом (мы учитываем, что
ограничения на управление u, v разделены и функция H1 непрерывна):
i (s ); V i (s );
hi 2 co tess
sup
H
(
t;
x
i
i
!s i
+1
0
u2U (t)
v2Kj
+1
+1
i+1 (s ); i+1 (s ); u; v )
i V
i
=
= co tess
sup H0 (t; x(si +); V (si +); (si +); u) +
!si
u2U (t)
;
H (s; x(si +); V (si+); (si +); v) +
+ max
v2Kj 1
35
V (si +)kv k
(33)
и аналогично
hi1 2 co tess
sup
H
(
t;
x
(
s
;
)
;
V
(
s
;
)
;
(
s
;
)
;
u
)
+
0
i
i
i
!s
i u2U (t)
;
+ max
H (s; x(si ;); V (si;); (si ;); v) +
v2Kj 1
V (si ;)kv k
: (34)
Шаг 5. Итак, мы доказали, что при любом j > kv ()k1 мультипроцесс удовлетворяет ПМ
в задаче PNj , который содержит все условия теоремы 1, за исключением условия максимума
по управлению v и условий оптимальности моментов si 2 Sd (V ) (вместо них имеем равенства
(23) и (27){(29)). Завершить доказательство нужно предельным переходом при j ! 1.
Заметим, что при j > 2kv ()k1 из условия (23) следует равенство
hHv (t); v (t)i + V (t)kv(t)k = 0; t 2 T
(левая часть совпадает с левой частью равенства (23)). Тогда максимумы по v в соотношениях
(33), (34) равны нулю и эти соотношения сводятся к включениям
H (t; s +); hi1 2 co tess
H (t; s ;):
hi0+1 2 co tess
!si 0 i
!si 0 i
Используя эти включения и интегральное представление
pis(0) =
Z di
0
H t si ( )d
1
(
)
(оно вытекает из (30) и уравнений для pis ( )), преобразуем равенства (27) и соотношения (28),
(29) к включениям
H (t; s +) ; co tess
H (t; s ;) 3
co tess
!s 0 i
!s 0 i
i
i
Z di
0
H t si ( )d + si ;
1
(
)
где s0 0, s0 (t0 ; s0 ) = 0, sN 0, sN (sN ; t1 ) = 0, si = 0, i = 1; N ; 1. Полученные включения
тождественны условиям оптимальности моментов импульса теоремы 1.
Итак, при всех достаточно больших j выполнение ПМ для процесса в задаче PNj равносильно теореме 1, за исключением взятия максимума по множеству Kj в условии (23) вместо
K . При j ! 1 все стационарные (по j ) условия остаются неизменными, а (23) с очевидностью
переходит в недостающее условие максимума по конусу K .
Этим доказательство ПМ завершается.
5. Заключение
Полученные в работе необходимые условия оптимальности об. решений с конечным числом
точек разрыва имеют достаточно широкий спектр приложений. Метод их доказательства допускает распространение и на более сложные классы негладких задач импульсного управления,
например, на задачи с промежуточными ограничениями на траекторию в общих нелинейных
системах, для которых известно описание структуры разрывных об. траекторий.
Литература
1. Миллер Б.М. Условия оптимальности в задаче управления системой, описываемой дифференциальным уравнением с мерой // Автоматика и телемеханика. { 1982. { Є 6. { С. 60{72.
2. Завалищин С.Т., Сесекин А.Н. Импульсные процессы: модели и приложения. { М.: Наука,
1991. { 256 с.
3. Миллер Б.М. Оптимизация динамических систем с обобщенными управлениями // Автоматика и телемеханика. { 1989. { Є 6. { С. 23{34.
4. Миллер Б.М. Условия оптимальности в задачах обобщенного управления // Автоматика и
телемеханика. { 1992. { Є 5. { С. 50{58.
36
5. Vinter R.B., Pereira F.M. A maximum principle for optimal processes with discontinuous
trajectories // SIAM J. Control and Optim. { 1988. { V. 26. { Є 1. { P. 205{229.
6. Дыхта В.А. Необходимые условия оптимальности импульсных процессов при ограничениях
на образ управляющей меры // Изв. вузов. Математика. { 1996. { Є 12. { С. 1{9.
7. Дыхта В.А., Самсонюк О.Н. Принцип максимума для импульсных процессов при ограничениях на образ и полную вариацию управляющей меры // Краев. задачи. { Иркутск, 1997.{
C. 122{138.
8. Clarke F.H., Vinter R.B. Optimal multiprocesses // SIAM J. Control and Optim. { 1989. { V. 27.
{ Є 5. { P. 1072{1091.
9. Кларк Ф. Оптимизация и негладкий анализ. { М.: Наука, 1988. { 280 с.
10. Арутюнов А.В. Условия экстремума. Анормальные и вырожденные задачи. { М.: Изд-во
\Факториал", 1997. { 256 с.
Иркутская государственная
экономическая академия
Поступила
10.08.1999
37
Документ
Категория
Без категории
Просмотров
20
Размер файла
231 Кб
Теги
оптимальное, негладкие, принципы, максимума, управления, траектория, разрывных, задача
1/--страниц
Пожаловаться на содержимое документа