Матеріали взято з книги: М. І. Жалдак, Ю. В. Триус Основи теорії і методів оптимізації: Навчальний посібник. – Черкаси: Брама-Україна, 2005. – С. 99-104. Метод множників Лагранжа Суть методу множників Лагранжа розв’язування класичної задачі на умовний екстремум полягає в тому, що для цієї задачі будується функція Лагранжа L( x, ) 0 f ( x) 1 g1 ( x) ... k g k ( x) ,
яка залежить від змінних
x1 ,...,x n , 0 ,1 ,..., k , де
(10.4)
x ( x1 ,..., xn ) R n ,
( 0 , 1 ,..., k ) R k 1 , і розв’язується вже задача відшукання екстремумів цієї функції без обмежень. При цьому використовується підхід, подібний до того, який було розглянуто в §9. Виявляється, що точка локального екстремуму функції Лагранжа L( x, ) ( x1* ,...,xn* , *0 , *1 ,...,*k ) R nk 1 містить координати точки локального умовного екстремуму функції y f ( x)
відносно рівнянь зв’язку (10.1): x* ( x1* ,..., xn* ) R n . Розглянемо обґрунтування методу множників Лагранжа. Припустимо, що функції визначені f ( x), g i ( x), i 1, k , диференційовні на деякій відкритій множині M R n . Знайдемо частинні похідні першого порядку функції змінними x1 ,...,xn , 0 , 1 ,..., k :
і
L( x, ) за
L( x, ) f ( x ) k g i ( x ) 0 i , j 1, n; x j x j x j i 1 L ( x, ) f ( x1 ,....,xn ); 0
(10.5)
L ( x, ) g i ( x1 ,....,xn ), i 1, k . i Т е о р е м а 10.1 (правило множників Лагранжа). Нехай функції f ( x), g i ( x), i 1, k , мають неперервні частинні похідні першого порядку на
множині М. Якщо точка x* ( x1* ,...,xn* ) M є точкою локального умовного екстремуму функції f ( x) при обмеженнях (10.1), то існують числа *0 , *1 ,...,*k , які одночасно не дорівнюють нулеві і такі, що всі частинні
похідні першого порядку функції Лагранжа L( x, ) за змінними x j ( j 1, n) в точці x * дорівнюють нулеві, тобто L( x*, *) f ( x*) k * g i ( x*) *0 i 0, j 1, n , x j x j x j i 1
(10.6)
де * (*0 , *1 ,...,*k ) R k 1 . Ця теорема є необхідною умовою локального умовного екстремуму функції f ( x) відносно рівнянь зв’язку (10.1) в термінах функції Лагранжа. Доведення теореми 10.1 при *0 1 можна знайти, наприклад, в [60], т. 2, стор. 66-68. Числа *0 , *1 ,...,*k в теоремі 10.1 називаються множниками Лагранжа. Нехай f ( x ) f ( x ) f ( x ) – градієнт функції f ( x) в точці x R n , f ( x ) , ,..., x2 xn x1 g ( x ) g i ( x ) g ( x ) – градієнт функції g i (x ) в точці x R n , g i ( x ) i , ,..., i x2 xn x1 i 1, k . Умова (10.6) означає, що градієнти функцій f ( x), g i ( x), i 1, k , в точці
x * лінійно залежні. Якщо при цьому градієнти g i ( x*), i 1, k , лінійно незалежні (умова регулярності), то *0 0 . Розглянемо геометричну інтерпретацію умови (10.6), коли цільова функція f ( x) і функції обмежень g i ( x ) , i 1, k , залежать від двох змінних і має місце умова регулярності. Якщо є одне рівняння зв’язку g1 ( x1 , x2 ) 0 , тоді умова (10.6) означає, що вектори f (x*) , g1 ( x*) повинні бути колінеарними (рис. 10.2). З рисунку 10.2 також видно, що допустима точка x ( 0) , в якій умова (10.6) не виконується, не може бути розв’язком задачі, оскільки з цієї точки можна зміститися вздовж лінії g1 ( x1 , x2 ) 0 так, що значення цільової функції f ( x) зменшиться порівняно з f ( x ( 0) ) .
g'(x(0))
f '(x(0))
1
x(0) x* g'(x*) 1
-
f '(x*)
+
-
+ l
-
f(x*)
+ l f(x(0))
g1(x)=0
Рис. 10.2. Будь-яка точка x M , що задовольняє умову (10.6) при деяких (00 ) , (10 ) ,...,(k0 ) , одночасно не рівних нулеві, а також умову допустимості (0)
gi ( x ( 0) ) 0, i 1, k ,
(10.7)
називається стаціонарною точкою класичної задачі на умовний екстремум. Таким чином, стаціонарні точки визначаються системою виду (10.6), (10.7), яка складається з рівнянь із n k 1 невідомими nk x1 ,...,xn , 0 , 1 ,..., k . Але фактично в цій системі невідомих також n k , оскільки 0 може набувати, взагалі кажучи, лише двох значень: 0 0 або 0 1 (якщо поділити всі множники Лагранжа на 0 0 ). Якщо 0 0 , то рівняння (10.6) відображають лише виродженість системи обмежень. Якщо виконується умова регулярності, то задача зводиться до випадку 0 1 і можна обмежитися розглядом регулярної функції Лагранжа: L( x, ) f ( x) 1 g1 ( x) ... k g k ( x) ,
(10.8)
де (1, 1 ,..., k ) . Тоді для відшукання стаціонарних точок функції f ( x) при умовах зв’язку (10.1) треба розв’язати систему з n k рівнянь: L( x1 ,..., xn , 1 ,..., k ) 0, i 1, n, x i g ( x ,..., x ) 0, i 1, k , n i 1
відносно n k невідомих x1 ,..., xn , 1 ,..., k .
(10.9)
Якщо x1( 0 ) ,...,xn( 0 ) , (10 ) ,...,(k0 ) – розв’язок системи (10.9) (таких розв’язків може бути кілька), то x ( 0 ) ( x1( 0 ) ,...,xn( 0 ) ) є точкою можливого локального умовного екстремуму функції f ( x) при умовах зв’язку (10.1). Подальше дослідження стаціонарних точок пов’язано із застосуванням достатніх умов екстремуму функції багатьох змінних. Розглянемо, як можна застосувати достатні умови екстремуму у випадку, коли які-небудь k змінних xi (i 1, n) можна виразити через інші з рівнянь зв’язку (10.1). Нехай для визначеності має місце подання xi i ( x ), i 1, k ,
(10.10)
де x ( xk 1 , xk 2 ,...,xn ) і k n . З урахуванням (10.8) і (10.10) побудуємо функцію
F ( xk 1 ,...,xn ) L(1 ( x ),...,k ( x ), xk 1 ,...,xn , (10) ,...,(k0) ) , (10.11) яка фактично залежить від змінних xk 1 , xk 2 ,...,xn , і знайдемо її другий диференціал за цими змінними в точці x ( 0 ) ( xk( 0)1 ,...,xn( 0 ) ) : 2 L ( x ( 0 ) , ( 0 ) ) d F |xx ( 0) dxi dx j , xi x j i k 1 j k 1 2
n
n
(10.12)
де ( 0 ) ((10 ) ,...,(k0 ) ) – відповідний набір множників Лагранжа, dxk 1 ,..., dxn – диференціали незалежних змінних. Якщо вираз d 2 F | x x ( 0 ) буде квадратичною формою від dxk 1 ,..., dxn і ця квадратична форма додатно визначена, то в точці x ( 0 ) ( xk( 0)1 ,...,xn( 0 ) ) функція F (x ) має локальний мінімум, а функція f ( x) в точці x ( 0 ) ( x1( 0 ) ,...,xn( 0 ) ) має локальний умовний мінімум при умовах зв’язку (10.1). Якщо квадратична форма d 2 F | x x ( 0 ) буде від’ємно визначена, то в точці x ( 0 ) ( xk( 0)1 ,...,xn( 0 ) )
функція
F (x )
має локальний максимум, а функція
f ( x)
в точці
x ( 0 ) ( x1( 0 ) ,...,xn( 0 ) ) має локальний умовний максимум при умовах зв’язку
(10.1). Якщо квадратична форма d 2 F | x x ( 0 ) знакозмінна, то в точці x ( 0) функція f ( x) не має умовного екстремуму. Сказане дає змогу сформулювати загальне привило пошуку розв’язків класичної задачі на умовний екстремум: 1) побудувати регулярну функцію Лагранжа: L( x, ) f ( x) 1 g1 ( x) ... k g k ( x) ;
2) знайти стаціонарні точки функції L( x, ) , розв’язавши систему рівнянь: L ( x1 ,...,xn , 1 ,..., k ) 0, j 1, n, x j g i ( x1 ,...,xn ) 0, i 1, k;
3) перевірити, які серед стаціонарних точок (якщо вони існують) будуть точками умовного екстремуму і визначити характер одержаних умовних екстремумів (для цього можна скористатися другим диференціалом (10.12) функції виду (10.11)); 4) знайти значення цільової функції f ( x) в точках умовного мінімуму і максимуму (якщо вони існують) і вибрати серед них найменше і найбільше. З а у в а ж е н н я. При розв’язуванні задач, для яких відомо або легко з’ясувати, що цільова функція в стаціонарних точках може досягати тільки мінімальних або максимальних значень (наприклад, для опуклої або вгнутої функції), крок 3 правила відшукання розв’язків класичної задачі на умовний екстремум можна опустити. П р и к л а д 10.1. При яких значеннях діаметра основи d см і висоти h см циліндрична банка, об’єм якої дорівнює 54 см3, має найменшу поверхню. Спочатку формалізуємо задачу. Оскільки повна площа поверхні циліндричної банки визначається формулою d 2 2 S 2 S ocн. S б.п. 2r 2rh dh , 2 де S ocн . – площа основи, S б.п. – площа бічної поверхні, то поставлена задача зводиться до відшукання умовного мінімуму функції
S ( d , h)
d 2 dh 2
при умові зв’язку
V
d 2 h 54 або d 2 h 216 0 . 4
Складемо регулярну функцію Лагранжа для одержаної задачі:
d 2 L ( d , h, ) dh ( d 2 h 216) . 2 Знайдемо стаціонарні точки цієї функції, розв’язавши систему рівнянь:
L ( d , h, ) d h 2dh 0, d L ( d , h, ) d d 2 0, h L ( d , h, ) d 2 h 216 0.
Оскільки діаметр d банки не може дорівнювати нулю, то з другого рівняння одержуємо, що ( 0 ) . Підставляючи значення ( 0 ) в перше рівняння, одержуємо d ( d h) 0 , тобто d h . Тоді з третього рівняння системи одержимо d 3 216 , звідки d = 6. Таким чином, є одна стаціонарна точка x ( 0 ) ( d ( 0 ) , h ( 0 ) ) (6, 6) . 216 Враховуючи умову зв’язку, маємо h 2 . Тому для подальшого дослідження d ( 0) точки x розглянемо функцію виду (10.11) 2 d 2 216 2 216 216 d , F (d ) d 2 d 216 2 2 d 2 d d d
яку одержуємо з функції Лагранжа L( d , h, ) при ( 0 ) / d . Оскільки функція F (d ) залежить від однієї змінної, то для встановлення характеру екстремуму в точці x ( 0 ) d ( 0 ) знайдемо значення другої похідної функції F (d ) в точці
d ( 0 ) 6 . Маємо: F ( d ) d
тобто
точка
x ( 0) d ( 0) 6
216 432 ; F ( d ) 3 ; F (6) 3 0 , 2 d d
є
точкою
мінімуму
функції
F (d ) ,
а
значить
x ( d , h ) (6, 6) є точкою розв’язком поставленої задачі. Таким чином, при значеннях діаметра основи d=6 см і висоти h=6 см циліндрична банка, об’єм якої дорівнює 54 см 3, має найменшу поверхню: S (6, 6) 54 см2. ( 0)
(0)
(0)