Metod mnojnukiv lagranja by Meri

Матеріали взято з книги: М. І. Жалдак, Ю. В. Триус Основи теорії і методів оптимізації: Навчальний посібник. – Черкаси: Брама-Україна, 2005. – С. 99-104. Метод множників Лагранжа Суть методу множників Лагранжа розв’язування класичної задачі на умовний екстремум полягає в тому, що для цієї задачі будується функція Лагранжа L( x, )   0 f ( x)  1 g1 ( x)  ...   k g k ( x) ,

яка залежить від змінних

x1 ,...,x n , 0 ,1 ,..., k , де

(10.4)

x  ( x1 ,..., xn )  R n ,

  ( 0 , 1 ,..., k )  R k 1 , і розв’язується вже задача відшукання екстремумів цієї функції без обмежень. При цьому використовується підхід, подібний до того, який було розглянуто в §9. Виявляється, що точка локального екстремуму функції Лагранжа L( x,  ) ( x1* ,...,xn* , *0 , *1 ,...,*k )  R nk 1 містить координати точки локального умовного екстремуму функції y  f ( x)

відносно рівнянь зв’язку (10.1): x*  ( x1* ,..., xn* )  R n . Розглянемо обґрунтування методу множників Лагранжа. Припустимо, що функції визначені f ( x), g i ( x), i  1, k , диференційовні на деякій відкритій множині M  R n . Знайдемо частинні похідні першого порядку функції змінними x1 ,...,xn ,  0 , 1 ,..., k :

L( x,  ) за

L( x,  ) f ( x ) k g i ( x )  0   i , j  1, n; x j x j x j i 1 L ( x,  )  f ( x1 ,....,xn );  0

(10.5)

L ( x,  )  g i ( x1 ,....,xn ), i  1, k .  i Т е о р е м а 10.1 (правило множників Лагранжа). Нехай функції f ( x), g i ( x), i  1, k , мають неперервні частинні похідні першого порядку на

множині М. Якщо точка x*  ( x1* ,...,xn* )  M є точкою локального умовного екстремуму функції f ( x) при обмеженнях (10.1), то існують числа *0 , *1 ,...,*k , які одночасно не дорівнюють нулеві і такі, що всі частинні

похідні першого порядку функції Лагранжа L( x,  ) за змінними x j ( j  1, n) в точці x * дорівнюють нулеві, тобто L( x*, *) f ( x*) k * g i ( x*)  *0   i  0, j  1, n , x j x j x j i 1

(10.6)

де *  (*0 , *1 ,...,*k )  R k 1 . Ця теорема є необхідною умовою локального умовного екстремуму функції f ( x) відносно рівнянь зв’язку (10.1) в термінах функції Лагранжа. Доведення теореми 10.1 при *0  1 можна знайти, наприклад, в [60], т. 2, стор. 66-68. Числа *0 , *1 ,...,*k в теоремі 10.1 називаються множниками Лагранжа. Нехай  f ( x ) f ( x ) f ( x )   – градієнт функції f ( x) в точці x  R n , f ( x )   , ,..., x2 xn   x1  g ( x ) g i ( x ) g ( x )   – градієнт функції g i (x ) в точці x  R n , g i ( x )   i , ,..., i x2 xn   x1 i  1, k . Умова (10.6) означає, що градієнти функцій f ( x), g i ( x), i  1, k , в точці

x * лінійно залежні. Якщо при цьому градієнти g i ( x*), i  1, k , лінійно незалежні (умова регулярності), то *0  0 . Розглянемо геометричну інтерпретацію умови (10.6), коли цільова функція f ( x) і функції обмежень g i ( x ) , i  1, k , залежать від двох змінних і має місце умова регулярності. Якщо є одне рівняння зв’язку g1 ( x1 , x2 )  0 , тоді умова (10.6) означає, що вектори f (x*) , g1 ( x*) повинні бути колінеарними (рис. 10.2). З рисунку 10.2 також видно, що допустима точка x ( 0) , в якій умова (10.6) не виконується, не може бути розв’язком задачі, оскільки з цієї точки можна зміститися вздовж лінії g1 ( x1 , x2 )  0 так, що значення цільової функції f ( x) зменшиться порівняно з f ( x ( 0) ) .

g'(x(0))

f '(x(0))

x(0) x* g'(x*) 1

f '(x*)

+ l

f(x*)

+ l f(x(0))

g1(x)=0

Рис. 10.2. Будь-яка точка x  M , що задовольняє умову (10.6) при деяких (00 ) , (10 ) ,...,(k0 ) , одночасно не рівних нулеві, а також умову допустимості (0)

gi ( x ( 0) )  0, i  1, k ,

(10.7)

називається стаціонарною точкою класичної задачі на умовний екстремум. Таким чином, стаціонарні точки визначаються системою виду (10.6), (10.7), яка складається з рівнянь із n  k  1 невідомими nk x1 ,...,xn ,  0 , 1 ,..., k . Але фактично в цій системі невідомих також n  k , оскільки  0 може набувати, взагалі кажучи, лише двох значень:  0  0 або  0  1 (якщо поділити всі множники Лагранжа на  0  0 ). Якщо  0  0 , то рівняння (10.6) відображають лише виродженість системи обмежень. Якщо виконується умова регулярності, то задача зводиться до випадку  0  1 і можна обмежитися розглядом регулярної функції Лагранжа: L( x, )  f ( x)  1 g1 ( x)  ...   k g k ( x) ,

(10.8)

де   (1, 1 ,..., k ) . Тоді для відшукання стаціонарних точок функції f ( x) при умовах зв’язку (10.1) треба розв’язати систему з n  k рівнянь:  L( x1 ,..., xn , 1 ,...,  k )  0, i  1, n,   x i   g ( x ,..., x )  0, i  1, k , n  i 1

відносно n  k невідомих x1 ,..., xn , 1 ,...,  k .

(10.9)

Якщо x1( 0 ) ,...,xn( 0 ) , (10 ) ,...,(k0 ) – розв’язок системи (10.9) (таких розв’язків може бути кілька), то x ( 0 )  ( x1( 0 ) ,...,xn( 0 ) ) є точкою можливого локального умовного екстремуму функції f ( x) при умовах зв’язку (10.1). Подальше дослідження стаціонарних точок пов’язано із застосуванням достатніх умов екстремуму функції багатьох змінних. Розглянемо, як можна застосувати достатні умови екстремуму у випадку, коли які-небудь k змінних xi (i  1, n) можна виразити через інші з рівнянь зв’язку (10.1). Нехай для визначеності має місце подання xi  i ( x ), i  1, k ,

(10.10)

де x  ( xk 1 , xk 2 ,...,xn ) і k  n . З урахуванням (10.8) і (10.10) побудуємо функцію

F ( xk 1 ,...,xn )  L(1 ( x ),...,k ( x ), xk 1 ,...,xn , (10) ,...,(k0) ) , (10.11) яка фактично залежить від змінних xk 1 , xk  2 ,...,xn , і знайдемо її другий диференціал за цими змінними в точці x ( 0 )  ( xk( 0)1 ,...,xn( 0 ) ) :  2 L ( x ( 0 ) , ( 0 ) ) d F |xx ( 0)    dxi dx j , xi x j i k 1 j k 1 2

(10.12)

де ( 0 )  ((10 ) ,...,(k0 ) ) – відповідний набір множників Лагранжа, dxk 1 ,..., dxn – диференціали незалежних змінних. Якщо вираз d 2 F | x  x ( 0 ) буде квадратичною формою від dxk 1 ,..., dxn і ця квадратична форма додатно визначена, то в точці x ( 0 )  ( xk( 0)1 ,...,xn( 0 ) ) функція F (x ) має локальний мінімум, а функція f ( x) в точці x ( 0 )  ( x1( 0 ) ,...,xn( 0 ) ) має локальний умовний мінімум при умовах зв’язку (10.1). Якщо квадратична форма d 2 F | x  x ( 0 ) буде від’ємно визначена, то в точці x ( 0 )  ( xk( 0)1 ,...,xn( 0 ) )

функція

F (x )

має локальний максимум, а функція

f ( x)

в точці

x ( 0 )  ( x1( 0 ) ,...,xn( 0 ) ) має локальний умовний максимум при умовах зв’язку

(10.1). Якщо квадратична форма d 2 F | x  x ( 0 ) знакозмінна, то в точці x ( 0) функція f ( x) не має умовного екстремуму. Сказане дає змогу сформулювати загальне привило пошуку розв’язків класичної задачі на умовний екстремум: 1) побудувати регулярну функцію Лагранжа: L( x, )  f ( x)  1 g1 ( x)  ...   k g k ( x) ;

2) знайти стаціонарні точки функції L( x,  ) , розв’язавши систему рівнянь:  L ( x1 ,...,xn , 1 ,..., k )  0, j  1, n,   x j    g i ( x1 ,...,xn )  0, i  1, k;

3) перевірити, які серед стаціонарних точок (якщо вони існують) будуть точками умовного екстремуму і визначити характер одержаних умовних екстремумів (для цього можна скористатися другим диференціалом (10.12) функції виду (10.11)); 4) знайти значення цільової функції f ( x) в точках умовного мінімуму і максимуму (якщо вони існують) і вибрати серед них найменше і найбільше. З а у в а ж е н н я. При розв’язуванні задач, для яких відомо або легко з’ясувати, що цільова функція в стаціонарних точках може досягати тільки мінімальних або максимальних значень (наприклад, для опуклої або вгнутої функції), крок 3 правила відшукання розв’язків класичної задачі на умовний екстремум можна опустити. П р и к л а д 10.1. При яких значеннях діаметра основи d см і висоти h см циліндрична банка, об’єм якої дорівнює 54 см3, має найменшу поверхню. Спочатку формалізуємо задачу. Оскільки повна площа поверхні циліндричної банки визначається формулою d 2 2 S  2 S ocн.  S б.п.  2r  2rh   dh , 2 де S ocн . – площа основи, S б.п. – площа бічної поверхні, то поставлена задача зводиться до відшукання умовного мінімуму функції

S ( d , h) 

d 2  dh 2

при умові зв’язку

V

d 2 h  54 або d 2 h  216  0 . 4

Складемо регулярну функцію Лагранжа для одержаної задачі:

d 2 L ( d , h,  )   dh   ( d 2 h  216) . 2 Знайдемо стаціонарні точки цієї функції, розв’язавши систему рівнянь:

 L ( d , h,  )  d  h  2dh  0,  d   L ( d , h,  )  d  d 2  0,  h   L ( d , h,  )  d 2 h  216  0.   

Оскільки діаметр d банки не може дорівнювати нулю, то з другого рівняння  одержуємо, що ( 0 )   . Підставляючи значення ( 0 ) в перше рівняння, одержуємо d ( d  h)  0 , тобто d  h . Тоді з третього рівняння системи одержимо d 3  216 , звідки d = 6. Таким чином, є одна стаціонарна точка x ( 0 )  ( d ( 0 ) , h ( 0 ) )  (6, 6) . 216 Враховуючи умову зв’язку, маємо h  2 . Тому для подальшого дослідження d ( 0) точки x розглянемо функцію виду (10.11) 2 d 2 216   2 216 216  d , F (d )   d 2   d  216    2 2 d 2 d d d 

яку одержуємо з функції Лагранжа L( d , h, ) при   ( 0 )   / d . Оскільки функція F (d ) залежить від однієї змінної, то для встановлення характеру екстремуму в точці x ( 0 )  d ( 0 ) знайдемо значення другої похідної функції F (d ) в точці

d ( 0 )  6 . Маємо: F ( d )  d 

тобто

точка

x ( 0)  d ( 0)  6

216 432 ; F ( d )    3 ; F (6)  3  0 , 2 d d

точкою

мінімуму

функції

F (d ) ,

значить

x  ( d , h )  (6, 6) є точкою розв’язком поставленої задачі. Таким чином, при значеннях діаметра основи d=6 см і висоти h=6 см циліндрична банка, об’єм якої дорівнює 54 см 3, має найменшу поверхню: S (6, 6)  54 см2. ( 0)

(0)