Теоретичні основи для реалізації розділу "Елементи функціонального аналізу та диференціальне числення функцій багатьох змінних" курсу математичного аналізу за допомогою комп’ютерних технологій
Поняття метричного простору. Збіжність в метричних просторах. Збереження зв’язності при неперервних відображеннях. Приклади повних метричних просторів. Поняття диференційовної функції. Необхідні умови диференційовності. Частинні похідні вищих порядків.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 23.08.2012 |
Размер файла | 1,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Дуже часто в математиці виникає потреба з'ясувати при яких умовах те чи інше рівняння має на деякій множині єдиний розв'язок. При розв'язуванні цієї задачі використовують властивості стискуючих відображень заданих в повних метричних просторах.
Означення 3.2. Нехай f відображає Х в Х. Точка х0Х, називається нерухомою точкою оператора f , якщо f(x0)=x0.
Теорема (Банаха). Якщо f:XX є стискуючим відображенням, і Х повний метричний простір, то відображення f в даному просторі має єдину нерухому точку.
Доведення. Візьмемо довільне х0Х, х1=f(x0), x2=f(x1),…xn=f(xn-1),… В результаті одержали послідовність {xn}X. Тоді
(3.1).
Візьмемо будь-яке п, тоді p
(n+p-1+n+p-2+… ...+n)(x1;x0)<(n+n+1+…+n+p-1+n+p+…)(x1;x0)= (x1;x0).
Оскільки 0<<1, то останній вираз при п, прямує до нуля так, що >0, n0: nn0, справедлива .
З останніх двох нерівностей одержуємо, що послідовність {xn} є фундаментальною, а оскільки простір повний, то і збіжною до деякої точки аХ.
Внаслідок неперервності відображення f маємо:
.
Звідси слідує, що а є нерухомою точкою цього відображення.
Для доведення єдиності точки а, припустимо, що b є ще одна нерухома точка відображення: b=f(b), причому ab. Тоді матимемо:
, бо 0<<1.
Прийшли до суперечності. Теорему доведено.
ЧАСТИНА II. Диференціальне числення функцій багатьох змінних
Розділ 1. Поняття дійсної функції багатьох змінних
В цьому розділі ми для функцій f, які діють з RnR, побудуємо апарат диференційного числення і вкажемо на деякі його застосування. Оскільки областю визначення цієї функції будуть деякі множини з простору Rn, кожна точка яких задається п дійсними координатами, а значеннями цієї функції є дійсні числа, то функції, які ми будемо вивчати, називатимуться дійснозначними функціями від п дійсних змінних або функціями багатьох змінних.
Таким чином, в цьому розділі ми будемо займатися функціями виду:
f: ER1 ERn ,
E - область визначення функції, f(E)R - множина значень.
Графіком функції двох дійсних змінних є деяка поверхня в просторі R3. Звичайно можна ввести поняття графіка і для функції більшої кількості змінних, але тоді ця множина М буде розміщена в просторі, розмірність якого більша або рівна 4, і цей об'єкт зобразити важко.
Із попередньої частини випливає, що для функцій багатьох змінних можна вводити поняття границі і поняття неперервності. Зауважимо, що ці речі переносяться сюди.
Домовимось, окіл точки х(0) , радіуса r позначати , а проколотий окіл - .
Означення 1.1. (неперервність функції за Гейне). Нехай f:ER, x(0)E. f називається неперервною в точці х(0), якщо для будь-якої послідовності {x(к)}: x(к)E , яка збігається до х(0), послідовність {f(x(к))} - збіжна до числа f(x(0)).
Означення 1.2. (неперервність функції по Коші). Нехай f: ER, x(0)E. Функція f називається неперервною в точці х(0),якщо для будь-якого >0 існує >0 таке, що для всякого хЕ, що задовільняє нерівності (х;x(0))<, виконується нерівність f(x)-f(x(0))<.
Якщо х(0)є граничною точкою множини Е, то означення неперервності можна сформулювати наступним чином.
Означення 1.3. Нехай f: ER, x(0)E і х(0) гранична точка множини Е. Функція f називається неперервною в точці х(0), якщо .
Зрозуміло, що якщо f - неперервна в усіх точках множини Е, то вона називається неперервною на множині Е.
Як і для функцій однієї змінної, так і для функцій багатьох змінних мають місце теореми Вейєрштрасса. Так, як обмежена замкнена множина в просторі Rn є компактом, то на основі теореми 4.4 розділу 5, першої частини дані теореми можна сформулювати наступним чином.
Теорема 1.1. (Теорема Вейєрштрасса). Якщо функція f неперервна на обмеженій і замкненій множині FRn, то вона обмежена на цій множині і досягає на ній своїх найбільшого і найменшого значень.
Теорема 1.2. Якщо G відкрита і зв'язна множина в просторі Rn, то будь-які дві точки цієї множини можна з'єднати неперервною кривою, всі точки якої належать множині G.
Доведення. Припустимо, що висновок теореми не вірний. Це означає, що існують дві точки х(1) і х(2), які належать множині G, які не можна з'єднати неперервною кривою, всі точки якої належать множині G.
Позначимо через А множину, що містить точку х(1) і всі ті точки множини G, які можна з'єднати із точкою х(1) неперервною кривою, яка належить G. Решту точок, - позначимо через В. Тобто В=G-A.
Оскільки G - відкрита, то х(1) входить в G разом з деяким своїм околом. Зрозуміло, що всі точки околу можна з'єднати з центром неперервною кривою (навіть прямолінійним відрізком), тобто до А входять всі точки з околу. Це означає, що А - непорожня і відкрита множина, бо якщо якась точка х(3)А, тобто її можна зєднати з х(1) неперервною кривою, то неперервною кривою можна з'єднати з точкою х(1) всі точки з деякого околу точки х(3).
Очевидно, що В - непорожня (бо там є х(2)) і також відкрита. Із побудови видно, що АВ=, а також , що G= AB. Оскільки множина G зв'язна, то хоча б одна з цих множин містить точку дотику другої. Нехай точка х(0)А є точкою дотику множини В. Тоді в будь-якому околі точки х(0) є хоча б одна точка з множини В. Візьмемо окіл точки х(0), який міститься в G. Всі точки з цього околу можна сполучити з х(0) неперервною кривою, яка лежить в G, а значить х(0) не може бути точкою дотику множини В. Аналогічно встановлюється, що жодна точка множини В не може бути точкою дотику множини А. Прийшли до суперечності. Теорему доведено.
Приклад. Нехай маємо функцію
Чи буде функція неперервною в точці (0;0)? Для цього потрібно з'ясувати чи буде
?
За умовою. Розглянемо два шляхи прямування (x;y)(0;0).
,
,
а це означає, що дана функція в даній точці границі не має. Значить в цій точці функція має розрив.
Нагадаємо, що будь-яка зв'язна відкрита множина, називаєтся областю.
Множина, що є об'єднанням області G і її граничних точок, називається замкненою областю.
Теорема1.3. (про неперервність складної функції). Нехай маємо функцію z=f(x1, x2,…, xn) причому точка (х1,...,хп)Е, ERn. Нехай задано ще таку систему функцій:
х1=1(t1,…,tk)
x2=2(t1,…tk)
.....................
xn=n(t1,…,tk),
де точки (t1,…,tk)GRk. Якщо функції 1,…,n неперервні в точці С=(t1(0),…,tk(0))G, а функція z=f(x1, x2,…, xn) неперервна в точці (х1(0),…хп(0))=х(0)Е (тут х1(0)=1(t1(0),…,tk(0)), х2(0)=2(t1(0),…,tk(0)),..., хп(0)=п(t1(0),…,tk(0))), то складна функція z від (t1,…,tk) - неперервна в точці t(0)= =(t1(0),…,tk(0)).
Доведення. Оскільки функції 1,...,п - неперервні в точці t(0),то (з означення неперервності за Гейне), для будь-якої послідовності t(і), яка належить множині G і збіжна до t(0) матимемо, що х(і)=(х1(і),...,хп(і)) (х1(0),…хп(0)). Тоді, оскільки функція f(x1, x2,.., xn)= f(x) є неперервною в точці х(0), то за означенням Гейне, з того, що послідовність х(і) збігається до х(0), слідує, що , або те саме,
.
А це означає, що складна функція неперервна в точці t(0). Теорему доведено.
Оскільки дана функція має множину значень, яка є деякою множиною дійсних чисел, які можна порівнювати, то виникає питання: чи має місце тут теорема Больцано-Коші?
Теорема 1.4. Больцано-Коші (для функції багатьох змінних.)
Нехай f:ER неперервна на зв'язній множині ЕRn. Якщо f(x(1))=A, f(x(2))=B; x(1), x(2)E, AB, то для будь-якої точки C,(CR), що лежить між А і В, існує точка х(3)Е така, що f(x(3))=C.
Доведення. Оскільки Е зв'язна множина в Rn, то за теоремою 1.1, будь-які дві її точки можна з'єднати неперервною кривою, всі точки якої належать множині Е. Це означає, що неперервною кривою можна з'єднати і точки х(1), х(2), де х(1)=(х1(1), х2(1),..., хп(1)), х(2)=(х1(2), х2(2),..., хп(2)).
Таким чином існують функції х1=1(t), х2=2(t),…, хn=n(t), - неперервні на [,] , (1()…n())=x(1), (1()…n())=x(2) і якщо t змінюється від до , то точка рухається по цій кривій від х(1)до х(2).
Розглянемо нашу функцію в точках тільки цієї неперервної кривої. Оскільки точки кривої задаються системою рівнянь від змінної t, z=f(x1, x2,…,xn), а точки (x1, x2,…,xn) належать кривій, то х1=1(t), x2=2(t),…, xn=n(t). Це означає, що наша функція z є складною функцією параметра t, z=f(1(t),2(t),…,n(t)), t[,]=(t) .
()=, ()=.
Оскільки f неперервна на Е, то вона неперервна в точках кривої, що належить цій множині. Кожний аргумент хі, теж є неперервною функцією параметра t. Тому за теоремою 1.2, матимемо, що складна функція (t) є неперервною функцією однієї змінної на [, ], а звідси за теоремою Больцано-Коші (з одномірного аналізу) випливає, що існує [, ]: ()=C (з умови теореми), тобто f(1(), 2(),…, n())=C, а оскільки точка (1(), 2(),…, n()) є точкою нашої кривої, то вона є і точкою множини Е, позначимо її х(3).Таким чином f(x(3))=С. Теорему доведено.
Приведемо ще одне різницеве означення неперервності функції багатьох змінних.
Означення 1.4. Нехай U=f(x1,…,xn) - задана в деякій області G, і (х1(0),х2(0),...,хп(0))G. Надамо цій точці приріст, так щоб новоутворена точка не
вийшла за межі області G. Одержимо точку . Тоді величина , називається приростом функції f(x1; x2;…;xn).
Зрозуміло, що функція U=f(x1,…,xn)буде неперервною в точці (x1(0),…,xn(0)) тоді і тільки тоді, коли .
Розділ 2. Диференційовність функцій багатьох змінних
§ 1. Поняття диференційовної функції. Часткові похідні. Необхідні умови диференційовності
Очевидно є проблема перенесення означення похідної функції однієї змінної на похідну функції багатьох змінних. І ця проблема полягає в тому, що кожна із змінних має свій приріст.
В зв'язку з цим, перенести означення похідної можна, якщо приріст надавати не всім змінним, а тільки одній із них. В результаті ми одержимо аналог похідної, який будемо називати частковою похідною від функції багатьох змінних, як було в одномірному аналізі.
Означення 1.1. Величину
,
називають частковим приростом функціі по змінній хі, де хі0, в точці х(0).
Означення 1.2. Якщо існує границя , то її називають частинною похідною функції U(x) в точці х(0) і позначають: , або .
Означення 1.3. Функція U=f(x), називається диференційовною в точці х(0), якщо повний приріст цієї функції в цій точці можна зобразити у вигдяді
, (1.1),
де Аі - незалежні від величини, і є функціями від , які прямують до нуля, коли .
Означення 1.4. Якщо функція диференційовна в точці х0, то вираз називається диференціалом функції в даній точці і позначається ,
.
Як ми бачимо, диференціал це є лінійна відносно частина приросту функції. З рівності (1.1) слідує, що якщо функція диференційовна в точці , то вона неперервна в цій точці.
Теорема 1.1. Якщо функція диференційовна в точці, то існують усі часткові похідні в цій точці.
Якщо рівність (1.1) справедлива для будь-якого приросту х(0), то вона справедлива, коли , а решта . Тоді , поділимо обидві частини на . Після переходу до границі, одержимо: .
Обернене твердження взагалі невірне.
Розглянемо функцію
В точці (0;0) існують часткові похідні.
;
.
Але дана функція не є неперервною в точці (0;0), тому вона не може бути і диференційовною в цій точці.
Таким чином цей приклад показує:
1)Із існування всіх часткових похідних в точці, не випливає диференційовність цієї функції в цій точці.
2)Не обов'язково розривна функція не повинна мати часткових похідних.
Зауважимо, що в означенні диференційовної функції на накладається умова: .
З теореми 1.1. бачимо, що якщо функція диференційовна в точці х0, то її приріст можемо записати у вигляді
,
де і - нескінченно малі функції від .
Якщо - незалежні змінні, то їх прирости називаються диференціалами, тобто:
.
Таким чином диференціал функції можна записати у вигляді
.
Як ми знаємо, між диференційовністю функції однієї змінної в якійсь точці х0 і наявністю дотичної до графіка функції в точці (х0, f(x0)), є зв'язок. Перенести його на функцію будь-якої кількості змінних (3) - не можливо, бо графік такої функції буде розміщуватись в просторі розмірності >3. Та все ж таки для функції z=f(x;y) таку проблему можна ставити, бо її графіком буде деяка поверхня в просторі R3, для якої ми можемо ввести поняття дотичної площини, а отже, можливо, і зможемо зв'язати проблему існування дотичної площини з умовою диференційовності функції.
Означення 2.4. Площина Р, називається дотичною до деякої поверхні G в деякій точці М0(у0; x0; z0) цієї поверхні, якщо:
1) М0Р;
2) кут між цією площиною і січною М0М, де М - будь-яка точка поверхні G, прямує до нуля, якщо точка М прямує до співпадання з точкою М0.
Нехай функція z=f(x; y) диференційовна в точці А(х0; y0), тоді приріст функції можна записати у вигляді , , коли 0, де .
Розглянемо площину: і покажемо, що вона є дотичною до поверхні в точці (х0; y0; z0), де z0=f(x0; y0). Для того, щоб довести, що ця площина буде дотичною до нашої поверхні в точці (х0; y0; z0) потрібно показати:
1) що вона проходить через точку (х0; y0; z0), а це очевидно, бо координати цієї точки наше рівняння задовільняють;
2) що кут між нормаллю цієї площини і січною прямуватиме до 90, коли точка М прямує до точки М0, рухаючись по цій поверхні.
Нехай -- вектор нормалі до площини в точці М0. Розглянемо вектор , де М(х; y; z) - довільна точка на поверхні.
Врахувавши, що , одержимо:
метричний простір функція диференційовність
, коли ,
це рівнозначне тому, що коли ММ0 по поверхні, то кут між і прямує до 90, а це означає, що кут між площиною і січною прямує до нуля.
Отже площина є дотичною до функції в точці М0(х0; y0; z0).
§ 2. Достатні умови диференційовності функції багатьох змінних
В попередньому параграфі ми показали, що, якщо функція диференційовна в точці, то в даній точці існують часткові похідні. Обернене твердження взагалі кажучи не вірне. Але при цьому має місце наступна теорема.
Теорема 2.1. Нехай функція U=(x1; x2;…;xn) в деякому околі точки А(х1(0); x2(0);…;xn(0)) має всі частинні похідні. Якщо вони є функціями неперервними в точці А, то дана функція - диференційовна в цій точці.
Доведення. Для простоти викладу будемо вважати, що наша функція залежить від двох змінних, U=f(x; y), A(x0; y0).
Надамо х0, у0 прирости такі, що точка належить околу, в якому існують часткові похідні. Використовуючи теорему Лагранжа, одержимо:
, де , .
Оскільки за умовою f /x і f /y - неперервна в точці х0, у0, то величини і прямують до нуля, коли . Знайшовши з останніх двох рівностей перші доданки справа і підставивши їх у суму, одержимо: , а це означає, що наша функція в точці А є диференційовною. Теорему доведено.
§ 3. Диференційовність складної функції.
Коли ми розглядали поняття диференційовності функції, то в представленні вважалося, що одночасно не можуть дорівнювати нулю. Тобто функції і не визначені в точці (0,...,0). Якщо доозначимо і в точці (0,0,...,0), поклавши і(0,...,0)=0, то рівність (1.1) матиме зміст і тоді, коли всі .
Нехай функції
(3.1)
визначені в області D1Rk, а функція U=f(x1,…,xn) визначена в області DRn при чому, якщо точка (t1,…,tk)D1, то точка (1(t1,…,tk ),…, n(t1,…, tk))D. Тоді ми одержимо складну функцію U=f(1(t1,…,tk ),…, n(t1,…, tk)), яка визначена в області D1.
Теорема 3.2. Нехай всі функції (3.1.) диференційовні в А(t1(0),…,tk(0)), а функція U=f(x1,…,xn) диференційовна в точці В(x1(0),…,xn(0)), де хі(0)=I(t1(0),…,tk(0)), тоді складна функція U(t1,…,tk) -диференційовна в точці А і при цьому її часткові похідні обчислюються по формулі:
, де і=1,...,k.
Доведення. Для простоти викладок, проведемо доведення, коли U=f(x1,x2), x1=1(t1, t2, t3); x2=2(t1, t2, t3), A=(t1(0), t2(0), t3(0)), B=(x1(0), x2(0)).
Оскільки функції 1, 2 диференційовні в точці А за умовою, то надавши t1(0), t2(0), t3(0) прирости t1, t2, t3, які одночасно всі не дорівнюють нулю, прирости функцій х1, х2, що відповідають цим приростам, можна записати у вигляді:
(3.2)
, (3.3),
де і, і0, а значить і 0, коли tk0. Оскільки х1(0), х2(0), одержали прирости х1, х2, які обчислюються за допомогою формул (3.2), (3.3), то в силу того, що U=f(x1, x2) в точці В диференційовна, її приріст в цій точці можна записати у вигляді:
(3.4),
тут 1, 20, коли (х1,х2)(0,0) (при цьому можуть х1=х2=0).
Підставивши (3.2) і (3.3) в (3.4), одержимо:
Замінивши множники біля t1, t2, t3 , в останніх трьох доданках, відповідно на 1, 2, 3, отримаємо:
Якщо t1, t2, t30, то 1, 2, 30, 1, 2, 30, і х1, х20, а значить 10, 20. Тому 1, 2, 30. Звідси робимо висновок, що функція U(t1, t2, t3) - диференційовна в точці , і при цьому , де і=1, 2, 3.
§ 4. Інваріантність форми диференціала функції багатьох змінних
Нехай функція U=f(x1,…,xn) диференційовна в точці В, а функції х1=1(t1,…,tk) ,…,xn=n(t1,…, tk), як вимагалось в теоремі 3.2 - диференційовні в точці А, при чому координати точки В зв'язані з координатами точки А, як і вимагалось в цій теоремі. Тоді, як ми довели, U(t1…,tk) диференційовна в точці А. А оскільки ti - незалежні аргументи, то існує диференціал нашої функції дорівнює:
Так, як при кожному і, то dU можна переписати у вигляті:
,
а останній вираз не відрізняється від dU, коли х1,...,хn - незалежні змінні.
Отже ми довели: форма диференціала функції багатьох змінних не залежить від того, чи її аргументи - незалежні змінні, чи функції якихось інших знінних. Ця властивість називається інваріантністю форми диференціала.
§ 5. Похідна за напрямком. Градієнт
Нехай маємо напрямок в точці М0(х0, у0, z0)R3, заданий одиничним вектором , який утворює, з додатніми напрямками осей ОХ, ОУ, ОZ, кути, що відповідно дорівнюють , , . Через точку М0 проведемо пряму, яка проходить вздовж вектора . За додатній напрямок візьмемо напрям вектора . На цій прямій виберемо точку М, відмінну від М0.
Означення 5.1. Орієнтовною довжиною відрізка М0М з початком в точці М0 і кінцем в точці М, називається число, яке дорівнює довжині цього відрізка, коли напрям вектора співпадає з напрямом , або число, яке дорівнює довжині цього відрізка взятій із знаком мінус, коли напрямки векторів і - протилежні.
Нехай функція U=f(x, y, z) - визначена в деякому околі точки М0(х0,у0,z0), точка М, відмінна від М0, яка лежить на вище згаданій прямій і належить даному околу.
Означення 5.2. Якщо існує границя , то її називають похідною функції f(x,y,z) в точці М0 за напрямком вектора і позначають: , .
Таким чином , , є похідними за напрямками, які визначаються відповідно додатніми напрямками осей ОХ, ОУ, ОZ.
Теорема 5.1. Якщо функція f(x,y,z) диференційовна в точці М0(x0,y0,z0), то в цій точці вона має похідну за будь-яким напрямком і при цьому виконується рівність:
. (5.1)
Доведення. Нахай маємо точку М0 і через неї проведена пряма, яка проходить через вектор . На прямій взято точку , . Так, як функція диференційовна в точці М0, то
,
де 1, 2, 3 прямують до нуля, коли х0, у0, z0. Оскільки х=М0Мcos, у=М0Мcos, z=М0Мcos, то
. (5.2).
Оскільки, якщо ММ0, то х, у, z,0, а значить і 1, 2, 3 прямують до нуля. Таким чином права частина рівності (5.2) ( а отже і ліва), має границю, коли ММ0, що дорівнює
.
Це означає, що похідна за напрямком існує і виконується рівність (5.1).
Теорему доведено.
Нехай функція U=f(x,y,z) диференційовна в точці М0(х0,у0,z0). Тоді за теоремою 5.1, в цій точці існує похідна функції за будь-яким напрямком. Часто виникає питання: за яким напрямком ця похідна буде найбільша?
Розглянемо два вектори: одиничний вектор , який визначає напрямок, і , який називається градієнтом функції f(x,y,z) в точці М0(x0,y0,z0), тут - орти. Скалярний добуток (,gradf(x0,y0,z0)) цих векторів, дорівнює:
.
Порівнявши з формулою (5.1) ми бачимо
(5.3).
З іншого боку
(5.4),
де - кут між цими векторами. Так, як , то з формул (5.3), (5.4), одержимо:
(5.5).
Права частина (а значить і ліва), якщо f(x0,y0,z0)0, набуває найбільшого значення при =0. Таким чином, якщо , , одночасно не дорівнюють нулю, то найбільшого значення похідна за напрямком набуває в напрямі градієнта даної функції. Похідна в цьому напрямі дорівнює:
.
Врахувавши, що дорівнює швидкості зміни функції в напрямі, який визначається вектором , то можна сказати, що якщо градієнт функції в точці М0 не дорівнює нулю, то він напрямлений в бік найбільшого зростання функції.
Розділ 3. Частинні похідні і диференціали вищих порядків
§ 1. Частинні похідні вищих порядків
Нехай функція U=f(x1,…,xn) визначена в області D і в кожній точці існує частинна похідна по змінній хі. Тоді ця частинна похідна є функцією змінних х1,...,хп, яка визначена в цій області. Може трапитись, що ця функція в точці має частинну похідну по змінній хк. Тоді цю частинну похідну називають частинною похідною другого порядку або другою частинною похідною функції U=f(x1,…,xn) в точці М0 спочатку по змінній хi, а потім по змінній хк і позначають так: . При цьому, якщо іk, то частинну похідну називають змішаною частинною похідною.
Аналогічно вводяться частинні похідні третього, четвертого і т. д. порядків.
Нехай в області D існує частинна похідна (m=1) порядку по змінних і ця частинна похідна в точці М0(х1(0),...,хп(0)) має частинну похідну по змінній . Тоді цю частинну похідну називають частинною похідною m-го порядку або m-тою частинною похідною функції U=f(x1,…,xn)в точці М0 по змінних . Співвідношення, яке визначає цю частинну похідну записують так: .
Якщо не всі індекси і1, і2,...,іт співпадають між собою, то частинна похідна називається змішаною.
Розглянемо приклад. Знайти частинні похідні другого порядку функції . Отримаємо
; ; ; ; ; .
§ 2. Достатні умови незалежності змішаних частинних похідних від порядку диференціювання
В вище наведеному прикладі змішані похідні ; функції були рівні. Наступний приклад показує, що це не завжди так.
Нехай .
Тоді ;
Розглянемо достатні умови незалежності змішаних частинних похідних від порядку диференціювання.
Означення 2.1. Функція U=f(x1,…,xn), називається т раз диференційовною в точці М0(х1(0),...,хп(0)) , якщо всі частинні похідні (т-1)-го порядку є функціями диференційовними в цій точці .
Теорема 2.1. Для того, щоб функція U=f(x1,…,xn) була т раз диференційовною в точці М0(х1(0),...,хп(0)) достатньо, щоб її частинні похідні т-го порядку були визначені в деякому околі точки М0 і були неперервними функціями в цій точці.
Справедливість цього твердження слідує з теореми про достатню умову диференційовності функції.
Теорема 2.2. (про рівність змішаних похідних другого порядку). Якщо функція U=f(x,у) двічі диференційовна в точці М0(х0, у0), то
.
Доведення. Так як функція U=f(x;y) двічі диференційовна в точці М0, то частинні похідні f /x(x;y) і f /y(x;y) визначені в деякому околі точки М0.
Розглянемо вираз
=f(x0+h, y0+h)-f(x0+h, y0)-f(x0, y0+h)+f(x0;y0), (2.1),
де h - довільне число, таке, що точка М0(х0+h, y0+h) міститься у вище вказаному околі. Переписавши у вигляді
=(f(x0+h, y0+h))-f(x0+h, y0))-(f(x0, y0+h)-f(x0;y0)),
помічаємо, що це є приростом функції (х)=f(x, y0+h)-f(x, y0) в точці х0. Тобто
=(х0)=(х0+h)-(х0) (2.2).
Оскільки функція (х) на х0, х0+h задовільняє умові теореми Лагранжа, то
=(х0+1,h)h=(fx(x0+1h,y0+h)-fx(x0+1h,y0))h=(fx(x0+1h,y0+h)-fx(x0,y0)-(fx(x0+1h,y0)-fx(x0,y0)))h (2.3).
де 0<1<1. Так, як fx(x,y)- диференційовна в точці М0, то
fx(x0+1h,y0+h)-fx(x0,y0)=fxx(x0,y0) 1h+fxy(x0,y0)h+1(h) 1h+2(h)h, (2.4).
fx(x0+1h,y0)-fx(x0,y0)=fxx(x0,y0) h+3(h) 1h, (2.5)
при цьому 1(h), 2(h),3(h) прямують до нуля, коли h0.
Підставивши (2.4) і (2.5) в (2.3), одержимо:
=((fxx(x0,y0)1h+fxy(x0,y0)h+1(h)1h+2(h)h)-((fxx(x0,y0)1h+3(h) 1h))h=(fxy(x0,y0)+1(h) 1+2(h)-3(h) 1)h2=(fxy(x0,y0)+1(h))h2 , (2.6),
де 1(h)=1(h)1+2(h)+3(h)1.
Переписавши у наступному вигляді
=(f(x0+h,y0+h)-f(x0,y0+h))-(f(x0,y0+h)-f(x0,y0)),
бачимо, що є приростом функції (y)=f(x0+h,y)-f(x0,y) в точці у0. Застосувавши теорему Лагранжа і врахувавши диференційовність fy(x,y) в точці М0, ми отримаємо наступне представлення для ,
=(fyx(x0,y0)+2(h))h2 (2.7),
при цьому 2()0, коли h0.
Прирівнявши праві частини рівностей (2.6) і (2.7) і скоротивши на h2, отримаємо:
fxy(x0,y0)+1(h)=fyx(x0,y0)+2(h) (2.8).
Перейшовши до границі, коли h0, отримаємо:fxy(x0,y0)=fyx(x0,y0). Теорема доведена.
Наступна теорема теж дає достатні умови рівності змішаних похідних другого порядку.
Теорема 2.3. Нехай в деякому околі точки М0(х0,у0) функція U=f(x,y) має частинні похідні fx, fy, fxy, fyx. Якщо fxy і fyx неперервні в М0, то fxy(x0,y0)=fyx(x0,y0).
Доведення. Розглянемо =f(x0+h, y0+h)-f(x0+h, y0)-f(x0, y0+h)+f(x0;y0). Замітимо, що =(х0), де (х)=f(x, y0+h)-f(x, y0). Застосувавши теорему Лагранжа до (х), отримаємо:
=(fx(x0+1h,y0+h)-fx(x0+1h,y0)), де 0<1<1.
Застосувавши теорему Лагранжа до функції t(y)=fx(x0+1h,y) на відрізку у0,у0+h, одержимо
=fxy(x0+1h,y0+2h)h2, 0<2<1.
Внаслідок неперервності fxy(x,y) в точці (х0,у0), маємо
=(fxy(x0,y0)+1(h))h2 (2.9),
де 1(h)0, коли h0. Представивши у вигляді =(у), де (у)=f(x0+h,y)-
-f(x0,y), аналогічно одержуємо
=(fyx(x0;y0)+2(h))h2 (2.10),
де 2(h)0, коли h0. Прирівнявши праві частини рівностей (2.9) і (2.10), скоротивши на h2 і перейшовши до границі, коли h прямує до нуля, отримаємо fxy(x0;y0)=fyx(x0;y0).
Теорема 2.4. Якщо U=f(x0;…;xn) m разів диференційовна в точці М0, то змішана частинна похідна, в цій точці, не залежить від порядку повторного диференціювання.
Доведення. Очевидно, достатньо довести незалежність значень давільної т-тої змішаної похідної від порядку проведення двох послідовних диференціювань. Тобто достатньо довести рівність:
(2.11).
Розглянемо функцію . Ця функція є диференційовною функцією від змінних, тому внаслідок теореми 2.2. маємо:
.
Звідси і слідує рівність (2.11). Теорему доведено.
§ 3. Диференціали вищих порядків
Нехай маємо функцію U=f(x1,…,xn), яка диференційовна в деякій області D. Тоді в кожній точці цієї області існує диференціал , який є функцією від змінних х1,...хп.
Припустимо, що в точці М0(х1(0),...,хп(0)) наша функція двічі диференційовна. Тоді диференціал від диференціала 1-го порядку, називається другим диференціалом або диференціалом 2-го порядку і позначається d2U=d(dU).
Нехай х1,...хп- незалежні аргументи, тоді
.
Врахувавши, що змішана частинна похідна не залежить від порядку диференціювання, одержимо:
Введемо символ . Тоді dU можна записати у вигляді
;
.
Аналогічно під диференціалом 3-го порядку будемо розуміти d(d2U). Якщо хі незалежні аргументи, то міркуючи аналогічно можна одержати, що
.
Аналогічно вводиться диференціал k-го порядку функції U і символічна форма його буде такою:
.
При цьому піднесення символа до степеня k виконується аналогічно, як піднесення многочлена до цього степеня.
Коли ми розглядали диференціал 1-го порядку, то його форма не залежала від того чи хі незалежні змінні, чи є функціями від інших змінних.
Подивимось, чи зберігається форма диференціала, для вищих порядків. Для простоти, розглянемо функцію 2-х змінних.
Нехай U=f(x;y) і при цьому х і у є функціями від інших змінних. Тоді d2U=d(dU)=d(fxdx+fydy)=d(fxdx)+d(fydy)=dxd(fx)+fxd(dx)+dyd(fy)+fyd(dy)=
.
Як бачимо, тут появилося два доданки, яких не було в диференціалі 2-го порядку, коли х і у незалежні змінні. Отже, диференціал 2-го, а значить і вищих порядків, не має властивості інваріантності форми, якою володіє диференціал 1-го порядку.
Проте, легко бачити, що якщо хі лінійно залежать від змінних t1,…,tk, то диференціали d2x1=d2x2=…=d2xn=0 і при цьому форма диференціала зберігається. В цьому випадку можна записати:
.
§ 4. Формула Тейлора для функцій багатьох змінних
Як відомо, для функції U=F(t) (п+1) раз диференційовної в околі точки t0, має місце рівність:
,
де 0<<1.
Запишемо дещо по-іншому цю формулу. Нехай t-t0=t, тоді:
F(t)-F(t0)=F(t0)
(4.1)
Дивлячись на цей вигляд формули Тейлора, неважко догадатись, що її можна перенести і на функції багатьох змінних.
Теорема 4.1(Формула Тейлора для функції багатьох змінних)
Нехай функція U=F(x1;x2;…;xk) (n+1) раз диференційовна в деякому околі точки М0(х1(0),....,хк(0)), тоді справедлива рівність:
, (4.1)
де і точка N(х1,...,хк) належить заданому околу. В диференціалах, які стоять справа, dxi=xi=xi-xi(0), останній доданок цієї формули, називається залишковим членом формули Тейлора у формі Лагранжа.
Доведення. Для простоти викладу доведемо цю формулу для функції двох змінних.
Нехай функція U=F(x1;x2), яка (п+1) разів диференційовна в околі точки М0(х1(0);x2(0)).
Візьмемо точку М1(х1(0)+х1;x2(0)+x2). Проведемо через точки М0 і М1 пряму, рівняння якої буде:
;
Звідки ; .
При цьому, якщо t0;1, то М(х1;x2) пробіжить відрізок М0М1.
Розглядатимемо функцію U=F(x1;x2) лише в точках відрізка М0М1. На цьому відрізку ця функція є функцією однієї змінної t: U=F(x1(0)+tx1;x2(0)+tx2)=f(t). З того, що х1, і х2 є лінійними функціями від t і задана функція (п+1) разів диференційовна в околі точки М0 слідує, що ця складна функція по t є (п+1) раз диференційовною в околі точки t0=0. Тоді з формули (4.1), одержуємо:
(4.2).
Замітимо, що в нашому випадку
f(0)=F(x1(0)+x1;x2(0)+x2)-F(x1(0);x2(0))=f(1)-f(0)=
Оскільки, як ми встановили вище, диференціали вищих порядків мають властивість інваріантності форми, якщо змінні лінійно залежать від інших аргументів, (від t), то всі інші доданки формули (4.2) матимуть вигляд
; k=1,2,…n
,
де NМ0;M1. Врахувавши це все, і, підставивши у формулу (4.2), ми одержимо формулу Тейлора, де в точці N, буде деяка точка на М0;М1. Теорему доведено.
Дана формула Тейлора дозволить нам в наступних параграфах вирішувати проблеми екстремумів функцій багатьох змінних.
Розділ 4. Неявні функції
§ 1. Існування неявної функції однієї змінної
Розглнемо криву х2+у2=1, це є коло.
Зрозуміло, що якщо точка М0 належить колу і не належить його горизонтальному діаметру, то завжди можна знайти окіл точки такий, що в ньому дане рівняння задає єдину функцію у від х, що визначена на проекції цієї дуги на вісь ОХ, тобто х, що належить проекції у(х):х2+у(х)2=1. Будемо казати, що рівняння х2+у2=1 задає неявну функцію у від х.
Нехай функція F(x;y) визначена на множині ЕR2 і Х - проекція цієї множини на вісь ОХ.
Будемо говорити, що рівняння F(x;y)=0, задає у, як функцію від х, у=f(х) на множині Х, якщо хХ існує пара (х;f(x))Е, яка задовільняє рівняння F(x;y)=0, тобто F(x;f(x))=0 є тотожністю на множині Х.
В нашому прикладі
, .
Ми бачимо, що в околі точки М0 це рівняння задаває єдину функцію у(х), щоб знайти її явне вираження, ми розв'язали наше рівняння відносно у. Та це вдасться зробити не завжди. Одже виникає така задача: як маючи певні властивості функції F, прогнозувати існування цієї неявно заданої функції, а також, які властивості повинна мати F, щоб ця неявно задана функція була, наприклад, неперервною чи диференційовною.
Зауважимо, що навіть на нашому простому прикладі видно, що якщо ми візьмемо т. М0(1,0), то такої єдиної визначеної функції, як вище вже не буде. Якщо ми спроектуємо будь-який окіл цієї точки М0 на ОХ, то помітимо, що на інтервалі, що належить проекції цього околу, рівняння кола задає безліч функцій у(х).
Теорема 1.1. Нехай:
1) функція F(x;y) неперервна разом із своїми частинними похідними Fx і Fy в деякому уколі т. М0(х0,у0);
2) Fy в точці (x0;y0) не дорівнює нулю;
3) F(x0;y0)=0.
Тоді в деякому прямокутнику П={(x;y) x0-1<x<x0+1, y0-2<y<y0+2}, рівняння F(x;y)=0 задаватиме єдину функцію у=f(x), яка задовільняє наступним умовам:
1) ця функція буде неперервною на інтервалі (х0-1;x0+1);
2) на цьому інтервалі існує f(x), яка буде неперервною.
Доведення. Нехай . З умов 1,2 теореми випливає, що деякий окіл т. М0, такий, що для всіх точок М, з цього околу, F(x;y) буде диференційовною і Fy(x;y)>0
Впишемо в цей окіл замкнений прямокутник з центром в точці М0 , сторони якого паралельні до координатних осей. Проведемо через т.М0 відрізок в прямокутнику паралельний до ОУ, розглянемо функцію Fy(x;y). В точках відрізка АВ вона матиме вигляд Fy(x0;y) (вона є похідною від функції F(x0;y) по змінній у). Оскільки Fy(x0;y)>0 і y0-2yy0+2, то функція F(x0;y) є монотонно зростаючою на сегменті [y0-2; y0+2].Звідси і з того, що F(x0, y0)=0 одержуємо, що F(x0, y0-2)<0, F(x0;y0+)>0 тобто, інакше кажучи, F(A)<0, F(B)>0. Так, як функція F(x,y) є неперервна в точці А і в точці В (тому що обидві ці точки належать околу де вона є неперервною), то існують окіл точки А і окіл точки В такі, що в межах першого F(x;y)<0, а другого F(x;y)>0. Не зменшуючи загальності, можна вважати, що радіуси цих околів рівні. Якщо радіус цього околу 1 , то із вище сказаного слідує, що для будь-якого х, який належить (х0-1, х0+1), F(x,y0-2)<0, a F(x,y0+2)>0.
Візьмемо будь-яке х, яке належить (х0-1;х0+1) і проведемо через це х пряму, перпендикулярну до ОХ. Оскільки точка А лежить на відрізку А1А2, а в кожній точці цього відрізка F(x;y)<0, то F(A)<0. Аналогічно F(B)>0.
Розглянемо функцію F(x;y) на відрізку АВ. На цьому відрізку вона є функцією однієї змінної у (бо тут х зафіксоване). При цьому вона буде неперервною на [y0-2;y0+2] і строго зростаючою. Оскільки в лівому кінці інтервала вона приймає від'ємне значення, а в правому - додатнє, то із всього сказаного вище випливає (за теоремою Больцано-Коші), існування єдиного у із інтервала (y0-2;y0+2) такого, що F(x;y)=0.
Таким чином ми встановили, що на інтервалі (х0-1,х0+1) існує єдина функція y=f(x) така, що F(x,f(x))=0 на цьому інтервалі.
Покажемо, що функция f(x) неперервна на інтервалі (х0-1,х0+1). Нехай х(х0-1,х0+1). Дамо х приріст х. Тоді функція одержить приріст y.
Точки (x;y) і (х+х;y+y), де y=f(x), y+y=f(x+y) задовільняють рівнянню F(x;y)=0. Таким чином
F(x;y)=F(х+х;y+y)-F(x;y)=0.
Використовуючи теорему Лагранжа, одержимо:
0=F(х+х;y+y)-F(x;y)=(F(х+х;y+y)-F(x;y+y))+(F(x;y+y)-F(x;y))=
=Fx(x+x;y+y)x+Fy(x;y+1y)y,
де 0<<1, 0<1<1. Так, як Fy?0, то
(1.1).
Оскільки Fx і Fy неперервні у замкнутому прямокутнику і Fy >0, то існують М>0 і т>0 такі, що Fx ?M і Fy>m.
Таким чином . Звідси маємо . Якщо х0, то y0, а це і означає, що f(x) неперервна в точці х.
Покажемо, що існує похідна f(x) для будь-якого х(х0-1,х0+1). Нехай х(х0-1,х0+1). Надамо х приріст х. Тоді функция одержить приріст у. Якщо х0 то і у0. При цьому , де 0<<1, 0<1<1. Враховуючи, що Fx і Fу неперервні і Fу?0, перейшовши до границі, коли х0, одержимо:
.
А це і означає, що похідна в точці х існує і
.
Крім цього, як випливає з останньої формули,є неперервна на інтервалі (х0-;x0+) тому, що чисельник і знаменник останньої рівності є композиція неперервних функцій і і у=f(x). Теорему доведено.
§ 2. Існування неявної функції багатьох змінних
У цьому параграфі ми розглянемо узагальнення вище доведеної теореми для випадку функції двох змінних.
Теорема 2.1 Нехай М0(х0,у0,z0)R3 і F(x,y,z) такі, що
1) F(x0,y0,z0)=0;
2) в деякому околі точки М0, функція F(x,y,z) і Fx; Fy;Fz неперервні;
3) Fz(x0,y0,z0)0.
Тоді в деякому паралелепіпеді П={x,y,z: x0-1<x<x0+1, y0-2<y<y0-2,
z0-3<z<z0+3} рівняння F(x,y,z) визначатиме єдину функцію z=F(x,y), яка буде визначена в прямокутнику П1={(х,у): x0-1<x<x0+1, y0-2<y<y0-2}, яка буде неперервно диференційовною в цьому прямокутнику.
Частинні похідні будуть обчислюватися за формулами:
;
Аналогічна теорема має місце для випадку функції від більше ніж 3-х змінних.
§ 3. Існування неявної функції, яка задається системою рівнянь
Іноді буває, що неявні функції задаються системою рівнянь. При цьому має місце така теорема.
Теорема 3.1 Нехай маємо таку систему:
(3.1)
і- точка, координати якої задовільняють кожному рівнянню системи (3.1).
Тоді, якщо:
1) в деякому околі точки М0, існують всі часткові похідні першого порядку функцій F1,…,Fm,при чому частинні похідні , де ; , будуть неперервні в точці М0;
2) величина, яка називається якобіяном і позначається
відмінна від нуля в точці М0, то існують додатні числа 1>0, 2>0,…,m>0 та окіл точки такий, що в ньому існує єдиний набір функцій:
U1=1(x1,…,xn)
U2=2(x1,…,xn)
………………..
Um=2(x1,…,xn),
які є розв'язками системи (3.1). В межах цього околу матимуть місце нерівності:
Кожна з функцій і є неперервною в цьому околі точки М0 та диференційовною в ньому.
В зв'язку з цією теоремою виникає питання, а як же знайти частинні похідні від функцій і, які одержалися в попередній теоремі. Адже із формулювання зрозуміло, що теорема стверджує тільки існування тих функцій і не дає можливості їх явно задати. Отже, як знайти їх частинні похідні?
Для цього продиференціюємо кожне із рівнянь системи (3.1) по змінній х1. Зважаючи на те, що хі - незалежні змінні, а Ui - функції від х1...хп, матимемо:
……………………………………………
Ми одержимо систему m лінійних рівнянь відносно т невідомих . Головний визначник цієї системи це є якобіян, взятий в точці М0, який за умовою теореми не дорівнює нулю.
Розв'язавши цю систему, ми знайдемо
Для того, щоб знайти частинні похідні по інших змінних зробимо те саме.
Розділ 5. Екстремуми функцій
§ 1. Поняття екстремума функцій багатьох змінних
Нехай функція U=f(x1,x2,…,xn) задана на множині ЕRп.
Означення 1.1 Будемо говорити, що в точці функція має максимум, якщо існує окіл цієї точки такий, що для будь-яких точок М із цього околу, які належать множині Е, виконується нерівність: f(M)?f(M0).
Означення 1.2 Будемо говорити, що в точці функція має мінімум, якщо існує окіл цієї точки такий, що для будь-яких точок М із цього околу, які належать множині Е, виконується нерівність: f(M)?f(M0).
Як і в одномірному випадку точки максимуму та мінімуму функції називають точками екстремуму.
Теорема 1.1. (Необхідні умови існування екстремуму).
Нехай функція U=f(x1,…xn), яка задана в області D, має в точці екстремум. Якщо в цій точці існують всі її частинні похідні 1-го порядку, то всі вони дорівнюють нулю: .
Доведення. Нехай дана функція в даній точці має максимум. Тоді функція , як функція від однієї змінної по х1має в точці х01 теж максимум, причому похідна в цій точці дорівнює частинній похідній . Оскільки функція має похідну в цій точці і ця точка є для неї точкою максимуму, то за відомою теоремою з одномірного аналізу її похідна, а отже і , аналогічно і з всіма іншими частинними похідними.
Аналогічно доводиться теорема, коли функція має мінімум.
Теорему доведено.
Означення 1.3 Точку М0, в якій всі частинні похідні функцій , або не існують, називають критичною точкою цієї функції.
Точки в яких всі частинні похідні 1-го порядку дорівнюють нулю, називають ще й стаціонарними.
Таким чином, щоб функція мала екстремум в даній точці необхідно, щоб ця точка була критичною. Наступний приклад показує, що це не є достатньою умовою.
Розглянемo функцію z=xy. Точка (0,0) тут є критичною, але в ній екстремуму немає. Бо який би ми окіл не взяли, в ньому існують точки в яких значення функції більші від значень функції в точці (0,0) та існують точки, в яких значення функції менші.
§ 2. Деякі відомості з теорії квадратичних форм
В цьому параграфі ми розглянемо деякі питання теорії квадратичних форм, які нам будуть потрібні надалі.
Означення 2.1 Функція
, аіk=аkі=сonst, (2.1),
яка залежить від змінних h1, h2,…, hn, називається квадратичною формою від вказаних змінних.
Означення 2.2 Квадратична форма називається додатньо визначеною (від'ємно визначеною), якщо при будь-яких значеннях h1, h2,…, hn, одночасно не рівних нулю, вона набуває додатніх (від'ємних) значень.
Додатньо визначені та від'ємно визначені форми називаються знаковизначеними.
Означення 2.3 Квадратична форма називається знакозмінною, якщо вона приймає як додатні так і від'ємні значення.
Означення 2.4 Квадратична форма називається квазізнаковизначеною, якщо вона приймає лише недодатні або лише невід'ємні значення, але при цьому вона дорівнює нулю при деяких h1, h2,…, hn, які одночасно не дорівнюють нулю.
Сформулюємо критерій Сільвестера знаковизначеності квадратичних форм.
Симетричну матрицю будемо називати матрицею квадратичної форми (2.1). Визначники А1=а11, ,..., називаються головними мінорами матриці А квадратичної форми.
Теорема 2.1 Для того, щоб квадратична форма (2.1) була додатньо визначеною необхідно і достатньо, щоб виконувалися нерівності:
А1>0, A2>0,…, An>0 (2.2).
Для того, щоб квадратична форма була від'ємно визначеною необхідно і достатньо, щоб знаки головних мінорів А1, А2,..., Ап чергувалися, причому А1>0.
Очевидно диференціал другого порядку функції U=f(x1, x2,…,xn) в точці М0(х(0)1,...,х(0)п) є квадратичною формою змінних х1, х2,...,хп.
Для формулювання достатніх умов існування екстремуму функції багатьох змінних використовуються квадратичні форми.
§ 3. Достатні умови існування екстремуму
Розглянемо достатні умови існування екстремуму.
Теорема 3.1 Нехай функція U=f(x1, x2,…, xn) має в деякому околі стаціонарної точки М0 частинні похідні до 2-го порядку включно, причому вони неперервні в точці М0. Тоді, якщо в точці М0 диференціал 2-го порядку цієї функції є знаковизначеною квадратичною формою, то в цій точці функція має екстремум: максимум, якщо ця форма від'ємно визначена та мінімум, якщо-додатньо визначена. Якщо диференціал 2-го порядку в цій точці є знакозмінною квадратичною формою, то екстремуму в точці М0 немає.
Доведення. З умови теореми маємо, що наша функція двічі диференційовна в деякому околі точки М0. Тому для будь-якої точки М з цього околу за формулою Тейлора матимемо, що
,
при цьому , N - проміжна точка з координатами N=(x(0)1+1x1; x(0)2+2x2,…, x(0)n+nxn), де 0<1<1,…,0<n<1.
,
де , коли (х1,...,хп)(0,...,0).
Нехай тоді
.
Розглянемо поведінку множника в другому доданку при 2:
коли (х1,...,хп)(0,...0).
Таким чином , де ()0, коли 0.
Отже ми тільки що довели, що для будь-якої точки М справедлива рівність:
(3.1).
Перетворимо перший доданок останньої рівності:
=,
де , hi1 і h12+…+hn2=1.
Звідси і з (3.1) будемо мати:
(3.2).
Нехай диференціал 2-го порядку в точці М0 є додатньо визначеною квадратичною формою. Оскільки диференціал 2-го порядку в точці М0 дорівнює добутку першого доданка справа в (3.2) без множника , то цей доданок теж є додатньо визначеною квадратичною формою заданою на одиничній сфері простору Rn. Оскільки ця квадратична форма є функцією неперервною на цій точці, а сфера Rn є компактом (бо вона замкнена і обмежена) то за теоремою Вейєрштрасса на цій сфері знайдеться точка (h1(0),…,hn(0)) в якій ця квадратична форма приймає найменше значення . Оскільки форма додатньо визначена, то 0. Отже перший доданок справа в (3.2) завжди більший або рівний /2. Оскільки ()0 коли 0 то знайдеться 1>0: 1 матимемо: ()</4.
Візьмемо . Тоді будемо мати
.
Отже ми довели, що U(M)>U(M0) для будь-якої точки М з 1-околу точки М0, а це означає, що в точці М0 функція має мінімум (для максимуму доведення аналогічне).
Розглянемо доведення 2-ї частини теореми. Для цього зробимо кілька зауважень відносно квадратичної форми.
Якщо Ф(t1,…,tn) деяка знакозмінна квадратична форма, то можна підібрати дві точки h=(h1,…,hn), h=(h1,…,hn) такі, що hi1; hi1, ; h1 2+…+hn 2=1; h1 2+…+hn 2=1 і Ф(h)>0, Ф(h)<0. Дійсно, оскільки Ф знакозмінна квадратична форма, то знайдуться дві точки t=(t1,…,tn), t=(t1,..,tn): Ф(t)>0, Ф(t)<0. Покладемо
, ,
ми одержимо h і h такі, що задовольняють умови і ;.
Візьмемо довільне >0. Нехай h=(h1,…,hn) така точка на одиничній сфері, що . Візьмемо точку таку, що , а значить . Тоді
.
Оскільки ()0, коли 0, а перший доданок є додатнім і не залежить від , то можна підібрати настільки малим, що вираз в дужках зберігатиме знак першого доданка. Тобто ми в як завгодно малому околі точки М0, знайшли точку М, таку що U(M)-U(M0)>0. Провівши аналогічні дослідження для U(M)-U(M0), ми отримаємо, що в як завгодно малому околі точки М0 знайдеться точка М , значення функції в якій менше за значення в точці М0. Отже в точці М0 функція не має екстремуму. Теорему доведено.
Часто виникає потреба дослідити на екстремум функцію двох змінних. Розглянемо цей випадок.
Теорема 3.2 (Достатні умови існування екстремуму для функції 2-х змінних). Нехай функція U=f(x;y) має частинні похідні другого порядку в деякому околі стаціонарної точки М0, які неперервні в цій точці. Нехай а11=fxx(M0); а22=fyy(M0); а12=fxy(M0) і (М0)=а11а22-а122. Якщо (М0)>0, то в точці М0 функція U має екстремум, а саме мінімум, коли а11>0 і максимум, коли а11<0. Якщо (М0)<0 то екстремуму в точці М0 дана функція немає.
Доведення. Перша частина теореми слідує з теореми 3.1 і критерію Сільвестера знаковизначеності квадратичної форми, бо А1=а11, А2=а11а22-а122. Тому, якщо М0>0, то d2U є знаковизначеною квадратичною формою, а саме, якщо а11>0 додатньо визначеною і при а11<0 - від'ємно визначеною. А значить, якщо а11>0 функція має мінімум, а при а11<0 - максимум.
Розглянемо випадок коли (М0)<0. На основі доведеного в теоремі 3.1, квадратичну форму диференціала в точці М0 можна записати у вигляді: Ф=(a11h12+2a12h1h2+a22h22), де h12+h22=1. Покажемо, що в цьому випадку квадратична форма 2-го диференціала в точці М0 є знакозмінною. Для цього достатньо знайти дві точки h=(h1,h2), h=(h1,h2) на одиничному колі такі, що в одній із них форма Ф буде додатньою, а в іншій - від'ємною величиною.
Нехай а110, тоді
Ф(h1h2)=1/a11(a112h12+2a11a12h1h2+a122h22+a11a22h22 -a122h22)=
=1/a11((a11h1+a12h2)2+(а11а22-а122)h22)
Якщо h1=1; h2=0,то вираз в дужках додатній. Якщо візьмемо і , то одержимо точку, яка лежить на одиничному колі і для якої вираз в дужках є від'ємним. Отже наш диференціал 2-го порядку є знакозмінною квадратичною формою, коли а110.
У випадку, коли а11=0, Ф(h1,h2)=(2a12h1h2+a22h22)=(2a12h1+a22h2)h2. Підберемо h1; h2 так, щоб 2а12h1>a22h2, h12+h22=1. Тоді величини 2а12h1+a22h2 і 2a12h1+a22(-h2) матимуть один і той самий знак, а значить (2a12h1+a22h2)h2 і (2a12h1+a22(-h2))(-h2) матимуть різні знаки. Це означає, що квадратична форма не є знаковизначеною. На основі попередньої теореми екстремуму в точці М0 немає. Теорему доведено.
§ 4. Умовний екстремум
Часто в математиці зустрічаються задачі пов'язані з відшуканням екстремуму функції, аргументи якої задовольняють додатковим умовам зв'язку. Екстремуми такого типу називаються умовними.
Розглянемо приклад. Знайти екстремуми функції U=x2+y2 при умові, що х і у задовільняють умові зв'язку х+у-1=0. Таким чином ми шукаємо екстремум функції не на всій площині, а лише на прямій х+у-1=0. Для розв'язання цієї задачі в рівняння функції U=x2+y2 підставляємо значення y=-x+1, знайдене з рівняння зв'язку. Цим самим ми звели поставлену перед нами задачу до задачі про відшукання звичайного екстремуму функції U=2x2-2x+1. Оскільки похідна U=4x-2 дорівнює нулю при х=1/2 і U(1/2)=4>0, то при х=1/2 дана функція має мінімум, який дорівнює 1/2. Таким чином функція U=x2+y2 при умові зв'язку х+у-1=0 має умовний мінімум U=1/2 в точці (1/2; 1/2). Слід відмітити, що мінімум функції досягається в точці (0,0) і дорівнює 0.
Перейдемо до загальної задачі про відшукання умовного екстремуму. Нехай треба знайти екстремум функції т+п змінних.
U=f(y1,y2,…,ym,x1 x2,…,xn) (4.1)
При наявності т-умов зв'язку
(4.2)
Означення 4.1 Будемо говорити, що в точці М0(у1(0),...,ут(0),х1(0),...,хп(0)) координати якої задовольняють умовам зв'язку (4.2), функція (4.1) при наявності зв'язків (4.2) має умовний максимум (мінімум), якщо існує окіл цієї точки такий, що для всіх точок М з даного околу, координати яких задовольняють рівнянням зв'язку (4.2), виконується нерівність: f(M)f(M0) (f(M)f(M0)).
Для знаходження умовного екстремуму функції (4.1) при наявності зв'язків (4.2) припустимо, що функції, які стоять в лівих частинах рівностей (4.2) диференційовані в деякому околі точки М0, при цьому частинні похідні цих функцій по змінних у1,...,ут неперервні в цій точці і якобіан
(4.3)
не дорівнює нулю. В цьому випадку внаслідок теореми (3.1) (розділу 4 цієї частини) існують додатні числа 1,...,т і окіл точки М0(х1(0),...хп(0)) такий, що в цьому околі визначені т функцій
(4.4),
які задовільняють умови у1-у1(0)<1,...,ут-ут(0)<m і які є єдиним диференційованим розв'язком системи (4.2).
Підставивши знайдені функції (4.3) в (4.1) ми зводимо нашу задачу про існування умовного екстремуму до задачі про існування звичайного екстремуму функції.
U=f(1(x1,…,xn),…,m(x1,…,xn), x1,…,xn,)=Ф(х1,...,хп) (4.5).
Розглянемо, як не знаходячи розв'язків системи (4.2) можна встановити необхідні умови існування умовного екстремуму в точці М0. Нехай функція диференційовна в точці М0 і має умовний екстремум при наявності зв'язків (4.2) або те саме, що функція (4.5) має звичайний екстремум в точці М0. Звідси слідує, що , а значить
(4.6)
при довільних дх1,...,дхп. На основі інваріантності форми диференціала формулу (4.6) можна записати можна записати наступним чином:
(4.7)
(при цьому частинні похідні беруться в точці М0). Зазначимо, що dy1,dy2,…,dym є диференціалами функцій (4.4) і тому рівність (4.7) не є тотожністю відносно цих диференціалів. Якщо в рівняння зв'язку (4.2) замість у1,...ут підставити функції (4.4) то одержимо тотожності. Диференціюючи їх одержимо
(4.8).
Так, як якобіан (4.3) не дорівнює нулю в точці М0, то з цієї системи можна знайти dy1,…,dym. Вони є лінійними функціями відносно dx1,…,dxn, якщо знайти ці вирази і підставити в (4.7), то одержимо:
А1dx1+…+Andxn=0, (4.9)
де А1,...,Ап виражаються через частинні похідні f, F1,…,Fm в точці М0. Так, як в (4.9) фігурують тільки диференціали незалежних змінних, то А1=А2=...=Ап=0. Приєднуючи до цих рівностей т умов зв'язку (4.2), одержимо необхідну умову існування умовного екстремуму, яку записують у такому вигляді:
А1=0,...,Ап=0, F1=0,…,Fm=0 (4.10),
що являє систему т+п рівнянь з т+п невідомими.
При знаходженні точки можливого умовного екстремуму методом, який ми розглянули, часто виникають труднощі, зв'язані з тим, що частина змінних х1,...,хп розглядаються нами, як незалежні, а інші - як функції від цих змінних. Лагранж запропонував метод, який спрощує цю незручність. Розглянемо функцію:
(у1,...,ут,х1,...,хп)=f(у1,...,ут,х1,...,хп)+1F1(у1,...,ут,х1,...,хп)+…
…+mFm (у1,...,ут,х1,...,хп ) (4.11),
де 1,...,т- довільні сталі. Цю функцію називають функцією Лагранжа. Легко бачити, що якщо рівність (4.8) помножити відповідно на 1,...,т і одержані рівності скласти почленно з рівнянням (4.7), то одержаний результат можна записати у вигляді:
(4.12).
Так, як при наявності зв'язків (4.2) F(M)-F(M0)=(M)-(M0) екстремуми функцій (4.3) і (4.11) співпадають. Підберемо 1,...,т так, щоб
(4.13).
Це можна зробити бо ці рівності приводять до лінійної системи рівнянь відносно 1,...,т
визначник якої рівний якобіяну (4.3), відмінний від нуля. При таких 1,...,т рівність (4.12) матиме вигляд
(4.14).
Оскільки х1,...,хп - незалежні змінні, то з (4.14) слідує, що
(4.15).
Приєднавши до рівнянь (4.13) і (4.15) умови зв'язку (4.2), ми одержимо систему п+2т рівнянь
(4.16)
для визначення п+т координат точки умовного екстремуму і множників 1,...,т.
Практично для реалізації цього методу поступають наступним чином: складають функцію Лагранжа і для неї знаходять точки можливого звичайного екстремуму. Для виключення 1,...,т застосовують умову зв'язку.
Розглянемо один із шляхів дослідження точок можливого умовного екстремуму. Припустимо, що в точці М0 виконуються необхідні умови умовного екстремуму (4.16). Крім цього, нехай в деякому її околі функції (4.1) і (4.2) - двічі диференційовані і всі частинні похідні другого порядку - неперервні в точці М0. Так, як при наявності зв'язків (4.2) екстремуми функцій U=f(y1,…,ym,x1,…,xn) і Лагранжа співпадають, то з результатів параграфу де розглядалися достатні умови існування екстремуму слідує, що якщо при наявності умов зв'язку (4.2) другий диференціал d2 в точці М0 є додатньо визначеною квадратичною формою, то в точці М0 функція має умовний мінімум, а якщо d2 є від'ємно визначеною квадратичною формою, то функція має умовний максимум.
Подобные документы
Поняття електронного підручника, його розробка, основні переваги та недоліки. Вивчення теоретичного курсу з теорії границь, диференціального та інтегрального числення функції однієї змінної. Застосування інтеграла Рімана, його означення та властивості.
дипломная работа [2,6 M], добавлен 12.02.2013Загальні дані та основні поняття мікропроцесорної техніки. Архітектура центрального персонального комп’ютера, її види та властивості. Головні відомості про технології SMM, SSE. Сторінковий режим роботи DRAM. Характеристика та елементи жорстких дисків.
контрольная работа [820,7 K], добавлен 04.10.2009Розвиток комп’ютерної техніки. Основи інформатики. Класифікація персональних комп’ютерів. Складові частини інформатики. Інформація, її види та властивості. Кодування інформації. Структурна схема комп’ютера. Системи числення. Позиційна система числення.
реферат [36,0 K], добавлен 27.10.2003Принцип роботи машини тюрінга - математичного поняття, введеного для формального уточнення інтуїтивного поняття алгоритму. Опис алгоритмів арифметичних дій в шістнадцятковій системі числення. Правила переведення чисел з однієї системи числення в іншу.
курсовая работа [1,4 M], добавлен 31.01.2014Арифметичні основи, на яких ґрунтується функціонування комп'ютерної техніки. Основні поняття дискретної обробки інформації. Системи числення, форми подання чисел у комп'ютерах. Арифметичні операції, що виконуються над числами, подані у двійковому коді.
учебное пособие [903,6 K], добавлен 18.12.2010Поняття комп'ютерної мережі як системи зв'язку між двома чи більше комп'ютерами через кабельне чи повітряне середовище. Середовище передачі у комп'ютерних мережах. Передумови інтенсивного розвитку мережних технологій. Мережні сервіси, класифікація мереж.
реферат [20,8 K], добавлен 13.11.2013Перевід цілого числа з десяткової системи числення в Р-ічную. Застосовування "трійкової логіки" у ЕОМ. Контроль числових перетворень за допомогою кодів Фібоначчі. Використання недвійкової комп'ютерної арифметики при розробці обчислювальної техніки.
контрольная работа [35,6 K], добавлен 28.11.2014Особливості архітектури комп'ютерних мереж. Апаратні та програмні засоби комп'ютерних мереж, їх класифікація та характеристика. Структура та основні складові комунікаційних технологій мереж. Концепції побудови та типи функціонування комп'ютерних мереж.
отчет по практике [1,2 M], добавлен 12.06.2015Визначення поняття і дослідження структури топології комп'ютерних мереж як способу організації фізичних зв'язків персональних комп'ютерів в мережі. Опис схеми топології типів шина, зірка і кільце. Багатозначність структур топології комп'ютерних мереж.
реферат [158,1 K], добавлен 27.09.2012Роль інформаційних систем і комп’ютерних технологій в удосконаленні управління. Особливості вхідної, вихідної та довідкової інформації. Основи організації машинної інформаційної бази. Інтелектуальні інформаційні системи в економіці. Поняття бази знань.
курс лекций [1,9 M], добавлен 16.04.2014