27
Проектировщик, прежде чем убедиться, что он получил наилучшую систему, должен иметь возможность исследовать все кандидатуры на эту роль”. Э. Хог, Я.Орора « Прикладное оптимальное проектирование», 1983 Лекція 1 Вступ На протязі усієї своєї історії людина прагнула до найкращого в усіх галузях своєї діяльності. Саме це є основою наукового, технічного, фізичного і духовного розвитку людства і тих вражаючих уяву досягнень в усіх областях знань, яку ми маємо на цей час. Пошук найкращого незмінна умова усякої творчості. До недавніх часів вібір найкращих варіантів відбувався простим порівнянням за субєктивними ознаками. Очевидно, цей спосіб не гарантував вибору найкращого, у кращому випадку кращого з тих які розглядалися. Пошук кращих зразків відбувається і у природі, хоча методи відбору більш жорсткі, навіть жорстокі (хоча і називаються природним відбором). У результаті довгої еволюції конструкції природи часто перевершують за своїми характеристиками штучні. Людство давно зрозуміло, що конкурувати з природою її засобами безперспективно і винайшло математичне моделювання. Математична модель це сукупність математичних обєктів і співвідношень між ними, які дозволяють імітувати поведінку обєкта, якого ще немає, але необхідні параметри відомі. Перехід від натурного до математичного порівняння поставив процес створення виробів (проектування) на наукову основу і став одним з найважливіших якісних переходів в історії людства і, зокрема, в історії техніки. При побудові математичних моделей необхідно забезпечити адекватність їх характеристик відповідним характеристикам реальної конструкції. Для цього важливо чітко визначити найбільш суттєві параметри, які визначають функціонування конструкції, критерії порівняння, обмеження на параметри, тобто область пошуку і, головне, розробити методи вибору кращого варіанту, так щоб вибір можна було доручити ЕОМ. Зазначимо, що без участі ЄОМ вирішити проблему вибору неможливо у звязку з великою кількістю кандидатів. Результатом розвитку і формалізації методів вибору найкращого виник термін «оптимальне проектування» і розділ прикладної математики «теорія оптимізації».

Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

“Проектировщик, прежде чем убедиться, что он получил наилучшую систему, должен иметь возможность исследовать все кандидатуры на эту роль”.

Э. Хог, Я.Орора « Прикладное оптимальное

проектирование», 1983

Лекція 1

Вступ

На протязі усієї своєї історії людина прагнула до найкращого в усіх галузях своєї діяльності. Саме це є основою наукового, технічного, фізичного і духовного розвитку людства і тих вражаючих уяву досягнень в усіх областях знань, яку ми маємо на цей час. Пошук найкращого –незмінна умова усякої творчості. До недавніх часів вібір найкращих варіантів відбувався простим порівнянням за суб’єктивними ознаками. Очевидно, цей спосіб не гарантував вибору найкращого, у кращому випадку кращого з тих які розглядалися. Пошук кращих зразків відбувається і у природі, хоча методи відбору більш жорсткі, навіть жорстокі (хоча і називаються природним відбором). У результаті довгої еволюції конструкції природи часто перевершують за своїми характеристиками штучні. Людство давно зрозуміло, що конкурувати з природою її засобами безперспективно і винайшло математичне моделювання. Математична модель – це сукупність математичних об’єктів і співвідношень між ними, які дозволяють імітувати поведінку об’єкта, якого ще немає, але необхідні параметри відомі. Перехід від натурного до математичного порівняння поставив процес створення виробів (проектування) на наукову основу і став одним з найважливіших якісних переходів в історії людства і, зокрема, в історії техніки. При побудові математичних моделей необхідно забезпечити адекватність їх

характеристик відповідним характеристикам реальної конструкції. Для цього важливо чітко визначити найбільш суттєві параметри, які визначають функціонування конструкції, критерії порівняння, обмеження на параметри, тобто область пошуку і, головне, розробити методи вибору кращого варіанту, так щоб вибір можна було доручити ЕОМ. Зазначимо, що без участі ЄОМ вирішити проблему вибору неможливо у зв’язку з великою кількістю кандидатів. Результатом розвитку і формалізації методів вибору найкращого виник термін «оптимальне проектування» і розділ прикладної математики – «теорія оптимізації».

Page 2: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Поняття «проектування» і «якнайкращий» можуть тлумачитися неоднозначно. Щоб уникнути можливих непорозумінь, обговоримо значення кожного з цих слів детально, з тим щоб надалі дати їм стислі, точні і однозначні формулювання. Продукти праці людини, наприклад одяг, будівлі або машини, є

віддзеркаленням думок і уяви проектувальників, що задумали їх створення. Проектування таких об'єктів може полягати у виборі форми, кольору, матеріалу, розмірів і розташування окремих елементів. Крім того, проектування може переслідувати ціль створити об'єкт, володіючий деякими заданими властивостями: швидкістю руху, довговічністю, ефективністю, вартістю. Коротше кажучи, проект — це уявний образ, який втілюється потім у продукті праці людини.

Щоб осмислено проектувати деякий об'єкт, інженер повинен знати, що на шляху до досягнення поставлених перед ним цілей існують деякі обмеження, звужуючі вибір можливих варіантів. Ці цілі і обмеження звичайно формулюються у вигляді чітко поставлених технічних вимог або умов, наприклад: «Балон повинен витримувати внутрішній тиск в 10 атмосфер, а його зовнішній діаметр повинен бути не більше 150 сантиметрів». Будь-яке проектне рішення, задовольняюче цим обмеженням, називається «допустимим» або «задовільним», і головна задача проектувальника полягає в тому, щоб знайти хоча б одне таке допустиме рішення.

Коли обмеження, що накладаються, не дуже жорсткі, можна отримати безліч різних рішень, кожне з яких буде допустимим, і у проектувальника з'являється можливість вибору. Якщо допустимі проектні рішення піддаються якій-небудь кількісній оцінці, наприклад вартісній, то можна провести їх порівняння. В цьому випадку вже можна говорити про переваги або недоліки того або іншого рішення.

Оптимальне проектне рішення — це такий допустимий проект, реалізація якого приводить до створення об'єкту, настільки хорошого відносно деякої кількісної міри його ефективності або корисності, наскільки це можливо.

Розділ математики, присвячений вивченню максимумів і мінімумів, а також їх кількісному визначенню, отримав назву теорії оптимізації.

Змістовна основа, визначувана перетином інженерного проектування і теорії оптимізації, є фундаментом дисципліни, званої оптимальним проектуванням.

Процес, в якому максимізується кількісна характеристика бажаної властивості об'єкту або мінімізується кількісна характеристика його небажаної властивості, називається оптимізацією. Оптимальне проектування можна розглядати як процес оптимізації функцій, що використовуються в задачах технічного проектування. Таким чином, у оптимальному проектуванні може знайти безпосереднє застосування будь-який з методів теорії оптимізації, пов'язаний з аналізом відповідного класу функцій..

Змістовна основа теорії оптимізації, яка дозволяє поставити її врівні з іншими математичними дисциплінами, сформувалася тільки останнім часом, проте

Page 3: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

перші математичні поняття і уявлення, пов'язані з оптимізацією, з'явилися вже за часів Стародавньої Греції, а можливо, і раніше. Аксіома Евкліда про те, що найкоротшою лінією між двома точками є пряма, поза сумнівом, була відомий ще землемірам староєгипетських фараонів. Формулювання складнішого принципу оптимального проектування, встановленого емпіричним шляхом і остававшегося недоведеним протягом тисячоліть, ми зустрічаємо в літературному викладі в «Енеїді» Вергилія, — в тому місці, де мова іде про заснування Карфагена. Боги були згодні дарувати цариці Дідоні стільки землі, скільки вона змогла б охопити ременем, зробленим з шкури бика. Дідона обкреслила цим ременем півколо, кінці якої розташовувалися на березі Середземного моря; тим самим Дідона охопила максимально можливу за заданих умов площу поверхні суші. В даному випадку практика оптимального проектування випередила теорію оптимізації, оскільки лише в XVIII віці математики довели, що крива заданої довжини, обмежуюча максимальну площу на площині, є колом.

Найраніший приклад формулювання основних положень теорії оптимізації, використаних для виявлення наявності оптимуму і визначення його положення, відноситься до XVII сторіччя і пов'язаний з іменем Ферма, який в процесі чисельних розрахунків встановив закономірність, полягаючу в тому, що при наближенні до точок максимуму або мінімуму швидкість зміни функції падає до нуля. Іншою відомою задачею була задача про брахістохрону. У цій задачі вимагалося відшукати криву, яка з’єднує дві точки, що не лежать на одному рівні, і має таку форму, що матеріальна точка під дією сили тяжіння скачується по ній в найкоротший час. В роботах Бернуллі, Ейлера і Лагранжа, присвячених аналізу оптимізаційних задач такого роду, були закладені основи варіаційного числення – математичного апарату теорії оптимізації, призначеного для визначення функцій, забезпечуючих мінімум деякого функціонала (інтеграла). Хоча варіаційне числення, в створенні якого великі заслуги належать Вейерштрассу і Якобі, зробило помітний вплив на розвиток математичного аналізу в XIX сторіччі, математичний апарат теорії оптимізації лише в невеликій мірі відповідав практичним потребам проектувальників. Таке положення зберігалося аж до середини XX століття, коли завдяки створенню електронно-обчислювальних машин відкрилися нові можливості практичної реалізації відповідних математичних методів. В основному, якщо не вважати встановленого ще у XVIII віці принципу знаходження екстремуму шляхом прирівнювання першої похідної нулю, в тих достатньо простих випадках, коли можна отримати рішення задачі в замкнутій формі, методи теорії оптимізації не знаходили широкого застосування в технічному проектуванні.

Відсутність у той час практичної необхідності у використовуванні методів теорії оптимізації, звичайно, стримувала її розвиток. В той період техніка знаходилася на такому ступені розвитку, коли основну увагу надавалося не стільки функціонуванню існуючих машин і устаткування, скільки створенню нових зразків. Проте при збільшенні масштабів і складності технічних систем і у зв'язку з тим, що все більше інженерів виявлялося залученими безпосередньо у виробничі і експлуатаційні процеси,

Page 4: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

а не в проектні розробки, з'явилася необхідність пошуку більш сучасних способів управління виробництвом і експлуатацією. Відповіддю на ці практичні потреби послужило виникнення нової прикладної дисципліни – дослідження операцій, початковий етап формування якої пов'язаний з використанням наукових принципів розробки тактичних військових операцій під час другої світової війни. В рамках дослідження операцій була розроблена сукупність оптимізаційних методів, легко пристосовуваних і до умов промислового виробництва, бо на відміну від проектних задач виробничі процеси у багатьох випадках описуються лінійними співвідношеннями між вхідними і вихідними змінними. Використання лінійної, тобто найпростішої математичної залежності, дозволяє провести детальний аналіз складних функціональних систем, що неможливо зробити умоглядно, тобто без застосування спеціальних методів. Швидкодійні електронно-обчислювальні машини, що з'явилися до цього часу, вперше дозволили реалізувати громіздкі, але строго впорядковані розрахунки, необхідні для розв’язання систем лінійних рівнянь. В значній мірі практичній можливості виконання відповідних розрахунків сприяли роботи Дж. Данцига, опубліковані в 1947 році і присвячені сімплексному методу розв’язання задач лінійного програмування, тобто задач, пов'язаних з оптимізацією лінійної функції при обмеженнях, що описуються системою лінійних нерівностей. Початковий етап становлення сучасної теорії оптимізації характеризується буквально тисячами різноманітних прикладів застосування методів лінійного програмування і розповсюдження їх на задачі із слабо нелінійною залежністю, допускаючою прийнятну лінійну апроксимацію.

Успішний розвиток лінійного програмування дозволив фахівцям в області дослідження операцій перейти до вивчення інших проблем, які можна було звести до рішення оптимизаційних задач. Р. Беллманом було розроблено метод динамічного програмування, орієнтований на рішення оптимізаційних задач, пов'язаних з дослідженням динамічних систем, тобто таких систем, характеристики яких залежать від часу; системи такого роду типові для економічного планування і автоматичного управління. Подальший розвиток апарату варіаційного обчислення, пов'язаний з роботами Л. З. Понтрягина, привів до формулювання «принципу максимуму» математичної теорії оптимальних процесів. Це дозволило подолати істотні труднощі теоретичного характеру, які виникли при створенні технічних засобів для вивчення космічного простору. Була розроблена велика кількість машинно-орієнтованих алгоритмів, або розрахункових схем, призначених для ітеративного пошуку локальних оптимумів як за наявності обмежень, що накладаються на змінні, так і за відсутності таких обмежень. Для вирішення задач цілочисельного програмування, тобто задач з неподільними змінними, був створений специфічний математичний апарат теорії груп і комбінаторного аналізу. До 70-х років сукупність розроблених математичних методів дозволила сформувати певний прикладної математики, який відомий більшості інженерів під назвою «теорія оптимізації», а фахівцям по

Page 5: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

дослідженню операцій і обчислювальній техніці — як математичне програмування. Хоча ці продуктивні методи дослідження були розроблені для задач операційного характеру, вони знайшли застосування і в технічному проектуванні. І дійсно, окремі методи теорії оптимізації, наприклад методи геометричного програмування, розроблені К. Зенером і Р. Даффіном, націлені у першу чергу на проблеми технічного проектування. Сучасні задачі в області теорії оптимізації технічних об’єктів полягають у знаходженні екстремуму деякої цільової функції (наприклад, вартості або ваги об’єкта), причому її оптимальне значення при дотриманні введених технічних обмежень знаходиться за допомогою машинних програм, що базуються на використанні сучасних алгоритмів. Оптимальне проектування конструкцій базується на методах механіки твердого деформівного тіла, зокрема таких її розділах як теорія пружності і пластичності, механіка тонкостінних і стержневих конструкцій, динаміка і стійкість елементів конструкцій та інших, а також чисельних методах механіки, таких як метод скінченних елементів, методи зважених нев’язок, спектральні методи, які у математиці узагальнюють під назвою проекційних методів.

Попередні відомості з математики

Наведемо деякі основні математичні терміни і положення, які використовуються в теорії оптимального проектування. Додаткові положення будуть вводитись далі при необхідності. Лінійним простором називають множину елементів довільної природи, в якій введені операції додавання і множення на число, що підкоряються звичайним розподільному, комутативному і сполучному законам.

Векторний простір nR є сукупністю усіх n-векторів, складених із дійсних чисел.

У лінійному векторному просторі елементи називають векторами. Прикладами лінійних просторів є множина усіх вільних векторів у трьохвимірному просторі, де операція додавання визначається за правилом паралелограма, а множення на число відповідно змінює довжину вектора. Лінійним простором є також множина стовпців, кожен з яких складається з дійсних чисел. Оскільки задачі оптимізації конструкцій є, як правило, багатопараметричними, тобто мають декілька параметрів, які треба оптимізувати, зручно використати векторні і матричні позначення. Зокрема, n змінних вважатимемо однією векторною змінною, або елементом (точкою) дійсного векторного простору

n

nR

Page 6: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

1

1[ ,..., ]Tn

n

xx x

x

⎡ ⎤⎢ ⎥= =⎢ ⎥⎢ ⎥⎣ ⎦

x .

Елементи цієї множини називають векторами і позначають як , де – координати елемента . Операції додавання і

множення визначаються такими правилами: ),,,( 21 nxxx …=x ix x

),,,(),,,(),,,( 22112121 nnnn yxyxyxyyyxxx +++=+=+ ………yx , ),,,(),,,( 2121 nn xxxxxx λλλ=λ=⋅λ ……x .

Лінійною комбінацією елементів …zy,x, простору R називають сукупність добутків …+γ+β+α zyx , де γβα ,, – які завгодно дійсні числа.

Елементи …zy,x, простору R називають лінійно незалежними, якщо рівність α β γ+ + + =x y z 0… можлива тільки у випадку, коли всі коефіцієнти дорівнюють нулю.

Розмірністю простору називають найбільше число лінійно незалежних векторів з цього простору. Якщо це число скінченне, то простір називають скінченно-вимірним.

Систему лінійно-незалежних векторів простору називають базисом, якщо довільний вектор простору можна записати як лінійну комбінацію векторів базису ie nnxxx eeex +++= …2211 .

Кожний елемент простору можна розкласти по базису, причому однозначно.

Наведемо приклади базисів конкретних лінійних просторів. 1) Довільні три некомпланарні вектори є базисом лінійного тривимірного

простору вільних векторів. 2) Сукупність елементів -вимірного координатного простору з

елементами n n

1 2( , , , )Tnx x x=x … .

Базис цього простору: , 1 (1,0,0, ,0)T=e … , 2 (0,1,0, ,0)T=e … . . . . . . . . . . . (0,0,0, ,1)T

n =e …

Page 7: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Лінійний простір R називають -вимірним, якщо у ньому існує незалежних елементів, а довільні )

n n1( +n вже є лінійно-залежними.

При цьому число називають розмірністю простору n R , тобто розмірність визначається кількістю елементів базису.

Припустимо, що деяка підмножина лінійного простору L R задовольняє дві умови:

1) якщо елементи yx, належать підмножині , то їх сума L yx + також належить цій підмножині;

2) якщо елемент x належить підмножині , а L λ – довільне дійсне число, то елемент xλ належить підмножині . L

Таку підмножину називають лінійним підпростором. Підпросторами є нульовий підпростір, який складається з одного

нульового елемента простору R , підмножина векторів, паралельних деякій площині у лінійному тривимірному векторному просторі, множина елементів простору R zyx γ++β+α … , де γβα ,,, … – довільні дійсні числа.

Цю комбінацію елементів називають лінійною оболонкою простору R , і вона є найменшим підпростором з елементів zyx ,,, … . Вона позначається як

),,,( zyxL … . Розмірність лінійної оболонки дорівнює кількості незалежних елементів, які складають підпростір.

Прикладом лінійних просторів є так звані евклідові простори. Евклідовим простором називають простір , точками якого є n -вимірні вектори nR

1[ ,..., ]Tnx x=x і встановлено правило, за яким довільним двом елементам

простору ставиться у відповідність дійсне число, яке називають скалярним добутком цих елементів ( ) T≡x,y x y , який відповідає таким умовам: )()( x,yy,x = , ),(),(),( 2121 yxyxyxx +=+ , )()( y,xy,x λ=λ ,

0)( >x,x – для ненульових елементів і 0)( =x,x , якщо x – нульовий елемент. Приклади евклідових просторів: 1. Тривимірний простір вільних векторів, де скалярний добуток векторів

визначається як добуток довжин векторів на косинус кута між ними. 2. -вимірний простір векторів, де скалярний добуток означено як n

. nn yxyxyxC +++== …2211yxT

3. -вимірний простір векторів, де скалярний добуток визначається як n , yAxT=C

Page 8: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

де – квадратна матриця порядку , симетрична відносно головної діагоналі, і для якої квадратична форма додатна для усіх значень змінних

, одночасно не рівних нулю.

A nxAxT

nxxx ,,, 21 …Якщо матриця – одинична, одержимо евклідовий простір з п. 2. AЕвклідовий простір називають нормованим, якщо норма (довжина)

довільного елемента визначається рівністю )( xx,=x .

Ортонормований базис -вимірного евклідового простору знаходиться з елементів

nneee … ,,, 21 , для яких справедлива умова

⎩⎨⎧

≠=

=.,0,,1

),(kiприkiпри

ee ki

Існує теорема, згідно з якою у всякому -вимірному евклідовому просторі існує ортонормований базис.

n

По аналогії з векторними просторами, де елементами є набори чисел, можна розглянути простори з вектор-функцій, тобто розглядати деякі набори функцій як вектори і застосувати до них операції алгебри. Цей напрям розглядається у розділі математики, який називають функціональним аналізом.

Іноді буває зручно розглядати комплекси різнорідних об'єктів (скажімо, пари число-функція) як точки одного простору. Це буває, зокрема, коли ми хочемо порівняти які-небудь пристрої, варіанти схем і т.п. відразу по декількох характеристиках, які відрізняються за формою математичного опису.

Векторний аналіз у n-вимірному евклідовому просторі

У векторному аналізі евклідових просторів на додаток до скалярних

функцій скалярного аргументу g g( )x= розглядаються скалярні функції векторного аргументу ( ) , а також векторні функції векторного аргументу g g= x

( )=g g x . Усі ці функції є частинними випадками поняття матричної функції матричного аргументу ( ) . Наведені вище функції можуть залежати від декількох аргументів, наприклад

=G G X

( , ), ( , ), ( , ),f f x y f f= = =x y f f x y a також від незалежної змінної t:

( , , ), ( , , ), ( , , ),f f x y t f f t t= = =x y f f x y Встановимо правила диференціювання. Найпростіше визначається похідна відносно скалярного аргументу.

1 2( ) [ , ,..., ] ,Tnd dx dx dxtdt dt dt dt

=x

Page 9: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Диференціювання матриці за скалярним аргументом виконується шляхом застосування цієї операції до кожного елемента матриці. Таким чином, якщо

)(tAA = і

,

11 12 1

21 22 2

1 2

( ) ( ) ( )( ) ( ) ( )

( )

( ) ( ) ( )

n

n

n n nn

a t a t a ta t a t a t

t

a t a t a t

⎡ ⎤⎢ ⎥⎢ ⎥=⎢ ⎥⎢ ⎥⎣ ⎦

A

то

11 12 1

21 22 2

1 2

( ) ( ) ( )

( ) ( ) ( )( )

( ) ( ) ( )

n

n

n n nn

d d da t a t a tdt dt dtd d da t a t a td t dt dt dt

dt

d d da t a t a tdt dt dt

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥=⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

A .

Якщо матриці A(t), B(t), C(t) погоджені за операціями додавання та множення, то

BABAdtd

dtd

dtd

+=+ )( , dtd

dtd

dtd BABABA +=)( ,

dtd

dtd

dtd

dtd CBACBACBACBA ++=)( ,

111 AAAA −−− −=dtd

dtd .

Диференціювання скалярної функції 1 2( , ) ( )f x x f= x за векторним

аргументом визначається так: x

1

2

/( ) ( )

/f dx

f ff dx∂⎡ ⎤∂

= ∇ = ⎢ ⎥∂∂ ⎣ ⎦x x

x.

Одержаний вектор-стовпець називають градієнтом ( )ggrad x , - оператор “набла”.

Похідні добутку двох векторів Tx y

11 1 2 2

2

11 1 2 2

2

( )

( )

T T

T T

yx y x y

y

xx x x x

x

⎡ ⎤∂ ∂ ∂= = + = =⎢ ⎥∂ ∂ ∂ ⎣ ⎦

⎡ ⎤∂ ∂ ∂= = + = =⎢ ⎥∂ ∂ ∂ ⎣ ⎦

x ,

2 ,

y y x yx x x

x x x x xx x x

Page 10: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Похідні прямокутної M N× матриці А

,

,

T T T

T T T T

∂ ∂= =

∂ ∂∂ ∂

= =∂ ∂

x Ay y A x Ayx x

y x x A y A yx x

де . 1 1

M NT

mn m nm n

a x y= =

=∑∑x Αy

Зокрема, для симетричної квадратної матриці (m=n)

( ) 2T T∂= + =

∂x Ax A A x Ax

x.

Друга похідна скалярної функції векторного аргументу по відношенню до вектора 1 2[ T]x x=x називається Гессіаном від ( )f x і визначається як

222 1 1

2 22 1 2

/ /( ) ( ) ( )

/ /2f x f x xdf f

d f x x f x⎡ ⎤∂ ∂ ∂ ∂ ∂

= ∇ = = ⎢ ⎥∂ ∂ ∂ ∂ ∂⎣ ⎦H x x x

x.

Друга похідна квадратичної форми знаходиться так: 2

2 2T Tdd

= + =x Ax A A Ax

.

Першу похідну векторної функції векторного аргументу f(x) називають Якобіаном функції f(x)

1 1 1 2

2 1 2 2

/ /( ) ( ) .

/ /f x f xdf x f xd∂ ∂ ∂ ∂⎡ ⎤

= = ⎢ ⎥∂ ∂ ∂ ∂⎣ ⎦J x f x

x

Лінійні оператори

Нехай V і – лінійні простори, розмірності яких і . Оператором А,

діючим з W n m

V у W , називають відображення, яке кожному елементу простору xV ставить у відповідність елемент у простору W . Це відображення записують так ),(xy A= або xy A= .

Оператор називають лінійним, якщо виконуються правила 2121 )( xxxx AAA +=+ , λλ=λ (,)( xx AA – число).

Якщо простір W співпадає з простором V , то лінійний оператор, діючий з V у V , називають лінійним перетворенням простору V . Розглянемо ці оператори докладніше.

Одиничним оператором I називають оператор, діючий за правилом

Page 11: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

)(, VI ∈= xxx . Добутком операторів А і В називають оператор

)()( xx BAAB = . Справедливими є такі властивості операторів

BAAB )()( λ=λ , ,)( BCACCBA +=+

,)( ACABCBA +=+ ).()(AB C A BC= Степінь оператора – це результат його повторного застосування

2 1( ) , ( )m m .A Ax A x A A x A x+= = Оберненим по відношенню до А називають оператор В з ),( VVL , для якого

IBAAB == , де І – так званий тотожній оператор.

Обернений оператор позначається символом 1−A . Справедливим є відношення

xAxA =−1 . Оператор А діє взаємно однозначно з V у V , якщо довільним двом різним

елементам 21, xx відповідають різні елементи 2211 , xyxy AA == .

Для того, щоб лінійний оператор А з ),( VVL мав обернений, необхідно і достатньо, щоб оператор діяв взаємно однозначно з V у V .

Назвемо ядром лінійного оператора А множину елементів простору V , для яких

0=xA . Ядро позначається символом AKer . Образом лінійного простору називають множину цих елементів у просторі

V , які задовольняють умові xy A= .

Образ лінійного оператора А позначається символом Aim . Якщо 0=AKer , то VAim = і навпаки.

Оператор А* у скінченно-вимірному евклідовому просторі з ),( VVL називають спряженим до лінійного оператора А, якщо для довільних і x y з V виконується співвідношення ( ) ( , T )A A=x,y x y .

Кожний лінійний оператор має єдиний спряжений. Лінійний оператор з ),( VVL називають самоспряженим, якщо справедлива

рівність TA A=

Page 12: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Для самоспряжених операторів існує декілька суттєвих положень: 1) Власні значення самоспряженого оператора – дійсні числа. 2) Скалярний добуток ),( xxA для самоспряженого оператора – дійсне

число. 3) Власні вектори самоспряженого оператора, які відповідають різним

власним значенням цього оператора, – ортогональні. 4) Матриця самоспряженого оператора симетрична, тобто

TAA = . 5) Самоспряжений оператор називають додатно визначеним, якщо для

довільного з x V справедливе співвідношення 0)( ≥xx,A .

Кожне власне значення додатно визначеного оператора додатне. Порівняємо відстань між парою яких-небудь точок x1, x2 постору Q (або

деякої його області q) з парою їх образів Ах1, Ах2. Якщо якимось способом у цьому просторі введено відстань між точками (метрику простору) ( 1, 2)x xρ і якщо

( 1, 2) ( 1, 2)Ax Ax M x xρ ρ≤ , де М – будь-яке не негативне число, то оператор А називають обмеженим. Нормою оператора А (позначається A ) у даній області q називають найменше з чисел М, при якому ця нерівність виконується для довільної пари точок х1,х2 з області q.

При всякому розширенні області норма оператора не може зменшуватися, а при всякому звуженні області не може збільшуватися. Очевидно, норма оператора вводиться погоджено з метрикою або нормуванням простору. Якщо в деякій області простору q ,A 1,α α≤ < то оператор називають стискаючим в цій області, бо для будь-яких 1, 2x x q∈ ( 1, 2) ( 1, 2)Ax Ax x xρ ρ< , Так, функція f(t) є стискаючим оператором в області аргументa , якщо [ , ]t a b∈

( ) 1f t m′ ≤ < при . [ , ]t a b∈ Нерухомі точки операторів – це такі точки, які не зміщуються у просторі цим оператором, Ax x∗ = ∗ , в той час як інші точки відображаються цим оператором у деякі інші точки, інакше кажучи, зміщуються. Оператор довільного вигляду може мати деяку множину нерухомих точок, або всього одну, або взагалі не мати їх.

Нерухомою точкою оператора диференціювання ( )d f tdt

буде

( ) tf t ae∗ = (a – довільне число). В даному випадку нерухома точка легко відшукується безпосереднім розв’язком диференціальногорівняння

( ) ( ), ( ) , (0) .tdf t f t f t ae f adt

∗ ∗= = =

Page 13: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Універсального способу знаходження нерухомих точок немає. Обчислювальні задачі часто зводяться до відшукання нерухомих точок операторів. Тому цікавим є спосіб, який хоча б в окремих випадках приводить до відповіді. Таким способом є побудова нескінченної послідовності точок, починаючи із за правилом 0x

1k kx A+ x= . Це правило можна записати і інакше

0k

kx A x= . Якщо виявляється, що ця послідовність має границю lim ( )kx x k∗ = →∞ , то ця границя і є нерухомою точкою. Збіжність до границі в загальному випадку залежить як від властивостей оператора A , так і від вибору початкової точки

0x . У цьому випадку дуже цінну властивість мають оператори, що є стискаючими у всьому просторі (наприклад, оператор-функція дійсного змінного

2xy e−= ). Такі оператори мають єдину нерухому точку і послідовність сходиться до x∗при будь-якому виборі 0x . Пояснимо, що наявність у оператора нерухомої точки є лише необхідною, але недостатньою умовою збіжності послідовності 1k kx Ax+ = .

Введемо поняття рангу лінійного оператора А. Рангом називають число, що дорівнює розмірності простору Aim

)dim( AimArang = . Покажемо, що кожному лінійному оператору Aз ),( VVL при заданому

базисі лінійного простору V відповідає матриця А цього оператора. Зафіксуємо у лінійному просторі базис neee …,,, 21 . Якщо x – довільний

елемент з простору V і може бути розкладеним по даному базису

∑=

=n

kk

kex1

x ,

для лінійного оператора А одержимо

∑=

=n

kk

k eAxA1

x .

Позначимо координати вектора keA як ),2,1(,,,,, 221 nkaaaa nkkkk …… = , тобто

),2,1(,1

nkeaAn

iiikk …== ∑

=e .

Тоді

∑∑∑===

===n

iii

n

iiik

n

k

k eyeaxA111

xy ,

Page 14: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

де

. ),2,1(,1

nixayn

kkiki …==∑

=

Матрицю А з компонентами називають матрицею оператора ika A у

заданому базисі, тобто залежність між векторами y і можна записати у вигляді

x

xAy = , де , T

nT

n xxxyyy ),,,(,),,,( 2121 …… == xy

. ⎥⎥⎥

⎢⎢⎢

=

nnnn

n

n

aaa

aaaaaa

……………

……

21

22221

11211

A

Очевидно, що для нульового оператора матриця буде нульовою, а для одиничного – одиничною.

Таким чином, лінійному оператору А з ),( VVL при заданому базисі простору V відповідає матриця цього оператора. Справедливим є і обернене твердження – кожній матриці А у заданому базисі відповідає деякий лінійний оператор А. Рангом лінійного оператора називають ранг матриці цього оператора. (Ранг матриці дорівнює числу лінійно-незалежних рядків).

Матриця лінійного оператора при переході до нового базису змінюється. Нехай V – лінійний простір, A – лінійний оператор з ),( VVL , а ee , – два базиси у V , причому

),2,1(,1

nkun

iikik …==∑

=

ee

– формули переходу від одного базису до іншого. Матриці оператора Aу двох базисах позначимо

[ ] [ ]ikik aa == AA , .

Між матрицями і A A існує залежність −= 1A L AL , де – обернена матриця для матриці . [ ],kil −= 1L L L

Обернена залежність має вигляд −= 1A L AL .

Для лінійного оператора BA λ+ матриця має вигляд BAA λ+= .

У новому базисі матимемо

Page 15: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

BAA λ+= . Оскільки визначник добутку матриць дорівнює добутку визначників цих

матриць, то , ( 1)det det det det det det det− −= = =1 1A L A L A L L .

Операція зміни базису у формі −= 1A L AL є особливо ефективною коли є ортогональною матрицею. Дійсна матриця називається ортогональною, якщо її транспонована матриця співпадає з оберненою, тобто

A

1,T або−=A A AAT = I (I – одинична матриця ). Це означає, що при зміні базису справедливою є рівність

T -1A = L AL = L AL . Ортогональні матриці широко використовують при обчисленнях. Зокрема,

це відноситься до так званих матриць обертання і відображення. Матриця обертання має таку структуру: компоненти на перетині i-го рядка і і-го стовпця, а також на перетині j-го рядка і j-го стовпця дорівнюють cosθ , деθ – кут повороту; компоненти на перетині i-го рядка і j-го стовпця, і на перетині j-го рядка і і-го стовпця дорівнюють відповідно sinθ− і sinθ : Усі інші діагональні елементи дорівнюють одиниці, а недіагональні нулю. Наприклад матриця повороту у двовимірному просторі має вигляд

cos sin.

sin cosθ θθ θ

−⎡ ⎤= ⎢ ⎥⎣ ⎦

L

Вектор y , який одержується у результаті обертання вектора , x T=y L x .

Матриця відображення визначається за формулою 2; ,TTα α =L = I - vv

v v

де вектор v може бути довільним. Дія матриці полягає у відображенні довільного вектора w від площини, ортогональної вектору v. Для n - вимірного простору вектор w буде мати компоненту кw у напрямку вектора v і компоненту u у напрямку перпендикулярному вектору v. Компонента кw при відображенні змінює напрям на протилежний, а компонента u не змінюється.

Зокрема, у двовимірному випадку матриця обертання, яка повертає вектор проти годинникової стрілки на кутθ ,має вигляд

cos sin.

sin cosL

θ θθ θ

⎡ ⎤= ⎢ ⎥−⎣ ⎦

Матриця відображення у двовимірному випадку буде такою: sin cos

.cos sin

Hθ θθ θ

⎡ ⎤= ⎢ ⎥−⎣ ⎦

Page 16: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Основні поняття теорії оптимізації Якщо розглядати процес оптимізації як пошук найкращого варіанту, то для одержання розв’язку задачі оптимізації необхідно, як правило, знайти відповіді на такі питання: – що означає “найкращий”? – що конкретно необхідно покращити? – що можна змінювати для того , щоб одержати найкращий результат? – у яких межах можна проводити ці зміни? Для відповіді на перші два питання необхідно ввести так званий критерій оптимізації, тобто визначити ті ознаки за якими можна порівнювати альтернативні результати оптимізації. Критерій оптимізації відповідає на запитання, що конкретно необхідно покращити. Це може бути маса конструкції, амплітуда коливань,ресурс роботи, вартість проекту і т.п. Для відповіді на два останніх питання необхідно мати математичну модель об’єкта оптимізації, яка описує об’єкт за допомогою математичних співвідношень між величинами що визначають його властивості. Деякі з цих величин можна змінювати у встановлених межах, що і породжує множину альтернатив, серед яких і треба вибрати кращу. Величини, які входять у математичну модель і вважаються змінними називають параметрами оптимізації, а співвідношення, що встановлюють границі можливої зміни параметрів, обмеженнями. Обмеження можуть задаватися у вигляді рівностей або нерівностей. Їх називають відповідно обмеженнями типу рівності і обмеженнями типу нерівності. Якщо множина параметрів оптимізації є підмножиною скінченновимірного простору, то говорять про скінченновимірну задачу оптимізації на відмінність відбезкінечновимірних задач, які розглядаються у варіаційномуобчисленні і оптимальному управлінні. При цьому критерієм оптимальності може бути вимога досягнення найбільшого або якнайменшого значення однією або декількома дійсними (скалярними) функціями параметрів оптимізації, що виражає кількісно міру досягнення мети оптимізації об'єкту, що розглядається. Кожну з таких функцій прийнято називати цільовою. Якщо цільова функція одна, то задачу скінченновимірної оптимізації називають задачею математичного програмування, а в протилежному випадку — задачею багатокритеріальної (векторної) оптимізації. Якщо цільова функція і обмеження є лінійною відносно параметрів оптимізації, то говорять про задачу лінійного програмування. Одну з перших таких задач сформулював і розв’язав Л.В. Канторович. Задача Канторовича була пов'язаною з вибором оптимальної виробничої програми, що і пояснює появу в назві цього класу задач слова „програмування". При нелінійній залежності цільової функції або обмежень від параметрів оптимізації говорять про задачу нелінійного програмування.

Page 17: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Структура оптимізаційних задач Усі оптимізаційні задачі можна кваліфікувати як задачі мінімізації деякої

функції ( )f x n-вимірного векторного аргумента , 1 2( , ,..., )Nx x x=xкомпоненти якого задовольняють систему рівнянь ( ) 0=A x , набір нерівностей

( ) ≥G x 0 , а також є обмеженими зверху і знизу, тобто . Далі min max≤ ≤x x xбудемо називати функцію ( )f x цільовою функцією, рівняння ( ) 0=A x – обмеженнями у вигляді рівностей, а нерівності – обмеженнями у ( ) ≥G x 0вигляді нерівностей. При цьому вважається, що усі аргументи цільової функції дійсні, а кількість обмежень скінченна.

Задачу загального виду – мінімізувати ( )f x , при обмеженнях

min max

( ) 0, 1,..., ,( ) 0, 1,..., ,

( ) , 1,...,

k

j

i i

h k Kg x j J

x x x x i N

= =≥ =

≤ ≤ =

x(1.1)

називають задачею оптимізації з обмеженнями, або задачею умовної оптимізації. Задача, у якій немає обмежень, тобто

min max

0,, , 1,...,i i

J Kx x i= =

= −∞ = ∞ = N(1.2)

називають оптимізаційною задачею без обмежень, або задачею безумовної оптимізації. Задачі, у яких x є одновимірним вектором, називають задачами з однієї змінною. Задачі, у яких функції ,k jh g є лінійними, називають задачами з лінійними обмеженнями. У таких задачах функції ( )f x можуть бути лінійними і нелінійними. Якщо ( )f x лінійні функції вектора х, маємо задачі лінійного програмування з лінійними обмеженнями. У задачах цілочисельного програмування компоненти вектора х можуть приймати тільки цілі значення. Наведена класифікація має важливе значення, у зв’язку з тим,що специфічні особливості кожного класу задач використовують при виборі ефективних методів оптимізації.

Класифікація задач оптимізації

Як і в будь-якій класифікації, розділення задач оптимізації на окремі класи достатньо умовне. Відзначимо, що одна і та ж прикладна задача може приводити до різних задач оптимізації залежно від того, яка математична модель використовується при розгляді реального объекта оптимізації. Ясно, що

Page 18: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

бажано застосовувати більш прості моделі, але в той же час достатньо повно відображаючі властивості об'єкту, істотні з погляду поставленої цілі, яка поставлена критерієм оптимальності. Саме тому при виборі або розробці математичної моделі або при обгрунтовуванні її спрощення необхідно достатньо чітко уявляти, до якого класу буде відноситися поставлена задача оптимізації і які методи можуть бути застосовані для її вирішення. Нехай 0 ( )f x цільова функція, що кількісно визначає деякий критерій

оптимальності і залежить від координат ( 1, )=jx j n точки nx R∈ . Ці координати є параметрами оптимізації (іноді їх називають також змінними задачі оптимізації або просто змінними задачі). При математичному формулюванні задачі оптимізації цільову функцію вибирають з таким знаком, щоб рішення задачі відповідало пошуку мінімуму цієї функції.Тому формулювання загальної задачі математичного програмування, як правило, записують так:

0 ( ) min,f → ∈x x Ω , (1.3)

де nRΩ ⊂ – множина можливих альтернатив, що розглядаються при пошуку розвязку задачі. Довільну точку ∈Ωx називають допустимим розв’язком задачі математичного програмування, а саму множину – множиною допустимих розв’язків або інакше, – допустимою множиною. Точку

Ω∈Ωx , у

якій функція 0 ( )f x досягає свого якнайменшого значення, називають оптимальним розв’язком задачі. За відсутності обмежень множина співпадає з областю визначення цільової функції. Якщо ж альтернативи, що розглядаються, повинні задовольняти деяким обмеженням, то множина допустимих розв’язків звужується. Задачу пошуку оптимуму надалі називатимемо задачею мінімізації цільової функції на множині , розуміючи під цим знаходження якнайменшого значення функції на і точок

, у яких воно досягається. Але цільова функція може і не досягати на

Ω0( ) nD f R⊂

Ω0 ( )f x Ω

∈Ωx Ω якнайменшого значення. Тоді говорять про точну нижню грань

функції 0inf ( )f∈Ω

xx 0 ( )f x на цій множині і замість (1.3) використовують запис

0 ( ) inf,f → ∈x x Ω (1.4) Відмінність ( 1.3) від (1.4) у тому, що в першому випадку припускають існування точки , в якій цільова функція досягає свого якнайменшого значення на множині , а в другому випадку така точка може і не існувати. Тому розв’язок загальної задачі математичного програмування полягає у тому, щоб в першому випадку знайти точні (або з деякою заданою точністю) значення координат

∈ΩxΩ

, ( 1, )jx j n= , точки nx R∈ і значення цільової функції, а

у другому випадку побудувати таку послідовність { } точок , якій би nx ∈Ωx

Page 19: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

відповідала послідовність{ ( )}o nf x , що сходиться до значення 0inf ( )f∈Ω

xx , і

обчислити це значення із заданою точністю. Відзначимо, що в більшості прикладних задач має місце перший випадок. Якщо – лінійна функція, то

її область визначення співпадає з 0 ( )f x

nR . Таку функцію за допомогою стандартного скалярного добутку можна записати у вигляді , де

відомий вектор. Ясно, що цільова функція 0 ( ) ( , )f =x c x

1[ ,..., ] nnc c R=c ∈

01

( ) ( , )n

j jj

f c x=

= =∑x c x (1.5)

може досягати якнайменшого значення на множині Ω лише в граничних точках множини. Якщо в задачі немає обмежень, то nRΩ = і точна нижня грань лінійної функції дорівнює ∞ . Тому для лінійної цільової функції задача оптимізації

( , ) min, nR→ ∈c x x (1.6) имеет смисл лише за наявності обмежень. В окремому випадку, коли задано лінійні обмеження типу рівності

, n ,R= ∈Dx d x (1.7)

де nR∈d , – матриця розміру доB k n× , а параметри оптимізації можуть приймати лише додатні значення, тобто

0, (1, )jx j≥ = n

)

. (1.8) Співвідношення (1.6)-(1.7) складають стандартну задачу лінійного програмування, або задачу лінійного програмування в стандартній формі (в літературі її часто називають канонічною задачею лінійного програмування, або задачею лінійного програмування в канонічній формі). Якщо до (1.6)-(1.8) додати m обмежень типу нерівності

1, , (1,

mn

ij j i ijj

a x b a R i m=

≤ ∈ =∑ , (1.9)

то співвідношення (1.6)-(1.9) будуть формулюванням загальної задачі лінійного програмування. При цьому обмеження (1.22)могут відноситися не до усіх параметрів оптимізації, а тільки до деяких. При відсутності обмежень типу рівності співвідношення (1.6-1.8) складають формулювання основній задачі лінійного програмування. Нерівності ,j j j jx a x b≥ ≤ , і

називають прямими обмеженнями на змінні задачі, причому останнє відносять до двосторонніх, а перші два — до односторонніх. Таким чином, обмеження (1.8) є прямими односторонніми.

, (1,j j ja x b j n≤ ≤ = )

Якщо при лінійних обмеженнях цільова функція, що мінімізується,

Page 20: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

окрім лінійної комбінації вигляду A.20) включає додатно визначену квадратичну форму, тобто

1 min2

T T+ →c x x Qx ,

де Q — додатно означена матриця порядку n, то маємо задачу квадратичного програмування, а функцію вигляду (A.24) називають квадратичною. Якщо цільова функція є відношенням двох лінійних функцій, а обмеження лінійні, маємо задачу дробово-лінійного програмування. Її формулювання включає обмеження( 1.)-(1.) і умову мінімуму функції

minT

T

αβ

+→

+q xr x

,

де є заданими. , , ,n nq R r R R Rα β∈ ∈ ∈ ∈Співвідношення

01

1

( ) ( ) min;

( ) ( ) , 1,..., ;

0, 1,..., ,

n

j jjn

i ij j ij

j

f h x

g g x i

x j n

γ=

=

= →

= ≤ =

≥ =

x

x m

визначають задачу сепарабелъного програмування. В цій задачі цільова функція і функції в лівій частині обмежень є сумою 0 ( )f x ( )ig xфункцій, кожна з яких залежить тільки від одного параметра оптимизации. В цьому випадку функції і називають сепарабелъними. 0 ( )f x ( )ig xЯкщо обмеження належать до типів рівності і (або) нерівності, і хоча б одна з функцій обмежень або цільова функція не є лінійними, то маємо про загальну задачу нелінійного програмування. Ясно, що таке формулювання включає задачі квадратичного, дробово-лінійного, сепарабельного і геометричного програмування.Серед цільових функцій достатньо широкий клас складають опуклі функції. У багатьох прикладних задачах оптимізації область допустимих значень параметрів оптимізації виявляється опуклою множиною. В такій області цільова функція може зберігати один і той же напрям опуклості, тобто бути опуклою або вниз (опукла), або вгору(є увігнута). Наприклад, залежність ефективності технічного пристрою від параметрів оптимізації є увігнутою функцією. Річ у тому, що чим вище технічні характеристики пристрою, тим важче добитися його подальшого вдосконалення і істотного приросту ефективності. Навпаки, цільові функції, що виражають масу, габарити або вартість технічного пристрою, із тих же причин звичайно опуклі. Аналогічна ситуація характерна і для функцій, що описують економічні системи. Наприклад, зростання об'єму продукції, що випускається, відбувається не прямо пропорційно капіталовкладенням або кількості ресурсів, що

Page 21: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

використовуються, а з уповільненням, причому це уповільнення часто тим більше, чем більше об'єм виробництва. Це приводить до увігнутості так званих виробничих функцій, що описують залежність об'єму продукції від витрачених ресурсів. Навпаки, при фіксованому об'ємі виробництва подальше зниження виробничих витрат і вартості одиниці продукції в порівнянні з досягнутим рівнем також відбувається з уповільненням, що приводить до опуклості цільових функцій, що описують вартісні характеристики виробництва. Ясно, що будь-яку увігнуту цільову функцію, змінивши знак, можна зробити опуклою. Задачі оптимізації, в яких необхідно знайти якнайменше значення опуклої цільової функції, що розглядається на опуклій множині, відносять до задач опуклого програмування. Окремими випадками таких задач є задачі квадратичного і лінійного програмування. Задачі геометричного програмування за деяких додаткових умов також є задачами опуклого програмування. Якщо множина Ω допустимих рішень виявляється скінченною множиною, то ми маємо задачу дискретного програмування, а якщо до того ж координати цих точок цілі числа, то задачу цілочисельного програмування. У прикладних задачах цільова функція часто має вигляд

1 1

( ) ijnm

ni j

i j

y c x= =

= ∑ ∏x ,

де ,ij ia R c R+∈ ∈ ( R+ - множина позитивних дійсних чисел). Вимога

позитивності коефіцієнтів , стала причиною того, що такий вид цільової функції називають позіномом на відміну від полінома (многочлена), в якому коефіцієнти можуть бути і не позитивними. Крім того, в многочлені показники степеня аргументів є цілими не негативними числами. Якщо цільова функція і ліві частини обмежень типу рівності і (або) нерівності в задачі мінімізації є позіномами, то таку задачу називають задачею геометричного програмування.

ic

Елементарні приклади задач оптимізації Задачі оптимізації відрізняються від задач оптимального проектування

тим, що вони зводяться до пошуку екстремумів деяких функцій або функціоналів, які не залежать від змінних стану, тобто параметрів, що визначають стан конструкції при дії відповідних навантажень. На противагу задачам оптимізації у задачах оптимального проектування, як правило, немає явно записаної цільової функції. Вхідні параметри вводяться в програму, яка видає значення цільової функції відповідне введеним параметрам. Таким чином, цільова функція визначається для кожного набору вхідних параметрів за допомогою “чорного ящика”, яким є програмний модуль, що описує математичну модель конструкції чи системи. У зв’язку з цим істотним є намагання побудувати математичну модель з аналітично визначеною цільовою

Page 22: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

функцією, тобто звасти задачу оптимального проектування до задачі оптимізації. Нижче розглядаються декілька задач такого типу. Приклад 1.1. Визначити розміри сторін прямокутника, вписаного в коло, який має найбільшу площу (рис.1).

Рис.1.1

Візьмемо парметрами оптимізації довжини сторін прямокутника 0, 0a b≥ ≥ , тоді цільовою функцією буде площа S ab= , а обмеженням

типу рівності – умова, що діагональ прямокутника дорівнює радіусу 2 2 2a b+ = R .

Маємо задачу нелінійного програмування, оскільки хоча цільова функція лінійна, обмеження є нелінійним. Математичне формулювання можна подати у вигляді

2 2 2max,

, 0,S aba b R a b 0.= →+ = ≥ ≥

Якщо за допомогою обмеження виключити одну зі змінних у виразі для цільової функції, можна знайти екстремум для функції однієї змінної стандартним спосом прирівнявши похідну до нуля.

2 22 2

2 2

4 2( 4 )4

d Ra R ada R a

− 0a− = =

−.

При умові, що сторони прямокутника не можуть дорівнювати , одержимо 2R

2a b R= = .

Page 23: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Приклад 1.2 У прямий круговий конус вписано прямий круговий циліндр (рис.1.2). Знайти розміри циліндра найбільш можливого об’єму.

Рис.1.2

Виберемо цільовою функцією відношення об’ємів циліндра і конуса 2 2

2 23 ./ 3

r h r hR H R Hπη

π= =

Тоді параметрами оптимізації можна прийняти відношення . / , /r R h HОбмеження на розміри циліндра мають вигляд

( ) /r H h HR= − .

Виключаючи це співвідношення з цільової функції, одержимо

2( ) 3(1 ) , (0,1)h h h hH H H H

.η = − ∈

Максимум цієї функції буде при 13

hH

= . При цьому відношення радіусів

основ циліндра і конуса дорівнює 2 ,3

rR= а відношення їх об’ємів

4 .9

η =

Приклад 1.3. Спроектувати бак пального у вигляді прямого кругового циліндра заданого об'єму V, на виготовлення якого піде якнайменша кількість листової сталі. Параметрами оптимізації виберемо радіус і висоту Н циліндра. Тоді витрати матеріалу на виготовлення бака визначатимуться сумарною площею S його бокової поверхні і двох плоских днищ. Таким чином, необхідно мінімізувати цільову функцію 2 (S R H )Rπ= + ) при обмеженні типу рівності

2R H Vπ = , тобто розв’язати задачу нелінійного програмування. Якщо з цільової функції за допомогою обмеження виключити H і записати її у вигляді

Page 24: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

2( ) 2 ,V VS R RR R

π= + +

то після визначення похідної по , прирівнюючи її до нуля, одержимо рівняння для визначення висоти бака

S R

2

24 0VRR

π − = ,

звідки 3

2VRπ

= .

Враховуючи обмеження, одержимо

34VHπ

= ,

тобто висота оптимального бака дорівнює його діаметру. При виготовленні одного бака необхідно враховувати, що для заготовки круглого днища площею 2Rπ доведеться узяти квадратний лист площею 24R , причому після розкрою частину листа, що залишилася, використовувати буде практично неможливо. Тому більш обгрунтовано як цільовою функцією вибрати

22 8S RH Rπ= + , тобто мінімізувати площу листа з урахуванням залишків. при колишньому обмеженні Тоді в результаті процедури, аналогічної розглянутій,отримаємо

33 28, , 6

2V .R H R S V

π= = =

Якщо належить виготовити велику партію баків, то розкрій листової сталі при заготівлі днищ можна провести більш раціонально, розміщуючи сусідні центри днищ у вершинах правильних трикутників із стороною 2R. Тоді витрата листа на кожне днище буде відповідати площі 22 3R правильного шестикутника, описаного навколо кола радіусу R. При цьому необхідно мінімізувати цільову функцію 22 4 3S RHπ= + R при тому ж обмеженні. У результаті одержимо

3 234 3, , 3 4

4 3VR H R S

π= = = 3 .V

Відмітимо, що при постановці задач оптимального проектування важливо, щоб математична модель об'єкту оптимізації достатньо повно відображала саме ті властивості об'єкту, поліпшення яких є ціллю оптимізації. Розробка такої моделі як правило вимагає використання відомостей з відповідних інженерних дисциплін або областей техніки.

Page 25: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Приклад 1.4 З курсу опору матеріалів відомо, що допустиме навантаження, яке сприймає прямолінійний стержень, що працює на розтяг або стиск (без втрати стійкості прямолінійної форми рівноваги), пропорційне площі F його поперечного перетину. При стиску стержень може втратити стійкість, згинаючись у деякій площині. Стискаюча сила, що викликає втрату стійкості стержня, пропорційна геометричному моменту інерції його перерізу відносно центральної осі площі перерізу, перпендикулярної площині прогину. Від значення також залежить прогин стержня, що згинається в цій площині, але залежність ця обернено пропорційна. Допустиме навантаження. при прогині стержня пропорційне моменту опору перерізу , де — відстань до самої віддаленої від центральної осі точки перерізу. Ці відомості важливі для вибору критерію оптимальності при проектуванні окремих елементів конструкцій, сприймаючих навантаження.

J

J

/ mW J y= my

Припустимо, що з круглої колоди радіусу R необхідно виготовити балку з прямокутним поперечним перерізом (рис. 1.5) так, щоб її можна було найбільш ефективно використовувати в будівельній конструкції. Якщо балка буде використана як стояк, працюючий на стиск без небезпеки втрати стійкості, то доцільно максимізувати площу F її перерізу, вибраного у вигляді квадрата із стороною 2R , вписаного в коло радіусу . Максимальне значення площі перерізу буде

R22R (див. приклад 1.1). Таким же повинен бути переріз стояка,

якщо можлива втрата стійкості в будь-якій площині, що проходить через його вісь. Дійсно, неважко показати, що в цьому випадку моменти інерції перерізу відносно будь-якої осі, що лежить площині квадрата і проходить через його центр, однакові і дорівнюють 4 /3R . Якщо ж площину прогину стояка при можливій втраті стійкості визначено умовами її закріплення, то доцільно вибрати таке відношення сторін прямокутника,щоб момент інерцїї перерізу відносно його центральної осі, перпендикулярної цій площині, був максимальним. Позначимо через b ширину перетину уздовж цієї осі, а через h

його висоту (рис. 1.3). Тоді отримаємо 3

12bhJ = .

Рис. 1.3

Page 26: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

Але сторони прямокутника повинні задовольняти обмеженню . Таким чином, приходимо до задачі нелінійного програмування

2 2 4b h R+ ≤ 2

3

2 2 2

max;12

4 , 0, 0,

bhJ

b h R b h

= →

+ ≤ ≥ ≥

Нескладно встановити, що максимальне значення 41 34

J R= буде досягнуто

при оптимальній висоті 3h R= і ширині b R= перерізуу балки. Такий же поперечний переріз балки необхідно вибрати, якщо вона навантажена в площині згинаючим навантаженням. При такому виборі жорсткість балки буде максимальною, а її прогин — мінімальним. Оскільки для прямокутного перетину балки / 2my h= , то для момента опору отримаємо

. У данному випадку задача нелінійного програмування приймає вигляд

2/ mW J y bh= = / 6

2

2 2 2

max;6

4 , 0, 0

bhW

b h R b h

= →

+ ≤ ≥ ≥ .

Її розв’язком буде

38 2 2, ,9 3 3

W R h R R= = = 2 .b

Приклад 1.5

Проліт завдовжки перекриває кругова арка (рис. 1.4), на яку діє 2rрівномірно розподілене навантаження . Необхідно підібрати радіус арки і визначити кут розкриття з умови мінімуму маси конструкції.

Рис.1.4 Запишемо вираз для маси арки, яка відповідає цільовій функції Z

2Z A Rρ ϕ= ,

Page 27: Лекція 1 Вступ - sopromat.org.uasopromat.org.ua/sopromat_files/LEC_OK_1.pdfЛекція 1 . Вступ. На протязі усієї своєї історії людина

де ρ - густина матеріалу; - площа перерізу арки. AЗусилля в поперечному перерізі дорівнює N qR= , а площа перерізу

визначається залежністю qRAσ

= .

Підставимо цей вираз в рівняння для і замінимо в ньому Zsin

rRϕ

= .

Тоді цільова функція задачі матиме вигляд

2

2 2sin

qrZ ϕρσ ϕ

= = ,

де змінною є тільки ϕ . Диференціюючи по Z ϕ і прирівнюючи результат до нуля, одержимо

2 2sin 2 sin cos2 04sin

qr ϕ ϕ ϕ ϕρσ ϕ

−= .

Оскільки знаменник і перший співмножник не дорівнюють нулю, то приходимо до трансцендентного рівняння

2 0tgϕ ϕ− = ,

розв’язком, якого є . При цьому радіус арки , а 2 133,5ϕ = 1.088R r=мінімальне значення цільової функції визначається співвідношенням

22,76 qrZ ρ

σ= .