71
НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ УКРАЇНИ «КИЇВСЬКИЙ ПОЛІТЕХНІЧНИЙ ІНСТИТУТ» Факультет менеджменту та маркетингу (повна назва факультету) Кафедра математичного моделювання економічних систем (повна назва кафедри) «До захисту допущено» Завідувач кафедри __________ В.О. Капустян (підпис) (ініціали, прізвище) ―___‖_____________2015 р. Дипломна робота на здобуття ступеня бакалавра із напряму підготовки 6.030502 Економічна кібернетика (код і назва) на тему: Прогнозування котирування акцій з використанням нейромереж _________________________________________________________________ _________________________________________________________________ Виконав: студент IV курсу, групи УК-11 - (шифр групи) Баранов Максим Юрійович - ________ (прізвище, ім’я, по батькові) (підпис) Керівник доцент, к.т.н., доцент Жиров О.Л - ________ (посада, науковий ступінь, вчене звання, прізвище та ініціали) (підпис) Консультант Охорона праці доцент, к.б.н. Гусєв А.М ________ (назва розділу) (посада, вчене звання, науковий ступінь, прізвище, ініціали) (підпис) Рецензент доцент, к.е.н., доцент Черненко Н.О ________ (посада, науковий ступінь, вчене звання, науковий ступінь, прізвище та ініціали) (підпис) Засвідчую, що у цій дипломній роботі немає запозичень з праць інших авторів без відповідних посилань. Студент _____________ (підпис) Київ – 2015 року

G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ УКРАЇНИ

«КИЇВСЬКИЙ ПОЛІТЕХНІЧНИЙ ІНСТИТУТ»

Факультет менеджменту та маркетингу (повна назва факультету)

Кафедра математичного моделювання економічних систем (повна назва кафедри)

«До захисту допущено»

Завідувач кафедри

__________ В.О. Капустян (підпис) (ініціали, прізвище)

―___‖_____________2015 р.

Дипломна робота

на здобуття ступеня бакалавра

із напряму підготовки 6.030502 Економічна кібернетика (код і назва)

на тему: Прогнозування котирування акцій з використанням нейромереж

_________________________________________________________________

_________________________________________________________________

Виконав: студент IV курсу, групи УК-11 - (шифр групи)

Баранов Максим Юрійович - ________ (прізвище, ім’я, по батькові) (підпис)

Керівник доцент, к.т.н., доцент Жиров О.Л - ________ (посада, науковий ступінь, вчене звання, прізвище та ініціали) (підпис)

Консультант Охорона праці доцент, к.б.н. Гусєв А.М ________

(назва розділу) (посада, вчене звання, науковий ступінь, прізвище, ініціали) (підпис)

Рецензент доцент, к.е.н., доцент Черненко Н.О ________ (посада, науковий ступінь, вчене звання, науковий ступінь, прізвище та ініціали) (підпис)

Засвідчую, що у цій дипломній роботі

немає запозичень з праць інших авторів

без відповідних посилань.

Студент _____________ (підпис)

Київ – 2015 року

Page 2: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

6

ЗМІСТ

ЗМІСТ ....................................................................................................................... 5

ВСТУП ...................................................................................................................... 8

РОЗДІЛ 1. Теоретична частина ............................................................................ 10

1.1. Специфіка ринку дорогоцінних металів ................................................... 10

1.2. Технології для прогнозування та аналізу даних ...................................... 13

1.2.1. Що таке аналітичні технології ............................................................ 15

1.2.2. Традиційні технології ........................................................................... 16

1.2.3. Імовірнісні моделі ................................................................................. 16

1.2.4. Недоліки традиційних технологій ...................................................... 17

1.3. Що таке нейронні мережі ........................................................................... 18

1.3.1. Переваги нейронних мереж ................................................................. 22

1.3.2. Основний недолік нейромереж ........................................................... 28

1.4. Будова та принципи роботи нейронної мережі ....................................... 28

1.4.1. Біологічна модель нейрона .................................................................. 28

1.4.1. Моделі нейронів ................................................................................... 32

1.4.2. Типи функцій активації........................................................................ 34

1.4.3. Архітектура мереж ............................................................................... 37

1.4.4. Навчання мережі ................................................................................... 42

РОЗДІЛ 2. Прогнозування цін на акції золотодобувної канадської компанії

Barrick Gold за допомогою нейронних мереж .................................................... 47

2.1. Збір даних для проектування нейромережі .............................................. 47

2.2. Проектування нейромережі ...................................................................... 49

2.3. Навчання і тестування нейромережі ......................................................... 51

2.4. Оптимізація нейромережі........................................................................... 55

РОЗДІЛ 3. ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ

СИТУАЦІЯХ .......................................................................................................... 58

3.1. Аналіз умов праці........................................................................................ 59

3.2. Аналіз шкідливих та небезпечних чинників ............................................ 60

3.3. Освітлення ................................................................................................... 60

Page 3: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

7

3.4. Електробезпека ............................................................................................ 61

3.5. Допомога при ураженні електричним струмом ....................................... 63

3.6. Мікроклімат робочої зони .......................................................................... 63

3.7. Пожежна безпека ........................................................................................ 64

3.8. Допомога при ураженні електричним струмом ....................................... 65

3.9. Висновки до розділу ................................................................................... 66

ВИСНОВКИ ........................................................................................................... 67

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ............................................................. 68

ДОДАТКИ .............................................................................................................. 72

Додаток А ............................................................................................................... 73

Додаток Б ................................................................................................................ 75

Page 4: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

8

ВСТУП

В останні кілька років ми спостерігаємо вибух інтересу до нейронних

мереж, які успішно застосовуються в різних галузях - бізнесі, медицині,

техніці, геології, фізиці. Нейронні мережі ввійшли в практику скрізь, де

потрібно розв’язувати завдання прогнозування, класифікації або управління.

Нейронні мережі являють собою нову і дуже перспективну

обчислювальну технологію, що дає нові підходи до дослідження динамічних

задач у фінансовій області. Спочатку нейронні мережі відкрили нові

можливості в області розпізнавання образів, потім до цього додалися

статистичні і засновані на методах штучного інтелекту засоби підтримки

прийняття рішень і вирішення завдань у сфері фінансів.

Здатність до моделювання нелінійних процесів, роботи з зашумленими

даними і адаптивність дають можливість застосовувати нейронні мережі для

вирішення широкого класу фінансових завдань. В останні кілька років на

основі нейронних мереж було розроблено багато програмних систем для

застосування в таких питаннях, як операції на товарному ринку, оцінка

ймовірності банкрутства банку, оцінка кредитоспроможності, контроль за

інвестиціями, розміщення позик.

Саме тому тема, яку я обрав для своєї дипломної роботи, є надзвичайно

актуальною та перспективною для вивчення та дослідження, особливо для

студентів кафедри математичного моделювання економічних систем.

Об’єктом дослідження даної роботи є Barrick Gold Corporation -

канадська гірничодобувна компанія, один зі світових лідерів з видобутку

золота.

Предметом дослідження є штучні нейронні мережі, їх можливості та

перспективи у сфері фінансового прогнозування.

Мета роботи – поглиблення знань про нейронні мережі, самостійна

розробка мережі та прогнозування вартості акцій на ринку цінних паперів з її

допомогою.

Page 5: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

9

Мета визначає наступні завдання дипломної роботи:

1) вивчення літератури, інтернет-ресурсів, програмних засобів, що

реалізують нейромережеві принципи для вирішення задач прогнозування;

2) вивчення історії виникнення нейронних мереж, їх перспектив,

структури, принципів роботи;

3) вивчення та аналіз принципів формування ринкової вартості

акцій, виявлення факторів, що на неї впливають;

4) побудова власної нейронної мережі, її навчання, апробація,

тестування;

5) прогноз ціни на акції Barrick Gold Corporation за допомогою

побудованої нейронної мережі.

Методи дослідження. Відомо величезна кількість різних методів

навчання нейронних мереж. Одним з класичних вважається метод зворотного

поширення помилки, заснований на градієнтному методі мінімізації. Проте в

чистому вигляді метод працює погано. Надмірне число вагових коефіцієнтів

призводить до небажаних явищ мультиколлінеарності і перенавчання. Не

ясно, якою має бути структура мережі для вирішення даної конкретної

задачі: кількість шарів, кількість нейронів в них, зв'язки між нейронами. Для

вирішення цих проблем був використаний метод Арнольда-Колмогорова-

Хехт-Нельсона.

Page 6: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

10

РОЗДІЛ 1

Теоретична частина

1.1. Специфіка ринку дорогоцінних металів

Ринок дорогоцінних металів являє собою механізм, який є

найважливішою складовою частиною виробництва, розподілу та споживання

фінансових активів, що забезпечує і регулює потреби шляхом реалізації

продуктів видобутку та перерозподілу вивільнених запасів.

У сучасній економіці роль дорогоцінних металів істотно змінилася -

золото більше не є «світовими грошима», але завдяки своїм унікальним

фізико-хімічними властивостям, дорогоцінні метали все ширше входять в

сферу промислового виробництва, особливо в галузях, що використовують

новітні технології. Висока питома цінність (рідкість, компактність,

можливість неодноразового споживання та тривалого використання),

ліквідність (розвинена мережа збуту і постійний попит) визначають

використання дорогоцінних металів і каміння в якості фінансових активів.

Таким чином, в умовах сталася демонетаризації дорогоцінні метали

виконують подвійну функцію. З одного боку, злитки і монети з дорогоцінних

металів є об'єктом банківського та біржового оборотів, входять до складу

державних і міжнародних золотовалютних резервів і тезавраційних фондів,

виступають найважливішим ресурсом, здатним забезпечити економічний і

фінансовий потенціал держави-продуцента, гарантувати стабільність банку, а

також добробут окремої людини. Основою світової фінансової системи на

даний момент є американський долар, забезпечений всіма активами США, в

тому числі і найбільшими в світі золотими резервами, що пояснює

прагнення, як держав, так і приватних власників підтримувати золоті активи

в високоліквідному стані. Багато країн постійно котирують вартість

національних золотих запасів відповідно зі світовими цінами. [33]

Page 7: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

11

З іншого боку, дорогоцінні метали залишаються найважливішим видом

військово-стратегічної та промислової сировини, без якого неможливе

функціонування підприємств військово-промислового комплексу,

електроніки, а також цивільного літакобудування, ювелірної, автомобільної,

хімічної промисловостей та багатьох інших галузей народного господарства.

Незважаючи на той факт, що індустріальні держави активно фінансують

програми пошуку технологій, спрямованих на мінімізацію використання

дорогоцінних металів, зменшення їх промислового споживання не

спостерігається.

Стратегічна роль дорогоцінних металів у світовій економіці

визначається стабільністю попиту на ці цінності. Висока ліквідність золотих

активів на світовому ринку забезпечується паритетом між трьома основними

сферами вкладення капіталу в:

видобуток і виробництво дорогоцінних металів;

виробництво ювелірних виробів та торгівлю ними;

фінансовий обіг злитків з дорогоцінних металів.

Основою цього паритету є історично сформована культура обігу

дорогоцінних металів на світовому ринку, що надає всім учасникам

юридично коректні процедури угод, великий набір фінансових інструментів

для диверсифікації вкладень і зниження ризиків, практично необмежений

набір сервісних послуг. [38]

Найвигіднішим способом отримати прибуток з золота є придбання

акцій компаній, які його видобувають, тому що акції золотодобувних

компаній мають тенденцію зростати в ціні швидше, ніж саме золото. Як і

всякі інші акції, їх легко купити і продати. Вони не вимагають якихось

спеціальних умов зберігання чи страхування і нерідко приносять дивіденди,

які в деяких випадках у два-три рази перевищують ті, що виплачуються зараз

з цінних паперів грошового ринку.

Кількість великих золотих копалень у світі невелике, і після чотирьох

тисяч років пошуків малоймовірно, щоб ми раптово виявили багато великих

Page 8: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

12

родовищ. Після того як протягом двадцяти років на золотому ринку панували

«ведмеді», сектор золотодобувної промисловості звузився до крихітного

розміру. Не дивлячись на значне поліпшення в порівнянні з низькими

показниками 2000 до кінця 2003 року ринкова капіталізація всіх акцій

золотодобувних компаній світу оцінювалася приблизно в 100 млрд. Доларів,

що становить близько третини ринкової вартості корпорації «Майкрософт»

та менше двох відсотків сукупної вартості фірм, входять в індекс рейтингової

компанії «S & P 500».

У тих випадках, коли зростає ціна на золото, виростають і доходи

видобувної компанії, а значить і виростає ціна акцій. Однак, слід врахувати

деякі додаткові фактори, і не завжди ціна акцій золотодобувної компанії

зростає зі зростанням ціни золота. На відміну від золотих злитків, які

вважаються відмінним способом збереження коштів, незахищені акції

вважаються дуже ризикованим і нестабільним придбанням. Мінливість

викликається властивим золотодобувних сектору важелям. Наприклад, ви

володіє акціями компанії, вартість виробництва однієї унції для якої

становить $ 200, а ціна продажу - $ 400. У такому випадку розмір прибутку

компанії складе $ 200. Зростання ціни на золото на ринку в 10% ($ 440)

призведе до того, що доходи компанії зростуть до $ 440, тобто на 20%, а

значить, в потенціалі на 20% зросте і ціна однієї акції. На жаль, падіння ціни

золота на 10% також призведе до скорочення прибутку компанії на 20%, а

значить і зменшення ціни акції на 20%.

Сильне збільшення доходів з видобутку золота під час зростання цін на

цей метал може спровокувати золоту лихоманку в цій галузі.

Щоб знизити цю мінливість, багато золотодобувні компанії фіксують

ціну на золото на період в 18 місяців. Це дозволяє і компанії, і інвесторам

стати менш уразливими до короткочасних ціновим флуктуацій, однак це і

знижує прибуток, одержуваний при зростанні ціни на золото. [42]

В своїй дипломній роботі я розглядав одну з найбільших

золотодобувних компаній світу - Barrick Gold Corporation.

Page 9: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

13

Barrick Gold Corporation є найбільшим золотодобувна компанія в світі,

зі штаб-квартирою в Торонто, Онтаріо, Канада. Barrick в даний час

проводить гірничодобувні проекти в Аргентині, Австралії, Канаді, Чилі,

Домініканській Республіці, Папуа-Нової Гвінеї, Перу, Саудівській Аравії,

США та Замбії. За перший квартал 2015 року компанія виробила 1,39 млн.

унцій золота з витратами $ 927 за унцію. [43]

1.2. Технології для прогнозування та аналізу даних

Аналітика фінансових ринків базується на двох складових: технічний і

фундаментальний аналіз. Ніякі аналітичні огляди не складаються без цих

потужних інструментів дослідження ринку, саме завдяки їм можна

достовірно припустити, які значення будуть приймати основні економічні

показники, котирування акцій і курси світових валют.

Технічний аналіз - це вивчення змін в минулому і сьогоденні технічних

параметрів руху досліджуваного активу з метою передбачення змін даних

параметрів в майбутньому. На перший погляд, складне визначення, але

головне, що з цього випливає, що ціни акцій змінюються тенденціями.

Тенденція (наприклад, «підвищення») - це не момент часу, а період часу,

тому дії (наприклад, покупка акцій) у поточній тенденції повинні бути

однотипними. І навпаки, якщо тенденція в минулому і теперішньому часі

«зниження», то в поточний момент "входу в ринок» тенденція раптом не

зміниться, а з цього випливає, що ви повинні відбуватися операція «продаж

акцій», з подальшою операцією «купівля акцій» . Технічний аналіз дозволяє

приймати правильні рішення за операціями з акціями, минаючи вплив

зовнішніх чинників - поради знайомих, телебачення, радіо, газети і т.і.

Фундаментальний аналіз - один з методів, який пропонує аналітика,

націлений на прогнозування зміни ціни з точки зору вивчення політико-

економічної ситуації в світі та в країні, економічної ситуації і загального

стану в галузі, в конкретному емітенті, економічні показники і т.і. Даний вид

Page 10: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

14

аналітики передбачає вивчення балансів, щоквартальних та щорічних звітів,

біржовий кон'юнктури і прогнозування ситуації в галузях економіки. У

вузькому сенсі фундаментальний аналіз - аналіз фінансової діяльності

компанії з метою адекватної оцінки цінних паперів, при цьому особлива

увага приділяється майбутнім доходам компанії, очікуваним дивідендах і

майбутнім процентних ставках, а так само оцінка ризику діяльності компанії.

При складанні аналітичних оглядів застосовується метод «зверху-вниз» (top-

down), тобто послідовно вивчаються:

• Економічна ситуація в цілому (в світі і в країні);

• Ситуація в обраній галузі;

• Показники фінансового становища підприємств;

• Визначення і прогнозування майбутньої вартості акцій підприємства.

Сама назва «фундаментальний аналіз» говорить про те, що його

методами можливо оцінити процес формування вартості акцій. В даному

випадку оцінюються такі індекси, як індекс Dow Jones, S&P/TSX 60, Nasdaq

Composite, RTS, FTSE_100, показники ймовірності державного перевороту та

скоєння терористичних актів, ціни на золото, курс канадського долара

відносно долара США, ставка рефінансування та курс акцій компанії.

Кінцевим підсумком аналізу є розрахунок очікуваної ціни акцій Barrick Gold

Corporation.

Фундаментальний аналіз - одна з найскладніших, але в теж час одна з

найголовніших складових роботи на ринку. Проводити фундаментальний

аналіз складно ще й тому, що в різні періоди часу одні й ті ж показники по-

різному впливають на кінцевий результат і можуть бути як найважливішими,

так і виступати в ролі другорядних і незначних. Фундаментальний аналіз

найдоцільніше використовувати спільно з технічним аналізом, подібна

зв'язка допомагає уникнути необґрунтованих ризиків і більш точно

визначити моменти входу в ринок.

Page 11: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

15

1.2.1. Що таке аналітичні технології

Аналітичні технології - це методики, які на основі яких-небудь

моделей, алгоритмів, математичних теорем дозволяють за відомими даними

оцінити значення невідомих характеристик і параметрів.

Найпростіший приклад аналітичної технології - теорема Піфагора, яка

дозволяє по довжинах сторін прямокутника визначити довжину його

діагоналі.

Іншим прикладом аналітичної технології є способи, за допомогою яких

обробляє інформацію людський мозок. Навіть мозок дитини може

вирішувати завдання, непідвладні сучасних комп'ютерів, такі як

розпізнавання знайомих облич у натовпі або ефективне управління

декількома десятками м'язів при грі в футбол.

Аналітичні технології потрібні в першу чергу людям, які приймають

важливі рішення - керівникам, аналітикам, експертам, консультантам. Дохід

компанії у великій мірі визначається якістю цих рішень - точністю прогнозів,

оптимальністю обраних стратегій.

Прогнозування:

• курсів валют

• цін на сировину

• попиту

• доходу компанії

• рівня безробіття

• числа страхових випадків.

оптимізація:

• розкладів

• маршрутів

• плану закупівель

• плану інвестицій

• стратегії розвитку.

Page 12: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

16

Як правило, для реальних завдань бізнесу та виробництва не існує

чітких алгоритмів вирішення. Раніше керівники та експерти вирішували такі

завдання тільки на основі особистого досвіду. За допомогою аналітичних

технологій будуються системи, що дозволяють істотно підвищити

ефективність рішень.

1.2.2. Традиційні технології

Найбільш ранні традиційні технології - це детерміновані технології.

Аналітичні технології типу теореми Піфагора використовуються людиною

вже багато століть. За цей час було створено величезну кількість формул,

теорем і алгоритмів для вирішення класичних задач - визначення обсягів,

рішення систем лінійних рівнянь, пошуку коренів многочленів. Розроблено

складні й ефективні методи для вирішення задач оптимального управління,

рішення диференціальних рівнянь і т.д. Всі ці методи діють за однією і тією

ж схемою. Для того, щоб алгоритм був застосовний, необхідно, щоб дана

задача повністю описувалася певної детермінованою моделлю (деяким

набором відомих функцій і параметрів). У такому випадку алгоритм дає

точну відповідь. Наприклад, для застосовності теореми Піфагора слід

перевірити, що трикутник - прямокутний.

1.2.3. Імовірнісні моделі

На практиці часто зустрічаються завдання, пов'язані з наглядом

випадкових величин - наприклад, завдання прогнозування курсу акцій. Для

подібних завдань не вдається побудувати детерміновані моделі, тому

застосовується принципово інший, імовірнісний підхід. Параметри

імовірнісних моделей - це розподілу випадкових величин, їх середні

значення, дисперсії і т.д. Як правило, ці параметри спочатку невідомі, а для їх

Page 13: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

17

оцінки використовуються статистичні методи, що застосовуються до вибірок

спостережуваних значень (історичними даними). Але такого роду методи

також припускають, що відома деяка імовірнісна модель задачі. Наприклад, в

задачі прогнозування курсу можна припустити, що завтрашній курс акцій

залежить тільки від курсу за останні два дні (авторегресійна модель). Якщо

це правда, то спостереження курсу протягом декількох місяців дозволяють

досить точно оцінити коефіцієнти цієї залежності і прогнозувати курс в

майбутньому.

1.2.4. Недоліки традиційних технологій

На жаль, класичні методики виявляються малоефективними в багатьох

практичних завданнях. Це пов'язано з тим, що неможливо досить повно

описати реальність за допомогою невеликого числа параметрів моделі, або

розрахунок моделі вимагає занадто багато часу і обчислювальних ресурсів.

Традиційні технології застосовні далеко не завжди, але і імовірнісні

технології також володіють істотними недоліками при вирішенні практичних

завдань. Залежності, що зустрічаються на практиці, часто нелінійні. Навіть

якщо й існує проста залежність, то її вид заздалегідь невідомий. Відзначимо

також, що статистичні методи добре розвинені тільки для одновимірних

випадкових величин. Якщо ж ми хочемо враховувати для прогнозування

курсу акцій кілька взаємозалежних факторів (наприклад, обсяг угод, курс

долара і т.д.), то доведеться звернутися до побудови багатовимірної

статистичної моделі. Однак такі моделі або припускають гауссовское

розподіл спостережень (що не виконується на практиці), або не обгрунтовані

теоретично. У багатовимірної статистики, за відсутністю кращого, нерідко

застосовують малообґрунтовані евристичні методи, які по своїй суті дуже

близькі до технології нейронних мереж.

Page 14: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

18

1.3. Що таке нейронні мережі

Дослідження штучних нейронних мереж пов'язані з тим, що спосіб

обробки інформації людським мозком в корені відрізняється від методів, що

застосовують звичайні цифрові комп'ютери. Мозок - це надзвичайно

складний, нелінійний, паралельний комп'ютер (система обробки інформації).

Він має здатність організовувати свої структурні компоненти (нейрони), так,

щоб вони могли виконувати конкретні завдання (такі як розпізнавання

образів, обробку сигналів органів чуття, моторні функції) у багато разів

швидше, ніж можуть дозволити найшвидші сучасні комп'ютери. Прикладом

такого завдання обробки інформації може служити звичайний зір. У функції

зорової системи входить створення представлення навколишнього світу в

такому вигляді, який забезпечує можливість взаємодії з цим світом. Більш

точно, мозок послідовно виконує ряд задач розпізнавання (наприклад,

розпізнавання знайомого обличчя в незнайомому оточенні). На це у нього

йде близько 100-200 мілісекунд, в той час як виконання аналогічних завдань

навіть меншої складності на комп'ютері може зайняти кілька днів.

Іншим прикладом може служити локатор кажана, що представляє

собою систему активної ехолокації. Крім надання інформації про відстань до

потрібного об'єкту (наприклад, мошки) цей локатор надає інформацію про

відносну швидкість об'єкта, про його розміри і розміри його окремих

елементів, а також про азимут і висоту руху об'єкта. Для виділення цієї

інформації з одержуваного сигналу крихітний мозок кажана проводить

складні нейронні обчислення. Ехолокація кажана за своїми характеристиками

якості та швидкодії перевершує найскладніші прилади, створені інженерами.

Що ж дозволяє мозку людини або кажана досягти таких результатів?

При народженні мозок має досконалу структуру, що дозволяє будувати

власні правила на підставі того, що ми називаємо "досвідом". Досвід

накопичується з часом, і особливо масштабні зміни відбуваються в перші два

роки життя людини. У цей період формується основа загальної структури.

Page 15: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

19

Однак розвиток на цьому не припиняється - він продовжується до останніх

днів життя людини.

Поняття розвитку нейронів пов'язане з поняттям пластичності мозку -

здатності налаштування нервової системи відповідно до навколишніх умов.

Саме пластичність грає найважливішу роль в роботі нейронів в якості

одиниць обробки інформації в людському мозку. Аналогічно, в штучних

нейронних мережах робота проводиться з штучними нейронами. У

загальному випадку нейронна мережа являє собою машину, що моделює

спосіб обробки мозком конкретного завдання. Ця мережа зазвичай

реалізується за допомогою електронних компонентів або моделюється

програмою, що виконується на цифровому комп'ютері. Для того щоб

отримати високу продуктивність, нейронні мережі використовують безліч

взаємозв'язків між елементарними осередками обчислень - нейронами. Таким

чином, можна дати наступне визначення нейронних мереж, що виступають у

ролі адаптивної машини.

Нейронна мережа - це величезний розподілений паралельний процесор,

що складається з елементарних одиниць обробки інформації, що

накопичують експериментальні знання і надають їх для подальшої обробки.

Нейронна мережа схожа з мозком з двох точок зору.

• Знання надходять в нейронну мережу з навколишнього середовища і

використовуються в процесі навчання.

• Для накопичення знань застосовуються зв'язки між нейронами

(синаптичними вагами).

Процедура, що використовується для процесу навчання, називається

алгоритмом навчання. Ця процедура будує в певному порядку синаптичні

ваги нейронної мережі для забезпечення необхідної структури взаємозв'язків

нейронів.

Зміна синаптичних ваг являє собою традиційний метод налаштування

нейронних мереж. Цей підхід дуже близький до теорії лінійних адаптивних

фільтрів, яка вже давно заявила про себе і застосовується в різних областях

Page 16: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

20

діяльності людини. Однак нейронні мережі можуть змінювати власну

топологію. Це обумовлено тим фактом, що нейрони в людському мозку

постійно відмирають, а нові синаптичні зв'язки постійно створюються.[33]

Нейронні мережі можуть бути класифіковані за рядом ознак.

Класифікація нейронних мереж за характером навчання ділить їх на:

• нейронні мережі, що використовують навчання з учителем;

• нейронні мережі, що використовують навчання без учителя.

Розглянемо їх докладніше.

У нейронних мережах, що використовують навчання з вчителем, для

кожного вхідного вектора існує цільовий вектор, що представляє собою

необхідний вихід. Разом вони називаються навчальною парою. Зазвичай

мережа навчається на деякому числі таких навчальних пар. Пред'являється

вихідний вектор, обчислюється вихід мережі і порівнюється з відповідним

цільовим вектором. Далі ваги змінюються відповідно до алгоритму, що

прагнуть мінімізувати помилку. Вектори навчальної множини

пред'являються послідовно, обчислюються помилки і ваги підлаштовуються

для кожного вектора доти, поки помилка по всьому навчальному масиву не

досягне прийнятного рівня.

Навчання нейромережі без вчителя є набагато більш правдоподібною

моделлю навчання з погляду біологічних коренів штучних нейронних мереж.

Розвинена Кохоненом і його послідовниками, вона не потребує цільового

вектора для виходів і, отже, не вимагає порівняння з зумовленими

ідеальними відповідями. Навчальна множина складається лише з вхідних

векторів. Навчальний алгоритм підлаштовує ваги мережі так, щоб виходили

узгоджені вихідні вектори, тобто щоб пред'явлення досить близьких вхідних

векторів давало однакові виходи. Процес навчання, отже, виділяє статистичні

властивості навчальної множини і групує схожі вектори в класи.

За методом налаштування ваг нейронні мережі поділяються на:

• мережі з фіксованими зв'язками - вагові коефіцієнти нейронної мережі

вибираються відразу, виходячи з умов задачі;

Page 17: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

21

• мережі з динамічними зв'язками - для них в процесі навчання

відбувається налаштування синаптичних ваг.

За типом вхідної інформації нейромережі класифікуються на:

• мережі з аналоговою вхідною інформацією - вхідна інформація

представлена у формі дійсних чисел;

• мережі з двійковою вхідною інформацією - вся вхідна інформація в

таких мережах представляється у вигляді нулів і одиниць.

Залежно від застосовуваної моделі нейронної мережі, нейромережі

можна розділити на чотири класи: мережі прямого поширення, рекурентні

мережі, радіально базисні функції і самоорганізовані карти або Мережі

Кохонена.

У мережах прямого поширення всі зв'язки спрямовані строго від

вхідних нейронів до вихідних. До таких мереж відносяться, наприклад:

найпростіший персептрон (розроблений Розенблатта) і багатошаровий

персептрон.

У рекурентних нейромережах сигнал з вихідних нейронів або нейронів

прихованого шару частково передається назад на входи нейронів вхідного

шару.

Радіально базисні функції - вид нейронної мережі, що має прихований

шар з радіальних елементів і вихідний шар з лінійних елементів. Мережі

цього типу досить компактні і швидко навчаються. Запропоновано в роботах

Broomhead and Lowe (1988) і Moody and Darkin (1989). Радіально базисна

мережа володіє наступними особливостями: один прихований шар, тільки

нейрони прихованого шару мають нелінійну активаційну функцію і

синаптичні ваги вхідного і прихованого шарів дорівнюють одиниці.

Самоорганізовані карти або Мережі Кохонена - такий клас мереж, як

правило, навчається без учителя і успішно застосовується в задачах

розпізнавання. Мережі такого класу здатні виявляти новизну у вхідних

даних: якщо після навчання мережа зустрінеться з набором даних, несхожим

ні на один з відомих зразків, то вона не зможе класифікувати такий набір і

Page 18: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

22

тим самим виявить його новизну. Мережа Кохонена має всього два

прошарки: вхідний і вихідний, складений з радіальних елементів.

1.3.1. Переваги нейронних мереж

Цілком очевидно, що свою силу нейронні мережі черпають, по-перше,

з розпаралелювання обробки інформації і, по-друге, із здатності

самонавчатися, тобто створювати узагальнення. Під терміном узагальнення

розуміється здатність отримувати обґрунтований результат на підставі даних,

які не зустрічалися в процесі навчання. Ці властивості дозволяють

нейронним мережам вирішувати складні (масштабні) завдання, які на

сьогоднішній день вважаються важковирішуваними. Однак на практиці при

автономній роботі нейронні мережі не можуть забезпечити готові рішення. Їх

необхідно інтегрувати в складні системи. Зокрема, комплексну задачу можна

розбити на послідовність щодо простих, частина з яких може вирішуватися

нейронними мережами. Дуже важливо усвідомити, що для створення

комп'ютерної архітектури, яка буде здатна імітувати людський мозок (якщо

таке виявиться можливим взагалі), доведеться пройти довгий і важкий шлях.

Використання нейронних мереж забезпечує наступні корисні

властивості систем:

1. Нелінійність.

Штучні нейрони можуть бути лінійними і нелінійними. Нейронні

мережі, побудовані із з'єднань нелінійних нейронів, самі є нелінійними.

Більше того, ця нелінійність особливого сорту, так як вона розподілена по

мережі. Нелінійність є надзвичайно важливою властивістю, особливо якщо

сам фізичний механізм, відповідальний за формування вхідного сигналу, теж

є нелінійним (наприклад, людська мова).

Page 19: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

23

2. Відображення вхідної інформації у вихідну.

Однією з популярних парадигм навчання є навчання з учителем. Це

передбачає зміну синаптичних ваг на основі навчальних прикладів. Кожен

приклад складається з вхідного сигналу і відповідного йому бажаного

відгуку. З цієї множини випадковим чином вибирається приклад, а нейронна

мережа модифікує синаптичні ваги для мінімізації розбіжностей бажаного

вихідного сигналу і формованого мережею відповідно до обраного

статистичному критерію. При цьому модифікуються вільні параметри

мережі. Раніше використані приклади можуть згодом бути застосовані знову,

але вже в іншому порядку. Це навчання проводиться до тих пір, поки зміни

синаптичних ваг не стануть незначними. Таким чином, нейронна мережа

навчається на прикладах, складаючи таблицю відповідностей вхід-вихід для

конкретного завдання. Такий підхід змушує згадати непараметричне

статистичне навчання. Цей напрямок статистики має справу з оцінками, не

пов'язаними з будь-якої конкретної моделлю, або, з біологічної точки зору, з

навчанням з нуля. Тут термін "непараметричний" використовується для

акцентування того, що спочатку не існує ніяких, зумовлених статистичною

моделлю, вхідних даних. Для прикладу розглянемо задачу класифікації

образів. У ній потрібно співвіднести вхідний сигнал, що представляє

фізичний об'єкт, або подія, з деякою визначеною категорією (класом). При

непараметричному підході до цієї задачі потрібно "оцінити" рамки рішення в

просторі вхідного сигналу на основі набору прикладів. При цьому не

використовується ніяка імовірнісна модель розподілу. Аналогічний підхід

застосовується і в парадигмі навчання з учителем. Це ще раз підкреслює

паралель між відображенням вхідних сигналів у вихідні, здійснюваним

нейронною мережею, і непараметричним статистичними навчанням.

3. Адаптивність.

Нейронні мережі мають здатність адаптувати свої синаптичні ваги до

змін навколишнього середовища. Зокрема, нейронні мережі, навчені діяти в

певному середовищі, можуть бути легко переучені для роботи в умовах

Page 20: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

24

незначних коливань параметрів середовища. Більш того, для роботи в

нестаціонарної середовищі (де статистика змінюється з часом) можуть бути

створені нейронні мережі, що змінюють синаптичні ваги в реальному часі.

Природна для класифікації образів, обробки сигналів і завдань управління

архітектура нейронних мереж може бути об'єднана з їх здатністю до

адаптації, що призведе до створення моделей адаптивної класифікації

образів, адаптивної обробки сигналів і адаптивного управління. Відомо, що

чим вище адаптивні здібності системи, тим більш стійкою буде її робота в

нестаціонарному середовищі. При цьому хотілося б зауважити, що

адаптивність не завжди веде до стійкості; іноді вона призводить до

абсолютно протилежного результату. Наприклад, адаптивна система з

параметрами, що швидко змінюються в часі, може також швидко реагувати і

на сторонні збудження, що викличе втрату продуктивності. Для того щоб

використовувати всі переваги адаптивності, основні параметри системи

повинні бути досить стабільними, щоб можна було не враховувати зовнішні

перешкоди, і досить гнучкими, щоб забезпечити реакцію на істотні зміни

середовища. Це завдання зазвичай називається дилемою стабільності-

пластичності.

4. Очевидність відповіді.

У контексті задачі класифікації образів можна розробити нейронну

мережу, що збирає інформацію не тільки для визначення конкретного класу,

але і для збільшення достовірності прийнятого рішення. Згодом ця

інформація може використовуватися для виключення сумнівних рішень, що

підвищить продуктивність нейронної мережі.

5. Контекстна інформація.

Знання подаються у самій структурі нейронної мережі за допомогою її

стану активації. Кожен нейрон мережі потенційно може бути підданий

впливу всіх інших її нейронів. Як наслідок, існування нейронної мережі

безпосередньо пов'язано з контекстної інформацією.

Page 21: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

25

6. Відмовостійкість.

Нейронні мережі, одягнені у форму електроніки, потенційно

відмовостійкі. Це означає, що при несприятливих умовах їх продуктивність

падає незначно. Наприклад, якщо пошкоджений якийсь нейрон або його

зв'язки, витяг запам’ятованої інформації ускладнюється. Однак, беручи до

уваги розподілений характер зберігання інформації в нейроннії мережі,

можна стверджувати, що тільки серйозні пошкодження структури нейронної

мережі суттєво вплинуть на її працездатність. Тому зниження якості роботи

нейронної мережі відбувається повільно. Незначне пошкодження структури

ніколи не викликає катастрофічних наслідків. Це - очевидна перевага

нейромережевих обчислень. Щоб гарантувати відмовостійкість роботи

нейронної мережі, в алгоритмі навчання потрібно закладати відповідні

поправки.

7. Масштабованість.

Паралельна структура нейронних мереж потенційно прискорює

рішення деяких завдань і забезпечує масштабованість нейронних мереж в

рамках технології VLSI (very-large-scale-integrated). Однією з переваг

технологій VLSI є можливість представити досить складну поведінку за

допомогою ієрархічної структури.

8. Единообразність аналізу і проектування.

Нейронні мережі є універсальним механізмом обробки інформації. Це

означає, що одне і те ж проектне рішення нейронної мережі може

використовуватися в багатьох предметних областях. Ця властивість

проявляється декількома способами.

• Нейрони в тій чи іншій формі є стандартними складовими частинами

будь-якої нейронної мережі.

• Ця спільність дозволяє використовувати одні й ті ж теорії і алгоритми

навчання в різних нейромережевих додатках.

• Модульні мережі можуть бути побудовані на основі інтеграції цілих

модулів.

Page 22: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

26

9. Аналогія з нейробіологією.

Будова нейронних мереж визначається аналогією з людським мозком,

який є живим доказом того, що відмовостійкі паралельні обчислення не

тільки фізично реалізовані, але і є швидким і потужним інструментом

вирішення завдань. Нейробіологи розглядають штучні нейронні мережі як

засіб моделювання фізичних явищ. З іншого боку, інженери постійно

намагаються підчерпнути у нейробіологів нові ідеї, що виходять за рамки

традиційних електросхем. Ці дві точки зору можна продемонструвати на

таких прикладах.

• У роботі моделі лінійних систем вестибуло-окулярного рефлексу

порівнювалися з моделями рекурентних нейронних мереж. Вестибуло-

окулярний рефлекс, або рефлекс VOR (vestibulo-ocular reflex), є складовою

частиною окодвижної системи. Його завданням є забезпечення стабільності

візуального образу при поворотах голови за рахунок обертання очей. Процес

VOR реалізується премоторними нейронами у вестибулярному центрі, які

отримують і обробляють сигнали повороту голови від вестибулярних

сенсорних нейронів і передають результат на моторні нейрони м'язів очей.

Механізм VOR добре підходить для моделювання, так як вхідний (поворот

голови) і вихідний (поворот очей) сигнали можна точно описати. До того ж

це досить простий рефлекс, а нейрофизических властивості реалізують його

нейронів досить добре описані. Серед трьох задіяних в ньому типів нейронів

премоторні нейрони, що входять до складу вестибулярного центру, є

найскладнішими, а значить, найцікавішими. Раніше механізм VOR

моделювався за допомогою зосередженої лінійної системи та теорії

управління. Ці моделі були придатні для опису деяких загальних

властивостей VOR, але не давали чіткого уявлення про властивості самих

нейронів. З появою нейромережевих моделей ситуація докорінно змінилася.

Рекурентні моделі VOR (програми, що використовують алгоритм

рекурентного навчання в реальному часі) дозволили відтворити і описати

Page 23: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

27

багато статичні, динамічні, нелінійні та розподілені аспекти обробки сигналів

при реалізації рефлексу VOR і, зокрема, вестибулярний центр .

• Сітківка, більш ніж якась інша частина мозку, виконує функції

взаємозв'язку навколишнього світу, представленого візуальним рядом або

фізичним зображенням, проектуються на матрицю рецепторів, з першим

нейронним зображенням. Сітківка - це матриця мікроскопічних рецепторів на

зовнішній лицьовій стороні очного яблука. В її завдання входить

перетворення оптичного сигналу в нейронах зображення, що передається по

оптичних нервах в різні центри для аналізу. Беручи до уваги синаптичну

організацію сітківки, це - складне завдання. У будь сітківці перетворення

зображення з оптичного у нейронах проходить три стадії:

1. Зняття фотокопії шаром нейронів-рецепторів.

2. Передача сформованого сигналу (реакція на світло) хімічними

синапсами на шар біполярних клітин .

3. Передача цих сигналів (також за допомогою хімічних синапсів) на

вихідні нейрони.

На двох останніх стадіях (при передачі інформації від рецепторів на

біполярні рецептори і від останніх - на вихідні нейрони) в операції беруть

участь спеціальні нейрони з латеральним гальмуванням, у тому числі так

звані горизонтальні клітини. Їх завданням є перетворення сигналу між

різними синаптичними шарами. Також існують відцентрові елементи, що

забезпечують передачу сигналу з внутрішнього синаптичного шару на

зовнішній. Деякі дослідники створювали електронні мікросхеми, що

імітують структуру сітківки. Ці електронні чіпи називалися нейроморфними

контурами. Нейроморфні сенсори являють собою матрицю фоторецепторів,

пов'язаних з відповідними елементами малюнка (пікселями). Вони імітують

сітківку в тому сенсі, що можуть адаптуватися до зміни освітленості,

ідентифікувати контури і рух. Нейробіологічна модель, втілена в

нейроморфні контури, забезпечила ще одну перевагу: вона вселила надію на

Page 24: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

28

те, що фізичне розуміння нейробіологічених структур може зробити істотний

вплив на область електроніки і технологію VLSI.

Після розгляду цих прикладів з нейробіології стає ясно, чому стільки

уваги приділяється людському мозку та його структурним рівням організації.

1.3.2. Основний недолік нейромереж

Недолік нейронних мереж полягає в тому, що нам, розробникам,

недоступно те, що відбувається всередині мережі. Ми формуємо входи, після

цього розраховуємо виходи і просто зіставляємо одне з іншим. У нас немає

можливості детально і покроково простежити те, як отримані на виході

значення були розраховані. Цей режим виконання обчислень в «чорному

ящику» надзвичайно ускладнює процес інтерпретації результатів і

модифікації мережі - неясно, що в ній потрібно змінити, щоб стало точніше.

1.4. Будова та принципи роботи нейронної мережі

1.4.1. Біологічна модель нейрона

Нервову систему людини можна розглядати як триступеневу (рис. 1.1) .

Центром цієї системи є мозок, представлений мережею нейронів (нервів). Він

отримує інформацію, аналізує її та видає відповідні рішення.

Рис. 1.1. Триступенева модель нервової системи людини

Page 25: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

29

На рис. 1.1 показані два набори стрілок. Стрілки, спрямовані зліва

направо, позначають пряму передачу сигналів інформації в систему, а

стрілки, спрямовані справа наліво, - відповідну реакцію системи. Рецептори

перетворюють сигнали від тіла і з навколишнього середовища в електричні

імпульси, які передаються в нейронну мережу (мозок). Ефектори

перетворюють електричні імпульси, згенеровані нейронною мережею

(мозком), у вихідні сигнали.

Вивчення людського мозку почалося з роботи, в якій запропонована

ідея організації людського мозку на основі нейронів. Як правило, реакція

нейронів на 5-6 порядків повільніше реакції кремнієвих логічних елементів.

Тривалість подій в кремнієвих елементах вимірюється в наносекундах

(910с), а в нейронах - в мілісекундах (

310 с). Однак ця відносна

повільність нейронів компенсується їх масою і кількістю взаємозв'язків між

ними. За існуючими оцінками, в корі головного мозку налічується близько 10

більйонів нейронів і близько 60 трильйонів синапсів. В результаті мозок

являє собою надзвичайно ефективну структуру. Зокрема, енергетичні

витрати мозку на виконання однієї операції в секунду становлять близько

1610Дж. У той же час витрати найекономічнішого комп'ютера не

опускаються нижче 610

Дж на операцію в секунду.

Синапси - це елементарні структурні та функціональні одиниці, які

передають імпульси між нейронами. Найпоширенішим типом синапсів є

хімічні, які працюють таким чином. Предсинаптичний процес формує

передану субстанцію, яка методом дифузії передається по синаптиченим

з'єднанням між нейронами і впливає на постсинаптичний процес. Таким

чином, синапс перетворює предсинаптичний електричний сигнал в хімічний,

а після цього - в постсинаптичний електричний. У традиційних описах

нейронної організації синапс представляють простим з'єднанням, яке може

передавати збудження або гальмування (але не те й інше одночасно) між

нейронами.

Page 26: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

30

Раніше вже говорилося, що під пластичністю розуміється здатність

нервової системи адаптуватися до умов навколишнього середовища. У мозку

дорослої людини пластичність реалізується двома механізмами: шляхом

створення нових синаптичних зв'язків між нейронами і за рахунок

модифікації існуючих. Аксони (лінії передачі) і дендрити (зони прийому)

являють собою два типи елементів клітини, які розрізняються навіть на

морфологічному рівні. Аксони мають більш гладку поверхню, більш тонкі

межі і велику довжину дендрити (свою назву вони отримали через схожість з

деревом) мають нерівну поверхню з безліччю закінчень. Існує величезна

безліч форм і розмірів нейронів, залежно від того, в якій частині мозку вони

знаходяться. На рис. 1.2 показана пірамідальна клітина - найпоширеніший

тип нейронів кори головного мозку. Як і всі нейрони, пірамідальні клітини

отримують сигнали від щупалець дендритів (фрагмент дендрита показаний

на рис. 1.2). Пірамідальна клітина може отримувати більше 10000

синаптичних сигналів і проектувати їх на тисячі інших клітин.

Рис 1.2. Пірамідальна клітина

Page 27: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

31

Вихідні сигнали більшості нейронів перетворюються в послідовність

коротких електричних імпульсів. Ці імпульси, звані потенціалами або

викидами, беруть свій початок в тілі нейрона і передаються через інші

нейрони з постійною швидкістю і амплітудою. Причина використання

потенціалу дії для взаємодії нейронів лежить в самій фізичній природі

аксона. Аксон нейрона має велику довжину і маленьку товщину, що

виражається в його великому електричному опорі і ємності. Обидві ці

характеристики розподілені по аксону. Таким чином, його можна

змоделювати як лінію електропередачі з використанням рівняння кабелю.

Аналіз цього рівняння показує, що подаваєма на один кінець аксона напруга

експоненціально зменшується з відстанню, досягаючи на іншому його кінці

малих значень. Потенціали дії дозволяють обійти цю проблему.

У людському мозку існують крупно і дрібномасштабні анатомічні

структури. Ці верхній і нижній рівні відповідають за виконання різних

функцій. Синапси являють собою найнижчий рівень - рівень молекул та

іонів. На наступних рівнях ми маємо справу з нейронними мікроконтурами,

дендритними деревами і на завершення - з нейронами. Під нейронним

мікроконтуром розуміється набір синапсів, організований в шаблони

взаємозв'язків, що виконують певну операцію. Нейронний мікроконтур

можна порівняти з електронним чіпом, що складається з набору транзисторів.

Мінімальний розмір мікроконтурів вимірюється в мікронах, а швидкість

операцій - в мілісекундах. Нейронні мікроконтури групуються в дендритні

субблоки, що складають дендритні дерева окремих нейронів. Весь нейрон

має розміри близько 100 мікрон і містить кілька дендритних субблоків. На

наступному рівні складності знаходяться локальні ланцюжки (розміром

близько 1 мм), що складаються з нейронів з однаковими або схожими

характеристиками. Ці набори нейронів виконують функції, характерні для

окремих областей мозку. За ними в ієрархії слідують міжрегіональні

ланцюжки, що складаються з траєкторій, стовпців і топографічних карт і

поєднують кілька областей, що знаходяться в різних частинах мозку. [33]

Page 28: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

32

1.4.1. Моделі нейронів

Нейрон являє собою одиницю обробки інформації в нейронній мережі.

На блок-схемі рис.1.3 показана модель нейрона, що лежить в основі штучних

нейронних мереж. У цій моделі можна виділити три основні елементи:

1. Набір синапсів або зв'язків, кожен з яких характеризується своєю

вагою або силою. Зокрема, сигнал jx на вході синапсу j, пов'язаного з

нейроном k, множиться на вагу kjw - Важливо звернути увагу на те, в якому

порядку вказані індекси синаптичної ваги kjw . Перший індекс відноситься до

розглянутого нейрона, а другий - до вхідного закінченню синапсу, з яким

пов'язаний даний вагу. На відміну від синапсів мозку синаптичнf вага

штучного нейрона може мати як позитивні, так і негативні значення.

Рис 1.3. Нелінійна модель нейрона

2. Суматор складає вхідні сигнали, зважені щодо відповідних синапсів

нейрона. Цю операцію можна описати як лінійну комбінацію.

Page 29: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

33

3. Функція активації обмежує амплітуду вихідного сигналу нейрона. Ця

функція також називається функцією стиснення. Зазвичай нормалізований

діапазон амплітуд виходу нейрона лежить в інтервалі [0,1] або [-1,1].

У модель нейрона, показану на рис. 1.3, включений пороговий елемент,

який позначений символом kb . Ця величина відображає збільшення або

зменшення вхідного сигналу, що подається на функцію активації.

У математичному поданні функціонування нейрона k до можна

описати наступною парою рівнянь:

(1.1)

(1.2)

де ku - лінійна комбінація вхідних впливів;

kmkk ...., 21 синаптичні ваги нейрона k;

mxxx ...., 21 вхідні сигнали;

kb - поріг;

ky - вихідний сигнал нейрона;

)( - функція активації.

В моделі, показаній на рис.1.3, постсинаптичний потенціал

обчислюється таким чином:

(1.3)

,1

m

j

jkjk xu

)( kkk buy

kkk buu

Page 30: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

34

1.4.2. Типи функцій активації

Функції активації, представлені у формулах як )( , визначають

вихідний сигнал нейрона залежно від індукованого локального поля .

Можна виділити три основні типи функцій активації.

1. Функція одиничного стрибка, або порогова функція. Цей тип функції

показаний на рис. 1.4, а і описується таким чином:

(1.4)

У технічній літературі ця форма функції одиничного стрибка зазвичай

називається функцією Хевісайда. Відповідно вихідний сигнал нейрона до

такої функції можна представити як

(1.5)

Де )(k індуковане локальне поле нейрона, тобто

(1.6)

Цю модель в літературі називають моделлю МакКаллока-Піттца. У цій

моделі вихідний сигнал нейрона приймає значення 1, якщо індуковане

локальне поле цього нейрона нейтрально, і 0 - в іншому випадку. Цей вираз

описує властивість "все або нічого" моделі МакКаллока-Піттца.

,1

m

j

kjkjk bxu

Page 31: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

35

Рис 1.4. Функція активації одиничного стрибка

2. Кусково-лінійна функція. Кусково-лінійна функція, показана на рис.

1.5, описується наступним виразом:

(1.7)

де коефіцієнт посилення в лінійній області оператора передбачається

рівним одиниці. Цю функцію активації можна розглядати як апроксимацію

нелінійного підсилювача. Наступні два варіанти можна вважати особливою

формою кусочно-лінійної функції.

Якщо лінійна область оператора не досягає порогу насичення, він

перетворюється в лінійний суматор.

Якщо коефіцієнт посилення лінійної області взяти нескінченно

великим, то кусково-лінійна функція вироджується в порогову.

Page 32: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

36

Рис. 1.5. Кусково-лінійна активаційна функція

3. Сигмоїдальна функція. Сигмоїдальна функція, графік якої нагадує

букву S, є, мабуть, найпоширенішою функцією, яка використовується для

створення штучних нейронних мереж. Це швидко зростаюча функція, яка

підтримує баланс між лінійною та нелінійною поведінкою. Прикладом

сигмоїдальної функції може служити логістична функція, що задається

наступним виразом:

(1.8)

де а - параметр нахилу сигмоїдальної функції.

Змінюючи цей параметр, можна побудувати функції з різною

крутизною.

Рис 1.6. Сигмоїдальна функція активації

Page 33: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

37

У межах, коли параметр нахилу досягає нескінченності, сигмоїдальна

функція вироджується в порогову. Якщо порогова функція може приймати

тільки значення 0 і 1, то сигмоїдальна функція приймає безліч значень в

діапазоні від 0 до 1. При цьому слід зауважити, що сигмоїдальна функція

може будти продифференційована, в той час як порогова - ні.

Область значень функцій активації, визначених формулами (1.4), (1.7) і

(1.8), являє собою відрізок від 0 до +1. Однак іноді потрібна функція

активації, що має область значень від -1 до +1. У цьому випадку функція

активації повинна бути симетричною відносно початку координат. Це

означає, що функція активації є непарною функцією індукованого

локального поля. Зокрема, порогову функцію в даному випадку можна

визначити наступним чином:

(1.9)

Ця функція зазвичай називається сигнум. [33]

В даному випадку сигмоїдальна функція буде мати форму

гіперболічного тангенса:

)tanh()( u (1.10)

1.4.3. Архітектура мереж

Структура нейронних мереж тісно пов'язана з використовуваними

алгоритмами навчання. Класифікація алгоритмів навчання буде приведена в

наступному розділі, а питання їх побудови будуть вивчені в наступних

розділах.

У загальному випадку можна виділити три фундаментальні класи

нейромережевих архітектур.

Page 34: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

38

1) Одношарові мережі прямого поширення

У багатошаровій нейронній мережі нейрони розташовуються по шарах.

У найпростішому випадку в такій мережі існує вхідний шар вузлів джерела,

інформація від якого передається на вихідний шар нейронів (обчислювальні

вузли), але не навпаки. Така мережа називається мережею прямого

поширення або ациклічною мережею. На рис.1.7 показана структура такої

мережі для випадку чотирьох вузлів у кожному з шарів (вхідному і

вихідному). Така нейронна мережа називається одношаровою, при цьому під

єдиним шаром мається на увазі шар обчислювальних елементів (нейронів).

При підрахунку числа шарів ми не беремо до уваги вузли джерела, так як

вони не виконують ніяких обчислень.

Рис. 1.7. Мережа прямого поширення з одним шаром нейронів

Page 35: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

39

2) Багатошарові мережі прямого поширення

Інший клас нейронних мереж прямого поширення характеризується

наявністю одного або декількох прихованих шарів, вузли яких називаються

прихованими нейронами, або прихованими елементами. Функція останніх

полягає в посередництві між зовнішнім вхідним сигналом і виходом

нейронної мережі. Додаючи один або кілька прихованих шарів, ми можемо

виділити статистики високого порядку. Така мережа дозволяє виділяти

глобальні властивості даних за допомогою локальних з'єднань за рахунок

наявності додаткових синаптичних зв'язків та підвищення рівня взаємодії

нейронів. Здатність прихованих нейронів виділяти статистичні залежності

високого порядку особливо істотна, коли розмір вхідного шару досить

великий.

Вузли джерела вхідного шару мережі формують відповідні елементи

шаблону активації (вхідний вектор), які складають вхідний сигнал, що

надходить на нейрони (обчислювальні елементи) другого шару (тобто

першого прихованого шару). Вихідні сигнали другого шару

використовуються в якості вхідних для третього шару і т.д. Зазвичай нейрони

кожного з шарів мережі використовують в якості вхідних сигналів вихідні

сигнали нейронів тільки попереднього шару. Набір вихідних сигналів

нейронів вихідного (останнього) шару мережі визначає загальний відгук

мережі на даний вхідний образ, сформований вузлами джерела вхідного

(першого) шару. Мережа, показана на рис. 1.8, називається мережею 10-4-2,

так як вона має 10 вхідних, 4 прихованих і 2 вихідних нейрона. У загальному

випадку мережа прямого поширення з m входами, 1h нейронами першого

прихованого шару, 2h нейронами другого прихованого шару і q нейронами

вихідного шару називається мережею m - 1h - 2h - q.

Page 36: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

40

Рис. 1.8. Повнозв'язна мережа прямого поширення з одним

прихованим і одним вихідним шаром

Нейронна мережа, показана на рис. 1.8, вважається повнозв’язною в

тому сенсі, що всі вузли кожного конкретного шару з'єднані з усіма вузлами

суміжних шарів. Якщо деякі з синаптичних зв'язків відсутні, така мережа

називається неповнозв’язною.

3) Рекурентні мережі

Рекурентна нейронна мережа відрізняється від мережі прямого поширення

наявністю принаймні однієї зворотного зв'язку. Наприклад, рекурентна

мережа може складатися з єдиного шару нейронів, кожен з яких спрямовує

свій вихідний сигнал на входи всіх інших нейронів шару.

Page 37: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

41

Рис. 1.9. Рекурентна мережа без прихованих нейронів і зворотних

зв'язків нейронів з самими собою

Архітектура такої нейронної мережі показана на рис. 1.9. Зверніть

увагу, що в наведеній структурі відсутні зворотні зв'язки нейронів самих з

собою. Рекурентна мережа, показана на рис. 1.9, не має прихованих нейронів.

На рис. 1.10 показаний інший клас рекурентних мереж - з прихованими

нейронами. Тут зворотні зв'язки виходять як з прихованих, так і з вихідних

нейронів.

Page 38: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

42

Рис. 1.10. Рекурентна мережа з прихованими нейронами

Наявність зворотних зв'язків у мережах, показаних на рис. 1.9 і 1.10,

безпосередньо впливає на здатність таких мереж до навчання і на їх

продуктивність. Більше того, зворотній зв'язок має на увазі використання

елементів одиничної затримки (вони позначені як 1z ) що призводить до

нелінійного динамічної поведінки, якщо, звичайно, в мережі містяться

нелінійні нейрони. [33]

1.4.4. Навчання мережі

Найважливішим властивістю нейронних мереж є їх здатність навчатися

на основі даних навколишнього середовища і в результаті навчання

підвищувати свою продуктивність. Підвищення продуктивності відбувається

з часом відповідно до певних правил. Навчання нейронної мережі

відбувається за допомогою інтерактивного процесу коригування

Page 39: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

43

синаптичних ваг і порогів. В ідеальному випадку нейронна мережа отримує

знання про довкілля на кожній ітерації процесу навчання.

З поняттям навчання асоціюється досить багато видів діяльності, тому

складно дати цьому процесу однозначне визначення. Більше того, процес

навчання залежить від точки зору на нього. Саме це робить практично

неможливою появу якогось точного визначення цього поняття. Наприклад,

процес навчання з погляду психолога в корені відрізняється від навчання з

погляду шкільного вчителя. Зі своєї точки зору (з позицій нейронної мережі)

ми можемо використовувати наступне визначення:

Навчання - це процес, в якому вільні параметри нейронної мережі

налаштовуються за допомогою моделювання середовища, в яке ця мережа

вбудована. Тип навчання визначається способом підстроювання цих

параметрів.

Це визначення процесу навчання передбачає таку послідовність подій:

1. У нейронну мережу надходять стимули із зовнішнього середовища.

2. У результаті цього змінюються вільні параметри нейронної мережі.

3. Після зміни внутрішньої структури нейронна мережа відповідає на

збудження вже іншим чином.

Вищевказаний список чітких правил вирішення проблеми навчання

називається алгоритмом навчання. Нескладно здогадатися, що не існує

універсального алгоритму навчання, відповідного для всіх архітектур

нейронних мереж. Існує лише набір засобів, представлений безліччю

алгоритмів навчання, кожен з яких має свої переваги. Алгоритми навчання

відрізняються один від одного способом налаштування синаптичних ваг

нейронів. Ще однією відмінною характеристикою є спосіб зв'язку навченої

нейромережі із зовнішнім світом. У цьому контексті говорять про парадигму

навчання, пов'язаною з моделлю навколишнього середовища, в якому

функціонує дана нейронна мережа. [33]

Для своєї дипломної роботи мною був обраний алгоритм зворотного

поширення помилки, що є одним з найефективніших методів навчання

Page 40: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

44

багатошарових персептронів. Навчання алгоритмом зворотного поширення

помилки припускає два проходи по всім шарам мережі: прямого і зворотного.

При прямому проході вхідний вектор подається на вхідний шар нейронної

мережі, після чого поширюється по мережі від шару до шару. В результаті

генерується набір вихідних сигналів, який і є фактичною реакцією мережі на

даний вхідний образ. Під час прямого проходу всі синаптичні ваги мережі

фіксовані. Під час зворотного проходу все синаптичні ваги налаштовуються

відповідно до правила корекції помилок, а саме: фактичний вихід мережі

віднімається з бажаного, в результаті чого формується сигнал помилки. Цей

сигнал згодом поширюється по мережі в напрямку, зворотному напрямку

синаптичних зв'язків. Звідси й назва - алгоритм зворотного поширення

помилки.

Метою навчання мережі алгоритмом зворотного поширення помилки є

таке підстроювання її ваг, щоб додаток деякої множини входів призводив до

необхідної множини виходів. Для стислості ці множини входів і виходів

будуть називатися векторами. При навчанні передбачається, що для кожного

вхідного вектора існує парний йому цільової вектор, що задає необхідний

вихід. Разом вони називаються навчальною парою. Мережа навчається на

багатьох парах.

Таким чином, алгоритм зворотного поширення помилки наступний:

1. Ініціалізувати синаптичні ваги невеликими випадковими

значеннями.

2. Вибрати чергову навчальну пару з навчальної множини; подати

вхідний вектор на вхід мережі.

3. Обчислити вихід мережі.

4. Обчислити різницю між виходом мережі і потрібним виходом

(цільовим вектором навчальної пари).

5. Підкоригувати ваги мережі для мінімізації помилки.

6. Повторювати кроки з 2 по 5 для кожного вектора навчальної

множини доти, поки помилка не досягне прийнятного рівня.

Page 41: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

45

Алгоритм зворотного поширення помилки здійснює так званий

градієнтний спуск по поверхні помилок. Не заглиблюючись, це означає

наступне: в даній точці поверхні знаходиться напрямок якнайшвидшого

спуску, потім робиться стрибок вниз на відстань, пропорційне коефіцієнту

швидкості навчання і крутизні схилу, при цьому враховується інерція, тобто

прагнення зберегти колишній напрям руху. Можна сказати, що метод

поводить себе як сліпий кенгуру - щоразу стрибає в напрямку, який здається

йому найкращим. Насправді крок спуску обчислюється окремо для всіх

навчальних спостережень, взятих у випадковому порядку, але в результаті

виходить досить хороша апроксимація спуску по сукупній поверхні помилок.

Незважаючи на достатню простоту і застосовність у вирішенні

великого кола завдань, алгоритм зворотного поширення помилки має ряд

серйозних недоліків. Окремо варто відзначити невизначено довгий процес

навчання. У складних завданнях для навчання мережі можуть знадобитися

дні або навіть тижні, а іноді вона може і взагалі не навчитися. Це може

статися через наступних нижчеописаних факторів.

1. Параліч мережі.

У процесі навчання мережі, значення ваг можуть в результаті корекції

стати дуже великими величинами. Це може призвести до того, що всі або

більшість нейронів видаватимуть на виході мережі великі значення, де

похідна функції активації від них буде дуже мала. Так як посилається назад у

процесі навчання помилка пропорційна цієї похідної, то процес навчання

може практично завмерти. У теоретичному відношенні ця проблема погано

вивчена. Зазвичай цього уникають зменшенням розміру кроку (швидкості

навчання), але це збільшує час навчання. Різні евристики використовувалися

для оберігання від паралічу або для відновлення після нього, але поки що

вони можуть розглядатися лише як експериментальні.

2. Локальні мінімуми.

Як говорилося спочатку, алгоритм зворотного поширення помилки

використовує різновид градієнтного спуску, тобто здійснює спуск вниз по

Page 42: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

46

поверхні помилки, безперервно підлаштовуючи ваги в напрямку до

мінімуму. Поверхня помилки складної мережі сильно порізана і складається з

пагорбів, долин, складок і ярів в просторі високої розмірності. Мережа може

потрапити в локальний мінімум (неглибоку долину), коли поруч є більш

глибокий мінімум. У точці локального мінімуму всі напрямки ведуть вгору, і

мережа нездатна з нього вибратися. Статистичні методи навчання можуть

допомогти уникнути цієї пастки, але вони повільні.

3. Розмір кроку. Алгоритм зворотного поширення помилки має доказ

своєї збіжності. Це доказ ґрунтується на тому, що корекція ваг

передбачається нескінченно малою. Ясно, що це нездійсненно на практиці,

оскільки веде до нескінченного часу навчання. Розмір кроку повинен братися

кінцевим, і в цьому питанні доводиться спиратися тільки на досвід. Якщо

розмір кроку дуже малий, то збіжність надто повільна, якщо ж дуже великий,

то може виникнути параліч або постійна нестійкість.

4. Тимчасова нестійкість. Якщо мережа вчиться розпізнавати букви, то

немає сенсу вчити «Б», якщо при цьому забувається «А». Процес навчання

повинен бути таким, щоб мережа навчалася на всьому навчальній множині

без пропусків того, що вже вивчено. У доказі збіжності ця умова виконана,

але потрібно також, щоб мережі пред'являлися всі вектори навчальної

множини перш, ніж виконується корекція ваг. Необхідні зміни ваг повинні

обчислюватися на всій множині, а це вимагає додаткової пам'яті; після низки

таких навчальних циклів ваги зійдуться до мінімальної помилки. Цей метод

може виявитися марним, якщо мережа знаходиться в постійно мінливому

зовнішньому середовищі, так що другий раз один і той же вектор може вже

не повторитися. У цьому випадку процес навчання може ніколи не зійтися. У

цьому сенсі алгоритм зворотного поширення помилки не схожий на

біологічні системи. [31]

Page 43: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

47

РОЗДІЛ 2

Прогнозування цін на акції золотодобувної канадської компанії Barrick

Gold за допомогою нейронних мереж

2.1. Збір даних для проектування нейромережі

Для прогнозування ціни акцій, використовувався метод

нейромережевого моделювання. Цей метод дозволяє вирішувати завдання,

для яких ще не існує строго формалізованих або працюючих з прийнятною

точністю алгоритмів, а також для задач з неповною інформацією.

Нейромережева модель була створена за допомогою спеціальної

програми «Нейросимулятор 2.0», яка являє собою повноцінний симулятор

повнозв'язних нейронних мереж. «Нейросимулятор 2.0» володіє простим,

зрозумілим, налаштованим, зручним інтерфейсом. Кожна дія забезпечено

піктограмою і коротким поясненням. При заданyі структури мережі вона в

реальному часі відображається в графічному вигляді. Кожна функція

активації забезпечена вікном конфігурації, на якому приводитися її формула,

графік. У цьому ж вікні можна налаштувати параметри функції, при їх

наявності. Так само і для функцій початкової ініціалізації ваг і до функцій

обробки даних.

В рамках моделі розглядаються ціни акцій за 2 місяці. Нейромережа

навчається за деякого набору прикладів з предметної області з відомими

вхідними та вихідними параметрами - навчальній вибірці.

Навчальна вибірка була складена на основі даних, узятих на офіційних

сайтах. У неї були включені такі основоположні показники, як індекси Dow

Jones, S&P/TSX 60, RTS, FTSE100, Nasdaq Composite. Курс канадського

доллара, ціна на золото, ставка рефінансування, ціни попереднього дня на

акції, ймовірність державного перевороту на терористичних актів. Таким

чином, ціну акцій в навчальній вибірці відображають 12 показників.

Page 44: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

48

Таблиця 2.1

Показники, від яких залежить ціна на акції

Х1 День тижня (1 - понеділок, 2 - вівторок ... 5 - п'ятниця)

Х2 Ціна акцій

Х3 Курс CAD

Х4 Ціна золота

Х5 ставка рефінансування

Х6 індекс RTS

Х7 Індекс Dow Jones

Х8 Індекс S&P/TSX60

Х9 Індекс FTSE_100

Х10 Індекс Nasdaq Composite

Х11 Ймовірність державного перевороту

Х12 Ймовірність терористичних актів

Y1 Ціна акцій на наступний день

Розроблена нейромережева модель має один вихідний параметр - ціна

акцій на наступний день - його і повинна спрогнозувати навчена

нейромережа.

У навчальну вибірку ввійшли дані за 2 місяці (41 запис, Додаток А), що

є достатньою кількістю для досить успішного навчання нейромережі. Після

того як сформована навчальна вибірка, можна переходити безпосередньо до

проектування мережі та її навчанню.

Page 45: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

49

2.2. Проектування нейромережі

Математично нейрон являє собою зважений суматор, єдиний вихід

якого визначається через його входи і матрицю ваг наступним чином:

12

1

00),(i

ii xxuufy (2.1)

де )(uf функція активації;

u індуковане локальне поле;

i - вага входу;

ix сигнал на вході нейрона

0 додатковий вхід;

0x відповідна йому вага.

Як вже відомо, кількість вхідних параметрів – 12, а вихідних – 1. Для

початку візьмемо тільки один прихований шар нейронів. Кількість елементів

на ньому визначимо за допомогою формули Арнольда-Колмогорова-Хехт-

Нельсона:

yyx

x

yw

yNNN

N

QNN

Q

QN

)1)(1(

)(log1 2

(2.2)

де yN - розмірність вихідного сигналу;

Q - число елементів множини навчальних прикладів;

wN - необхідне число синаптичних зв'язків;

xN - розмірність вхідного сигналу.

Page 46: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

50

Порахуваши, можна зробити висновок, що необхідне число

синаптичних зв'язків знаходиться в діапазоні 7 < wN < 63 . Необхідна кількість

нейронів в прихованому шарі визначається за формулою:

yx

w

NN

NN

(2.3)

Таким чином, число нейронів в прихованому шарі буде в діапазоні

1 < N < 5. Досліджуємо весь діапазон і виберемо ту кількість нейронів на

прихованому шарі, при якому помилка навчання буде менше. Для початку

візьмемо 5 нейронів на прихованому шарі.

Залишилося вибрати активаційні функції для кожного шару. Нейрони

вхідного і вихідного шару відповідають тільки за введення і виведення

даних, їх функції можна залишити лінійними. Основна розрахункове

навантаження лягає на нейрони прихованого шару, тому його активаційну

функцію слід зробити сигмоїдною.

Рис. 2.1. Проектування мережі

Page 47: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

51

2.3. Навчання і тестування нейромережі

За допомогою спеціальної кнопки «Загрузить из EXCEL» завантажуємо

навчальну вибірку з відповідного файлу. Необхідно прослідкувати, щоб

кількість стовпців в таблиці Excel суворо збігалося з числом нейронів на

вхідному і вихідному шарі. В даному випадку це число повинне бути рівним

13 (12 нейронів на вході, 1 - на виході).

Далі необхідно вибрати алгоритм навчання мережі. Для

багатошарового персептрона найбільше підходить алгоритм зворотного

поширення помилки. Даний алгоритм має ряд недоліків, описаних в

попередньому розділі. Щоб їх уникнути, потрібно серйозно підходити до

вибору швидкості навчання і кількості епох - повних циклів пред'явлення

повного набору прикладів навчання.

При дуже маленьких значеннях швидкості навчання нейронної мережі

буде проходити повільно. При дуже великих її значеннях виникає

ймовірність того, що в момент досягнення мінімуму функції помилки

нейронна мережа не зможе потрапити в цей мінімум і буде нескінченно довго

«стрибати» праворуч і ліворуч від нього, виробляючи перерахунки вагових

коефіцієнтів. Стає очевидним, що динамічне управління величиною

швидкості навчання може серйозно підвищити ефективність навчання

нейронної мережі методом зворотного поширення помилки.

Page 48: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

52

Рис. 2.2. Навчання моделі в нейросимуляторі

Присвоєння швидкості більшого значення в момент початку навчання

дозволить отримати більш швидке наближення до області, де знаходиться

оптимальне безліч вагових коефіцієнтів.

Таким чином, спочатку потрібно задати досить високу швидкість

навчання. Задамо швидкість навчання - 0,1 і кількість епох - 5000.

Тепер, коли завантажена навчальна вибірка і задані параметри

навчання, можна розпочати навчання. Після того як мережа навчилася, на

екрані з'явиться графік навчання. [31]

Page 49: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

53

Рис. 2.3. Графік навчання мережі

Після навчання можемо поглянути на значимість параметрів. Як видно з

рис. 2.4, найбільш значимий параметр – Х8 (індекс S&P/TSX60, що охоплює

60 найбільших канадських компаній)

Рис. 2.4. Значимість вхідних параметрів

Page 50: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

54

Тестування. На цьому етапі можна розрахуваемо максимальну помилку

навчання, скопіювавши за допомогою спеціальної функції приклади з

навчальної множини. У даному випадку помилка склала 4,63%.

Рис. 2.5. Розрахунок максимальної похибки навчання

Також розрахуємо максимальну помилку узагальнення, завантаживши

на вкладку «Проверка» тестуючу множину (Додаток Б), що не увійшли в

навчальну вибірку. Помилка узагальнення склала 3,97%.

Рис. 2.6. Розрахунок максимальної похибки узагальнення

Page 51: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

55

2.4. Оптимізація нейромережі

Після того як початкове проектування мережі вже зроблено, потрібно

оптимізувати її для отримання кращого результату при прогнозуванні. Для

початку досліджуємо весь діапазон нейронів на прихованому шарі.

У таблиці 2.2 показані підсумки досліджень всього діапазону нейронів

на прихованому шарі.

Таблиця 2.2

Похибки при різній кількості нейронів на прихованому шарі

Кількість нейронів на

прихованому шарі

Похибка навчання Похибка узагальнення

5 4,63% 3,97%

4 4,69% 12,84%

3 6,79% 14,6%

2 4,87% 42,25%

1 7,02% 11,77%

З таблиці видно, що найменша похибка навчання досягається при п’яти

нейронах на прихованому шарі. Далі будемо працювати з цією кількістю

нейронів. Збільшимо кількість епох до 8000 та навчимо мережу заново.

Рис. 2.7. Графік повторного навчання мережі

Page 52: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

56

Після того як мережа навчилася помилка навчання зменшилися з 4,63%

до 1,95%, а похибка узагальнення навпаки збільшилась з 3,97% до 10,77%,

що трішки погіршує точність прогнозу цін акцій.

Рис. 2.8. Похибка навчання мережі

Рис. 2.9. Похибка узагальнення

Page 53: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

57

Рис. 2.10. Значимість параметрів

З малюнка 2.10 випливає, що найбільш значущими параметрами є Х2

(ціна акцій в попередній день), Х10 (індекс Nasdaq Composite), Х8 (індекс

S&P/TSX60), X9 (індекс FTSE_100), X7 (індекс Dou Jones). Перейшовши на

вікно «Прогноз», ми можемо побачити результат нашого прогнозування:

Рис. 2.11. Прогноз ціни акції на майбутне

Отже, побудована нейромережева модель була успішно навчена та

може давати прогноз на ціну акцій на наступний день з точністю від 89.33%.

Page 54: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

58

РОЗДІЛ 3

ОХОРОНА ПРАЦІ ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАЦІЯХ

Охорона праці – система правових, соціально-економічних,

організаційно-технічних, санітарно-гігієнічних і лікувально-профілактичних

заходів і засобів, спрямованих на охорону здоров'я і працездатності людини в

процесі трудової діяльності. Науково-технічна революція призвела до

виникнення великої кількості новітніх приладів та технологій, що тепер

широко використовуються на робочих місцях. З одного боку, вони значно

полегшують роботу персоналу, а з іншого, створюють додаткові небезпечні

фактори. Охорона праці покликана захищати право працівника на безпечні й

здорові умови праці.

Основою законодавства України з охорони праці є Конституція

України та система законодавчих актів України, спрямованих на реалізацію

вищезазначеного конституційного права. Основними законодавчими актами

цієї системи є наступні Закони України: «Про охорону праці», «Про охорону

здоров'я», «Про обов'язкове державне соціальне страхування від нещасного

випадку на виробництві й професійного захворювання, що привели до втрати

працездатності» тощо.

Програмний продукт, який є результатом дипломної роботи,

призначений для прогнозування цін на акції золотовидобувної канадської

компанії Barrick Gold Corporation у короткостроковому періоді за допомогою

використання нейромережі. Під час роботи має бути забезпечено виконання

допустимих або оптимальних значень шкідливих чинників для організації

умов праці, що відповідають усім нормам.

Page 55: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

59

3.1. Аналіз умов праці

У кімнаті, де відбувається робота прогнозувальника, працюють

одночасно 4 особи. Площа кімнати складає Sз=30 м2, а об’єм Vз=105 м

3.

Отже, на одну людину відводиться площа S1=7,5 м2, а об’єм V1=26,25 м

3,

висота приміщення – 3,5 м, що відповідає нормативному документу НПАОП

0.00-1.28-10, чинного від 2010-03-26. Робочі місця знаходяться на відстані 1

м одне від одного та розташовані вздовж стін.

Робочі столи виготовлені з ДСП та мають 1,8 м завдовжки і 1 м

завширшки. Сидіння відповідають ергономічним вимогам для найбільш

зручного положення тіла при роботі з відеодиспленими терміналами (ВДТ).

Кожне робоче місце оснащене ВДТ, що розташований на відстані 0,6 м від

краю стола, відстань між користувачем та ВДТ складає 0,7 м, а висота

робочої поверхні – 0,75 м, у робочій кімнаті є вікно 2 м завширшки.

Також кожне робоче місце містить комп’ютер, мишу та клавіатуру.

Приміщення оснащене радіаторами та кондиціонерами для забезпечення

комфортних умов роботи персоналу. План робочого приміщення показано на

рис. 3.1:

Рис. 3.1. План робочого приміщення

Page 56: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

60

3.2. Аналіз шкідливих та небезпечних чинників

Під час роботи прогнозувальника неминучим є використання

персонального комп’ютера, який є потенційним джерелом шкідливих та

небезпечних виробничих факторів, що несприятливо впливають на стан

здоров’я робітника.

На робочому місці користувач ПК може піддаватися впливу

несприятливих мікрокліматичних умов, некоректного рівня освітленості,

підвищеного рівня електромагнітних випромінювань радіочастот, високої

напруга електричної мережі тощо. Робота з ПК супроводжується також

підвищеним ступенем напруженості трудового процесу. При систематичному

впливі виробничих факторів, які не відповідають нормативним показникам,

зростає рівень професійно зумовленої захворюваності працюючих та можуть

виникнути захворювання органів зору, руху, нервової системи. Таким чином,

виявлення, аналіз та запобігання впливу небезпечних та шкідливих факторів

виробництва користувача ПК є необхідною умовою запобігання негативних

наслідків впливу шкідливих факторів.

3.3. Освітлення

Виробниче освітлення – це система заходів і пристроїв, що

забезпечують сприятливу роботу зорового аналізатора людини та

виключають шкідливий або небезпечний вплив світла на нього в процесі

праці. У зв'язку з тим, що природне освітлення зазвичай є недостатнім, на

робочому місці повинне застосовуватися також штучне освітлення.

Відповідно до ДБН В.2.5.-28-2006, чинного від 2006-05-28, роботи, що

виконуються, відносяться до V розряду зорових робіт.

Для нормування природного освітлення використовується коефіцієнт

природної освітленості (КПО). Він виражається у відсотках і визначається

відношенням освітленості у певній точці приміщення Ев (люкс) до

Page 57: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

61

одночасної зовнішньої освітленості горизонтальної поверхні розсіяного

світла небозводу Ен (люкс): КПО = (Ев/Ен) · 100, %. КПО вказує, яка частина

зовнішнього дифузійного світла небозводу (у відсотках) забезпечує

освітлення у визначеній точці всередині приміщення.

Для забезпечення нормованої величини КПО необхідно реалізувати

відповідну площу світлових прорізів (вікон) у приміщенні. На практиці

світлотехнічний розрахунок зводиться до визначення площі та конструкції

світлових прорізів відповідно до нормативів, передбачених ДСН.

Нормування штучної освітленості виконують так: визначають точність

виконуваної зорової роботи (за найменшим розміром об'єкта розрізнення); за

цією характеристикою визначають розряд зорових робіт. Сукупність цих

характеристик дозволяє визначити величину нормативної освітленості (Ен).

Природне освітлення приміщення здійснюється за системою однобічного

бічного освітлення. Природне світло проникає у кімнату через світловий

проріз (віконний отвір). Оскільки лише природного освітлення недостатньо,

штучне освітлення у приміщенні відбувається за допомогою світильників з

люмінесцентними лампами, встановлених рядами, рівномірно над усією

кімнатою.

3.4. Електробезпека

При роботі з комп'ютером повинні виконуватися НПАОП 0.00-1.28-10,

чинного від 2010-03-26, оскільки, в протилежному випадку, можуть виникати

ситуації із загрозою враження струмом, адже живлення ПК здійснюється від

мережі з напругою 220В, тоді як для людини безпечною є напруга в 40 В.

Монітором створюється напруга в 25 кВ(при 15 — 25 кВ виникає м'яке

рентгенівське випромінювання).

Під час роботи комп'ютера дисплей створює ультрафіолетове

випромінювання, при підвищенні щільності якого більше 10 Вт/м2, воно стає

Page 58: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

62

для людини шкідливим чинником. Його вплив особливо позначається при

тривалій роботі з комп'ютером.

Будь-які електронно-променеві прилади, у тому числі і ЕОМ під час

роботи комп'ютера внаслідок явища статичної електрики спричиняють

електризацію пилу і дрібних часток, які притягуються до екрану. Зібраний на

екрані електризований пил погіршує видимість, може потрапляти на шкіру та

в легені людини і спричиняти захворювання дихальних шляхів та шкіри.

Згідно з нормативним документом НПАОП 0.00-1.28-10, чинного від

2010-03-26, приміщення, де працює прогнозувальник належить до категорії

без підвищеної небезпеки електротравматизму: відносна вологість повітря не

більше 75%, температура повітря до 25 0С, підлога не струмопровідна,

струмопровідний пил відсутній.

Під час роботи із сучасними ПК, корпуси яких виготовляються з

пластмаси та металу, може виникати загроза враження струмом. Для

запобігання цьому в конструкції ПК має бути передбачена вилка з 3

контактами,два з яких служать для підключення живлення, а третій – для

заземлення. У столі, на якому стоїть ПК, системному блоку має бути

відведене спеціальне місце, а електропроводка і мережеві кабелі повинні

бути ізольованими та знаходитися в закритому положенні в спеціальних

пластикових коробах.

Page 59: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

63

3.5. Допомога при ураженні електричним струмом

Рятування життя людини, ураженої струмом залежить від швидкості і

правильності дій осіб (колеги, працівники меду пункту підприємства, якщо

такий є в наявності), що здійснюють допомогу. Передусім потрібно

якнайшвидше звільнити потерпілого від дії електричного струму. Якщо

неможливо відключити електричне обладнання від мережі, потрібно відразу

приступити до звільнення потерпілого від струмопровідних частин, не

доторкаючись при цьому до потерпілого.

Заходи долікарської допомоги після звільнення потерпілого залежать

від його стану, її потрібно надавати негайно, по можливості на місці події,

одночасно викликавши медичну допомогу. Якщо потерпілий не

знепритомнів, потрібно забезпечити йому на деякий час спокій, не

дозволяючи рухатись до прибуття лікаря. Якщо потерпілий дихає рідко і

судорожно, але прослуховується пульс, потрібно негайно зробити йому

штучне дихання. При відсутності дихання, розширення зіниць і посиніння

шкіри потрібно робити штучне дихання і непрямий масаж серця.

Надавати допомогу необхідно до прибуття лікаря, оскільки є багато

випадків, коли штучне дихання і масаж серця повертали потерпілих до

життя.

3.6. Мікроклімат робочої зони

Метеорологічні умови виробничих приміщень визначаються

сукупністю параметрів – температури (t ,0С), відносної вологості (φ, %),

швидкості руху повітря (V, м/с), атмосферного тиску (Р, мм. рт. ст.),

інтенсивності теплового випромінювання (Е, Вт/м2). Сукупність цих

величин, характерних для конкретних виробничих умов, називається

мікрокліматом. Параметри, що визначають метеорологічні умови на кожному

Page 60: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

64

робочому місці, як окремо, так і в різних сполученнях, впливають на

функціональну діяльність людини, її самопочуття, здоров'я і є одними з

найважливіших показників санітарно-гігієнічних умов праці. Параметри

мікроклімату нормуються згідно ДСН 3.3.6.042-99, чинного від 1999-12-01.

Робота, що виконується в цьому приміщенні за енерговитратами

відноситься до категорії легких робіт Іа. Робоче місце прогнозувальника є

постійним.

Оптимальна температура повітря робочої зони – 22 0С, допустима 20 –

24 0С, оптимальна відносна вологість 40% — 60% допустима — не більше

75%, швидкість руху повітря не більше 0.1 м/с. У робочому приміщенні, де

працює прогнозувальник, температура, вологість та швидкість руху повітря є

оптимальними.

У зимову пору року повинне здійснюватися централізоване опалення за

допомогою радіаторів.

Для теплої пори року було встановлено кондиціонер. Потужність

кондиціонера складає 1,25 — 1,4 кВт на 10 м2 площі приміщення.

3.7. Пожежна безпека

Відповідно до НАПБ Б.03.2002–2007, чинного від 2007-12-03, існують

наступні п'ять категорій приміщень стосовно пожежонебезпечності та

вибухонебезпечності: категорія А, категорія Б (вибухопожежонебезпечна),

категорія В (пожежонебезпечна), категорія Г, категорія Д.

Оскільки в будівлі компанії, де працює прогнозувальник, знаходяться

тверді та волокнисті речовини, а приміщення не є вибухонебезпечним і

вибухопожежонебезпечним, а також компанія є типом офісного приміщення,

можна зробити висновок, що приміщення належать до категорії В по

вибухонебезпеці та до категорії П-IIа по пожежонебезпеці.

Page 61: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

65

Можливими ричинами пожежі в приміщенні можуть бути несправність

електрообладнання та порушення протипожежного режиму (використання

побутових нагрівальних пристроїв, куріння та ін.).

У приміщенні рекомендується встановити пожежну сигналізацію та

сповіщувач, який реагує на задимленість і температуру. Сигналізація

приміщення може бути підключена до централізованого інформаційного

пункту, від якого у разі виникнення пожежі сигнал передається на пожежну

частину.

Згідно з НАПБ Б.03.001–2004, чинного від 2004-02-04, у приміщенні

знаходяться 3 газові вогнегасники типу ВВК-1,4, ВВК-2.

Для приміщення, в якому працюють менше 25 чоловік, і відстань від

будь-якого робочого місця не перевищує 25 метрів згідно з нормами досить

трьох виходів евакуації.

Рекомендується встановити автоматичну стаціонарну систему

пожежогасіння і пожежні гідранти.

3.8. Допомога при ураженні електричним струмом

Рятування життя людини, ураженої струмом залежить від швидкості і

правильності дій осіб (колеги, працівники меду пункту підприємства, якщо

такий є в наявності), що здійснюють допомогу. Передусім потрібно

якнайшвидше звільнити потерпілого від дії електричного струму. Якщо

неможливо відключити електричне обладнання від мережі, потрібно відразу

приступити до звільнення потерпілого від струмопровідних частин, не

доторкаючись при цьому до потерпілого.

Заходи долікарської допомоги після звільнення потерпілого залежать

від його стану, її потрібно надавати негайно, по можливості на місці події,

одночасно викликавши медичну допомогу. Якщо потерпілий не

знепритомнів, потрібно забезпечити йому на деякий час спокій, не

дозволяючи рухатись до прибуття лікаря. Якщо потерпілий дихає рідко і

Page 62: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

66

судорожно, але прослуховується пульс, потрібно негайно зробити йому

штучне дихання. При відсутності дихання, розширення зіниць і посиніння

шкіри потрібно робити штучне дихання і непрямий масаж серця.

Надавати допомогу необхідно до прибуття лікаря, оскільки є багато

випадків, коли штучне дихання і масаж серця повертали потерпілих до

життя.

3.9. Висновки до розділу

Під час роботи програміста та прогнозувальника неминучим є

використання персонального комп’ютера, який є потенційним джерелом

шкідливих та небезпечних виробничих факторів, що несприятливо

впливають на стан здоров’я робітника.

На робочому місці користувач ПК може піддаватися впливу

несприятливих мікрокліматичних умов, некоректного рівня освітленості,

підвищеного рівня виробничого шуму, високої напруга електричної мережі

тощо. Робота з ПК супроводжується також підвищеним ступенем

напруженості трудового процесу. При систематичному впливі виробничих

факторів, які не відповідають нормативним показникам, зростає рівень

професійно зумовленої захворюваності працюючих та можуть виникнути

захворювання органів зору, руху, нервової системи. Таким чином, виявлення,

аналіз та запобігання впливу небезпечних та шкідливих факторів

виробництва користувача ПК є необхідною умовою запобігання негативних

наслідків впливу шкідливих факторів.

В даному розділі були розглянуті основні вимоги до охорони праці у

приміщеннях, в яких зазвичай працюють оператори ЕОМ. Зазначено вимоги

до освітлення, мікроклімату приміщення. Приділено увагу пожежній безпеці.

Встановлені необхідні типи пожежної сигналізації та вогнегасників.

Page 63: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

67

ВИСНОВКИ

На останок хочеться відзначити, що формування ринкової ціни акцій

компанії – досить складний і багатофакторний процес, тому що вони

залежать від багатьох економічних, а також політичних і спекулятивних

чинників.

Нейронні мережі є дуже потужним інструментом для роботи на

фінансових ринках. Сьогодні вже багато великих фірм і приватних осіб

мають власні розробки в області технологій прогнозування з використанням

ШНС і досить гарно на цьому заробляють.

Розроблена нейромережа показала доволі гарні результати. Прогноз

ґрунтувався на різних показниках таких як: індекси Dow Jones, S&P/TSX60,

RTS, FTSE 100, Nasdaq Composite. Курс канадського долара, ціна на золото,

ставка рефінансування.

В процесі тестування мережі найбільш значущими параметрами

виявились: ціна акцій в попередній день, індекс Nasdaq Composite, індекс

S&P/TSX60, індекс FTSE 100, індекс Dow Jones.

Також виявилось, що оптимальною є мережа з одним прихованим

шаром з 5 нейронів. При такій архітектурі досягається оптимізація помилок

навчання та узагальнення. Максимальна помилка прогнозу складає 10,77%.

Основні проблеми, що виникають при роботі з цією технологією

нейромережевого прогнозування - правильна попередня обробка даних, цей

етап відіграє вирішальну роль для прогнозування і дуже багато безуспішних

спроб прогнозування пов'язані саме з цим етапом.

Для того, щоб добре освоїти нейромережі потрібно дуже багато

експериментувати – але воно того варте.

В цілому, мета даної роботи в дослідження і розробці штучної

нейромережі була досягнута. Усі поставлені завдання були виконані.

Page 64: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

68

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1. Барский А.Б. Нейронные сети: распознавание, управление,

принятие решений М.: Финансы и статистика, 2004. – 176 с

2. Бердникова Т.Б. Оценка ценных бумаг: Учеб. пособие. — М.:

ИНФРА-М, 2006. — 144 с

3. Барский А.Б. Нейронные сети: распознавание, управление,

принятие решений М.: Финансы и статистика, 2004. – 176 с

4. Бердникова Т.Б. Оценка ценных бумаг: Учеб. пособие. — М.:

ИНФРА-М, 2006. — 144 с

5. Бодянский Е.В. Искусственные нейронные сети: архитектуры,

обучение, применения/ Бодянский Е.В., Руденко О.Г. Харьков: Телетех,

2004. – 369с.

6. Борисов С.М. Трансформация мирового рынка золота //Деньги и

кредит. - 2003 №1, с. 57-64.

7. Боровиков В.П. Нейронные сети. STATISTICA Neural Networks:

Методология и технологии современного анализа данных / Под

редакцией В. П. Боровикова. - 2-е изд., перераб. и доп. - М.: Горячая

линия - Телеком, 2008. - 392 c.

8. Бровкова М.Б. Системы искусственного интеллекта в

машиностроении: Учеб. пособие. Саратов: Сарат. гос. техн. ун-т, 2004.

119 с.

9. Бэстенс Д.-Э. Нейронные сети и финансовые рынки: принятие

решений в торговых операциях./ Бэстенс Д.-Э.., ван ден Берг В.-М., Вуд

Д. — Москва: ТВП, 1997. — хх, 236 с.

Page 65: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

69

10. Вороновский Г.К., и др. Генетические алгоритмы, искусственные

нейронные сети и проблемы виртуальной реальности / Г. К. Вороновский,

К. В. Махотило, С. Н. Петрашев, С. А. Сергеев.—X.: ОСНОВА, 1997,—

112 с.

11. Галушкин А.И. Теория нейронных сетей. Кн. 1: Учеб. пособие

для вузов / Общая ред. А. И. Галушкина. - М.: ИПРЖР. 2000.-416 c.

12. Горбань А.Н. Нейронные сети на персональном компьютере.—

Новосибирск: Наука, 1996. 275 с.

13. Горелова В. Л. Основы прогнозирования систем: Учеб. пособие /

В. Л. Горелова, Е. Н. Мельникова – М.: Высшая школа, 1986. – 287с.

14. Евменов В.П. Интеллектуальные системы управления: Учебное

пособие. М.: Книжный дом «ЛИБРОКОМ», 2009. — 304 с.

15. 3митрович А. И. Интеллектуальные информационные

системы.— Минск: НТО О О "ТетраСистемс", 1997. 367 с.

16. Зайченко Ю.П. Нечеткие модели и методы в интеллектуальных

системах: Учеб. пособие / Зайченко Ю. П. – К.: Слово, 2008. – 341с.

17. Захаров В.Н. Искусственный интеллект: В 3-х кн. Кн. 3.

Программные и аппаратные средства: Справочник/ Под ред. В. Н. Захаро-

ва, В. Ф. Хорошевского. — М.: Радио и связь, 1990.—368 с.

18. Иванов А.И. Нейросетевые алгоритмы биометрической

идентификации – Радиотехника, 2004 г., 144 с.

19. Калина А. В. Современный экономический анализ и

прогнозирование (макро- и микроуровень): Учебно-методическое

пособие. / Калина А. В., Конева М. И., Ященко В. А. – К.: МАУП, 1997. -

272 с.

20. Каллан Р. Основные концепции нейронных сетей – Вильямс,

2002 г., 287 с.

21. Лорьер Ж.-Л. Системы искусственного интеллекта: Пер. с

франц.— М.: Мир, 1991.-568 с.

Page 66: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

70

22. Лорьер Ж.-Л. Нейронные сети. Системы искусственного

интеллекта. 1991 год. 568 стр.

23. Науменко В. Впровадження методів прогнозування і планування

в умовах ринкової економіки. / В. Науменко, Б. Панасюк – К.: Глобус,

1995.—198 с.

24. Пилиньский М. Нейронные сети, генетические алгоритмы и

нечеткие системы / Пилиньский М. Рутковская Д.,, Рутковский Л. - М.:

Горячая линия - Телеком, 2006, 452 с.

25. Попов Э.В. Искусственный интеллект: В 3 кн. Кн. 1. Системы

общения и экспертные системы: Справочник /Под ред. Э. В.

Попова.—М.: Радио и связь, 1990.—464 с

26. Тархов Д.А. Нейронные сети. Модели и алгоритмы –

Радиотехника, 2005 г. 256 с.

27. Уоссермен Ф. Нейрокомпьютерная техника.—М.: Мир, 1992.

127 с.

28. Черепанов Ф.М. Искусственный интеллект. Элективный курс:

Методическое пособие. / Черепанов Ф.М., Ясницкий Л.Н.,– М.: БИНОМ.

Лаборатория знаний, 2011. – 216с

29. Черепанов Ф.М. Симулятор нейронных сетей «Нейросимулятор

1.0» // Свидетельство об отраслевой регистрации разработки № 8756.

Зарегистрировано в Отраслевом фонде алгоритмов и программ 12.07.2007

30. Хайкин С. Нейронные сети. Полный курс. 2-e изд. Пер. с англ. –

М.: Издательский дом "Вильямс", 2006. – 1104 с.

31. Ясницкий Л.Н. Современный искусственный интеллект и задачи

его философского осмысления // Философско-методологические

проблемы искусственного интеллекта: Материалы постоянно

действующего теоретического междисциплинарного семинара. – Пермь:

Изд-во Перм. гос. техн. ун-та, 2007 – 97c.

Page 67: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

71

32. Ясницкий Л.Н. Введение в искусственный интеллект: Учеб.

пособие для студ. высш. учеб. заведений – М: Издательский центр

«Академия», 2005 – 112c.

33. Ясницкий Л.Н. Искусственный интеллект. Элективный курс:

Учебное пособие. – М.: БИНОМ. Лаборатория знаний, 2011. – 240c.

34. Информация о мировом финансовом рынке, рынке ценных бумаг,

участниках финансового рынка и его структуре [Електронний ресурс] –

Режим доступу: http://www.finanz.ru/

35. Портал искусственного интелекта, роботы с искусственным

интелектом [Електронний ресурс] – Режим доступу:

http://www.aiportal.ru/articles/neural-networks/actuality.html

36. Прогнозирование на ОРЭМ [Електронний ресурс] – Режим

доступу: http://www.mbureau.ru/blog/modeli-prognozirovaniya-neyronnye-

seti

37. Cтатсофт. Электронный учебник по статистике [Електронний

ресурс] – Режим доступу:

http://www.statsoft.ru/home/textbook/modules/stneunet.html

38. Экономические науки. Математические методы в экономике

[Електронний ресурс] – Режим доступу: http://www.rusnauka.com

39. Электронная библиотеки wm-finance.com.ua [Електронний

ресурс] – Режим доступу: http://www.wm-

finance.com.ua/books/view/1/section:19

40. Barrick Gold from Wikipedia, the free encyclopedia [Електронний

ресурс] – Режим доступу: https://en.wikipedia.org/wiki/Barrick_Gold

Page 68: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

72

ДОДАТКИ

Page 69: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

Додаток А

Навчальна множина

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 D1

4 14,3 0,793147208 1199,3 0,25 868,62 17678,23 15,29 7 031,70 5089,36 0,01 0,02 14,27

5 14,4 0,789079145 1186,2 0,25 856,44 17712,66 15,15 7 013,50 5090,79 0,01 0,02 14,45

1 14,04 0,788519161 1123,5 0,25 878,94 17976,38 15,45 7 007,30 5071,74 0,01 0,02 14,82

2 13,97 0,792518624 1204,2 0,25 880,42 17778,73 15,82 6 995,10 5070,03 0,01 0,02 14,84

3 14,13 0,79649542 1195,03 0,25 910,41 17698,18 15,72 6 968,90 5078,44 0,01 0,02 14,94

4 14,02 0,801025312 1214,7 0,25 933,58 17763,31 15,92 6 960,50 5048,29 0,01 0,02 14,89

1 14,94 0,801346262 1208,6 0,25 930,12 17882,06 15,58 6 973,00 5050,8 0,01 0,02 14,97

2 15,38 0,799808046 1202,8 0,25 971,08 17872,51 15,5 6 949,60 4981,69 0,01 0,02 14,64

3 15,6 0,8027615 1194,6 0,25 971,24 17902,51 15,37 6 933,80 4976,19 0,01 0,02 14,65

4 15,46 0,795228628 1208,05 0,25 988,3 17958,79 15,47 7 029,90 4993,57 0,01 0,02 14,94

5 15,3 0,795988219 1198,85 0,25 1003,42 18057,65 15,15 7 046,80 5003,55 0,01 0,02 15,08

1 15,91 0,794155019 1192,55 0,25 999,38 17977,04 15,86 6 887,00 4945,54 0,01 0,02 15,29

2 15,89 0,801217851 1202,05 0,25 1004,62 18036,7 16,04 6 933,70 4919,64 0,01 0,02 15,15

3 15,49 0,81393456 1198,5 0,25 1015,51 18112,41 16,19 6 927,60 4939,33 0,01 0,02 15,45

4 15,76 0,820681165 1204,65 0,25 1052,33 18105,77 15,54 6 985,95 5016,93 0,01 0,02 15,82

5 15,79 0,816926722 1191,1 0,25 1061,6 17826,3 15,91 6 986,00 5005,39 0,01 0,02 15,72

1 15,47 0,818263645 1202,68 0,25 998,96 18034,93 16,01 6 960,60 4941,42 0,01 0,02 15,92

2 15,48 0,814531237 1187,25 0,25 995,7 17949,59 15,16 6 946,30 5023,64 0,01 0,02 15,58

3 15,58 0,817394147 1194,05 0,25 1007,69 18037,6 15,37 7 030,50 5055,42 0,01 0,02 15,5

4 15,67 0,823723229 1179,65 0,25 1004 18058,69 15,28 7 104,00 5060,25 0,01 0,02 15,37

5 15,18 0,821355236 1202,1 0,25 1028,47 18080,14 15,18 7 070,70 5092,08 0,01 0,02 15,47

1 15,28 0,827677537 1212,1 0,25 1037,52 18039,97 15,67 7 053,70 5056,06 0,01 0,02 15,15

2 15,37 0,831393415 1209 0,25 1022,78 18110,14 15,58 7 028,20 5035,17 0,01 0,02 15,86

3 15,16 0,832362244 118,5 0,25 1029,71 18034,8 15,48 7 062,90 5014,1 0,01 0,02 16,04

Page 70: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

74

Продовження додатку А

4 16,01 0,828363154 1178,5 0,25 1031,78 17840,52 15,47 7 052,10 4994,6 0,01 0,02 16,19

5 15,91 0,822774395 1178,4 0,25 1029,31 18024,06 15,79 6 994,60 4931,81 0,01 0,02 15,54

1 15,54 0,827061451 1188,2 0,25 1072,93 18070,4 15,76 7 060,50 5007,79 0,01 0,02 15,91

2 16,19 0,828912467 1193,33 0,25 1066,19 17928,2 15,49 7 096,80 5011,02 0,01 0,02 16,01

3 16,04 0,830357884 1191,8 0,25 1060,73 17843,19 15,89 7 075,30 4977,29 0,01 0,02 15,16

4 16,19 0,824674254 1184,8 0,25 1059,52 17925,5 15,91 7 064,30 4988,25 0,01 0,02 15,37

5 15,54 0,828569061 1187,9 0,25 1070,19 18191,11 15,3 7 089,80 4995,98 0,01 0,02 15,28

1 16,04 0,830633774 1184,2 0,25 1082,21 18105,67 15,46 7 015,40 4974,56 0,01 0,02 15,18

2 15,86 0,832431533 1193,5 0,25 1054,9 18068,36 15,6 6 937,40 4950,82 0,01 0,02 15,67

3 15,15 0,836470096 1215,38 0,25 1074,73 18060,49 15,38 6 961,80 4910,23 0,01 0,02 15,58

4 15,47 0,834794223 1217,7 0,25 1075,47 18252,24 14,94 6 833,50 4917,32 0,01 0,02 15,48

5 15,37 0,832639467 1224,25 0,25 1057,6 18272,56 14,02 6 809,50 4886,94 0,01 0,02 15,47

1 15,5 0,822571358 1225,8 0,25 1031,97 18298,38 14,13 6 773,00 4880,23 0,01 0,02 15,79

2 15,58 0,817728351 1212,2 0,25 1047,47 18312,39 13,97 6 891,40 4900,88 0,01 0,02 15,76

3 15,92 0,819336338 1209,9 0,25 1051,21 18285,33 14,04 6 855,00 4947,44 0,01 0,02 15,49

4 15,72 0,8200082 1206,45 0,25 1052,31 18289,34 14,4 6 895,30 4891,22 0,01 0,02 15,89

5 15,82 0,814398567 1205,95 0,25 1051,11 18232,02 14,3 6 895,30 4863,36 0,01 0,02 15,91

Page 71: G : P 1 H G :Ь G B C G 1 Q G 1 < ? J K M D J : 2 G B « D B 2 < KЬ E 1 …mses.kpi.ua/diplom/bar.pdf · 2015-06-22 · поширення помилки, ... використання

75

Додаток Б

Тестуюча множина

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 D1

1 14,27 0,8275 1174,05 0,25 923,23 17766,55 858,47 6790,04 5021,63 0,01 0,02 14,37

2 14,45 0,83277 1172 0,25 922,67 17849,46 872,21 6804,6 5068,46 0,01 0,02 14,47

3 14,82 0,82836 1177,1 0,25 922,63 17905,58 876,16 6859,24 5059,12 0,01 0,02 14,52

4 14,84 0,83236 1185,3 0,25 947,28 18076,27 883,7 6950,46 5099,23 0,01 0,02 14,94

5 14,94 0,83139 1193,6 0,25 973,45 18011,94 879,51 6928,27 5076,52 0,01 0,02 14,84