70
Београд, 15.04.2014. Јавна одбрана докторске дисертације ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА БАЗИРАНО НА МАШИНСКОМ УЧЕЊУ Комисија за оцену и одбрану : др Зоран Миљковић, ред. проф., МФБГ, ментор др Бојан Бабић, ред. проф., МФБГ др Живана Јаковљевић, доцент, МФБГ др Радиша Јовановић, доцент, МФБГ др Жарко Ћојбашић, ред. проф., МФ Ниш Универзитет у Београду – Машински факултет Катедра за производно машинство Кандидат : Марко Митић, дипл. маш. инж.

ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Београд, 15.04.2014. Јавна одбрана докторске дисертације

ЕМПИРИЈСКО УПРАВЉАЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА

БАЗИРАНО НА МАШИНСКОМ УЧЕЊУ

Комисија за оцену и одбрану:

др Зоран Миљковић, ред. проф., МФБГ, ментор

др Бојан Бабић, ред. проф., МФБГ

др Живана Јаковљевић, доцент, МФБГ

др Радиша Јовановић, доцент, МФБГ

др Жарко Ћојбашић, ред. проф., МФ Ниш

Комисија за оцену и одбрану:

др Зоран Миљковић, ред. проф., МФБГ, ментор

др Бојан Бабић, ред. проф., МФБГ

др Живана Јаковљевић, доцент, МФБГ

др Радиша Јовановић, доцент, МФБГ

др Жарко Ћојбашић, ред. проф., МФ Ниш

Универзитет у Београду – Машински факултет

Катедра за производно машинство

Универзитет у Београду – Машински факултет

Катедра за производно машинство

Кандидат: Марко Митић, дипл. маш. инж.Кандидат: Марко Митић, дипл. маш. инж.

Page 2: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 2/70

Садржај (1/2)

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење демонстрацијом, вештачке неуронске

мреже, симулациони и експериментални резултати оригиналног

емиријског управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација

добијенихдобијених одод камерекамере – модел камере, алгоритми препознавања

карактеристичних објеката, управљање на бази: грешке у

параметрима слике, издвојених карактеристика са слике неопходних

за оцењивање положаја карактеристичног објекта, епиполарне

геометрије и хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење демонстрацијом, вештачке неуронске

мреже, симулациони и експериментални резултати оригиналног

емиријског управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација

добијенихдобијених одод камерекамере – модел камере, алгоритми препознавања

карактеристичних објеката, управљање на бази: грешке у

параметрима слике, издвојених карактеристика са слике неопходних

за оцењивање положаја карактеристичног објекта, епиполарне

геометрије и хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

Page 3: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 3/70

Садржај (2/2)

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

Page 4: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 4/70

Увод

• Систем који укључује способност да „осећа“ своје окружење,

процесира информације у функцији редуковања неодређености,

планира, генерише и извршава управљачке акције у ситуацијама

које су стохастичке, конституише интелигентни управљачки

систем;

• Аутономност робота базирана је на реализацији управљачких

команди на начин да се у дужем временском периоду (long-term

memory) обављају изабрани технолошки задаци без спољашње

интервенције;

• Истраживања у оквиру ове докторске дисертације подразумевају

развој управљачких система на бази сопственог искуства

робота стеченог кроз интеракцију са окружењем, применом

техника машинског учења, уз информације добијене од

спољашњих сензора.

• Систем који укључује способност да „осећа“ своје окружење,

процесира информације у функцији редуковања неодређености,

планира, генерише и извршава управљачке акције у ситуацијама

које су стохастичке, конституише интелигентни управљачки

систем;

• Аутономност робота базирана је на реализацији управљачких

команди на начин да се у дужем временском периоду (long-term

memory) обављају изабрани технолошки задаци без спољашње

интервенције;

• Истраживања у оквиру ове докторске дисертације подразумевају

развој управљачких система на бази сопственог искуства

робота стеченог кроз интеракцију са окружењем, применом

техника машинског учења, уз информације добијене од

спољашњих сензора.

Page 5: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 5/70

Увод – полазне хипотезе

• Могуће је развити управљачки систем интелигентног роботскогсистема који има способности машинског учења иприлагођавања реалним условима за карактеристичнепроблеме навигације и избегавања препрека у реалномтехнолошком окружењу;

• Имплементацијом техника вештачке интелигенције(computational intelligence) могуће је да се обезбеди ефикасномашинско учење мобилног робота током фазе истраживањатехнолошког окружења, а у циљу реализације аутономногпонашања у домену комплексног задатка локализације робота;

• Развојем хибридног емпиријског управљачког системаинтелигентног мобилног робота на бази информација добијенимод камере, могуће је обезбедити интелигентну роботизовануманипулацију радним предметима (припремак, обрадак,израдак, готов део) у оквиру технолошких система запроизводњу делова од лима.

• Могуће је развити управљачки систем интелигентног роботскогсистема који има способности машинског учења иприлагођавања реалним условима за карактеристичнепроблеме навигације и избегавања препрека у реалномтехнолошком окружењу;

• Имплементацијом техника вештачке интелигенције(computational intelligence) могуће је да се обезбеди ефикасномашинско учење мобилног робота током фазе истраживањатехнолошког окружења, а у циљу реализације аутономногпонашања у домену комплексног задатка локализације робота;

• Развојем хибридног емпиријског управљачког системаинтелигентног мобилног робота на бази информација добијенимод камере, могуће је обезбедити интелигентну роботизовануманипулацију радним предметима (припремак, обрадак,израдак, готов део) у оквиру технолошких система запроизводњу делова од лима.

Page 6: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 6/70

Увод – остварени научни допринос

Остварени научни допринос дисертације огледа се кроз развој иексперименталну верификацију пет оригиналних алгоритамауправљања:

• Метода емпиријског управљања мобилног робота (потпоглавље3.6);

• Хибридни алгоритам управљања мобилног робота који сесастоји од две независне управљачке петље (потпоглавље 4.5);

• Хибридни управљачки систем робота вертикалне зглобнеконфигурације који се заснива на машинском учењу ојачавањеми управљању на бази грешке у параметрима слике (поглавље 5);

• Емпиријски управљачки систем мобилног робота на базимашинског учења демонстрацијом и епиполарне геометрије(поглавље 6);

• Хибридни управљачки систем мобилног робота на базиалгоритма оптимизације колонијом свитаца и хомографије(поглавље 7).

Остварени научни допринос дисертације огледа се кроз развој иексперименталну верификацију пет оригиналних алгоритамауправљања:

• Метода емпиријског управљања мобилног робота (потпоглавље3.6);

• Хибридни алгоритам управљања мобилног робота који сесастоји од две независне управљачке петље (потпоглавље 4.5);

• Хибридни управљачки систем робота вертикалне зглобнеконфигурације који се заснива на машинском учењу ојачавањеми управљању на бази грешке у параметрима слике (поглавље 5);

• Емпиријски управљачки систем мобилног робота на базимашинског учења демонстрацијом и епиполарне геометрије(поглавље 6);

• Хибридни управљачки систем мобилног робота на базиалгоритма оптимизације колонијом свитаца и хомографије(поглавље 7).

Page 7: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 7/70

Садржај

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење ојачавањем, вештачке неуронске мреже,

симулациони и експериментални резултати оригиналног емиријског

управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација

добијенихдобијених одод камерекамере – модел камере, алгоритми препознавања

карактеристичних објеката, управљање на бази: грешке у

параметрима слике, издвојених карактеристика са слике неопходних

за оцењивање положаја карактеристичног објекта, епиполарне

геометрије и хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење ојачавањем, вештачке неуронске мреже,

симулациони и експериментални резултати оригиналног емиријског

управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација

добијенихдобијених одод камерекамере – модел камере, алгоритми препознавања

карактеристичних објеката, управљање на бази: грешке у

параметрима слике, издвојених карактеристика са слике неопходних

за оцењивање положаја карактеристичног објекта, епиполарне

геометрије и хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

Page 8: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 8/70

Индустријски мобилни роботи

Интелигентни технолошки системи:Интелигентни технолошки системи:

• Синергија вештачкевештачке интелигенцијеинтелигенције (ВИ) и рачунарскирачунарскиинтегрисанихинтегрисаних технологијатехнологија (РИТ);

• Фактори који се морају задовољити при концепцијском

пројектовању ИТС:

• Роботизовни унутрашњи транспорт материјала

Интелигентни технолошки системи:Интелигентни технолошки системи:

• Синергија вештачкевештачке интелигенцијеинтелигенције (ВИ) и рачунарскирачунарскиинтегрисанихинтегрисаних технологијатехнологија (РИТ);

• Фактори који се морају задовољити при концепцијском

пројектовању ИТС:

• Роботизовни унутрашњи транспорт материјала

ИТС (ВИ ИТС (ВИ ˄˄ РИТ(РИТ(CAD CAD ˄˄ CAM CAM ˄˄ CAQ CAQ ˄˄ CAPP CAPP ˄˄ ФТС(ФТС(МА МА ˄˄ ИР ИР ˄˄ Р))Р))

пројектовање, планирање, производња,

дистрибуција материјала

Page 9: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 9/70

Индустријски мобилни роботи

УнутрашњиУнутрашњи транспорттранспорт:: брзо, тачно, економично и ефикасно

кретање материјала на начин који обезбеђује максималну

безбедност материјала (делова) и људи у окружењу

УнутрашњиУнутрашњи транспорттранспорт:: брзо, тачно, економично и ефикасно

кретање материјала на начин који обезбеђује максималну

безбедност материјала (делова) и људи у окружењу

Page 10: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 10/70

Индустријски мобилни роботи

МоделМодел кретањакретања (модел(модел променепромене стања)стања)МоделМодел кретањакретања (модел(модел променепромене стања)стања)

1

1

1

cos( /2)

sin( /2)

cos( )2 2

sin( )2 2

k k

k

d l d l

d l d l

kd l

x s

y s

s s s s

bxs s s s

yb

s s

b

x x x

Tk x y x

),( ld ss

),,( yx

b

- пређени пут

десног и левог

погонског точка

респективно,

- померај

- размак између

точкова

Page 11: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 11/70

Индустријски мобилни роботи

ЛабораторијскиЛабораторијски моделмодел технолошкогтехнолошког окружењаокружења

НехолономниНехолономни мобилнимобилни роботробот KheperaKhepera IIII,,

компатибилнакомпатибилна камеракамера KheCMUCamKheCMUCam ии

хватачхватач KheGripKheGrip

ЛабораторијскиЛабораторијски моделмодел технолошкогтехнолошког окружењаокружења

НехолономниНехолономни мобилнимобилни роботробот KheperaKhepera IIII,,

компатибилнакомпатибилна камеракамера KheCMUCamKheCMUCam ии

хватачхватач KheGripKheGrip

Page 12: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 12/70

Садржај

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење демонстрацијом, вештачке неуронске

мреже, симулациони и експериментални резултати оригиналног

емиријског управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација добијенихдобијених одод

камерекамере – модел камере, алгоритми препознавања карактеристичних

објеката, управљање на бази: грешке у параметрима слике,

издвојених карактеристика са слике неопходних за оцењивање

положаја карактеристичног објекта, епиполарне геометрије и

хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење демонстрацијом, вештачке неуронске

мреже, симулациони и експериментални резултати оригиналног

емиријског управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација добијенихдобијених одод

камерекамере – модел камере, алгоритми препознавања карактеристичних

објеката, управљање на бази: грешке у параметрима слике,

издвојених карактеристика са слике неопходних за оцењивање

положаја карактеристичног објекта, епиполарне геометрије и

хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

Page 13: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 13/70

Емпиријско управљање

• Будући рад интелигентног агента је заснован на оцени

успешности извршавања прописаног задатка у прошлости

• Будући рад интелигентног агента је заснован на оцени

успешности извршавања прописаног задатка у прошлости

Елементи емпиријског процеса

1. Предвиђање излаза на основу нивоа поузданости за сваки

улазно-излазни уређени пар

2. Покушај остваривања изабраног излаза

3. Поређење оствареног излаза са предвиђеним излазом

4. У случају подударања оствареног и предвиђеног излаза,

меморисаће се скуп управљачких акција и модел предвиђања

5. Уколико не може да се оствари конзистентност у спровођењу

управљачких акција при извршавању задатка, треба одбацити

тренутни модел предвиђања, а затим усвојити нови који је боље

успостављен

Page 14: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 14/70

Емпиријско управљање

• Емпиријски (управљачки) систем мора самостално да учи током

процеса истраживања окружења

• Емпиријски (управљачки) систем мора самостално да учи током

процеса истраживања окружења

Акција Вектор стања

Технолошко

окружење

Наградна

оцена

стања

Интелигентни агент - роботски систем

Page 15: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 15/70

Машинско учење ојачавањем (Машинско учење ојачавањем (Reinforcement LearningReinforcement Learning))

• Засновано је на Марковљевом процесу одлучивања (Markov

Decision Processes)

• Стратегија доношења акција

• Очекивана вредносна оцена стања

Машинско учење ојачавањем (Машинско учење ојачавањем (Reinforcement LearningReinforcement Learning))

• Засновано је на Марковљевом процесу одлучивања (Markov

Decision Processes)

• Стратегија доношења акција

• Очекивана вредносна оцена стања

Емпиријско управљање

1 , ,...,t t t tS f S a z

0

0

M

t tMlim E r ,π t

t

V γ πx x x

π

Page 16: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 16/70

Машинско Машинско QQ--учење ојачавањем (учење ојачавањем (QQ--LearningLearning))Машинско Машинско QQ--учење ојачавањем (учење ојачавањем (QQ--LearningLearning))

Псеудокод машинског Q-учења ојачавањем

1. Иницијализација вредносне функције пара стање-акција

2. Одређивање тренутног стања и одабир одговарајуће

акције

3. Додељивање наградне оцене стања и одређивање

наредног стања

4. Ажурирати вредносне функције пара стање-акција према:

где је

5. Поновити процедуру све док не буду задовољени

постављени критеријуми заустављања

Емпиријско управљање

1 1

ˆ max ,t t ta

V Q x ax

1 1

ˆ( , ) ( , ) , ( , )t t t t t t t t t t t t t tQ a Q a α r a γV Q ax x x x x

Page 17: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 17/70

SARSASARSA алгоритамалгоритам машинскогмашинског учењаучења ојачавањемојачавањем

*SARSA – State, Action, Reward, State, Action

SARSASARSA алгоритамалгоритам машинскогмашинског учењаучења ојачавањемојачавањем

*SARSA – State, Action, Reward, State, Action

Емпиријско управљање

Псеудокод SARSA алгоритма машинског учења ојачавањем

1. Иницијализација вредносне функције пара стање-акција

2. Одређивање тренутног стања и одабир одговарајуће акције

према усвојеној стратегији одлука

3. Додељивање наградне оцене стања и одређивање

наредног стања

4. Одређивање наредне акције према усвојеној стратегији

одлука

5. Ажурирати вредносне функције пара стање-акција према:

6. Поновити процедуру све док не буду задовољени

постављени критеријуми заустављања

1 1 1 1( , ) ( , ) , ( , ) ( , )t t t t t t t t t t t t t t tQ a Q a α r a γQ a Q ax x x x x

Page 18: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 18/70

Машинско учење демонстрацијомМашинско учење демонстрацијом

((Learning from Demonstration Learning from Demonstration -- LfDLfD))

• Машинско учење имитацијом и машинско учење демонстрацијом

Машинско учење демонстрацијомМашинско учење демонстрацијом

((Learning from Demonstration Learning from Demonstration -- LfDLfD))

• Машинско учење имитацијом и машинско учење демонстрацијом

Емпиријско управљање

Page 19: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 19/70

• Симулација развијена у MATLAB® софтверском пакету

• KheperaII мобилни робот

• 5 стања, 5 акција

• Могуће вредности стања: 0; 0.5; 1;

• Симулација развијена у MATLAB® софтверском пакету

• KheperaII мобилни робот

• 5 стања, 5 акција

• Могуће вредности стања: 0; 0.5; 1;

Емпиријско управљање – симулациони резултати

Инфрацрвени зраци

ПрепрекаПрепрека

R

Ротација улево, затим кретање унапред

Ротација под углом од 45° у позитивном

математичком смеру

Ротација удесно, затим кретање унапред

Ротација под углом од 45° у негативном математичком смеру

Кретање унапред

Page 20: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 20/70

Емпиријско управљање – симулациони резултати

Наградна оцена стања

АкцијаТренутно

стање

Интелигентни мобилни робот

Табеларни запис вредносне функције

Метода одабира акција

Окружење

Кашњење

Инфрацрвени сензори

Page 21: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 21/70

Емпиријско управљање – симулациони резултати

Page 22: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 22/70

• Мобилни робот LEGO Mindstorms NXT

• Ултразвучни сензор

• Мобилни робот LEGO Mindstorms NXT

• Ултразвучни сензор

Емпиријско управљање – експериментални резултати

Page 23: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 23/70

Оригинални алгоритам емпиријског управљањаОригинални алгоритам емпиријског управљања

Емпиријско управљање – експериментални резултати

Page 24: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 24/70

Емпиријско управљање – експериментални резултати

Page 25: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 25/70

Садржај

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење демонстрацијом, вештачке неуронске

мреже, симулациони и експериментални резултати оригиналног

емиријског управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација добијенихдобијених одод

камерекамере – модел камере, алгоритми препознавања карактеристичних

објеката, управљање на бази: грешке у параметрима слике,

издвојених карактеристика са слике неопходних за оцењивање

положаја карактеристичног објекта, епиполарне геометрије и

хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

1.1. УводУвод – аутономност робота, емпиријско управљање, полазне

хипотезе истраживања, остварени научни допринос;

2.2. ИндустријскиИндустријски мобилнимобилни роботироботи – унутрашњи транспорт

материјала, интелигентни технолошки систем, дефинисање стања

и модела промене стања мобилног робота;

3.3. ЕмпиријскоЕмпиријско управљањеуправљање – теоријске основе, машинско учење

ојачавањем, машинско учење демонстрацијом, вештачке неуронске

мреже, симулациони и експериментални резултати оригиналног

емиријског управљачког система;

4.4. УправљањеУправљање роботскихроботских системасистема нана основуоснову информацијаинформација добијенихдобијених одод

камерекамере – модел камере, алгоритми препознавања карактеристичних

објеката, управљање на бази: грешке у параметрима слике,

издвојених карактеристика са слике неопходних за оцењивање

положаја карактеристичног објекта, епиполарне геометрије и

хомографије.

Експериментални резултати развијеног алгоритма емпиријског

управљања;

Page 26: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 26/70

Модел инфинитезимално малог отвора бленде (pinhole camera)Модел инфинитезимално малог отвора бленде (pinhole camera)Модел инфинитезимално малог отвора бленде (pinhole camera)Модел инфинитезимално малог отвора бленде (pinhole camera)

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

T

X Y ZP

0

0

0

0

1 0 0 1

x

y

u α u X X

v α v Y Y

Z Z

K

x uα f k y vα f k

Page 27: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 27/70

• Карактеристични објекат представља објекат у равни слике који

••

• Карактеристични објекат представља објекат у равни слике који

се на неки оптималан начин разликује од осталих

•• HarrisHarris методаметода

препознавањапрепознавања

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

Page 28: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 28/70

SIFT (Scale Invariant Feature Transform) алгоритам

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

Page 29: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 29/70

SURF (Speeded Up Robust Features) алгоритам

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

Page 30: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 30/70

•• Положај камере у односу на роботски систем

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

Page 31: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 31/70

• Управљање на бази грешке

у параметрима слике

• Управљање на бази издвојених

карактеристика са слике

неопходних за оцењивање

положаја карактеристичног

објекта

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

Page 32: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 32/70

УУправљање на бази грешке у параметрима сликеправљање на бази грешке у параметрима слике

• карактеристичних

УУправљање на бази грешке у параметрима сликеправљање на бази грешке у параметрима слике

• Разлика између тренутних и жељених карактеристичних

објеката

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

t ( ) *e s s e e L v e

Z x Z xy x y

Z y Z y xy x

2

2

1 0 1

0 1 1L

ˆeλ v L e

УУправљањеправљање нана базибази издвојених киздвојених карактеристикаарактеристика саса сликеслике

неопходнихнеопходних заза оцењивање оцењивање положајаположаја карактеристичногкарактеристичног објектаобјекта

13 01 x

1

ˆ

0

θ

u

e

u

I t LL

Leλ 1ˆv L e*

0 0 ,c c θ u

e t t

Page 33: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 33/70

Епиполарна геометрија и управљање на бази епиполаЕпиполарна геометрија и управљање на бази епиполаЕпиполарна геометрија и управљање на бази епиполаЕпиполарна геометрија и управљање на бази епипола

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

0Tc tp p F ce 0F

Tte 0F

Page 34: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 34/70

Епиполарна геометрија и управљање на бази епиполаЕпиполарна геометрија и управљање на бази епиполаЕпиполарна геометрија и управљање на бази епиполаЕпиполарна геометрија и управљање на бази епипола

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

α ψtantx xe

α μ ψtancx ye

1

2

d de cx cx cx

e fd de tx tx tx

v e e e

v e e ev K

Page 35: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 35/70

Хомографија и управљање на бази хомографијеХомографија и управљање на бази хомографијеХомографија и управљање на бази хомографијеХомографија и управљање на бази хомографије

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

3x3d ap pH

-1 -1 -1-d d d

T T Tn n nH K R t K K R Rc K KR I c K

11 33vv k h h

Page 36: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 36/70

•• Симулација развијена у MATLAB® софтверском пакету

Управљање роботских система на основу Управљање роботских система на основу

информација добијених од камереинформација добијених од камере

Page 37: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 37/70

Експериментални резултатиЕкспериментални резултати

Page 38: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 38/70

*

for automated guided vehicles

Technology

* Miljković, Z., Vuković, N., Mitić, M., Babić, B., New hybrid vision-based control approach

for automated guided vehicles, The International Journal of Advanced Manufacturing

Technology, Vol. 66, Issues: 1-4, pp. 231-249, Springer-Verlag London Ltd., April 2013.

Експериментални резултатиЕкспериментални резултати

Page 39: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 39/70

Садржај

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

Page 40: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 40/70

• имплементацију

• величине

амбијенталног

• машинског

управљачког

• Постоје многобројни проблеми везани за имплементацију

основних алгоритама визуелног управљања

• Прорачун управљања зависи од: резолуције камере, величине

пискела, фокалне дужине камере, промене амбијенталног

осветљења, постојања шума у процесу аквизиције сигнала, итд.

• Предложено решење: имплементација алгоритама машинског

учења у процес концепцијског пројектовања управљачког

система

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 41: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 41/70

Оригинални хибридни управљачки систем на бази Оригинални хибридни управљачки систем на бази

машинског учења ојачавањем и информација добијених од камере

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 42: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 42/70

• Q-учење и SARSA

• Q-учење и SARSA

алгоритам

• Вештачка неуронска

мрежа са простирањем

грешке уназад

(backpropagation)

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

1, 11

, maxt t t t tat

Q a r γ Q a

x x

100, тр_стање жељ_области

30, раст(тр_стање, жељ_области)<раст(пр_стање, жељ_области)

30, раст(тр_стање, жељ_области)>раст(пр_стање, жељ_области)

0, раст(тр_стање, жељ_области)==р

ако

акоr

ако

ако аст(пр_стање, жељ_области)

Page 43: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 43/70

• случај

равни

camera

приступом

• процесу

матрице,

• Симулација развијена у MATLAB® софтверском пакету

• Анализиране су три независне симулационе студије: (i) случај

када постоје пројекције свих карактеристичних објеката у равни

слике, (ii) проблем видног поља камере (field-of-view camera

problem), и (iii) поређење са традиционалним приступом

управљања на бази информација добијених од камере

• Анализирани су проблеми: постојања шума у процесу

аквизиције сигнала, погрешне оцене калибрационе матрице,

управљања услед нетачног растојања до жељеног положаја.

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 44: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 44/70

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 45: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 45/70

•• Поређење са традиционалним приступом

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 46: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 46/70

• Експериментални резултати су остварени коришћењем робота • Експериментални резултати су остварени коришћењем робота

вертикалне зглобне конфигурације NeuroArm Manipulator

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

* Miljković, Z., Mitić, M., Lazarević, M., Babić, B., Neural network reinforcement learning

for visual control of robot manipulators, Journal Expert Systems with Applications (ISSN

0957-4174), Vol. 40, Issue 5, pp. 1721-1736, Elsevier, April 2013.

Page 47: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 47/70

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 48: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 48/70

Нови хибридни емпиријски управљачки систем робота

вертикалне зглобне конфигурације

Page 49: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 49/70

Садржај

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

Page 50: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 50/70

• Машинско учење демонстрацијом и епиполарна геометрија

• Машинско учење демонстрацијом и епиполарна геометрија

• Корекција оријентације робота применом техника машинског

учења

Управљање интелигентног мобилног робота на бази машинског учења Управљање интелигентног мобилног робота на бази машинског учења

демонстрацијом демонстрацијом и и информација добијених од камереинформација добијених од камере

** Mitić, M., Miljković, Z., Neural network learning from demonstration and epipolar

geometry for visual control of a nonholonomic mobile robot, Journal Soft Computing,

Vol.18, Issue 5, pp. 1011-1025, Springer-Verlag London Ltd., May 2014.

Page 51: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 51/70

Оригинални емпиријски управљачки систем мобилног роботаОригинални емпиријски управљачки систем мобилног робота

Управљање интелигентног мобилног робота на бази машинског учења Управљање интелигентног мобилног робота на бази машинског учења

демонстрацијом демонстрацијом и и информација добијених од камереинформација добијених од камере

Page 52: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 52/70

• Обучавајући пар ВНМ чини: улаз - разлика између тренутне и

управљачка

• учења

• Обучавајући пар ВНМ чини: улаз - разлика између тренутне и

жељене позиције карактериситчног објекта, излаз – управљачка

команда за корекцију оријентације

• Тестирано је укупно 6 различитих алгоритама машинског учења

и 18 различитих архитектура ВНМ

Управљање интелигентног мобилног робота на бази машинског учења Управљање интелигентног мобилног робота на бази машинског учења

демонстрацијом демонстрацијом и и информација добијених од камереинформација добијених од камере

Алгоритми обучавања вештачке неуронске мреже

Р.б. Алгоритам учења Скраћеница

1

2

3

4

5

6

Левенберг-Маркеов алгоритам

Бајесова регуларизација

Адаптибилни Backpropagation алгоритам

Скалирани градијентни поступак спајања

BFGS квази-Њутн Backpropagation

Backpropagation са варијабилним параметром

учења

LM

BR

RP

SCG

BFG

GDX

Page 53: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 53/70

Управљање интелигентног мобилног робота на бази машинског учења Управљање интелигентног мобилног робота на бази машинског учења

демонстрацијом демонстрацијом и и информација добијених од камереинформација добијених од камере

Page 54: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 54/70

Управљање интелигентног мобилног робота на бази машинског учења Управљање интелигентног мобилног робота на бази машинског учења

демонстрацијом демонстрацијом и и информација добијених од камереинформација добијених од камере

Page 55: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 55/70

Садржај

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

Page 56: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 56/70

• Теорија ројева (Swarm Intelligence): GA, PSO, ACO,...

• Mатематичко-алгоритамскe процедурe које се базирају на

колективној интелигенцији скупа појединачних јединки

РЕПРОДУКЦИЈА ЖЕЉЕНЕ ТРАЈЕКТОРИЈЕ И ВИЗУЕЛНО НАВОЂЕЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА НА БАЗИ БИОЛОШКИ

ИНСПИРИСАНОГ АЛГОРИТМА И ХОМОГРАФИЈЕ

Page 57: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 57/70

• Метахеуристички алгоритам оптимизације колонијом свитаца

(Firefly algorithm)

• Промена положаја јединке дефинисана је са

РЕПРОДУКЦИЈА ЖЕЉЕНЕ ТРАЈЕКТОРИЈЕ И ВИЗУЕЛНО НАВОЂЕЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА НА БАЗИ БИОЛОШКИ

ИНСПИРИСАНОГ АЛГОРИТМА И ХОМОГРАФИЈЕ

α

2γβ εr

i i o j i ix x e x x

Page 58: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 58/70

РЕПРОДУКЦИЈА ЖЕЉЕНЕ ТРАЈЕКТОРИЈЕ И ВИЗУЕЛНО НАВОЂЕЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА НА БАЗИ БИОЛОШКИ

ИНСПИРИСАНОГ АЛГОРИТМА И ХОМОГРАФИЈЕ

Page 59: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 59/70

РЕПРОДУКЦИЈА ЖЕЉЕНЕ ТРАЈЕКТОРИЈЕ И ВИЗУЕЛНО НАВОЂЕЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА НА БАЗИ БИОЛОШКИ

ИНСПИРИСАНОГ АЛГОРИТМА И ХОМОГРАФИЈЕ

• Третирани су проблеми навигације (машинског учења и репродукција

трајекторије) и визуелног навођења мобилног робота

• Решење се базира на примени техника машинског учења демонстрацијомдемонстрацијом

и алгоритма оптимизације колонијом свитаца

• Проблем навигације: функција циљафункција циља (циљ оптимизације) је минимална

грешка у крајњем положају (позицији и оријентацији) мобилног робота

• Проблем визуелног навођења: функција циља функција циља је генерисање управљачких

команди за корекцију оријентације мобилног робота

• Резултат спроведених истраживања:

Успешна манипулација радним предметом у

лабораторијском моделу технолошког окружења применом

оригиналног оригиналног емпиријскогемпиријског алгоритма управљања алгоритма управљања

интелигентног мобилног роботаинтелигентног мобилног робота

Page 60: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 60/70

РЕПРОДУКЦИЈА ЖЕЉЕНЕ ТРАЈЕКТОРИЈЕ И ВИЗУЕЛНО НАВОЂЕЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА НА БАЗИ БИОЛОШКИ

ИНСПИРИСАНОГ АЛГОРИТМА И ХОМОГРАФИЈЕ

Page 61: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 61/70

• Нови емпиријски управљачки систем мобилног робота

и

• Нови емпиријски управљачки систем мобилног робота

карактеришу својства адаптабилности, флексибилности и

робустности

РЕПРОДУКЦИЈА ЖЕЉЕНЕ ТРАЈЕКТОРИЈЕ И ВИЗУЕЛНО НАВОЂЕЊЕ

ИНТЕЛИГЕНТНОГ МОБИЛНОГ РОБОТА НА БАЗИ БИОЛОШКИ

ИНСПИРИСАНОГ АЛГОРИТМА И ХОМОГРАФИЈЕ

Page 62: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 62/70

Садржај

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

5.5. НовиНови хибриднихибридни емпиријскиемпиријски управљачкиуправљачки системсистем роботаробота

вертикалневертикалне зглобнезглобне конфигурацијеконфигурације базиранбазиран нана информацијамаинформацијама

добијенимдобијеним одод камерекамере – симулациони и експерименални резултати;

6.6. УправљањеУправљање интелигентногинтелигентног мобилногмобилног роботаробота нана базибази машинскогмашинског

учењаучења демонстрацијомдемонстрацијом ии информацијаинформација добијенихдобијених одод камерекамере –

експерименални резултати;

7.7. РепродукцијаРепродукција жељенежељене трајекторијетрајекторије ии визуелновизуелно навођењенавођење

интелигентногинтелигентног мобилногмобилног роботаробота нана базибази биолошкибиолошки инспирисаногинспирисаног

алгоритмаалгоритма ии хомографијехомографије – теорија ројева и алгоритми

оптимизације, одређивање глобалног оптимума нелинеарне функције

применом алгоритма оптимизације колонијом свитаца, оригинални

систем емпиријског управљања интелигентног мобилног робота;

8.8. ЗакључакЗакључак ии правциправци будућихбудућих истраживањаистраживања

Page 63: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 63/70

Закључак

• Савремено схватање унутрашњег транспорта у оквиру ИТСподразумева примену мобилних робота и техника вештачкеинтелигенције

• Истраживања у оквиру докторске дисертације подразумевала суразвој оригиналних управљачких система заснованих наприкупљању емпиријских података из окружења, њиховојкласификацији и анализи кроз примену машинског учења, узкоришћење информација добијених од спољашњих сензора

• Укупно је развијено петпет оригиналнихоригиналних алгоритамаалгоритама емпиријскогуправљања на бази различитих техника машинског учења

• Савремено схватање унутрашњег транспорта у оквиру ИТСподразумева примену мобилних робота и техника вештачкеинтелигенције

• Истраживања у оквиру докторске дисертације подразумевала суразвој оригиналних управљачких система заснованих наприкупљању емпиријских података из окружења, њиховојкласификацији и анализи кроз примену машинског учења, узкоришћење информација добијених од спољашњих сензора

• Укупно је развијено петпет оригиналнихоригиналних алгоритамаалгоритама емпиријскогуправљања на бази различитих техника машинског учења

Page 64: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 64/70

Закључак

• Оригинални алгоритми емпиријског управљања базирани су на 9

различитих техника вештачке интелигенције

• Решени су проблеми навигације, избегавања препрека и

локализације мобилног робота у лабораторијском моделу

технолошког окружења

• Експериментална верификација новоразвијеног емпиријског

управљачког система мобилног робота базирана је на

оригиналној методи Q-учења

• Оригинални алгоритми емпиријског управљања базирани су на 9

различитих техника вештачке интелигенције

• Решени су проблеми навигације, избегавања препрека и

локализације мобилног робота у лабораторијском моделу

технолошког окружења

• Експериментална верификација новоразвијеног емпиријског

управљачког система мобилног робота базирана је на

оригиналној методи Q-учења

Инфрацрвени зраци

ПрепрекаПрепрека

R

Page 65: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 65/70

Закључак

• Имплементирано је укупно 4 алгоритма управљања (IBVS,

PBVS, EG, H) на основу информација добијених од камере

• Оригиналнo развијен алгоритам на бази епиполарне геометрије

је тестиран за решавање проблема унутрашњег транспорта

помоћу мобилног робота Khepera II, уз коришћење WEB камере

и хватача KheGrip

• Развијен је и експериментално верификован нови алгоритам

управљања (неуронско Q-учење и IBVS) на роботу NeuroArm

Manipulator System, уз коришћење камере CMUCam3

• Имплементирано је укупно 4 алгоритма управљања (IBVS,

PBVS, EG, H) на основу информација добијених од камере

• Оригиналнo развијен алгоритам на бази епиполарне геометрије

је тестиран за решавање проблема унутрашњег транспорта

помоћу мобилног робота Khepera II, уз коришћење WEB камере

и хватача KheGrip

• Развијен је и експериментално верификован нови алгоритам

управљања (неуронско Q-учење и IBVS) на роботу NeuroArm

Manipulator System, уз коришћење камере CMUCam3

Page 66: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 66/70

Закључак

• Развијен је емпиријски управљачки систем мобилног робота

Khepera II применом машинског учења демонстрацијом (LfD) и

вештачких неуронских мрежа

• Решена су два независна проблема управљања мобилног

робота Khepera II у домену унутрашњег транспорта материјала:

(i) репродукција жељене трајекторије до положаја дефинисаног

у равни слике, и (ii) визуелно управљање на бази хомографије и

машинског учења демонстрацијом

• Развијен је емпиријски управљачки систем мобилног робота

Khepera II применом машинског учења демонстрацијом (LfD) и

вештачких неуронских мрежа

• Решена су два независна проблема управљања мобилног

робота Khepera II у домену унутрашњег транспорта материјала:

(i) репродукција жељене трајекторије до положаја дефинисаног

у равни слике, и (ii) визуелно управљање на бази хомографије и

машинског учења демонстрацијом

Page 67: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 67/70

Закључак

НаНа основуоснову развијенихразвијених алгоритамаалгоритама емпиријскогемпиријског управљањауправљања

роботаробота закључујезакључује сесе дада:

- Мобилни робот (интелигентни агент) не мора да поседује било коју apriori информацију о динамици објекта управљања, стању окружења укоме се налази и природи процеса у коме учествује;

- Имплементацијом вештачке неуронске мреже у управљачки систембазиран на машинском учењу ојачавањем, значајно је убрзанаконвергенција алгоритама ка оптималном решењу;

- УОП и УОИК омогућавају: (i) раздвајање сложеног проблема на дваједноставнија проблема, (ii) решење проблема видног поља камере упочетном положају мобилног робота (случај у коме карактеристичниобјекти нису у видном пољу камере);

- Дефинисањем жељених области карактеристичних објеката у равни

слике, омогућено је кретање робота оптималном путањом;

НаНа основуоснову развијенихразвијених алгоритамаалгоритама емпиријскогемпиријског управљањауправљања

роботаробота закључујезакључује сесе дада:

- Мобилни робот (интелигентни агент) не мора да поседује било коју apriori информацију о динамици објекта управљања, стању окружења укоме се налази и природи процеса у коме учествује;

- Имплементацијом вештачке неуронске мреже у управљачки систембазиран на машинском учењу ојачавањем, значајно је убрзанаконвергенција алгоритама ка оптималном решењу;

- УОП и УОИК омогућавају: (i) раздвајање сложеног проблема на дваједноставнија проблема, (ii) решење проблема видног поља камере упочетном положају мобилног робота (случај у коме карактеристичниобјекти нису у видном пољу камере);

- Дефинисањем жељених области карактеристичних објеката у равни

слике, омогућено је кретање робота оптималном путањом;

Page 68: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 68/70

Закључак

- Остварени положај робота једнозначно указује на то да робот вршикориговање свих положаја у случају осцилације епипола у равни слике инаглих промена осветљења у окружењу;

- Резултати примене метахеуристичког алгоритма оптимизације ихомографије на мобилном роботу Khepera II (са камером KheCMUCam ихватачем KheGrip) у лабораторијском моделу технолошког окружењапотврђују да робот репродукује и прати оптималну путању у реалномвремену (online);

- Сви новоразвијени емпиријски алгоритми управљања мобилног роботанеизискују додатну транспортну инфраструктуру или вештачке маркере;

- Увођењем техника машинског учења у управљачки систем мобилногробота, елиминисана је зависност прорачуна управљања од: променеамбијенталног осветљења, перформанси алгоритма детекцијекарактеристичних објеката, параметара калибрационе матрице -резолуције, величине пискела и фокалне дужине камере, утицаја шума упроцесу аквизиције сигнала, оцене положаја 3D објекта у односу накоординатни систем камере, прорачуна епипола и фундаменталне матрице,као и постојања равни хомографије у 3D сцени.

- Остварени положај робота једнозначно указује на то да робот вршикориговање свих положаја у случају осцилације епипола у равни слике инаглих промена осветљења у окружењу;

- Резултати примене метахеуристичког алгоритма оптимизације ихомографије на мобилном роботу Khepera II (са камером KheCMUCam ихватачем KheGrip) у лабораторијском моделу технолошког окружењапотврђују да робот репродукује и прати оптималну путању у реалномвремену (online);

- Сви новоразвијени емпиријски алгоритми управљања мобилног роботанеизискују додатну транспортну инфраструктуру или вештачке маркере;

- Увођењем техника машинског учења у управљачки систем мобилногробота, елиминисана је зависност прорачуна управљања од: променеамбијенталног осветљења, перформанси алгоритма детекцијекарактеристичних објеката, параметара калибрационе матрице -резолуције, величине пискела и фокалне дужине камере, утицаја шума упроцесу аквизиције сигнала, оцене положаја 3D објекта у односу накоординатни систем камере, прорачуна епипола и фундаменталне матрице,као и постојања равни хомографије у 3D сцени.

Page 69: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 69/70

Правци будућих истраживања

• Имплементација fuzzy технике машинског учења у циљу

апроксимације функције пара стање-акција

• Хибридизација fuzzy алгоритама и система вештачких неуронских

мрежа у оквиру машинског учења демонстрацијом у циљу

унапређења перформанси мобилног робота у реалном времену

• Поређење и упоредну анализу других метахеуристичких метода

оптимизације (ACO, PSO, или GA) у домену задатака праћења

путање и визуелног управљања мобилног робота

• Увођење других техника машинског учења у оквиру развијених

емпиријских алгоритама управљања

• Имплементација fuzzy технике машинског учења у циљу

апроксимације функције пара стање-акција

• Хибридизација fuzzy алгоритама и система вештачких неуронских

мрежа у оквиру машинског учења демонстрацијом у циљу

унапређења перформанси мобилног робота у реалном времену

• Поређење и упоредну анализу других метахеуристичких метода

оптимизације (ACO, PSO, или GA) у домену задатака праћења

путање и визуелног управљања мобилног робота

• Увођење других техника машинског учења у оквиру развијених

емпиријских алгоритама управљања

Page 70: ЕМПИРИЈСКО УПРАВЉАЊЕ ИНТЕЛИГЕНТНОГ ...cent.mas.bg.ac.rs/nastava/its/Sajt_2010/2010_2011/MMitic...Модел инфинитезимално малог

Марко Митић, дипл. маш. инж. Јавна одбрана докторске дисертације 70/70

Хвала на пажњи!