17
Testing different evolutionary neural networks for autonomous robot control S. Slušný, R. Neruda, P. Kudová Ústav Informatiky AV ˇ CR 25. septembra 2007

Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Testing different evolutionary neural networksfor autonomous robot control

S. Slušný, R. Neruda, P. Kudová

Ústav InformatikyAV CR

25. septembra 2007

Page 2: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Evolucná robotika

1993 k-team: KheperaPriemer 70 mm, váha 80gDetekcia bielej prekážky do vzdialenosti 5 cm

Page 3: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

MLP

Dopredné perceptrónové siete

1x x2 xn

2w

0xw =−h0

váhy............. synaptické

výstupy .................................

........... vstupy

w1 wn...

............. prah

� �� �� �� �

� �� �� �� �

� �� �� �� �

� �� �� �� �

� � �� � �� � �� � �

� � �� � �� � �� � �

� �� �� �� �

� �� �� �� �

1.0 −23.2

2.5

2 4

5 6

9

1 3

7

8

2.33.87

0.34 1.20.76

Vnútorný potenciál neurónu ε =∑n

i=1 wixiVýstup (stav) neurónu y = σ(ε− h)Logistická sigmoida σ(ε) = 1/(1 + e−λε)

Page 4: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Elmanove siete

Spocítaj aktiváciu skrytých neurónov, na základe výstupovvstupných neurónov a uschovaných hodnôt zpredchádzajúcecho krokuVypocítaj aktiváciu výstupných neurónov na základeskrytej vrstvyUschovaj výstupy neurónov pre d’alší krok

Page 5: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

RBF siete

Jedna skrytá vrstva RBFjednotieky(~x) = ϕ

(‖~x−~c‖

b

)Lineárna výstupná vrstvaAktivacná funkciafs(~x) =

∑hj=1 wjsϕ

(‖~x−~cj‖

bj

)

Page 6: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Genetický algoritmus

Schéma GA [Holland 1975]1 Vytvor pociatocnú populáciu.2 Ohodnot’ jedincov úcelovou funkciou.3 Ak je i = maximálny pocet generácií, skonci a vrát’ riešenie

odpovedajúce jedincovi s optimálnou hodnotou úcelovejfunkcie.

4 Vytvorenie novej populácie P(i + 1) z populácie P(i):Aplikuj operátory selekcie, kríženia a mutácie.

5 i = i + 1, prejdi k bodu 2.

Page 7: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Schéma GA

Page 8: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Ohodnotenie jedinca

Maximalizácia úcelovej (fitness) funkcie

Algoritmus ohodnotenia

Pre každý pokus:Inicializuj prostredieVlož robota na náhodne zvolená pociatocnú pozíciuSpusti simuláciu (požadovaný pocet krokov, kým robotnenarazí)

Ohodnot’ jedinca úcelovou funkciou fitness (napr. priemerza jednotlivé pokusy)

Page 9: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Bludisko

Prehl’adaj prostredie - nájdi “zónu“Aréna 60x30cmAgent žije 250 simulacných krokov

Page 10: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Experiment: Bludisko

Ohodnotenie jedincaPohyb a vyhýbanie prekážkamTk ,j = Vk ,j(1 −

√∆Vk ,j)(1 − ik ,j)

Priemerné ohodnotenie za 1 simulacný krokSj =

∑250k=1

Tk,j250

Odmen, ak agent našiel zónuFitness =

∑4j=1(Sj + ∆j)

Vk ,j : suma abs. rýchlostí motorov(Vkj = |vl |+ |vr |, Vk ,j ∈< 0, 1 >)ik ,j : hodnota najaktívnejšieho senzora (ik ,j ∈< 0, 1 >)

∆j =

{1 agent navštívil zónu0 inak

Page 11: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Priebeh genetického algoritmu

Page 12: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Najlepší agent

Page 13: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Experiment: Steny a prekážky

Nenarážaj do steny, ale zostan v blízkosti prekážkyAréna 40x40 cm500 krokov simulácieÚloha typu 2 [Nolfi 2000]Úcelová funkcia:

Tk ,j =

{1 ak je agent v blízkosti prekážky0.5 inak

Page 14: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Najlepší agent

Page 15: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Výsledky - 1. experiment

Typ siete Bludiskomean std min max

MLP 5 neurónov 4.29 0.08 4.20 4.44MLP 10 neurónov 4.32 0.07 4.24 4.46ELM 5 neurónov 4.24 0.06 4.14 4.33ELM 10 neurónov 3.97 0.70 2.24 4.34RBF 5 neurónov 3.98 0.90 1.42 4.36RBF 10 neurónov 4.00 0.97 1.23 4.38

Page 16: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Výsledky - 2. experiment

Typ siete Steny a prekážkymean std min max

MLP 5 neurónov 2326.1 57.8 2185.5 2390.0MLP 10 neurónov 2331.4 86.6 2089.0 2391.5ELM 5 neurónov 2250.8 147.7 1954.5 2382.5ELM 10 neurónov 2027.8 204.3 1609.5 2301.5RBF 5 neurónov 1873.8 230.6 1530.0 2146.0RBF 10 neurónov 2079.4 94.5 2077.5 2359.5

Page 17: Testing different evolutionary neural networks for autonomous …petra/slides/itat_2007_b.pdf · 2007-09-25 · Výsledky - 2. experiment Typ siete Steny a prekážky mean std min

Záver

Jednoduché úlohyReaktívni agentiKolektívne chovanieProblémy so zložitejšími neurónovými siet’ami