28
Deriv´ aci´osfaalap´ u genetikus programoz´ as Doktori ´ ertekez´ es t´ ezisei szerz˝ o: anyiR´obert emavezet˝ o: apl. Prof. Dr.-Ing. K´ okai Gabriella Informatika Doktori Iskola Term´ eszettudom´ anyi ´ es Informatikai Kar Szegedi Tudom´ anyegyetem Szeged, 2012

Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

Derivacios fa alapu

genetikus programozas

Doktori ertekezes tezisei

szerzo:

Vanyi Robert

temavezeto:

apl. Prof. Dr.-Ing. Kokai Gabriella

Informatika Doktori Iskola

Termeszettudomanyi es Informatikai Kar

Szegedi Tudomanyegyetem

Szeged, 2012

Page 2: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS
Page 3: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

1. Bevezetes

Ez a tezisfuzet a Derivacios fa alapu genetikus programozas cımu PhDdolgozat eredmenyeit foglalja ossze. A dolgozat a cımben megjelolt, an-golul ,,derivation tree based genetic programming” (roviden DTGP) nevenbemutatott eljarast mutatja be.

Az osszefoglalo strukturaja a dolgozat felepıteset koveti. A problema-terulet bemutatasa utan az evolucios algoritmusok es a formalis nyelvekrelevans temakoreinek osszefoglalasa kovetkezik. A 4. fejezet a DTGPmodszert ırja le, mıg az 5. fejezet az alap rendszer kiegeszıteseit foglaljaossze. A 6. fejezet attekintest nyujt a DTGP alkalmazasanak eredmenyei-rol, a 7. fejezet pedig a dolgozat teziseit ismerteti.

1.1. Problematerulet

A szamıtastudomany egy gyakori alkalmazasi terulete az optimalizalasiproblemak megoldasa. Ide tartozik a minimalizalas, maximalizalas vagyaltalanossagban a legjobb megoldas megtalalasa. Megkulonboztetunk de-terminisztikus es sztochasztikus modszereket. Bar az elobbieket altalabankonnyebb vizsgalni, ezek az idoigenyuk miatt sokszor nem praktikusak. Asztochasztikus algoritmusok ezzel szemben egy bizonyos merteku bizonyta-lansagot hordoznak magukban, de a gyakorlatban alkalmazott idokorlatokmellett sok esetben jobb eredmenyt ernek el.

Az evolucios algoritmusok metaheurisztikus optimalizalasi algoritmu-sok, melyek a termeszetes szelekciot modellezik es ıgy hoznak letre, vizs-galnak es valasztanak ki egyednek nevezett megoldaskezdemenyeket. [3]Tobbfele tıpusuk is ismert, mint az evolucios strategiak, a genetikus algorit-musok es a genetikus programozas. Ezeket kulonfele problemak megoldasa-ra alkalmaztak a mernoki tervezesi optimalizalastol kezdve a szamıtogepesprogramok automatizalt eloallıtasaig.

A fekete doboz paradigma azt jelenti, hogy az optimalizalasi algorit-musnak egyaltalan semmi, vagy csak nagyon keves informacioja van amegoldasok strukturajarol vagy magarol a megoldasterrol. Ez azt is je-lenti, hogy sokszor nem garantalhato, hogy az uj egyedek a problemanakegyaltalan megoldasai, ami rossz hatassal van a kereses minosegere. Azervenytelen egyedek csokkentik a populacio effektıv meretet es a detektala-suk, kiertekelesuk illetve esetleges javıtasuk tobblet szamıtasigenyt jelent.

1

Page 4: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

Egy modszer az evolucios kereses szabalyozasara az evolucios folyama-tot iranyıto formalis nyelvtanok alkalmazasa. Ha a megoldasok, illetveazok reprezentacioi formalis nyelvet alkotnak, vagyis a halmazuk leırhatoegy nyelvtannal, a kereses korlatozhato a nyelvtan szabalyait koveto egye-dekre. Tobb nyelvtan vezerelt genetikus programozasi (roviden GGGP)modszert is definialtak, kozuluk sok kornyezetfuggetlen nyelvtant hasznal afolyamat iranyıtasara es derivaciokat a genotıpus reprezentalasara. Megol-daskezdemenyek helyett derivaciokon dolgozva garantalhatjuk az eloallı-tott egyedek ervenyesseget. [6]

1.2. A javasolt modszer

A dolgozatban bemutatott modszer derivacios fakat hasznal reprezentacio-kent, es ugy definialja az evolucios operatorokat, hogy az egyedek mindigervenyes derivacios fak legyenek. Az eddigi GGGP eljarasokhoz kepestelorelepest jelent a parameterek szeleskoru alkalmazasa. Parametereket afa minden csucsaban tarolunk, es ezeket kulonbozo celokra hasznaljuk fel,mint peldaul a veletlen csucskivalasztas kiegyensulyozottsaganak garanta-lasara, a kiertekeles idoigenyenek linearisrol logaritmikusra valo csokkente-sere, a kereses befolyasolasara illetve szemantikai megkotesek felallıtasara.

1.3. Publikaciok

A dolgozatban bemutatott eredmenyek ot publikacion alapulnak, melyekidorendben a kovetkezok:

[11] R. Vanyi and Sz. Zvada Avoiding syntactically incorrect individualsvia parameterized operators applied on derivation trees. In R. Sharker,et al., editors, Proceedings of the 2003 Congress on EvolutionaryComputation CEC2003, volume 4, pages 2791–2798, Canberra, 8-12Dec 2003. IEEE Press.

[16] Sz. Zvada and R. Vanyi Improving grammar-based evolutionary al-gorithms via attributed derivation trees. In M. Keijzer, et al., editors,Genetic Programming 7th European Conference, EuroGP 2004, Pro-ceedings, volume 3003 of LNCS, pages 208–219, Coimbra, Portugal,5-7 Apr 2004. Springer-Verlag.

2

Page 5: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

[12] R. Vanyi and Sz. Zvada Syntactically correct genetic programming.In R. Poli et al., editors, GECCO 2004 Workshop Proceedings, Seat-tle, Washington, USA, 26-30 Jun 2004.

[15] Sz. Zvada, G. Kokai, R. Vanyi, and H.H. Fruhauf EvolFIR: Evolvingredundancy-free FIR structures. In Second NASA/ESA Conferenceon Adaptive Hardware and Systems (AHS 2007), pages 439–446.IEEE Computer Society, 5-8 Aug 2007.

[10] R. Vanyi Enforcing semantic constraints with derivation tree basedgenetic programming. Abstract accepted to oral presentation atVeszprem Optimization Conference: Advanced Algorithms (VOCAL2012), 11-14 Dec 2012.

A [11] bemutatja a DTGP modszert, az alapveto fa operatorokat es aveletlen fageneralast. A [16] a kiegyensulyozott veletlen csucs kivalasztastepıti fel es nehany parameter alkalmazasanak lehetoseget tekinti at. A[12] a DTGP-t mas GGGP modszerekkel hasonlıtja ossze, bemutatja akeszlet keresztezest illetve megvizsgalja az operatorok idoigenyet. A [15]egy valos DTGP alkalmazast mutat be, amit a Fraunhofer Alapıtvany In-tegralt Aramkorok Intezetevel kozosen fejlesztettunk, es felvazolja a sze-mantikai megkotesek alkalmazasara tett elso kıserleteket. A szemantikailagkorlatozott derivacio elso formalizalasat, beleertve a disztribucios halma-zokat, disztribucios fuggvenyeket es a megkotott szintetizalt attributumokat,a [10] mutatja be.

1.4. Magyar kifejezesek

A dolgozat angol nyelven keszult, de ebben az osszefoglaloban legtobbszoraz eredeti angol kifejezesek magyar megfeleloi szerepelnek.

Az evolucios algoritmusok operatorait mutacionak, rekombinacionak,illetve keresztezesnek nevezzuk, es ezek a populaciok egyedeit modosıtjak.A dolgozatban definialt keszlet keresztezes eredeti angol elnevezese poolcrossover. A distribution set es distribution function kifejezeseket magyar-ra disztribucios halmaz, illetve disztribucios fuggveny neven fordıtottuk.A forced synthesized attribute magyar megfeleloje a megkotott szintetizaltattributum.

3

Page 6: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

2. Evolucios algoritmusok

Az evolucios algoritmusok (EA) egy specialis modszert hasznalnak az op-timalis megoldas megtalalasara, ami a termeszetben megfigyelheto evolu-cion alapul. Evolucios algoritmusok hasznalatakor a keresesi eljaras parhu-zamos, vagyis tobb hipotezis kivizsgalasa folyik egyidoben. A hipoteziseketegyedeknek nevezzuk, es ezek alkotjak a populaciot. A kezdeti populaciotveletlenszeruen hozzuk letre, majd minden hipotezist kiertekelunk a fit-ness fuggveny segıtsegevel, amely megmutatja, hogy az adott hipotezismennyire jo. Ezutan a szelekcio operatorral kivalasztunk egyedeket a fit-ness ertek alapjan, ezek lesznek a szulok. Vegul az evolucios operatorokat,mint a mutaciot vagy a rekombinaciot, a szulok halmazara alkalmazva aleszarmazottak egy uj populaciojat hozzuk letre, es a folyamatot az ujpopulacioval ujrakezdjuk.

A folyamat kozben a populacioban (amit az adott lepes vegen ge-neracionak nevezunk) egyre jobb egyedek jelennek meg. A folyamatotakkor allıtjuk le, amikor az ugynevezett megallasi feltetelt elertuk. Gyakorimegallasi feltetel a lepesek szama, csekely valtozas a legjobb fitness ertek-ben, vagy az optimum elegendoen pontos megkozelıtese.

Az evolucios algoritmusoknak tobb fajtaja van. [3] A legismertebbek azevolucios strategiak (ES) es a genetikus algoritmusok (GA). Egy harmadiktıpus a genetikus programozas (GP), amelyet a genetikus algoritmusokbolfejlesztettek ki.

2.1. Komplex strukturak optimalizalasa

A dolgozatban egy peldan keresztul mutattuk be, hogyan lehet a genetikusalgoritmusokat komplex strukturak optimalizalasara alkalmazni. A cel egylogikai kifejezes megtalalasa volt, amely lehetoleg rovid, es az elore definialtlogikai fuggvenyt ırja le. A kifejezeseket sztringekkel reprezentaltuk, egyvaltozokat, negalt valtozokat, konjunkcio es diszjunkcio operatorszimbo-lumokat illetve zarojeleket tartalmazo abece felett.

Az eredmenyek azt mutattak, hogy az algoritmus sok szintaktikailaghelytelen egyedet allıt elo, ami meggatolja a megoldas megtalalasat. Le-hetoseg van az operatorok korlatozasara, es ıgy a helyes megoldasok meg-talalhatoak, de a teszteredmenyek szerint az ervenytelen egyedek szamatovabbra is magas, a sikeressegi rata pedig alacsony marad.

4

Page 7: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

A genetikus programozast arra terveztek, hogy absztrakt szintakszis-fakat optimalizaljon, elsosorban olyanokat, amelyek a LISP programozasinyelv S-kifejezeseit reprezentaljak. GP-t hasznalva szintaktikailag helyesegyedek jonnek letre, de csak bizonyos korlatok mellett: a hagyomanyosGP megkoveteli a zartsagi tulajdonsagot. [5, 9] Egyreszt ehhez tıpuskon-zisztencia szukseges, ami azt jelenti, hogy minden argumentumnak esvisszateresi erteknek ugyanolyan tıpusunak kell lennie. Ez azert szukseges,mert az evolucios operatorok tetszolegesen cserelhetnek ki reszfakat. Mas-reszt a zartsagi tulajdonsag magaban foglalja a kiertekelesi biztonsagot,ami azt jelenti, hogy minden lehetseges reszfa altal reprezentalt kifejezeskiertekelheto, es ıgy minden fahoz fitness ertek rendelheto. Tehat a hagyo-manyos GP nem szolgaltat altalanos megoldast az optimalizalasi folyamatszintaktikailag helyes egyedekre valo korlatozasara.

Azonban a GP atalakıthato, hogy formalis nyelvtanokat hasznaljon azevolucios folyamat soran a szintaktikai helyesseg biztosıtasara. Ezeket azeljarasokat nyelvtan vezerelt genetikus programozasi (GGGP) algoritmu-soknak nevezzuk. [6] A dolgozatban javasolt modszer szinten egy GGGPeljaras, amely kornyezetfuggetlen nyelvtanokat hasznal, es ezen nyelvtanoknehany fontos tulajdonsagara tamaszkodik.

3. Nyelvtanok es formalis nyelvek

Egy abece szimbolumaibol nyelvek felepıtesere legtobbet hasznalt eszkozoka Chomsky altal definialt formalis nyelvtanok. [2] A dolgozatban a kornye-zetfuggetlen nyelvtanoknak kiemelt szerepuk van. Egy kornyezetfuggetlennyelvtan egy G = (N ,Σ,P, S) rendezett negyes, ahol N a nemterminalisabece, Σ a terminalis abece ugy, hogy N ∩ Σ = ∅, P ⊂ N × (N ∪ Σ)∗

atırasi szabalyok egy veges halmaza, es S ∈ N a kezdo szimbolum.

Nyelvtanokkal nyelveket a levezetesek (derivaciok) segıtsegevel general-hatunk. A kezdo szimbolumot egy megfelelo atırasi szaballyal lecsereljuk.Ezutan az uj szoban lehetnek nemterminalis szimbolumok, melyeket ujabbatırasi szabalyok alkalmazasaval cserelunk ki. Az atırasi szabalyokat addigalkalmazzuk, amıg egy csak terminalis szimbolumokbol allo szot kapunk.Mivel altalaban tobb atırasi szabaly alkalmazhato, egy adott nyelvtannaltobb szo is generalhato. A legtobb GGGP modszernel a derivacio fogalmakifejezetten fontos, ezert itt megadjuk a formalis definıciojat is.

5

Page 8: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

3.1. definıcio. (Derivacio)Az (N ∪ Σ)∗ halmaz felett bevezetunk egy ⇒G-vel jelolt binaris relaciot,amit kozvetlen derivacionak nevezunk. Tetszoleges γ, δ ∈ (N ∪ Σ)∗-raγ ⇒G δ akkor es csak akkor all fenn, ha ∃ϕ,ψ ∈ (N ∪ Σ)∗ es egy A → βszabaly P-ben, amelyre teljesul, hogy γ = ϕAψ es δ = ϕβψ. A derivacioa kozvetlen derivacio tranzitıv, reflexıv lezartja, amit ⇒∗G-gal jelolunk.

A kozvetlen derivacio segıtsegevel definialhato a derivacios szekvencia,ami szavak egy veges α0, α1, α2, . . . , αn sorozata, melyre αi ⇒G αi+1. Aderivacios szekvencia hossza a kozvetlen derivacios lepesek szama, azaz n.

A derivacio segıtsegevel definialhato a generalt nyelv. A G nyelvtanaltal generalt nyelv a kovetkezo: L(G) = {u ∈ Σ∗ | S ⇒∗G u}.

3.1. Derivacios fak

A kornyezetfuggetlen nyelvtanok feletti derivaciokat egyszeruen reprezen-talhatjuk. Tekintsuk a levezetett szavak betuit csucsoknak. Amikor egynemterminalis szimbolumot kicserelunk egy szora, vagyis szimbolumok egysorozatara, ezeket a szimbolumokat ugy abrazolhatjuk, mint az eredetiszimbolum csucsanak gyerekeit egy fa strukturaban, amit derivacios fanaknevezunk. A tenyleges levezetett szo a fa hataraban talalhato, ami a faleveleinek sorozata balrol jobbra haladva.

Fontos megjegyezni, hogy egy szo akkor es csak akkor vezetheto le egyszimbolumbol, ha letezik olyan derivacios fa, amelynek a gyokere az adottszimbolum, a hatara pedig az adott szo. Ez a megallapıtas kulonosenfontos a kezdoszimbolumra es a terminalis szavakra, ahogyan a kovetkezotetel kimondja.

3.2. tetel.Egy u ∈ Σ∗ szora S ⇒∗ u akkor, es csak akkor, ha letezik T ∈ T (S), ugyhogy fr(T ) = u, ahol T (S) az S gyokeru derivacios fak halmaza.

3.3. kovetkezmeny.Egy u ∈ Σ∗ szora u ∈ L(G) akkor, es csak akkor, ha letezik T ∈ T (S), ugyhogy fr(T ) = u.

Ez a kovetkezmeny azt jelenti, hogy ha derivacios fakkal dolgozva biz-tosıtjuk, hogy az eredmenyek is ervenyes derivacios fak legyenek, akkor afak hataraiban talalhato szavak mindig ervenyes megoldasok lesznek.

6

Page 9: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

3.1.1. Derivacios fak merete

A dolgozatban adattıpuskent derivacios fakat alkalmazunk, ezert erdemesmegvizsgalni a levezetett szavak, a derivaciok es a derivacios fak meretekozotti kapcsolatot. Ha a terminalis szimbolumok szamat az r atırasiszabaly jobb oldalan |r|Σ jeloli, akkor a korrelaciot a kovetkezo tetellelırhatjuk le.

3.4. tetel. (A derivaciohoz kapcsolodo meretek korrelacioja)Adott egy G = (N ,Σ,P, S) kornyezetfuggetlen nyelvtan. Egy tetszolegesα0, α1, . . . , αk, αk ∈ Σ∗ derivacios szekvenciara jelolje a hozza tartozoderivacios fa meretet s, a levezetett terminalis szo αk hosszat pedig n.Ebben az esetben s = O(k). Tovabba, ha |r|Σ az osszes alkalmazott ri(1 ≤ i ≤ k) szabalyra atlagolva legalabb 1, akkor k ≤ n.

3.2. Attributum nyelvtanok

Az attributum nyelvtanok azzal terjesztik ki a kornyezetfuggetlen nyelv-tanok koncepciojat, hogy a szimbolumokat attributumokkal latjak el es aderivacio soran ezekhez ertekeket rendelnek. [1]

Egy attributum nyelvtan egy AG = (G,SD,AD,R) rendezett negyes,ahol G egy kornyezetfuggetlen nyelvtan, SD a szemantikai tartomany,amely az attributum tıpusokat, fuggvenyeket es relaciokat definialja, ADtartalmazza az attributum leırasokat, R = {R(p) | p ∈ P} pedig halma-zok egy csaladja, amely definialja a szemantikai szabalyokat a G nyelvtanminden atırasi szabalyara.

A dolgozatban a kovetkezo attributumokkal kapcsolatos feltetelezeseketalkalmazzuk. Egy a attributum orokolt, ha minden X → Y1Y2 . . . Ynszabalyra a kalkulacios sema a kovetkezo:

Yi.a = fa(X.a, Y1.a, . . . , Yi−1.a),

illetve szintetizalt, ha a kalkulacios sema a kovetkezo:

X.a = ga(Y1.a, Y2.a, . . . , Yn.a).

Ennel formalisabb definıciora nincs szuksegunk, de az olvaso fellelheti oketaz irodalomban. Az orokolt attributumokat mas neven fentrol-lefele, mıga szintetizalt attributumokat lentrol-felfele attributumoknak nevezzuk.

7

Page 10: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

4. Derivacios fa alapu genetikus programozas

Az ervenytelen egyedek kezelesenek altalanos modja az, hogy a kiertekelesifuggveny kiszuri oket peldaul ugy, hogy nagyon alacsony fitness ertekeketrendel hozzajuk. Egy masik lehetoseg, hogy egyaltalan nem engedunkmeg ilyen egyedeket. Ehhez a reprezentacio vagy az evolucios operatorokmodosıtasara van szukseg. Ezt harom kulonbozo modon erhetjuk el.

Minden hipotezis engedelyezese A legegyszerubb mod, hogy mindenhipotezist elfogadunk megoldaskent. Ehhez nem szukseges az evolu-cios algoritmust megvaltoztatni. Erre a megkozelıtesre egy pelda ahagyomanyos GP, ahogyan Koza definialta. [5]

Operatorok korlatozasa Egy kezenfekvo modszer az operatorok modo-sıtasa, bar ez nem mindig egyszeru feladat. Igy mukodik az erosentıpusos genetikus programozas. [7]

Reprezentacio ujradefinialasa A harmadik lehetoseg a reprezentaciokhalmazanak olyan definialasa, hogy zart legyen az evolucios opera-torokra nezve. Ehhez szuksegesek lehetnek aprobb valtoztatasok azoperatorokban. Ezt a megkozelıtest koveti a DTGP.

4.1. Nyelvtan vezerelt genetikus programozas

A nyelvtan vezerelt genetikus programozas (GGGP) [6] egyre nagyobbnepszerusegnek orvend. A GGGP eljarasok feltetelezik, hogy az ervenyesegyedek halmaza egy kornyezetfuggetlen nyelv, es ezert kornyezetfuggetlennyelvtanokat hasznalnak az evolucios folyamat iranyıtasara. A reprezen-taciotol fuggoen ket tıpust kulonboztetunk meg.

4.1.1. Fa alapu GGGP

Az elso fa alapu GGGP kıserleteket Gruau [4] vegezte, aki kornyezetfugget-len nyelvtanokat es derivacios fakat hasznalt az egyedek helyessegenekellenorzesere. Az ellenorzes utan azonban a derivacios fakat torolte, majdaz uj egyedekre ujra eloallıtotta. Whigham [13] a populacio egyedeit de-rivacios fakkal reprezentalta, es az operatorokat kozvetlenul ezekre alkal-mazta. Az o modszerenek korlatja, hogy az operatorok nem parameterez-hetoek, ıgy csak globalis valtozokkal lehet oket befolyasolni.

8

Page 11: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

4.1.2. Linearis GGGP

A legnepszerubb linearis GGGP modszer a nyelvtani evolucio (GE ) [8],ami bitvektorokat hasznal az egyedek reprezentalasara. Ez lehetove teszia genetikus algoritmusok teruleten megismert operatorok es modszerekalkalmazasat.

A hipotezisek egy Σ abece feletti szavak, es a megoldasok halmazategy G nyelvtan ırja le. Az ervenyes reprezentaciok, vagyis az L(G) nyelvszavai leırhatoak baloldali levezetesekkel, amelyek viszont binarisan taroltindexvektorokkal reprezentalhatoak. A nyelvtani evolucio ezeket az in-dexvektorokat hasznalja egyedekkent.

Azonban ennek a modszernek vannak hatranyai. Eloszor is, mivel csaka szabalyok indexeinek sorozata kerul eltarolasra, a derivaciokat el kellvegezni es a derivacios fakat, vagy legalabb azok hatarat ki kell szamıtaniahhoz, hogy megkapjuk a tenyleges megoldast. Ez jelentos idot vehetigenybe. Tovabba nincs kolcsonosen egyertelmu lekepezes a bitsztringek esa derivaciok kozott, ami befejezetlen vagy vegtelen derivaciokhoz vezethet.

4.2. A DTGP modszer alapjai

A derivacios fa alapu genetikus programozas egy fa alapu GGGP modszer.A reprezentaciok derivacios fak egy G kornyezetfuggetlen nyelvtan felett.A megoldasok, vagyis az L(G) nyelv szavai, ezen fak hataraban talal-hatoak. Az evolucios operatorokat ugy definialjuk, hogy csak ervenyesderivacios fakat allıtsanak elo. Ennek kovetkezteben az evolucios folya-mat csak ervenyes hipoteziseket generalhat. A modszer alapjai nagyonhasonloak Whigham [13] eljarasahoz, viszont az adattıpus az algoritmusjavıtasara hasznalt parametereket is tartalmaz.

4.2.1. Derivacios fa adattıpus

A derivacios fa gyakorlatilag egy hagyomanyos fa adattıpus, altalabanpointer alapu implementacioval. Viszont a DTGP nem csak a cımkekettarolja el minden csucsban, hanem parameterek formajaban tovabbi in-formaciot is. Ezen parametereknek koszonhetoen az eljaras tobb elonnyelis rendelkezik mas fa alapu GGGP modszerekkel szemben, ahogy ez a dol-gozatban bemutatasra is kerult.

9

Page 12: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

A dolgozatban hasznalt jeloleseket az 1-es tablazat mutatja be. Megkell jegyeznunk, hogy a csucs es a fa jelolesek sok esetben felcserelhetoek.Peldaul a fa meretet jelolheti T.size, de ezt altalaban parameterkent ta-roljuk el a fa N gyokereben, ezert N.size-zal is jeloljuk.

szimbolum jelentes megjegyzesT, T1, T2, . . . fa, reszfa T1, T2, . . . a T egy reszfajat jeloliN,N1, N2, . . . csucs N1, N2, . . . az N gyerekeiN [T1, . . . , Tn] fa N gyoker T1, . . . , Tn reszfakkalN.label cımke N csucs cımkejeT.label cımke T fa gyokerenek cımkejeN.param parameter N csucs parametereT.param parameter T fa gyokerenek parametere

1. tablazat. A derivacios fa adattıpus reszeinek jelolese

4.2.2. Parameterezett derivacios fak

Az evolucios folyamat kozben az operatorok a derivacios fak tobb tulaj-donsagat is felhasznalhatjak. Mivel ezeknek az ismetelt kiszamıtasa nagymunkaigenyu lehet, ezert a DTGP az ertekeket parameterkent eltarolja areszfak gyokereiben.

A muveletek reszfakat modosıtanak, es az a celunk, hogy ezek a valtoz-tatasok csak a csucsok egy korlatozott halmazat erintsek, ezert megkovetel-juk, hogy egy fa tulajdonsagai csak a reszfainak tulajdonsagaitol fuggjenek.Ez azt jelenti, hogy ezeket a tulajdonsagokat lentrol felfele definialjuk, ıgyminden p tulajdonsagra es minden T = N [T1, . . . , Tn] fara a kalkulaciossema T.p = fp(N,T1, . . . , Tn).

A parameterek csucsokban torteno eltarolasanak hatranya, hogy ezeketaz evolucios folyamat soran aktualizalnunk kell. Viszont mivel a parame-tereket lentrol felfele definialjuk, konnyu belatni, hogy a derivacios fanbelul egy reszfa megvaltoztatasa csak a reszfa gyokeretol a derivacios fagyokerebe vezeto uton levo csucsokra van hatassal. Ezert a parametereketegy egyszeru algoritmussal frissıthetjuk, ami csak logaritmikus idoigenyu afa meretere nezve. Az algoritmus a megvaltoztatott reszfa csucsabol indulki es az oseit aktualizalja, amıg el nem eri a fa gyokeret.

10

Page 13: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

4.3. Evolucios operatorok

Az evolucios operatorok a szokasos faoperatorokon alapulnak, bar szuksegvan nehany modosıtasra annak biztosıtasahoz, hogy csak ervenyes de-rivacios fak johessenek letre. A DTGP-hez tobb kulonbozo mutacio eskeresztezodes operatort definialhatunk. Ezek az operatorok ket alapmu-veletet hasznalnak: a veletlen fageneralast es a veletlen csucskivalasztast.Az operatorokat ugy terveztuk meg, hogy figyelembe vegyek a kornyezet-fuggetlen nyelvtan altal definialt megkoteseket, de az evolucios algoritmusbonyolultsagat ne noveljek jelentosen.

4.3.1. Veletlen fageneralas

A veletlen fagenerator egy alapveto resze a DTGP-nek, mert ez az egyetlenkomponens, amelynek informacioja van a keresesi terrol, egy kornyezet-fuggetlen nyelvtan formajaban. Az alapotlet az, hogy egy adott nemter-minalis szimbolumbol kiindulva vegyuk az alkalmazhato szabalyokat, va-lasszunk egyet veletlenszeruen, alkalmazzuk, majd vegyuk a nemterminalisszimbolumokat a letrehozott fa hataraban. Az algoritmus addig foly-tatodik, amıg van nemterminalis szimbolum a fa hataraban.

A fa meretenek korlatozasahoz egy minp nevu konstanst rendelunkminden p szabalyhoz, hogy tudjuk, mekkora a legkisebb eloallıthato fa,amennyiben az adott szaballyal kezdjuk a derivaciot. A minp konstanskiszamıtasa igenyel valamennyi idot, de csak egyszer kell elvegezni a sza-mıtast, megpedig az evolucios folyamat elindıtasa elott.

4.3.2. Veletlen csucskivalasztas

Minden operatornak ki kell valasztania a derivacios fa egy vagy tobbcsucsat. A komplex adatstruktura miatt ez nem trivialis feladat, kulonosenazert, mert nem minden csucs lehetseges jelolt a kivalasztasra. Egy vek-torbol veletlenszeruen kivalasztani egy elemet egyszeru, de az osszes csucsvektorba rendezese csak a kivalasztas miatt nem hatekony megoldas. Ezerta DTGP-hez egy, a keresesi fa kivalasztasi modszeren alapulo veletlencsucskivalasztot definialtunk, ami logaritmikus idoigenyu. Ez azt jelenti,hogy a faban bejarunk egy utat a gyokerbol lefele, mikozben veletlensze-ruen valasztunk az aktualis csucs, illetve a csucs gyerekei kozul. Ha magata csucsot valasztottuk, a kereses befejezodik.

11

Page 14: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

Azonban ha minden gyereknek ugyanaz a sulya, a veletlen csucskiva-laszto kiegyensulyozatlan lesz, mert a kisebb reszfakban talalhato csucsok-nak nagyobb lesz a kivalasztasi valoszınusege. Ezert minden X csucsnal areszfa meretet is eltaroljuk az X.size nevu parameterben, es ezt kivalasz-tasi sulykent alkalmazzuk. Igy az X X ′ lepes valoszınusege a kovetkezo-keppen definialhato:

P (X X ′) =

{ 1X.size ha X ′ = X,X′.sizeX.size ha X ′ az X-nek egy gyereke.

Belathato, hogy ezzel a definıcioval a fa osszes csucsat ugyanakkoravaloszınuseggel valasztjuk ki. Tovabba, mivel a kivalasztasi utvonal a gye-rekeken keresztul megy, es mindig lefele halad, ezert a maximalis uthossza fa magassagaval egyenlo, ami a csucsok szamat tekintve logaritmikus.Mivel az X.size erteke csak az X ′.size-tol fugg, ahol X ′ az X gyereke,ezert X.size lentrol-felfele definialt tulajdonsagnak tekintheto, es mintilyen, parameterkent eltarolhato a csucsokban, ıgy tovabbi szamıtas nelkulelerheto a veletlen csucskivalasztaskor. Ez a modszer altalanosıthato ugy,hogy kulonbozo kivalasztasi sulyokat engedjunk meg minden csucsra.

4.3.3. Derivacios fa mutacio

Az elozoekben definialt veletlen fageneralassal es veletlen csucskivalasz-tassal egy egyszeru mutacio konnyen definialhato. Eloszor veletlenszeruenkivalasztunk egy csucsot, majd a csucs alatti reszfat kicsereljuk egy ve-letlenszeruen generalt uj reszfara. A generalt reszfat korlatozhatjuk akivalasztott csucs aktualis attributumaival. Peldaul neha esszeru egy adottmelysegu reszfat egy azonos melysegu reszfaval kicserelni, viszont altalabannincs erre vonatkozo megkotes, csak az uj reszfa meretere adott globaliskorlat. Fontos megjegyezni, hogy ezek a mutacio operatorok csak lokalisvaltozasokat eredmenyeznek, es tobb parameterrel szabalyozhatoak. Amutacio koltsege fokent a veletlen fageneralasbol es a veletlen csucski-valasztasbol tevodik ossze. Nehany tovabbi szamıtas szukseges az att-ributumok ujraszamıtasahoz a reszfa beillesztese utan, ami logaritmikusidoigenyu, ahogy azt a 4.2.2 fejezetben emlıtettuk.

12

Page 15: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

4.3.4. Derivacios fa keresztezes

A derivacios fakra alkalmazhato keresztezes a mutacional egyszerubbendefinialhato, mivel nincs szukseg reszfa generalasra. Csupan ket csucsotkell kivalasztani, es az ezek alatti reszfakat megcserelni. Egy nehezsegazonban jelentkezik, ugyanis a kivalasztott reszfaknak azonos cımkeju gyo-kerrel kell rendelkezniuk. Ha nem ez az eset all fenn, a keresztezes kihagy-hato vagy ujra meg lehet probalni a kivalasztast. Megtehetjuk azt is, hogyaz elso szuloben kivalasztunk egy csucsot, es ezutan a masodik szulobenegy specialis kivalasztassal egy ugyanolyan cımkeju csucsot keresunk, deez a modszer nem hatekony. Az is lehetseges, hogy a keresztezes operatortujradefinialjuk ugy, hogy az egesz populacion mukodjon, ne csak szulopa-rokon. Ez a megkozelıtes lehetove teszi, hogy kicsereljunk reszfakat akkoris, ha az egyszeru veletlen csucskivalasztast alkalmazzuk, es a kivalasztottcsucs cımkejet nem hatarozzuk meg elore.

4.3.5. Keszlet keresztezes

A keresztezes jelentosege, hogy a jo egyedek reszeikkel hozzajarulnak azuj generacio sikeressegehez. Ezt nem csak ugy erhetjuk el, hogy veszunkket szulot, es beloluk ket leszarmazottat hozunk letre. A keresztezestdefinialhatjuk ugy, hogy az egesz populacion mukodjon, akarcsak a globalisES rekombinacio. A dolgozatban erre az otletre epıtve egy uj operatortdefinialtunk a derivacios fakra keszlet keresztezes neven.

Ez az operator a kovetkezokeppen mukodik. Az elso lepesben kivalasztegy-egy reszfat, eltavolıtja ezeket a szulokbol es felveszi oket a keszletbe,a kivalasztott csucs cımkeje szerint csoportosıtva. A masodik lepesbenezeket a reszfakat visszailleszti a szulokbe veletlenszeru sorrendben.

4.3.6. Operator koltsegek

Ugy tunhet, hogy a fa muveletek, mint a reszfa kivagasa vagy beillesztesemiatt az operatorok koltsege lenyegesen magasabb a bitvektorokra alkal-mazott operatorokenal. Azonban pointer alapu implementaciot hasznalvaa reszfa kivagasa es beillesztese konstans ido alatt elvegezheto a lancoltlistakhoz hasonloan.

Az operator koltsegeket az altalanos esetre vizsgaltuk a dolgozatban,ezeket a 2. tablazat foglalja ossze. A vizsgalt operatorok a mutacio (MUT)

13

Page 16: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

es a negy fele keresztezes: standard (XO), szimbolumonkent sulyozott(XO-W), ujraprobalkozas (XO-R) es a keszlet keresztezes (POOL). AzRNS es OP oszlopok mutatjak a veletlen csucskivalasztas es az operatoralkalmazasanak idoigenyet. A megoldas meretet, vagyis a szo hosszat n-neljeloljuk es a 3.4 tetel alapjan a fa meretet O(n)-nek tekintjuk.

RNS OP frissıtes siker meretMUT O(log n) O(|P|r) O(log n) 100% O(1)XO O(log n) O(1) O(log n) 1/|N |a O(1)XO-R O(|N | log n)a O(1) O(log n) 100% O(1)XO-W O(log n) O(1) O(|N | log n) 100% O(|N |)POOL O(log n) O(1) O(log n) ≈ 100%b O(1)

aa nemterminalisok eloszlasatol fuggoenbha a populacio N -hez viszonyıtva nagy

2. tablazat. A DTGP operatorok koltsegeinek osszegzese

Ez az elemzes a DTGP modszer (es mas fa alapu GGGP modszerek)enyhe hatranyat mutatja a sztring alapu GGGP modszerekkel szemben,mivel az utobbiak legtobbszor konstans idoigenyu operatorokat hasznal-nak, es a sikeres muveletek aranya 100%. Viszont az elemzes a DTGP masfa alapu modszerekkel szembeni elonyet is megmutatta. A parameterekcsucsokban valo eltarolasaval a DTGP linearisrol logaritmikusra tudjacsokkenteni az idoigenyt, mivel elkeruli, hogy a veletlen csucskivalasztassoran minden csucsot be kelljen jarni.

Az operatorok koltsegenek targyalasanal a kiertekeles koltseget is fi-gyelembe kell vennunk. Eloszor a genotıpust, esetunkben a derivacios fat,le kell kepeznunk a fenotıpusra a fa hataranak leolvasasaval, majd ezutan afenotıpust ki kell ertekelnunk a fitness fuggveny segıtsegevel. Fontos meg-jegyezni, hogy a fenotıpus mindig szintaktikailag helyes hipotezis, ezertnincs szukseg szintaktikai ellenorzesre vagy korrekciora. A fa hataranakleolvasasahoz altalaban a fa bejarasa szukseges, ami osszevetheto a linearisGGGP-knel vegrehajtott derivacioval. Tehat a genotıpus-fenotıpus leke-pezes koltsege mindket megkozelıtes eseten O(n). Bizonyos problemakraazonban a DTGP alkalmazhat parametereket a fenotıpus eloallıtasahozvagy a fitness fuggveny kiszamıtasahoz, es ıgy csokkentheti a kiertekeleskoltseget akar O(1)-re. Egy ilyen tovabbfejlesztes nem lehetseges olyan

14

Page 17: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

algoritmusokkal, amelyek nem taroljak el a derivaciokat, mint peldaul alinearis GGGP modszerek.

4.4. DTGP pelda

A DTGP mukodesenek szemleltetesehez, es a tulajdonsagainak elemzese-hez egy peldat mutattunk be es ertekeltuk ki. A pelda egy logikai reg-resszios problema volt, amit a genetikus algoritmus tesztelesere is hasz-naltunk. A peldahoz hasznalt, az ervenyes logikai kifejezeseket generalokornyezetfuggetlen nyelvtan nagyon egyszeru, es az irodalomban gyakranismertetett.

4.4.1. Eredmenyek

Az alapertelmezett beallıtasban a populacio merete 1000 volt, es 100 lepestvegeztunk el a mutacio es keszlet keresztezes operatorokkal. A kezdetipopulacioban a fak magassaga nem lehetett nagyobb 15-nel. A veletlencsucskivalasztasnal minden csucsnak ugyanaz volt a sulya, kiveve ter-meszetesen a leveleket. A mutacional a veletlenszeruen generalt reszfakmagassagat 10-re korlatoztuk. A fitness szamıtashoz a kifejezest minda 25 = 32 lehetseges kiertekelessel kiszamıtottuk, es osszehasonlıtottuk acelfuggvennyel, amit egy 32-bites szam reprezentalt. Minden talalatot 1000ponttal jutalmaztunk, majd a kifejezes meretet levontuk a pontszambol,ıgy elmeletileg a maximalis fitness 32000-1. Az egyik futas alatt a 40. ge-neraciora az algoritmus talalt egy kifejezest, amely pontosan leırja a fugg-venyt, majd a megoldashoz tartozo derivacios fa meretet tovabb tudtaoptimalizalni 532-rol 247-re.

Az eredmeny hasonlo az altalanos GA algoritmus biztonsagos muta-cioval elert eredmenyehez. Viszont a GA eljaras egy 10000 egyedbol allopopulaciot hasznalt, amelyek kozul sok ervenytelen volt. A DTGP algorit-musnak 1000 egyed eleg volt. Az algoritmus altal talalt legjobb megoldasegy 93 szimbolum hosszu kifejezes. Az altalanos beallıtasokkal 100 kulontesztet futtattunk le, ezek kozul 38 elert egy 31000 feletti fitness erteket,vagyis mind a 32 bit helyes volt, ami sikeres futast jelent. A median azon-ban 31000 alatt volt, es a legrosszabb esetben a fitness kicsivel 27000 alattmaradt, ami csak 27 helyes bitet jelent.

15

Page 18: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

4.4.2. Parameter beallıtasok

A DTGP algoritmusnak sok beallıthato parametere van. A legfontosabbparameterek az operator alkalmazasi rata, a lepesek szama es a populaciomerete. A DTGP algoritmus csucskivalasztasi parametereit es a veletlenfageneralas korlatait is be lehet allıtani. A DTGP eljarast tobb beallıtassalteszteltuk, az eredmenyek osszefoglalasa alabb olvashato:

Operator alkalmazasi rata A [14] cikkben bemutatott eredmenyeketmegerosıtve a kulonbozo alkalmazasi ratakkal kapott teszteredme-nyek megmutattak, hogy a mutacio a DTGP legfontosabb operatora,bar a keresztezes magas alkalmazasi rataja is javıtja az algoritmust.Tovabba azt is bizonyıtottuk, hogy ha a populacio eleg nagy, a keszletkeresztezes sikertelensegenek valoszınusege elhanyagolhatoan kicsi.

A lepesek szama Mivel az algoritmus altal talalt legjobb megoldas at-lagos fitness erteke minden lepessel fokozatosan javul, meg lehetprobalni az algoritmust tovabb futtatni, bar, ahogy a tesztek meg-mutattak, a javulas merteke egyre csokken. Ez foleg a populaciocsokkeno diverzitasanak koszonheto, es a dolgozatban megallapıtasrakerult, hogy ket kulon teszt futtatasaval jobb eredmenyeket lehetelerni, mint egy teszt dupla hosszusagu futtatasaval. Peldaul a dol-gozatban hasznalt beallıtasokkal ketszer 100 lepessel jobb eredmenytkaptunk, mint egyszeri 200 lepessel.

Populacio merete A megfelelo populaciomeret fontos az evolucios al-goritmusok szamara, mert a populacio diverzitasanak megorzesehezszukseg van egy bizonyos mennyisegu egyedre. Tovabba egy nagypopulacio a keresesi ter nagyobb reszet fedi le. Viszont a populaciomeretenek novelese csak egy bizonyos szintig javıt az eredmenyeken,ezert neha, akarcsak a lepesek szamanal, a populacio mereteneknovelese helyett jobb, ha tobb kulon tesztet futtatunk. A dolgo-zatban bemutatott teszt 500-as populaciomerettel erte el a legjobberedmenyeket.

A dolgozatban a keresesi aszimmetriat is vizsgaltuk. A modszer enyhetendenciat mutat nagy fak generalasa fele. Ez gyakori jelenseg a genetikusprogramozasban, amit a szakirodalom bloat-nak nevez. [9]

16

Page 19: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

5. A DTGP tovabbfejlesztese

A DTGP altal alkalmazott fa struktura varhatoan aszimptotikusan nemnagyobb, mint a linearis GGGP strukturai, de megis nagyobb es bonyo-lultabb adattıpus. Szerencsere ez az adattıpus lehetoseget nyujt az algorit-mus tovabbfejlesztesere. A dolgozatban bemutatott tovabbfejleszteseketharom csoportba sorolhatjuk: Parameterek lehetosegeinek kihasznalasa,szemantikai megkotesek alkalmazasa es a fageneralas veletlenszerusegenekjavıtasa.

5.1. Parameterek felhasznalasa

Parametereket alkalmazhatunk a reszfak kulonfele tulajdonsagainak elta-rolasara. A dolgozatban ilyen informaciot a kovetkezo celokra hasznaltunk:

A fa hataranak futasidoben torteno eloallıtasa A fa hatarat para-meterkent eltarolhatjuk a gyokerben. Ez egy lentrol felfele definialtparameter, ezert a DTGP konnyen tudja kezelni, es a fa hataratkonstans ido alatt elerhetove teszi. Meg kell jegyeznunk azonban,hogy ez a parameter egyedenkent O(n log n) tarhelyet igenyel, O(n)helyett.

A hipotezis futasidoben torteno kiertekelese Egy egyed kiertekele-sehez a fa hatara gyakorlatilag irrelevans, amıg a reprezentalt hipo-tezis kiertekelheto. Ha a hipotezist tomoren tudjuk reprezentalni,akkor parameterkent hasznalhatjuk, ıgy a fitness szamıtasnal kons-tans ido alatt elerheto lesz.

Futasidoben torteno fitness szamıtas Bizonyos esetekben lehetseges,hogy reszben vagy akar teljesen kiszamıtsuk es eltaroljuk a fitnessertek reszfahoz tartozo reszet, peldaul a reszfa altal reprezentaltreszhipotezishez tartozo koltseget.

Operator befolyasolas A veletlen csucskivalasztashoz barmilyen kiva-lasztasi sulyt lentrol felfele definialt tulajdonsagkent parameter for-majaban eltarolhatunk, es alkalmazhatjuk a veletlen csucskivalasztasbefolyasolasara. A dolgozatban harom peldat mutattunk be: magas-sagkuszob szerinti kivalasztas, a szelesseg-magassag aranytol fuggosulyozas, es egy, a magassaggal exponencialisan csokkeno sulyozas.

17

Page 20: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

5.2. Szemantikai megkotesek

A DTGP-ben hasznalt lentrol felfele definialt parametereket tekinthetjukegy attributum nyelvtan szintetizalt attributumainak. Ezert ezeket szintenszintetizalt attributumoknak vagy roviden attributumoknak nevezzuk. Aza attributum lehetseges ertekeinek halmazat Va-val jeloljuk. Ha maskentnem jelezzuk, az attributumok egy adott szabalyra ertelmezhetok, mertmeg ha ugyanazt az informaciot is tartalmazzak minden csucsban, a de-finıciojuk kulonbozo lehet minden szabalyra. Az attributumokat a gyerekcsucsok attributumaibol szamıtjuk ki, vagyis T.a = fa(T1.a, . . . , Tn.a).

Szemantikai megkotesek alkalmazasa azt jelenti, hogy a veletlen fakfelepıtesekor elore definialt szemantikai informaciot kell tovabbıtanunk le-fele a reszfaknak, es esetleg aktualizalnunk is kell a folyamat kozben. Ezt afolyamatot disztribucios halmazok es disztribucios fuggvenyek segıtsegevelırhatjuk le, amelyek meghatarozzak, hogy a szemantikai informaciot mi-kepp osztjuk el a reszfak kozott.

5.1. definıcio. (Disztribucios halmaz)Adott egy szintetizalt attributum a, amit a kovetkezo fuggveny definial:

T.a = fa(T1.a, . . . , Tn.a)

A v0 ∈ Va attributum ertekhez es az n ∈ N nemnegatıv egeszhez tartozodisztribucios halmaz vektorok egy Da(v0, n) halmaza, amit a kovetkezo-keppen definialunk:

Da(v0, n) = {(v1, . . . , vn) ∈ (Va)n | fa(v1, . . . , vn) = v0}

Tehat a disztribucios halmaz az osszes olyan ertekvektor halmaza, ami azelore definialt erteket szintetizalja.

5.2. definıcio. (Disztribucios fuggveny)Adott egy a szintetizalt attributum. Definialjuk a D ⊆ Va × Z+ hal-mazt, mint a legnagyobb olyan halmazt, amire minden (v0, n) ∈ D parraa Da(v0, n) disztribucios halmaz nem ures.

Egy disztribucios fuggveny egy Dom(fa) = D felett definialt veletlen

fa fuggveny, amelyre

fa(v0, n) = ~v, ahol ~v ∈ Da(v0, n).

Vagyis az fa(v0, n) a Da(v0, n) egy veletlenszeruen kivalasztott eleme.

18

Page 21: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

Disztribucios halmazok es disztribucios fuggvenyek segıtsegevel defi-nialhatunk olyan attributumokat, amelyek szemantikai megkoteseket tesz-nek a derivacios fakra. Ezeket megkotott szintetizalt attributumoknak ne-vezzuk, es a szintetizalt attributumokkal ellentetben ezeket nem a reszfakattributumai alapjan szamıtjuk ki, hanem az ertekeket a disztribuciosfuggvenyekkel a szuloktol a gyerek csucsokba adjuk tovabb.

Meg kell jegyeznunk, hogy van hasonlosag az orokolt es a megkotottszintetizalt attributumok kozott. A szemantikai informaciot mindket eset-ben fentrol lefele tovabbıtjuk, de a megkotott szintetizalt attributumokatlentrol felfele definialjuk.

5.3. definıcio. (Szemantikailag korlatozott derivacio)Adott G = (N ,Σ,P, S) nyelvtanra, az α0, α1, . . . , αn, α0 = S derivaciosszekvencia szemantikailag korlatozott egy a megkotott szintetizalt attri-butummal, ha minden i lepesre αi−1 = ϕAψ, αi = ϕβψ es a p : A → βszabalyra a kovetkezo teljesul:

Da,p(A.a) 6= ∅,

es ha a β szo k > 0 nemterminalist tartalmaz, melyek B1, B2, . . . Bk, akkor

(B1.a, B2.a, . . . , Bk.a).= fa,p(A.a),

ahol a.= az egyik lehetseges ertekkel valo egyenloseget jeloli.

A szemantikailag korlatozott derivacio soran, amikor az A → β sza-balyt alkalmazzuk, vesszuk az A-val cımkezett csucs a attributumanakv0 erteket. Eloszor ellenorizzuk a Da,p(v0) halmazt, hogy az erteket szetlehet-e osztani. Ha a Da,p(v0) ures, akkor az adott szabaly nem alkal-

mazhato. Ha talalunk alkalmazhato szabalyt, akkor az fa,p disztribuciosfuggveny segıtsegevel meghatarozzuk a β nemterminalis szimbolumaihoztartozo attributum ertekeket.

5.2.1. Veletlen fageneralas

Veletlen fa generalasakor ugy kell reszfakat generalnunk, hogy az attri-butumaik a teljes fanak megfelelo erteket szintetizaljak. Ezert amikor amegfelelo szabaly alkalmazasaval a reszfak gyokereit letrehozzuk, a diszt-ribucios fuggvenyt hasznaljuk a szemantikai megkotesek reszfak gyokereikozotti szetosztasara.

19

Page 22: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

A szemantikailag korlatozott derivacio egy nehezsege, hogy zsakutcabafuthat, vagyis egy reszleges derivacios fahoz vezethet, aminek egy vagytobb nemterminalis csucsaban ures disztribucios halmazok vannak. Ez alehetoseg problema-specifikus, es ezt a disztribucios fuggvenyek definiala-sakor figyelembe kell vennunk.

5.2.2. Keresztezes

A standard keresztezes ket fat valaszt ki, es mindkettoben egy azonoscımkevel rendelkezo csucsot keres. Megkotott szintetizalt attributumokalkalmazasa eseten azonban az attributumok ertekeinek is egyezniuk kell,kulonben konfliktus alakulna ki.

Ennek a problemanak a megoldasara modosıtanunk kell az operatortugy, hogy ne csak a cımkek, hanem a megkotott szintetizalt attributumokis egyezzenek, amikor ket reszfat megcserelunk. A standard keresztezesselez nehezkes, de a keszlet keresztezest modosıthatjuk ugy, hogy kezeljea megkotott szintetizalt attributumokat is. Ehhez az egyes keszleteketnemcsak nemterminalisokkal, hanem a megkotott szintetizalt attributumertekeivel is meg kell jelolni.

Elofordulhat, hogy a keszlet keresztezes sem mukodik. Ez akkor torten-het meg, amikor egy keszlet elemeinek szama pontosan egy. Ennek avaloszınusege no a lehetseges keszletek szamaval, es csokken a populaciomeretenek novelesevel. Ezert a keszlet keresztezes nem alkalmazhato,ha tul sok nemterminalis–attributumertek kombinacio letezik, hacsak apopulacio meretet nem noveljuk.

5.2.3. A szemantikai megkotesek korlatai

Amikor szemantikai megkoteseket definialunk, figyelembe kell vennunk asikertelen derivaciokat is. Ha a megkotes nagyon szigoru, nehezze valik ahelyes megoldasok generalasa. Ez tortenik, amikor a celfuggvenyt szeman-tikai megkoteskent hasznaljuk a logikai regresszios probleman. A sikerte-len derivaciok elkerulese erdekeben a derivacios fak magassagat novelnunkkell, de ezzel a fak merete exponencialisan novekszik. Tehat szemantikaimegkotes bevezetese csak egy bizonyos mertekig hasznalhato. Tovabbakonnyu belatni, hogy a keszlet keresztezes a megkotesek szigorıtasavalegyre kevesbe hatekony, mivel a keszletek szama is exponencialisan no.

20

Page 23: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

5.3. Veletlenszerusıtes

A derivacios fa alapu genetikus programozas, mint barmely mas sztochasz-tikus algoritmus, nagyban fugg a veletlenszerusıtes (randomizacio) mino-segetol, mivel ez befolyasolhatja a keresest, es meghatarozhatja, hogy akeresesi ter mely reszeit vizsgaljuk nagyobb valoszınuseggel. A dolgozat-ban a kovetkezoket vizsgaltuk:

Kivalasztas A kivalasztas operatort illetoen a DTGP nem kulonbozikmas evolucios algoritmusoktol. Ezek tobb kulonbozo kivalasztasimodszert is definialnak, melyek kozul barmelyiket alkalmazhatjuka DTGP-vel is.

Veletlen csucskivalasztas a csucsok sulyai alapjan mukodik, amit pa-rameterkent tarolunk. Az altalanos suly a levelekre 0, a tobbi csucsrapedig 1. A dolgozatban ket tovabbi peldat mutattunk be a logikairegresszios probleman. A harom tesztelt sulyozas kozul a standardsullyal ertuk el a legjobb eredmenyt.

Veletlen szabaly kivalasztas A veletlen szabaly kivalasztas optimali-zalasahoz bizonyos tulajdonsagok alapjan a szabalyokhoz sulyokatrendelhetunk. A dolgozatban harom lehetoseget teszteltunk, ezeka szabaly minimum erteke, amit a minp konstansban tarolunk, anemterminalisok szama a jobb oldalon es a rakovetkezo szabalyokszama. Az eredmenyek azt mutattak, hogy a minimum ertek szolgal-tatja a legjobb eredmenyt.

Reszfa korlat elosztas Miutan egy szabalyt kivalasztottunk es alkal-maztunk, vagyis uj csucsokat szurtunk be a derivacios faba, a reszfakorlatait ujra kell szamolnunk, es tovabbadnunk a veletlen fagenera-tornak minden nemterminalis csucsra. Ennek elvegzesere kulonbozostrategiak leteznek, a dolgozatban a kovetkezoket emlıtettuk: a stan-dard eljaras, ami veletlen elosztast hasznal, a minp-vel sulyozott es aszekvencialis. Azonban a tesztek nem mutattak lenyeges javulast sema logikai regresszios problemaval, sem az integer generalassal, ezerta gyakorlatban eleg a standard disztribucios strategiat alkalmazni.

21

Page 24: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

6. DTGP alkalmazasok

A dolgozatban a DTGP bemutatasara peldakent a logikai regresszios prob-lemat hasznaltuk, de mas feladatokra is alkalmaztuk a modszert, es rovi-den elemeztuk oket. Az elso pelda a 6-Multiplexer problema volt, ami agenetikus programozas egy standard peldaja. A masodik pelda az utazo-ugynok problema volt, amit gyakran hasznalnak optimalizalasi modszerektesztelesere. A harmadik pelda a DTGP egy gyakorlati alkalmazasa voltFIR (finite input response) filterek optimalizalasara.

6.1. Multiplexer

A multiplexer egy n cımbittel es 2n adatbittel rendelkezo logikai kapu,ami a cımbitek altal kivalasztott adatbitet adja vissza kimenetkent. Adolgozatban harom lehetoseget mutattunk be a 6-Multiplexer problema (2cımbit es 4 adatbit) megoldasara DTGP alkalmazasaval. Az eredmenyekmegmutattak, hogy a DTGP algoritmus kepes megoldani a 6-Multiplexerproblemat 88%-os sikerarannyal, es ha szemantikai megkoteseket is alkal-mazunk, az eredmeny meg jobb. Ez megmutatta a DTGP egyertelmuelonyet mas fa alapu GGGP modszerekkel szemben.

6.2. Utazougynok problema (TSP)

Az utazougynok problemara lefuttatott kulonbozo tesztek eredmenyei aztmutattak meg, hogy a DTGP algoritmus alkalmazhato a TSP utvonalanakoptimalizalasara, bar a talalt megoldas nem mindig optimalis. Mivel azutazougynok problema megoldasai utak vagy korok egy grafban, ezek belsostrukturaja nagyban kulonbozik a kornyezetfuggetlen nyelvek szavaitol.Ezert egy szintaktikailag megkotott optimalizalasi algoritmus alkalmazasanem a legjobb valasztas, es a szakirodalomban is csak nagyon keves olyanpeldat talalhatunk, amiben a hagyomanyos vagy nyelvtan vezerelt geneti-kus programozast a TSP problema megoldasara alkalmaztak.

6.3. FIR filterek

A DTGP algoritmust alkalmaztuk FIR filterek optimalizalasara egy kozosprojektben a Fraunhofer Tarsasag Integralt Aramkorok Intezetevel. [15]Ennek az alkalmazasnak az osszefoglaloja is megtalalhato a dolgozatban.

22

Page 25: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

7. Osszefoglalas

A dolgozatban egy uj nyelvtan vezerelt genetikus programozasi (GGGP)eljaras, a derivacios fa alapu genetikus programozas (DTGP) kerult de-finialasra es kiertekelesre. Ez a modszer egy elore megadott kornyezet-fuggetlen nyelvtan feletti derivacios fakat hasznal az egyedek reprezenta-lasara, es ezekre a fakra alkalmaz genetikus programozast. Ennelfogvaa derivacios fa alapu GGGP -k kategoriajaba sorolhato, es mas nyelv-tan vezerelt eljarasokhoz hasonloan garantalni tudja, hogy az eloallıtottegyedek az adott nyelvtan szempontjabol mindig szintaktikailag helyesek.

A linearis GGGP megkozelıtesekkel osszehasonlıtva a DTGP adat-tıpusa nagyobb, bar legtobbszor nem aszimptotikusan, de mindenkepposszetettebb. Ez a dolgozat bemutatta, hogyan lehet az evolucios operato-rokat helyesen es hatekonyan definialni ugy, hogy ne csak a derivacios faklegyenek helyesek, hanem az idobonyolultsag is logaritmikus maradjon azesetek tobbsegeben.

Azt is bemutattuk, hogyan lehet parametereket alkalmazni az algo-ritmus tovabbfejlesztesere. Ennek egy fontos alkalmazasa a fent emlıtettveletlen csucskivalasztas. A lentrol-felfele parameterek arra is alkalmasak,hogy a fitness szamıtashoz hasznalhato informaciot taroljunk el. Nemelyesetben a fenotıpus, vagy akar a fitness ertek is kiszamıthato parameter-kent, es ıgy a kiertekeles idoigenye konstans, egy tovabbi, logaritmikusideju muvelettel a parameterek frissıtesere.

A lentrol-felfele parameterek ertekeit elore is megadhatjuk, mint sze-mantikai korlatokat. A disztribucios halmazok es disztribucios fuggvenyekhasznalataval ezeket az ertekeket fentrol lefele haladva lehet tovabbadni areszfaknak a veletlen fa generalasa soran. Ezt az eljarast szemantikailagkorlatozott derivacionak nevezzuk. A szemantikai korlatok alkalmazasaegy jelentos elorelepes a korabbi GGGP eljarasokhoz kepest, mert eddigilyen korlatozasokat csak a fitness fuggvenybe lehetett beepıteni. Ebben azesetben olyan egyedek is letrejottek, amelyek nem elegıtettek ki a szeman-tikai korlatokat, es ezeket kesobb a fitness ertek alapjan kellett kiszurni.

A dolgozatban a DTGP modszer a logikai regresszios probleman kerultreszletes bemutatasra. Ezen kıvul, a DTGP algoritmust teszteltuk a 6-Multiplexer probleman, valamint bemutattuk, hogyan lehet alkalmazni azutazougynok problemara. A modszer FIR (finite input response) filterekoptimalizalasara valo gyakorlati alkalmazasat szinten osszefoglaltuk.

23

Page 26: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

A dolgozat megallapıtasainak osszefoglalasa:

I. Tezis A derivacios fa alapu genetikus programozas, ahogy ebben adolgozatban definialtuk, egy specializalt evolucios algoritmus, amikulonbozo optimalizalasi problemak megoldasara alkalmazhato a fe-kete doboz elv alkalmazasaval, mikozben az eloallıtott egyedek szin-taktikai helyessege is garantalt.

a. A jol definialt veletlen fageneratorral a DTGP ervenyes de-rivacios fakat allıt elo, mikozben a szukseges meretkorlatozastis betartja.

b. Az operatorok alkalmazasa elott a DTGP logaritmikus idobenki tud valasztani egy veletlen csucsot a derivacios faban, mikoz-ben biztosıtja, hogy a kivalasztas valoszınusege minden csucsraugyanaz. Tovabba a kivalaszthato csucsok halmaza korlatoz-hato, es szukseg eseten nem uniform szelekcios suly is alkal-mazhato.

c. A gyengen teljesıto hagyomanyos keresztezes helyettesıtheto akeszlet keresztezessel, ami ugyanolyan idoigenyu, de legtobbszor100%-os hatekonysaggal mukodik.

II. Tezis A derivacios fak kibovıtett adattıpusanak koszonhetoen, megfe-leloen definialt parametereket alkalmazva, a DTGP viselkedese ala-kıthato, es az algoritmus tovabbfejlesztheto.

a. Megfelelo informacio csucsokban torteno eltarolasaval bizonyosesetekben a fitness fuggveny konstans idoben kiertekelheto. Aparameterek frissıtese tovabbi szamıtast igenyel az operatorokalkalmazasa utan, de ez nem noveli a teljes idobonyolultsagot.

b. Parameterek hasznalataval a veletlen csucskivalasztas, es ıgyaz evolucios operatorok, valamint a fitness kiertekeles is be-folyasolhatoak.

c. Megkotott szintetizalt attributumok segıtsegevel szemantikuskorlatok helyezhetok az algoritmusba.

III. Tezis A DTGP alkalmazhato kulonfele optimalizalasi problemakra,kulonosen akkor, ha a megoldasoknak olyan strukturajuk van, amelyegy kornyezetfuggetlen nyelvtannal leırhato.

24

Page 27: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

Hivatkozasok

[1] H. Alblas. Introduction to attribute grammars. In Proceedings of theInternational Summer School on Attribute Grammars, Applicationsand Systems (SAGA’91), volume 545 of LNCS, pages 1–16. SpringerVerlag, 1991.

[2] N. Chomsky. On certain formal properties of grammars. Informationand Control, 2:137–167, 1959.

[3] A. E. Eiben and J. Smith. Introduction to Evolutionary Computing.Springer-Verlag, 2003.

[4] F. Gruau. On using syntactic constraints with genetic programming.In P. J. Angeline and K. E. Kinnear, Jr., editors, Advances in GeneticProgramming 2, chapter 19, pages 377–394. MIT Press, Cambridge,MA, USA, 1996.

[5] J. R. Koza. Genetic Programming: On the Programming of Comput-ers by Means of Natural Selection. MIT Press, Cambridge, MA, USA,1992.

[6] R. I. McKay, N. X. Hoai, P. A. Whigham, Y. Shan, and M. O’Neill.Grammar-based genetic programming: a survey. Genetic Program-ming and Evolvable Machines, 11(3/4):365–396, Sept. 2010. TenthAnniversary Issue: Progress in Genetic Programming and EvolvableMachines.

[7] D. J. Montana. Strongly typed genetic programming. EvolutionaryComputation, 3(2):199–230, May 1995.

[8] M. O’Neill and C. Ryan. Grammatical Evolution - Evolving programsin an arbitrary language., volume 4 of Genetic Programming. KluwerAcademic Publishers, 2003.

[9] R. Poli, W. B. Langdon, and N. F. McPhee. A field guide to geneticprogramming. Published via http://lulu.com and freely available athttp://www.gp-field-guide.org.uk, 2008. (With contributions byJ. R. Koza).

25

Page 28: Deriv aci os fa alapu genetikus programoz asdoktori.bibl.u-szeged.hu/1659/3/vanyi_booklet_hu.pdf · 2013-04-16 · In Second NASA/ESA Conference on Adaptive Hardware and Systems (AHS

[10] R. Vanyi. Enforcing semantic constraints with derivation tree basedgenetic programming. Abstract accepted to oral presentation atVeszprem Optimization Conference: Advanced Algorithms (VOCAL2012), 11-14 dec 2012.

[11] R. Vanyi and S. Zvada. Avoiding syntactically incorrect individualsvia parameterized operators applied on derivation trees. In R. Sarker,R. Reynolds, H. Abbass, K. C. Tan, B. McKay, D. Essam, andT. Gedeon, editors, Proceedings of the 2003 Congress on EvolutionaryComputation CEC2003, volume 4, pages 2791–2798, Canberra, 8-12dec 2003. IEEE Press.

[12] R. Vanyi and S. Zvada. Syntactically correct genetic programming. InR. Poli et al., editors, GECCO 2004 Workshop Proceedings, Seattle,Washington, USA, 26-30 jun 2004.

[13] P. A. Whigham. Grammatically-based genetic programming. In J. P.Rosca, editor, Proceedings of the Workshop on Genetic Programming:From Theory to Real-World Applications, pages 33–41, Tahoe City,California, USA, 9July 1995.

[14] S. Zvada. Attribute Grammar Based Genetic Programming. CuvillierVerlag, 2010.

[15] S. Zvada, G. Kokai, R. Vanyi, and H. H. Fruhauf. EvolFIR: Evolvingredundancy-free fir structures. In Second NASA/ESA Conference onAdaptive Hardware and Systems (AHS 2007), pages 439–446. IEEEComputer Society, 5-8 aug 2007.

[16] S. Zvada and R. Vanyi. Improving grammar-based evolutionary algo-rithms via attributed derivation trees. In M. Keijzer, U.-M. O’Reilly,S. M. Lucas, E. Costa, and T. Soule, editors, Genetic Programming7th European Conference, EuroGP 2004, Proceedings, volume 3003of LNCS, pages 208–219, Coimbra, Portugal, 5-7 apr 2004. Springer-Verlag.

26