Upload
biro-imre-levente
View
2
Download
0
Embed Size (px)
Citation preview
1
Matematika az irodalomban és a nyelvészetben
A mindennapi életben a matematikát a természettudományok meghatározó fontosságú,
lényeges összefüggéseket leíró tudományának tartják. Ilyen formán nyugodtan mondhatnánk,
hogy a matematika a nyelve a természettudományoknak, annak terminológiája szerves eleme
például a fizikának. Ha a matematikát nyelvnek nevezzük, felmerül a kérdés, vajon a
nyelvészetben van-e helye és szerepe a matematikának? Feltárhatók-e matematikai
összefüggések a matematikától oly távol eső területen, az irodalomban?
E tanulmány ezekre a kérdésekre keresi a választ. Célja annak feltárása és bemutatása,
hogy a magyar nyelvészetben és irodalomban milyen módon jelenik meg a matematika.
Mielőtt bármit is elkezdenénk fontos tisztázni, hogy a magyar, angol, stb. nyelvekre nem
nyelvészeti szempontból tekintünk, hanem matematikai szemszögből. A tanulmányban a
nyelvre, mint matematikai fogalomra nézünk, nem pedig irodalmi meghatározásra.
A matematika az az abc, amellyel Isten az Univerzumot írta
(Galileo Galilei)
A magyar irodalomnak és nyelvtannak több köze van a matematikához, mint azt bárki
hinné. Gondoljunk csak egy olyan egyszerű kifejezésre, mint a regény hossza vagy a szó
hossza. Ráadásul többféle értelemben használatos. Egyik például az oldalszám (vagy esetleg
mennyi idő kell az elolvasásához) a másik a betűk száma. Számos olyan példát fogunk
megnézni, amely az irodalomnak és a nyelvészetnek a matematikával való kapcsolatát fogja
igazolni. Kezdetnek nézzük meg azt, ami az író számára a legfontosabb: a szó és a nyelv.
Minden emberi nyelv az alapegységekből áll. Hasonlóan az algebrához, ahol az
alapegységek a számok. Azzal a különbséggel, hogy az emberi nyelvek véges sok és
megszámlálható alapegységet tartalmaznak, míg a számok halmazára nem feltétlen igaz. De a
számokhoz hasonlóan ezek az alapegységek – más néven betűk – halmazt alkotnak. Ez a
halmaz az abc, amiben minden betű egyszer szerepel. Matematikai értelemben az abc a
következő képen definiálható:
Σ abc * eleme Σ (üres jel) és | Σ | ≥ 3 és véges halmaz
Megjegyzés(1): az üres jel a szavakat elválasztó jel, ami jelen esetben a szóköz.
Ez az értelmezés ugyan nem engedi meg a végtelen nagy halmazt, de bizonyos értelemben
viszont nincs felső határa, vagyis nincs olyan k szám, amire igaz, hogy k+1 elemszámú abc,
már ne lenne elfogadható.
Megjegyzés(2): A beszélt nyelvek hangokból állnak. Azonban az alapegységeket azért
tekintjük betűknek, mert matematikai szempontból ezek építik fel a nyelveket. A másik ok az
az, hogy a betűk és a hangok között egy reláció áll fenn. A hangok szempontjából reláció, a
betűk szempontjából függvény. Hasonlóan a számokhoz. Az egy, mint szám nem egyezik
meg az őt szimbolizáló jellel. De látható, hogy a számokat is több féle képen ábrázolják,
hasonlóan a betűkhöz. Lássunk egy példát:
„A”, mint hang: A, a , A, a Egy, mint szám: 1, I , egy, …
Nézzük meg a magyar nyelv esetében hogyan érvényesül a fent tárgyalt abc definíció:
Σmagyar = { A, Á, B, C, CS , … , U, V, Z, ZS } latin betűkkel | Σmagyar | = 40 ≥ 3
A magyar abc-nek létezik kiterjesztett változata
2
Σmagyar-kiterjesztett = Σmagyar U {Q, W, X , Y} | Σmagyar-kiterjesztett | = 44
Megjegyzés: a magyar nyelvben vannak kettős betűk és egy hármas betű a latin írásmóddal.
Ezek a betűk egy egységnek tekintendők, vagyis nem választhatók szét.
Például: a helyes elválasztás lán – dzsa és nem lánd – zsa.
A következőkben megvizsgáljuk az ősi székely – magyar rovás abc-t. A magyar nyelvnek
több ezer évig ez volt az abc-je, és a magyar emberek ezt abc-t használták írásra, pontosabban
rovásra. Az ősi székely - magyar abc (továbbiakban rovás abc) csak egykarakteres betűket
tartalmaz, de ugyanúgy megtalálhatók benne a kettős betűk megfelelő egy karakteres alakja.
Ez alól kivétel a ’dz’ betű és a hármas ’dzs’ betű. A latin abc betűkészlete kevés a magyar abc
leírására, ezért meg kellett oldani azoknak a betűknek is a jelölését, amelyek a latin abc-ben
nincsenek.
A fenti állítás azért is igaz, mert | Σlatin | = 26 < | Σmagyar | = 40
Nézzük egy példát a kettős betű leképezésére : ’| ’= ’sz’ | = ’s’ U ’z’ = sz
Σmagyar-rovás Σmagyar = Σlatin U {Á, CS, DZ, DZS, É, GY, Í, LY, NY, Ó, Ö, Ő, SZ, TY, Ú, Ü,
Ű, ZS} \ {Q, W, X, Y}
Ha nem vizsgáljuk a különbséget a balról jobbra és jobbról balra olvasás között:
| Σmagyar-rovás,FS | = | Σmagyar | -1 = 39
| Σmagyar-rovás,MA | = | Σmagyar | - 5 = 35
A rovás abc – nek két változata van. Az egyik a Magyar Adorján (a továbbiakban: MA) a
másik a Forrai Sándor (továbbiakban: FS) által meghatározott betűkészlet.
Alapvető különbség az, hogy a MA ábécé nem tartalmaz külön jeleket a hosszú
magánhangzókra (í, ó, ő, ú, ű ) emellett két féle ’S’ betűt (’ES’ és ’AS’)és két féle ’K’ (’KA’
és ’AK’)betűt különbözet.
Az FS ábécé azonban megkülönbözteti a rövid és hosszú magánhangzókat, azonban csak egy
fajta ’S’ betű létezik benne, de ugyan csak két fajta ’K’ betű.
Mindkét abc –re igaz, hogy nincs bennük ’dz’ és ’dzs’ betű illetve ennek megfelelő jel.
Ha figyelembe vesszük a balról jobbra, és a jobbról balra írás közötti különbséget, akkor:
| Σmagyar-rovás,FS | = (| Σmagyar | - 1)* 2 és | Σmagyar-rovás,MA | = (| Σmagyar | - 5)*2
Ez a megkülönböztetés azért célszerű, mert egy szöveget nem biztos, hogy csak az egyik
típussal írták. Elfordult, hogy balról jobbra írva a sorvégén nem a következő sor elejére
ugrottak, hanem folytatták az írást a következő sorban jobbról – balra.
A helyzet azonban tovább bonyolódik. Ugyanis a ma elfogadott magyar abc betűit is két féle
képen használjuk. Egyrészt, mint kis és nagy betűk, más részt írott és nyomtatott és ezek
keveréke. Ami biztos, hogy a mindennapi életben két féle abc használatos (kis és nagy betűk),
így a következő kép alakulnak az abc-k:
Σmagyar = Σmagyar, kis U Σmagyar, nagy ez igaz írott és nyomtatott betűkre. Ekkor a rovás abc-hez
való viszonyuk a következő lesz.:
| Σmagyar-rovás,FS | = | Σmagyar | - 1 és | Σmagyar-rovás,MA | = | Σmagyar | - 5
3
A mellékletben ezek a viszonyok tovább vannak részletezve.
A rovás abc-ben az egy karakteres betűkön kívül még léteznek ligatúrák. Ezek a karakterek
több betűt jelölnek, de nem többszörös betűk, mint ’dz’ vagy ’dzs’, hanem rövidítések,
amelyek akár egy szót is jelölhetnek. Így a rovás abc-ben egy külön kódolási eljárás is
fellelhető, ami az írás karakter számát rövidíti.
Nemcsak a ligatúrák rövidítik a karakter számot, hanem a bizonyos karakterek kihagyása.
Általában ezek magánhangzók. A magánhangzók kihagyását akkor alkalmazták, ha
egyértelmű volt a szó betű kihagyásokkal is.
Megjegyzés: a rovás abc és a magyar abc kis illetve nagy betűi között bijektív leképező
függvény létezik , ha eltekintünk a kétfajta k és s betűktől.
Azonban van még itt egy probléma, még pedig az „y” betű. A magyar abc se melyik
változata, nem tartalmazza az y karaktert. Pedig 4 betűben is fellehető: gy, ly, ny, ty.
Valószínűleg az y az orosz lágyjelhez (ь) hasonlít. Az úgymond kemény g, l, n, t betűkből
lágy betűket képez. Ez esetben, viszont a magyar abc elemszáma nem 40 hanem 41. Ekkor
viszont:
| Σmagyar-rovás,FS | = | Σmagyar | és | Σmagyar-rovás,MA | = | Σmagyar | - 4
Érdekesség: az angol és a latin abc (nem meglepő módon) része a kiterjesztett magyar abc-
nek, vagyis: Σlatin Σmagyar és Σangol Σmagyar de ebből nem következik, hogy az angol vagy a
latin nyelv a magyar nyelv része volna, de az igaz, hogy nincs olyan latin vagy angol szó,
amit a kiterjesztett magyar abc-ből ne lehetne előállítani.
Miután megtörtént az abc definiálása, megnézzük, hogyan jönnek létre a szavak
Σ k : Σ –ból képzett K hosszúságú szavak halmaza
Σ0 = Σ \ {*}
Ekkor a K hosszúságú szavak halmaza, amiben nincs elválasztás: Σ 0k
Megjegyzés: Ahogy a geometriában létezik hosszúság definíció úgy a nyelvészetben is létezik
hosszúság meghatározás. A szó hossza, az őt képező betűk száma.
Például: |család| = 5 család szó eleme Σ 05
és eleme Σ 5
Most már vannak alapegységeink – ezek a betűk. Vannak egységeink melyeknek önálló
értelmük van és betűkből épülnek fel ezek a szavak. Most már alkothatunk nyelvet, ami a
következő képen értelmezhető:
L nyelv , ha L Σ 0* , ahol
Sztenderd probléma, adott x szó ami eleme Σ 0*. Kérdés: x szó az L nyelvben benne van – e?
Konkretizálva a magyar nyelvben benne vannak azok a szavak, amelyek 1, 2 ,3, … hosszúak.
Fontos kérdés az, hogy mik azok az i hosszú szavak, amik benne vannak a magyar nyelvben?
Ennek a kérdésnek az eldöntése részben már nyelvészeti feladat. Amit tudunk a magyarról az
az, hogy véges nyelv, ezért értelmes dolog felsorolni azokat a szavak, amik benne vannak.
Lmagyar = | Σ 0, értelmes1| + | Σ 0, értelmes
2| + | Σ 0, értelmes
3| + … + | Σ 0, értelmes
K|, ahol K a leghosszabb
magyar szó.
4
Most már meghatároztuk mi az, hogy betű, szó és mit jelent az, hogy nyelv. A magyar
nyelvnek és minden emberi nyelvnek van egy fontos tulajdonsága. Ez pedig a rekurzivitás, és
ennek következtében a rekurzív felsorolhatóság.
Egy L nyelv rekurzív Ha a χL (χL : Σ 0* {0,1}) karakterisztikus függvénye rekurzív
L nyelv rekurzív felsorolható Ha létezik rekurzív f függvény : Σ 0* Σ 0
* : Im(f) = L
vagy L = üres
A magyar nyelv rekurzív nyelv, mivel véges. Ezért létezik neki leghosszabb szava, így a
rekurzió egyik módja a következő:
Tegyük fel, hogy a magyar nyelv leghosszabb szavának hossza K. Ekkor egy K+1 magasságú
fát tudunk szerkeszteni, amire igaz, hogy egy csúcs
gyerekeinek száma 41 vagy üres jel. Így egy w
hosszúságú szó egy w+1 magasságú lánc lesz a
fában, ami a w+1. szintig tart. A +1 azért kell, mert
szükséges egy hely a üres hely jelölésére, ami jelzi a
szó végét, de ez már az L halmazba nem kerül bele.
Nézzünk egy egyszerű példát: w = asztal. |w| = 5
A lánc hossza |w|+ * = |w |+ 1 = 6 . Első betűje a,
ezután az 1. szintű a részfájában folytatódik a
rekurzió. Addig nézzük a gyerekeit, míg az ’sz’
betűhöz nem érünk, ezután a 2. szintű ’sz’ betű
részfájában folytatódik az eljárás, egészen míg az 5.
szint l betűjét meg nem találjuk és utána a 6. szinten a
* jelet.
Az eljárást az ezen az ábrán látható.
Megjegyzés: Nem csak véges nyelv lehet rekurzív.
A magyar nyelv rekurzív felsorolható is, mivel
rekurzív.
Az emberi nyelv, mint kuriózum
Az emberi nyelvek mindegyike különleges nyelv. Egyrészt, mert véges, de leginkább ami a
végességéből következik mégpedig, hogy rekurzív. Azt, hogy az emberi nyelvek mennyire
nem átlagos nyelvek, azt a következő bizonyítás mutatja meg.
A legtöbb nyelv nem rekurzív: (Matematikai nyelvek!, az emberi nyelvek is benne vannak)
|Σ 0*| = w0 megszámlálható
{ L : L Σ 0* } = P (Σ 0
*) = 2 Σ 0*
2w0
= 2 Σ 0*> w0 Nyelvek száma : 2
w0 Kontinuum sok
Turing – gépek száma: Véges string, tetszőleges abc felett le lehet írni
#(Turing –gépek) ≤ w0 ≤ |Σ 01| + |Σ 0
2| + …+ |Σ 0
i| A Turing – gépek száma legfeljebb
megszámlálható Egy Turing – gép legfeljebb egy nyelvet képes felismerni.
A fenti levezetés következménye az, hogy ha tekintem az összes nyelvek halmazát, akkor
annak a valószínűsége, hogy egy rekurzív nyelvet választok ki belőle az nulla. Ez azért is
érdekes, mert az ember nyelvalkotás szempontjából, csak véges nyelvet tud alkotni, tehát
rekurzívat. Vagyis pont olyat, aminek a véletlenül való kiválasztása nulla. Tehát az agy nem
random generátor. Ennek következménye az, hogy az ember sem random generátor, hanem
önálló gondolkodásra képes autonóm lény. (Ez nem jelenti azt, hogy az emberben nincsenek
5
„előre programozott” mechanizmusok vagy, hogy a gondolkodást ne lehetne irányítani. De a
gondolkodás, mint folyamat nem előre determinált.)
Időmértékes verselés
A magyar nyelv azon kevés nyelv közé tartozik, amely természetétől fogva alkalmas az
időmértékes verselésre (mivel a magyar nyelv eleve megkülönbözteti a hosszú és rövid
magánhangzókat.). Ezt a lehetőséget sok nagy költőnk csodálatosan alkalmazta Sylvester
Jánostól Berzsenyin át Radnótiig. Az indogermán (pl. svéd, angol, német) nyelvekben a
hosszú magánhangzók helyett a ritmus kedvéért gyakran olyan szótagokat használnak, ahol a
mássalhangzók torlódása szabályozza a kicsengési időtartamot. Ez az úgynevezett analógiás
(konstruktív) versépítő technika jól megfigyelhető Goethe, vagy a svéd Georg Stiernhielm
hexaméteres költeményeiben. (Wikipédia)
Az időmértékes verselésnek is van alapegysége a nyelvhez hasonlóan, ez a versláb, melynek
mértékegysége: a mora. (Érdekes, hogy a mértékegység fogalom ilyen kézzel fogható módon
jelenik meg az irodalomban).
Egy rövid szótag: 1 mora, egy hosszú szótag: 2 mora. Megkülönböztethető 2 , 3 vagy 4
mora hosszúságú versláb.
A szótagok hosszának jelölésére két fajta jelet használnak:
U : A rövid szótag jele (1 mora) — a hosszú szótag jele (2 mora).
Ezzel elérkezetünk a digitális jelek történetének első fejezetéhez. Ugyanis a rövid szótagnak
megfeleltethető egy jelszint, ami valamilyen logika érték (például: logika 0) és ugyancsak a
hosszú szótagoknak is megfeleltethető egy jelszint, ami valamilyen logikai érték (például:
logika 1). Következésképpen minden verslábnak és sorfajtának megfeleltethető egy digitális
kód, ami őt egyértelműen azonosít.
Elmondható, hogy az ókori görögök már használták a „digitális” jeleket.
Például: koriambus : — U U — = 1 0 0 1
1 Pl.: logikai 1 5 Volt , logikai 0 1 V, üres jel 0V
0
1 0 0 1
Hexameter, Képlete: 1 0 0 | 1 0 0| 1 0 0| 1 0 0 | 1 0 0 | 1 0
Hat verslábból álló sor. Görög és római verselés fő eleme. A verslábak daktilusok vagy
spondeusok, az utolsó előtti mindig daktilus, az utolsó trocheus, vagy spondeus.
Pentameter: 1 0 0 | 1 0 0 | 1 1 0 0 | 1 0 0 | 1
Neve szerint öt, de valójában hat (négy teljes, és két fél) verslábból álló verssor, amelyben a
harmadik és hatodik csonka. Önálló sorként ritka, de az ókori görög költészetben gyakori a
disztichonok második soraként.
6
Disztichon
Egy sor hexameterből és egy sor pentameterből álló sorfajta.
"Gyűlölöm azt, aki telt kupa mellett bort iszogatván
— U U | – UU| – U U| – – | – U U | – —
háborut emleget és lélekölő viadalt. "
— U U |— U U| – || – UU| – U U| —
Anakreón: Gyűlölöm (részlet)
Műfajok és jellemzők, avagy az objektivitás az irodalomban
Nézzük meg röviden a legnagyobb irodalmi kategóriákat.
- Epika
- Líra
- Dráma: - dráma modellek
- Egyéb
A három műnem elkülönítését már az ógörög irodalomban is megfigyelhetjük. Ez a
hármasság tisztán azonban csak Goethe és Schiller elméleti munkásságában bontakozott ki, a
hagyományos műnem- és műfajelméleti rendszert pedig Hegel dolgozta ki esztétikájában
1820-1829 között. A műnemek meghatározásának leggyakoribb szempontjai: az idősík, a
szerzőnek a műhöz és a valósághoz fűződő viszonya, a nézőpont, stb. Mindegyik műnembe
kvázi egyértelműen besorolhatók a
versek. Mindegyik műnem további
alkategóriákra (halmazokra)
bontható. Ezen felül a dráma
műfaj két nagyobb halmazra a
Dráma műfajok és a Dráma
modellek halmazra. Ezzel megint
kialakult a fa struktúra, hasonlóan
a rekurzív nyelvekhez. Alapvető különbség itt az, hogy egy csúcs gyerekeinek a száma nincs
előre meghatározva és nincs maximalizálva. Míg a szó alkotásban szereplő fák 41-es
kupacok, addig a műfaj elméleti fa inkább Fibonacci kupachoz hasonló. Ez az ábra a
műnemek csoportosítását mutatja be. A számok az adott műnem műfajainak számát jelöli.(Az
adott csúcs gyerekeinek számát jelölik)
Ezzel elérkeztünk az objektivitás kapujába. Ugyanis az a tény, hogy egy adott irodalmi mű
mely műfaj elméleti kategóriába vagy kategóriákba (vegyes műfajú mű) sorolható, az előre
meghatározott. Ugyanis minden műnemnek megvannak a maguk kritériumai és minden
műfajnak megvannak a maguk meghatározásai. Gyakorlatilag, amikor egy mű műfaját
próbáljuk meghatározni, a fent levő fán megyünk végig. Mivel megvannak a kritériumok,
ezért az ellenőrizhetőség megjelenik, sőt magától értetődővé válik. Ezáltal a kategorizálás
ellenőrizhetővé, vagyis objektívvé válik.
A regény cselekménye
A regényben az események több szálon futnak Az író sokszor több személy szemszögéből
mutatja be az eseményeket. Mivel a regényben nem lehet párhuzamosan ábrázolni (egy
oldalon leírni több személy szemszögéből az eseményeket) csak folytonosan, a regényben az
idő múlása nem monoton növekvő, sőt nem is biztos folytonos. Tulajdonképpen az idő múlása
egy görbe, az idő és a cselekmény által meghatározott térben. Az egyszerűség kedvéért
tekintsünk tér és idő koordinátákat (mondjuk, a szereplők csak mozognak), és ezt ábrázoljuk.
7
Tegyük fel, hogy a cselekmény annyi, hogy a szereplők eljussanak egyik pontból a másikba
és ezt kell leírnunk minél részletesebben. A leírás az alábbi ábrázoláshoz lesz hasonló.
Az ábrán a 3 szereplő tényleges mozgása a fekete vonalak, a regény cselekménye a piros
vonal, ahogy az író ábrázolja, a szaggatott vonal átmenet egyik helyszínről a másikra, ami
akár ugrás is lehet. Így tulajdonképpen egy regény esemény tere egy több dimenziós tér,
tengelyein különféle értékekkel, amelyek nem csak matematikai kifejezések lehetnek, hanem
irodalmi kifejezések is, például: „a főhős erkölcsi fejlődése”. A regény maga - vagyis az író
szemszögéből a történés - egy görbe a hipertérben. A metszéspontok valamilyen kapcsolatra
utalhatnak (például találkozás), de ez nem mindig van így. Tényleges kapcsolat, csak akkor
jön létre, ha ez minden paraméter szerint is létre jön. Például: A fent látható pálya görbéken a
csomópontok, csak akkor tényleges találkozások, ha azok időben is találkozások. Vagyis az,
hogy a két pálya metszi egymást, nem biztos, hogy ott találkozás történik.
Szintaktika, szemantika
Ahogy a számítástechnikában, matematikában és szinten minden természettudományban
nagyon fontos a jelsorrend ugyan úgy a nyelvészetben is az. Egy apró változtatás drasztikusan
megváltoztathatja a szó illetve a jel sorozat jelentését. Tulajdon képen a szó az egy jelsorozat,
aminek jelentése van. Ahogy a nyelvészetben is vannak szavak ugyan úgy a matematikában is
vannak szavak. Kezdjük ezeknek az elemzésével.
Amíg a magyar nyelvben egy szó általában több karakterből áll, addig a matematika általában
egy karakteres szavakat használ. De a matematika szavai és a magyar szavak között egy
bijektív leképező függvény létezik. Lássunk rá egy – két példát
Létezik ↔
Mindegyik / Bármely ↔
De nem csak a magyar nyelv esetében létezik bijektív függvény. Minden más nyelv esetében
is létezik, sőt az adott nyelv szavától függetlenül a matematikai szimbólum ugyanaz marad,
feltéve, hogy a jelentése is (vagyis a szó által hordozott információ) ugyan az – e. Például:
To be ↔
Es gibt ↔
Bizonyos keretek között a matematika, mint nyelv interfész két humán nyelv között.
Létezik ↔ ↔ To be
Természetesen a fent felsorolt szimbólumokon kívül még sok szimbólum létezik a
matematikában. Gondoljunk csak a számokra, zárójelekre, operátorokra. Gyakorlatilag
mindegyikőjük egy egykarakteres kifejezés és mindegyikőjükre igaz, hogy külalakjuk a
nyelvtől független. Igaz azonban, hogy a gyakorlati jelentésük több karakteres. Például
8
Összeadás / „meg” : ↔ +
De: 5 + 6 = 11 ↔ Öt meg hat egyenlő tizenegy
A matematika tulajdonképpen egy nyelv, amivel a matematikai problémákat le is lehet írni és
megoldani is mód van rá. A nyelvészet ettől egy kicsit eltér. Ugyanis amíg a matematika
nyelvével gyakorlatilag csak matematikai problémák írhatók le, addig a nyelvészettel nem
csak nyelvészeti problémák határozhatók meg. A nyelvészettel szinte minden probléma
leírható, a megoldás az egy másik kérdés. A másik eltérő tulajdonság, hogy a matematika
nemzetközi. Vagyis szimbólumot minden matematikus megérti függetlenül a nemzetiségtől,
azonban a „létezik” jel sorozatot csak a magyar ember érti meg. Egy harmadik különbség az,
hogy egy szimbólum, akkor több szónak vagy akár egy egész mondatnak megfelelhet. A
későbbiekben fogunk erre is példát látni. Azonban nézzünk meg most egy olyan példát ami
probléma leírásra alkalmas:
Létezik – e egész szám, ami ötnél nagyobb, de hétnél kisebb:
? x Z: 5 < x < 7
De nem matematika probléma a következő:
Szereti – e Mariska Pistát?
Ezt csak a nyelvészet illetve a pszichológia tudja kezelni. Ez nem azt jelenti, hogy matematika
rossz, hanem, hogy megvannak a maga korlátai és gondoljunk bele abba is, hogy a
nyelvészettel sem lehet minden problémát megoldani.
Térjünk vissza az elemzéshez. Megállapítottuk, hogy a matematikának vannak szavai. Ha
vannak szavai, akkor azokból mondatokat is lehet képezni, mint ahogy a fenti példán is
látható. De nézzünk még meg egy komolyabb mondatot:
Egész számok azok a számok, amelyek felírhatók két természetes szám különbségeként:
Z = { x | x = y – z : y,z N }
Tulajdon képen matematika szöveg is elképzelhető, de ez már a formális logika területe.
Mi a matematika nyelvtana? Először is az, hogy a szimbólumokat értelmesen kell kezelni.
Ennek is megvannak a maguk (formális) szabályai, amiket most nem részletezünk. Ami
biztos, hogy fontos betartani a mondat képzés szabályait a matematikában is, különben
értelmetlen mondatot kapunk. Például:
+ 5 6 = 11 ? ↔ „ plusz öt és hat egyenlő tizenegy” vagy „plusz ötvenhat egyenlő tizenegy”?
A nyelvtan második része gyakorlatilag a maguk matematika szabályai, legyen szó egyszerű
állításokról vagy összetett és/vagy bonyolult tételekről. Vagyis a matematika nyelvét egy részt
a jelsorrend szabályai határozzák meg, más részt a matematikai állítások, tételek és törvények.
Lássunk erre is egy – két példát:
A = { (x,y) | x,y N y = x + 5}
Az A halmazban olyan számpárok vannak, amikre igaz, hogy mind a ketten természetes
számok és a második szám öttel nagyobb, mint az első.
Ezek matematikailag és nyelvtanilag is értelmes állítások vagy mondatok. Igaz az is, hogy egy
– két karakter több szónak felel meg:
(x,y) ↔ „olyan számpárok vannak”
x,y N ↔ mind a ketten természetes számok
Nézzünk most egy ellenpéldát:
A = { x | x N x = x + 5 }
Az A halmazban, olyan természetes számok vannak, amelyek öttel nagyobbak önmaguknál
A fenti állítás nyelvtanilag korrekt, de matematikailag butaság. Nincs olyan szám, ami
önmagánál öttel nagyobb. Ez értelmetlen. Ebből is látható, hogy a matematika nyelvét nem
csak a szintaktikai szabályok határozzák meg, hanem maguk a matematikai szabályok.
Tulajdonképpen szintaktikai és szemantikai szabályok határozzák meg egy mondat
szerkezetét, de nem csak a matematikában, hanem a nyelvtanban is.
Nézzük most meg, hogy a matematika, mint nyelv hogyan épül fel.
9
Nyelvtani értelemben vett abc-je nincsen vagyis nem lehet a jel között nagyságbeli relációt
tenni, de formális értelemben van, ami a következő:
Σmatematika = { üres jel, 0, 1, …, 9, +, -, *, \, : , ( , ) , , , …} véges halmaz
Σ természetes számok = {0,1,2,3,4,5,6,7,8,9,üres jel} és ebben létezik jel sorrend, vagyis értelmes
kérdés, hogy a <? b
A fentiből egyértelműen látszik, hogy
Σ valós számok Σmatematika
A már ismert definíciókból elő áll, hogy
Lmatematika Σ 0* pontosabban Lmatematika Σ*matematika,0
A magyar nyelvhez hasonlóan elő áll:
Lmatematika = | Σ 0, értelmes1| + | Σ 0, értelmes
2| + | Σ 0, értelmes
3| + … , de ez a magyarral ellentétben
nem véges, hanem végtelen nyelv, valamint nem is rekurzív, sőt nem is rekurzíve
felsorolható. Az igaz, hogy vannak olyan résznyelvei, amelyek rekurzívak (LDomino,
Ltermészetes_számok) és vannak olyanok résznyelvei, amelyek rekurzíve felsorolhatók (LNem_rak =
{d DOMINO | d-vel nem rakható ki a sík}), de összességében nem rekurzíve felsorolható,
ami az jelenti, hogy vannak olyan problémák, amelyekről nem lehet eldönteni, hogy igazak –
e vagy sem, vagyis a matematika nem teljes nyelv. A kérdés az, hogy a matematika teljes
nyelvé fog – e válni valamikor, mert lesznek olyan sejtések amelyek igazolást nyernek vagy
bebizonyítják, hogy nem igazak, de ezek megoldása vajon teljessé teszi – e a matematikát?
Nem, mert ezek mellett vannak olyan rész nyelvei a matematikának, amelyekről bizonyítottan
nem rekurzíve felsorolható. Ilyen például az a kérdés, hogy egy adott dominó készlettel
kirakható e a sík. Valamikor egyértelműen eldönthető, de általában véve nem.
Végezetül nézzünk meg egy-két példát, hogy egy apró változás mennyire megváltoztathatja a
szó jelentését.
vagány – vágány
lap – láp – lép
megy – meggy
Ebből is látható, hogy nyelvtanban ugyan olyan precízen be kell tartani a szabályokat, mint
bármely természettudományban. De gondoljunk még abba is, hogy az írás jelek elhelyezése is
megváltoztathatja a mondat jelentését. Nézzük meg a mindenki által ismert példát:
Királynőt megölni, nem kell félnetek, érdemes lesz! Vagy
Királynőt megölni nem kell, félnetek érdemes lesz!
Apró változás (egy vesszővel több vagy kevesebb) és máris az ellenkezőjét jelenti a mondat,
akárcsak a formális nyelvben. Lássunk erre is egy példát
A1={ x | i [2;n] n N n≤ x-1 : x mod i =0} vagy
A2={ x | i [2;n] n N n≤ x-1 : x mod i =0}
A1 = N – PRIM – {0,1} ezzel szemben A2 = 0 üres halmaz. Nem mindegy, hogy egy halmaz
minden eleméről van szó, vagy pedig van olyan elem ami abban a halmazban van.
A nyelvek polinomiális visszavezethetősége
Elsőnek nézzük meg mit is jelent, hogy egy nyelv polinomiálisan visszavezethető egy
másikra:
Legyen L Σ 0* és K Π0
* valamint legyen f: Σ 0
* Π0
* képező függvény. Ekkor L
polinomiálisan visszavezethető K-ra ↔ ha x L ↔ f(x) K. Ekkor a jelölése: L α K
A fenti meghatározás első közelítésben akkor érvényes minden emberi nyelvre, ha f nem
függvény, hanem reláció. Nagyon sok olyan szó van, ahol f lehet függvény, de vannak olyan
10
szavak, amelyekre f nem függvény. Ezek a szinonimák és a homonimák. Később nézünk erre
két példákat. Most azokra a szavakra nézünk egy példát, ahol egyértelmű a megfeleltetés:
ANGOL α MAGYAR f: ANGOL MAGYAR
pl.: car ANGOL ↔ f(car) MAGYAR f(car)=autó MAGYAR
Lássunk most a homonimákra példát:
Ég1 f(Ég1)= Sky – Kék az ég
Ég2 f(Ég2)= to burn - Ég a tűz
Másik példa a szinonimákra:
Potato Krumpli
Potato Burgonya
A kérdés az, hogy egy tetszőleges nyelv polinomiálisan visszavezethető-e egy másik nyelvre
vagy sem. A válasz igen, még a szinonimák és a homonimák esetén is. A megoldás a
következő: A homonimák esetén kiválasztunk egy szót és ezt képezzük le. A szó másik
változatát a nyelven belül leképezzük az előbb kiválasztott szóra és így képezzük le a másik
nyelvre. Például:
Burgonya g(Burgonya)=Krumpli f(krumpli)=f(g(burgonya))=gof(burgonya)=Potato
g: a nyelven belül képező függvény, f: a nyelvek között képező függvény
Így gyakorlatilag a tájnyelv is lefordíthatóvá válik. A több jelentésű szavaknál, pedig a
jelentésüket különböztetjük meg és úgy fordítjuk le őket. A jelentésük pedig a szöveg
környezetből kiderül. Következésképp a definícióban levő f tényleg lehet függvény minden
emberi nyelv esetén, nem csak reláció. Az eddig tárgyalt eljárás nem meglepő. Hiszen ha ezt
nem lehetne megcsinálni, akkor a nyelveket nem lehetne egyikről a másikra lefordítani és így
ekkor (nyelvi)szótárak sem létezhetnének.
P és NP
Végezetül nézzük meg, hogy az emberi nyelvek a nyelvi halmazban hol helyezkednek el.
Először definiáljuk a következő fogalamakat:
CO-NP={L nyelv : L NP}=Azon L nyelvek osztálya, melyek komplementere NP – ben van
DTIME(f(n)): Azon L nyelvek osztálya, ahol f: NN és T Turing – gép, amely a w inputra
0-t ír ki, ha w Σ 0*- L és 1-t ír ki, ha w L és legfeljebb f(|w|) lépést tesz meg a leállásig
SPACE(f(n)) vagy DSPACE(f(n)): Azon L nyelvek osztálya, ahol f: NN és T Turing –
gép, amely a w inputra 0-t ír ki, ha w Σ 0*- L és 1-t ír ki, ha w L és legfeljelbb f(|w|) db
mezőt használ fel a leállásig az összes szalagon együttesen.
NTIME(f(n)): Azon L nyelvek osztálya, amelyekhez T Nem determinisztikus Turing – gép,
amely a w L-et f(|w|) megengedett lépésben elfogadja és w nincs L-ben, akkor nem fogadja
el sehány lépésben.
Hol van a magyar nyelv?
Az biztos, hogy a rekurzív nyelvek halmazában. Az is biztos, hogy:
MAGYAR PSPACE
11
Hiszen MAGYAR DSPACE ugyanis, minden magyar szó felismerhető polinomiáls tárban.
Az is világos, hogy:
MAGYAR NP
Hiszen minden magyar szó felismerhető egy NDTG-vel. A MAGYAR nyelv rekurzív, tehát
MAGYAR (MAGYAR komplementere) szintén rekurzív. Mivel MAGYAR benne van NP-
ben, ezért MAGYAR CO-NP:
MAGYAR NP∩Co-NP
Végezetül:
MAGYAR P
Ugyanis minden magyar szó felismerhető polinomiális időben és polinomiáls tárban.
Megjegyzés képen: A MAGYAR nyelv szavai lineáris tárban és időben is felismerhetők. Sőt,
mivel a MAGYAR abc, definiál egy rendezési szabályt, ezért a szavak között kisebb –
nagyobb relációt lehet, alkalmazni, vagyis sorrendbe állítani. Ekkor a MAGYAR nyelv szavai
logaritmikus időben felismerhetők.
A fenti levezetések nem csak a magyar nyelvre, hanem az összes beszélt nyelvre vonatkozik.
Miért érdekes ez? Azért, mert a nyelvek többsége nem rekurzív – ezt bizonyítottuk, még
kevesebb van PSPACE-ben, és persze, ami PSPACE-ben benne van, nem biztos, hogy P-ben
is benne van. A lényeg az, hogy amikor az emberek nyelvet alkotnak, „véletlenül” pont úgy
alkotják, hogy a nyelv szavai lineáris tárban és lineáris időben felismerhetőek legyenek úgy,
hogy közben nem tudják, hogy egyébként ilyet alkotnak.