78
Newton törvényeitől a Higgs-bozonig Captatio benevolentiae Ezt a kifejezést az azóta elhunyt Szőkefalvi-Nagy Béla professzor úrtól hallottam réges-régen egy funkcionálanalízis előadáson. A jóindulat megragadása. Az én jóindulatomat sikerült is megragadnia: lelkesen bejártam az előadásaira, pedig nekünk, fizkushallgatóknak ez a tárgy nem is szerepelt a tanrendünkben. Sokminden nem szerepelt (hogy csak egyet említsek: differenciálegyenletek), ami ahhoz kellett volna, hogy a modern elméleti fizikát valóban megérthessük. Sőt, magából a modern elméleti fizikából is meglehetősen hézagos ismeretekkel próbáltak felvértezni minket: ha nem jártam volna át a geometria tanszékre Szabó Zoltán spec. koll. előadásaira, akkor az általános relativitáselméletről fizikus diplomám birtokában sem tudtam volna többet, mint bármelyik velem együtt érettségiző kortársam. A vége aztán az lett, hogy hiába próbáltam képességeim szerint betömködni a tudásbeli hézagokat, bár diplomát kaptam, fizikus mégsem lett belőlem. A szó semmilyen értelmében sem, kivéve az érdektelen jogi értelmezést. Nem értek semmit, nem tudok semmit, és nem is ez a munkám. Persze nem állítom, hogy ez kizárólag az egykori egyetemem hibája. A kisördög azért azóta is bujkál bennem, piszkálja a csőrömet, hogy még csak meg sem értem, miről beszélnek az igazi fizikusok. Például, mi a szösz az a Higgs-bozon. Persze el lehet olvasni a Wikipedián, hogy az a Standard Modellben egy olyan feltételezett részecske, amely az ú.n. Higgs-mezőhöz tartozik. A Higgs-mező jelentősége pedig az, hogy a mértékbozonok (gauge boson) és a fermionok ezzel a mezővel való kölcsönhatásuk eredményeként tesznek szert tömegre. A mértékbozonok mibentétének és ennek a bizonyos Higgs-mechanizmusnak a megértéséhez szükség van az ú.n. mértéktérelmélet (gauge theory) ismeretére. A mértéktérelméletről ugyan hallottam már az egyetemen is, de csak annyit, hogy azzal kapcsolatos, hogy az elektromágneses mező potenciálja nincs egyértelműen meghatározva, hanem egy csomó függvény közül azt választhatjuk, amelyik nekünk éppen tetszik, merthogy ezek ugyanazt az elektromágneses mezőt eredményezik. Ez egy kicsit furán hangzik, ugyanis ez azt jelenti, hogy éppen azzal foglalkozik, ami nem számít. Merthogy ezeknek a potenciálfüggvényeknek az értelmük, vagyis a fizikai jelentésük ugyanaz. Szóval ez egy titok, egy rejtvény. És nem túl könnyű a megfejtés. Ha a mértéktérelméletet akarjuk megismerni, egyből egy csomó újabb ismeretlen dolog ugrik elő, és mindegyik mögött mégy egy csomó, és így tovább és körbekörbe. Arra azért már rájöttem, hogy az alapvető fogalmak itt a fibrált nyaláb (fibre bundle), principális nyaláb (principal bundle), szelés (section) és konnexió (connection). És arra is, hogy ezek viszonylag könnyen felfoghatók egyszerű példákon keresztül. Ilyen példa Newton második törvényének leírása tetszőleges (gyorsuló) vonatkoztatási rendszerben, vagy akár maga a puszta téridő. Meg persze az elengedhetetlen Möbius-szalag. Ha ezeken keresztül megbarátkozunk ezekkel a fogalmakkal – no meg egy kis jártasságot szerzünk a differenciálformák és külső algebrájuk (exterior algebra) birodalmában is – nem okozhat nagy nehézséget a Maxwell-egyenletek újraértelmezése sem, és érteni fogjuk, hogy mit jelent az, hogy potenciál = konnexió, térerő = görbület. A Maxwell-féle elektrodinamika egyúttal az első mértéktérelméleti példa, innen már a valódi sűrűje következik. Ha eljutunk odáig. Merthogy el szeretném nektek mesélni. Hátha úgy járok, mint az alábbi anekdotabeli tanár

Newton törvényeitől a Higgs-bozonig

Embed Size (px)

Citation preview

Page 1: Newton törvényeitől a Higgs-bozonig

Newton törvényeitől a Higgs-bozonig

Captatio benevolentiae

Ezt a kifejezést az azóta elhunyt Szőkefalvi-Nagy Béla professzor úrtól hallottam réges-régen egy funkcionálanalízis előadáson. A jóindulat megragadása. Az én jóindulatomat sikerült is megragadnia: lelkesen bejártam az előadásaira, pedig nekünk, fizkushallgatóknak ez a tárgy nem is szerepelt a tanrendünkben. Sokminden nem szerepelt (hogy csak egyet említsek: differenciálegyenletek), ami ahhoz kellett volna, hogy a modern elméleti fizikát valóban megérthessük. Sőt, magából a modern elméleti fizikából is meglehetősen hézagos ismeretekkel próbáltak felvértezni minket: ha nem jártam volna át a geometria tanszékre Szabó Zoltán spec. koll. előadásaira, akkor az általános relativitáselméletről fizikus diplomám birtokában sem tudtam volna többet, mint bármelyik velem együtt érettségiző kortársam. A vége aztán az lett, hogy hiába próbáltam képességeim szerint betömködni a tudásbeli hézagokat, bár diplomát kaptam, fizikus mégsem lett belőlem. A szó semmilyen értelmében sem, kivéve az érdektelen jogi értelmezést. Nem értek semmit, nem tudok semmit, és nem is ez a munkám. Persze nem állítom, hogy ez kizárólag az egykori egyetemem hibája.

A kisördög azért azóta is bujkál bennem, piszkálja a csőrömet, hogy még csak meg sem értem, miről beszélnek az igazi fizikusok. Például, mi a szösz az a Higgs-bozon. Persze el lehet olvasni a Wikipedián, hogy az a Standard Modellben egy olyan feltételezett részecske, amely az ú.n. Higgs-mezőhöz tartozik. A Higgs-mező jelentősége pedig az, hogy a mértékbozonok (gauge boson) és a fermionok ezzel a mezővel való kölcsönhatásuk eredményeként tesznek szert tömegre. A mértékbozonok mibentétének és ennek a bizonyos Higgs-mechanizmusnak a megértéséhez szükség van az ú.n. mértéktérelmélet (gauge theory) ismeretére. A mértéktérelméletről ugyan hallottam már az egyetemen is, de csak annyit, hogy azzal kapcsolatos, hogy az elektromágneses mező potenciálja nincs egyértelműen meghatározva, hanem egy csomó függvény közül azt választhatjuk, amelyik nekünk éppen tetszik, merthogy ezek ugyanazt az elektromágneses mezőt eredményezik. Ez egy kicsit furán hangzik, ugyanis ez azt jelenti, hogy éppen azzal foglalkozik, ami nem számít. Merthogy ezeknek a potenciálfüggvényeknek az értelmük, vagyis a fizikai jelentésük ugyanaz.

Szóval ez egy titok, egy rejtvény. És nem túl könnyű a megfejtés. Ha a mértéktérelméletet akarjuk megismerni, egyből egy csomó újabb ismeretlen dolog ugrik elő, és mindegyik mögött mégy egy csomó, és így tovább és körbekörbe.

Arra azért már rájöttem, hogy az alapvető fogalmak itt a fibrált nyaláb (fibre bundle), principális nyaláb (principal bundle), szelés (section) és konnexió (connection). És arra is, hogy ezek viszonylag könnyen felfoghatók egyszerű példákon keresztül. Ilyen példa Newton második törvényének leírása tetszőleges (gyorsuló) vonatkoztatási rendszerben, vagy akár maga a puszta téridő. Meg persze az elengedhetetlen Möbius-szalag. Ha ezeken keresztül megbarátkozunk ezekkel a fogalmakkal – no meg egy kis jártasságot szerzünk a differenciálformák és külső algebrájuk (exterior algebra) birodalmában is – nem okozhat nagy nehézséget a Maxwell-egyenletek újraértelmezése sem, és érteni fogjuk, hogy mit jelent az, hogy potenciál = konnexió, térerő = görbület. A Maxwell-féle elektrodinamika egyúttal az első mértéktérelméleti példa, innen már a valódi sűrűje következik. Ha eljutunk odáig. Merthogy el szeretném nektek mesélni. Hátha úgy járok, mint az alábbi anekdotabeli tanár

Page 2: Newton törvényeitől a Higgs-bozonig

…a diák nem érti, tanár azt mondja: “de hát nézze, ha veszi a … “, és elmagyarázza valahogy. Diák: “nem, nem értem”. Tanár: “Hát nézze, ha onnan nézi, akkor láthatja, hogy a …”, és elmagyarázza másképp. Diák: “még mindig nem értem”. Tanár: “hogy-hogy nem érti, pedig most már én is értem”.

1. A téridő mint fibrált nyaláb

Akárhogy is nézem, a legalapvetőbb fogalom ebben a témakörben a fibrált nyaláb fogalma. A szokásos bevezetése ennek a fogalomnak az, hogy a definíció megadása után a Möbius-szalag példája következik. Én azonban fizikusabb módon próbálom megközelíteni a dolgot. Előbb mondom a példámat, aztán elárulom a pontos definíciót, aztán jöhet majd a Möbuis-szalag.

A példám teljesen elemi: a newtoni (Galilei-féle) téridő. Csak annyit feltételezünk most erről a téridőről, hogy topologikus tér, vagyis van értelme benne folytonosságról beszélni.

Amiért a Newton/Galilei-féle téridőt választottam az az, hogy abban az idő abszolút, vagyis tetszőleges esemény időpontja egyértelműen (megfigyelőtől függetlenül) megmondható. Az időpontok halmazáról se feltételezzünk most többet, hogy az is egy (jelen esetben 1-dimenziós) topologikus tér. Ha most a téridőt E-vel jelöljük, az időpontok halmazát pedig T-vel, akkor megfigyelőtől függetlenül adva van egy

folytonos leképezés.

Másrészt, minden megfigyelő számára értelmes dolog a (fizikai) tér fogalma. Erről a térről is csak annyit teszünk fel, hogy (jelen esetben 3-dimenziós) topologikus tér. Jelöljük X-szel.

Az is igaz, hogy minden megfigyelő minden eseménynek meg tudja mondani a helyét és az időpontját. Vagyis minden megfigyelő a tér és az idő Descartes-szorzatára tudja leképezni a téridőt. Az i megfigyelő ezt a

folytonos (sőt, homeomorf) függvénnyel teszi.

Az idő abszolút volta miatt fennáll:

Page 3: Newton törvényeitől a Higgs-bozonig

Ezzel tulajdonképpen le is írtuk a téridőt, mint fibrált nyalábot. A lényeg: a megfigyelők számára a téridő az idő és a tér Descartes-szorzata, igazából pedig egy fibrált nyaláb, ami a fenti összefüggések teljesüléséből következik. Már csak ezt kéne elárulnom, hogy akkor mi is pontosan a fibrált nyaláb definíciója, és általánosabb értelme. Épp ez fog következni a következő bejegyzésben.

2. A fibrált nyaláb definíciója

Az esetleges félreértések elkerülése céljából hangsúlyozom, hogy előző bejegyzésben nem a téridőről akartam mondani valamit, hanem a fibrált nyaláb fogalmát kívántam egy ismert példa segítségével bevezetni. A fibrált nyaláb a newtoni téridőnek azt a tulajdonságát ragadja meg, hogy az események között értelmezett "ugyanakkor" reláció abszolút (megfigyelő-független), míg az "ugyanott" reláció nem az. Egy egyszerű ábrával ezt úgy lehetne szemléltetni, hogy a szokásos iskolai út-idő diagramon a függőleges vonalak egyértelműek, a vízszintesek meg nem. Olyan értelemben, hogy egy függőleges egyenes által reprezentált (vagyis "ugyanakkor" történő) események képe tetszőleges (akár gyorsuló) vonatkoztatási rendszer koordinátázásával elkészített diagramon is függőleges egyenes lesz, míg egy vízszintes egyenes (= nyugvó, vagyis mindig "ugyanott" lévő pont világvonala) más vonatkoztatási rendszerben elkészített diagramon nem lesz vízszintes. Sőt ha az a rendszer gyorsul az előzőhöz képest, akkor még csak egyenes sem lesz.

Bár a fibrált nyaláb fogalma jól visszaadja a newtoni téridőnek ezt az alapvető tulajdonságát, fordítva ez nem igaz: a téridő a fibrált nyaláboknak csak egy speciális esete, az úgynevezett triviális fibrált nyaláboké.

Az általános esetben nem követeljük meg azt, hogy a nyaláb ú.n. teljes tere (a példánkban E) teljes egészében egy Descartes-szorzat homeomorf képe legyen, csak annyit, hogy előálljon olyan nyílt halmazok egyesítéseként, amelyek homeomorfak a bázistér (a példánkban T) egy nyílt részhalmazának és a fibrum (a példánkban X) Descartes-szorzatával.

A fibrált nyaláb tehát a pontos definíció szerint egy (E, T, Π, X) négyes, ahol E, T és X topologikus terek, Π E-nek egy folytonos szürjekciója T-re, és T minden t pontjának van olyan Ut környezete, hogy Π−1(Ut) homeomorf Ut × X -fel.

T-ről feltesszük még, hogy előáll megszámlálhatóan sok fenti tulajdonságú Uj nyílt halmaz egyesítéseként. Ha minden egyes Uj -hez megadunk egy-egy olyan

φj : Π−1(Uj) → Uj × X , e → φj (e) = (proj1(φj(e)), proj2(φj(e)))

homeomorfizmust, amelyek mindegyikére

proj1(φj (e)) = Π (e)

akkor az {(Uj , φj)} halmazt a nyaláb lokális trivializációjának nevezzük.

A newtoni téridő esetén minden egyes megfigyelő a téridőnek egy egyetlen elemből álló trivializációját adja meg (U1 = T) . Különböző megfigyelők különböző trivializációt. Esetünkben ez a proj2φj függvények különbözőségét jelenti. A Möbius-szalag viszont egy olyan fibrált nyalábra példa, amelyre ilyen egyelemű trivializáció nem adható

Page 4: Newton törvényeitől a Higgs-bozonig

meg. Ezt a következő bejegyzésemben részletezem, és talán eljutunk a sündisznótétel kimondásához is.

3. A frizura és a Möbius-szalag

Mint láttuk, a triviális fibrált nyalábok olyan valamik, amik Descartes-szorzatként értelmezhetők, ám maguk nem Descartes-szorzatok, vagyis ez az értelmezés nem egyértelmű, csak “féloldalasan” (a téridőt minden megfigyelő máshogy bontja fel az idő és a tér Descartes-szorzatára). Egy T × X Descartes szorzaton kétféle irányú “természetes projekció” van adva: A T-re való (t,x) → t, és az X-re való (t,x) → x projekció, míg a téridőn csak a (t,x) → t projekció van adva.

A fibrált nyaláb más hasonlattal élve olyan, mint egy csinos hölgy frizurája. A teljes tér(E) maga a frizura, a bázistér (T) a fejbőr, a fibrum (X) pedig “a” hajszál. A Π projekció a frizura minden pontjához a fejbőrnek azt a pontját rendeli, ahonnan kinő az a hajszál, amelyik a frizura kiszemelt pontjában van. A fejbőr egy p pontjából kinövő konkrét hajszál a Π−1(p) halmaz. Ezt a p pont feletti fibrumnak is szokás nevezni.

Visszatérve a téridőnkre, az 2-dimenziós esetben olyasmi, mint egy vonalas füzet, amelyben egy irányban vannak vonalak, szemben egy kockás (négyzetrácsos) füzettel, amelyben két irányban. A hétköznapi szemléletünk szerint ugyan a vonalas füzetbe is egyértelműen berajzolhatnánk a függőleges vonalakat, de a példa csalóka, mert a füzetlapon önkéntelenül is az euklideszi geometriát alkalmazzuk, pontosabban az abban meglévő merőlegesség fogalmát, míg a newtoni téridő esetén ilyen merőlegesség-fogalom nincs. Pontosabban van, de megfigyelőfüggő, vagyis az nem a téridő, hanem a (téridő, megfigyelő) párok tulajdonsága.

A nemtriviális fibrált nyalábok esetén még érthetőbb a dolog, hogy miért akarunk megszabadulni az egyik irányú vonalkázástól: mert azok esetében ez nem is lehetséges.

Vágjuk ki papírból a [0,2π] ×[-1,1] téglalapot! Ennek papírcsíknak a baloldali széle a {0}×[-1,1], a jobboldali pedig a {2π} ×[-1,1] halmaz. Csináljunk a csíkunkból Möbius-szalagot úgy, hogy a két szélét megfordítva összeragasztjuk, vagyis a (0,x) pontot összeragasztjuk (matematikául: azonosítjuk) a (2π,-x) ponttal. A Möbius-szalagunk középvonala a [0,2π] × {0} halmaz, amely egy zárt görbe, hiszen a (0,0) pontot azonosítottuk a (2π,0) ponttal. Tetszőleges más [0,2π] ×{x} görbe nem zárt, hiszen az (0,x) pontot nem az (2π,x), hanem a (2π,-x) ponttal azonosítottuk!

A Möbius-szalagunkra egyszerűen nem tudunk “szélességi köröket”, rajzolni a [0,2π] × {0} “egyenlítőn” kívül. Legalábbis, ha kritériumnak tekintjük azt, hogy ezek a görbék zártak és folytonosak legyenek, ne metsszék az egyenlítőt, és pontosan egyszer érjék körbe a szalagot, vagyis a szalagot bárhol az egyenlítőre merőlegesen keresztülvágva a görbénket pontosan egyszer vágjuk el (a merőlegesség ugyan nem tartozéka a Möbius-szalagnak, de most az egyszerűség kedvéért vegyük hozzá).

A nyalábok nyelvén elmondva: a Möbius-szalagunk teljes tere (E) maga a szalag, bázistere (T) egy kör (képzelhetjük ezt a kört például a szalag középvonalának), fibruma (X) pedig a [-1,1] intervallum. A Π projekció a szalag tetszőleges pontjához az egyenlítő egy pontját rendeli hozzá. A másik irányban nincs ilyen projekció, mert nem egyértelmű, hogy egy (t,x) ponthoz x-et, vagy -x-et rendeljük-e hozzá.

Page 5: Newton törvényeitől a Higgs-bozonig

A Möbius-szalagnak ez a tulajdonsága a matematikusok szemében azzal rokon, hogy a sündisznót nem lehet megfésülni. De erről már csak legközelebb.

4. A struktúracsoport

Elnézést kell kérnem, hogy nem a beígért sündisznóval folytatom, de időközben rá kellet jönnöm, hogy messze nem tartunk még ott, hogy a sündisznó fésüléséről beszélgessünk.

Először is arra kell felhívnom a figyelmet, hogy a differenciálgeometriában szereplő dolgok nem mindig azok, aminek esetleg hisszük őket. Amíg csak topologikus terekről van szó, addig igen, ám ha már differenciálható sokaságokról, akkor egy picit változik a helyzet. Topologikus tér például a gömbbel homeomorf valamilyen halmaz, mondjuk egy félig leeresztett labda. Egy labda önmagában hordozza azt a tulajdonságot, hogy ő topológiai értelemben vagy gömb, vagy nem (mert mondjuk lyukas). Ám ha már nem csak topologikus terekről, hanem differenciálható sokaságokról van szó, akkor a labda önmagában nem árulja el, hogy ő egyáltalán differenciálható sokaság-e, vagy sem, vagy ha igen, akkor milyen típusú. Merthogy a differenciálható sokaság definíciójában nem csak az szerepel, hogy a labda milyen (a gömbbel homeomorf), hanem az is, hogy az őt koordinátázó atlasz is elemei közti átmeneti függvények hányszor differenciálhatók. Az meg nem a labdától, hanem tőlünk függ, hogy milyen atlasszal fedjük le őt (szegény labda arról nem tehet, hogy ha mi ügyetlen atlaszt adunk meg, akkor ő esetleg egyáltalán nem is lesz differenciálható sokaság).

Hasonló a helyzet a nyalábok esetében is. Amíg azt a fibrált nyaláb-definíciót használjuk, amit mondtam, addig akár a téridő, akár a Möbius-szalag önmaga meghatározza, hogy ő milyen fibrált nyaláb. Ha viszont egy másik definíciót használunk – mondjuk azt amelyik [1]-ben szerepel, akkor a dologba már a mi önkényünk is beleszól. Ez a definíció ugyanis a mi négy, E, T, Π, és X objektumunk mellett tartalmaz egy ötödiket, G-t is. Ez a G az úgynevezett struktúracsoport, amiről most pár szót szeretnék ejteni.

Legyen adva egy (E, T, Π, X) fibrált nyaláb, és annak egy {(Uj , φj)} lokális trivializációja. Mivel az Uj nyílt halmazok lefedik T-t, egynémely (i, j) indexpár esetén az Ui és Uj halmazok átfedik egymást, vagyis az Ui∩ Uj halmaz nem üres. Ebben az esetben értelme van a

leképezésről beszélni.

Lévén, hogy a trivializáció definíciója szerint proj1φi (φj−1 (t,x)) = Π (φj

−1 (t,x)) = proj1φj (φj

−1 (t,x)) = proj1(t,x) = t, ezért ez a leképezés

alakú. Egy kiválasztott t esetén gij(t) : X → X : x → proj2φi (φj−1 (t,x)) az X fibrum önmagára

való hoeomorf leképezése, az ú.n. átmeneti függvény. A gij(t) átmeneti függvények X

Page 6: Newton törvényeitől a Higgs-bozonig

homeomorfizmus-csoportjának egy G részcsoportját generálják. Ezt a G csoportot nevezzük a nyaláb struktúracsoportjának. Persze igazából nem (az általunk értelmezett) nyalábé, hanem a (nyaláb, lokális trivializáció) páré. Vagyis a struktúracsoport ugyanúgy nem belső tulajdonsága a nyalábnak, mint egy topologikus térnek az őt differenciálható sokasággá tevő atlasz. Jobb is lenne, ha ezt a (nyaláb, lokális trivializáció) párt nem is nyalábnak hívnánk, hanem külön nevet adnánk neki, de sajnos nincs külön neve. Talán azért nincs, mert nem is igen használják. Mégpedig azért, mert ennek a valaminek az érdekesebb tulajdonságai maguknak a φi függvényeknek, sőt, E-nek és Π-nek a konkrét ismerete nélkül, pusztán a gij(t) átmeneti függvények birtokában is vizsgálhatók. Ugyanis adott T, X , {Ui} és { gij(t)}-ből egyszerűen konstruálható olyan (nyaláb, lokális trivializáció) pár (vagyis definiálhatunk ezekből olyan E-t, Π-t és {φi}-t ), hogy (T, X , {Ui})-t ezekkel kiegészítve az így általunk létrehozott (E, T, Π, X, {Ui, φi }) nevenincsnek épp az adott gij(t)-k lesznek az átmeneti függvényei (ld. [1] 144. old].

5. Newton I. törvénye

Hagyjuk azt a sündisznót, maradjunk inkább a téridőnél.

Mint láttuk, a newtoni (Galilei-féle) téridő egy 3-dimenziós fibrumú fibrált nyaláb az 1-dimenziós idő felett. A nyalábok elméletében a bázisteret vízszintesnek a felette lévő fibrumot pedig függőlegesnek szokás ábrázolni. Vagyis ugyanúgy, mint az iskolai füzetben az út-idő diagramot. A bázistér (idő) a vízszintes tengely, a fibrum (tér) pedig a függőleges. Szó volt róla, hogy a függőleges egyenesek ezen az ábrán egyértelműek, a vízszintesek azonban nem (más megfigyelő mást tart vízszintesnek). Ezt úgy is megfogalmazhatjuk, hogy a téridő (mint differenciálható sokaság) adott pontjában lévő érintővektorra van értelme azt mondani a függőleges irányú, annak viszont nincs, hogy vízszintes irányú. Ellenben, ha nem a téridőt vesszük nyalábnak (mint ahogy a relativitáselméletben nem is az), hanem az ő érintőnyalábját* vizsgáljuk, akkor pontosan az inerciális mozgások azok, amelyek érintője minden pontban vízszintesnek tekinthető ezen a nyalábon. Ez Newton I. törvénye.

Ha már elmondtam volna a konnexió fogalmát, akkor Newton I. törvényét így fogalmazhattuk volna meg: A téridő érintőnyalábján adva van egy konnexió.

6. Konnexiók

Bár Galilei kihúzta a lábunk alól a teret, mint a téridőn adott természetes projekciót, az időt még meghagyta nekünk (azt csak Einstein húzta ki a lábunk alól). Ezért tekinthető a Galilei-féle téridő fibrált nyalábnak.

Most ezen a téridőn adott konnexiókról fogok beszélni, és ehhez szükség lesz a téridő érintőnyalábjára. (Newton I. törvénye viszont az érintőnyalábon adott konnexióról szól, ehhez a téridő érintőnyalábjának az érintőnyalábjára lesz majd szükségünk. A sor természetesen a végtelenségig folytatható lenne, de szerencsére nekünk nem kell ennél tovább mennünk.)

Maradjunk egyelőre tehát magánál a Galilei-féle téridőnél, mint fibrált nyalábnál. A térről és az időről továbbra sem teszünk fel többet, mint azt, hogy differenciálható sokaság. (Ezt általában gyengébb feltevésnek szokás tekinteni, mint az affin struktúra meglétét. Habár valóban igaz, hogy minden affin téren definiálható egy "természetes topológia", valójában ez a természetesnek mondott topológia az adott esetben elég természetellenes lehet1

Page 7: Newton törvényeitől a Higgs-bozonig

Szóval tekintsük a szokásos (E, T, Π, X) fibrált nyalábunkat, ahol most E a téridő, T az idő, X a tér, és Π az a projekció, amely E minden eleméhez, vagyis minden e eseményhez T egy elemét, vagyis az esemény időpontját rendeli hozzá. Egy e∈ E pontbeli TeE érintőtérnek egyértelműen megadható a "függőleges" (vertikális) vektorokat tartalmazó VeE altere. Ez azokbl a v∈TeE vektorokból áll, amelyekre dΠ(v) = 0. Vagyis, amely vektorok a t = Π(e) időpillanathoz tartozó térben (= t feletti fibrumban) e-n keresztülhaladó görbék érintői. Fizikailag ezek a végtelen sebességű mozgások sebességei ( = térszerű görbék érintői). Ennek a VeE altérnek a komplementere az a HeE altér, amely a "vízszintes" (horizontális) érintővektorokat tartalmazza. Fizikailag ez a e-n áthaladó, "nyugalomban lévő" (x = const) tömegpont (különböző paraméterezésű) világvonalának az érintővektorait jelenti. Ez TeE-nek egy 1-dimenziós altere, és minthogy a nyugalomban levés megfigyelőfüggő, ez az altér is megfigyelőnként változik. Egész pontosan szólva, a különböző megfigyelők az egyértelmű VeE = ker(dΠe) függőleges altér mellett az ő adott

e → φj (e) = (projTφj(e), projXφj(e)) = (t(e), x(e)) = (Π (e) , x(e))

trivializációjuknak megfelelően a HeE = ker(dxe) alteret tekintik vízszintes altérnek.

Egy fibrált nyalábon megadott konnexió alatt a teljes tér (E) minden e pontjához a VeE (= ker(dΠe) ⊂TeE ) komplementer HeE alterének megválasztását értjük e differenciálható függvényeként (a HeE ⊂ TeE alteret akkor nevezzük VeE komplementer alterének, ha HeE

∩ VeE = {0} és VeE ⊕ HeE = TeE ). Az alterek e-től való függését akkor nevezük differenciálhatónak, ha tetszőleges differenciálható vektormező vízszintes ill. függőleges komponenséből álló vektormezők is differenciálhatók.

Egy megfigyelő megadását tekinthetjük tehát akár egy trivializáció megadásának, akár egy konnexió megadásának a newtoni téridőn, mint fibrált nyalábon.

7. A tehetetlenség törvénye

Tekintsük most a téridőnk érintőnyalábját. Vagyis most a szokásos (E, T, Π, X) nyalábunk helyett most a (TE, E, Π, V) fibrált nyalábot tekintsük. A bázisterünk most maga a téridő (E), a fibrum (V) egy 4-dimenziós vektortér, a négyes-sebességek lineáris tere. TE-t úgy kell képzelni, hogy E minden pontja “felett” van egy V vektorér: a ponton (eseményen) áthaladó E-beli görbék (világvonalak) érintőiből álló lineáris tér. Ezt az e pont feletti érintőtérnek nevezik és TeE-val jelölik. A Π projekció most TeE elemeihez az e pontot rendeli hozzá. (TE-t a fizikusok a tömegpont fázisterének nevezik, de néha nem ezt, hanem a koérintőnyalábot nevezik fázistérnek. Az ettől annyiban különbözik, hogy TeE helyett annak a duális terét veszik az e pont feletti fibrumnak.) Mivel E is és V is 4-dimenziós, TE 8-dimenziós.

Mint említettem, Newton I. törvénye szerint ezen a nyalábon adva van egy konnexió, vagyis TE tetszőleges p pontjához tartozó TpTE érintőtérnek adva van a “vízszintes irányú” érintővektorokat tartalmazó HpTE altere.

Definíció. Legyen adva egy p pont egy fibrált nyaláb teljes terében, valamint a nyalábon legyen adva egy konnexió. Vagyis a teljes tér érintőterében legyen értelme horizontális vektorokról beszélni. A fibrált nyaláb bázisterében haladó g(t) görbének a p pontba való felemelése alatt a nyaláb teljes terében haladó olyan h(t) görbét értünk, amelyre h(0) = p

Page 8: Newton törvényeitől a Higgs-bozonig

és Π(h(t)) = g(t).* A felemelést horizontálisnak nevezzük, ha a h(t) görbe érintője minden pontban horizontális. A horizontális felemelés egyértelmű.

Esetünkben a bázistér E, a teljes tér TE, vagyis most az E-beli görbéknek a p ∈ TE pontba való felemeléséről van szó. Ez a felemelés a definíciónk szerint horizontális, ha h‘(t) ∈HpTE.

Ha tehát adva van egy g görbénk E-n, és egy v vektorunk a g(0) pont feletti fibrumban (nem feltétlenül a g görbe érintőjéről, hanem tetszőleges v ∈ Tg(0)E vektorról van szó), akkor van értelme a g görbének a v pontba való horizontális h felemeltjéről beszélni. A v vektornak a g görbe mentén a g(t) pontba való párhuzamos eltoltján a h(t) ∈ Tg(t)E vektort értjük.

Definíció. Egy g görbét geodetikusnak nevezünk, ha tetszőleges g‘(t) érintővektora azonos a g‘(0) érintővektor g(t) pontba való párhuzamos eltoltjával.

Mint látjuk, a Newton I. törvényében szereplő konnexió egyúttal a téridő geodetikusait is meghatározza. Vegyük észre, hogy itt sehol sem használtuk ki a téridő fibrált nyaláb voltát, vagyis amiről itt beszéltünk, az mind nemcsak a Newton/Galilei-féle téridőre, hanem tetszőleges differenciálható sokaságnak tekintett téridőre egyformán érvényes. Vagyis a speciális és az általános relativitáselmélet téridejére is!

A tehetetlenség törvénye ezek után így hangzik: A magára hagyott tömegpont világvonala geodetikus. A “magára hagyott” kitétel az általános relativitáselméletben úgy értendő, hogy a gravitáción kívül más külső hatás nem éri a tömegpontunkat.

* A terminológia a szakirodalomban nem egységes. Az általam használt terminológia a Wikipedia Ehresman connection szócikkében szereplővel azonos, de egyes szerzők csak azt nevezik felemelésnek, amit én horizontális felemelésnek (pl. Spivak : A Comprehensive Introduction to Differential Geometry Vol. 2 (third edition), 318. old.). Megint más szerzők a c(t) görbe felemelése alatt a görbét értik (pl. Ana Canas da Silva Lectures on Symplectic Geometry, 115. old.) Megint más szerzők kerülik a felemelés (lift) szó jelző nélküli használatát, és csak a horizontális felemélést definiálják (pl. Nakahara Geometry, Topology and Physics 336. old)

8. A konnexiók fajtái

A 6. fejezetben általam definiált konnexió (= a fibrált nyaláb teljes terének minden egyes e pontja feletti érintőtér horizontális He alterének megadása) a konnexiók lehető legáltalánosabb definíciója. Olyannyira általános, hogy így ezt nem is használja senki. A legáltalánosabb ténylegesen használt fogalom az Ehresmann-konnexió. Ennek a definíciója annyiban szigorúbb az általam mondottnál, hogy kikötés, hogy a az e → He hozzárendelés sima legyen (ez alatt az ott mondottaknak megfelelően azt értjük, hogy tetszőleges sima vektormező vízszintes ill. függőleges komponenséből álló vektormezők is simák).

A 7. fejezetben egy speciális fibrált nyalábon, a téridő érintőnyalábján adott konnexióról beszéltem. Az érintőnyaláb egyúttal vektornyaláb is. Vektornyalábnak olyan fibrált nyalábot nevezünk, amelynek a fibruma vektortér. Érintőnyaláb olyan vektornyaláb, amelynek a p pont feletti fibruma a p pont feletti érintőtér (pontosabban ld. itt).

Page 9: Newton törvényeitől a Higgs-bozonig

Vektornyalábok esetén értelmezhető az ú.n. lineáris konnexió fogalma. Ezt másként Koszul-konnexiónak is nevezik. Ha a vektornyaláb speciálisan egy érintőnyaláb, akkor az ezen megadott lineáris konnexiót affin konnexiónak nevezik. Az általunk a 7. fejezetben felvillantott konnexiót e szavak bármelyikével lehet illetni. Az affin konnexióval ekvivalens foglom a kovariáns deriválás.

Az affin konnexió másrészről egy speciális Cartan-konnexiónak tekinthető, az pedig egy speciális principális konnexiónak. Principális konnexiónak a principális nyalábokon megadott konnexiókat nevezzük. A principális nyaláb olyan fibrált nyaláb, amely fibruma principális homogén tér (torzor). A mértéktérelméletben ilyen nyalábok szerepelnek, ezért ezekkel érdemes lesz közelebbi ismeretséget kötnünk.

A konnexiók családfája tehát egyrészt

Ehresmann → Koszul → Affin

másrészt

Ehresmann → Principális → Cartan → Affin

Az affin konnexiók tovább specializálódnak. Metrikus téren definiálhatók az ú.n. metrikus konnexiók, ezek speciális esete a Riemann-konnexió. A torziómentes Riemann-konnexiót Levi-Civita konnexiónak nevezik.

A sor tehát tovább így folytatódik:

Affin → metrikus → Riemann → Levi-Civita

vagy esetleg így:

Affin → metrikus → Riemann → Weitzenböck

A Weitzenböck-konnexió a Levi-Civita konnexió komplementere olyan értelemben, hogy míg a Levi-Civita konnexió torziómentes, de általában nem görbületmentes, addig a Weitzenböck-konnexió görbületmentes, de általában nem torziómentes. Az általános relativitáselmélet téridőmoelljében a Levi-Civita-konnexió szerepel, ennek a konnexiónak a görbülete írja le a gravitációt. Einstein próbálkozott a komplementer megoldással is, vagyis egy görbületmentes konnexió torziójával írni le a gravitációt, de ez az irány elhalt. Pedig Einstein eredetileg azt remélte tőle, hogy ezzel a megoldással esetleg egyesíteni lehet a gravitáció elméletét az elektromágnesességével. Ez a próbálkozás volt az ú.n. teleparallel gravitáció elmélete.

Vannak még egyéb konnexiók is (pl. projektív, Grothendieck, Gauss-Manin), de ezekkel nem fogunk foglalkozni.

9. Lineáris konnexiók

Mint láttuk, a vektornyalábokon (illetve speciálisan az érintőnyalábokon) megadott konnexiók többek között arra jók, hogy a segítségükkel a vektorok párhuzamos eltolását lehessen értelmezni egyik fibrumból a másikba. Teljes általánosságban ez a párhuzamos eltolás elég

Page 10: Newton törvényeitől a Higgs-bozonig

furcsa is lehet. Semmi sem tiltja, hogy ha egy TpM-beli v vektornak egy adott M-beli g görbén való q pontba (vagyis TqM-be) való párhuzamos eltoltja w, akkor egy g-től különböző g’ görbe mentén és ugyancsak p-ből q-ba párhuzamosan eltolva w-től különböző w’ legyen az eredmény. Sőt, előfordulhat az is, hogy ha v-nek g mentén p-ből q-ba való párhuzamos eltoltja w, akkor λv-nek ugyancsak g mentén p-ből q-ba való párhuzamos eltoltja nem λw lesz, és az is, hogy két vektor összegének az eltoltja nem lesz azonos a vektorok eltoltjainak az összegével.

Az első típusú furcsaság - vagyis hogy a párhuzamos eltolás eredménye függhet a görbétől, amely mentén a vektort toljuk – a konnexiók görbületét jelenti. Ha egy konnexió esetén ez a furcsaság nincs jelen – tehát ha a párhuzamos eltolás eredménye mindig független az útvonaltól – akkor azt a konnexiót görbületmentesnek mondjuk.

Ha a második furcsaság nincs jelen – vagyis, ha a párhuzamos eltolás megtartja a vektorok lineáris kombinációit – akkor pedig lineárisnak.

A görbületmentesség – mivel a párhuzamos eltolás a horizontális felemeléssel ekvivalens – tetszőleges Ehresmann-konnexió esetén értelmezhető, a linearitás viszont csak vektornyalábok konnexióin, hiszen szerepelnek benne a vektorok lineáris kombinációi.

A vektornyaláb olyan fibrált nyaláb, amelynek a tipikus fibruma és minden pont feletti fibruma külön-külön is egy-egy n-dimenziós vektortér. Ha tehát a nyaláb (B, E, Π, V), akkor tetszőleges x ∈B esetén a Π-1 (x) halmazon vektortér-struktúra van megadva, azaz tetszőleges e, f ∈ Π-1 (x) elemre és tetszőleges λ skalárra értelmezve van az e + f összeadás és a λe skalárral való szorzás, amely műveletek eleget tesznek a vektortérműveletek azonosságainak és nem vezetnek ki Π-1 (x)-ből. A vektornyalábok lokális trivializációira előírjuk, hogy tartsák meg ezt a vektortér-struktúrát. Ez azt jelenti, hogy a nyaláb struktúracsoportja GL(n) egy részcsoportja. Szokás a vektornyalábot egyszerűen úgy definiálni, hogy olyan fibrált nyaláb, amely fibruma n-dimenziós vektortér, a struktúracsoportja pedig GL(n).

Egy vektornyalábon megadott konnexió linearitása a párhuzamos eltolások nyelvéről a horizontális felemelések nyelvére visszafordítva azt jelenti, hogy ha h1 és h2 a g görbe egy-egy horizontális felemeltje, akkor tetszőleges λ1 és λ2 skalárokat véve λ1h1+ λ2h2 is az.

Ugyanezt a horizontális alterekkel és érintőleképezésekkel megfogalmazva:

Legyen

Sλ: E → E : e → λe,

E ×B E := {(p, q) ∈ E × E : π(p) = π(q)},

H := {v ∈ TE : v ∈ H π(v)}

H ×B H := {(v, w) ∈ H × H : π(v) = π(w)},

és

Page 11: Newton törvényeitől a Higgs-bozonig

σ: E ×B E → E : (p, q) → p + q.

A konnexió definíció szerint lineáris, ha

• Tetszőleges e ∈ E elemre és tetszőleges λ skalárra Hλe= d(Sλ)e(He)• dσ(H ×B H )= H

Az első feltétel azt jelenti, hogy a skalárral való szorzás a horizontális görbéket horizontálisba viszi, a második pedig azt, hogy két horizontális görbe pontonként vett összege szintén horizontális.

10. Szelések

A szelés a folytonos függvény fogalmának általánosítása Descartes-szorzatokról fibrált nyalábokra.

A függvény – mint tudjuk – két halmaz Descartes-szorzatának egy részhalmaza. Például a f(x) = 2x függvény a Gf = {(x,2x)|x ∈ R} halmaz. Általában pedig egy f: H → K függvény az E = H × K halmaznak olyan Gf részhalmaza, hogy H tetszőleges x eleméhez pontosan egy olyan e eleme van Gf -nek, hogy proj1(e) = x.

Ha a szelés fogalma nem tartalmazná a folytonosságot, akkor a függvény fogalmának ez a nemlétező általánosítása Descartes-szorzatról fibrált nyalábra ennyi lenne: Egy H bázisterű, E teljes terű és Π projekciójú fibrált nyaláb (globális) szelése E-nek egy olyan Gs részhalmaza, hogy H tetszőleges x eleméhez pontosan egy olyan e eleme van Gs -nek, hogy Π(e) = x. Nevezzük ezt a hiányosan definiált definiált szelést mondjuk pszeudo-szelésnek (akár kiscicának is nevezhetnénk, mert csak a szelés valódi definíciójának kimondásához van rá szükségünk)

Nézzük akkor a folytonosságot!

Függvények esetén folytonosságról akkor van értelme beszélni, ha H és K topologikus terek, vagyis értelmezve van bennük a nyílt halmaz fogalma. Egy f: H → K függvény definíció szerint folytonos, ha K tetszőleges N nyílt halmazának ősképe, vagyis a proj1(Gf ∩ H × N) halmaz nyílt halmaz H-ban.

Ezt már tovább tudjuk vinni a szelésre is: a globális szelés olyan pszeudo-szelés, amelyben E tetszőleges M nyílt halmazának ősképe, vagyis a Π(Gs ∩ M) halmaz nyílt halmaz H-ban.

A lokális szelés ugyanez H helyett annak tetszőleges U nyílt részhalmazával elmondva.

Megjegyzések

1. A matematikai élő nyelvben általában sem a függvénynek, sem a szelésnek nem ezt a halmazos megfogalmazását használják. Nem Gf-ről és Gs-ről, hanem inkább f(x)-ről és s(x)-ről beszélnek. A két beszédmód közti kapcsolat: f(x) az {y| (x’,y) ∈ Gf , proj 1

( x’,y ) = x } egyelemű halmaznak, s(x) pedig az {e| e ∈ Gs , Π(e) = x} egyelemű halmaznak az egyetlen elemét jelenti. Gf-et és Gs-t a függvény grafikonjának, illetve a szelés értékkészletének szokás nevezni. A későbbiekben adott s szelés esetén s(x) -et

Page 12: Newton törvényeitől a Higgs-bozonig

mi is az itt mondott értelemben fogjuk használni. Ekkor tehát az általános szokásnak megfelelően s-t egy olyan folytonos H → E függvénynek tekintjük, amelyre Π(s(x)) = x.

2. A vektornyalábok szeléseit vektormezőknek nevezik. A fentiek alapján látható, hogy ez nem azonos a vektor értékű függvény fogalmával, bár ugyanúgy hasonlít rá, mint ahogy egy fibrált nyaláb hasonlít egy Descatres-szorzathoz.

3. Az 1. (A téridő mint fibrált nyaláb) bejegyzésben definiált newtoni téridőnek, mint fibrált nyalábnak a szelései a pontszerű részecskékék világvonalai.

11. Egy elrettentő példa

Megszoktuk, hogy tetszőleges adott H és K topologikus terek esetén definiálható H-ból K-ba ható folytonos függvény. Például K-nak tetszőleges k elemét kiszemelve a f: H → K : x → k függvény ilyen. A halmazos megfogalmazásunkkal ez a függvény a Gf = {(x, k) | x ∈H } halmaz.

Az azonban már nem igaz, hogy tetszőleges H bázisterű, K fibrumú és E teljes terű fibrált nyalábnak lenne globális szelése.

Erre mutatok most egy példát.

Legyen H = {z | z ∈ C , |z|=1 }, vagyis egy egységsugarú kör a komplex számsíkon a szokásos topológiával, K = {-1,1} és E = H .

Legyen a Π projekció az E → H : z → z2 leképezés. Ennek a nyalábnak nincs globális szelése! Indirekt módon tegyük fel ugyanis, hogy van. Ekkor

1. Létezik olyan Gs ⊆ E halmaz, hogy minden z ∈ H elemhez pontosan egy olyan e ∈Gs elem van, hogy Π(e) = z,

2. Tetszőleges M ⊆ E nyílt halmazra Π(Gs ∩ M) halmaz nyílt halmaz H-ban.

Tekintsük H-nak a H0 = { eiφ | 0 < φ < 2π} nyílt részhalmazát, vagyis az ei0 = 1 komplex szám kivételével az egész kört.

Legyen M1 = { eiφ | 0 < φ < π} és M2 = { eiφ | π < φ < 2π} E két nyílt részhalmaza.

Az indirekt feltevésünk 2. pontja szerint Π(Gs ∩ M1 ) is és Π(Gs ∩ M2 ) is nyílt halmaz H-ban. Mivel a Π leképezésünk is folytonos, ez azt jelenti, hogy Gs ∩ M1 és Gs ∩ M2 halmazok, mint egy nyílt halmaz folytonos leképezés általi ősképei, maguk is nyílt halmazok.

Másrészt a feltevésünk 1. pontja szerint Π(Gs ∩ M1 ) ∩ Π(Gs ∩ M2 ) = Ø és Π(Gs ∩ M1 ) ∪ Π(Gs ∩ M2 ) = H0 , vagyis Π(Gs ∩ M1 ) és Π(Gs ∩ M2) egymásnak H0-ra vonatkozó komplementerei, vagyis mindkettő zárt is. Lévén, hogy H0 összefüggő, H0 részhalmazai közül csak az üres halmazra és a teljes H0-ra áll fenn, hogy nyílt is és zárt is. Ezért, és mert Π(Gs ∩ M1 ) és Π(Gs ∩ M1 ) egymásnak H0-ra vonatkozó komplementerei, az egyikük üres, a másikuk H0. A határozottság kedvéért tegyük fel, hogy Π(Gs ∩ M2) üres (a másik eset ugyanígy tárgyalható). Ekkor Π(Gs ∩ M1 ) = H0 és Gs ∩ M2= Ø.

Page 13: Newton törvényeitől a Higgs-bozonig

A kérdés már csak a H \ H = {1} halmaz egyetlen eleméhez Gs-nek melyik eleme tartozik, vagyis, Gs-nek melyik az az e0 eleme, amelyre Π(e0) = 1.

Erre két lehetőség van: vagy e0 = 1 (= ei0), vagy e0 = -1 (= eiπ).

Ha e0 = 1, akkor az M = { eiφ | -1 < φ < 1} nyílt halmazzal Π(Gs ∩ M) = Π((Gs ∩ M ∩ M1)∪{ei0}) = Π({ eiφ | 0 ≤ φ < 1}) = { e2iφ | 0 ≤ φ < 1}, ha e0 = -1 akkor pedig az M = { eiφ | π-1 < φ < π+1} nyílt halmazt véve Π(Gs ∩ M) = Π((Gs ∩ M ∩ M1)∪{eiπ}) = Π({ eiφ | π-1 < φ ≤ π }) = { e2iφ | π-1 < φ ≤ π }. Mivel ezek a halmazok nem nyíltak, az indirekt feltevésünkkel ellentmondásra jutottunk. Tehát ennek a nyalábnak nincs globális szelése!

12. Affin terek

Az érintőnyalábokon megadott konnexiók értelme, hogy pótolják azt a hiányosságot, amellyel az affin terek eleve rendelkeznek: a vektorok eltolhatóságát, illetve a különböző pontokhoz tartozó érintővektorok összehasonlítását. Ha például most a téridőre, mint egy 4-dimenziós sokaságra gondolunk, akkor a pontszerű részecskék világvonalai téridőbeli görbék. A részecskék sebessége minden pontban a sokaság egy érintővektora. A gyorsulásukat viszont csak akkor tudjuk megmondani, ha valahogy össze tudjuk hasonlítani a különböző pontbeli sebességeiket. Kicsit formálisabban elmondva ugyanezt: Ha a részecskénk világvonala mondjuk a g:[0,1] → M görbe (ahol M a 4-dimenziós téridő, mint differenciálható sokaság), akkor ennek a részecskének a t0 pontbeli sebessége a görbének a g(t0)- beli érintővektora a

(1)

deriváció.

A részecske gyorsulása

(2)

lenne, ha lenne értelme a különbségnek. De nincs, mivel a Tg(t)M vektortérnek, pedig a Tg(t0)M -nek az eleme, és különböző vektorterek elemei közt nincs értelmezve a kivonás művelete.

Ha azonban TM-en adva van egy konnexió, az azt jelenti, hogy értelmezve van tetszőleges v ∈ Tg(t0) vektornak a g görbe mentén a Tg(t)M -be történő párhuzamos eltolása. Ha a

Page 14: Newton törvényeitől a Higgs-bozonig

konnexiónk lineáris, akkor ez egy Γg,t0,t : Tg(t0)M → Tg(t)M lineáris leképezés. Ha még nem elfajuló is ez a leképezés, akkor létezik a Γg,t0,t

-1 : Tg(t0) → Tg(t)M inverze is.

Ezzel már tudjuk definiálni a gyorsulást:

(3)

.

Tehát a differenciahányados számlálóját úgy számoljuk, hogy a g(t) beli sebességet a g görbe mentén párhuzamosan visszatoljuk Tg(t0) be, ahol már ki tudjuk vonni belőle a g(t0) -beli sebességet. Látható, hogy a konnexió linearitására azért van szükség, hogy az így definiált gyorsulás a sebességnek ugyanúgy lineáris függvénye legyen, mint ahogy azt megszoktuk.

Mondanom sem kell, hogy ez abszolút gyorsulás, hiszen semmiféle koordinátákat nem használtunk a definiálásához. A konnexiót pedig Newton I. törvénye biztosítja számunkra – szintén megfigyelőfüggetlen módon. Az majd a következő kérdés lesz, hogy ilyen-olyan koordinátákkal hogy lehet ezt kiszámolni.

De egyelőre nézzük meg ezt a dolgot az affin terek esetében.

Egy nem üres M halmazt, a V vektortér feletti affin térnek nevezünk ha M elemei között értelmezve van a kivonás művelete, vagyis adva van egy M x M → V, (x,y) → x – y leképezés amelyre

1. tetszőleges o ∈ M esetén az Oo: M → V , x → x – o leképezés bijektív2. (x-y) + (y-z) + (z-x) = 0.

Az n-dimenziós affin tereket sima sokaságoknak is tekinthetjük, ha atlasznak az affin koordinátákat tekintjük, vagyis V tetszőleges {ei} bázisához és M tetszőleges o pontjához azt a Φ: M → Rn, p → {x1,…xn} térképet választjuk, amelyre

(4)

.

A topológiát az a feltétel egyértelműen definiálja M-en, hogy ezek a térképek homeomorfizmusok legyenek (ez az affin terek ú.n. természetes topológiája).

Page 15: Newton törvényeitől a Higgs-bozonig

A fenti módon sima sokaságnak tekintett affin terekben egy g görbe érintővektorát egyrészt ugyanúgy definiálhatjuk, mint bármilyen sima sokaság esetén (vagyis az (1) képlettel), másrészt definiálhatjuk a

képlettel is, hiszen affin terek esetén a kivonásnak van értelme a számlálóban, és a valós számmal való osztásnak is.

Az így definiált g’(t) a V vektortér eleme, nem pedig egy deriváció, mint .Az, hogy g‘(t) t-től függetlenül ugyanannak a V vektortérnek az eleme, számunkra örvendetes, mert ha az így definiált érintővektort tekintjük sebességnek, akkor a használhatatlan (2) képletben helyett g‘-t írva az máris használhatóvá válik:

(5)

A kétféle érintővektor közti kapcsolat:

.

A kétféle érintővektor azonosíthatósága azt jelenti, hogy az affin tér struktúrája meghatározza az érintőnyalábjának egy természetes konnexióját.

13. Newtoni sebességek

Vegyük a newtoni téridőt, vagyis az (E, T, Π, X) fibrált nyalábot. Itt az E 4-dimenziós sima sokaság az események halmaza, vagyis a téridő, T (1-denziós sima sokaság) az időpontok halmaza, és Π az a függvény, amely minden eseményhez hozzárendeli a bekövetkeztének az időpontját. Az egyidejűleg bekövetkező események (vagyis adott t ∈ T esetén a Π-1(t) halmaz) E-nek egy X-szel homeomorf részhalmazát alkotják (ld. az 1. bejegyzést). Egy pontszerű részecske világvonala a részecskével történő események halmaza, vagyis E bizonyos részhalmaza. Korábbi bejegyzéseimben némileg pongyolán azt mondtam, hogy a világvonalak a téridőbeli görbék, pedig azok csak bizonyos görbék értékkészletei. A görbe paraméterezése (vagyis az adott világvonallal, mint értékkészlettel rendelkező R → E függvény) fizikailag indifferens, vagyis tetszőlegesen megadható, éppúgy, mint E, T, és X koordinátázása. Görbék emlegetése helyett tulajdonképpen azt kellett volna mondanom, hogy a világvonalak E-nek bizonyos 1-dimenziós részsokaságai (ez egyúttal egy megszorítás is, mivel a nem injektív függvények kiesnek a szóba jöhető görbék közül). A bizonyos kitétel pedig annak a fizikai posztulátumnak a teljesülését jelenti,

Page 16: Newton törvényeitől a Higgs-bozonig

hogy egyrészt egy részecskével egyidejűleg csak egy esemény történhet, másrészt, a a részecskénk “az időben folytonosan mozog”. Ez a két feltétel a modellünkben pontosan azt jelenti, hogy a világvonalak a nyalábunk szelései. Itt a szelés szót az általam mondott eredeti értelemben, vagyis E bizonyos részhalmazaként értem (ld. a 10. bejegyzést). A 10. bejegyzés 1. megjegyzése szerint a szelések azonosíthatók az Π(s(x)) = x tulajdonságú s: T → E : függvényekkel. Igaz, így is függvénynek tekintjük a világvonalunkat, de mégis jobb, mintha görbének tekintenénk, mert így maga a függvény is rögzítve van, nemcsak az értékkészlete.

De miért beszélek erről?Azért, mert kicsit bajban vagyunk a newtoni (abszolút) sebesség definiálásával. Sebességként ugyanis a görbék érintővektorát (mint derivációt) tudnánk értelmezni, ám így (vagyis a 12. bejegyzés (1) összefüggésével) értelmezve a sebesség magától a görbétől, tehát nemcsak az értékkészletétől, más szóval nem csak a világvonaltól, mint halmaztól, hanem annak – tetszőlegesen megadható – paraméterezésétől is függ, tehát fizikailag nem jóldefiniált. A szelésként felfogott világvonal paraméterezése ugyan fix, de annak meg az értelmezési tartománya nem a valós számok egy intervalluma, vagyis az s(τ) szeléssel nem tudjuk az f(s(τ)) függvény τ szerinti deriváltját értelmezni, ami az érintővektor definíciója lehetne. Ha viszont megadjuk a T halmazunknak egy tetszőleges φ: T → R koordinátázását, akkor f º φ-1 (f ∈ C∞(E)) már egy E-beli görbe, tehát rá ismét alkalmazható a 12/(1) definíció. Ám ebben megint benne van az önkényes φ függvény. Megoldhatnánk úgy is a dolgot, hogy nem az érintővektorokat nevezzük sebességeknek, hanem az

(1)

operátorokat. Ezek az operátorok értelemszerűen éppúgy vektorteret alkotnak, mint a derivációk.

Azért lehet ennél egyszerűbben is. Vegyük észre, hogy ha φ és ψ T két különböző koordinátása és

,

akkor

Page 17: Newton törvényeitől a Higgs-bozonig

.

Bizonyítás.Mivel , ezért , ahol

avalós függvény deriváltját jelenti. Az állításunk tehát pontosan akkor igaz, ha

. Ez viszont könnyen belátható, ugyanis a feltétel definíció szerint azt jelenti, hogy tetszőleges differenciálható függvényre

A newtoni sebességek ezek szerint az (1) definíció helyett értelmezhetők

TT × C∞(E) → R, vagy másképp felfogva bizonyos tulajdonságú v: TT → TE : t → v(t) leképezésekként is. A bizonyos tulajdonságok:

1. Linearitás2. dΠ º v = idTT

A linearitás úgy értendő, hogy ha v(t) ∈ TpE, akkor v(λt) ∈ TpE és v(λt) = λv(t). (1-dimenziós vektortéren értelmezett függvények esetén a linearitás a homogenitással azonos). Az, hogy ez teljesül, az egyrészt a (1) definícióból, másrészt abból látható, hogy egyrészt a T inverz koordinátafüggvényei (φ-1) és azok érintővektorai ((φ-1).)közt is, másrészt ezen inverz koordinátafüggvények és s. között is lineáris kapcsolat áll fenn.

A dΠ º v = idTT , vagyis a dΠ(v(t)) = t összefüggés pedig Π(s(φ-1(t)) = φ-1(t) következménye.

A t ∈ T időpontban a téridőnek a t feletti Et fibrumában lévő ppontjában a newtoni sebességek tehát a {v | v ∈ Lin(TtT →TpE), dΠ º v = idTT } halmaz elemei.

14. A Möbius-szalag titka

Talán kicsit barátságosab lesz az Elrettentő Példám (a továbbiakban: EP), ha elárulom, hogy mi köze van a Möbius-szalaghoz. Hát ez:

Page 18: Newton törvényeitől a Higgs-bozonig

Az EP nem más, mint az a nyaláb, amely a Möbius-szalagból úgy keletkezik, hogy a teljes terének a belső pontjait elhagyjuk. Vagyis ennek a nyalábnak a teljes tere (E) a Möbius-szalag teljes terének a határa (a szalag éle), bázistere és projekciója pedig ugyanaz, mint a Möbius-szalagé. A két nyaláb közt vannak hasonlóságok és különbségek és is. Különbség, hogy a Möbius-szalagnak van globális szelése (hiszen tudunk rá egyenlítőt rajzolni, az EP-nek viszont – mint láttuk -nincs. A hasonlóság ránézésre is nyilvánvaló, de mi azért itt ezt egy kicsit mélyebben is ki fogjuk vesézni.

Jelölések:

Legyen H = {z ∈ C : |z|=1 }

Az EP nyaláb: (E, H, ΠE, K), ahol

E = H, ΠE : E → H : z → z2 , K = {-1,1}.

Az EP nyaláb z = eiφ pont feletti fibruma a ΠE -1 (eiφ )={ eiφ/2 ,-eiφ/2 } halmaz.

Azért, hogy világosan látszódjon, hogy az EP-nyaláb a Möbius-szalag résznyalábja, a Möbius-szalagot is komplex számokkal írom most le. A Möbius szalag teljes tere C2-nek az alábbi részhalmaza:

M = {(sinη eiφ , cosη eiφ/2) : 0 ≤ η ≤ π, 0 ≤ φ ≤ 2π}

A Möbius-szalag: (M, H, Π, F), ahol Π : M → H : (sinη eiφ , cosη eiφ/2) → eiφ, F = [-1,1]. A Möbius-szalag z = eiφ pont feletti fibruma a {(sinη eiφ , cosη eiφ/2) : 0 ≤ η ≤ π} halmaz. Az EP-nyaláb eiφ pont feletti fibruma láthatóan ennek a halmaznak a határa, amennyiben (0,z) párt azonosítjuk z-vel.

Ugyanígy látható, hogy az EP nyaláb teljes tere (E) valóban határa a Möbius-szalag teljes terének (M-nek):

Page 19: Newton törvényeitől a Higgs-bozonig

E = {(sinη eiφ , cosη eiφ/2) : η ∈ {0,π}, 0 ≤ φ ≤ 2π} = {(0 , eiφ) : 0 ≤ φ ≤ 2π}

15. Principális nyalábok

De miért érdekes ez?

Azért, mert szeretném elmagyarázni – de mindenekelőtt megérteni – a principális nyalábok lényegét. A definíciójukat természetesen el tudom mondani (már el is mondtam valahol), és azt is tudom, hogy miután megismertük őket, másféle nyalábok már szinte egyáltalán nem fognak érdekelni minket. Érintőnyalábok helyett frame-nyalábokat fogunk vizsgálgatni, a Möbius-szalag helyett pedig az Elrettentő Példát. A mértéktérelmélet meg eleve csak principális nyalábokkal foglalkozik.

Mint már említettem, a principális nyaláb olyan nyaláb, amely fibruma a nyaláb struktúracsoportja feletti principális homogén tér. A principális homogén tér egy halmaz és a halmaz önmagára történő leképezéseinek egy olyan csoportja, amelyre fennáll, hogy a halmaz tetszőleges két eleméhez a csoportnak pontosan egy olyan eleme van, amelyik az egyiket a másikba viszi. Például az affin tér és az affin tér definíciójában szereplő vektortér (az összeadásra, mint csoportműveletre nézve) ilyen, ha egy v vektort olyan leképezésnek tekintünk, amely a p ponthoz azt a q elemet rendeli, amelyre q – p = v. Tetszőleges csoport, mint halmaz, a csoportelemekkel történő balról való szorzással, mint csoporthatással principális homogén teret alkot. Természetesen az Elrettentő Példa fibruma, vagyis a {-1,1} halmaz is principális homogén tér, ha csoportműveletnek a szorzás tekintjük. Ráadásul ez a csoport egyúttal ennek a nyalábnak a struktúracsoportja is, tehát az Elrettentő Példánk egy principális nyaláb!

Azt szokták mondani, hogy az EP a Möbius-szalag principális nyalábja. Ezt úgy értik, hogy a Möbius-szalagnak van olyan lokális trivializációja, amelyhez tartozó struktúracsoport a kételemű csoport. És itt jön az, amivel foglalkozni szeretnék. Az ilyen módon egy fibrált nyalábhoz rendelt principális nyaláb vizsgálatával például megállapítható, hogy egy nyaláb triviális-e vagy sem: pontosan akkor triviális ő is és a principális nyalábja is, ha a principális nyalábjának van globális szelése. Tudjuk, hogy az Elrettentő Példának nincs, tehát e tétel szerint sem ő, sem a Möbius-szalag nem triviális nyaláb.

Van azonban egy bökkenő. Egy nyaláb lokális trivializációja nem egyértelmű, tehát a struktúracsoportja sem, tehát a principális nyalábja sem. Például egy hengerpalást triviális nyaláb, hiszen ő a kör és egy intervallum Descartes-szorzatával homeomorf. De nem kötelező nekünk így trivializálni. Összeállíthatunk papírból egy hengerpalástot például három papírcsík átfedéssel történő összeragasztásával: az 1. csík 2. végét a 2. csík 1. végéhez, a 2. csík 2. végét a 3. csík 1. végéhez, a 3. csík 2. végét pedig az 1. csík 1. végéhez ragasztjuk. Az így hengerpalásttá összeállt alakzatra egymással párhuzamos körbemenő vonalakat rajzolhatunk, és megszámozhatjuk őket mondjuk -1-től 1-ig a valós számokkal. Az átfedő részeken a vonalak az egymásra ragasztott papírcsíkok mindegyikére rákerülnek (mondjuk indigósak a papírcsíkok). Az átmeneti függvény így mindhárom átfedő tartományban az identitás, a struktúracsoport tehát az egyelemű csoport, a hengerpalástunk principális nyalábja tehát az S1

× {e} triviális nyaláb.De megtehetjük azt is, hogy a második csíkot megfordítjuk. Ekkor az 2. csík két végén az átmeneti függvényünk a -1-gyel való szorzás lesz, a 3. és 1. csík egymással átfedő részén pedig marad az identitás. Így egy olyan trivializációhoz jutunk, amelynek a struktúracsoportja ugyanaz, mint a Möbius-szalagé. A bázistere is ugyanaz. A principális nyalábja mégis

Page 20: Newton törvényeitől a Higgs-bozonig

különböző, hiszen az övének van globális szelése, az EP-nek viszont nincs.Ez ezért érdekes, mert a mértéktérelméletben csak lazán a struktúracsoport megnevezésével utalnak egy principális nyalábra. A Maxwell-elmélet principális nyalábját például csak U(1)-nyalábnak emlegetik. Most viszont azt láttuk, hogy ugyanaz a bázistér és ugyanaz struktúracsoport egymástól eltérő principális nyalábokhoz is tartozhat!

16. Trivialitás és átmeneti függvények

Annak ellenére, hogy egy nyaláb trivializációja lényegében véve önkényes, egy ilyen önkényes trivializáció átmeneti függvényeit megvizsgálva meg tudjuk mondani, hogy a nyaláb triviális-e, vagy sem.

Példaként nézzük a nemtriviális Möbius-szalagot illetve a triviális hengerpalástot. Rakjuk össze a hengerpalástot az előző bejegyzésben írt módon, három papírcsíkból. Ekkor a 3 papírcsíknak 3 átfedése van. A 4. bejegyzés jelöléseit használva a papírcsíkok rendre az Ui × [-1,1] halmazok (i ∈ {1,2,3} ). Az átmeneti függvények 1-gyel, ill. -1-gyel történő szorzások. Az első módon leírt összerakásban: g12 = g23 = g31 = 1. A második esetben, vagyis amikor a második papírcsíkot megfordítottuk, az átmeneti függvények: g12 = g23 = -1, g31 = 1. Az átmeneti függvények mindkét esetben faktorizálhatók gij = λi λj alakban: az első esetben λ1

= λ2 = λ3 = 1 , a másodikban pedig λ1 = λ3 = 1, λ2 = -1 értékekkel.

A Möbius-szalag esetén a papírcsíkokat úgy kell összeragasztani, hogy valamelyik csíknak az egyik felét ragasztjuk fordítva a következőhöz, mondjuk a harmadik szalagot az elsőhöz: g12 = g23 = 1, g31 = -1. Ha ebben az összeállításban a második szalagot megfordítjuk, az átmeneti függvények ezek lesznek: g12 = g23 = g31 = -1. Ezek a gij függvények láthatóan nem faktorizálhatók λi λj alakban, hiszen gij = λi λj esetén g12 g23 g31 = (λ1λ2)(λ2λ3)(λ3λ1) = λ1

2 λ22

λ32 = 1 lenne és nem -1.

És ez általában is igaz! Egy fibrált nyaláb pontosan akkor triviális, ha egy trivializéciójához tartozó gij átmeneti függvények λi λj alakban faktorizálhatók. Ez egyúttal persze azt is jelenti, hogy egy nyalábnak vagy az összes trivializációja faktorizálható ámeneti függvényekkel rendelkezik, vagy egyik sem.

17. Érintőnyalábok

Mint már említettem, az érintőnyaláb olyan vektornyaláb, amelynek a fibrumai a bázistér érintőterei. Ez önmagában persze még csak annyit mond, hogy a fibrumok a bázistér dimenziószámával azonos dimenziójú vektorterek. De ez még nem a teljes definíciója az érintőnyalábnak. Mielőtt elmondanám a pontos definíciót, mutatok egy feltűnő különbséget az érintőnyaláb és az általános értelmű vektornyaláb között.

Tekintsük most a hengerpalástot illetve a Möbius-szalagot végtelen hosszú palásttal, vagyis a [-1,1] fibrum helyett vegyük R-t fibrumnak. A struktúracsoportot ez a változtatás nem érinti, a trivializáló lefedések között továbbra is az identitás és a -1-gyel való szorzás az átmeneti függvények. Lévén, hogy R egy vektortér, ebből látjuk, hogy a kör, mint bázistér fölött két különböző topológiájú 1-dimenziós fibrumú vektornyaláb lehetséges: az egyik a triviális hengerpalást, a másik a nemtriviális Möbius-szalag. A kör érintőnyalábja is egy 1-dimenziós fibrumú vektornyaláb, de az az általános vektornyalábbal szemben már egyértelmű. A topológiáját meghatározza az, hogy ő érintőnyaláb. Speciel a kör érintőnyalábja a

Page 21: Newton törvényeitől a Higgs-bozonig

hengerpalásttal homeomorf, és nem a Möbius-szalaggal, vagyis triviális. De nem minden érintőnyaláb triviális, például a gömbé sem.

Végre elárulom, hogy az érintőnyalábok topológiája az azonos bázisterű és azonos fibrumú vektornyalábokkal ellentétben miért egyértelmű. Azért, mert tőlük megköveteljük, hogy a trivializációjuk a bázistér atlaszából származhasson, mégpedig úgy, hogy ha a bázistér egy U nyílt halmazához tartozó U → Rn térkép a Φ leképezés, akkor a nyaláb trivializációjának a Π-

1(U) nyílt halmazához tartozó Π-1(U) → R2n homeomorfizmusa a (p,vi∂i) → (Φ(p), v1, v2…,vn) leképezés legyen. Ennek persze csak akkor van értelme, ha a nyaláb tipikus fibruma* Rn. Ezért ennek is szerepelnie kell az érintőnyaláb definíciójában (bár ez inkább csak formai megkötés, hiszen minden n-dimenziós vektortér izomorf és diffeomorf Rn-nel).

A papírcsíkokból összerakott hengerpalástunkból úgy tudunk Möbius-szalagot készíteni, hogy az egyik csík egyik végét megfordítjuk. Ugyanezt az érintőnyalábbal nem tudjuk megtenni, mert az átmeneti függvényt - mivel az a kör atlaszából származik – csak úgy tudjuk -1-szeresére változtatni, hogy az atlasz hozzá tartozó térképelemét -1-szeresére cseréljük. De ekkor ennek a koordinátavonalnak az érintője nemcsak itt, hanem végig -1-szeresére változik, tehát a képzeletbeli papírcsíkunk másik végén is – ha akarjuk, ha nem.

*Itt a tipikus fibrum azt jelenti, amit a fibrált nyaláb definícójában csak simán fibrumnak neveztem. Ez pontosabb szóhasználat, mivel a bázistér tetszőleges p pontja esetén Π-1(p)-t is (a p pont fölötti) fibrumnak nevezzük. Most látható, hogy a két dolog nem ugyanaz. A világosabb fogalmazás céljából ezentúl fibrumnak csak a Π-1(p) halmazokat fogom nevezni, a másikat pedig mindig tipikus fibrumnak.

18. Sündisznótétel és párhuzamosíthatóság

A sündisznótétel azt mondja, hogy S2 érintőnyalábjának nincs sehol sem eltűnő szelése. Magyarra lefordítva: a gömb felszínén nem lehet olyan folytonos vektormezőt megadni, ami sehol sem 0. Sündisznóra lefordítva: Az összegömbölyödött sündisznó valamelyik tüskéje mindig pontosan merőleges a gömb felületére. Persze csak akkor, ha a sündisznó tüskéi folytonos függvényei a helynek, és nincs valahol “forgó” a sündisznó frizurájában.

De ez most látszólag nem érdekel minket, hiszen jól elvagyunk mi a hengerpalásttal, Möbius-szalaggal és az Elrettentő Példával. Az érintőnyalábok csak érintőlegesen jöttek be a képbe, és azt mondtuk rájuk, hogy ők tulajdonképpen ugyanazok, mint a hengerpalást. Már persze, ha a kör érintőnyalábjáról van szó. Még a struktúracsoportot sem változtattuk meg, pedig tulajdonképpen kellett volna. Valahol talán már említettem, hogy a vektornyalábok struktúracsoportja (így az érintőnyaláboké is) kötelezően GL(n), vagyis az n-dimenziós általános lineáris csoport. Mi ennek ellenére a {-1,1} csoportot vettük struktúracsoportnak. Hogy tehettünk ilyet? Egyrészt, tudnunk kell, hogy ha egy fibrált nyaláb struktúracsoportja G (vagyis, ha a nyaláb egy trivializációjának átmeneti függvényei G elemei) és G homotopikusan ekvivalens egy H részcsoportjával*, akkor annak a nyalábnak létezik olyan trivializációja is, amelyhez tartozó struktúracsoport H (a G-ról H-ra való áttérést a struktúracsoport redukálásaként szokás emlegetni). Másrészt azt kell tudnunk, hogy a GL(n) csoport homotopikusan ekvivalens O(n)-nel, vagyis az n-dimenziós ortogonális csoporttal, és persze azt is, hogy O(1) = {-1,1}. Az érintőnyalábok struktúracsoportjának tehát nyugodtan vehetjük O(n)-t is, ha éppen úgy akarjuk.

Page 22: Newton törvényeitől a Higgs-bozonig

Kézenfekvő lenne azt mondani, hogy az M sokaság T(M) érintőnyalábjának principális nyalábja az a principális nyaláb, amelynek a bázistere M, a struktúracsoportja GL(n), a fibruma pedig ugyancsak GL(n), mint önmaga feletti principális homogén tér. A fibrumot azonban egy kicsit szemléletesebben szokás megadni: GL(n) helyett az n-dimenziós tér rendezett bázisainak (frame) halmazát, amelyen a csoporthatás GL(n) a bázistranszformációk csoportja. Ezt a nyalábot (tehát T(M) standard principális nyalábját) nevezzük az M sokaság F(M) frame-nyalábjának. Nem nehéz észrevenni, hogy GL(n)-nek O(n)-re történő redukálása a frame-nyalábnak az ortonormált bázisokra való leszűkítését jelenti a köztük értelmezett bázistranszformáció-csoporttal.

Ha egy M differenciálható sokaság F(M) frame-nyalábjának van globális szelése, akkor M-et párhuzamosíthatónak (parallelizálhatónak) mondjuk. Az elnevezés oka, hogy F(M) globális szelése M minden p pontja feletti Tp(M) érintőtér egy rendezett bázisának a megadását jelenti p folytonos függvényeként. Ha van ilyen, akkor T(M) vektorai között értelmezhetünk egy párhuzamossági relációt: M két különböző pontja feletti érintővektorokat akkor nevezünk párhuzamosnak, ha az adott bázisokra vonatkozó megfelelő koordinátáik konstansszorosai egymásnak. Lévén, hogy a frame-nyaláb az érintőnyaláb principális nyalábja, egy sokaság pontosan akkor párhuzamosítható, ha az érintőnyalábja triviális. Említettük, hogy a kör érintőnyalábja triviális, tehát a kör párhuzamosítható. A kör frame-nyalábjának egy globális szelése az alábbi ábrán látható.

Persze nemcsak érintőnyalábok, hanem tetszőleges vektornyaláb principális nyalábja is frame-nyaláb, így például a vektornyalábnak tekintett Möbius-szalagé is. Ez a nyaláb nem más, mint az Elrettentő Példa.

És beszélhetünk mondjuk magának a Möbius-szalagnak, mint differenciálható sokaságnak is a frame-nyalábjáról (tehát a Möbius-szalag teljes tere érintőnyalábjának a principális nyalábjáról) is. Ennek egy globális szelése a szalag minden pontjában két egymástól lineárisan független vektor megadása. Más szóval két olyan folytonos vektormezőé, amelyekhez tartozó vektorok minden pontban lineárisan függetlenek egymástól. Ez azt is jelenti, hogy egyik vektormező sem tartalmazhat sehol sem nullvektort, hiszen a nullvektor és egy bármilyen vektor lineárisan függők. A möbius-szalagon egy olyan folytonos vektormezőt meg tudunk adni, ami sehol sem nulla: a szalag minden pontjában a szalag élével párhuzamos irányú (“vízszintes”) érintővektorokat veszünk. A másik vektormezőnek olyan érintővektorokból kellene állnia, amelyek minden pontban lineárisan függetlenek az első vektormezőhöz tartozó vektortól, tehát mondjuk merőlegesek arra (a merőlegességet mondjuk a szalagnak egy kiválasztott térképén értve). Ilyen folytonos vektormezőt azonban nem lehet

Page 23: Newton törvényeitől a Higgs-bozonig

megadni: a szalagon “lefelé mutató” vektorok valahol mindenképpen “fölfelé mutató” vektorral fognak találkozni. A Möbius-szalag tehát nem párhuzamosítható.

Az, hogy a gömbfelszín (S2) sem, az a sündisznótétel egyszerű következménye. A tétel szerint gömbfelszínen egyetlen sehol sem eltűnő vektormezőt sem lehet megadni, nemhogy kettőt.

Nyilvánvaló, hogy párhuzamosítható sokaságok szorzattere is párhuzamosítható, tehát például egy tórusz is, mivel az a kör önmagával vett topologikus szorzata. Az viszont már nem igaz, hogy egy nem párhuzamosítható és egy akármilyen sokaság szorzata ne lehetne párhuzamosítható. Például a gömbfelszín (S2) és az egyenes (R) szorzata R3\{0} párhuzamosítható. A trükk az, hogy az R3\{0} frame-nyalábjának egy szelése három olyan vektormezőből áll, amelyeknek ugyan mindegyike olyan, hogy a gömbfelszínre való vetülete valahol eltűnik, de a három közül minden esetben csak egyé, vagyis mindig marad még kettő, amelyik kifeszíti a gömb adott pont feletti érintőterét. Csak persze nem minden pont felett ugyanaz a kettő, hiszen ha így lenne, akkor ennek a kettőnek S2-re vonatkozó vetületei párhuzamosítanák S2-t.

*Két topologikus tér homotopikus ekvivalenciája azt jelenti, hogy folytonosan egymásba deformálhatók (pl. a kávéscsésze egy fánkká). A pontos definíció az, hogy X és Y topologikus tér definíció szerint homotopikusan ekvivalens, ha létezik egy f: X → Y és egy g: Y → X folytonos függvény úgy, hogy f º g homotóp idX-szel, g º f pedig idY-nal. Két folytonos X → X függvény, pl. h és i pedig definíció szerint akkor homotóp egymással, ha van olyan folytonos H: X × [0,1] → X függvény, hogy H(x,0) = h(x) és H(x,1) = i(x).

19. Dirac derékszíja

Kérjük kölcsön Paul Diractól a derékszíját, és tűzzük tele gombostűkkel jó sűrűn végig a középvonalán (belülről kívülre), úgy, hogy amikor a szíjat szépen kisimítva lefektetjük az asztalra, akkor a tűk mind szépen párhuzamosan álljanak egymással, függőlegesen felfelé, tehát a szíj és az asztal közös síkjára merőlegesen.

Ha a szíjat a két végénél megfogva kifeszítve felemeljük, a tűk ugyanúgy függőlegesen állnak, egymással párhuzamosan:

Page 24: Newton törvényeitől a Higgs-bozonig

Most a szíj csatos végét tartsuk mozdulatlanul a másik végét pedig forgassuk el a szíj középvonala, mint tengely mentén 360 fokkal, vagyis csavarjunk a szíjon egy teljes fordulatot. Nézzük, mi lett a gombostűinkkel. A szíj két végén függőlegesen felfelé állnak, a közepén függőlegesen lefelé, közben pedig folyamatosan változik az irányuk, valahogy így:

Ha szíj hossza 1 egység, akkor a csatos végtől t távolságban lévő gombostűnek a függőlegessel bezárt szöge φ(t) = 2πt (mod 2π). A t távolság függvényében a szög [-π, π] intervallumbeli reprezentánsa így néz ki:

Page 25: Newton törvényeitől a Higgs-bozonig

A -π szögű helyzet azonos a π szögűvel, az alsó szakasz tehát olyan, hogy a baloldali vége azonos a jobboldalival. Tulajdonképpen az alsó szakasz helyett egy kört kellett volna rajzolnom (a szakasz meggörbítésével és a π pontnak a -π-hez való ragasztásával) ahhoz, hogy a rajz topológiája megegyezzen a tű lehetséges térbeli helyzeteinek a topológiájával. Ha csupán az lett volna a célom, hogy a tűknek az adott fix tengely körüli forgatásait szemléltessem, így is tettem volna. Ha azonban a derékszíjat meglazítjuk úgy, hogy a két végét a végeken lévő tűk függőleges irányának megtartásával közelebb visszük egymáshoz, akkor a szíjat változatos módon tudjuk görbítgetni, aminek eredményeképpen a beleszúrt tűk a bármerre mutathatnak. Az eredeti, függőleges irányukhoz viszonyított helyzetüket ekkor nem tudjuk egyetlen szöggel jellemezni, hanem azt is meg kell adnunk, hogy az eredeti helyzetükből milyen tengely körül fordultak el az adott szöggel (a tengely az eredeti és az elforgatott vektor által kifeszített síkra merőleges, és olyan irányú, hogy az eredeti vektor, az elforgatott vektor és a tengely ebben a sorrenben jobbsodrású rendszert alkosson). Ezt egy térbeli ábrán úgy tudjuk szemléltetni, hogy az előző ábrán szereplő alsó szakaszt az elforgatás tengelyének az irányában vesszük fel. Ha vesszük az összes ilyen lehetséges szakaszt a 0 pontjukkal összeragasztva, az eredmény egy π sugarú tömör gömb lesz, amely felszínének átellenes pontjait azonosnak tekintjük. Ezt a gömböt valós 3-dimenziós projektív térnek (RP3) nevezik, és mint látjuk minden p pontja annak a térbeli elforgatásnak felel meg, amelynek szöge azonos az illető pontnak a gömb o középpontjától mért op távolságával, a forgatás tengelye pedig op irányú. Ez a bizonyos valós 3-dimenziós projektív tér ezek szerint homeomorf a 3-dimenziós forgáscsoporttal, SO(3)-mal.

Az ábrán tehát az alsó szakasz ebben a gömbben helyezkedik el úgy, hogy a 0 pontja a gömb középpontjában van, a két vége pedig a gömb felszínén, az iránya pedig megegyezik a szíj középvonalának az irányával. A lerajzolt függvény pedig a látszat ellenére egy zárt görbe, hiszen folytonos és az alsó szakasz két vége azonos egymással. Ha a szíjat meglazítjuk és a végpontjainak fix helyzetben való tartása mellett különböző módon görbítjük, a görbénk továbbra is zárt marad (hiszen a végpontjai nem változnak), a belső pontjai viszont a benne lévő tű helyzetének megfelelően a gömb belsejében (folytonosan) vándorolnak. Az így valamilyen módon meggörbített szíj tehát az eredeti zárt görbével homotóp görbét definiál a projektív terünkben. Az eredeti, tehát a megcsavarás előtti állapot pedig a [0,1] → {o} görbét jelenti. Ha tehát a szíjat a végeinek fix helyzetben tartása mellett úgy tudnánk tekergetni, hogy végül visszaáll a kiinduló állapot, ez azt jelentené, hogy a szíj alakját leíró projektív térbeli görbénk egy pontra húzható (homeotóp a ponttal). Elég nyilvánvaló, hogy a fent ábrázolt [-π, π] szakasz nem húzható egy pontra, a 360 fokkal megtekert szíjunkat tehát a végpontjainak fix helyzetben való tarása mellett akárhogyan görbítgetjük, soha sem tudjuk az eredeti, csavarásmentes helyzetbe hozni.

Viszont ha a szíjon mégegy fordulatot tekerünk, akkor az ezt leíró görbe duplán fedi le a [-π, π] szakaszt. A kiinduló helyzet lényegében ilyen:

Page 26: Newton törvényeitől a Higgs-bozonig

Ez a zárt görbe folytonosan ilyenné deformálható:

Ez pedig a 2. és 3. pont teljesen egymásra húzásával ilyenné:

Ez pedig már egy símán az 1 (=4) pontra húzható zárt görbe.

A derékszíjra vonatkozóan ez azt jelenti, hogy a 720 fokkal megtekert szíjat a két végének fix helyzetben való tartása mellett – a 360 fokkal megtekert helyzettel ellentétben – lehet úgy görbítgetni, hogy végül teljesen kiegyenesedjen.

20. A félbevágott gumilabda esete a 4-dimenziós térrel

Folytassuk rombolásunkat! Paul Dirac derékszíját már sikerült tönkretennünk a vastag gombostűkkel, most egy gumilabdát vágjunk félbe! Olyat keressünk, amit amúgy is két félgömbből ragasztottak össze, mert ezen szépen látszik a ragasztás nyoma, mint valami egyenlítő: itt vágjuk szét. Ha nem túl erős a labda (vagy inkább: ha a képzelőerőnk kellően erős), akkor ezt a fél-labdát szépen egy koronggá tudjuk kisimítani.

A korong nem más, mint egy 2-dimenziós tömör gömb. Nevezzük D2-nek! A korong határa egy kör, vagyis egy 1-dimenziós gömbhéj (S1). Maga a gumilabda pedig egy 3-dimenziós térben lévő 2-dimenziós gömbhéj (S2).

Most lépjünk egy dimenzióval feljebb! Korong (vagyis a 2-dimenziós tömör gömb, D2) helyett vegyünk egy rendes, 3-dimenziós tömör gömböt (D3). Ezt nyilván egy 4-dimenziós térbeli gumilabda (S3) kettévágásával és kisimításával tudjuk létrehozni.

A 3-dimenziós tömör gömbbel az előző bejegyzésben úgy tudtuk a 3-dimenziós forgatások topológiáját leírni, hogy a felszíni, egymással átellenes pontjait azonosítottuk. Egy dimenzióval lejjebb ez a – kisimított, vagy kisimítatlan - fél gumilabda egyenlítőjének az átellenes pontjainak egymással történő azonosítását jelenti. Ez így nem elég szép. Ragasszuk csak vissza a helyére a gumilabda levágott déli félgömbét is, és azonosítsuk a déli félgömb

Page 27: Newton törvényeitől a Higgs-bozonig

minden pontját az északi félgömbnek a vele átellenes pontjával. Így a labda minden pontja azonos a vele szemben lévővel. Az ilyen ekvivalenciarelációval ellátott S2-nek ugyanaz a topológiája, mint a fél gumilabdáé (2-dimenziós tömör gömbé, azaz D2-é) ha annak a határpontjain (az egyenlítőn) definiáljuk ezt az ekvivalenciarelációt. Akármelyik reprezentációt vesszük, amit a megfelelő hányadosterek leírnak, az RP2, vagyis a valós projektív sík.

A 3-dimenziós forgatások topológiája pedig RP3 -mal (a valós projektív térrel) azonos, ami az előzők 1-dimenzióval feljebb való megismétlésével azt jelenti, hogy nem csak D3/{szemben lévő határpontok ekvivalenciája}, hanem S3/{szemben lévő pontok ekvivalenciája}-ként is előáll.

Mivel S3 a 4-dimenzós térben lévő gömbhéjat jelenti, ő magát nem tudjuk szemléletesen elképzelni, csak a 3-dimenziós térbeli S2 metszeteit. Az egy dimenzióval lejjebbi gumilabda esetén egy ilyen metszet a gumilabdának egy délköre. A különböző délkörök különböző sugarú körök (1-dimenziós gömbhéjak). Ennek megfelelően S3-at úgy lehet elképzelni, mint ami hasonlóan van összerakva a D3 belsejéből kiszedett különböző sugarú gömbhéjakból, mint ahogy a gumilabda "van összerakva" a különböző sugarú délköreiből.

A forgatásokra visszatérve S3 tehát úgy reprezentálja a forgatásokat, hogy egy adott α esetén az α szögű forgatások S3 -nak egy α sugarú metszetében vannak, vagyis egy α sugarú 3-dimenziós gömbhéjon, ugyanúgy, mint ahogy az a D3-mal történő reprezentálás esetében is volt.

21. Forgatások és kvaterniók

A sík forgatásai topológiailag egy körvonallal (S1) azonosak, ez nyilvánvaló. A körvonal minden pontja pedig egy egységnyi abszolút értékű komplex számnak felel meg, ráadásul ha a φ szögű forgatásnak az eiφ komplex számot feleltetem meg, akkor ez a megfeleltetés egy csoporthomomorfizmus a sík forgatásai (SO(2)) és az egységnyi abszolút értékű komplex számoknak multiplikatív csoportja (SU(1)) között.

Ez a helyzet nem pontosan analóg a 3-dimenziós forgatásokéval. Mint ahogyan az előző bejegyzésben láttuk, a 3-dimenziós tér forgatásai topológiailag nem S3-mal, hanem RP3-mal azonosak, ami azt jelenti, hogy S3 duplán fedi le SO(3)-at. Ez annak felel meg, mintha S1-gyel duplán fednénk le SO(2)-t, vagyis, ha például a φ szögű forgatásnak nem eiφ -t, hanem eiφ/2 -t feleltetem meg (a gumilabdás analógia szerint a [-π,π] szakaszt nem a két végénél ragasztom ösze, hanem egy 2-dimenzióbeli gumilabda felső felének tekintem, és hozzáragasztom az alsó felét is) . Ekkor eiφ ugyanazt a 2φ szögű forgatást jelenti, mint -eiφ. Ha a komplex egységkört nézzük, akkor azt látjuk, hogy ebben az ábrázolásban a φ szögű akármilyen irányú forgatások azok az egységnyi abszolút értékű komplex számok, amelyek valós részének abszolút értéke cos(φ/2). Ha – a szokástól eltérően – a valós tengelyt függőlegesnek vesszük, akkor ez a körnek, mint 2-dimenzióbeli gömbnek a cos(φ/2) "szélességi körei".

Ez a kissé szokatlan ábrázolás azért jó, mert gyakorlatilag változatlanul átvihető a 3-dimenziós forgatásokra, azzal a különbséggel, hogy komplex számok helyett kvaterniókat veszünk, amik abban különböznek a komplex számoktól, hogy a képzetes részük nem 1, hanem 3-dimenziós. Egy kvaternió tehát (t, v ) alakú 4-dimenziós vektor, ahol t egy valós szám, v pedig egy 3-dimenziós vektor. A kvaternió valós része t, képzetes része pedig v. Ekkor tehát a komplex egységkörünk helyett egy – az egységnyi abszolút értékű

Page 28: Newton törvényeitől a Higgs-bozonig

kvaterniókból álló – 4-dimenziós gömbünk van, amelynek a cos(φ/2) valós résszel jellemzett "szélességi köre" az összes lehetséges különböző irányú φ szögű forgatásokat reprezentáló 3-dimenziós gömbhéj. A gömbhéjon lévő kvaterniók (cos(φ/2) , usin(φ/2)) alakúak, ahol u a forgatás tengelye irányába mutató egységvektor.

A kvaterniók között a vektorösszeadás mellett ugyanúgy egy szorzás művelet is definiálva van, mint ahogy a komplex számok esetében. A kvaterniók szorzása asszociatív és disztributív az összeadásra nézve, ellenben nem kommutatív.

Szorzási szabályok:

A tiszta valós (vagyis 0 képzetes részű) kvaterniók szorzata is tiszta valós és a valós komponense az egyes valós részek szorzatával egyezik meg: (t,0)(s,0) = (ts,0).

Egy (t,0) tiszta valós és egy (0,v) tiszta képzetes kvaternió szorzata a képzetes rész skalárszorosa: (t,0)(0,v) = (0, tv)

A tiszta képzetes kvaterniók szorzata pedig definíció szerint:

(0,v)(0,w) = (-vw, v x w ),

ahol vw a v és v vektorok skaláris szorzatát, v x w pedig a vektoriális szorzatukat jelöli.

Általánosságban tehát egy (s,v) és egy (t,w) kvaternió szorzata:

(s,v)(t,w) = (st - vw, sw + tw + v x w).

Állítás.

(s,v)-1 = (s, -v)/(s2 + |v|2).

Bizonyítás.

(s,v)(s, -v)/(s2 + |v|2) = (s2 + |v|2, sv -sv + v x v)/(s2 + |v|2) = (1, 0).

Következmény.

ha |u|2 = 1, akkor

(cos(φ/2) , usin(φ/2))-1 = (cos(-φ/2) , usin(-φ/2))

Állítás. Ha q = (cos(φ/2) , usin(φ/2)), akkor

q(0,v)q-1 = (0, v‘),

ahol v‘ a v vektor u körüli φ szöggel való elforgatottja.

Bizonyítás.

Page 29: Newton törvényeitől a Higgs-bozonig

Tekintve, hogy a (0,v) -> q(0,v)q-1 hozzárendelés v-ben lineáris, az állítás az alábbi két állítással ekvivalens:

1. q(0,v)q-1 = (0,v), ha v = u2. q(0,v)q-1 = (0, vcosφ + (u x v)sinφ ), ha v merőleges u-ra , vagyis, uv =0 és u x v x u

= v

Ezek az összefüggések pedig a

q(0,v)q-1 = (cos(φ/2) , usin(φ/2)) (0,v) (cos(φ/2) , -usin(φ/2))

szorzás elvégzésével egyszerűen láthatóan teljesülnek.

22. A szögsebesség és a Maurer-Cartan forma

Egy forgó merev test minden nemnulla sebességű pontjának pillatatról pillanatra változik a sebességvektora. Mégis van értelme “változatlan forgás”-ról beszélni, olyan értelemben, hogy egy egyenletesen forgó merev testnek a tér adott pontján éppen ott lévő pontjának a sebessége időben állandó. Vagyis egy egyenletesen forgó merev test mozgása időben állandó sebességmezővel írható le.

Ez a megállapítás természetesen a merev test forgás nélküli egyenletes transzlációjára is alkalmazható, de ott persze maguknak a tömegpontoknak is konstans a sebességük. Ellenben egy változó keresztmetszetű csőben stacionáriusan áramló összenyomhatatlan folyadék esetén ismét már csak a sebességmező az, ami állandó, a folyadék egyes pontjainak a sebessége már nem. A fenti példák arra utalnak, hogy a kiterjedt testek mozgásának leírására bizonyos szempontból praktikusabb módszer lehet a test sebességmezejének a jellemzése, mint annak a vizsgálata, hogy a test egyes pontjai hogyan mozognak.

Maradjunk a forgó merev testnél. A test forgását a test sebességmezejével szeretnénk jellemezni, tudván, hogy a test egy lehetséges helyzetét minden esetben egy forgatással – vagyis az csoport egy elemével – lehet egy másik lehetséges helyzetébe vinni.

Tegyük fel, hogy adva van a test egy önkényesen kiválasztott helyzete, és ebben a helyzetben minden pontjának ismerjük az térbeli helyzetvektorát. Tetszőleges pillanatban a test tetszőleges pontjának a helyvektora egy csoportelemmel származtatható az általunk lefixált helyzetéből:

,

vagy magának a pontnak a jelölését elhagyva:

(a továbbiakban a test pontjait azonosítjuk kiválasztott helyzetbeli helyvektorukkal). Tehát adott pillanatban a test összes pontjának a pillanatnyi helyzete ugyanazzal az egyetlen -beli elemmel jellemezhető. Ez az összes pillanatra vonatkoztatva azt jelenti, hogy a merev test adott forgása esetén a különböző pontja által -ban leírt összes különböző görbét egyetlen -beli görbe határozza meg.

Page 30: Newton törvényeitől a Higgs-bozonig

Mi most a pontok sebességeit, vagyis ezeknek az -beli görbéknek az érintőit szeretnénk kapcsolatba hozni érintővektoraival, vagyis az -beli görbék érintőivel.Mivel minden egyes helyvektor meghatároz egy

leképezést, ennek az érintőleképezése a megfelelő érintőterek között határoz meg egy leképezést:

az a deriváció, amely egy differenciálható függvényhez a

számot rendeli, ahol olyan -beli görbe, amelyre (ahol a TSO(3) nyaláb projekciója), és amelynek a pontbeli érintője , vagyis, amelyre

tetszőleges deriválható függvényre. Lévén, hogy affin tér, ezért azonosítható a

vektorral (ld. 12. Affin terek ).

A definícióból közvetlenül adódik, hogy tetszőleges elemre

.

Ha az elem -on való jobboldali csoporthatását, vagyis az hozzárendelést -gyel jelöljük, akkor az összefüggésünket

alakba írhatjuk. Az összefüggés természetesen tetszőleges görbe összes pontjára is érvényes:

,

így e görbék érintőire is:

(1)

amit helyett -re alkalmazva

Page 31: Newton törvényeitől a Higgs-bozonig

(1′)

alakba is írhatunk.Az

hozzárendelést felfoghatjuk úgy is, hogy minden érintővektora meghatároz egy

leképezést. Tekintve, hogy elemei lineáris transzformációi, ezért

is -nek lineáris függvénye, ezért egy lineáris leképezésnek tekinthető.

Ez már majdnem a forgó test sebességtere, de nem teljesen. Ha a érintővektor a pont felett van (vagyis, ha , vagyis ), akkor a következő leképezés. Tetszőleges -n átmenő és ebben a pontban érintőjű -beli görbét véve

a -beli görbe pontbeli érintője. Nekünk viszont egy olyan hozzárendelés kell, amelyik nem az , hanem a ponthoz rendeli hozzá ezt az érintővektort. A keresett sebességmező tehát az

leképezés.Az (1′) összefüggés és definíciója szerint ez

(2)

alakba is írható.

Az itt szereplő

lineáris leképezés tetszőleges érintővektorhoz az SO(3) csoport egységeleme feletti vektort rendel hozzá, mégpedig úgy, hogy ha egy -n átmenő, -ben érintőjű

-beli görbét az csoporthatással egy -n átmenő görbébe viszünk, akkor ennek az utóbbi görbének az érintője az pontban.

A lineáris leképezést (más szóval, ezt a Lie-algebra értékű 1-formát) nevezik Maurer-Cartan formának. Az itt bevezetett Maurer-Cartan forma különleges tulajdonsága, hogy a jobb-invariáns vektormezőkön konstans az értéke. Jobb-invariánsnak akkor nevezünk

Page 32: Newton törvényeitől a Higgs-bozonig

egy vektormezőt, ha tetszőleges esetén . (Természetesen, ha a jobboldali csoporthatás helyett baloldalit veszünk, akkor a balinvariáns Maurer-Cartan formához jutunk).

De térjünk vissza a merev testünkhöz. A (2) összefüggés szerint a merev test sebességmezeje alakú, ahol , vagyis az Lie-algebra eleme. Ez azt

jelenti, hogy valamely -n átmenő -beli görbével

,

ahol a deriválás abban a t pontban értendő, amelyre . Az általánosság megszorítása nélkül feltehetjük, hogy . Lévén, hogy elemei izometriák, tetszőleges esetén

, vagyis

,

ahol a skalárszorzatot jelöli, és az érintővektorokat itt ismét azonosítottuk a vektorokkal. Az leképezés tehát egy antiszimmetrikus lineáris leképezés, hiszen

.

A 3-dimenziós euklideszi tér önmagára történő antiszimmetrikus lineáris leképezései 3-dimenziós vektorteret alkotnak, tehát izomorfia létesíthető közöttük és elemei között. Az ilyen módon az sebességmezőhöz rendelt vektort nevezzük a forgó merev test szögsebesség-vektorának. Ezzel az vektorral felírva , ahol a szokásos vektoriális szorzatot jelöli.

Mátrix-reprezentáció

Ha elemeit a szokásos módon -as 1 determinánsú ortogonális mátrixokkal reprezentáljuk, és g eleméhez tartozó mátrixot -vel jelöljük, akkor .

elemei olyan mátrixok, amelyek mátrix-értékű függvények deriváltjai. A deriválás mátrixelemenként végezhető el.

A Maurer-Cartan forma ebben a reprezentációban a leképezés, ahol valamely 1 determinánsú ortogonális mátrix értékű függvény deriváltja abban a pontban,

amelyben . Mint láttuk, az eredmény egy antiszimmetrikus transzformáció mátrixa lesz, vagyis egy antiszimmetrikus mátrix. Ennek a

23. Killing vektormező és egyenletes forgás

Az előző bejegyzésben szereplő sebességmező, vagyis egy forgó merev test adott pillanatbeli sebességmezeje egy Killing vektormező. Persze a Killing vektormezőnek nem ez a definíciója. Azt általában a Riemann-terek izometrikus folyamainak a sebességmezejeként szokás emlegetni, de még általánosabb értelemben tetszőleges sokaságon adott automorfizmus-csoport tetszőleges egyparaméteres részcsoportjának a hatása által generált folyam sebességmezejeként. A forgó merev testünk esetén ez a csoport az csoport, az egyparaméteres részcsoport pedig egy olyan -beli görbe, amely egyenletes forgást ír le.

Page 33: Newton törvényeitől a Higgs-bozonig

Persze az egyparaméteres részcsoportot sem így szokás definiálni, hanem úgy, hogy egy topologikus csoportban haladó olyan görbe, amelyre , vagyis az olyan görbék, amik a valós számok additív csoportjának nemcsak homeomorf (oda-vissza folytonos és kölcsönösen egyértelmű), hanem homomorf (művelettartó) leképezése is (pontosabban szólva, a homeomorfizmust csak az egységelemnek valamely környezetében várjuk el). Az, hogy egy egyparaméteres részcsoportja tényleg egyenletes forgást ír le, onnan látszik, hogy egy kiszemelt pont helye a pillanatban , sebessége

.

Egy 0-hoz elég közeli pillanatban az r pontban az pont van, a sebessége pedig

Az pontbeli sebesség tehát tetszőleges pillanatban megegyezik a 0 pillanatbelivel. A fenti egyenlőség-láncban a második az, ami az egyparaméteres részcsoportokra kirótt

feltétel következménye.

Az előző bejegyzés tanulsága szerint a Killing vektormezők kölcsönösen egyértelmű kapcsolatban vannak a Lie-algebra vektoraival: a Lie-algebra (vagyis ) tetszőleges eleme meghatároz a G csoporton egy jobb (bal-) invariáns vektormezőt: ez azokból a vektorokból áll, amelyekhez a Maurer-Cartan forma -t rendeli. Ennek a G csoporton adott vektormezőnek a csoporthatás érintőleképezése általi képe az illető elemhez tartozó Killing vektormező.

24. Neumann János paralelogrammája

Neumann János 1935-ben Pascual Jordan-nal írt egy közös cikket*, ami lényegét tekintve arról szól, hogy az euklideszi terek legalapvetőbb összefüggése az úgynevezett paralelogramma azonosság. Ez egy elemi összefüggés a paralelogramma oldalhosszai és átlóhosszai között: az oldalhosszainak négyzetösszege egyenlő az átlóhosszainak négyzetösszegeivel: 2a2+2b2=e2+f2 , ahol a és b a paralelogramma oldalai, e és f pedig a két átlója. Tulajdonképpen a Pitagorasz-tétel általánosításáról van szó, hiszen a derékszögű paralelogramma (vagyis téglalap) speciális esetében ez a két átlóra felírt Pitagorasz-tétel egyenleteinek az összeadásaként adódik. Nem maga az összefüggés az, amire Neumann és Jordan rájött (hiszen valószínűleg már Pitagorasz is ismerte), hanem az, hogy egy valós, véges dimenziós, normált tér pontosan akkor euklideszi, ha érvényes benne a paralelogramma azonosság.

Neumann János és Pascual Jordan a kvantummechanika atyjai voltak. Jordan Heisenberggel és Born-nal együtt a kvantummechanika úgynevezett mátrixmechanikai formalizmusát alkotta meg, Neumann pedig bebizonyította, hogy ez a mátrixmechanika matematikailag ekvivalens a Schrödinger-féle hullámmechanikával. Az ekvivalencia bizonyítása abból ált, hogy megmutatta, hogy mindkét elmélet állapottere az absztrakt Hilbert-tér (pontosabban a Hilbert-tér altérhálójának) egy-egy speciális megvalósítása. Magának az absztrakt Hilbert-térnek a fogalmát is Neumann János alkotta meg 1929-ben**

A Hilbert tér az euklideszi tér fogalmának olyan általánosítása, amelyben a skalárok nem csak valós, hanem komplex számok is lehetnek, a tér dimenziója pedig nem kötelezően véges. Az

Page 34: Newton törvényeitől a Higgs-bozonig

euklideszi terek valós és véges dimenziós Hilbert-terek, a kvantummechanika Hilbert-tere viszont komplex és végtelen dimenziós.

E két általánosítástól eltekintve a Hilbert tér ugyanaz, mint az euklideszi: egy lineáris tér (vektortér), amelyen adva van a skalárszorzat, ami egy nemdegenerált, pozitív definit, szimmetrikus, bilineáris forma. A szimmetrikusság a komplex esetben nem szó szerint értendő, hanem konjugált-szimmetrikusságnak: a változók felcserélésével a skalárszorzat értéke a komplex konjugáltjára változik. Egy vektor önmagával vett skalárszorzatát a vektor normájának, vagy hosszának nevezik. A skalárszorzat megadása tehát egyúttal egy norma megadását is jelenti. Ez a norma teljesíti az alábbi összefüggéseket:

1. A 0 vektor normája 0.2. Minden más vektor normája egy pozitív valós szám.3. Egy vektor skalárszorosának a hossza egyenlő a skalár abszolútértéke szorozva a

vektor hosszával.4. Két vektor összegének a hossza nem nagyobb, mint a vektorok hosszának az összege

(háromszögegyenlőtlenség)5. A vektortér erre a normára nézve teljes tér, vagyis benne minden Cauchy-sorozat

konvergens.

És persze minden Hilbert-térben, speciálisan az euklideszi térben is érvényes az a bizonyos paralelogramma azonosság, amiről beszélünk:

|a+b|2 + |a-b|2 = 2|a|2 + 2|b|2.

Ez az egyenlőség a skalárszorzat tulajdonságainak egyszerű következménye.

Azokat a tereket, amelyekben a fenti 1-5. tulajdonsággal rendelkező norma van definiálva, Banach-tereknek nevezik. Mint mondtuk, ha a norma skalárszorzattal van definiálva, akkor ezek mindenképpen teljesülnek, és teljesül a paralelogramma azonosság is. Lehet azonban Banach-teret megadni skalárszorzat nélkül is. És persze, ha van norma, akkor van értelme a valós esetben a g(a,b) = (1/2)(|a+b|2 - |a|2 – |b|2 ), a komplexben pedig a g(a,b)=(1/2)(|a+b|2 – |a|2 – |b|2)+(i/2)(|a+ib|2 – |a|2 – |b|2) kétváltozós függvénynek is. A valós illetve komplex Hilbert terekben g(a,b) épp az <a|b> skalárszorzattal egyezik meg, az olyan Banach-terek esetén azonban, amelyekben a norma nem skalárszorzatból származik, már nem biztos, hogy ez egy bilineáris forma lesz. Például, ha egy vektor normáját tetszőleges p≥1 számot véve az (|x1|p+|x2|pp+…+|xn|p)1/p képlettel definiáljuk, a p=2 esetet kivéve olyan normához jutunk, amire a fenti g(a,b) függvény nem lineáris. Tehát minden Hilbert-tér Banach-tér, de nem minden Banach-tér Hilbert-tér.

Mivel Hilber-terekben érvényes a paralelogramma azonosság, annak, hogy egy Banach tér Hilbert-tér legyen szükséges feltétele a paralelogramma azonosság teljesülése. Neumann és Jordan az említett cikkében azt bizonyítja be, hogy ez a feltétel elégséges is, vagyis minden olyan Banach-tér, amelyben teljesül a paralelogramma azonosság egyben Hilbert-tér is, tehát ekkor a fenti g(a,b) függvény egy nemdegenerált, szimmetrikus, pozitív definit bilineáris forma lesz. Ez a megállapítás speciális esetként magában foglalja azt is, hogy egy valós, véges dimenziós normált vektortér pontosan akkor euklidesz tér, ha teljesül benne a paralelogramma azonosság.

Page 35: Newton törvényeitől a Higgs-bozonig

*P. Jordan and J. V. Neumann (1929),”On Inner Products in Linear, Metric Spaces” The Annals of Mathematics, Second Series, Vol. 36, No. 3 (Jul., 1935), pp. 719-723

(sajnos nem tudok arról, hogy ez a cikk valahol fent lenne ingyenesen a neten – pedig a magyar törvények szerint már nem védi copyright – , de találtam a tételnek egy ingyenesen hozzáférhető, magyar nyelven írt bizonyítását : http://numanal.inf.elte.hu/~simon/PARALL.pdf)

**von Neumann, John (1929), “Allgemeine Eigenwerttheorie Hermitescher Funktionaloperatoren”, Mathematische Annalen 102: 49–131.

25. A távolság, mint konnexió

Nem üveggolyó, hanem konnexió. És igazából nem is távolság, hanem norma. Ugyanaz, amelyikről az előző bejegyzésben volt szó. Sőt tulajdonképpen nem is a normáról szeretnék beszélni, hanem a területről. Vagyis arról, hogy terület-fogalom van távolságfoglom nélkül is. És mégcsak nem is ez a terület legérdekesebb tulajdonsága. Neumann János például bebizonyította, hogy egy egységnégyzetet lehet felszabdalni, és a részeit területtartó (!) transzformációval átrendezni úgy, hogy az eredmény két darab egységnégyzet legyen. Ez komoly, akárki ellenőrizheti, amit mondok, itt. A dolognak csak a neve paradoxon, valójában ez egy matematikai tétel, de annyira ellentmond a hétköznapi intuíciónknak, hogy pradoxonnak nevezték el. Megvan ugyanez három dimenzióban is, azt úgy hívják, hogy Banach-Tarski paradoxon (na, ez hálistennek magyarul is megvan), és az is matematikai tétel és nem paradoxon. A fizikusoknak is vannak paradoxonnak nevezett tételeik, például a hidrodinamikai paradoxon nevű, amit mindenki tanul középiskolában.

De most nem erről akarok beszélni. Van mondjuk egy ember, aki a földjét el akarja cserélni egy ugyanakkora területű másik földre. A földje parallelogramma alakú, és a másik darab föld is az. Pechére a területek csak egy 2-dimenziós vektortérben vannak, amelyen se norma, se skalárszorzat nincs definiálva. Ez abban nyilvánul meg, hogy az emberünknek nincs se mérőszalagja, se szögmérője. Vannak viszont jól kiképzett földmérő munkások, akiket arra képeztek ki, hogy mindig pontosan egyformákat lépjenek adott irányban (akár előre, akár hátra). Minden munkásnak megvan a saját iránya, amerre léphet, de két különböző irányban lépkedő munkás lépéshosszát nem tudjuk összehasonlítani, csak az azonos irányban lépkedőkét. Bezzeg, ha lenne egy konnexiónk! Mármint azon a fibrált nyalábon, amelynek a teljes tere az origótól megfosztott sík, a bázistere a kör, fibrumai az origóból kiinduló nyílt félegyenesek, a projekciót pedig a félegyeneseknek egy az origót megkerülő téglalapvonallal való metszéspontja definiálja (a téglalap a körrel homeomorf, tehát topológiai értelemben kör). A fibrumok 1-dimenziós alterek részhalmazai (1-dimenziós kúpok), és normáltnak tekinthetők, hiszen két vektor bennük mindig valamilyen pozitív skalárszorosa egymásnak, és ezt a skalárt nevezhetjük a vektorok hossz-arányának (vagyis igazából nem hossz, hanem hossz-arányok vannak, de nekünk a területméréshez is elég, ha területarányokat tudunk, a terület konkrét értéke nem érdekel minket). Egy konnexió definiálná a fibrumokat átszelő "vízszintes" görbéket, jelen esetben a köröket, amivel egyből normált térré válna a síkunk, és ha ráadásul még ez a norma olyanra sikeredne, hogy teljesíti az előző bejegyzésben leírt paralelogramma azonosságot, akkor a síkunk mindjárt euklideszi tér lenne, skalárszorzattal, szöggel, szinusszal, koszinusszal, merőlegességgel. Így persze nem lenne kunszt területet sem mérni.

Page 36: Newton törvényeitől a Higgs-bozonig

Az érdekes az, hogy a területarányok egy vektortérben akkor is egyértelműen adva vannak, ha nincs se merőlegességünk, se koszinuszunk, se szinuszunk, se szögünk, se skalárszorzatunk, de még egy árva normánk sem, nemhogy paralelogramma-azonosságunk! A terület egyszerűen egy Haar-mérték, vagyis egy olyan függvény, amely a sík kompakt halmazaihoz, illetve az e halmazok által generált szigma-algebra elemeihez egy nemnegatív számot rendel hozzá úgy, hogy egyrészt mérték legyen (vagyis szigma-additív, és az üres halmazon eltűnő), másrészt az úgynevezett regularitási feltételeknek eleget tegyen. Ezek elég természetes feltételek, azt kötik ki, minden halmaz területe a kompakt részhalmazai területének a szuprémuma, az őt tartalmazó nyílt halmazokénak pedig az infimuma legyen. A poén az, hogy ha ettől a mértéktől mindössze annyit követelünk még meg, hogy az eltolás ne változtassa meg egy halmaz mértékét, akkor ez a mérték egy konstans szorzó erejéig egyértelmű! Vagyis a földdarabok területarányát a terület fenti fogalma és az eltolással szembeni invarianciája egyértelműen meghatározza, tehát nem függ attól, hogy definiálunk-e, vagy ha igen, milyen konnexiót definiálunk a lépegető földmérők között! Elég, ha mindegyik lépeget a saját irányába, a többi földmérőétől független lépéshosszal! Lépegetésekkel megállapítják, hogy a cserére kiszemelt földdarab oldalai a meglévő földdarab i és j oldalvektoraival a = a1i + a2j és b = b1i + b2j alakban fejezhetők ki. Ekkor az új terület a meglévőnek |a1b2 – a2b1|-szerese. Miért is? Mert ha az i és j oldalú parallelogramma területét 1-nek vesszük, akkor az előző összefüggéssel egy eltolásinvariáns Haar-mértéket definiáltunk a vektorterünkön (mint topologikus csoporton), tehát az így számolt területarányt ugyanannyinak fogja mérni egy tetszőleges c és d oldalú paralelogramma alakú földdarab birtokosa is, hiszen hasonló módon ő is egy eltolásinvariáns Haar-mértéket definiál, e két mérték tehát konstansszorosa egymásnak. Aki nem hiszi, számoljon utána!

26. Párhuzamosíthatóság és görbületmentesség

A párhuzamosság fogalmával eddig két különböző értelemben találkoztunk. Az egyik a párhuzamosítható sokaságok, a másik pedig a párhuzamos eltolás (parallel transzport) fogalma volt. Az előbbi tisztán topológiai fogalom, az utóbbit pedig fibrált nyalábokon megadott konnexió definiálja. Azért valami közük van egymáshoz.

Az első fogalom: egy n-dimenziós differenciálható sokaságot akkor nevezünk párhuzamosíthatónak, ha megadható rajta n darab folytonos X1(p),…Xn(p) vektormező úgy, hogy az X1(p),…Xn(p) vektorok minden p pontban lineárisan függetlenek (vagyis a p pont feletti érintőtér bázisát alkotják). Egy ilyen vektormező-rendszer a sokaság frame-nyalábjának egy szelése. Világos, hogy ez a sokaság egészét jellemző, globális tulajdonság, hiszen lokálisan, vagyis a sokaság atlaszából vett bármelyik térképen megadható ilyen vektormező-rendszer: ∂/∂x1,…., ∂/∂xn.

A második fogalom az érintőnyalábok speciális esetében egy érintővektornak egy görbe mentén való párhuzamos eltolása, ami a görbének az érintőnyalábba való horizontális felemelésével azonos. Ennek a felemelésnek a horizontális voltát nem határozza meg a sokaság, hanem mi mondhatjuk meg, hogy egy érintőnyalábban haladó görbe érintője mikor tekintendő horizontálisnak. Ezt a megmondást nevezzük az érintőnyalábon megadott konnexiónak. A konnexiót akkor nevezzük görbületmentesnek, ha az alapsokaság tetszőleges egyszeresen összefüggő tartományában haladó tetszőleges zárt görbe horizontális felemelése is zárt görbe. Vagyis, ha egy vektor egy görbe mentén p pontból q pontba való a párhuzamos eltolásának az eredménye nem függ a görbétől, ha a görbe a sokaságnak egy egyszeresen összefüggő tartományában halad.

Page 37: Newton törvényeitől a Higgs-bozonig

Egy görbületmentes lineáris konnexió megadása egy egyszeresen összefüggő sokaság érintőnyalábján a sokaság párhuzamosítását jelenti. Ez esetben ugyanis két különböző pont feletti érintővektor párhuzamossága egyértelműen definiálható, az érintőnyalábnak egy adott vektorral párhuzamos vektorai pedig folytonos vektormezőt alkotnak. Másrészt, egy lineáris konnexió által meghatározott párhuzamos eltolás a vektorok lineáris függetlenségét megőrzi, így a párhuzamosíthatóság által megkívánt vektormezők egy kiszemelt pont feletti érintőtér valamely bázisvektorainak a sokaság minden pontjába való párhuzamos eltoltjai lehetnek.

De többszörösen összefüggő sokaság esetén ez már nincs így: gondoljunk a Möbius szalagra, amint egy a középvonalára merőleges érintővektort párhuzamosan egyszer körbetolunk a középvonal mentén. Az eredmény az lesz, hogy a vektor fejjel lefelé fog visszaérkezni a kiinduló pontba, vagyis ebben az esetben a párhuzamos eltolás segítségével nem tudunk folytonos vektormezőt megadni! És persze az is igaz, hogy egy párhuzamosítható sokaságon is lehet azért görbült konnexiót megadni, gondoljunk csak egy félgömbre a rajta természetes módon értelmezett párhuzamos eltolással!

Egy egyszeresen összefüggő sokaság érintőnyalábján megadott görbületmentes konnexió az érintőnyalábot Descartes-szorzattá teszi, hiszen a sokaság különböző pontjai feletti két érintővektort azonosíthatunk egymással, ha egymás párhuzamos eltoltjai.

27. A rátóti legények és a Lie-deriválás

Merthogy nemcsak libát loptak szegények, hanem létrát is vittek az erdőben. Keresztben.

A legények egy folyamot képeznek a felületen, a létra pedig egy vektor, amit a folyam tol előre (ld. pushforward). A legények folyama egy φ : (R x M) → M : (t, p) → φt(p) leképezés. A t = 0 pillanatban a p pontban tartózkodó legény a t pillanatban a φt(p) pontban van. Most képzeljük el, hogy a létra, amit visznek, egy kétágú létra, ami útközben kinyílik. A kinyíló szabad ág (csakúgy, mint a fogott ág) a létra zsanérjából mutat valamerre, vagyis ő a zsanér által leírt görbe minden pontjában egy ottani érintővektor. Legyen Y egy olyan vektormező a felületen, amely ezen a görbén azonos kinyílt ág által meghatározott vektorral. Tegyük fel, hogy a létra éppen zárva van, amikor a zsanér éppen a felület p pontjában tartózkodik. Tartozzék e a pillanat a t = 0 időponthoz. Ettől eltérő t pillanatban a létra szabad ága a φt(p) pont feletti Yφt(p) vektor, a fogott ága pedig a φt*(Yp) vektor, ahol φt* a φt leképezés érintőleképezése (pushforwardja).

A kinyíló ághoz tartozó Y vektormezőnek a legények X sebességmezeje szerinti Lie-deriváltja a létra fogott ága nemzsanéros végéből a kinyíló szabad ág nemzsanéros végébe mutató vektor idő szerinti deriváltja:

LXY = limt→0(1/t)[Yφt(p)- φt*(Yp)],

Sajnos ez a definíció csak görbületmentes felületen jó, ahol a különböző pontok feletti érintővektorok ugyanannak a vektortérnek az elemei.(1) Az általános esetben a Lie-deriváltat egy picit másképp kell definiálnunk azért, hogy az itt leírt deriválandó időfüggő vektor minden t pillanatban a p pont feletti vektortérnek legyen eleme. Azt csináljuk, hogy a fenti összefüggésben mindkét tagot φt* inverzével visszatoljuk a p pontba:

LXY = limt→0(1/t)[φ-1t*(Y φt(p)) - Yp] = (d/dt)|t=0[φ- 1

t*(Yφt(p))]

Page 38: Newton törvényeitől a Higgs-bozonig

Nézzük meg, hogy hat ez a vektor, mint deriváció egy az M sokaságon megadott valós értékű függvényre!

(LXYf)(p) = limt→0(1/t)[(φ-1t*(Y φt(p))f)(p) - Ypf (p)]

A pushforward definíciója szerint

[φ-1t*(Yφt(p))f](p) =[Yφt(p) (φ-1

t*(f )](φt(p)) = [Y(f º φ- 1

t)](φt(p))

Ezzel

(LXYf)(p) = limt→0(1/t)[([Y(f º φ- 1t)](φt(p)) – Yf (p)] (*)

A fenti kéttagú kifejezés második tagja:

Yf(p) = d/ds|s=0(f(ψs(p)) = lims→0(1/s)[f(ψs(p)) - f(p)],

ahol ψ az Y vektormező által meghatározott folyam. Az első tag:

[Y(f º φ- 1t)](φt(p)) = d/ds|s=0((f º φ- 1

t(ψs(φt(p)))

= lims→0(1/s)[f º φ-1t(ψs (φt(p))) - f º φ-1

t(φt(p))]

= lims→0(1/s)[f º φ-1t º ψs º φt (p) - f(p)]

Így tehát

LXYf = limt,s→0(1/st)[ f(φ-1t º ψs º φt(p)) - f(p) - f(ψs(p)) + f(p)]

= limt,s→0(1/st)[ f(φ-1t º ψs º φt(p)) - f(ψs(p))]

Az ábrán szereplő sorszámokkal:

LXYf = limt,s→0(1/st)[f(3) - f(4)],

amit az ábrán a 4 → 3 piros vektor szemléltet.

Igenám, de mi eredetileg az 5 → 2 kék vektorra lettünk volna kíváncsiak, hiszen ez az a vektor, ami a létra fogott szára végéből a szabad szár végébe mutat. Vagyis mi a

limt,s→0(1/st)[f(2) - f(5)] = limt,s→0(1/st)[ f( ψs º φt(p)) - f(φt º ψs(p))]

eredményt szerettük volna kapni, ami könnyen láthatóan a jól ismert [X,Y]f = X(Yf)-Y(Xf) kommutátorral azonos. Elrontottunk volna valamit?

Nem! Bármily hihetetlen is, ez a két kifejezés egyenlő egymással!

Page 39: Newton törvényeitől a Higgs-bozonig

(1) Mivel most lokális fogalmat definiálunk, az esetleges többszörösen összefüggés globális tulajdonságnak itt nincs szerepe, tehát most nyugodtan gondolhatunk parallelizálható sokaságra, amikor görbületmenteset mondunk.

28. Lie-deriválás, kovariáns deriválás, torzió tenzor

Az előző bejegyzésben láttuk, hogy az LXY Lie-deriválás értéke a p pontban egy olyan vektor, ami az X vektormezőnek (vagyis a rátóti legények sebességmezejének) a p ponton áthaladó φp

integrálgörbéje mentén összehasonlítja az Y (a létra szabad ága irányába mutató) vektormezőnek ahhoz az Y’ vektormezőhöz viszonyított változását, ami az Yp vektornak a φ folyammal történő pushforwardjaiból áll (ez a létra fogott ága irányába mutató vektormező). Pusztán az Yp pont és a φp görbe még nem határozzák meg az Y’ vektormezőnek a φp görbén felvett értékeit. A pushforwardhoz szükségünk van az X vektormező értékére a p pont egy teljes környezetében (hiszen ha a létra zsanérját fogó legénynél gyorsabb a mellette jobbra haladó, akkor a létra balra ferdül, ha pedig lassabb, akkor jobbra).

Ha most az Y’ vektormező helyett egy olyan Y” vektormezőt veszünk, ami az Yp pontnak a φ görbe mentén való párhuzamos eltoltjaiból áll, akkor az LXY Lie-derivált helyett a ∇XY kovariáns deriválthoz jutunk. Az Y vektormezőnek az X vektormező mentén vett kovariáns

Page 40: Newton törvényeitől a Higgs-bozonig

deriváltjának p pontbeli (∇X Y)p értéke a Lie-deriválttal szemben nem függ az X vektormezőnek a p ponton kívüli értékeitől, viszont szükség van hozzá a párhuzamos eltolást meghatározó konnexióra. Ez olyasmi, mint ha az előző bejegyzésbeli rátóti legények helyett egyetlen legény vinné a létrát, és valaki (vagy pl. egy iránytű) előírná neki, hogy milyen irányban tartsa a létra fogott ágát menet közben.

Láttuk másrészről azt is, hogy a Lie-deriválás a létra kinyílási sebességén kívül azt méri, hogy két különböző folyam mentén egymás után azonos ideig haladva mennyire különbözik a végső helyzetünk, ha először az egyik, majd a másik folyam mentén haladunk attól, ha ezt fordított sorrendben tesszük. Ez az előző bejegyzés végén szereplő

f( ψs º φt(p)) – f(φt º ψs(p))

képlet jelentése t = s esetén. A Lie-derivált ennek a különbségnek és t2-nek határértéke a t → 0 esetben:

(LXY)f = limt→0(1/t2)[ f( ψt º φt(p)) - f(φt º ψt(p))]

ami persze azonos az általunk eredetileg felírt

limt,s→0(1/st)[ f( ψs º φt(p)) - f(φt º ψs(p))]

határértékkel, ha ez utóbbi létezik.

Az LXY (= [X, Y]) Lie-deriváltat az ábrán az 5 → 2 kék vektor, az

Page 41: Newton törvényeitől a Higgs-bozonig

(∇X Y)f = limt,s→0(1/st)[ f( ψs º φt(p)) - f(expφt(p)(sY''φt(p))]

kovariáns deriváltat a 6 → 2, az

(∇Y X)f = limt,s→0(1/st)[ f(φt º ψs(p)) - f(expψs(p)(tX''ψs(p)))]

kovariáns deriváltat pedig a 7 → 5 sötétzöld vektorok szemléltetik.

Az ábrán szereplő 6 → 7 (barna) vektor azt a különbséget szemlélteti, ami a p pontból kiinduló X, majd Y irányú geodetikusok mentén t illetve s ideig való, illetve a fordított sorrendű haladás eredményének a különbsége. Az X illetve az Y irány a p-től különböző pontokban úgy értendő, hogy ezek az Xp illetve az Yp vektornak a görbe mentén való párhuzamos eltoltjai (és nem az X és az Y vektormező ottani értéke!). Tehát az X és Y vektormezőnek a p pontbeli Xp és Yp értékeiből a konnexió már meghatározza ennek a különbségnek a határértékét. És persze a határértéket az sem befolyásolja, ha X és Y érintőjű geodetikus helyett egyéb X ill. Y irányú görbét veszünk (mint ahogy jelen esetben is φt (p)-t ill. ψs(p)-t használtunk p-ből induló szakaszokként).

A 6 → 7 vektor a fentiek alapján és az ábráról leolvashatóan a

(Xp, Yp) → (∇X Y)p – (∇Y X)p – [X, Y]p

hozzárendelést jelenti. Ez a hozzárendelés lineáris, tehát egy (1,2)-típusú tenzormező. A neve: a konnexió torzió tenzora.

29. A távolság, mint különbség

Az euklideszi terekben a távolság különbségből származtatható: a p és q pont távolsága

d(p, q) = |p – q|

,ahol p – q egy vektor, és | ennek a vektornak az euklideszi normáját jelöli. A Riemann-terekben azonban a vektorok nem pontok különbségei, hanem az érintőnyaláb elemei, és különböző pontok felett különböző vektorterekhez tartoznak. Távolságfogalom azonban a Riemann-terekben is van, nevezetesen a p és q pontokat összekötő görbék hosszainak az infimuma:

d(p, q) = inf{len(c) | c: [0,1] → M. c(0) = p, c(1) = q } (1)

Az itt szereplő ívhossz:

len(c) = ∫[0,1] |c.c(t)| dt, (2)

ahol c.c(t) a c görbe c(t) pontbeli érintővektora, |c.

c(t)| = [gc(t)(c.c(t),c.

c(t))]1/2 és g a metrikus alaptenzor. Egyszerűen belátható, hogy az így definiált hossz csak a c görbe értékkészletétől függ, a görbe konkrét t → c(t) paraméterezésétől nem. Tehát a c görbe paraméterezése olyasvalami, mint egy kémia reakcióban egy katalizátor: a definícióban ugyan szerepel, azonban a definiálandó fogalom mégsem függ tőle.

Page 42: Newton törvényeitől a Higgs-bozonig

És lehet ezt is katalizátormentesen is csinálni!1

Az elv ugyanaz, amit általában alkalmaznak a sokaságok esetén: a hiányzó fogalmat a sokaságon értelmezett függvények segítségével definiáljuk. Az alapgondolat a következő.

f(q) – f(p) = ∫[0,1] (d/dt)[f(c(t)]dt

= ∫[0,1] c.c(t)(f) dt

= ∫[0,1] df(c.c(t)) dt

= ∫[0,1] gc(t)(gradf|c(t) , c.c(t)) dt (3)

Ezért

|f(q) – f(p)|≤ ∫[0,1] |gradf|c(t)| |c.c(t)| dt

≤ |gradf|∞ ∫[0,1] |c.c(t)| dt = |gradf|∞ len(c)

, ahol |gradf|∞ = sup{|gradf|p| : p ∈ M}.

Mivel ez tetszőleges p-n és q-n átmenő görbére érvényes ezért (1)-re való tekintettel

|f(q) – f(q)| ≤ |gradf|∞ d(p, q) (4)

Természetesen ennek az egésznek csak akkor van értelme, ha az itt szereplő f függvény majdnem mindenütt korlátos gradienssel rendelkezik. Mivel a kapott összefüggésünk minden ilyen függvényre fennáll, ezért

sup{|f(p) – f(q)| : f ∈ C(M), |gradf|∞ ≤ 1} ≤ d(p, q)

ahol C(M) az M-en majdnem mindenütt deriválható függvények halmaza. Alább megmutatjuk, hogy van ezek között olyan f függvény is, amelyre

|f(p) – f(q)| = d(p, q) (5)

, tehát a kapott összefüggésük jobb és baloldala közti ≤ helyett = jelet írhatunk:

sup{|f(p) – f(q)| : f ∈ C(M), |gradf|∞ ≤ 1} = d(p, q) (6)

Az ígért f függvényünk legyen

fp(q) := d(p, q).

Page 43: Newton törvényeitől a Higgs-bozonig

Erre a függvényre (5) szemmel láthatóan teljesül, azt kell tehát róla belátnunk, hogy majdnem mindenüt deriválható és |gradfq|∞ ≤ 1. A háromszög-egyenlőtlenség miatt |fq(p) – fq(r)| ≤ d(p, r), tehát fq Lipschitz-féle legfeljebb 1 Lipschitz konstanssal. Ez azt jelenti, hogy majdnem mindenütt deriválható. Mint látni fogjuk, a |gradfq|∞ ≤ 1 egyenlőtlenség |gradfq|∞ = 1 alakban áll fenn. Ennek az igazolásához szükségünk van az alábbi lemmára.

Lemma.

Legyen fp(q) := d(p, q), ahol d(p, q) a távolságfüggvény. Ekkor tetszőleges p-n átmenő ívhossz-paraméterezésű c geodetikus görbére c.

c(t) = gradfp|c(t)

(bizonyítás)

A |gradfp|∞ = 1 egyenlőség a lemma segítségével az alábbi módon látható be. Alkalmazzuk a (3) összeföggésünket az fp függvényre és egy a p ponton átmenő, ívhossz paraméterezésű c(t) geodetikus görbére. Ekkor

fp(q) – fp(p) = s = ∫[0,s] gc(t)(gradfp|c(t) , c.c(t)) dt

Ezt az összefüggést s szerint deriválva:

gc(t)(gradfpc(t) , c.c(t)) = 1

A lemmánk szerint tehát

gc(t)(gradfp|c(t) , gradfp|c(t) )= 1,

vagyis valóban |gradfp|∞ = 1.

Beláttuk tehát, hogy ha egy Riemann-téren a távolság az (1) és (2) összefüggésekkel van definiálva, akkor a (6) összefüggés mindig érvényes. A távolság tehát (1) és (2) helyett közvetlenül az (6) összefüggéssel, vagyis függvényértékek különbségével is definiálható. Így a távolság definíciójához nincs is szükség semmiféle görbére! Éppen fordítva: a görbe ívhossza az, ami ennek segítségével definiálható, mégpedig a szokásos módon: a görbét közelítő poligonok egymást követő pontjai közti távolságok összegének határértékeként, midőn a maximális szomszédpont-távolság 0-hoz tart. Ezzel a görbe ívhosszának a definíciójából is elimináltuk a csak "katalizátorként" szereplő paraméterezést (legalábbis abban az esetben, amikor a görbénk értékkészlete egy 1-dimenziós részsokaság, tehát a görbe nem önátmetsző, sem önmagába visszetérő, tehát az egyértelmű az, hogy mik az "egymást követő pontok").

30. Differenciálformák integrálása

A differenciálforma (más néven k-forma) egy differenciálható sokság minden pontjában az ottani érintőtéren értelmezett antiszimmetrikus multilineáris forma. Vagyis minden érintőtéren egy olyan függvény, ami k darab érintővektorhoz egy valós számot rendel úgy, hogy ha a

Page 44: Newton törvényeitől a Higgs-bozonig

vektorok közül bármelyik kettőt felcseréljük, akkor az ehhez a vektor k-shoz hozzárendelt szám a negatívjára változik:

ω(v1, v2, … vi,…vj,…,vk) = -ω(v1, v2, … vj,…,vi…,vk).

A differenciálforma tehát k darab X1, X2, … ,Xk vektormezőhöz egy a sokaságunkon értelmezett p → ω(X1(p), X2(p), … ,Xk(p)) valós függvényt rendel. A differenciálformától megköveteljük még azt is, hogy ha a k darab vektormező mindegyike sima, akkor ez a függvény is sima legyen (egy vektormezőt pedig akkor nevezünk simának, ha a sokaságon értelmezett sima függvényekhez sima függvényt rendel. Egy függvényt pedig akkor nevezünk simának, ha bármely térképpel vett kompozíciója végtelen sokszor deriválható)

Differenciálforma például a

dx1 ∧ dx2 : (ξ, η) → dx(ξ)dy(η) – dx(η)dx(ξ) = ξxηy- ηx ξy

2-forma.

Ilyen kifejezéssel legutóbb a Haar-mértékről szóló bejegyzés végén találkoztunk. A dx1∧dx2

differenciálforma abszolútértéke egy-egy Haar-mértéket definiál egy 2-dimenziós sokaság minden pontja feletti érintőtéren. A Haar-mérték, mint már említettük egy eltolás-invariáns mérték. Eltolás alatt tetszőleges lokálisan kompakt topologikus csoport csoportműveletét érthetjük, az ilyen csoportokon van értelme a Haar-mértéknek. Speciálisan ez a csoport itt egy vektortér az eltolással, mint csoportművelettel. Viszonylag egyszerűen bizonyítható, hogy a Haar-mérték konstans szorzó erejéig egyértelmű.

Az Rn vektortér esetén van egy kitüntetett Haar-mérték, ami már ezt a konstans szorzóban való bizonytalanságot sem tartalmazza. Ez az ú.n. Lebesgue-mérték, amely az R-en definiált Lebesgue-mértékből alkotott szorzatmérték. R-en a Lebesgue-mérték definíciója a következő. Egy nyílt (a, b) intervallum Lebesgue-mértéke a |b – a| szám, diszjunkt nyílt intervallumok uniójának a mértéke az intervallumok mértékeinek az összege, R egyéb mérhető halmazáé pedig az őt lefedő diszjunkt, nyílt intervallumok mértékeinek az infimuma.1 Mivel a Lebesgue-mérték eltolás-invariáns, egyúttal egy Haar-mérték is (az Rn vektortér többi Haar-mértéke pedig ennek konstansszorosa).

Bár épp azt mondtam, hogy a Lebesgue-mérték kizárólag Rn-en van értelmezve, most mégis azon fogunk mesterkedni, hogy kiterjesszük tetszőleges n-dimenziós differenciálható sokaságra is.2 Először nézzük, hogy lehet Rn helyett tetszőleges n-dimenziós vektortéren definiálni. Nyilván lehet, hiszen minden n-dimenziós vektortér izomorf Rn-nel. Nos, legyen a V vektortér és Rn között ez az izomorfia a φ: V → Rn leképezés. Ekkor V egy H részhalmaza Lebesgue-mértékének tekintsük a μφ(H) = λ(φ(H)) számot, ahol λ az Rn-beli Lebesgue-mérték. Ez a definíció persze függ az φ izomorfia megválasztásától. Ha φ helyett ψ-tválasztunk, akkor a mértékünk μψ(H) = λ(ψ(H)) lesz. A két mérték között a kapcsolat:

μψ(H) = |det(ψ º φ-1)|μφ(H).

Itt det(ψ º φ-1) a ψ º φ-1 nemszinguláris lineáris transzformáció determinánsa. A μφ mértéket az Rn-en adott λ mérték φ általi képének fogjuk nevezni, és általában is, ha adva van az M és M’ sokaság között egy φ: M → M’ diffeomorfizmus, akkor M differenciálható sokaságon adott μ mérték φ általi képének azt a μ’ M’-n adott mértéket nevezzük, amelyre μ’(H’) = μ(φ-1(H’)).

Page 45: Newton törvényeitől a Higgs-bozonig

Ha a fenti konstrukciót általánosítjuk, és φ-től nem követeljük meg, hogy izomorfia legyen, hanem csak azt, hogy diffeomorfizmus, akkor ez a módszer nemcsak vektorterekre, hanem egy tetszőleges n-dimenziós M sokaság bármelyik (U, φ) térképére is alkalmazható: az U-n adott Lebesgue-mértéknek Rn Lebesgue-mértékének a φ-1 leképezés általi képét , vagyis a H → μφ(H) = λ(φ(H)) mértéket nevezzük. Ha az (U, φ) térkép helyett egy (U, ψ) térképet használunk, akkor a μφ és a μψ mérték között a μψ = |Jθ º φ|μφ kapcsolat áll fenn, ahol Jθ a θ = ψ º φ-1 leképezés Jacobi-determinánsa. Jθ º φ egy U-n értelmezett valós értékű függvény. Ahhoz, hogy értelmezni tudjuk a |Jθ º φ|μφ kifejezést, tudnunk kell, hogy mit értsünk egy mérték függvényszeresén. Az M-en adott mértékek ekvivalensek az M-en értelmezett korlátos, folytonos függvényeken értelmezett korlátos lineáris funkcionálokkal. Korlátosnak akkor nevezünk egy L lineáris funkcionált, ha létezik olyan c valós szám, hogy |L(f)|< c · sup(|f|).

Egy μ mérték egy f függvényhez az ∫M f dμ számot rendeli. Adott g M-en értelmezett folytonos valós függvény esetén gμ definíció szerint az a mérték, ami minden f függvényhez a

∫M gf dμ számot rendeli. Egy μ mértéket pozitívnak nevezünk, ha nemnegatív függvényhez nemnegatív számot rendel (a linearitás miatt ez azt is jelenti, hogy nagyobb függvényhez nagyobb számot rendel).

Ennek ismeretében már nem csak egy (U, φ) térképen, hanem az egész M sokaságon meg tudjuk adni a Lebesgue-mérték definícióját: Egy μ pozitív mértéket Lebesgue-mértéknek nevezünk, ha tetszőleges (U, φ) térképén a μ mérték φ általi képe fλ alakú, ahol f egy U-n sehol nem eltűnő sima függvény. Ilyen mérték minden n-dimenziós sokaságon létezik.3

De mi köze ennek a differenciálformákhoz – mármint azon kívül, mit a Haar-mértékkel kapcsolatban láttunk? A következő.

A továbbiakban tegyük fel a sokaságunkról, hugy irányítható, és meg is van adva egy irányítása. Egy (U, φ) térkép a fentiek szerint meghatároz egy μφ Lebesgue-mértéket U-n. Ugyanakkor ez a térkép egy dx1 ∧ dx2 … ∧ dxn differenciálformát is meghatároz U-n. Ha az adott ω n-formához találunk olyan (U, φ) térképet, hogy U-n ω = dx1 ∧ dx2 … ∧ dxn, akkor ω tetszőleges H ⊆ U mérhető halmazon való integráljának vagy μφ(H )-t, vagy -μφ(H )-t nevezzük, aszerint, hogy a dx1 ∧ dx2 … ∧ dxn forma pozitív, vagy negtív irányítású. Belátható, hogy ez a definíció nem függ az (U, φ) térkép konkrét megválasztásától. Szerencsénkre igaz az, hogy tetszőleges sehol sem eltűnő ω n-formához és minden p ponthoz található a p pontot lefedő ilyen (U, φ) térkép4. Tekintve, hogy dx1 ∧ dx2 … ∧ dxn az n-formák terének bázisa minden pont felett, tetszőleges (akár valahol eltűnő) ω n-forma ω = fdx1 ∧ dx2 … ∧ dxn alakban írható. Ez összefüggés módot ad arra, hogy a definíciónkat a sehol sem eltűnő differenciálformákról kiterjeszthessük tetszőleges differenciálformára. Ez az előző definíciónk módosítása úgy, hogy nem olyan térképet keresünk, amellyel ω = dx1 ∧ dx2

… ∧ dxn , hanem tetszőlegeset használhatunk. Ha ez a térkép olyan, amellyel ω = fdx1 ∧ dx2

… ∧ dxn és dx1 ∧ dx2 … ∧ dxn pozitív irányítású, akkor az n-formánk integrálja a H halmazon definíció szerint az fμφ(H ) szám. Ez a definíció ugyancsak egyértelmű, vagyis szintén nem függ az (U, φ) térkép megválasztásától.5

1 Az itteni definíció az ú.n. külső Lebesgue-mértéket definiálja, ami Lebesgue-mérhető halmazok esetén azonos a Lebesgue-mértékkel. R egy H részhalmazát akkor mondjuk Lebesgue-mérhetőnek, ha egyrészt korlátos, vagyis lefedhető egyetlen T nyílt intervallummal, másrészt az itt definiált külső mértéke megegyezik a belső mértékével. A H halmaz belső

Page 46: Newton törvényeitől a Higgs-bozonig

mértékét először azokban a speciális esetekben definiáljuk, amikor H nyílt, illetve ha zárt. Nyílt halmaz belső mertéke definíció szerint a külső mértékével egyenlő (tehát a korlátos nyílt halmazok definíció szerint Lebesgue-mérhetők). A T nyílt intervallumba írt zárt H halmaz belső Lebesgue-mértéke pedig definíció szerint T mértékének és a T \ H nyílt halmaz mértékének a különbsége. Tetszőleges korlátos H halmaz belső mértékét most már definiálni tudjuk: a H halmaz zárt részhalmazai belső Lebesgue-mértékeinek a szuprémuma.

2 Mivel ezt előttünk már más is megtette, tulajdonképpen nem igaz, hogy a Lebesgue-mérték kizárólag Rn-en van értelmezve, de mi most mégis úgy teszünk, mintha ez így lenne.

3 ld. J. Dieudonné: Treatise on Analysis vol. III., 163. old.

4 ld. J Moser On The Volume Elements On a Manifold, Trans. Amer. Math. Soc. 120 (1965), pp. 286–294. Ezúton mondok köszönetet Gergo73-nak a cikk megtalálásáért valamint a téma felderítésében nyújtott segítségéért és kritikai észrevételeiért.

5 ld. J. Dieudonné: Treatise on Analysis vol III. 170-172. old.

31. Miért nincsenek mágneses töltések?

Vannak azok, csak rosszul keressük őket. A mágneses töltés fogalma az elektromos és mágneses jelenségek közti analógia alapján született. Ez alapján az analógia alapján logikusan várhatnánk az elektromos töltés mágneses megfelelőjét, de úgy tűnik, hogy a természet nem igazodik a mi logikánkhoz, és önfejűen szigorúan 0-ra állítja a mágneses töltések mennyiségét, bárhol, bármikor.

Ám felmerülhet az is, hogy esetleg mégsem a természet akar froclizni minket, hanem a szokásos analógia a mágneses és elektromos mennyiségek között kicsit szerencsétlen. A szokásos analógia az, hogy a

div D = ρ

Gauss-törvény párjának a

div B = 0

egyenletet feleltetjük meg. Ha D elektromos eltolás vektornak a B mágneses indukció vektor a párja, akkor a ρ elektromos töltéssűrűségnek a 0 mágneses töltéssűrűséget kell megfeleltetnünk, ezért mondjuk, hogy nincs mágneses töltés.

Most egy olyan megfeleltetést mutatok az elektromos és mágneses mennyiségek között, amelyben nincs ilyen lyuk, tehát fel sem merülhet, hogy kéne lennie valamiféle mágneses töltésnek. Ilyen értelemben ez a fajta analógia jobban illeszkedik a természet logikájához. Ezt a szokásos vektorfelfogással szemben a modern differenciálformás felfogásban* fogom megmutatni, mert az sokkal áttekinthetőbb (és persze blogunk stílusához is ez illik jobban).

Ebben a felfogásban a ρ elektromos töltéssűrűség egy 3-forma. Mivel a ρ 3-forma dρ külső deriváltja egy 4-forma, ami a 3-dimenziós terünkben azonosan 0, ezért ρ zárt: dρ = 0. Poincaré lemmája szerint egy pontrahúzható tartományon értelmezett zárt formák egzaktak, vagyis van

Page 47: Newton törvényeitől a Higgs-bozonig

olyan eggyel alacsonyabb fokú forma, amelynek ő a külső deriváltja. A ρ 3-forma esetében ez az elektromos eltolás D 2-formája:

ρ = dD

(a szokásos vektoros jelölésekkel ez a ρ = div D egyenlet.)

A B mágneses indukció 2-formát ebben az egyenletben most ne a 2-forma D-vel, hanem a 3-forma ρ-val állítsuk párhuzamba! (Máris megvan az elektromos töltéssűrűség mágneses megfelelője, csak épp az 1-gyel kisebb dimenziójú) A – szokásos felfogásban a mágneses töltések létét kizáró - dB = 0 egyenlet (vektoros írásmódban: div B = 0) a B 2-forma zártságát jelenti. Tehát ismét a Poincaré-lemma szerint van olyan 1-forma, amelynek B a külső deriváltja. Ez pedig nem más, mint a vektorpotenciál:

B = dA

(vektoros felfogásban: B = rot A). A D elektromos eltolás 2-formának tehát mi a vektorpotenciál 1-formát feleltetjük meg.

A folytatás az, hogy a j elektromos áramsűrűség 2-forma analógja az E elektromos térerősség 1-forma lesz. A

dj + ∂tρ = 0

kontinuitási egyenletnek ekkor a

dE + ∂tB = 0

Maxwell- egyenlet, vagyis a Faraday-féle indukciós törvény felel meg.

Ezekben az egyenletekben a már felírt ρ = dD, illetve B = dA helyettesítést elvégezve a

d(j + ∂tD) = 0

illetve a

d(E + ∂tA) = 0

egyenletekhez jutunk, amik a j + ∂tD 2-forma, illetve a E + ∂tA 1-forma zártságát jelentik. Poincaré lemmája most a H mágneses térerősség 1-forma, illetve a Φ skalárpotenciál 0-forma létezését biztosítja:

j + ∂tD = dH

(ez az Ampére-féle gerjesztési törvény)

illetve

E + ∂tA = dΦ.

Ezzel az analógia teljes.

Page 48: Newton törvényeitől a Higgs-bozonig

Az alábbiakban táblázatosan összefoglalom a most vázolt új analógiát és azt a hagyományos analógiát, amely alapján felmerülhetett a (valóságban nem létező) mágneses töltés fogalma.

új

töltés / mágneses indukció ρ B

elektomos eltolás / vektorpotenciál D A

áramsürüség / elektromos térerösség j E

mágneses térerösség / skalárpotenciál H Φ

ρ maximális fokú/ nincs mágneses töltés dρ = 0 dB=0

Gauss-tétel / Helmholz-tétel I. ρ = dD B=dA

kontinuitási egyenlet / Faraday-féle indukciós törvény dj+∂tρ = 0 dE+∂tB=0

Ampére-féle gerjesztési törvény /Helmholz-tétel II. j+∂tD=dH E+∂tA=dΦ

hagyományos

töltés / - ρ -

elektomos eltolás / mágneses indukció D B

elektomos térerösség / mágneses térerösség E H

áramsürüség / - j -

- / skalárpotenciál - Φ

- / vektorpotenciál - A

Gauss-tétel /nincs mágneses töltés ρ = dD 0=dB

- / Helmholz-tétel I. - B=dA

kontinuitási egyenlet / - dj+∂tρ = 0 -

Ampére-féle gerjesztési törvény/ Faraday-féle indukciós törvény j+∂tD=dH dE+∂tB=0

- /Helmholz-tétel II. - E+∂tA=dΦ

Azon kívül, hogy az új analógia a hagyományossal ellentétben hézagmentes, a következőket érdemes észrevenni:

• a 8 mennyiség között a hagyományos táblázatban nem 8, hanem csak 7 összefüggés van, mert a dρ = 0 egyenlőséget a fizikusok nem szokták leírni (szemben a dB = 0 Maxwell-egyenlettel).

• Az E elektromos térerősség az elektromos mennyiségek oszlopából a mágnesesekébe, míg a H mágneses térerősség a mágneses mennyiségek közül az elektromosak közé került (ezek a hagyományos elnevezések a fenti újfajta logikával szerencsétlen módon ütköznek)

32. A szimplektikus teve

Page 49: Newton törvényeitől a Higgs-bozonig

A Nature 1987. szeptember 3-i számában megjelent Ian Stewart egy cikke “The symplectic camel” címmel. A szimplektikus tevét nem ő találta ki, hanem Mihail Leonyidovics Gromov, mintegy két évvel azelőtt. Ian Stewartnak van egy matematikát népszerűsítő könyve magyarul is, abban nem szerepel a szimplektikus teve. Attól még nagyon jó könyv.

Matolcsi Tamás matematikai fizika jegyzetében már 1979-ben a szimplektikus sokaságokra építi a klasszikus mechanikát. A téma akkor még meglehetősen új volt. A szimplektikus topológia Ian Stewart szerint abban az időben még gúny tárgya volt egyes matematikus körökben, és nem a köztiszteletnek örvendő szimplektikus teve szimbolizálta, hanem a haszontalanság csimborasszójaként számon tartott szárított elefánt. A szárított elefántot Mark Kac találta ki. A Chimborazo egy jó magas hegycsúcs Ecudorban, Quitotól délre. Mark Kac Erdős-száma 1, Gromové 3, Ian Stewartét és Matolcsiét nem tudom. Ez nem jelenti azt, hogy Kacnak van igaza.

Ian Stewart ékes szavakkal ecseteli, hogy a szimplektikus topológia (vagy szimplektikus geometria) mennyire természetes leírását adja egy csomó dolognak, többek között a newtoni, pontosabban szólva hamiltoni klasszikus mechanikának. Matolcsi is pontosan erre használja. Érdemes elolvasni.

Matolcsi tárgyalásának közvetlen történelmi és szellemi előzménye Jean-Marie Souriau Structure of Dynamical Systems című könyve volt, de én azt a könyvet nem nagyon tudtam megérteni a benne szereplő sok szép trombita ellenére sem. Sőt annak dacára sem, hogy az eredeti francia nyelvű kiadás után – mivel azt nem értettem – beszereztem az angol nyelvűt is.

Állítólag a szimplektikus topológia a helyes megnevezés, és nem a szimplektikus geometria, mivel egy szimplektikus sokaságoknak nincsenek lokális invariánsai. A lokális invariáns olyasmi, mint a görbület, vagy a torzió. Az, hogy szimplektikus sokaságokon nincs ilyen, az Darboux egy tétele. Darbouxnak ez a tétele azt mondja, hogy az azonos dimenziójú szimplektikus sokaságok lokálisan szimplektomorfak egymással. Ez hasonló jellegű állítás, mint az, hogy a Riemann-terek lokálisan izometrikusan egymásra képezhetők, csak ez utóbbi állítás nem igaz. Egy gömb egy darabja nem képezhető le nyújtás nélkül a sík egy darabjára, mivel más a görbülete.

Ian Stewart felvillantja azt az érdekes nézőpontot is, amikor a szimplektikus formát (ami egy nemdegenerált antiszimmetrikus bilineáris forma) a skalárszorzat egy variánsának tekintjük. Ebben a felfogásban egy szimplektikus vektortér olyan, hogy minden vektor hossza 0 és merőleges saját magára. (Ez végülis nem is olyan nagyon furcsa, hiszen a Minkowski-tér fényszerű vektorai is ilyen tulajdonságúak.) De ez csak egy lehetséges nézőpont, valójában a szimplektikus formáknak inkább a térfogathoz van közük. Azért még majd erre a nézőpontra is visszatérünk, de most már ideje lenne tudnunk, miről is beszélünk valójában.

Page 50: Newton törvényeitől a Higgs-bozonig

Mint már volt szó róla, egy n-dimenziós vektortérben n darab vektor által kifeszítet paralelepipedon térfogatát egy nem azonosan nulla, antiszimmetrikus n-lineáris forma definiálja: V(a1,… ,an) = |ω(a1,… ,an,)|, ahol ω egy nem azonosan nulla, antiszimmetrikus n-lineáris forma. Ez egyúttal egy Haar-mérték is, mivel eltolásinvariáns.

Hasonlóképpen, egy n-dimenziós irányítható sokaság térfogatán egy rajta értelmezett pozitív n-forma integrálját értjük (az, hogy pozitív, azt jelenti, hogy az irányítást definiáló n-formának pozitív számszorosa). Mivel az eltolás művelete differenciálható sokaságokon általában nincs definiálva, arról nincs szó, hogy ez Haar-mérték lenne. Ez egy Lebesgue-mérték.

Multilineáris formákkal egy általános-, vagy középiskolai diák nemigen találkozik, a terület és térfogat fogalmával ellenben igen. Az iskolában úgy tanultuk, hogy a paralelogramma területe: alapszor magasság. Ez első ránézésre nem antiszimmetrikus, hanem szimmetrikus formával van kapcsolatban: az “alap” az alap hosszát jelenti, a “magasság” a magasságét, ráadásul a magasság merőleges az alapra. A hossz és merőlegesség viszont skalárszorzattal van definiálva: |a|2 = g(a, a), az a merőleges b-re pedig azt jelenti, hogy g(a, b) = 0. Itt g egy nemelfajuló, szimmetrikus bilineáris forma. A paralelepipedon térfogata pedig alapterületszer magasság, ahol az alapterület számítását épp most mondtuk el, a “magasság” pedig az alaplap síkjára merőleges vektor hosszát jelenti. Itt is hossz, és merőlegesség, vagyis ugyanaz g nemelfajuló, szimmetrikus bilineáris forma szerepel.

Most akkor szimmetrikusra, vagy antiszimmetrikusra van szükségünk? Nézzük meg jobban azt a paralelogrammát!

Feszítse ki a paralelogrammánkat az a és b vektor. A paralelogramma területe

T = |a|·|b|·sinα,

ahol α az a és b vektorok által bezárt kisebbik szög (α < π). Ez valójában nem más, mint az a vektor 90 fokkal való R(a) elforgatottja és a b vektor skalárszorzatának az abszolútértéke:

T = |g(R(a), b)|

Itt tehát R a 90 fokkal pozitív irányban való elforgatás operátora.

Az, hogy az R operátor elforgatás, azt jelenti, hogy izometria és az origót megtartja. Vagyis a vektorok normáját megtartja, vagyis a skalárszorzatukat is.

Mazur és Ulam 1932-ben bebizonyították, hogy tetszőleges normált vektortér izometriái affin transzformációk. Az affin azt jelenti, hogy egy lineáris transzformációból és egy eltolásból összetehető. A forgatások – lévén, hogy eltolásmentesek - Mazur és Ulam tétele szerint tehát lineáris transzformációk. Az abszolútértékjelben tehát egy bilineáris forma van. Ez a bilineáris forma antiszimmetrikus, vagyis g(R(a), b) = – g(R(b),a). Ez szemléletesen is nyilvánvaló, de formálisan is kijön1.

Az ω(a,b) = g(R(a),b) forma nemelfajuló (hiszen b = R(a)-t véve ω(a,b) csak akkor 0, ha a = 0), tehát egy szimplektikus forma. Két dimenzióban tehát a szimplektikus transzformációk azonosak a területtartó transzformációkkal. Egy kétdimenziós szimplektikus teve azonos a kétdimenziós térfogattartó (azaz területtartó) tevével, és persze át tud menni a tű fokán, hiszen

Page 51: Newton törvényeitől a Higgs-bozonig

tetszőleges vékonnyá tudja magát nyújtani térfogattartó, vagyis területtartó, vagyis szimplektikus módon. Hogy ez nagyobb (tehát legalább 4) dimenzióban is így vajon van-e, nos épp ez az, amit tudni szeretnénk. De miért 4, miért nem 3? Mi van a legérdekesebb 3-dimenzióval? Hát, sajnos azon nem adható meg szimplektikus forma. És különben sem a 3-dmenzió a legérdekesebb, hanem a 6, mivel egy tömegpont klasszikus állapottere (fázistere) 6-dimenziós.

Miért is nem adható meg szimplektikus forma 3-dimenzióban? Hiszen az ω(a,b) = g(R(a),b) formát ott is megadhatjuk! Igen, de 3-dimenzióban az sajnos nem antiszimmetrikus. Vegyünk egy a forgástengely irányába mutató (nemnulla) v vektort, arra R(v) = v, tehát ω(v,v) = g(R(v),v) = g(v,v), ami nem lehet egyenlő -g(v,v)-vel vagyis nem lehet 0, mivel g nemelfajuló.

De ezzel még csak azt láttuk, hogy g(R(a),b) nem jó 3-dimenzióban szimplektikus formának. Talán valami más.

Sajnos nem. Az alábbiakban megmutatom, hogy páratlan dimenziós vektortéren nem lehet szimplektikus formát megadni. Ezt a 2n+1 -dimenziós terekre n szerinti teljes indukcióval teszem.

Bizonyítás.

Az állításunk n=0-ra (vagyis 1-dimenziós vektortérre) nyilvánvalóan igaz, hiszen 1-dimenzióban tetszőleges antiszimmetrikus bilineáris forma azonosan 0, tehát degenerált. Indukciós feltevésként tegyük fel, hogy n-re ( vagyis 2n+1 dimenziós térre) már bizonyítottuk. Tekintsünk egy 2n + 3 dimenziós V vektorteret. Indirekt módon belátjuk, hogy ezen nincs szimplektikus forma. Tegyük fel ugyanis, hogy van. Ekkor tetszőleges e ≠ 0 vektorhoz van olyan f vektor, amellyel ω(e,f) ≠ 0, Jelöljük az e és f vektorok által kifeszített síkot W-vel. Azt állítom, hogy ennek van “ortogonális” komplementer altere, vagyis, hogy a Q = {q ∈ V : ∀w ∈ W ω(q,w) = 0} halmazt véve egyrészt Q ∩ W = {0}, másrészt tetszőleges v vektor felírható egy Q-beli és W-beli vektor összegeként. Ha ugyanis ez így van, akkor Q egy 2n+1-dimenziós altere V-nek, és a V-n adott szimplektikus forma ezen sem lehet elfajuló (hiszen tetszőleges Q-veli nemnulla v-hez van olyan V-beli w’, amelyre ω(v,w’) ≠ 0, következésképpen, ha w’-t egy Q-beli w és egy W-beli w” összegeként áll elő, akkor ω(v,w) ≠ 0 ezzel a Q-beli w-vel), így az indirekt feltevésünk ellentmondásba kerül az indukciós feltevésünkkel.

Lássuk be tehát az állításunkat.

Tegyük fel, hogy v ∈ Q ∩ W. Ekkor egyrészt v = ae +bf valamilyen a és b skalárral, másrészt ω(v,e) = ω(v,f) = 0. Ekkor ω(v,e) = -b, és 0 = ω(v,f) = a, tehát v = 0.

Legyen most v ∈ V tetszőleges vektor, c = ω(v,e), d = ω(v,f). Ekkor a (-cf + de) ∈ W és a (v + cf -de) ∈ Q vektorok összege.Kész.

Ellenben páros dimenziós tereken mindig megadható szimplektikus forma. A 2n dimenziós téren tetszőleges e1,…en,,f1,,…fn bázist véve az

ω(ei, ej) = ω(fi, fj) = 0,

Page 52: Newton törvényeitől a Higgs-bozonig

ω(ei, fj)= δij

definícióval értelmezett lineáris forma szimplektikus, ezt nem nehéz látni.

Érdemes látni, hogy egy 2n-dimenziós vektortérben egy szimplektikus forma n-edik külső hatványa egy térfogati forma. Ezt szimplektikus térfogati formának, vagy Liuoville-formának is nevezik. És viszont: ha egy 2-forma n-edik hatványa térfogati forma (vagyis, ha nem azonosan nulla), akkor maga a 2-forma nem elfajuló, tehát szimplektikus. Egyszóval a szimplektikus teve magasabb dimenziók esetén is térfogattartó. Annak a belátását, hogy térfogattartó módon át tud menni a tű fokán, az olvasóra bízom. Az viszont már közel sem olyan egyszerű kérdés, hogy ezt egyúttal szimplektikus módon meg tudja-e tenni. Vajon erősebb feltétel egy transzformáció szimplektikussága a térfogattartóságnál, vagy sem?

1 g(R(a), b) + g(R(b),a) = g(R(a), b) + g(R(b),a) + g(R(a), a) + g(R(b),b) = g(R(a), a + b) + g(R(b),a + b) = g(R(a + b), a + b) = 0. Itt kihasználtuk egyrészt R linearitását és g bilinearitását, másrészt azt, hogy R egy 90 fokos elforgatás, vagyis tetszőleges x vektorra g(R(x),x) = 0.

33. A szimplektikus teve II. – a tű fokán

Nézzük meg azért azt a házi feladatot közösen is!*

Nyilván az a megoldás, hogy a tevét a lyuk síkjában össze kell nyomni, arra merőlegesen pedig meg kell nyújtani. Írjuk le ezt pontosabban!

Az egyszerűség kedvéért maradjunk 4-dimenziós vektortérben. Legyen a bázisunk és a szimplektikus formánk olyan, amilyet az előző bejegyzés végén mondtunk. Emlékeztetőül ideírom még egyszer. A bázis:

{ e1, e2, f1, f2 }

A szimplektikus forma:

ω(ei, ej) = ω(fi, fj) = 0,

ω(ei, fj)= δij.

Ez nem jelent semmilyen megszorítást, mivel tetszőleges szimplektikus formához található ilyen bázis az előző bejegyzésben szereplő bizonyításban elvégzett “ortogonalizációs” eljárással.

Az ω szimplektikus formának ei és fi vektorok által kifeszített 2-dimenziós altérre vonatkozó megszorítása ezen az altéren egy szimplektikus forma, ezért ezt az alteret az i-edik szimplektikus síknak fogom nevezni. A szimplektikus formának minden más bázisvektorpár által kifeszített síkra való megszorítása azonosan nulla. Ezeket a síkokat nemszimplektikus síkoknak fogom nevezni, és ennek az észrevételnek megfelelően két esetet fogunk vizsgálni. A teve mindkét esetben legyen ugyanaz a gömb, a tű foka pedig az első esetben egy nemszimplektikus síkra, a második esetben pedig egy szimplektikus síkra állított henger. Az elsőt nemszimplektikus, a másodikat pedig szimplektikus hengernek fogom nevezni. A

Page 53: Newton törvényeitől a Higgs-bozonig

továbbiakban az egyszerűség kedvéért a vektorokat a fenti bázisra vonatkozó koordinátáival azonosítom.

Legyen tehát a teve az origó körüli R sugarú gömb, vagyis a

B(R) = {(x1, x2, p1, p2 ) : x12 + x2

2 + p12 + p2

2 < R2 }

halmaz.

Első eset: nemszimplektikus henger

Legyen a tű foka az e1 és e2 vektorok által kifeszített (nemszimplektikus) síkon álló r sugarú (nemszimplektikus) henger, vagyis a

Z12(r) ={(x1, x2, p1, p2 ) : x12 + x2

2 < r2 }

halmaz.

A tevét a mondott sík irányában λ-szorosára (0 < λ < 1) összenyomjuk, arra merőlegesen pedig ugyanilyen arányban megnyújtjuk. Ez a

mλ : (x1, x2, p1, p2 ) → (x1‘, x2‘, p1‘, p2‘) = (λx1, λx2, p1/λ, p2/λ)

transzformáció valamely 0 és 1 közé eső λ számmal. Ez a transzformáció térfogattartó, sőt szimplektikus is. Ha x1

2 + x22 + p1

2 + p22 < R2 , akkor x1

2 + x22 < R2 , vagyis x1‘2 + x2‘2 < (λR)2 .

Ha tehát λ ≤ r/R, akkor B(R) gömb pontjait (vagyis a tevét) a Z12(r) hengerbe (vagyis a tű fokába) viszi. Hurrá!

Második eset: szimplektikus henger

Legyen most a tű foka az első szimplektikus (vagyis az e1 és f1 vektorok által kifeszített) síkra állított r sugarú henger, vagyis a

Z1(r) = {(x1, x2, p1, p2 ) : x12 + p1

2 < r2 }

halmaz.

Most az x1 – p1 síkon nyomunk össze, és arra merőlegesen nyújtunk. A transzformációnk tehát most:

nλ : (x1, x2, p1, p2 ) → (x1‘, x2‘, p1‘, p2‘) = (λx1, x2/λ, λp1, p2/λ)

Ez továbbra is térfogattartó, és a λ ≤ r/R esetben B(R)-t Z1(r) -be (vagyis a tű fokába) viszi. Azonban ez transzformáció a λ = 1 eset kivételével már nem szimplektikus!

34. A szimplektivus teve III. – szimplektikus mechanika

Ez azért még nem túl meggyőző. Igaz ugyan, hogy találtunk egy olyan transzformációt, ami térfogattartó de nem szimplektikus, és beletranszformálja a tevét a tű fokába, de ez még távolról sem jelenti azt, hogy ez semmilyen szimplektikus transzformációval sem tehető meg.

Page 54: Newton törvényeitől a Higgs-bozonig

Ráadásul idáig végig vektortérben dolgoztunk, pedig a szimplektikus teve valójában szimplektikus sokaságon él. A szimplektikus sokaság úgy viszonyul a szimplektikus vektortérhez, mint a Riemann-tér az euklideszi vektortérhez. A Riemann-tér olyan, hogy egy sokaság minden pontbeli érintőtere euklideszi vektortér, vagyis a sokaságon adva van egy nemelfajuló, szimmetrikus másodrendű tenzormező, amely minden pontban a skalárszorzatot definiálja az ottani érintőtéren, vagyis euklideszi térré teszi azt. A szimplektikus sokaság pedig olyan, hogy a sokaság minden pontbeli érintőtere szimplektikus vektortér, vagyis a sokaságon adva van egy nemelfajuló, zárt 2-forma (nemelfajuló antiszimmetrikus másodrendű tenzormező, amelynek a külső deriváltja 0), amely minden pontban a szimplektikus struktúrát definiálja az ottani érintőtéren, vagyis szimplektikus vektortérré teszi azt. A zártság fontos eleme a definíciónak. Azt jelenti, hogy a szimplektikus forma külső deriváltja nulla, ami Stokes tétele miatt azt is jelenti, hogy a szimplektikus formának tetszőleges zárt felületre történő integrálja 0. Ez egyúttal azt is jelenti, hogy a szimplektkus forma, bár a definíciója erősen emlékeztet a térfogati formáéra, mégsem egy 2-dimenziós térfogati forma (felszín forma), mivel egy felszín formának egy iránytható 2-dimenziós sokaságon soha sem lehet nulla az integrálja (a sehol sem eltűnés miatt). A sehol sem eltűnés helyett itt a zártság a kritérium, ami fontos kelléke a szimplektikus sokaságok már említett tulajdonságának, hogy mind ekvivalensek (szimplektomorfak) egymással.1

A teve valójában csak ürügy arra, hogy a klasszikus mechanika szimplektikus sokaságok nyelvén történő megfogalmazásával foglalkozhassunk. Kapóra jön, hogy a legkisebbb hatás elvében szereplő hatás szimplektikus tulajdonságait fel lehet használni a teve problémájának a vizsgálatára is.

Most megmutatom tehát, hogyan lehet a klasszikus mechanikát a szimplektikus sokaságok nyelvén megfogalmazni.

Egy adott klasszikus mechanikai rendszer állapotát egy adott pillanatban a rendszer független koordintái és azok deriváltjai (vagyis a sebességek) jellemzik. Úgy értve, hogy ha egy pillanatban ezeket az adatokat pontosan tudjuk, és ismerjük a rendszerünk mozgástörvényeit, akkor tetszőleges másik pillanathoz meg tudjuk mondani, hogy mik lesznek ezek a koordináták és sebességek abban a másik pillanatban. Ha a rendszer pillanatnyi helyzetét n darab koordináta írja le, akkor a koordináták és sebességek együtt egy 2n-dmenziós sokaság egyetlen pontjának a koordinátájának tekinthetők (ezt a bizonyos 2n-dimenziós soksaságot néha állapottérnek néha pedig fázistérnek nevezik). Ha a rendszer egy konkrét mozgása során minden időponthoz hozzárendeljük a hozzá tartozó pontot, akkor ez egy (az idő számértékével paraméterezett) görbe megadását jelenti ezen a sokaságon. A mozgástörvények persze nem csak ezt az egy görbét szabják meg, hanem ha a t = 0 időponthoz tetszőleges x pontot adunk meg ebben az állapottérben kezdőértéknek, akkor is megszabják, hogy a rendszer állapota tetszőleges t pillanatban milyen pontban lesz. A differenciálgeometria nyelvén -t a fázistér egy folyamának nevezik. A klasszikus mechanika törvényei szerint az x ponthoz a pontot rendelő transzformáció szimplektikus2, ami azt jelenti, hogy megadható az állapottéren, mint sima sokaságon olyan ω szimplektikus forma, amellyel tetszőleges x pontbeli a és b érintővektorra

.

Page 55: Newton törvényeitől a Higgs-bozonig

Példaként nézzük a mozgásegyenletű lineáris harmonikus oszcillátort. A konfigurációs tér ebben az esetben 1-dimenziós, a fázistér 2-dimenziós. A mozgásegyenletnek megfelelő fázistér-folyam3:

.

Legyen , , . Ekkor

A pont érintőterében lévő a és a b vektort a transzformáció pushforwardja a pont feletti érintőtérbeli

ill.

vektorokba tolja4 . Így

,

tehát a harmonikus oszcillátor mozgása valóban a fázistér egy szimplektikus folyamával írható le.

1A Darboux-tétel bizonyítása a PlanetMath-on olvasható.2 Legalábbis mi most csak ilyen mechanikai rendszerekkel foglalkozunk. Ebben nincsenek benne az időtől függő Hamilton-függvénnyel rendelkező rendszerek, mint például egy elektronnak időben változó mágnses térben való mozgása.

3 Ez az összefüggés a sinus és cosinus függvények addíciós tételének alkalmazásával közvetlenül adódik a mozgásegenletből.

4 -nek a (q,p) koordinátákban való linearitása miatt a pushforwardja a koordinátabázisra vonatkozóan azonos vele.

35. Szimplektikus mechanika II. – A Hamilton-féle mozgásegyenletek

Az előző bejegyzésben a lineáris harmonikus oszcillátornak a konfigurációs téren megadott mozgásegyenletéről mutattuk ki, hogy ez a sík szimplektikus folyamát írja le,

ahol az oszcillátor impulzusa. Vagyis az oszcillátor mozgását leíró 1-dimenziós

Page 56: Newton törvényeitől a Higgs-bozonig

konfigurációs térbeli görbéhez a plusz koordináta bevezetésével tudtunk egy 2-dimenziós térbeli görbét rendelni, amely egy szimplektikus folyam egy orbitja. A Hamilton-féle szimplektikus mechanika ezt épp fordított irányból közelíti meg. Azt posztulálja, hogy egy -dimenziós konfigurációs térben zajló folyamat (vagyis e folyamatot leíró n-dimenziós térbeli görbe) mindig egy -dimenziós állapottérbeli szimplektikus folyam valamely orbitjának a vetülete a konfigurációs térre. A továbbiakban ezt a folyamot (a fázistéren lehetséges egyéb folyamoktól való megkülönböztetés céljából) Hamilton-folyamnak*

nevezzük. A Hamilton-folyamot maga a mechanikai rendszer szabja meg, azt pedig, hogy ennek a folyamnak melyik orbitja fogja a mozgást leírni, az a kezdeti feltételtől függ (az oszcillátor esetén ezek az orbitok a különböző amplitúdójú rezgéseihez tartozó görbnék). A 2n-dimenziós állapottér a Hamilton-mechanikában a konfigurációs tér koérintőnyalábja, a szimplektikus forma a koérintőnyaláb kanonikus szimplektikus formája, a projekció pedig a nyaláb projekciója. A mechanikai rendszer megadása tehát egy szimplektikus folyam megadását jelenti a koérintőnyalábon. Ennek a szimplektikus folyamnak az iránymezeje (vagyis az orbitok érintőiből álló vektormező) egy az állapottéren értelmezett valós értékű függvény szimplektikus gradiense. Ez a függvény az illető mechanikai rendszer Hamilton-függvénye, amelynek a megadása tehát definiálja a mechanikai rendszerhez tartozó Hamilton-folyam iránymezejét, így magát a Hamilton-folyamot is. A mechanikai rendszerek végső soron tehát a Hamilton-függvényükkel jellemezhetők.

Két olyan dolgot mondtam itt, amiről eddig még nem volt szó: az egyik a koérintőnyaláb kanonikus szimplektikus formája, a másik a szimplektikus gradiens. Kezdjük az utóbbival, mert ez egyszerűen elintézhető.

Mielőtt elmondanám, mi az a szimplektikus gradiens, előbb elmondom egy jellemző tulajdonságát a szokásos (Riemann-térbeli) gradienssel szembeállítva. Ha adva van egy deriválható függvény egy Riemann-téren, akkor ennek a függvénynek a gradiense egy vektormező, amely minden pontban -nek az e pontot tartalmazó nívóhalmazára merőleges vektor. A szimplektikus gradiens ezzel szemben olyan vektormező, amely minden pontban a nívófelületnek egy érintővektora. Egy szimplektikus Riemann-téren tehát a gradiens mindig merőleges a szimplektikus gradiensre. Ez érthető, ha tudjuk, hogy a gradiens a skalárszorzattal áll kapcsolatban, a szimplektikus gradiens pedig a szimplektikus formával, és emellett azt is tudjuk, hogy skalárszorzatból szimplektikus formához jutunk, ha a skalárszorzatban egyik vektor helyett egy rá merőleges vektort veszünk (ld. Az A szimplektikus teve bejegyzést).

Azt is előrebocsátom még, hogy tetszőleges differenciálható függvény szimplektikus gradienséhez tartozó folyam szimplektikus. A szóban forgó függvényt (tehát amelynek a szimplektikus gradienséről szó van), e folyam generátorfüggvényének nevezzük. Egy függvény által generált szimplektikus folyam megőrzi -et.

A pontos definíció pedig a következő. A szimplektikus gradiens ugyanaz, mint a gradiens, csak skalárszorzat helyett a szimplektikus forma szerepel a definíciójában. Jó, de akkor mi az a gradiens? Az a differenciál duális vektora. Egy függvény differenciálja egy 1-forma, ami egy érintővektorhoz (azaz derivációhoz) a értéket rendeli hozzá. Ez a hozzárendelés minden pontban az ottani érintőtér lineáris funkcionálja. Másrészt, ha a sokaságunk egy Riemann-tér, akkor minden értintőtéren definiálva van a vektorok közti skalárszorzat: , ami egy pozitív definit, szimmetrikus bilineáris forma. -t lefixálva pedig egy lineáris funkcionál (kovektor), csakúgy mint . Az könnyen beltható, hogy minden lineáris funkcionálhoz van olyan vektor, amellyel való skalárszorzás ugyanazt

Page 57: Newton törvényeitől a Higgs-bozonig

a lineáris funkcionált definiálja, mint , vagyis, amellyel minden vektorra . Ezt a vektort az lineáris funkcinál (vagyis kovektor) duálisának nevezzük. A lineáris funkcionálhoz tartozót pedig gradiensénk. Tehát minden pontban az a vektor, amellyel minden vektorra .

Most, ha a fentiekben a skalárszorzat bilineáris forája helyébe az szimplektikus formát helyettesítjük, akkor a szimplektikus gradiens definíciójához jutunk. Egy függény szimplektikus gradiense tehát egy olyan vektormező, amellyel minden vektorra

.

Speciálisan, ha -n a szimplektikus formánk , akkor egyrészt , vagyis

,

másrészt , vagyis

.

A szimplektikus gradiens definíciója szerint tehát

,

Vagyis

és

Ezek az egyenletek a mechanika Hamilton-féle mozgásegyenletei 1-dimenziós konfigurációs tér esetén.

* Általában minden olyan szimplektikus folyamot Hamilton-folyamnak szokás nevezni aminek a sebességmezeje valamely függvény szimplektikus gradiense, de mi csak kifejezetten az itt említett (tehát a mechanikai rendszer lehetséges időbeli változásait leíró) folyamot fogjuk így nevezni.

36. Szimplektikus mechanika III. – A lineáris harmonikus oszcillátor

Ott tartottunk, hogy az 1-dimenziós mozgáshoz tartozó 2-dimenziós fázistéren (azaz az 1-dimenziós konfigurációs tér koérintőnyalábján) a Hamilton-féle mozgásegyenletek az alábbiak.

Page 58: Newton törvényeitől a Higgs-bozonig

és

, ahol és a fázistér kanonikus koordinátáit jelenti: az 1-dimenziós konfigrációs tér egy pontja, pedig -nek az az eleme, amelyiket ez a koordinátázás a pont feletti koérintőtér elemének feleltet meg.

a mechanikai rendszert jellemző szimplektikus folyam (vagyis a Hamilton-folyam) iránymezeje, pedig ennek a folyamnak a generátorfüggvénye, vagyis az a függvény, amelynek ez az iránymező a szimplektikus gradiense. -et a mechanikai rendszer Hamilton-függvényének nevezik, és általában -val jelölik. A továbbiakban mi is ezt fogjuk tenni. Ha a Hamilton-folyam egy orbitja a fent ismertetett koordinátáinkkal kifejezve ,

akkor . Ezekkel a jelölésekkel a Hamilton-egyenleteket már a szokásos alakban írhatjuk:

és

Nézzük meg, hogy fest ez a lineáris harmonikus oszcillátor esetében!

Azt már láttuk, hogy a mozgásegyenletű harmonikus oszcillátornak a

.

Hamlton-folyam felel meg. Ennek a folyamnak az iránymezeje az a vektormező, amely az pontban a görbe érintője -ban, vagyis , vagyis és

. Ezt Hamilton-egyenleteinkkel összehasonlítva látjuk, hogy és . Ebből

. Ez a lineáris harmonikus oszcillátorunk Hamilton-függvénye (egyúttal a összefüggést is megkaptuk, sőt kaptunk még egy összefüggést is).

37. A lapos tórusz, avagy hengerek és gömbök 3, 4 és n dimenzióban

Egy henger 3-dimenzióban egy kör és egy egyenes Descartes-szorzata, vagy ha úgy tetszik a kör, mint bázistér feletti 1-dimenziós fibrumú vektornyaláb. Egy origó körüli R sugarú gömb és egy origó körüli r<R sugarú henger metszete két kör, azért, mert a henger minden fibruma a gömböt két pontban metszi. A metszet tehát a kör ( ), mint bázistér feletti kételemű fibrumú nyaláb, ami jelen esetben két kör (pedig ettől lehetne még az elrettentő példa is – ami nem más, mint egy duplára csavart befőttesgumi – , de sprciel itt nem az). Ha visziont r = R, akkor ez a két kör egybeesik, tehát csak 1 kör a metszet.

4-dimenzióban a henger egy kör és egy sík Descartes-szorzata, vagy ha úgy tetszik, a kör, mint bázistér feletti 2-dimenziós fibrumú vektornyaláb. Egy origó körüli R sugarú gömb és egy origó körüli r<R sugarú henger metszete egy tórusz, azért, mert a henger minden fibrumának a gömbbel való meteszete egy kör. A metszet tehát a kör ( ), mint bázistér feletti

Page 59: Newton törvényeitől a Higgs-bozonig

fibrumú nyaláb, ami egy tórusz, legalábbis topológiai értelemben (metrikus értelemben itt speciel ez az ú.n. lapos tórusz). Ha visziont r = R, akkor a fibrumok 0 sugarú körökké, vagyis pontokká fajulnak, tehát ekkor csak egy kör a metszet.

Egy henger n-dimenzióban egy kör és egy (n-2)-dimenziós hipersík Descartes-szorzata, vagy ha úgy tetszik, a kör, mint bázistér feletti (n-2)-dimenziós fibrumú vektornyaláb. Egy origó körüli R sugarú gömb és egy origó körüli r<R sugarú henger metszete egy kör ( ), mint bázistér feletti fibrumú nyaláb, azért, mert a henger minden fibrumának a gömbbel való meteszete egy (n-2)-dimenziós gömbhéj, vagyis . Ha visziont r = R, akkor a fibrumok 0 sugarú hipergömbökké, vagyis pontokká fajulnak, tehát ekkor csak egy kör a metszet.

38. Szimmetria és megmaradás

Arról a dologról szeretnék itt pár szót ejteni, amit Noether-tételként emlegetnek, és amit tömören úgy szokás megfogalmazni, hogy egy mechanikai rendszer minden folytonos szimmetriacsoportjához tartozik egy megmaradó fizikai mennyiség. Ez így megfogalmazva persze nem jelent semmit, amíg nem tudjuk, hogy mit értsünk egy mechanikai rendszer szimmetriája, illetve fizikai mennyisége alatt. Példákat azért különösebb előkészítés is említhetünk: a tér valamely irányában történő eltolásaihoz, mint szimmetriacsoporthoz az impulzusnak az abba az irányba eső komponense tartozik mint megmaradó fizikai mennyiség, adott tengelyű forgatásokhoz az impulzusmomentumnak a tengely irányába eső komponense, az időeltolásokhoz pedig az energia. Hangzatosan és mély filozófiai tartalmat sejtetően ezeket úgy szokás mondani, hogy a tér homogenitásából következik az impulzusmegmaradás, az idő homogenitásából az energiamegmaradás, a tér izotrópiájából pedig az impulzusmomentum megmaradása. Valójában persze nem a tér és az idő homogenitásáról illetve izotropiájáról van szó, hanem arról, hogy egy fizikai rendszer valamilyen matematikai modelljében az ezeknek a transzformációknak megfelelő transzformációk a modell elemei közül valamit változatlanul hagynak. Kicsit hasonló itt is a helyzet, mint az Aharonov-Bohm-effektus esetén: nem valami fizikailag is megfigyelhető dolog az, aminek az invarianciájáról beszélünk, hanem egy csak a mi modellünkben létező artifaktum, jelen esetben a Hamilton-függvény, vagyis a mechanikai energia. Már hallom is az olvasót: már miért lenne az energia nemfizikai artifaktum? Hiszen már az általános iskolai fizikai tananyagban is szerepel! A válaszom erre: azért, mert az energiának mindig csak a változása az, aminek fizikai értelme van. Ha minden energiaértékhez hozzáadjuk ugyanazt a számot, akkor az égvilágon semmi sem változik. A szimplektikus mechanikában ez úgy jelenik meg, hogy nem a Hamilton-függvény az, ami meghatároz egy mechanikai rendszert, hanem csak a differenciálja. Egymástól konstansban eltérő Hamilton-függvények ugyanazt a mechanikai rendszert írják le!

Hogy kicsit konkrétabb legyek: homogén gravitációs mezőben való ejtő kísérletek eredményét nem befolyásolja, ha a laboratóriumunkat egy függőleges tengely körül bármilyen szöggel elforgatjuk – és lám az impulzusmomentum függőleges komponense meg is marad az ilyen rendszerekben. Hasonló érvényes a vízszintes síkban való eltolásra is, és ahogy illik, az impulzus vízszintes komponense is megmarad. Ahol a bökkenő van, az a függőleges irányú eltolás: a homogén gravitációs mezőben lévő laboratóriumunkat bármennyivel eltolhatjuk függőleges irányban is anélkül, hogy a belül elvégzett kísérletek kimenetelében ez bármiféle változást okozna. A homogén gravitációs mező tehát “fizikailag” a függőleges irányú eltolásokkal szemben is invariáns, de persze a benne leejtett test impulzusának a függőleges komponense nem marad meg! Ilyen értelemben mondom én, hogy valami “nemfizikai”, csak a modellünkben létező dolog az, ami nem invariáns az ilyen eltolásokkal szemben. Elmondom részletesebben is, miről van itt szó, persze a szimplektikus mechanika modelljében.

Page 60: Newton törvényeitől a Higgs-bozonig

A szimplektikus mechanikában a mechanikai rendszerek lehetséges időbeli fejlődését a fázistér Hamilton-folyama írja le. A Hamilton-folyamot egyértelműen meghatározza a sebességmezeje, azt pedig a Hamilton-függvény. A Hamilton-függvény az a függvény, amelynek a szimplektikus gradiense a Hamilton-folyam iránymezeje. A szimplektikus gradiens a differenciál szimplektikus duálisa. Ha két függvény egymástól konstansban tér el, akkor a differenciáljaik egyenlők, tehát egy mechanikai rendszer Hamilton-függvénye csak konstans erejéig egyértelmű. Vagyis a Hamilton-függvényhez konstans hozzáadása nem változtatja meg a Hamilton-folyam orbitjait, vagyis az elvégzett kísérletek lehetséges lefolyásait. Fizikailag tehát a konstansban való eltérés irreleváns, a Noether tétel viszont csak azokra a szimmetriákra érvényes, amelyek magát a Hamilton-függvényt is változatlanul hagyják, nem csak az orbitokat.

De mik is ezek a szimmetriák?

A newtoni mechanika Galilei-invariáns. Ez a szimplektikus mechanikában azt jelenti, hogy a Galilei-csoport tetszőleges egyparaméteres részcsoportjának adva van egy szimplektikus csoporthatása az állapottéren. Például az ( a 3-dimenziós forgáscsoport) tetszőleges egyparaméteres részcsoportjáé (vagyis egy adott tengely körül való forgatások csoportjáé) is. Legyen ez a csoporthatás az hozzárendelés, ahol az állapottér valamely automorfizmusa (önmagára történő szimplektomorfizmusa). Az, hogy ez csoporthatás azt jelenti, hogy az hozzárendelés tetszőleges esetén folytonos, és . A szimplektikusság pedig azt, hogy mindegyik transzformáció megőrzi a szimplektikus formát. Az általában nem igaz, hogy A Hamilton-folyam orbitjait egymásba másik orbitba visz át. Ha viszont ez egy mechanikai rendszerre teljesül, akkor a fentiekben kifejtett “fizikai” értelemben (vagyis abban az értelemben, hogy a kísérletek eredményét nem változtatja meg az elforgatás) ennek a mechanikai rendszernek egy szimmetriacsoportja az adott részcsoport.

Klassz. Merthogy egy kiválasztott tengely körüli forgatások csoporthatása az M fázistérnek éppúgy egy szimplektikus folyama, mint a Hamilton-folyam, vagyis amelyik a fázistér időbeli fejlődését írja le. Feltesszük, hogy ennek a folyamnak is van generátorfüggvénye, mint ahogy a Hamilton-függvény a Hamilton-folyam generátorfüggvénye. Tehát egy olyan függvény, amelynek a szimplektikus gradiense az illető folyam sebességmezeje. Az adott tengely körüli forgatásoknak megfelelő generátorfüggvényt a mechanikai rendszernek az erre a tengelyre vonatkozó impulzusmomentumának nevezzük. Az világos, hogy az impulzusmomentum által generált folyam orbitjain az impulzusmomentum értéke állandó, de nem ezt nevezik megmaradásnak, hanem az időbeli állandóságot, vagyis a Hamilton-folyam orbitjain való állandóságot.

A Noether-tétel azt állítja, hogy ha a G egyparaméteres csoportnak a fázistérbeli hatása a Hamilton-függvényt változatlanul hagyja, akkor a G által generált fázisfolyam generátorfüggvénye a Hamilton-folyam orbitjain állandó.

Nézzük, tényleg így van-e!

Ha egy egyparaméteres szimmetriacsoporthoz tartozó szimplektikus folyam megőrzi a Hamilton-függvényt, akkor ennek a folyamnak generátorfüggvénye konstans a Hamilton-folyam orbitjai mentén, hiszen ha a Hamilton-folyam sebességmezeje , a szimmetria-folyam sebességmezeje és a generátorfüggvénye , akkor a -nek a Hamilton-folyam egy orbitja mentén vett deriváltja:

Page 61: Newton törvényeitől a Higgs-bozonig

, mivel a Hamilton-függvény a szimmetria-folyam orbitjain konstans, vagyis a szimmetriafolyam irányában vett deriváltja nulla.Ha viszont a szimmetriánk csak az orbitokat őrzi meg, magát a Hamilton-függvényt nem, akkor ennek a szimmetriának a generátorfüggvénye már nem feltétlenül konstans a Hamilton-folyam orbitjain. Erre példa a bevezetőben említett homogén gravitációs térben a függőleges eltolás. A homogén gravitációs mezőben mozgó tömegpont Hamilton-függvénye:

, ahol a helyvektor, pedig az impulzusvektor. A Hamilton-folyamnak az ponton átmenő orbitja a

Hamilton-egyenletekből számíthatóan:

.

A függőleges irányú nagyságú eltolás hatása a fázistéren:

,

ennek az iránymezeje , a generátorfüggvénye tehát , mivel ennek a függvénynek a szimplektikus gradiense

Világos, hogy ez a szimmetriafolyam a Hamilton-folyam orbitjait egymásba viszi, de nem konstans ezeken az orbitokon. Tehát, habár a függőleges eltolás fizikailag szimmetria, a generátorfüggvénye, vagyis a függőleges irányú impulzus nem marad meg.

39. A tautologikus 1-forma, a kanonikus szimplektikus forma és a Hamilton-egyenletek több dimenzióban

Adós vagyok még a 35. bejegyzésben említett kanonikus szimplektikus forma magyarázatával.Ott a 2-dimenziós fázistérrel próbáltam érzékeltetni, miről van szó:

Egy függény szimplektikus gradiense tehát egy olyan vektormező, amellyel minden

vektorra .

Speciálisan, ha -n a szimplektikus formánk , akkor egyrészt , vagyis

,

másrészt , vagyis

.

Page 62: Newton törvényeitől a Higgs-bozonig

A szimplektikus gradiens definíciója szerint tehát

,

Vagyis

és

De miért éppen a 2-formát vettük szimplektikus formának, és hogy lesz ez több dimenzióban? Másrészről: nem koordinátázásfüggő ez?Dehogynem. De a kanonikus koordinátázások között már nem! Hogy mi az a kanonikus koordinátázás? Ha a konfiguráció tér tetszőleges koordinátázása esetén mindegyik koérintőtér bázisának -t veszem, és a koordináták erre a bázisra vonatkoznak, akkor a koérintőnyaléb koordinátázását kanonikusnak nevezzük.

És most elmondom, mi is ez a kanonikus szimplektikus forma akárhány dimenzióban, koordinátafüggetlenül, majd azt, hogy ezt kanonikus koordinátákkal hogy lehet kifejezni.

A dolog két észrevételen alapul.Egyrészt: egy koérintőnyaláb elemei (pl. ) a nekik megfelelő érintőtéren (vagyis

-en}) értelmezett lineáris funkcionálok.Másrészt: egy koérintőtényaláb érintővektorainak (vagyis elemeinek) létezik egy -re való természetes projekciója: .

E két tényt kihasználva egy természetes 1-formát lehet definiálni a koérintőnyalábon: azt az 1-formát, amelyik a koérintőtér pontja feletti érintőterén (vagyis -en) az a lineáris funkcionál, amelyik a vektorhoz az számot rendeli. Ezt a -en definiált 1-formát nevezzül a koérintőnyaláb tautologikus 1-formájának1.

A tautologikus 1-forma (más néven: Liouville 1-forma, Poincaré 1-forma, vagy kanonikus 1-forma) a kanonikus koordinátákkal kifejezve:

Ha , akkor

A tautologikus 1-forma külső deriváltja egy nemelfajuló 2-forma, vagyis egy szimplektikus forma. Ezt a szimplektikus formát, pontosabban ennek a negatívját nevezik a koérintőnyaláb kanonikus szimplektikus formájának.

A kanonikus szimplektikus forma a kanonikus koordinátákkal kifejezve:

Page 63: Newton törvényeitől a Higgs-bozonig

A szimplektikus forma tehát már világos. Nézzük a Hamilton-egyenleteket. Az tetszőleges dimenzióban is érvényes, hogy a Hamilton-függvény egy olyan függvény, amelynek a szimplektikus gradiense a Hamilton-folyam iránymezeje. Egész röviden tehát így írhatjuk le koordinátafüggetlenül a Hamilton-féle mozgásegyenleteket:

,

ahol sgrad a szimplektikus gradienst jelöli. Mint már szó volt róla, ez definíció szerint azt jelenti, hogy tetszőleges vektormezőre

.

Más jelöléssel:

,

vagy

,

ahol -nek -val való kontrakciója, vagyis az az 1-forma , ami egy vektormezőhöz az függvényt rendeli.

A kanonikus koordinátákra vonatkozó Hamilton-egyenleteket több dimenzióban is ugyanúgy kaphatjuk meg, mint 1-dimenzióban, csak az ottani szimplektikus forma helyett most az általános kifejezést kell használnunk. Az 1-dimenzióban mondottakat mutatis mutandis megismételve (és most már helyett -t írva, illetve az kifejezésből elhagyva):

,

vagyis

.

másrészt

,

Az egyenletünk tehát koordinátásan:

,

Vagyis

és

Page 64: Newton törvényeitől a Higgs-bozonig

, vagy a fizikában szokásos , jelöléssel írva:

1Fordított szemszögből nézve: ha adva van egy szimplektikus forma és valamely 1-formára , akkor az 1-formát szimplektikus potenciálnak nevezzük. Speciálisan a

koérintőnyalábok tautologikus 1-formája a kanonikus szimplektikus forma szimplektikus potenciálja, de persze minden más olyan 1-forma is szimplektikus potenciál, amelyik ettől egy függvény differenciáljában (vagyis egy 0-forma külső deriváltjában) különbözik.

40. Tömegpontrendszer impulzusa és impulzusmomentuma

Az előző bejegyzésben az impulzust és impulzusmomentumot a térbeli eltolások, illetve forgatások egyparaméteres részcsoportja fázistéren vett hatásának generátorfüggvényeként definiáltuk. Pontosabban ezek a függvények az impulzusnak illetve impulzusnak csak a szóban forgó irányban vett értékei, vagy a fizikában használatos terminológia szerint az impulzusvektornak illetve impulzusmomentum vektornak az abba az irányba eső komponensei. Azt a kérdést, hogy a szimplektikus leírásban mi fog megfelelni magának az impulzus vektornak, illetve impulzusmomentum vektornak, egyelőre tegyük félre, és először azt vizsgáljuk meg, hogy pontosan hogy is néz ki ez a dolog egy N tömegpontból álló pontrendszer esetén.

A tömegpontrendszer fázistere az egyes tömegpontok fázistereinek Descartes szorzata az

szimplektikus formával ellátva, ahol .

Az impulzus adott irányba eső komponense az abban az irányban való eltolás generátorfüggvénye. Ez azt jelenti, hogy egy pont eltolását jelentő fázistérbeli orbit érintővektora ennek a függvénynek a szimplektikus gradiense. Az N tömegpontból álló rendszer fázisterének egy lokális koordinátázása legyen

,

, ahol az i-edik tömegpont fázisterének kanonikus koordinátázása. Ennek a pontnak az irányban t-vel való eltoltja az

pont. A paraméter függvényének tekintve ez egy görbe a fázistérben. Az irányban való eltolás generátorfüggvénye a rendszer irányú impulzusa. Ez a függvény a

Page 65: Newton törvényeitől a Higgs-bozonig

függvény, hiszen ennek a szimplektikus gradiense

pontosan az irányú eltolás egyparaméteres részcsoportja fázistéren vett hatásának, mint görbének (vagyis a fenti görbének) az érintővektora.Az “ irányban való eltolás” a 3-dimenziós transzlációcsoport egy egyparaméteres részcsoportjának a csoporthatása a fázistéren. Az egyparaméteres részcsoportok a Lie-csoportban haladó olyan görbék, amelyekre . Az egyparaméteres részcsoportok a Lie-algebra (vagyis a csoport egységeleme feletti érintőtér) elemeivel és a Lie-algebra és a csoport közötti exponenciális leképezéssel adhatók meg. Az exponenciális leképezés definíciója: , ahol az az (egyértelműen létező) egyparaméteres részcsoport, amelynek az egységelembeli érintője . Ez egyúttal azt is jelenti, hogy . Általában csoport Lie-algebrájának tetszőleges elemét kiszemelve az általa meghatározott egyparaméteres részcsoport csoporthatása egy vektormezőt határoz meg -en, amit az ehhez a csoporthatáshoz tartozó Killing vektormezőnek nevezünk. A Killing vektormező értéke az pontban:

A fenti, irányú eltolás a transzlációcsoportnak olyan csoporthatása, amelyben a Killing vektormező konstans:

,

-től függetlenül. Itt a csoport Lie-algebrájának az az eleme, amely által generált egyparaméteres részcsoport hatása az irányú eltolás.

Nézzük most, mi a helyzet az általános esetben. Tömegpontrendszer fázisterén való csoporthatás az egyes részecskékhez tartozó 3-dimenziós konfigurációs tereken megvalósuló csoporthatásokból tevődik össze. A konfigurációs tér egy differenciálható sokaság, amelyen így adva van T(3)-nak egy csoporthatása. Feltesszük erről a hatásról, hogy folytonos és reguláris. Tekintve, hogy T(3) izomorf saját Lie-algebrájával (ahol az izomorfizmus az exponenciális leképezés), ez azt jelenti, hogy az egyes tömegpontok konfigurációs tere a t(3) vektortér feletti principális homogén tér, röviden: affin tér. Az összeadás:

.

Magán a tömegpontrendszer fázistérén megvalósuló csoporthatás tehát:

, ahol az i-edik tömegpont 3 koordinátája helyett szerepel, és a neki megfelelő 3 koordináta -be van összegyűjtve. Az ehhez a hatásához tartozó Killing mező:

Page 66: Newton törvényeitől a Higgs-bozonig

A fenti érintővektor a

függvény szimplektikus gradiense, feltéve, hogy a koordináták affin koordináták, vagyis, hogy ). Tehát az impulzus “ irányú komponense” ez a függvény.

Hasonló a helyzet az impulzusmomentummal is: az Lie-csoport Lie-algebrájának tetszőleges elemét véve az elemnek a fázistéren való hatása az

pontot az pontba viszi, ahol az adott reprezentációban az elemnek megfelelő forgatás operátora -ban. Tehát a forgások egyparaméteres csoportjainak a fázistéren való hatása is -on megvalósuló csoporthatásokból tehetők össze. Mint ahogy korábbi bejegyzésekben volt róla szó, ezek a csoporthatások a 3-dimenziós tér egyenletes forgását jelentik, amelyekhez tartozó Killing vektormező egy antiszimmetrikus mátrix-szal rendelkező lineáris transzformáció, ami az antiszimmetrikus mátrix Hodge-duálisával, vagyis az szögsebesség vektorral kifejezve:

,

ahol és között lineáris kapcsolat áll fenn.

A fázistér Killing vektormezeje tehát:

.

Itt

,illetve

.

,ahol a Levi-Civita-féle permutációs szimbólum.

A egyparaméteres részcsoport hatásának a generátorfüggvénye az az függvény, amelynek a szimplektikus gradiense a fenti vektor, azaz, amelyre

és

.

Page 67: Newton törvényeitől a Higgs-bozonig

Ez pedig az

függvényre teljesül, tehát ez a tömegpontrendszerünknek a (illetve ) “irány”-hoz tartozó impulzusmomentuma.

41. Az impulzus és impulzusmomentum, mint momentum leképezés

Most megvizsgáljuk, hogy a komponenseik után maguk a fizikában szereplő impulzus illetve impulzusmomentum vektorok minek felelnek meg a szimplektikus mechanikában.

Durván szólva arról van szó, hogy az impulzusvektor és impulzusmomentum-vektor valójában egy-egy lineáris funkcionál, pontosabban, a fázistér minden pontjában egy lineáris funkcionál. Ezek a lineáris funkcionálok az “irányok”-at megtestesítő vektorokhoz rendelik azt a számot, ami az impulzusnak, illetve az impulzusnak az ebben az irányban vett értéke a fázistér adott pontjában (ld. az előző bejegyzés eredményeit). És minthogy a lineáris funkcionálok is vektorteret alkotnak, ilyen értelemben az impulzus és impulzusmomentum is vektor.Ebben két dolog is homályos egy kicsit:

1. Mik is akkor végülis ezek az irányok?2. Pontosan mi ez a bizonyos lineáris hozzárendelés?

A pontos válasz az, hogy az “irányok” a megfelelő Lie-algebra elemei, az impulzus és az impulzusmomentum pedig úgynevezett momentum leképezések. Hogy ez mit jelent, azt az alábbiakban mondom el.

A szóban forgó csoportok (vagyis a 3-dimenziós transzlációcsoport, illetve az 3-dimenziós forgáscsoport) egyparaméteres részcsoportjainak a fázistéren vett hatása a fázistér egy folyama, amelynek a megadása ekvivalens a folyam iránymezejének a megadásával. Ez az iránymező az ehhez a hatáshoz tartozó Killing vektormező, más néven az infinitézimális hatás. Általában, ha a csoportnak adva van az sokaságon egy

csoporthatása, akkor a G csoport Lie-algebrájának egy eleme által generált egyparaméteres részcsoport hatásához tartozó Killing vektormező értéke az pontban

.

Egy leképezést a csoporthatás momentum leképezésének nevezünk, ha minden elemére az függvény szimplektikus gradiense . Más szóval, ha tetszőleges vektormezőre

Ezt gyakran az alábbi alakban fogalmazzák meg:

,

Page 68: Newton törvényeitől a Higgs-bozonig

Az itt szereplő -t a - vektormezőnek -val való kontrakciójának nevezik és definíció szerint egyenlő az 1-formával.

Adott csoporthatás momentum leképezése additív integrációs konstans erejéig egyértelmű.

Az előző bejegyzés példáiban a tömegpontrendszer impulzusa az a momentum leképezés, amely a fázistér pontjához a -nak azt az elemét rendeli,

amelynek a vektoron felvett értéke , az impulzusmomentuma

pedig az, amelyik a Lie-algebra-elemhez a számot rendeli hozzá. Itt az számok lineáris függvényei, tehát valóban a Lie-algebrán értelmezett lineáris funkcionálról van szó mindkét esetben.

42. Young-egyenlőtlenség és Legendre-transzformáció

A Legendre-transzformáció alapvető jelentőségű a fizikában: a mechanika Lagrange-féle megfogalmazását kapcsolja össze az általunk eddig vázolt Hamilton-féle, vagyis szimplektikus leírással. A Hamilton-mechanika, mint láttuk, megkapóan egyszerű: a Hamilton-függvény az a függvény, aminek a szimplektikus gradiense a mechanikai rendszerünk lehetséges időbeli változásait leíró fázisfolyam sebességmezeje. A fázisfolyam a fázistérnek, vagyis a konfigurációs tér koérintőnyalábjának egy folyama, egy orbitjának a konfigurációs térre eső vetülete a rendszer egy lehetséges mozgása. A Lagrange-mechanika egy kicsit körülményesebb: a Lagrange-függvény az érintőnyalábon (és – a Hamilton-függvénytől eltérően – nem a koérintőnyalábon) értelmezett függvény, amely a legkisebb hatás elvén keresztül határozza meg a rendszer egy lehetséges mozgását: két adott pontot összekötő fázástérbeli görbék közül az írja le a rendszernek egy lehetséges mozgását, amelyen a Lagrange-függvény integrálja – amit hatásnak neveznek – minimális. A vicc az, hogy ez a két leírás ekvivalens. Az ekvivalenciát a Legendre-transzformáció teremti meg köztük.

Legendre-transzformáció alatt többnyire egy függvénytranszformációt szoktak érteni, ebben az értelemben a Hamilton- és a Lagrange-függvény egymás - fibrumonként vett – Legendre-transzformáltjai. Nekem ezzel szemben jobban tetszik az a terminológia, amely szerint a Legendre-transzformáció az érintőnyaláb és a koérintőnyaláb közti “ponttranszformáció”, amely a Hamilton-féle fázisgörbéket az ugyanahhoz a mozgáshoz tartozó Lagrange-féle (tehát az érintőnyalábbeli) görbébe viszi és viszont.1 Ebben a terminológiában a Hamilton- és Lagrange-függvények egymás Young-duálisai.2 Hogy mi áll e mögött a nevezéktan mögött, azt az alábbiakban próbálom megvilágítani.

Egy szigorúan monoton növő függvény integrálja (primitív függvénye) szigorúan konvex. A Young-dualitás a szigorúan konvex függvények között van definiálva, a következő módon. Legyen egy a intervallumon szigorúan monoton növő folytonos fügvény, amelyre

. Ekkor az (a intervallumon szigorúan konvex) függvény

Young-duálisa az (a intervallumon szigorúan konvex) függvény.

Page 69: Newton törvényeitől a Higgs-bozonig

Az ábráról láthatóan tetszőleges esetén

(1)

, amit a szimmetria kedvéért természetesen

(1′)

alakba is írhatunk, ahol .

Az ábráról az is látszik, hogy tetszőleges és esetén

Ezt az egyenlőtlenséget nevezik Young-egyenlőtlenségnek3. Mint láttuk, az egyenlőség a esetben teljesül (és csak akkor), ezért a Young-duális definíciója ekvivalens az

alábbival:

(2)

Leírom még azt a formát is, amivel leggyakrabban szokták definiálni a Young-duálist, ez pedig nem más, mint az (1) összefüggés, amelyet miatt így is írhatunkk:

. (3)

Az ebben az egyenlőségben és argumentumait összekapcsoló

(4)

leképezést a intervallum -fel történő Legendre-transzformációjának nevezzük.

Page 70: Newton törvényeitől a Higgs-bozonig

A Young-duális és a Legendre-transzformáció (2) ill. (4) definíciói értelmesek tetszőleges F szigorúan konvex függvényt véve (tehát nem csak a speciálisan választott ,

esetben), és a (3) összefüggés is mindig teljesül. Csak a Young-duális integrálos definíciója lesz kevésbé szép. Az általános esetben

,

ennek a Young-duálisa pedig

.

1ld. pl. Ana Cannas da Silva: Lectures on Symplectic Geometry, 122. old.2 ld. pl. V.I. Arnold: A mechanika matematikai módszerei, 67.old.3Az elnevezés oka, hogy a szóban forgó egyenlőtlenség W. H. Youngtól származik (On classes of summable functions and their Fourier series. Proc. Roy. Soc. London A 87, 225-229 (1912))

43. Egységnégyzetek és majdnem komplex sokaságok

A szimplektikus teve kapcsán láttuk, hogy a síkon a skalárszorzat segítségével szimplektikus struktúrát is definiálhatunk:

,

ahol a skalárszorzat, pedig a 90 fokos elforgatás operátora. Ha a síkot a komplex számsíkkal azonosítjuk, akkor az egyik irányban való 90 fokos elforgatás azonos a -gyel való szorzással.Ez indokolja, hogy tetszőleges vektortéren adott tulajdonságú lineáris leképezést a -n adott komplex struktúrának nevezzük. Egy komplex struktúrával rendelkező

-dimenziós valós vektortér tekinthető -dimenziós komplex vektortérnek is, ha egy vektor komplex számszorosának az vektort tekintjük. És fordítva: egy -

dimenziós komplex vektortér tekinthető egy komplex struktúrával rendelkező 2n-dimenziós valós vektortérnek. az A szimplektikus vektortéren adott komplex struktúrát -val kompatibilisnek nevezzük, ha a

bilineáris forma skalárszorzat, vagyis pozitív definit és szimmetrikus. Itt az bilineáris forma szimmetrikusságával ekvivalens feltétel

szimplektikussága, vagyis, a feltétel.1 Ekkor izometria is az

normára nézve, hiszen . Bizonyítható, ha -n egy

szimplektikus struktúra és egy skalárszorzat is adva van, akkor mindig létezik olyan kompatibilis komplex struktúra, ami a kettőt összekapcsolja, vagyis, amellyel

.2.

Page 71: Newton törvényeitől a Higgs-bozonig

Azt már tudjuk, hogy ha 2-dimenziós, akkor ugyanaz, mint a skalárszorzattal definiált terület. Értsük ezt úgy, hogy egy és oldalú egységnégyzet területe = 1 és

. Az “ és oldalú egységnégyzet” azt jelenti, hogy és . Több dimenzióban ez persze már nem így van:

gondoljunk arra, hogy 3-dimenzóban ha két egymásra merőleges vektor közül az egyiket valamilyen irányban 90 fokkal elforgatjuk, akkor az elforgatott vektor már csak akkor válik kollineárissá a másikkal, ha az elforgatás tengelye az általuk kifeszített síkra merőleges. Ha pedig az elforgatás tengelye épp az egyik vektor irányába esik, akkor

lesz. Általában pedig egy szimplektikus és euklideszi struktúrával is rendelkező vektortérben az egységnégyzet szimplektikus területe, vagyis

mindig 0 és 1 közé esik, hiszen ha és , akkor

,

ahol kihasználtuk izometrikusságát, és alkalmaztuk a Schwarz-Cauchy-Bunyakovszkij egyenlőtlenséget.

Vektorterekről sokaságokra térve a komplex struktúrát az érintőtereken kell megadni. Ha az érintőtereken megadott komplex struktúra a pont sima függvénye, akkor az illető sokaságot majdnem komplex sokaságnak nevezzük, az érintőterek komplex struktúráit együtt pedig a sokaság majdnem komplex struktúrájának. A majdnem komplex sokaságok páros dimenziósak és irányíthatók3. A vektorterekre mondott állításhoz hasonló érvényes a sokaságokra is: ha egy szimplektikus sokaságon adva van egy Riemann-metrika is, akkor létezik olyan majdnem komplex struktúra is -en, ami a kettőt összekapcsolja, vagyis amelyre .

1 Mert ha szimmetrikus, akkor , vagyis szimplektikus, ha pedig

szimplektikus, akkor , tehát szimmetrikus.2 ld. Ana Canas da Silva: Lectures on Symplectic Geometry, 68-69. old.3ld. Y.Choquet-Bruhat, C. DeWitt-Morette, M.Dillard-Bleick: Analysis, Manifolds and Physics, 331. old.

44. A gömbi inga, avagy előjáték a Maupertuis-elvhez

A már tárgyalt lineáris harmonikus oszcillátor fázistere 2-dimenziós, tehát a Hamilton-függvényének a nívóhalmazai 1-dimenziósak. Ezért az energiamegmaradás (vagyis, a Hamilton-függvénynek a Hamilton-folyam orbitjain állandósága) már önmagában meghatározza magukat az orbitokat is. Tehát valami bonyolultabb rendszert kell vennünk ahhoz, hogy lássuk, hogy mi az, ami meghatározza, hogy egy több dimenziós szintfelületen merre kanyarognak azok az orbitok. Mielőtt a konkrét példára térnénk, nézzük, mit mondhatunk erről általában.

Azt már tudjuk, hogy a Hamilton-függvény az általa meghatározott mechanikai rendszer fázistrajektóriáin (vagyis a Hamilton-folyam orbitjain) állandó1. Ez azt jelenti, hogy minden egyes fázistrajektória a Hamilton-függvény valamely nívóhalmazában halad teljes

Page 72: Newton törvényeitől a Higgs-bozonig

egészében. Az irányt a Hamilton-függvény szimplektikus gradiense adja meg, ami tehát mindig az adott ponthoz tartozó nívóhalmaz valamelyik érintője. Ha egyszer adva van egy ilyen nívóhalmaz, akkor ennek a nívóhalmaznak az érintői közül a mechanikai rendszerünk mozgásának megfelelő érintőt az a feltétel választja ki, hogy -nek a nívóhalmaz összes érintőjére “szimplektikusan merőleges”-nek kell lennie, vagyis teljesülnie kell, hogy

. Ez közvetlenül adódik abból, hogy a nívófelületben haladó tetszőleges görbén konstans, vagyis az ilyen görbék bármely érintőjével , másrészt, ha egy

fázistrajektória érintője (vagyis H szimplektikus gradiense), akkor . Lévén, hogy a szintfelület adott pontbeli érintőtere a

fázistér e pontbeli érintőterének 1 kodimenziójú altere, ez a feltétel egyértelműen meghatározza az vektor irányát. Szokás ezt úgy is mondani, hogy a nívófelület null-irányába mutat2.

Nézzük meg most ezt konkrétan a kis kitérésű gömbi inga esetében. Ennek a rendszernek a fázistere egy euklideszi normával ellátott 4-dimenziós szimplektikus vektortér. Az előző bejegyzésben mondottak szerint tehát létezik egy olyan komplex struktúra (vagyis egy

tulajdonságú lineáris transzformáció) is, ami a skalárszorzatot és az szimplektikus formát összekapcsolja:

.

A kis kitérésű gömbi inga Hamilton-függvénye:

.

A dimenziószámtól eltekintve ez a rendszer azonos a már tárgyalt lineáris harmonikus oszcillátorral.

A Hamilton-függvény nívóhalmazai itt 4-dimenziós gömbök 3-dimenziós héjai. A rendszer mozgását leíró orbitok mindig teljes egészében valamelyik gömbhéjon (-ban) kanyarognak, mégpedig a Hamilton-függvény szimplektikus gradiensének az irányában. A Hamilton-függvény szimplektikus gradiense az az vektor, amellyel minden vektorra

. Mivel most euklideszi térben vagyunk, értelme van magának a gradiensnek is. A Hamilton-függvény gradiense az a vektor, amellyel minden vektorra

. Ebből rögtön látszik, hogy az gradiens és a szimplektikus gradienst a komplex struktúra viszi egymásba:

,

hiszen .A transzformáció minden vektort egy rá merőleges vektorba visz, hiszen

. A szimplektikus gradiens tehát merőleges a gradiensre. Ez nem túl meglepő, hiszen a gradiens mindig merőleges a szintfelületre, a szimplektikus gradiens pedig a szintfelület érintője.Azt is tudjuk, hogy a gömbéj egy pontjába mutató helyvektor merőleges a gömb e pontbeli

érintőire (mivel minden, a gömbfelületen futó görbére ). Tehát a helyvektor is és a Hamilton-függvény gradiense is merőleges a szintfelületre, a szintfelület pedig 1 kodimenziójú, ezért ez a két vektor egyirányú. Vagyis akis kitérésű gömbi inga speciális esetében tetszőlege fázistrajektóriára

Page 73: Newton törvényeitől a Higgs-bozonig

valamely számmal.

Most válasszunk egy tetszőleges pontot az adott gömbhéjon és nézzük meg, milyen az az orbit, amelyik ezen a ponton halad át! Azt már tudjuk, hogy ez az orbit az vektormező ponton átmenő integrálgörbéje. Ez a vektormező a teljes 4-dimenziós vektorterünkön értelmezve van, így az és vektorok által kifeszített síkon is. Vegyük észre, hogy ezen a síkon a vektormező minden eleme ugyanennek a síknak az eleme, hiszen

. Tehát a Picard-Lindelöf-tétel szerint ezen a síkon létezik ennek a vektormezőnek az ponton átmenő integrálgörbéje. Az unicitás miatt ez egyúttal a teljes vektormezőnek is az ponton átmenő integrálgörbéje, vagyis maga a keresett orbit. Azt kaptuk tehát, hogy tetszőleges ponton átmenő orbit az és vektorok által kifeszített sík és a gömbhéj metszetében halad. Ez a metszet egy origó középpontú, sugarú kör, vagyis a gömb egy főköre. Mivel a főkör az és által kifeszített szimplektikus síkban van,

és ebben a síkban az egységnégyzet szimplektikus területe =, a főkör által határolt körlap szimplektikus területe . Vagyis a főkörök közül pontosan azok a fázistrajektóriák, amelyek maximális (ellenkező irányítással véve minimális) szimplektikus területű körlapot határolnak.

Ez az eredmény erősen emlékeztet a Maupertuis-elvre, különösen, ha tudjuk, hogy ez a bizonyos szimplektikus terület nem más, mint a Maupertuis-elvben szereplő rövidített hatás.

1 hiszen, ha a trajektória érintője, akkor Itt az utolsó előtti egyenlőség maga a Hamilton-egyenlet, vagyis az a feltétel, hogy a Hamilton-függvény szimplektikus gradiense.

2Egy szimplektikus vektortér minden 1 kodimenziójú (vagyis a vektortér dimenziójánál 1-gyel kisebb dimenziójú) altere koizotróp, vagyis tartalmazza a saját szimplektikus ortogonális komplementerét (hiszen, ha nem tartalmazná, akkor az egy olyan altér lenne, amelynek a vektorai a vektorér összes vektorára szimplektikusan merőlegesek, ami ellentmond a szimplektikus forma nemelfajuló tulajdonságának). Mivel egy szimplektikus vektortér tetszőleges alterére és az ő szimplektikus ortogonális komplementer alterére

, ebből az is következik, hogy esetén , tehát a nívóhalmaz érintőterének a null-iránya egyértelmű. Másképp

fogalmazva a nívóhalmaz már önmagában meghatározza a trajektória érintőjének az irányát. (ld. da Silva: Lectures on Symplextic Geometry 8. old., ill. Yakov Eliashberg, Lisa Traynor: Symplectic Geometry and Topology, 11. old.)

45. A kis kitérésű gömbi inga és a Maupertuis-elv

Nem mondom még el pontosan, mi az a Maupertuis-elv, csak annyit árulok el róla, hogy adott mechanikai rendszer két adott konfigurációját összekötő ténylegesen lehetséges pályát (vagy pályákat) választja ki az összes olyan pálya közül, amelyek adott összenergiához tartoznak. Az “adott összenergiához tartozó pálya” alatt a Hamilton-függvény adott nívóhalmazában haladó (bármilyen) görbének a konfigurációs térre eső vetületét (mint halmazt) értem, “ténylegesen lehetséges pálya” pedig a Hamilton-függvény valamely orbitjának a konfigurációs térre eső vetületét (mint halmazt).A kis kitérésű gömbi inga esetén az adott összenergiához tartozó pályák egy adott 4-

Page 74: Newton törvényeitől a Higgs-bozonig

dimenziós gömb 3-dimenziós felületén (-ben) tetszőlegesen haladó görbének a vetületei, a ténylegesen lehetségesek pedig – mint láttuk – a gömb szimplektikus főköreinek (vagyis a gömb és az origón átmenő szimplektikus síkok metszeteinek) a vetületei.

Vizsgáljuk meg, hogy adott összenergia és adott kezdőpont esetén mik a ténylegesen megvalósuló pályák! Nyilván ezek közül fognak kikerülni azok is, amelyek egy másik adott ponton mennek át. A “kezdőpont” a 2-dimenziós konfigurációs tér egy pontja, amelyhez a fázistérnek (=koérintőnyaláb) az adott pont feletti 2-dimenziós érintőtere – más szóval az érintőnyalábnak az adott ponthoz tartozó fibruma tartozik. Ennek a fibrumnak a gömbbel való metszete vagy üres, vagy egyetlen pont, vagy egy kör.

Ha a metszet üres, akkor nincs miről beszélni: az adott ponton keresztül nem létezik lehetséges pálya.

Ha a metszet egy pont, akkor ez a pont az origótól távolságra lévő fibrum 0 eleme. Az ehhez a ponthoz tartozó szimplektikus sík konfigurációs térre való projekciója egy origón átmenő és arra szimmetrikus hosszúságú szakasz. Ekkor ez az egyetlen lehetséges pálya. Az adott energiához tartozó pályából viszont sok van: a gömb felületén haladó és ezen a bizonyos ponton áthaladó tetszőleges görbe vetülete ilyen. Mint például az origó körüli sugarú kör.

Az igazán érdekes eset az, amikor a metszet egy kör. Mivel a főkörök az origóra szimmetrikusak, annyit máris tudunk, hogy minden lehetséges pálya a körnek az origóra vonatkozó tükörképének valamelyik pontján is átmegy. Ennek a tükörkép-körnek a konfigurációs térre való vetülete azonos a kör konfigurációs térre vonatkozó vetületének az origóra való tükörképével. Tehát adott ponton átmenő mindegyik lehetséges pálya átmegy a pontnak az origóra való tükörképén. Ugyanemiatt minden lehetséges pálya szimmetrikus az origóra nézve.

A lehetséges pályák ilyesmik, mint amik ezen az ábrán láthatók:*

Page 75: Newton törvényeitől a Higgs-bozonig

Az itt ábrázolt pályák egyenletei:

Mindegyik pálya az pontból indul ki, ami a fázistér síkjának a konfigurációs térre eső vetülete. Az adott

energiaérték , vagyis fázistérbeli orbitok egy sugarú gömbhéj szimplektikus főkörei. Ennek a gömbnek és az síknak a metszete a kör. A lila, zöld, piros és kék pályák ennek a körnek rendre a ill. értékekhez tartozó pontjából kiinduló orbitnak a vetületei.Az pontból kiinduló orbit az kör, ahol az

komplex struktúra.A színes görbék tehát rendre a értékekhez tartozó

fázistérbeli orbitoknak az síkra eső vetületei.

Látható, hogy a és egy másik kijelölt pont között ha van lehetséges pálya, akkor az nem egyértelmű. A ponton az összes lehetséges pálya átmegy, a többin meg kettő.

A Maupertuis-elvet mi már a legelején felhasználtuk azzal, hogy csak szimplektikus főköröket vettünk. A szimplektikus főkörök abban különböznek a többitől, hogy azokon az egységnégyzet szimplektikus területe maximális, vagyis 1. A szimplektikus terület a szimplektikus forma integráljának az abszolút értéke. Mivel a szimplektikus 2-forma a tautologikus 1-forma külső deriváltja, Stokes tétele szerint a szimplektikus formának egy adott irányított felületre való integrálja egyenlő a tautologikus formának a felület határára vett integráljával. Egy mechanikai rendszer orbitjai általában nem zárt görbék, vagyis nem határolnak semmilyen felületet amire a szimplektikus formát integrálni lehetne, ellenben a tautologikus formát mindig lehet integrálni rájuk. A tautologikus formának egy adott fázistérbeli görbére vett integrálját az adott görbéhez tartozó rövidített hatásnak nevezzük. Speciálisan zárt görbe esetén ez egyenlő a tautologikus forma integráljával, vagyis az előjeles szimplektikus területtel. Maupertuis elve azt állítja, hogy a mechanikai rendszer két elég közeli konfigurációs pont (azaz két elég közeli fázistérbeli fibrum) között a Hamilton-függvény nívóhalmazában úgy mozog, hogy a hozzá tartozó rövidített hatás lokálisan extrémális a szomszédos, szintén ugyanebben a nívóhalmazban futó, és ugyanezt a két fibrumot összekötő görbékhez tartozó rövidített hatásokhoz képest.

A Maupertuis-elvet a szimplektikus mechanikában bizonyítani lehet. A bizonyítás heurisztikusan annyi, hogy a fázistrajektóriát és egy hozzá közeli görbét véve a tautologikus formának a két görbén számolt integráljainak a különbsége a két görbe közé zárt felületdarab szimplektikus területe, és ez a felületdarab olyan paralelogrammával közelíthető, aminek az egyik oldala null-irányú (ld. az előző bejegyzést), tehát ennek a paralelogrammának a szimplektikus területe 0. Ez azt jelenti, hogy a két görbén vett integrálok különbsége a görbék eltérésénél nagyobb rendben tart 0-hoz, vagyis az integrálnak extrémuma van a fázistrajektórián (ld. V.I. Arnold: A mechanika matematikai módszerei 233-234. oldal, vagy az angol nyelvű kiadásban 243-244. oldal)

46. A gömbi inga és a Hopf-fibrálás

Page 76: Newton törvényeitől a Higgs-bozonig

Maradjuk a kis kitérésű gömbi ingánknál! Azt már tudjuk, hogy Hamilton-függvényének a nívóhalmazai a 4-dimenziós gömb 3-dimenziós héjai, és azt is, hogy az ponton átmenő orbit az sugarú gömbhéj és az és vektorok által kifeszített sík metszeteként előálló főkör. Itt az szimplektikus formával és a metrikával kompatibilis komplex struktúra, vagyis amelyre

és , vagy másképp írva .1 Világos, hogy ezeknek a főköröknek az egyesítése kiadja a teljes gömbhéjat, hiszen a gömbhéj tetszőleges pontjához létezik egy ilyen főkör. Ami nem teljesen nyilvánvaló, az az, hogy egyrészt ezek a

főkörök páronként diszjunktak, másrészt, minden főkör , vagyis a 2-dimenziós gömbhéj egy-egy pontjának feleltethető meg kölcsönösen egyértelmű módon. Ezt – az alábbiakban részletesen ismertetendő – megfeleltetést nevezik Hopf-leképezésnek. A 3-dimenziós gömbhéj (vagyis ) ezzel a leképezéssel, mint projekcióval az bázistér feletti fibrumú fibrált nyalábbá válik, ezért ezt a konstrukciót más néven Hopf-fibrálásnak is nevezik, az így előálló fibrált nyalábot pedig Hopf-nyalábnak.

Az említett Hopf-leképezés úgy mondható el legegyszerűbben, ha a komplex struktúránkat szó szerint vesszük és a szokásos síkok mindegyikét egy-egy komplex síkkal azonosítjuk, vagyis -et -nek fogjuk fel. Ebben a felfogásban a komplex struktúra az képzetes egységgel való szorzás, hiszen

.

Az és vektorok által kifeszített sík az alakú pontok halmaza, ahol

, vagyis .

Mivel esetén , egy ilyen sík azon pontjaiból áll, amelyeknek a második és

első (komplex) koordinátájának a hányadosa -vel egyenlő. A szóban forgó, értékhez tartozó főkörök mindegyike tehát egy komplex számnak feleltethető meg,

méghozzá a -nek, a síkjuk pedig a sík. Látható, hogy ezeknek a síkoknak csak az origó a közös pontjuk (hiszen -ből esetén következik), tehát esetén a körök valóban diszjunktak. A értéknek megfelelő

síkbeli főkört pedig a komplex számsík “végtelen távoli pontjának” feleltetjük meg (ez a főkör ugyancsak diszjunkt a többitől, hisz azoknak nincs 0 első koordinátájú pontjuk). A végtelen távoli ponttal kiegészített sík viszont -vel azonosítható2, így a szimplektikus főköröket (vagyis a kis kitérésű gömbi inga fázistrajektóriáit) mint fibrumokat végülis -re vetítettük. Ezt nevezik Hopf-fibrálásának.

A Hopf-fibrálásról nagyon szemléletes, angol nyelvű magyarázattal ellátott animáció található a http://dimensions-math.org/Dim_reg_AM.htm sorozat 7. fejezetében.

1 Ld. a 43. bejegyzést2 Ld. Riemann-gömb, pl. itt.

47. Vektorabb a grad-nál a rot

De miért? Hiszen mindkettő vektor, nem? A grad egy skalárfüggvény szintfelületeire merőleges, a rot (más néven curl) pedig valamiféle örvénylés síkjára merőleges1, nem? Csakhogy a merőlegesség metrikafüggő, ezért ezek a vektorok a metrikától függnek. De a rot iránya mégis metrikafüggetlen, mindjárt elmondom, miért.

Page 77: Newton törvényeitől a Higgs-bozonig

A vektoranalízisben úgy tanítják, hogy a grad és rot skalár- illetve vektormezők parciális deriváltjaiból számolható vektorok, a differenciálformák elméletében pedig azt, hogy ezek differenciálformák külső deriváltjainak felelnek meg. Az utóbbi felfogás tekinthető általánosabbnak, mert differenciálformák és külső deriválás tetszőleges differenciálható sokaságokon létezik, de ha speciálisan egy Riemann-metrika is adva van egy 3-dimenziós sokaságon (vagyis, ha az érintőterek 3-dimenziós euklideszi terek, esetleg maga a sokaság is euklideszi tér), akkor kérdéses differenciálformákat is és a külső deriváltjukat is vektoroknak lehet megfeleltetni a sokaság minden pontjában, mégpedig úgy, hogy a külső deriváltnak megfeleltetett vektorok az eredeti differenciálformáknak megfeleltetett skalár- ill. vektormező grad, ill. rot vektorai a vektoranalízises definíció értelmében. A grad nulladrendű, a rot pedig elsőrendű differenciálforma külső deriváltjából származtatható.

grad

A nulladrendű differenciálforma egy a sokaságon megadott valós értékű függvény, tehát maga az a skalármező, amiről a vektoranalízisben szó van. Ennek a 0-formának a külső deriváltja egy 1-forma, vagyis a sokaság minden pontjában az ottani érintőtéren értelmezett lineáris funkcionál. Ha ez az érintőtér euklideszi tér, akkor minden lineáris funkcionál megfeleltethető annak a vektornak, amivel való skaláris szorzás épp a szóban forgó lineáris funkcionálnak a hatásával egyenlő. Világos, hogy az, hogy milyen irányú és nagyságú vektort feleltetünk meg így a lineáris funkcionálnak, az attól függ, hogy milyen skalárszorzat van definiálva az érintőtéren. Vagyis a grad vektornak az iránya is és a nagysága is az euklideszi struktúrától függ.

rot (curl)

Ez már trükkösebb egy kicsit. Egy 1-forma nem maga a vektoranalízisbeli vektormező, de a fent említett módon a skalárszorzat segítségével azonosítható egy vektormezővel. Az azonosítás konkrét módja természetesen függ az érintőtereken definiált skalárszorzattól, vagyis a Riemann-metrikától. Az 1-forma külső deriváltja viszont egy 2-forma, amit általában nem tudunk vektormezővel azonosítani. De csak általában nem. Egy n-dimenziós vektortéren

az (n-1)-edrendű antiszimmetrikus multilineáris formák -dimenziós vektorteret

alkotnak, az n-edrendűek pedig -dimenziósat. Ezért egy (n-1)-edrendű antiszimmetrikus multilineáris forma konstans szorzótól eltekintve egyértelműen azonosítható azzal a vektorral, amit az n db vektorhoz n-ediknek hozzávéve az n db vektor által kifeszített n-dimenziós paralelepipedon térfogata megegyezik az (n-1)-formánknak az eredeti n-1 db vektoron felvett értékével. Mivel a térfogat (akár, mint egy antiszimmetrikus n-lineáris forma, akár, mint egy eltolásinvariáns Haar-mérték) konstans szorzó erejéig egyértelmű, a kérdéses n-edik vektorunk konstans szorzó erejéig egyértelmű. Speciálisan n=3 esetén tehát tetszőleges 2-formához van olyan vektor, hogy

.

Van tehát egy olyan irány, ami közvetlenül az adott elsőrendű differenciálformából származtatható metrika nélkül is. Ez az irány a differenciálformának megfeleltetett vektormező rot (curl) vektorának az iránya. Mivel ez az irány nem függ a metrikától, ezért mondom, hogy “vektorabb” a grad-nál a rot. Persze csak akkor, ha az 1-formából és nem vektormezőből indulok ki, merthogy az 1-forma és a vektormező egymásnak való megfeleltetése metrikafüggő. Tehát csak egy 1-forma rotációja vektorabb, mit a grad, vektormező rotációja már nem!

Page 78: Newton törvényeitől a Higgs-bozonig

Ezzel a bizonyos iránnyal egyébként már találkoztunk is, amikor megállapítottuk, hogy a szimplektikus formának az érintőtér 1-kodimenziójú V alterein van egy bizonyos “null-iránya”, vagyis egy olyan 1-dimenziós altere, amelybe tartozó vektoroknak V minden elemével való szimplektikus szorzata 0. És valóban, , tehát ez az irány valóban az r vektor iránya.

1 Egy egyenletes forgás sebességmezejének megfelelő vektormező rotáció (curl) vektora a szögsebességvektor kétszerese (ld.Gibbs, Josiah Willard; Wilson, Edwin Bidwell (1902), Vector analysis, 155-156. old.).