51
Hippias Nikomedes Arkimedes Pappus al-Khwärizmi al-Khayyãmi Cardano Viète Lagrange Descartes Gauss Abel Galois Wantzel ......... Et bevis for umuligheden Et bevis for umuligheden Et bevis for umuligheden Et bevis for umuligheden af at tredele en generel af at tredele en generel af at tredele en generel af at tredele en generel vinkel med passer og lineal vinkel med passer og lineal vinkel med passer og lineal vinkel med passer og lineal Erik Vestergaard

Et bevis for umulighedenEt bevis for umuligheden af at ...Pappus al-Khwärizmi l l..... Et bevis for umulighedenEt bevis for umuligheden af at tredele en generelaf at tredele en generel

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

  • HippiasNikomedesArkimedes

    Pappusal-Khwärizmial-Khayyãmi

    CardanoViète

    LagrangeDescartes

    GaussAbel

    GaloisWantzel

    .........

    Et bevis for umulighedenEt bevis for umulighedenEt bevis for umulighedenEt bevis for umuligheden af at tredele en generelaf at tredele en generelaf at tredele en generelaf at tredele en generel vinkel med passer og linealvinkel med passer og linealvinkel med passer og linealvinkel med passer og lineal

    Erik Vestergaard

  • Indholdsfortegnelse 1. Indledning ..............................................................................................3

    1.1 Historisk introduktion.....................................................................3 1.2 Færre hjælpemidler .........................................................................5 1.3 Konstruktion med passer og lineal .................................................5 1.4 En bevisstrategi.............................................................................10

    2. Abstrakte mængder ..............................................................................11 2.1 Lidt om ringe og legemer .............................................................11 2.2 Vektorrum.....................................................................................14

    3. Polynomier...........................................................................................19 3.1 Nogle definitioner .........................................................................19 3.2 Polynomiets division ....................................................................19 3.3 Største fælles divisor.....................................................................21 3.4 Euklids algoritme..........................................................................22

    4. Faktorisering ........................................................................................27 4.1 Irreducible polynomier .................................................................27 4.2 Kriterier for irreducibilitet ............................................................30

    5. Legemsudvidelser ................................................................................35 5.1 Simple udvidelser .........................................................................35 5.2 Simple algebraiske udvidelser ......................................................36 5.3 Egenskaber for simple algebraiske udvidelser .............................38 5.4 Graden af en legemsudvidelse ......................................................40

    6. Umulige konstruktioner .......................................................................45 6.1 Algebraisk formulering.................................................................45 6.2 Terningens fordobling og vinklens tredeling................................47

    Litteratur ..................................................................................................49 Stikordsregister ........................................................................................50

  • 3

    1. Indledning Umuligheden af at tredele vinkler med passer og lineal er normalt et emne, som hører hjemme på universitetet. Det kan for eksempel følge som et biprodukt under gen-nemgangen af emnet Galois-teori, der blandt andet handler om betingelser for eksi-stensen af løsninger til polynomieligninger. Jeg har gennem nødvendige udpenslin-ger og udeladelser af unødvendigt stof, forsøgt at lave en note, som kan forstås af kvikke gymnasieelever. Beviset er komplet og stiller ikke krav om nogen forudsæt-ninger, der ligger udover, hvad der gennemgås i gymnasiet. Alligevel må noten nok siges at være på ”4g-niveau”, idet det kræver en vis matematisk modenhed at kunne overskue et så langt bevis og at mestre nogle af de mere tekniske passager. Min note er desuden stilet til enhver person, som længe har ønsket sig at se et rigtigt bevis for et af matematikkens klassiske problemer. Referencerne [3] og [7] giver også beviser for umuligheden af generelt at tredele vinkler med passer og lineal. Beviset i [3] overlader mange detaljer til læseren. Be-viset i den udmærkede bog [7] angriber problemet med nogle forholdsvist ad hoc me-toder, som fører hurtigt til målet. Selv om det fylder noget mere, har jeg valgt at bygge teorien mere systematisk op. Dermed menes indførelse og beskrivelse af simp-le algebraiske udvidelser og irreducible polynomier. Disse emner er endvidere vig-tige, hvis man senere skulle få lyst til at kigge på et bevis for et beslægtet og mere kompliceret problem: Umuligheden af at fremstille en formel til bestemmelse af rød-derne i en generel femtegradsligning. Ønsker man en mere simpel introduktion til emnet med at konstruere med passer og lineal, kan jeg henvise til en af mine tidligere noter: Klassiske konstruktioner med passer og lineal. Den er på et niveau, som skulle kunne forstås af 1g matematikere. 1.1 Historisk introduktion I matematikkens historie er der en række problemer, som har tiltrukket sig ekstra op-mærksomhed. Blandt disse er de over 2000 år gamle, såkaldt klassiske problemer: Cirklens kvadratur, terningens fordobling og vinklens tredeling. Alle handler om konstruktioner med passer og lineal. I det første problem ønsker man at konstruere et kvadrat med samme areal som en cirkel, i det andet at konstruere en terning med dobbelt så stort volumen som volumenet af en given terning, mens man i det tredje problem søger efter en generel fremgangsmåde til at tredele vinkler. I dag ved man, at ingen af de tre konstruktioner er mulige, når man holder sig til de strenge regler, som blev udviklet af de gamle grækere. En forklaring på hvorfor netop konstruk-tioner med passer og lineal blev dyrket med så stor interesse, skal søges i den om-stændighed, at grækerne betragtede cirklen og linjen som de eneste ”perfekte” geo-

  • 4

    metriske figurer. For grækerne var det eksakte konstruktionsmetoder, som talte, ikke approksimative løsninger. I modsætning til ægypterne, der hovedsagligt anvendte matematikken til at løse praktiske opgaver, var matematikken i grækernes øjne en højt hævet åndelig og filosofisk disciplin. I modsætning til terningens fordobling, har man ingen overleveringer, der fortæller om, hvordan eller hvornår problemet med at tredele vinkler med passer og lineal op-stod. Måske var det ønsket om at konstruere regulære polygoner, der satte grækerne i gang. Det kan også have haft forbindelse med tredelingen af et linjestykke eller hal-veringen af en vinkel, som man jo havde fundet løsningen på. Flere af de gamle grækere angav løsningsforslag, der involverede hjælpemidler, som ikke er tilladte under de strengeste krav for konstruktion med passer og lineal. Arkimedes (287 f. Kr. – 212 f.Kr.) anvendte både en indskydningsmetode og en konstruktion ved hjælp af en ”spiral”, Nikomedes (ca. 220 f.Kr.) anvendte en såkaldt ”konkoide”, Hippias (ca. 420 f.Kr) en såkaldt ”kvadratrice” og Pappus fra Alexandria (ca. 290 – ca. 350) et keglesnit. Middelalderen bragte ikke nogen videre fremgang hvad angår bestræbel-serne på at nå en løsning. Den katolske kirke var i centrum, og den opmuntrede ikke til rationel tænkning. Derimod var det araberne, som bragte problemet nærmere en løsning. Dels fandt man flere metoder til at løse vinkeltredelingen ved hjælp af keg-lesnit, dels opdagede man, at problemet var ækvivalent med løsning af en tredje-gradsligning. Araberen al-Khwärizmi (ca. 780 – 850) arbejdede med løsninger til andengradsligningen, mens Umar al-Khayyãmi (1048 – 1131) beviste, at alle tredje-gradsligninger kan løses med keglesnit. Langsomt viser det sig, at algebraen (gennem ligningerne) således kom til at spille en central rolle i opgaven med at løse de geome-triske konstruktionsproblemer. Jeg vil ikke gå yderligere ind på den videre udvikling, blot nævne, at berømte matematikere som Girolamo Cardano (1501 – 1576), Fran-cois Viète (1540 – 1603), René Descartes (1596 – 1650), Joseph-Louis Lagrange (1737 – 1813), Niels Henrik Abel (1802 – 1829) og Evariste Galois (1811 – 1832) alle leverede vigtige bidrag til en opklaring af problemet med at konstruere med passer og lineal, enten direkte eller indirekte. Læsere, som ønsker nærmere redegø-relse herfor henvises til den fremragende bog [7]. En af alle tiders største matemati-kere, Carl Friedrich Gauss (1777 – 1855), tog et vigtigt skridt fremad, da han i en alder af kun 18 år fandt en metode til at konstruere en regulær 17-kant med passer og lineal og derefter desuden angav kriterier for, hvilke regulære polygoner, der kan konstrueres med passer og lineal. Han påstod desuden, at hvis disse kriterier ikke er opfyldt, så er den regulære polygon ikke konstruérbar. Det hævdes, at Gauss’ op-dagelser med de regulære polygoner var med til at overbevise ham selv om, han skul-le vi sit liv til matematikken. Faktisk følger det ret nemt af Gauss’ postulater, at en vinkel på 60 grader ikke kan tredeles. Gauss offentliggjorde dog aldrig noget bevis. Han påstod blot, at problemerne med at fordoble terningen og tredele vinklen var umulige. Først i 1837 blev der givet et bevis for umuligheden af at tredele en generel vinkel med passer og lineal. Pariseren Pierre Laurent Wantzel (1814–1848) var man-den, der leverede varen. Han var som ung usædvanlig fremmelig, ikke bare i mate-

  • 5

    matik men også i filosofi, historie og musik. Her udviste han overalt lige stor intel-lektuel overlegenhed. Han kastede sig over studierne med stor iver og arbejdede ofte til langt ud på natten. Nogle mener at hans irregulære arbejdsmønster, sammen med den omstændighed, at han påtog sig usædvanligt mange opgaver, var skyld i, at han ikke blev ældre. Hvad angår hans matematiske resultater, så var de betydelige, selv om nogle af de største byggede på andres arbejder. At han ikke nåede at udrette end-nu mere tilskrives af nogle hans særegne levevis og bredden sig over for mange emner. 1.2 Færre hjælpemidler I sidste afsnit så vi, at grækerne for at løse problemerne med konstruktion med passer og lineal, ofte så sig nødsagede til at udnytte ekstra hjælpemidler, såsom keglesnit, indskydningslineal, spiral etc. Nogle undersøgelser gik imidlertid også i modsat ret-ning: Man søgte efter mere restriktive krav til konstruktionerne. I renæssancen stude-rede man således konstruktioner med en lineal og en rusten passer, dvs. en passer med konstant radius. Det viste sig, at man selv med disse begrænsede hjælpemidler kunne konstruere en lang række geometriske figurer, ja faktisk kan alle figurer, der kan konstrueres med passer og lineal, også konstrueres med lineal og en rusten pas-ser. Her gav danskeren Georg Mohr (1640 – 1697) også sit bidrag i sit skrift Com-pendium Euclidis Curiosi fra 1673. Georg Mohr udgav endvidere i året 1672 et endnu mere interessant skrift, nemlig Euclidus Danicus. Heri viser Mohr, at alle konstruktionsproblemerne fra Euklids Elementer kan løses med passer alene. Når man har to punkter, så kan man selvfølge-lig ikke tegne linjen igennem dem, da der ingen lineal er til rådighed. For at kunne tale om at konstruere trekanter m.m. betragtede Mohr den ”indbildte linje” som givet, hvis to punkter på den er konstrueret. Restriktionerne går derimod på, at nye punkter kun må konstrueres som skæringer mellem cirkler. Essencen af Mohrs arbejde er, at disse begrænsede hjælpemidler ikke betyder, at man kan konstruere færre figurer, konstruktionerne bliver blot mere komplicerede. Mohr’s værk blev desværre glemt og i stedet fik italieneren Lorenzo Mascheroni (1750 – 1800) æren for resultatet, før Georg Mohr’s bidrag blev genopdaget i dette århundrede. Endnu senere, i 1822, viste Jean Victor Poncelet (1788 – 1867), at alle konstruk-tioner, som kan udføres med passer og lineal, kan udføres med en lineal alene, hvis der er givet en fast cirkel i planen og dennes centrum. 1.3 Konstruktion med passer og lineal Opgaven med denne note er som nævnt at bevise, at det er umuligt at finde en meto-de til at tredele en generel vinkel. Personer, som ikke er trænet i matematisk deduktiv argumentation, vil ofte misforstå dette budskab derhen, at det endnu ikke er lykkes nogen at finde en metode. Derfor indsender amatørmatematikere stadig ”løsninger”

  • 6

    til universiteter og større læreanstalter i håbet om at høste berømmelsen for at have løst en af matematikkens store problemer. Det eneste man kan sige er, at der er en fejl i argumenterne, hvad enten det er muligt at gennemskue de ofte snørklede løs-ningsforslag eller ej. Sagen er nemlig, at det i 1837 endegyldigt blev bevist, at uanset hvor genial man er, så vil det aldrig kunne lykkes at finde en metode – en sådan findes ganske simpelt ikke. Men hvordan kan man da lave et bevis, som på en gang tager højde for alle mulige tænkelige fremgangsmåder? Svaret er, at man må gå meget systematisk til værks. Første punkt vil være at præcisere helt nøjagtigt, hvilke konstruktioner, som er tilladelige. Lad os begynde med det: Definition 1.1

    Begrebet konstruktion med passer og lineal dækker over følgende operationer: 1) Tegne den rette linje igennem to allerede fundne eller givne punkter. Eller at

    forlænge et linjestykke, så langt man ønsker. 2) Tegne en cirkel med et allerede fundet eller givet punkt som centrum og med

    en radius, som er lig med afstanden mellem to allerede fundne eller givne punkter.

    3) Finde nye punkter som skæringspunkterne for allerede fundne eller givne rette

    linjer og cirkler. Definition 1.2

    Lad der være givet en mængde 2A ⊂ , altså en mængde af punkter i planen. Med udgangspunkt i mængden af punkter A kan vi konstruere en række nye punkter ved brug af reglerne 1), 2) og 3) ovenfor. Vi vil lade ( )ARC betegne mængden af alle de punkter, som udfra A kan konstrueres ved brug af endeligt mange af ovennævnte operationer. Specielt mængden { }( )(0, 0); (1, 0)=RC RC vil vi betegne som Mængden af konstruérbare punkter. Det er vores hensigt at undersøge mængden RC , altså finde ud af hvilke punkter i planen, der er konstruérbare. Bemærk, at vi som udgangspunkt kun har de to punkter (0,0) og (1,0), som indtegnet i et koordinatsystem på figur 1 side 8. Lad os starte på at konstruere nogle flere punkter: Vi kan for eksempel bruge regel 1) og tegne linjen igennem de to punkter – den vil være sammenfaldende med x-aksen. Dernæst kan vi bruge regel (2) og tage afstanden 1 i passeren, svarende til afstanden mellem (0,0) og (1,0), og med centrum i (0,0) tegne en cirkel. Den skærer vores tidligere konstruerede linje i punktet A(–1,0), som dermed er konstruérbart. Vi fortsætter og laver en cirkel med centrum i (1,0) og radius 1. Denne cirkel skærer linjen i punktet B(2,0), som

  • 7

    dermed også er i RC . Desuden skærer cirklen den anden cirkel i punkterne 312 2( , )C og 312 2( , )D − . Derefter kan en linje tegnes igennem C og D til skæring med den anden linje i E. Endnu tre punkter i RC ! Resultatet kan ses på figur 2. Definition 1.3

    Vi vil sige, at vi kan konstruere tallet a, såfremt vi kan konstruere to punkter med indbyrdes afstand a, hvis a er et positivt tal, og –a, hvis a er et negativt tal. Med denne definition har vi altså straks vist, at blandt andet følgende tal kan konstru-eres: –1, 1, 2, 3, 12 og

    32 .

    Før vi går videre vil vi lige overveje nogle ting. Ovennævnte tre regler i definition 1.1 er dem, der gælder, når der tales om at konstruere med passer og lineal. Nogle ville måske hævde, at de nævnte regler for konstruktion er lovligt restriktive i forhold til dem, de blev præsenteret for i folkeskolen. Her måtte man af praktiske årsager ofte tage en vilkårlig afstand i passeren, når man konstruerede. I vores definition skal denne afstand svare til afstanden mellem to allerede konstruerede eller givne punkter. Hvis man tænker nærmere over det, så var det egentligt ikke klart, hvilke krav, der blev stillet til en ”lovlig” konstruktion i folkeskolen – det lå højst i luften. Tager man reglerne helt bogstaveligt kunne man jo i princippet konstruere et hvilken som helst punkt, bare man var ”heldig” at tage en bestemt afstand i passeren. Det har imidlertid aldrig været meningen. Man kan formulere det ofte usagte således, at man kun måtte tage en vilkårlig afstand i passeren, hvis det punkt (eller den linje), man endte med at konstruere, ikke afhang af den valgte passeråbning. Dette er tilfældet med en række af de typiske konstruktionsmetoder, som jeg vil forudsætte, at læseren er bekendt med: Oprejse en normal i et punkt på en linje, nedfælde en normal igennem et punkt til en linje, konstruere en vinkelhalveringslinje, konstruere en linje igennem et punkt parallel med en anden linje etc. . . . Det viser sig, at langt fra alle reelle tal er konstruérbare. Vi har ovenfor fundet nogle få af de tal, som er konstruérbare. For at komme videre må vi gå langt mere systema-tisk til værks. Her kommer følgende sætning belejligt:

    Sætning 1.4

    Hvis a og b er konstruérbare tal, så er også , , , oga b a b a b a b a+ − ⋅ konstruérbare.

  • 8

  • 9

    Bevis for sætning 1.4: At summen og differensen af to konstruérbare tal a og b igen er konstruérbart følger nemt af figur 3, idet stykkerne a og b afsættes ud af samme linje. Hvad angår produktet at a og b, så kan det stykke konstrueres på følgende måde (figur 4): Afsæt linjestykket AD med længde a og linjestykket AB med længde 1 ud af samme linje. Udnyt nu et af punkterne udenfor linjen gennem A og B til at lave en vinkel med toppunkt i A. Størrelsen af vinklen er ligegyldig. Afsæt derefter linje-stykket AC med længde b ud af det nye vinkelben. Punkterne B og C forbindes med en linje. Igennem D og parallel med BC konstrueres nu en linje til skæring med for-længelsen af benet AC i punktet E. Så vil linjestykket AE have den ønskede længde, hvilket ses ved at udnytte, at ABC∆ og ADE∆ er ensvinklede. Hvis k er forstørrel-sesfaktoren fås:

    (1) 1aAE k AC b a b= ⋅ = ⋅ = ⋅

    En lignende konstruktion viser, at a b er konstruérbart (figur 5). Detaljerne overla-des til læseren. Tilbage er at vise, at kvadratroden af et konstruérbart tal igen er konstruérbart: Afsæt stykkerne a og 1 i forlængelse af hinanden ud af samme linje (figur 6). Konstruér midtpunktet M af AC og tegn halvcirklen med centrum i M og radius lig med AM . Oprejs den vinkelrette til AC i punktet B til skæring med halvcirklen i punktet D. Så er BD a= , som vi skal argumentere for i det følgende: For det første er ADC∠ en periferivinkel til den udartede centervinkel AMC∠ . Altså må førstnævnte vinkel være halvt så stor som den sidste, altså 1 12 2 180 90ADC AMC∠ = ⋅∠ = ⋅ ° = ° . Dette bruges til at vise, at ABD∆ og BCD∆ er ensvinklede. Detaljerne overlades igen til læseren. Da forstørrelsesfaktoren er 1k x= fås:

    (2) 21x k a a x a x ax

    = ⋅ = ⋅ ⇔ = ⇔ =

    Bemærkning 1.5

    Med sætning 1.4 har vi ikke blot, at ⊂RC , man kan også tage kvadratrødder og stadig blive i mængden RC . For eksempel er følgende tal konstruérbart:

    37 2 11 7 26 19

    − ++

  • 10

    1.4 En bevisstrategi I sætning 1.4 så vi, at mængden af alle konstruérbare tal RC er stabil med hensyn til addition, subtraktion, multiplikation, division og kvadratrodsuddragning. Hermed menes, at man bliver i mængden, hvis man foretager disse operationer på tal i mæng-den. Men hvilke tal indeholder RC egentligt? Lad være den linje, som passerer igennem (0,0), og som danner en vinkel på 20° med x-aksen. Vi skal vise det meget overraskende resultat, at det eneste punkt på , som kan konstrueres, er (0,0). Dette betyder, at det vil være umuligt at tredele en vin-kel på 60°, fordi det kræver to punkter på for at kunne tegne linjen.

    Måden at vise ovenstående på er dog ikke simpel. Vi skal gøre brug af en helt anden gren af matematikken, nemlig algebraen. Givet en mængde af punkter i planen. Koordinaterne til mængdens punkter genererer et såkaldt legeme, som er en algebra-isk størrelse. Tilføjer man et nyt punkts koordinater til legemet, genereres en såkaldt legemsudvidelse. Man kan tildele en udvidelse en grad. En grundsten i beviset består i at vise, at hvis et punkt skal være konstruérbart, så skal den legemsudvidelse, punk-tet giver anledning til, have en grad, som er en potens af 2. Dernæst viser man, at for nogle punkters vedkommende vil graden af den tilhørende legemsudvidelse være lig med 3. Dermed har man straks, at dette punkt ikke kan være konstruérbart. Polyno-mierne viser sig at besidde mange af de samme egenskaber som de hele tal. De poly-nomier, der modsvarer primtallene i talteorien, nemlig de irreducible polynomier, viser sig at spille en central rolle. Udvider man et legeme med en rod af et irreduci-belt polynomium, så viser det sig nemlig, at graden af den pågældende udvidelse er lig med graden af det irreducible polynomium. Jeg vil stoppe snakken her, så læseren kan komme i gang med beviset.....

  • 11

    2. Abstrakte mængder På vores vej til at bevise, at vinkler generelt ikke kan tredeles med passer og lineal, skal vi stifte bekendtskab med nogle særlige mængder af tal. Det er i den forbindelse hensigtsmæssigt at indføre nogle ret abstrakte definitioner, som i starten kan synes unødvendige eller direkte forvirrende. Årsagen er, at man i matematikkens historie har mange eksempler på, at matematikere har udviklet teorier, som var ”dunkle” eller direkte forkerte. Man vidste ikke i alle tilfælde, hvad man talte om. Dette har ført til, at man i de seneste par hundrede år er blevet mere og mere skrappe med formalis-men. Matematikere som Carl Friedrich Gauss (1777–1855) og Niels Henrik Abel (1802–1829) var nogle af de første til at starte en tradition for matematisk stringens.

    2.1 Lidt om ringe og legemer Mængden af hele tal og mængden af reelle tal har en række egenskaber, som er velkendte for enhver gymnasieelev, men som man måske ikke tænker så meget over når man regner i det daglige. Senere skal vi vise, at andre, ikke så indlysende mæng-der, har tilsvarende egenskaber. Prøv at overbevis dig selv om, at er en kommuta-tiv ring og er et legeme ifølge definitionerne nedenfor.

    Definition 2.1

    En ring R (på engelsk ring) er en mængde, som er udstyret med to operationer, + (addition) og ⋅ (multiplikation), og som opfylder en række egenskaber: A1) R er stabil med hensyn til addition: ,a b R a b R∈ ⇒ + ∈ A2) Associative lov for addition: ( ) ( )a b c a b c+ + = + + for alle , ,a b c R∈ . A3) Kommutative lov for addition: a b b a+ = + for alle ,a b R∈ . A4) Der findes et nulelement 0 R∈ , med følgende egenskab: 0 0a a a+ = + = for

    ethvert a R∈ . A5) Ethvert a R∈ har et inverst element med hensyn til addition: For ethvert a R∈

    har ligningen 0a x+ = , hvor 0 er nulelementet med hensyn til addition, en løs-ning i R.

    M1) R er stabil med hensyn til multiplikation: ,a b R a b R∈ ⇒ ⋅ ∈ . M2) Associative lov for multiplikation: ( ) ( )a b c a b c⋅ ⋅ = ⋅ ⋅ for alle , ,a b c R∈ . D) Distributive love: ( )a b c a b a c⋅ + = ⋅ + ⋅ for alle , ,a b c R∈ ,

    ( )a b c a c b c+ ⋅ = ⋅ + ⋅ for alle , ,a b c R∈ .

  • 12

    Definition 2.2

    En ring R, hvori multiplikation er kommutativ, kaldes en kommutativ ring, dvs. ud-over egenskaberne i definition 1 er følgende opfyldt: M3) Kommutative lov for multiplikation: a b b a⋅ = ⋅ for alle ,a b R∈ . Definition 2.3

    Et legeme F (på engelsk field) er en kommutativ ring, som yderligere opfylder:

    M4) Der findes et 1-element 1 \{0}F∈ , med følgende egenskab: 1 1a a a⋅ = ⋅ = for ethvert a F∈ .

    M5) Ethvert \{0}a F∈ har et inverst element med hensyn til multiplikation: For et-hvert \{0}a F∈ har ligningen 1a x⋅ = , hvor 1 er 1-elementet med hensyn til multiplikation, en løsning i \{0}F . Denne løsning er det inverse element.

    Bemærkning 2.4

    For nemheds skyld vil vi ofte skrive ab i stedet for a b⋅ . Det inverse element med hensyn til addition til et element a i en ring vil vi ofte betegne –a. Det inverse element til a med hensyn til multiplikation vil vi ofte betegne med 1a− . Eksempel 2.5

    Mængden { }( 2) 2 ,a b a b= + ∈ , hvor er mængden af rationale tal, udgør et legeme. For at indse det, skal vi vise egenskaberne A1–A5, M1–M5 og D. Det er klart, at hvis vi adderer to tal fra ( 2) , så får vi igen et tal i ( 2) : (1) 1 1 2 2 1 2 1 2( 2) ( 2) ( ) ( ) 2a b a b a a b b+ + + = + + +

    idet både 1 2a a+ ∈ og 1 2b b+ ∈ . Så mængden er stabil overfor addition, altså egenskaben A1 er opfyldt. Endvidere er mængden stabil med hensyn til multiplika-tion:

    (2) 1 1 2 2 1 2 1 2 1 2 1 2

    1 2 1 2 2 1 1 2

    1 2 1 2 1 2 2 1

    ( 2) ( 2) 2 2 2 2

    2 2 2

    ( 2 ) ( ) 2

    a b a b a a a b b a b b

    a a a b a b b b

    a a b b a b a b

    + ⋅ + = ⋅ + ⋅ + ⋅ + ⋅

    = + + +

    = + + +

    eftersom begge parenteser i det sidste udtryk er rationale tal. Altså er også egen-skaben M1 opfyldt. Den associative lov og den kommutative lov for både addition og multiplikation følger direkte af, at disse love gælder indenfor de reelle tal, hvoraf

  • 13

    ( 2) er en delmængde. Altså er egenskaberne A2, A3, M2 og M3 også opfyldt. Af samme årsag er den distributive lov D også opfyldt.

    ( 2) arver både nulelementet 0 (= 0 0 2+ ) og 1-elementet 1 (=1 0 2+ ) fra de reelle tal: (3) ( 2) 0 0 ( 2) 2a b a b a b+ + = + + = + (4) 1 ( 2) ( 2) 1 2a b a b a b⋅ + = + ⋅ = + hvilket gælder for alle 2 ( 2)a b+ ∈ . Dermed har vi redegjort for gyldigheden af egenskaberne A4 og M4. Tilbage står at vise eksistensen af inverse elementer. Elementet 2 ( 2)a b− − ∈ er naturligvis det inverse element til 2 ( 2)a b+ ∈ med hensyn til addition. Dette ses ved, at hvis man adderer de to elementer, så fås nulelementet: (5) ( 2) ( 2) ( 2) ( 2) 0a b a b a b a b+ + − − = − − + + = Det mest interessante er imidlertid det inverse element til { }2 ( 2) \ 0a b+ ∈ med hensyn til multiplikation. Opgaven går egentligt ud på at vise, at

    (6) 12a b+

    er et tal på formen 2c d+ , altså et element i ( 2) . Hvis vi smart forlænger (6) i tæller og nævner med 2a b− og bruger reglen om to tals sum gange de samme to tals differens, så får vi:

    (7) 2 2 2 2 2 21 ( 2) 2 2

    2 2 22 ( 2)( 2)a b a b a b

    a b a b a ba b a b a b− − − = = = + ⋅ − − − + + −

    Det er klart, at når a og b hver især er rationale tal, så er indholdet i de store paren-teser også rationale. Så vi har virkeligt at gøre med et element i ( 2) . Bemærk lige, at når a og b er rationale, så kan nævneren 2 22a b− umuligt være 0, for så skul-le a b være lig med 2 , men dette er umuligt, da vi ved, at 2 er et irrationalt tal. Hermed er egenskaberne A5 og M5 begge beviste. ( 2) er altså et legeme!

  • 14

    Bemærkning 2.6

    Bemærk, at i et legeme har ligningen a x b⋅ = , hvor 0a ≠ , altid en entydig løsning. Eftersom a har et inverst element med hensyn til multiplikation, kan vi nemlig blot multiplicere med det inverse element på begge sider af lighedstegnet:

    1 1

    1 1

    1

    1

    ( )

    ( )

    1

    a x b a a x a b

    a a x a b

    x a b

    x a b

    − −

    − −

    ⋅ = ⇔ ⋅ ⋅ = ⋅

    ⇔ ⋅ ⋅ = ⋅

    ⇔ ⋅ = ⋅

    ⇔ = ⋅

    hvor vi blandt andet har brugt den associative lov for multiplikation. 2.2 Vektorrum Når vi senere i kapitel 5 skal indføre dimensionen for en simpel algebraisk udvidelse, vil vi få brug for begrebet vektorrum. Et vektorrum er en mængde, der er udstyret med en ganske bestemt struktur. Vi skal først give nogle definitioner. Bagefter skal vi straks se på et par eksempler, som giver de ret abstrakte definitioner mening. Definition 2.7

    Et vektorrum V over et legeme K er en mængde af elementer, kaldet vektorer, sådan at hvert par af vektorer u og v fra V bestemmer en vektor u v V+ ∈ , og sådan at enhver vektor u V∈ og enhver skalar k K∈ bestemmer en vektor k u V⋅ ∈ , med følgende egenskaber: a) V er en kommutativ gruppe under addition (tilfredsstiller A1–A5 fra afsnit 2.1). b) ( )k u v ku kv+ = + c) 1 2 1 2( )k k u k u k u+ ⋅ = + d) 1 2 1 2( ) ( )k k u k k u⋅ = ⋅ ⋅ e) 1 u u⋅ = Definition 2.8

    Lad V være et vektorrum over et legeme K. En linearkombination af vektorerne 1 2, , , ru u u V∈… er et element på formen 1 1 2 2 r rk u k u k u+ + +… , hvor ik K∈ .

  • 15

    Definition 2.9

    Lad V være et vektorrum over et legeme K. Vektorerne 1 2, , , ru u u V∈… siges at ud-spænde V, såfremt der for ethvert u V∈ findes skalarer 1 2, , , rk k k K∈… , så (8) 1 1 2 2 r ru k u k u k u= + + +… altså så ethvert u V∈ kan skrives som en linearkombination af 1 2, , , ru u u… . Definition 2.10

    Lad V være et vektorrum over et legeme K. Vektorerne 1 2, , , ru u u V∈… betegnes som lineært uafhængige over K, såfremt der for 1 2, , , rk k k K∈… gælder: (9) 1 1 2 2 1 20 0r r rk u k u k u k k k+ + + = ⇒ = = = =… … hvor 0 på venstre side af tegnet ⇒ hentyder til nulvektoren. Hvis et sæt af vektorer ikke er lineært uafhængige over K, så siges de at være lineært afhængige over K. Definition 2.11

    Lad V være et vektorrum over et legeme K. En basis for vektorrummet V er et sæt af lineært uafhængige vektorer, som udspænder V. Definition 2.12

    Lad V være et vektorrum over et legeme K. Hvis et vektorrum har en basis bestående af n elementer, så vil vi sige, at vektorrummet har dimension n over K. For at definitionen i 2.12 har mening, er det selvfølgelig nødvendigt, at der i vektor-rummet ikke findes to baser med et forskelligt antal elementer. Vi vil senere (sætning 2.15) gøre rede for, at dette aldrig kan forekomme, så den grundige læser ikke føler sig snydt. Før dette gøres vil vi dog kigge på et par eksempler.

    Eksempel 2.13

    Mængden af alle vektorer i rummet over er et eksempel på et vektorrum:

    (10) 1

    32 1 2 3

    3

    , ,uu u u uu

    = ∈

  • 16

    Bemærk, at vi har skrevet koordinaterne i en lodret tuppel og ikke vandret med kom-ma imellem. Det er en smags sag, hvad man gør! Man kan addere to vektorer samt multiplicere en vektor med en konstant (også kaldet en skalar) k ∈ og derved igen få en vektor i mængden, på følgende måde:

    1 1 1 1

    2 2 2 2

    3 3 3 3

    u v u vu v u vu v u v

    + + = + +

    (11)

    1 1

    2 2

    3 3

    ;u k u

    k u k u ku k u

    ⋅ ⋅ = ⋅ ∈ ⋅

    Ethvert element 31 2 3( , , )u u u ∈ kan skrives som en linearkombination af (1, 0, 0) , (0,1, 0) og (0, 0,1) , dvs. de tre vektorer udspænder 3 :

    (12) 1

    2 1 2 3

    3

    1 0 00 1 00 0 1

    uu u u uu

    = ⋅ + ⋅ + ⋅

    Dette kan nemt kontrolleres ved at bruge (11). De nævnte tre vektorer er lineært uaf-hængige. Det indses nemlig ret let, at en linearkombination af de tre vektorer kun kan være lig med nulvektoren (0, 0, 0) , hvis alle tre skalarer er lig med 0. Altså udgør de tre vektorer en basis for 3 og dimensionen af vektorrummet er lig med 3.

    Eksempel 2.14

    Udover at udgøre et legeme, så er mængden { }( 2) 2 ,a b a b= + ∈ også ud-styret med en vektorrumsstruktur. Det er et vektorrum over med basis { }1, 2 : At de to nævnte vektorer 1 og 2 udspænder ( 2) er klart. Lineær uafhængighed: Antag 1 2 0a b⋅ + = . Begge koefficienter kan ikke være forskellige fra nul, for det ville give modstrid med at 2 er et irrationalt tal. Når en af koefficienterne er nul er de begge nødt til at være det. Derfor må der gælde 0a b= = . Så vektorerne er lineært uafhængige over ifølge definition 2.10.

  • 17

    Sætning 2.15

    Antag, at V er et vektorrum over et legeme K, og at V har en basis bestående af n vektorer ( n∈ ). Da vil enhver anden basis for V også have n elementer.

    Bevis: Lad { }0 1 2, , , nU u u u= … være basen med de n vektorer. Det er tilstrækkeligt at vise, at hvis { }0 1 2, , , mV v v v= … er et sæt af vektorer fra V, som er lineært uafhæn-gige over K, så er m n≤ . Det vil nemlig betyde, at en anden basis ikke kan have flere vektorer end n. At denne anden basis heller ikke kan have færre end n vektorer, føl-ger når man bytter rundt på rollen af den ”oprindelige” og den ”anden” basis. Da 0U udspænder V, så kan vektoren 1 0v V∈ skrives på formen (13) 1 1 1 2 2 n nv k u k u k u= + + +… hvor koefficienterne 1 2, , , nk k k K∈… . En af koefficienterne må være forskellig fra 0, ellers var 1v nulvektoren, i modstrid med at 0V er et lineært uafhængigt sæt. Vi kan uden indskrænkning antage, at det er 1k , som er forskellig fra 0. Omskrivningen

    1 1 11 1 1 1 2 2 1 n nu k v k k u k k u

    − − −= − − −… af (13) viser, at 1u ligger i rummet udspændt af { }1 1 2, , , nU v u u= … . 1U må derfor udspænde hele V. Vi skal yderligere argumentere

    for, at vektorerne i 1U er lineært uafhængige: Antag, at (14) 1 1 2 2 3 3 0n nc v c u c u c u+ + + + =… . Der gælder 1 0c = : Antag modsætningsvist, at 1 0c ≠ . Så kunne vi omskrive (14) til: (15) 1 1 11 1 2 2 1 3 3 1 n nv c c u c c u c c u

    − − −= − − − −… og trækkes ligning (15) fra (13) fås en linearkombination af 1 2, , , nu u u… , som er 0 og hvor ikke alle koefficienterne er 0 (koefficienten til 1u bliver 1k , som er forskellig fra 0). Dette er i modstrid med, at 1 2, , , nu u u… er lineært uafhængige. Indsættes 1 0c = i (14) fås en linearkombination af 2 , , nu u… som er 0. Da vektorer-ne er lineært uafhængige må koefficienterne være 0. Derfor er alle koefficienterne i (14) lig med 0. Vi har altså vist, at vektorerne i 1U er lineært uafhængige. Alt i alt har vi ovenfor fået indsat 1v i stedet for et af u’erne fra den oprindelige basis

    0U , og derved fået en ny basis 1U . Denne proces gentages nu: Vi vil forsøge at ind-sætte 2v i stedet for et af de tilbageværende u’er fra 1U : Da 1U er en basis, kan vi udtrykke 2v på formen:

  • 18

    (16) 2 1 1 2 2 3 3 n nv k v k u k u k u= + + + +… hvor koefficienterne 1 2, , , nk k k K∈… . Koefficienterne til u’erne, dvs. 2 , , nk k… , kan ikke alle være forskellige fra 0, for så ville (16) udarte til en ligning, der ville vise, at de involverede v’er var lineært afhængige, i modstrid med udgangspunktet i sætningen. Vi kan uden indskrænkning antage, at det er 2k , som er forskellig fra 0. Omskrivningen 1 1 1 12 2 2 2 1 1 2 3 3 2 n nu k v k k v k k u k k u

    − − − −= − − − −… af (16) viser, at 2u ligger i rummet udspændt af { }2 2 1 3, , , , nU v v u u= … . 2U må derfor udspænde hele V. Vi skal argumentere for, at vektorerne i 2U er lineært uafhængige: Antag, at (17) 2 2 1 1 3 3 0n nc v c v c u c u+ + + + =… . Der gælder 2 0c = : Antag modsætningsvist, at 2 0c ≠ . Så kunne vi omskrive (17) til: (18) 1 1 12 2 1 1 2 3 3 2 n nv c c v c c u c c u

    − − −= − − − −… og trækkes ligning (18) fra (16) fås en linearkombination af 1 2, , , nv u u… , som er 0 og hvor ikke alle koefficienterne er 0 (koefficienten til 2u bliver 2k , som er forskel-lig fra 0). Dette er i modstrid med, at 1 2, , , nv u u… er lineært uafhængige. Indsættes 2 0c = i (17) fås en linearkombination af 1 3, , , nv u u… som er 0. Da vek-torerne er lineært uafhængige må koefficienterne være 0. Derfor er alle koefficien-terne i (17) lig med 0. Vi har altså vist, at vektorerne i 2U er lineært uafhængige. Antag nu, at m n> . Så ville man i den successive proces med at skabe nye baser ved at udskifte et af de tilbageværende u’er med et af v’erne komme ud for at stå med en basis { }1 2, , ,n nU v v v= … , med stadig mindst et v tilbage: 1nv + . Da vil 1nv + kunne skrives som en linearkombination af vektorerne i nU , i modstrid med, at v’erne er lineært uafhængige. Altså må der gælde m n≤ . Dette beviser sætningen.

  • 19

    3. Polynomier 3.1 Nogle definitioner Med et polynomium af grad n over en ring R skal vi mene et udtryk af formen

    11 0

    n nn na x a x a

    −−+ + +…

    hvor x er en variabel og koefficienterne ia R∈ , med 0na ≠ . Man kan addere og multiplicere polynomier på sædvanlig vis, og eftersom R er stabil med hensyn til addition og multiplikation, så fås igen et polynomium over R. Faktisk kan man over-bevise sig om, at mængden af polynomier over en ring R selv udgør en ring, betegnet

    [ ]R x . Nulelementet er selvfølgelig nul-polynomiet 0, og 1-elementet er tilsvarende polynomiet 1 af grad 0. Også de øvrige egenskaber for en ring er opfyldt. Vi skal bare lige nævne, at 11 0

    n nn na x a x a

    −−− − − −… er det inverse element med hensyn til

    addition. Derimod har de fleste polynomier over R ikke et inverst med hensyn til multiplikation. Derfor udgør [ ]R x ikke et legeme. Heller ikke, selvom koefficient-ringen R endda skulle udgøre et legeme. Man kan ikke dividere to polynomier og altid regne med igen at få et polynomium. Kun hvis man får resten 0 ved polynomiets division, får man igen et polynomium. I det følgende skal vi se på nogle vigtige egenskaber for polynomier over et vilkårligt legeme K. Først gælder det den metode, som betegnes polynomiets division. Hvis du er bekendt med denne metode for polynomier over de reelle tal, så vil du formentlig nikke genkendende til det følgende. 3.2 Polynomiets division

    Sætning 3.1

    Laf f og g være polynomier over et legeme K og antag, at 0f ≠ , dvs. at f er for-skellig fra nulpolynomiet. Så findes der entydige polynomier q og r over K, så

    g q f r= ⋅ +

    hvor r har mindre grad end f .

  • 20

    ”Bevis”. Eksistens: I stedet for at komme med et yderst abstrakt bevis, vil jeg neden-for give et eksempel på, hvordan q og r kan findes for to polynomier over legemet Q. Det vil (forhåbentligt) kunne overbevise om, at metoden altid kan bruges til at finde q og r. Det er vigtigt at observere, at vi ikke udnytter nogen egenskab for Q, som ikke også gælder for ethvert andet legeme K.

    Entydighed: Antag, at der er to sæt af løsninger for q og r:

    1 1 2 2g q f r q f r= ⋅ + = ⋅ +

    Dette vil betyde, at 1 2 1 2( ) ( ) 0f q q r r⋅ − + − = . Eftersom graden af f er større end graden af 1 2r r− , må der gælde 1 2 1 20, dvs. q q q q− = = , for ellers ville første led på venstresiden få større grad end det sidste led på venstresiden og så ville summen umuligt kunne give nulpolynomiet. Når første led således er 0, må også det andet led være det: 1 2 1 20r r r r− = ⇔ = . De to løsningssæt er altså ens!

    Eksempel 3.2 Givet følgende to polynomier over legemet :

    6 5 4 3 213 15 1252 2 2

    4 35 272 2

    ( ) 12 66 22

    ( ) 9

    g x x x x x x x

    f x x x x

    = + + − − − −

    = + − −

    Vi skal se, hvordan vi kan finde frem til to polynomier q og r med de ønskede egen-skaber. Først divideres leddet med højest grad i f op i leddet med højest grad i g, altså

    4x divideres op i 6x , hvilket giver 2x , som vi skriver ude til højre. Dernæst ganger vi 2x med divisoren 4 35 272 2 9x x x+ − − , hvilket giver

    6 5 3 25 272 2 9x x x x+ − − . Det

    skriver vi under g ude til venstre, idet vi dog af praktiske årsager tilføjer 40x . Dette fratrækkes nu g og man får 5 4 3 210724 12 6 66 22x x x x x+ + − − − .

    6 5 4 3 2 4 3 213 15 125 5 272 2 2 2 2

    6 5 4 3 25 272 2

    5 4 3 21072

    5 4 3 2

    4 3 212

    4 3 2

    3 212

    12 66 22 : ( 9) 4 2

    0 9

    4 12 6 66 22

    4 10 0 54 36

    2 6 30 22

    2 5 0 27 18

    3 4

    x x x x x x x x x x x

    x x x x x

    x x x x x

    x x x x x

    x x x x

    x x x x

    x x x

    + + − − − − + − − = + +

    + + − −

    + + − − −

    + + − −

    + + − −

    + + − −

    + − −

  • 21

    Processen fortsættes nu på samme måde: Leddet med højest grad i f divideres op i leddet med højest grad i 5 4 3 210724 12 6 66 22x x x x x+ + − − − . Det giver 4x , som vi tilføjer ude til højre, etc. Processen standser, når man får et ”restpolynomium”, som har mindre grad end det, man dividerer med. Det er tilfældet med 3 212 3 4x x x+ − − . En forholdsvis enkel analyse af ovenstående metode viser, at vi har:

    6 5 4 3 213 15 1252 2 2

    2 4 3 3 25 27 12 2 2

    12 66 22

    ( 4 2) ( 9) ( 3 4)

    x x x x x x

    x x x x x x x x

    + + − − − −

    = + + ⋅ + − − + + − −

    svarende til g q f r= ⋅ + , hvor 2( ) 4 2q x x x= + + og 3 212( ) 3 4r x x x x= + − − . Bemærk, at vi kun har benyttet metoder, som gælder i ethvert legeme. Derfor kan fremgangsmåden umiddelbart overføres til polynomier over ethvert legeme K.

    3.3 Største fælles divisor Situationen i teorien for polynomier ses på mange måder at være analog til den, man møder indenfor talteorien. Man kan tale om, at et polynomium går op i et andet poly-nomium, hvis restpolynomiet (eller bare resten) r er nulpolynomiet. Hvis f går op i g, vil vi skrive |f g ; og hvis divisionen ikke går op, skriver vi |f g/ . Vi skal også ind-føre begrebet største fælles divisor for to polynomier.

    Definition 3.3

    Et polynomium d over K siges at være en største fælles divisor for f og g, såfremt | og |d f d g og der endvidere gælder, at hver gang | og |e f e g , haves |e d .

    Bemærk, at vi har sagt en største fælles divisor, fordi der normalt findes flere for-skellige polynomier, som er største fælles divisor for to givne polynomier f og g. Der er dog en snæver sammenhæng mellem dem. De er alle proportionale, som den føl-gende sætning viser.

    Sætning 3.4

    a) Hvis d er en største fælles divisor for to polynomier f og g, og hvis 0 k K≠ ∈ , så er også d k d′ = ⋅ en største fælles divisor for f og g.

    b) Hvis d og d ′ er to største fælles divisorer for f og g, så findes der en konstant , 0k K k∈ ≠ , så d k d′ = ⋅ .

  • 22

    Bevis: a) Når | og |d f d g , så fås umiddelbart ( ) | og ( ) |k d f k d g⋅ ⋅ , når k er en konstant (se bemærkning 3.5). At k d⋅ endda er en største fælles divisor følger af, at

    | og | | | ( )e f e g e d e k d⇒ ⇒ ⋅ .

    b) Da både og d d ′ er største fælles divisorer for f og g, så har man af definitionen, at | og |d d d d′ ′ . Den eneste mulighed herfor er, at de to polynomier må have sam-me grad. Kvotienten q ved division af d op i d ′ er derfor en konstant k, og da resten er 0, må d k d′ = ⋅ .

    Bemærkning 3.5

    Ifølge sætning 3.1 kan man vise, at et polynomium f går op i et polynomium g, hvis man kan skrive g på formen g q f r= ⋅ + , hvor 0r = . Ofte går det så ud på at anvise en kvotient q ved divisionen. Når vi under a) ovenfor ønsker at vise, at ( ) |k d f⋅ og ( ) |k d g⋅ , så kan det gøres ved at angive kvotienterne. Men af forudsætningerne

    |d f og |d g har vi direkte, at der findes kvotienter 1q og 2q , så 1f q d= ⋅ og 2g q d= ⋅ . Men

    11 1( ) ( )f q d k q k d

    −= ⋅ = ⋅ ⋅ ⋅ og 12 2( ) ( )g q d k q k d−= ⋅ = ⋅ ⋅ ⋅ . Disse

    nye udtryk viser direkte, at vi ved division med k d⋅ kan anvise de to kvotienter 1

    1k q− ⋅ og 1 2k q

    − ⋅ . Det ønskede er dermed vist. 3.4 Euklids algoritme I dette afsnit skal vi se på en metode til at bestemme en største fælles divisor for to polynomier over et legeme K. Metoden går under navnet Euklids algoritme. For hur-tigst muligt at fange idéen bag algoritmen tror jeg, at det vil være hensigtsmæssig at tage udgangspunkt i et eksempel. Eksempel 3.6

    Lad os sige, at vi ønsker at bestemme en største fælles divisor for de to polynomier, som vi betragtede i eksempel 3.2: 6 5 4 3 213 15 1252 2 2( ) 12 66 22g x x x x x x x= + + − − − − og 4 35 272 2( ) 9f x x x x= + − − . I eksemplet fandt vi ved polynomiets division frem til, at 1 1g q f r= ⋅ + , hvor

    21( ) 4 2q x x x= + + og hvor

    3 211 2( ) ( 3 4)r x x x x= + − − . Idéen

    er nu, at man foretager polynomiets division en række gange: hver gang tager man resten fra den foregående division og dividerer op i divisoren fra den foregående division. Den næste division består altså i at dividere 1r op i f :

  • 23

    4 3 2 3 25 27 12 2 2

    4 3 212

    3 2 192

    3 2

    2 72

    0 9 : ( 3 4) 2

    3 4

    2 3 9

    2 6 8

    2 1

    x x x x x x x x

    x x x x

    x x x

    x x x

    x x

    + + − − + − − = +

    + − −

    + − −

    + − −

    − −

    Vi tager nu resten heri og dividerer op i divisoren:

    3 2 2 7 91 12 2 2 8

    3 27 14 2

    29 54 2

    29 63 94 16 8

    23 2316 8

    3 4 : (2 1)

    4

    x x x x x x

    x x x

    x x

    x x

    x

    + − − − − = +

    − −

    − −

    − −

    Resten heri divideres igen op i divisoren:

    2 7 23 23 32 82 16 8 23 23

    2

    1212

    2 1 : ( )

    2 4

    1

    1

    0

    x x x x

    x x

    x

    x

    − − − = −

    Vi er nu nået til en rest på 0 og stopper. Divisionerne, inklusiv den første fra eksem-pel 3.2, gav altså anledning til følgende række af ligninger:

    1) 6 5 4 3 213 15 125

    2 2 22 4 3 3 25 27 1

    2 2 2

    12 66 22

    ( 4 2) ( 9) ( 3 4)

    x x x x x x

    x x x x x x x x

    + + − − − −

    = + + ⋅ + − − + + − −

    2) 4 3 3 2 25 27 712 2 2 29 ( 2)( 3 4) (2 1)x x x x x x x x x+ − − = + + − − + − −

    3) 3 2 29 7 23 231 12 2 8 2 16 83 4 ( )(2 1) ( )x x x x x x x+ − − = + − − + −

    4) 2 7 32 8 23 232 23 23 16 82 1 ( )( )x x x x− − = − −

  • 24

    Påstanden er, at den sidste rest forskellig fra 0, dvs. 23 2316 8x − , er en største fælles divisor. Lad mig lige nævne, at man naturligvis kan få en anden største fælles divisor ved at gange med en konstant. Ganger vi med 1623 får vi én, som er pænere: 2x − .

    For at kunne argumentere for, at fremgangsmåden i eksemplet altid holder stik, må vi formalisere situationen lidt. For det første vil vi for at arbejde med en mere uniform notation vedtage, at betegne g med 1r− og f med 0r . Vi forestiller os nu, som i eksemplet, at vi starter med at dividere f op i g ved polynomiets division. Med ovenstående notation dividerer vi altså 0r op i 1r− . Herved får vi en kvotient 1q og en rest 1r , så 1 1 0r q r r− = + , svarende til ligning 1) nedenfor. Derefter gentager vi pro-cessen med at foretage polynomiets division, denne gang med resten 1r og divisoren

    0r og får ligning 2). Processen fortsættes igen med resten 2r og divisoren 1r , etc. … indtil man får en rest, der er 0. Det sker i ligning 1)s + i skemaet.

    ( )

    ( )

    ( )

    ( )

    1 1 0 1 1 1 0 1

    0 2 1 2 0 2 1 2

    1 3 2 3 1 3 2 3

    2 1 2 1

    1 1

    1)

    2)

    3)

    )

    1)

    s s s s s s s s

    s s s

    r q r r r q r r

    r q r r r q r r

    r q r r r q r r

    s r q r r r q r r

    s r q r

    − −

    − − − −

    − +

    = + − =

    = + − =

    = + − =

    = + − =

    + =

    Sætning 3.7

    a) Med ovenstående notation er sr en største fælles divisor for f og g. b) Lad d være en største fælles divisor for to ikke-nulpolynomier f og g over K. Så findes der to polynomier a og b over K, så

    a f bg d+ =

    Bevis: For det første er det vigtigt at bemærke, at ovenstående sekvens altid vil standse på et tidspunkt! Dette skyldes, at 1grad( ) grad( )i ir r+ < for 0,1,i = … . Dette godtgør, at man på et tidspunkt vil få en rest, som er 0.

  • 25

    a) Vi skal først vise, at sr er en divisor i f og g. Dette gøres ved at starte i ”bunden” af ovenstående sekvens: Ligning 1)s + viser direkte, at 1|s sr r − . Da sr går op i hvert af leddene på højresiden i ligning s), fås 2|s sr r − . Når man på denne måde arbejder sig videre op igennem sekvensen af ligninger får man umiddelbart, at |s ir r for alle

    , 11, 0,1, si −= − … ; specielt går sr op i 1r g− = og 0r f= . For at vise, at sr er en største fælles divisor, antager vi, at |e f og |e g , dvs. 0|e r og 1|e r− . Kig nu på lig-ningerne i parenteserne ovenfor. De er blot simple omskrivninger af ligningerne til venstre. Hvis du bruger ligningerne i parenteserne, så vil du kunne arbejde dig suc-cessivt nedad og vise, at | ie r for alle , 1, 2, 3, ,1, 0 si = − … , specielt haves | se r , som ønsket. Dermed er sr en største fælles divisor for f og g. b) Da alle største fælles divisorer til f og g er proportionale, jvf. sætning 3.4, så er det åbenlyst nok at vise, at der findes polynomier a og b, så sa f bg r+ = , eller med den nye notation, så 0 1 sar br r−+ = . Igen skal man gå en tur igennem sekvensen ovenfor, denne gang oppefra og nedefter. Kig på ligningerne i parenteserne: I ligning 1) er 1r udtrykt ved 0r og 1r− . Hvis vi udskifter 1r i ligning 2 med dette udtryk har vi, at også

    2r kan udtrykkes ved 0r og 1r− . Således fortsættes nedefter til man har vist, at også sr kan udtrykkes ved 0r og 1r− , som ønsket.

    Eksempel 3.8

    Lad os vende tilbage til eksempel 3.6 og prøve at anvende sætning 3.7b) herpå. Vi så i eksempel 3.6, at man i fjerde division fik en rest, der var 0, svarende til, at vi har skemaet:

    ( )

    ( )

    ( )

    1 1 0 1 1 1 0 1

    0 2 1 2 0 2 1 2

    1 3 2 3 1 3 2 3

    2 4 3

    1)

    2)

    3)

    4)

    r q r r r q r r

    r q r r r q r r

    r q r r r q r r

    r q r

    − −= + − =

    = + − =

    = + − =

    =

    Ligning 1) i parentesen giver ved indsættelse af de udregnede kvotienter fra eksem-pel 3.6 følgende:

    21 0 1( 4 2)r x x r r− − + + ⋅ =

    Indsættes dette udtryk for 1r i ligning 2) fås:

    20 1 0 2

    3 20 1 2

    ( 2)( ( 4 2) )

    ( 6 10 5) ( 2)

    r x r x x r r

    x x x r x r r

    − + − + + ⋅ =

    + + + ⋅ − + ⋅ =

  • 26

    og ved indsættelse af udtrykkene for både 1r og 2r i ligning 3 fås endeligt:

    ( ) ( )( )

    ( ) ( )

    2 3 2911 0 0 1 32 8

    4 3 2 233 51 71 61 17 131 10 1 32 8 4 4 8 2 8 4

    ( 4 2) ( 6 10 5) ( 2)r x x r x x x x r x r r

    x x x x r x x r r

    − −

    − + + ⋅ − + + + + ⋅ − + ⋅ =

    − + + + + ⋅ + + + ⋅ =

    Altså ( )4 3 233 51 71 6112 8 4 4 8( )a x x x x x= − + + + + og 2 17 1312 8 4( )b x x x= + + kan bruges!

  • 27

    4. Faktorisering 4.1 Irreducible polynomier I kapitel 3 så vi, at polynomier besidder en række af de samme egenskaber som mængden af hele tal. Man kan tale om, at et polynomium går op i et andet polynomi-um, ligesom man kan tale om, at et helt tal går op i et andet helt tal. Analogien kan drives meget videre. Vi skal nu se, at man kan definere et begreb for polynomier, som svarer til begrebet primtal for de hele tal.

    Definition 4.1

    Et polynomium over en kommutativ ring R siges at være reducibelt, hvis det kan skrives som et produkt af to polynomier af lavere grad over R. I modsat fald kaldes det irreducibelt. Eksempler 4.2

    a) Alle polynomier af grad 0 og 1 er klart irreducible.

    b) 2( ) 2p x x= − er irreducibelt som et polynomium over . Eneste mulighed var nemlig, at polynomiet kunne skrives som et produkt af polynomier af grad 1:

    (1) 2 2 ( )( )x ax b cx d− = + +

    med , , ,a b c d ∈ . Men ganger man højresiden sammen betyder det blandt andet, at 1ac = . Heraf fås:

    (2) 1 1( ) ( )( )( ) ( )( )ax b cx d b dax b cx d x x x b x d

    a c a c+ + + + = ⋅ = + + = + +

    hvoraf det ses, at hvis der findes løsninger a, b, c og d til (1), så findes der også en faktorisering med normerede polynomier over de rationale tal, da 1 1,b d ∈ . Med et normeret polynomium menes her et polynomium, hvor koefficienten til højeste-gradsleddet er lig med 1. Ganger man de to parenteser til højre sammen, får man

    1 1 0b d+ = og 1 1 2b d⋅ = − . Indsættes 1 1d b= − i sidstnævnte fås 21 2b = , hvilket er

    umuligt i mængden af rationale tal, da 2 er et irrationalt tal. Altså er 2 2x − irre-ducibelt over .

    c) 2( ) 2 ( 2)( 2)p x x x x= − = − + viser, at polynomiet er reducibelt over .

  • 28

    Sætning 4.3

    Ethvert ikke-nulpolynomium over et legeme K er et produkt af irreducible poly-nomier over K.

    Bevis: Et reducibelt polynomium kan skrives som et produkt af to polynomier af lavere grad. Hvis disse begge er irreducible er vi færdige. I modsat fald er der mindst én faktor, som er reducibel. Den/de kan så igen splittes op i faktorer af mindre grad. Processen kan ikke fortsætte uendeligt, da graden aftager med mindst 1 for hver fak-torisering, og fordi der er en nedre grænse for graden af et polynomium. Heraf det ønskede.

    Vigtigheden af primtal indenfor mængden af hele tal skyldes ikke så meget, at et-hvert helt tal kan skrives som et produkt af primtal, men snarere, at faktoriseringen er entydig – på nær faktorernes rækkefølge. På samme måde afhænger betydningen af irreducible polynomier af en slags entydighedssætning. Situationen er imidlertid ikke triviel i dette nye ”miljø”. Hvis man nøjes med at arbejde med mængden af polynomier over en ring, så findes der faktisk eksempler på, at et polynomium kan skrives på to ”væsentligt” forskellige måder som et produkt af irreducible faktorer. Men arbejder vi med polynomier over et legeme, er situationen simplere, som vi skal se i det følgende. Definition 4.4

    To polynomier over et legeme K med største fælles divisor lig med 1 vil vi betegne som værende indbyrdes primiske.

    Sætning 4.5

    Lad f være et irreducibelt polynomium over et legeme K, og lad ogg h være to andre polynomier over K. Så gælder:

    | | |f gh f g f h⇒ ∨

    Bevis: Hvis |f g så holder højresiden og vi er færdige. Hvis derimod |f g/ , så vil vi vise, at der må gælde |f h . Når |f g/ må f og g være indbyrdes primiske. Dette følger af, at de eneste divisorer for f er på formen k f⋅ eller bare k, hvor k er en kon-stant fra K. Den første mulighed som største fælles divisor for f og g udelukkes, da

  • 29

    |f g/ . Hvis k er en største fælles divisor for f og g, så er også 1 en største fælles divisor. Derfor er f og g indbyrdes primiske. Dermed eksisterer der ifølge sætning 3.7 polynomier a og b, så (3) 1af bg+ = Ganger vi på begge sider med h fås: (4) afh bgh h+ =

    | |f gh f bgh⇒ , så f går op i begge led på venstresiden. Dermed haves |f h , som ønsket.

    Sætning 4.6

    Faktorisering af polynomier over et legeme K i irreducible polynomier er enty-dig op til konstante faktorer og rækkefølgen i hvilken de skrives.

    Bevis: Antag at 1 2 1 2r sf f f f g g g= ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅… … , hvor f er et polynomium over K og hvor 1 2, , , rf f f… og 1 2, , , sg g g… alle er irreducible polynomier over K. Hvis alle

    if -erne er konstanter, så må også jg -erne være det og sætningen holder. I modsat fald kan vi antage, at ingen af if -erne er konstanter (ellers kan man dividere med dem på begge sider af lighedstegnet). Vi har 1 1 2| sf g g g⋅ ⋅ ⋅… , hvilket med gentagen brug af sætning 4.5 giver at 1 | if g for et { }1, 2, ,i s∈ … . Vi kan foretage en ny in-deksering af jg -erne, så det er det første, der er tale om, dvs. 1 1|f g . Da 1f ikke er en konstant, må der derfor gælde 1 1 1f k g= ⋅ for en eller anden konstant 1k . På tilsva-rende måde fås for de andre faktorer: 2 2 2 3 3 3, , , r r rf k g f k g f k g= ⋅ = ⋅ = ⋅… , hvor 2 3, , , rk k k… er konstanter. De eventuelle overskydende ( )jg j r> må også være konstanter, for ellers ville graden af højresiden være større end graden af ven-stresiden. Hermed har vi vist det ønskede!

    Sætning 4.7 (Abels irreducibilitetssætning)

    Lad f og F være to polynomier over legemet K. Antag, at begge polynomier har α som rod og at f er irreducibelt over K. Da findes der et polynomium q over K, så ( ) ( ) ( )F x q x f x= ⋅ . Specielt gælder, at alle rødder i f også er rødder i F.

  • 30

    Bevis: Hvis vi kalder den største fælles divisor for f og F for d, så kan vi ifølge sæt-ning 3.7 finde to polynomier a og b over K, så

    a f b F d⋅ + ⋅ =

    Når vi indsætter α på venstresiden får vi 0, hvilket viser, at d må have grad mindst 1. Pr. definition af største fælles divisor haves |d f og |d F . Da imidlertid f er irredu-cibelt og grad( ) 1d ≥ , må der findes en konstant k K∈ , så d k f= ⋅ . Men så haves

    | ( ) | |d F k f F f F⇔ ⋅ ⇔ , hvilket beviser første påstand. Den sidste fås nemt udfra faktoriseringen.

    Bemærkning 4.8

    Abels irreducibilitetssætning siger altså, at hvis man har et polynomium over K, der har samme rod som et andet polynomium over K, der er irreducibelt over K, så er alle de øvrige rødder i det irreducible polynomium også rødder i førstnævnte polynomi-um. Dette er en stærk konstatering. Specielt giver sætning 4.7, at hvis man har to irreducible polynomier over K med en fælles rod α , så er det ene irreducible polyno-mium lig med en konstant gange det andet. 4.2 Kriterier for irreducibilitet Det kan undertiden være meget kompliceret at afgøre, hvorvidt et polynomium kan faktoriseres eller ej. At foretage overvejelser som i eksempel 4.2b) er generelt set upraktisk for polynomier af højere grad. I dette afsnit skal vi angive et kriterium, som kan benyttes i visse tilfælde. Det går under navnet Eisensteins irreducibilitets kriteri-um. Først skal vi dog udføre et lille forarbejde. Kommentarer til notation

    Antag, at et polynomium f kan skrives som et produkt af to andre: (5) 1 1 11 0 1 0 1 0( ) ( )

    n n r r s sn n r r s sc x c x c a x a x a b x b x b

    − − −− − −+ + = + + + ⋅ + + +… … …

    Vi søger et generelt udtryk for den i’te koefficient ic , udtrykt ved koefficienterne i polynomierne på højre side. Man kan skrive (6) 0 1 1 0i i i ic a b a b a b−= + + +… hvis man vedtager at sætte 0 forja j r= > og 0 forj j sb >= . Denne konvention sikrer, at vi kan opskrive et simpelt og systematisk udtryk for koefficienten ic . Be-

  • 31

    mærk, at summen af indices i hvert eneste led på højre side i (6) giver i. Skrevet ud, har vi følgende udtryk for koefficienterne for f :

    (7)

    0 0 0

    1 0 1 1 0

    2 0 2 1 1 2 0

    0 1 1 0n n n n

    c a bc a b a bc a b a b a b

    c a b a b a b−

    == += + +

    = + + +…

    Vi får i det følgende brug for en sætning, der oprindeligt blev bevist af den store tyske matematiker Carl Friedrich Gauss.

    Sætning 4.9

    Lad f være et polynomium med heltallige koefficienter, der er reducibelt som et polynomium over . Så er f også reducibelt som et polynomium over Z .

    Bevis: Lad f g h= ⋅ være faktoriseringen af f i to polynomier over . Lad a være produktet af alle nævnerne for de rationale koefficienter i g, og b være produktet af alle nævnerne for de rationale koefficienter i h. Ganger man polynomiet g med a og polynomiet h med b, så får man to polynomier med heltallige koefficienter:

    (8) 1

    1 01

    1 0

    ( )

    ( )

    r rr r

    s ss s

    g x a x a x a

    h x b x b x b

    −−

    −−

    ′ = + + +

    ′ = + + +

    Hvis vi sætter c a b= ⋅ fås af g a g′ = ⋅ og h b h′ = ⋅ , at: (9) c f g h′ ′⋅ = ⋅ Vi vil i det følgende vise, at vi kan dividere på hver side af (9) med enhver primfak-tor for c, og samtidigt bevare den kendsgerning, at der på højre sider står et produkt af to polynomier over Z . Efter at have divideret alle primfaktorerne bort vil vi der-med stå med et produkt af to polynomier over Z , som ønsket. Antag, at p er en primfaktor i tallet c. Påstanden er nu, at p går op i alle koefficienter-ne i enten g′ eller h′ . Antag nemlig modsætningsvist, at dette ikke er tilfældet: Så vil der i begge polynomier være koefficienter, hvor p ikke er divisor. Betegn med i det mindste tal, så | ip a/ og betegn med j det mindste tal, så | jp b/ . Dermed forstås, at 0 1 1| , | , , | ip a p a p a −… og 0 1 1, || , , | jp bp b p b −… . Imidlertid går p op i en-hver koefficient i polynomiet på venstresiden i (9). Derfor må det samme være tilfæl-

  • 32

    det med koefficienterne på højresiden i (9). Specielt går p op i den ( ) ' tei j+ koeffi-cient i g h′ ′⋅ . Et udtryk for denne koefficient fås ved at gange de to polynomier i (8) sammen. Analogt til (6) fås: (10) 0 1 1 1 1 1 1 0i j i j i j i j i j i ja b a b a b a b a b h g+ + − − + + − ++ + + + + + +… …

    Vi kan ifølge ovenstående straks konkludere, at p går op i ethvert led bortset fra det understregede i ja b . Da imidlertid p går op i hele udtrykket, så vil | i jp a b også gæl-de. Da p er et primtal må det gå op i mindst et af tallene: | |i jp a p b∨ . Men i og j var jo netop valgt, så | ip a/ og | jp b/ . En modstrid! Altså må p gå op i alle koefficienterne i det ene af polynomierne g′ og h′ . Man divi-derer nu med p på begge sider i (9): På venstresiden divideres c med p og på højre-siden divideres p op i det polynomium, hvor alle koefficienterne er delelige med p. Dermed bliver (9) til en ligning, hvor højresiden stadig er et produkt af to polynomier over Z . Som tidligere nævnt gentager man herefter ovenstående procedure indtil man har fået divideret alle primfaktorerne fra det oprindelige tal n, bort. Da vil man stå med en faktorisering af f i to polynomier over Z . Bemærk, at det under hver division med en primfaktor er vigtigt, at man på højresiden ender med et produkt af polynomier over Z (ikke bare over ).

    Sætning 4.10

    Lad f være et polynomium over Z , som er irreducibelt over Z . Da er f, betrag-tet som et polynomium over , også irreducibelt over .

    Bevis: Følger straks af sætning 4.9.

    Sætning 4.9 godtgør, at hvis man ønsker at afgøre om et polynomium over Z kan skrives som et produkt af polynomier over de rationale tal, så er det tilstrækkeligt at søge blandt polynomier med heltallige koefficienter. Dette kan være en ganske væ-sentlig besparelse. Vi skal imidlertid især udnytte ovenstående sætninger til at bevise Eisenstein’s irreducibilitets kriterium.

  • 33

    Sætning 4.11 (Eisenstein’s irreducibilitets kriterium)

    Lad 11 0( )n n

    n nf x c x c x c−

    −= + + +… være et polynomium over Z . Antag, at der er et primtal p, så

    20

    1. |2. | ( 0,1, , 1)

    3. |

    n

    i

    p cp c i n

    p c

    /= −

    /

    Så er f irreducibel over .

    Bevis: Antag modsætningsvist, at f er lig med et produkt af to polynomier over , som i (5) ovenfor. Da 0|p c og 0 0 0c a b= ⋅ haves 0 0| |p a p b∨ ifølge sætning 4.5. Da imidlertid 2 0|p c/ kan p ikke gå op i begge koefficienter. Vi kan uden indskrænk-ning antage, at 0|p a og 0|p b/ . Vi skal nu arbejde os igennem ligningerne i (7). Be-tragt den anden ligning, 1 0 1 1 0c a b a b= + . Ifølge forudsætningerne i sætningen går p op i venstresiden. Den går også op i første led på højre side. Derfor må p også gå op i det andet led på højre side: 1 0|p a b . Da 0|p b/ konkluderer vi, at 1|p a . Vi går nu til tredje ligning i (7) og får efter lignende argumenter, at 2|p a . Man arbejder sig her-efter systematisk ned til den næstsidste ligning, hvorefter man alt i alt har | ip a ( 0,1, , 1)i n= −… . Betragt nu den sidste ligning: 0 1 1 0n n n nc a b a b a b−= + + +… . Her går p op i de første n led, da p går op i 0 1 1, , , na a a −… . Men p går faktisk også op i det sidste led, da 0na = . Vi har selvfølgelig antaget, at polynomierne på højresiden i (5) er egentlige polynomier, dvs. har grad > 0. Derfor må højst mulige grad for hver af faktorerne være 1n − , hvorfor 0na = (Husk konvention!). Da p går op i ethvert led på højresiden af den sidste ligning, må | np c , i modstrid med punkt 1 i sætnin-gens forudsætninger. Altså kan f ikke være reducibel over Z . Ifølge sætning 4.10 er f dermed også irreducibel over .

    Eksempel 4.12

    Polynomiet 3( ) 2f x x= − er irreducibelt over , som det følger af Eisensteins irre-ducibilitets kriterium: 3 2 1 01, 0, 0, 2c c c c= = = = og primtallet 2p = opfylder de tre punkter i sætning 4.11.

  • 34

    Eksempel 4.13

    Eisensteins irreducibilitets kriterium kan ikke bruges direkte til at påvise, at polyno-miet 3( ) 3 1f x x x= − − er irreducibelt over . Man kan dog udføre et genialt trick: Definér et nyt polynomium g ved at sætte 1x + ind i stedet for x i udtrykket for f :

    3 3 2( ) ( 1) ( 1) 3 ( 1) 1 3 3g x f x x x x x= + = + − ⋅ + − = + − Eisensteins irreducibilitets kriterium kan bruges på g med primtallet 3p = til at vise, at g er irreducibelt over . Men så må f også være irreducibel over , for hvis f var reducibel over , ville det også medføre, at g var det, som følgende regning umiddelbart viser:

    1 2 1 2 1 2( ) ( ) ( ) ( ) ( 1) ( 1) ( 1) ( ) ( )f x f x f x g x f x f x f x g x g x= ⋅ ⇒ = + = + ⋅ + = ⋅ hvor vi har sat 1 1( ) ( 1)g x f x= + og 2 2( ) ( 1)g x f x= + .

  • 35

    5. Legemsudvidelser 5.1 Simple udvidelser Definition 5.1

    Hvis K og L er legemer og K L⊂ så siges man, at L er en legemsudvidelse (eller bare udvidelse) af K. Man benytter ofte betegnelsen :L K for en legemsudvidelse. Definition 5.2

    Hvis :L K er en legemsudvidelse og Y er en delmængde af L, så vil vi med ( )K Y betegne det mindste legeme, som indeholder K Y∪ . Det benævnes ofte legemet ge-nereret af K og Y. En simpel udvidelse er en udvidelse :L K , der har den egenskab, at { }( )L K= α , for et Lα∈ . Man skriver ofte ( )K α i stedet for { }( )K α .

    a

    K( )a

    K.

    Det er ikke svært at indse, at ( )K Y består af alle de elementer, som fremkommer ved at foretage (endeligt mange) ”legeme-operationer” på elementer fra K Y∪ . Hermed menes additioner, multiplikationer og inddragelse af inverse elementer. Eksempel 5.3

    Mængden { }2 ,a b a b+ ∈ fra eksempel 2.5 er et eksempel på en simpel ud-videlse. Vi skal argumentere for, at mængden fremkommer ved at tilføje elementet

    2 til legemet : Det er klart, at den simple udvidelse nødvendigvis må indeholde alle elementer på formen 2, ,a b a b+ ∈ , fordi udvidelsen jo er et legeme og derfor skal være stabil overfor addition og multiplikation. I eksempel 2.5 viste vi endvidere, at mængden { }2 ,a b a b+ ∈ er et legeme. Dermed må mængden også være det mindste legeme, som indeholder både og 2 . Dette godtgør, at der er tale om en simpel udvidelse og betegnelsen ( 2) er derfor retfærdiggjort.

  • 36

    Eksempel 5.4

    For folk, der er bekendt med mængden af komplekse tal , kan det nævnes, at er en simpel udvidelse af mængden af reelle tal med den komplekse enhedsrod

    1i = − , dvs. ( )i= . Analogt til eksempel 5.3 kan man vise, at legemet af kom-plekse tal kan skrives på formen { },a bi a b+ ∈ . Eksempel 5.5

    Den simple udvidelse 3( 2) af mængden af rationale tal med tallet 3 2 må nød-vendigvis indeholder alle tal på formen 3 2 ; ,a b a b+ ∈ . Mængden af sådanne tal er imidlertid ikke stabil overfor multiplikation, idet for eksempel ( )23 3 32 2 2⋅ = ikke kan skrives på ovennævnte form. Derimod kan man vise, at

    ( ){ }23 3 3( 2) 2 2 , ,a b c a b c= + + ∈

    Senere, i eksempel 5.15, skal vi argumentere nærmere herfor. Eksempel 5.6

    Den simple udvidelse ( )π af mængden af rationale tal med π kan ikke skrives på en smart måde som ovenfor. Dette skyldes, som vi skal berøre senere, at tallet π ikke er rod i noget polynomium med rationale koefficienter. Et bevis for sidstnævnte er meget kompliceret og blev først gennemført i 1882 af den tyske matematiker Carl Louis Ferdinand von Lindemann (1852 – 1939). 5.2 Simple algebraiske udvidelser I dette afsnit skal vi udlede nogle helt særlige egenskaber for de tilfælde af simple udvidelser, hvor det element α , man udvider med, er algebraisk over legemet K, altså hvor α er rod i et polynomium over K.

    Definition 5.7

    Lad ( ) :K Kα være en simpel udvidelse. Hvis der eksisterer et polynomium p over K, med 0p ≠ , så ( ) 0p α = , da siges α at være algebraisk over K og udvidelsen kal-des en simpel algebraisk udvidelse. I modsat fald kaldes α transcendent over K og udvidelsen benævnes en simpel transcendent udvidelse.

  • 37

    Eksempler 5.8

    Blandt eksemplerne 5.3 – 5.6 er de tre første udvidelser algebraiske, mens det sidste er transcendent. Dette ses eftersom:

    a) Eksempel 5.3: 2 er rod i polynomiet 2( ) 2p x x= − over . b) Eksempel 5.4: i er rod i polynomiet 2( ) 1p x x= + over .

    c) Eksempel 5.5: 3 2 er rod i polynomiet 3( ) 2p x x= − over .

    d) Eksempel 5.6: π er ikke rod i noget polynomium over .

    Selv om vi ikke direkte får brug for det i vores videre fremfærd, så er nedenstående resultat så interessant, at det bør nævnes:

    Sætning 5.9

    Lad k være et element i et tallegeme K, så k K∉ , samt lad p være et polyno-mium over K. Hvis ( , )a b k a b K+ ∈ er rod i p, så er også a b k− rod i p.

    Bevis: Hvis 0b = er sætningen triviel. Antag derfor 0b ≠ : a b k+ er rod i følgen-de polynomium over K:

    2 2 2( ) ( ( ))( ( )) 2 ( )q x x a b k x a b k x ax a b k= − + − − = − + − Faktoriseringen ovenfor er over ( )K k . På grund af den entydige opløsning i irredu-cible faktorer op til en konstant (se sætning 4.6), findes der ikke nogen faktorisering af q over K. Eneste mulighed er jo to faktorer af grad 1. Derfor er q irreducibelt over K. Sætningen følger nu direkte af bemærkning 4.8.

    Definition 5.10

    Et polynomium 11 0( )n n

    n np x a x a x a−

    −= + + +… over et legeme K, kaldes normeret, såfremt 1na = . Hvis α er rod i et polynomium p over et legeme K, så er α også rod i et normeret polynomium over K. Man kan jo bare dividere det oprindelige polynomium med ko-efficienten na . Vi påstår nu, at der er netop ét normeret polynomium af mindst grad, i hvilket α er rod. Der er klart mindst ét. Antag, at der var to polynomier p og q, så ville ( ) ( ) 0 0 0p qα − α = − = Normeres dette polynomium ved at multiplicere med en konstant, så haves et nyt normeret polynomium, hvori α er rod. Da dette polynomi-um endvidere har grad mindre end graden af p og q, så fås en modstrid.

  • 38

    Definition 5.11

    Lad ( ) :K Kα være en simpel algebraisk udvidelse. Det entydigt bestemte normerede polynomium m af mindst grad, hvori α er rod, vil vi kalde det minimale polynomium for α over K.

    Sætning 5.12

    Antag, at f er et polynomium over K, som har α som rod, og som er irreducibelt over K. Da fås det minimale polynomium m for den simple algebraiske udvidel-se ( ) :K Kα ved at normere f . Specielt er m selv irreducibelt over K.

    Bevis: Det er tilstrækkeligt at vise, at der ikke findes noget polynomium p over K, hvori α er rod og hvor grad( ) grad( )p f< . I så fald vil det polynomium, der frem-kommer ved at normere f , nemlig opfylde betingelserne for at være minimalt. Antag modsætningsvist, at der er et polynomium p med nævnte egenskaber. Fakto-risér p i et produkt af irreducible faktorer over K (se sætning 4.3). Et af disse irre-ducible polynomier må ifølge nulreglen have rod α . Ifølge sætning 4.7 vil det gå op i f . Da graden af faktoren er mindst 1 (det har en rod!) og strengt mindre end graden af f, giver det modstrid med, at også f er irreducibelt over K.

    5.3 Egenskaber for simple algebraiske udvidelser Vi skal nu formulere en vigtig sætning, som udtaler sig om hvordan elementerne i en simpel algebraisk udvidelse ser ud. Hertil skal man kende udvidelsens minimale po-lynomium. Til brug i det følgende defineres mængden af rationale udtryk i α , som

    (1) ( )( ) , [ ], ( ) 0( )

    f f g K x gg

    αℜ α = ∈ α ≠ α

    hvor [ ]K x er ringen af alle polynomier over K.

    Sætning 5.13 Lad ( ) :K Kα være en simpel algebraisk udvidelse, hvor α har minimalt poly-nomium m over K. Da kan ethvert element i ( )K α udtrykkes entydigt på for-men ( )p α , hvor p er et polynomium over K med grad mindre end grad(m).

  • 39

    Bevis: Der gælder ( ) ( )K α = ℜ α , hvilket fremgår af følgende: For det første er det opfyldt at ( ) ( )K α ⊇ ℜ α , fordi udvidelsen klart må indeholde alle de rationale udtryk for at være stabil. For at vise ( ) ( )K α ⊆ ℜ α er det nok at kunne argumentere for, at

    ( )ℜ α indeholder α (hvilket er klart) og at ( )ℜ α er et legeme. Men ( )ℜ α er stabil med hensyn til addition og multiplikation og indeholder også inverse elementer; så mængden udgør et legeme. Tag nu et vilkårligt element ( ) ( )t f g= α α fra ( )K α . Vi skal vise, at t kan skrives som et polynomium i α , ( )p α , hvor p har grad mindre end grad(m). Vores umiddel-bare problem er nævneren ( )g α . Vi kan dog slippe af med nævneren, som det føl-gende viser. Polynomiet g kan ikke være deleligt med m, for så ville ( ) 0g α = , da ( ) 0m α = . Da m ifølge sætning 5.12 er irreducibelt, må m og g være indbyrdes primiske, dvs. deres største fælles divisor er en konstant. Ifølge sætning 3.7 findes der derfor polynomier a og b over K, så 1ag bm+ = . Indsættes α fås ( ) ( ) 1a gα α = . Elementet ( )a α er altså det inverse element til ( )g α med hensyn til multiplikation. Vi kan altså slippe af med nævneren i det rationale udtryk:

    (2) ( ) ( ) ( ) ( )( )

    f f a hg

    α = α ⋅ α = αα

    idet vi har sat ( ) ( ) ( )h x f x a x= ⋅ . Vi kan nu dividere m op i h og bruge sætning 3.1: h q m r= ⋅ + , for polynomier q og r med grad(r) < grad (m). Indsætter vi α ser vi, at ( ) ( )r hα = α . Altså er det oprindelige element ( )t r= α . Så som polynomium p kan vi

    bruge resten r. Den opfylder også betingelsen på graden. Entydighed: Antag, at et element t kan skrives på to måder som et polynomium i α , begge med grad mindre end grad(m): 1 2( ) ( )t p p= α = α . Definér polynomiet h ved

    1 2( ) ( ) ( )h x p x p x= − . Dets grad er mindre end grad(m) og ( ) 0h α = . Dette er i mod-strid med at m er det minimale polynomium, med mindre 0h = , dvs. hvis 1 2p p= . Dette beviser entydigheden.

    Eksempel 5.14

    Betragt den simple udvidelse ( 2) . Det element, 2 , vi udvider med, er rod i det normerede polynomium 2( ) 2f x x= − , som er irreducibelt over ifølge eksem-pel 4.2b). Sætning 5.12 giver os da, at f er det minimale polynomium for udvidel-sen. Sætning 5.13 siger herefter, at elementerne i udvidelsen entydigt kan skrives på formen ( 2)p , hvor p er et polynomium af grad 1≤ . Dette hænger fint sammen med vores kendskab til, at mængden kan skrives på formen { }2 ,a b a b+ ∈ .

  • 40

    Eksempel 5.15

    Betragt den simple algebraiske udvidelse 3( 2) . Legemet af rationale tal er blevet udvidet med 3 2 , som er rod i det normerede polynomium 3( ) 2f x x= − . Ifølge ek-sempel 4.12 giver Eisensteins kriterium, at f er irreducibelt over . Dette godtgør, at f må være det minimale polynomium for udvidelsen. Ifølge sætning 5.13 kan ele-menterne i udvidelsen derfor alle skrives på formen 3( 2)p , hvor p er et polynomium med grad 2≤ . Alle elementer på denne form ligger åbenlyst i udvidelsen. Derfor kan mængden opskrives på formen:

    (3) ( ){ }23 3 3( 2) 2 2 , ,a b c a b c= + + ∈

    Dermed har vi argumenteret for påstanden tilbage i eksempel 5.5.

    5.4 Graden af en legemsudvidelse I eksempel 2.14 så vi, at den simple algebraiske udvidelse ( 2) kunne tillægges en vektorrumsstruktur. Betragtet som et vektorrum over er ( 2) udspændt af basen { }1, 2 og dimensionen af vektorrummet er dermed 2. Hvad med andre ud-videlser :L K ? har de også en vektorrumsstruktur? Svaret er ja, for betingelserne i definition 2.7 for at L er et vektorrum over K er svagere end egenskaben, at L er en legemsudvidelse af K. Dette giver anledning til følgende definition: Definition 5.16

    Med graden [ ]:L K for en legemsudvidelse :L K menes dimensionen af L betragtet som et vektorrum over K.

    Eksempler 5.17

    a) ( 2) : 2 = da dimensionen af vektorrummet er 2.

    b) Elementerne 2 31, , , , , ,iπ π π π… … fra ( )π er lineært uafhængige over . Man har nemlig vist (meget svært!), at π ikke er rod i noget polynomium over . Dette betyder, at udvidelsen ( ) :π har uendelig grad, dvs. [ ]( ) :π = ∞ .

    c) 3( 2) : 3 = , idet ( ){ }23 31, 2, 2 er en basis for 3( 2) , betragtet som vek-torrum over .

  • 41

    Sætning 5.18

    Givet tre legemer K L M⊆ ⊆ , hvor udvidelserne :M L og :L K har endelig grad. Så er graden af udvidelsen :M K bestemt ved:

    [ ] [ ][ ]: : :M K M L L K=

    Bevis: Lad { }1 2, , , ru u u… være en basis for L, betragtet som et vektorrum over K, og lad { }1 2, , , sv v v… være en basis for M, betragtet som et vektorrum over L. Vi vil vise, at { }|1 ,1ijw i r j s≤ ≤ ≤ ≤ , hvor ij i jw u v= er en basis for M betragtet som et vektorrum over K. Hvis dette er tilfældet, fås sætningen straks, da der er r s⋅ vekto-rer i basen. Lineær uafhængighed: Antag, at en linearkombination af ijw ’erne over K er 0:

    (4) 1 1 1 1 1 1

    0 0 0r s s r s r

    ij i j ij i j ij i ji j j i j i

    k u v k u v k u v= = = = = =

    = ⇔ = ⇔ =

    ∑∑ ∑ ∑ ∑ ∑

    Da { }1 2, , , sv v v… er lineært uafhængige vektorer over L må enhver koefficient

    (5) 1

    r

    j ij ii

    c k u L=

    = ∈∑ være lig med 0. Da { }1 2, , , ru u u… er lineært uafhængige vektorer over K, fås ende-ligt, at alle koefficienterne ijk er lig med nul.

    Vektorerne udspænder rummet: Ethvert element v M∈ kan skrives som en linear-kombination af basisvektorerne { }1 2, , , sv v v… :

    (6) 1

    ;s

    j j jj

    v b v b L=

    = ∈∑ .

    Vi kan gå et skridt videre og udtrykke koefficienterne jb i basen { }1 2, , , ru u u… :

    (7) 1

    ;r

    j ij i iji

    b a u a K=

    = ∈∑

    Indsættes (7) i (6) fås:

    (8) 1 1 1 1

    s r r s

    ij i j ij i jj i i j

    v a u v a u v= = = =

    = =

    ∑ ∑ ∑∑

    Hvilket viser det ønskede.

  • 42

    Eksempel 5.19

    Antag, at vi ønsker at finde ( 2, 3) : , altså finde graden af den udvidelse, som fremkommer ved at tilføje de to kvadratrødder 2 og 3 til legemet bestående af alle rationale tal. Denne udvidelse kan foretages i form af to simple algebraiske udvidelser, nemlig ved først at tilføje 2 til og derefter tilføje 3 til ( 2) . Betragtet som vektorrum over er ( 2) udspændt af basen { }1, 2 , som vi så tilbage i eksempel 2.14. Vi skal argumentere for, at vi på lignende måde får at { }1, 3 er en basis for ( 2, 3) betragtet som vektorrum over ( 2) : Ethvert element i ( 2, 3) kan skrives på formen 2 3 6a b c d+ + + , hvor ko-efficienterne a, b, c og d er rationale tal. Bemærk, at vi må medtage et led med 6 for at mængden bliver stabil med hensyn til multiplikation: 2 3 6⋅ = . At det multiplikative inverse element til et element på formen 2 3 6a b c d+ + + igen er et element på denne form kan ses af overvejelserne foretaget i eksempel 5.20 neden-for. Elementet 2 3 6a b c d+ + + kan alternativt skrives som (9) ( 2) ( 2) 3a b c d+ + + Hvilket viser, at { }1, 3 udspænder ( 2, 3) : ( 2) . Bemærk, at tallene i paren-teser er koefficienter fra ( 2) . For at konkludere, at { }1, 3 endda danner en basis, mangler vi at vise, at de to vektorer er lineært uafhængige: Antag, at ( 2) ( 2) 3 0a b c d+ + + = . Hvis begge parenteser er forskellige fra 0, så vil vi have 3 ( 2) ( 2) ( 2)a b c d= − + + ∈ , altså vi vil kunne skrive 3 på formen 1 13 2a b= + for passende 1 1,a b ∈ . Kvadrerer vi, får vi at 1 12 2a b ∈ , hvilket kun kan forekomme hvis 1 0a = eller 1 0b = . Men så må enten 13 a= eller

    13 2b= , som begge er absurde. Altså kan begge parenteser ikke begge være for-skellige fra 0. Hvis på den anden side en af parenteserne er 0, så ses det nemt , at den anden også må være det. Altså begge parenteser er 0, dvs. 0a b c d= = = = . Dermed er den lineære uafhængighed vist. Graden af de to simple algebraiske udvidelser ( 2, 3) : ( 2) og ( 2) : er altså ifølge definition 5.16 begge lig med 2. Vi kan nu bruge sætning 5.18 til at be-stemme graden af udvidelsen ( 2, 3) : :

    ( 2, 3) : ( 2, 3) : ( 2) ( 2) : 2 2 4 = = ⋅ =

  • 43

    Eksempel 5.20

    Lad 1 2, , , nx x x… betegne n variable. Betragt da udtrykket

    (10) 1 2 1 2 1 21 2 1 2 1 2

    ( , , , ) ( )( )( )( ) ( )

    n n n

    n n n

    P x x x k x x x k x x xk x x x k x x x k x x x

    = + + + + − + + +⋅ + − + + − − + + ⋅ ⋅ − − − −

    … … …… … … …

    hvor k K∈ er en konstant. Udtrykket (10) skal forstås på den måde, at det indehol-der alle mulige kombinationer af fortegn til de variable. Da hver variabel har to mu-lige fortegn må der altså være i alt 2n parenteser. Hvis man ganger parenteserne sammen og reducerer, så kan resultatet kun indeholde led med lige potenser af de variable, hvilket fremgår af følgende argumenter: Betragt en vilkårlig af de variable ix . Vi parrer nu de parenteser i (10) sammen to og to, der har samme fortegn for de øvrige variable 1 2 1 1, , , , , ,i i nx x x x x− +… … . Multipli-ceres to sådanne parenteser, hvor den eneste forskel på leddene er fortegnet til ix , så kan vi bruge to tals sum gange de samme to tals differens og opnå et resultat, hvor ix kun forekommer i anden parentes. Det samme fås for alle øvrige sammenparrede pa-renteser. Herved ses det ønskede for den variable ix . Da variablen var vilkårlig valgt, følger påstanden generelt. Lad os se på en anvendelse af ovenstående: 1 2 31, 2, 3, 6k x x x= = = = . Indsat i (10) fås et tal, som må være et rationalt tal, grundet påstanden om, at kvadratrødder-ne kun kommer til at forekomme i anden potens:

    (11)

    ( 2, 3, 6) (1 2 3 6)(1 2 3 6)

    (1 2 3 6)(1 2 3 6)

    (1 2 3 6)(1 2 3 6)

    (1 2 3 6)(1 2 3 6)368

    P = + + + − + +

    = + − + − − +

    = + + − − + −

    = + − − − − −= −

    Dermed har vi umiddelbart et inverst element til 1 2 3 6+ + + :

    (12)

    1

    1( 368)

    (1 2 3 6) (1 2 3 6)(1 2 3 6)

    (1 2 3 6)(1 2 3 6)(1 2 3 6)

    (1 2 3 6)(1 2 3 6)

    + + + = − + + + − +

    ⋅ − − + + + − − + −

    ⋅ + − − − − − ⋅

    Samme metode kan bruges til at vise, at det inverse element til et element på formen

    2 3 6a b c d+ + + igen er et element på denne form.

  • 44

    Sætning 5.21

    Lad ( ) :K Kα være en simpel algebraisk udvidelse. Så er [ ]( ) :K Kα lig med graden af det minimale polynomium for α over K.

    Bevis: Lad n være graden af det minimale polynomium. Ifølge sætning 5.13 udspæn-der vektorerne 2 11, , , , n−α α α… rummet ( )K α , og på grund af entydighedsdelen af sætning 5.13 kan vi slutte, at de også er lineært uafhængige over K. Derfor udgør vektorerne en basis. Graden af udvidelsen er altså n.

  • 45

    6. Umulige konstruktioner 6.1 Algebraisk formulering I dette kapitel skal vi omformulere det geometriske problem med at tredele en vinkel til et algebraisk problem, som kan løses med redskaberne fra de forrige kapitler. For hvert skridt i en konstruktion med passer og lineal vil vi således knytte en legemsud-videlse. Mængden af konstruérbare punkter RC blev i kapitel 1 defineret som mæng-den af de punkter, som kan konstrueres udfra punkterne (0,0) og (1,0) gennem ende-ligt mange simple operationer af typen 1), 2) eller 3) fra definition 1.1. Til mængden bestående af de to punkter (0,0) og (1,0) vil vi knytte legemet 0K = . Hvis vi udfra disse to punkter konstruerer et nyt punkt med koordinaterne 1 1( , )x y , vil vi til denne konstruktion knytte udvidelsen 1 0 1 1( , )K K x y= . Hvis vi videre ud fra de nu tre punk-ter konstruerer endnu et punkt 2 2( , )x y , vil vi knytte udvidelsen 2 1 2 2( , )K K x y= . Sådan kan vi blive ved med at konstruere nye punkter og således få en række af legemsudvidelser (1) 0 1 2 nK K K K⊆ ⊆ ⊆ ⊆… hvor 1 1 1( , )i i i iK K x y+ + += .

    Sætning 6.1

    Med ovenstående notation er 1ix + og 1iy + rødder i polynomier af grad højst 2 over legemet iK .

    Bevis: Antag, at vi har konstrueret i punkter. Lad ( , )r rx y og ( , )s sx y være to af de punkter, der allerede er konstrueret, og som er forskellige. Ifølge definitionen oven-for haves , , ,r r s s ix y x y K∈ . Vi skal bestemme en ligning for linjen igennem de to punkter. En linje med normalvektor ( , )a b og som går igennem punktet 0 0( , )x y har som bekendt ligningen 0 0( ) ( ) 0a x x b y y− + − = . Som normalvektor kan vi bruge tværvektoren til retningsvektoren: ( ( ), ( ))s r s ry y x x− − − og som punktet 0 0( , )x y kan vi bruge et vilkårligt af de to punkter, for eksempel ( , )r rx y . Dermed fås følgende ligning for linjen igennem ( , )r rx y og ( , )s sx y : (2) ( )( ) ( )( ) 0s r r s r ry y x x x x y y− − − + − − = Altså en ligning af formen 0i i ia x b y c+ + = med koefficienter i iK .

  • 46

    Antag, at ( , )t tx y er et allerede konstrueret punkt, og lad r være afstanden mellem to allerede konstruerede punkter. Da vil , ,t t ix y r K∈ . Cirklen med radius r og centrum i ( , )t tx y har da ligningen: (3) 2 2 2( ) ( )t tx x y y r− + − = Antag, at vi nu konstruerer et nyt punkt 1 1( , )i ix y+ + som et skæringspunkt mellem en linje og en cirkel. Da vil dette skæringspunkt skulle tilfredsstille begge ligningerne (2) og (3). Ved at omskrive og indsætte den ene ligni