32
Kapitel 1 Lineære og multilineære afbildninger 1.1 Endeligdimensionale vektorrum I det følgende betegner X, Y, Z og så videre endeligdimensionale reelle vektorrum. Meget at det vi siger giver mening for uendeligdimensionale normerede vektorrum, og vi gør os stor umage for at formulere os, så det tager sig generelt ud. Men en række essentielle steder kommer vi til at trække på egenskaber, der kun holder for endeligdimensionale vektorrum. 1) Der vil eksistere mange normer på et vektorrum X. Men når X er endelige- dimensional, vil alle disse normer være ækvivalente. Hvis ‖·‖ og ||| · ||| er to normer på X, vil der altså findes en konstant C ||| x||| ≤ C xfor alle x ∈X . I særdeleshed giver to normer på X samme topologi. 2) Alle lineære afbildninger mellem endeligdimensionale vektorrum er kon- tinuerte. I forbindelse med uendeligdimensionale vektorrum får man en ube- hagelig sondring mellem to slags lineære afbildninger: de kontinuerte og de diskontinuerte. Denne sondring er man fri for i forbindelse med endeligdimen- sionale vektorrum. 1

Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

Kapitel 1

Lineære og multilineæreafbildninger

1.1 Endeligdimensionale vektorrum

I det følgende betegnerX, Y,Z og så videre endeligdimensionale reelle vektorrum.Meget at det vi siger giver mening for uendeligdimensionalenormerede vektorrum,og vi gør os stor umage for at formulere os, så det tager sig generelt ud. Men enrække essentielle steder kommer vi til at trække på egenskaber, der kun holder forendeligdimensionale vektorrum.

1) Der vil eksistere mange normer på et vektorrumX. Men nårX er endelige-dimensional, vil alle disse normer være ækvivalente. Hvis‖ · ‖ og ||| · ||| er tonormer påX, vil der altså findes en konstantC så

|||x||| ≤ C ‖x‖ for alle x ∈ X .

I særdeleshed giver to normer påX samme topologi.

2) Alle lineære afbildninger mellem endeligdimensionale vektorrum er kon-tinuerte. I forbindelse med uendeligdimensionale vektorrum får man en ube-hagelig sondring mellem to slags lineære afbildninger: de kontinuerte og dediskontinuerte. Denne sondring er man fri for i forbindelsemed endeligdimen-sionale vektorrum.

1

Page 2: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

2 Kapitel 1. Lineære og multilineære afbildninger

3) Alle underrum er afsluttede. Det er i virkeligheden påstanden om at de li-neære afbildninger er kontinuerte i forklædning. I uendeligdimensionale rumkan man have underrum der ligger tæt i hele rummet, og det er noget af enudfordring for den geometriske intuition.

4) Hvis man har en norm‖ · ‖ på et endeligdimensionalt vektorrumX, så vilalle afsluttede kugler, altså mængder af formen

{x ∈ X | ‖x− x0‖ ≤ r} ,

være kompakte delmængder afX.

5) En lineær afbildning af et endeligdimensionalt vektorrum X ind i sig selv,er automatisk bijektiv hvis den er injektiv eller hvis den ersurjektiv. Det er ethøjst forbløffende fænomen at injektivitet medfører surjektivitet og omvendt,men det følger af dimensionsbetragtninger.

Af og til benytter vi os af disse bekvemmeligheder. Nogle gange for at give korte,simple beviser, andre gange fordi den sætning vi diskutererkun er rigtig i endeligdi-mensionale rum. Vi sætter en ære i at formalismen fremtrædermeget generel, men ivirkeligheden beviser vi ingenting for uendeligdimensionale vektorrum.

Vi vil her bruge lidt energi på at advare mod en udbredt misforståelse angående en-deligdimensionale vektorrum: at de “bare” erRk for et passendek. Misforståelsenskyldes nok især at lineær algebra typisk ligger så tidligt iuniversitetsuddannelsen, atman reelt ikke har andre naturlige eksempler til sin rådighed. De eksempler man kun-ne tage fat på (f.eks. rum af lineære afbildninger), vil formentlig forvirre mere end degavner, på det stade af uddannelsen. Problemet med at identifcere allek-dimensionalevektorrum medRk, er at man på den måde siger at der kun er étk-dimensionalt vek-torrum. Og ofte erforskellighedenaf to k-dimensionale vektorrum en vigtig pointe.De er måske nok isomorfe som vektorrum, men udover vektorrumsstrukturen har dehver deres tekstur.

Det er sandt nok, at vælger man en basise1, . . . , ek for X, så kan man identificereXogRk ved hjælp af koordinatafbildningenφ : Rk→ X,

x1...

xk

7→

k∑

i=1

xi ei . (1.1)

Page 3: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.1. Endeligdimensionale vektorrum 3

Men denne identificering er som regel helt vilkårlig: et andet valg af basis ville giveen anden identificering. Og ingen af valgene er rettet ind modde egenskaber, derdefinererX - disse egenskaber kan være af geometrisk eller algebraisk art, som detnu må falde sig.

For at udrydde misforståelsen helt, vil vi starte med nogle eksempler på endeligdi-mensionale vektorrum, som man ikke uden videre kan erstattemedRk.

Eksempel 1.1Et todimensionalt underrum iR3 kan specificeres på flere måder. Mankan f.eks. angive et frembringersystem - i hvilket tilfældekommer man nærmestper automatik til at identificere underrummet medR2. Men man kan også angive ennormalvektora ∈ R3. Underrummet får da strukturen

X ={

x ∈ R3 | 〈x, a〉 = 0}

.

Denne beskrivelse fokuserer på underrummets placering i forhold til det omgivenderum, og leder ikke så let til en identificering medR2. Hvis man i et konkret problemhar givet et underrum ved hjælp af en normalvektor, så vil manofte stå sig ved atfastholde denne geometriske beskrivelse, ogundgå identificeringen medR2.

Eksempel 1.2 En flade i R3, er en dims der lokalt ser todimensional ud. Vi vilikke give en præcis definition her, men nøjes med en heuristisk behandling. Et oplagteksempel på en flade er overfladen af en kugle,

S2 ={

x ∈ R3 | ‖x‖ = 1}

.

Et begrænset område påS2 ligner et område iR2. Men globalt lignerS2 ikke endelmængde afR2 - f.eks. erS2 kompakt, men den har i modsætning til kompaktemængder iR2 ikke nogen rand. Andre flader, man umiddelbart kan komme i tankeom, er en torus (overfladen af en vanilliekrans) og et Möbius-bånd. Man kan også sepå grafen for en glat funktionR2→ R, eller overfladen af et omdrejningslegeme.

Lad M være en flade iR3. Vi vil til hvert punkt p ∈ M konstruere et todimensionaltvektorrumTpM, det såkaldtetangentrum i p. For hvert punktp ∈ M kan vi diskuterede glatte kurver påM, der går igennemp. Vi ser altså på afbildningerγ : (−ǫ, ǫ) → Mmed den egenskab afγ(0) = p, og vi antager at disse kurver, betragtet som afbildnin-ger (−ǫ, ǫ) → R3, er differentiable.

TangentrummetTpM til M i punktetp, defineres som systemet af alle tangentvektorertil glatte kurver påM igennemp. Hvisγ : (−ǫ, ǫ) → M er en glat kurve medγ(0) = p,

Page 4: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

4 Kapitel 1. Lineære og multilineære afbildninger

erγ′(p) altså et element i tangentrummetTpM, og dette tangentrum består af alle devektorer iR3, der kan fås frem på denne måde.

Det er klart at hvisv ∈ TpM, så vil ogsåcv ∈ TpM for ethvertc ∈ R - man kanblot gennemløbe den kurve, der producererv, i et lidt andet tempo. Det er derimodikke klart atTpM er stabil overfor addition. Tager man to vektorerv1 ogv2 i TpM, såligger der under dem to kurver gennemp. Men man kan ikke lægge kurver sammen.Og det man skal producere, er en tredie kurve gennemp, en kurve hvis tangentvektori p netop erv1 + v2. Man kan spekulere længe over hvordan det skal gøres. Og hvisspekulationerne skal krones med held, kræver det nok at man giver en præcis defini-tion af hvad man egentlig mener med en flade. Men så er det faktisk muligt at vise atTpM er additiv, og dermed udgør et todimensionalt vektorrum afR

3. Man forestillersig gerne det vektorrum siddende i punktetp som en “tangentplan”.

Pointen med denne løsagtige indførsel af tangentrum til flader i rummet, er selve dengeometriske indførsel af vektorrummet - det er en samling vektorer man får fremved visse forholdvis veldefinerede, men ikke helt simple geometriske operationer.Disse operationer har et ikke-lineært skær over sig, så selve vektorrumsstrukturen aftangentrummet er et ikke-trivielt forhold.

Hvis man indtager den holdning at alle disse tangentrum “bare” erR2, så misser manhele pointen. Tangentrummene hørende tilM’s punkter er netopforskellige vektor-rum, med hver sin veldefinerede geometriske betydning.

Eksempel 1.3 LadMn,n være mængden afn × n-matricer. Disse matricer udgør etn2-dimensionalt vektorrum. Identificeringen afMn,n medRn2

opnås ofte ved hjælp afden såkaldtevec-operator, der forn = 2 virker på følgende måde:

(

a bc d

)

7→

acbd

,

hvor man har taget søjlerne i matricen og stablet ovenpå hinanden. Udfører man denmodsatte operation, hvor man tager enn2-søjle, som man skærer in mindre søjler, derderefter placeres ved siden af hinanden i en matrix, siger man gerne at man brugerstack-operatoren.

Hvis man har en lineær afbildningRk → Rn, så er mange mennesker tilbøjelige tilat identificere denne afbildning med enn × k-matrix. Men hvad nu hvis man har en

Page 5: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.1. Endeligdimensionale vektorrum 5

lineær afbildningL : Rk → Mn,n? Eftersom sekundærrummet jo “blot” erRn2, så kan

L i princippet identificeres med enn2 × k-matrix. Men hvordan skal man forstå deenkelte koordinater i denne matrix?

Man er nok nødt til at gøre det i praksis, før man ser hvor kompliceret det bliver. Lados betragte den simple afbildning fraR2 ind iM2,2 givet ved

x 7→ x yT , (1.2)

hvor y er er fast vektor iR2. Skrevet ud i koordinater, står der

(

x1

x2

)

7→

x1 y1 x1 y2

x2 y1 x2 y2

.

Udsættes billedmatricen forvec-operatoren, bliver afbildningen

(

x1

x2

)

7→

x1 y1

x2 y1

x1 y2

x2 y2

=

y1 00 y1

y2 00 y2

(

x1

x2

)

.

Så nu har vi repræsenteret afbildningen (1.2) ved en matrix.Er det noget fremskridt?Det er svært at tro at der nogen, der ved et blik på den repræsenterende matrix, vilvære i stand til at forstå hvad den lineære afbildning gør. Såmatrix-repræsentationenaf den lineære afbildning er her et regulært tilbageskridt iforhold til den simple ogintutive form (1.2).

Lineære afbildninger ind i rum af matricer eller mellem rum af matricer, er ikkespor eksotiske, de dukker op i mange sammenhænge, f.eks. i forbindelse med højereordens afledede af flerdimensionale funktioner. Så man er nødt til at kunne forholdesig til dem. Og her er det i almindelighed et drastisk fejlgreb at insistere på at stablematricerne på højkant til vektorer, og repræsentere de lineære afbildninger ved “storematricer”, for koordinaterne i disse store matricer taber enhver geometrisk intuition.Det er langt at foretrække at holde sig til de oprindelige vektorrum, og fokusere påhvad de lineære afbildninger gør.

Page 6: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

6 Kapitel 1. Lineære og multilineære afbildninger

1.1.1 Indre produkter

Et indre produkt på et vektorrumX er en afbildning〈·, ·〉 : X × X → R, der opfylderfem regneregler:

1) 〈x1, x2〉 = 〈x2, x1〉 for x1, x2 ∈ X

2) 〈x1 + x2, x3〉 = 〈x1, x3〉 + 〈x2, x3〉 for x1, x2, x3 ∈ X

3) 〈cx1, x2〉 = c〈x1, x2〉 for x1, x2 ∈ X, c ∈ R

4) 〈x, x〉 ≥ 0 for x ∈ X

5) 〈x, x〉 = 0⇔ x = 0 .

Et indre produkt tillader os at tænke i baner af ortogonalitet, hvilket letter mange ar-gumenter. Det giver også mulighed for en eksplicit formel for den inverse afbildningtil koordinatafbildningen (1.1), hvis den anvendte basis er tilpasset det indre produkt,det vil sige hvis det er en ortonormalbasis.

Vi benytter ofte indre produkter for at give gennemskueligeargumenter. Men som visenere skal se, så adskiller forskellige indre produkter sig ikke synderligt fra hinan-den, og konklusioner opnået ved at argumentere på ét indre produkt kan som regelsmertefrit overføres til andre. PåRk vil vi som om regel arbejde med detsædvanligeindre produkt. På andre endeligdimensionale vektorrum kanman sagtens lave et in-dre produkt hvis man føler behov: til enhver basise1, . . . , ek findes der præcis ét indreprodukt der gøre1, . . . , ek til en ortonormalbasis.

Eksempel 1.4 PåMn,n er det ofte naturligt at arbejde med det såkaldte sporproduktgivet ved

〈〈A, B〉〉 = Tr(

AT B)

for A, B ∈ Mn,n . (1.3)

At det vitterligt er et indre produkt ses nemmest ved at gangeud:

〈〈A, B〉〉 =n

i=1

(

AT B)ii =

n∑

i=1

n∑

j=1

ai j bi j .

Sporproduktet af matricerneA og B er således det sædvanlige indre produkt påRn2,

taget på vec(A) og vec(B). En alternativ måde at karakterisere sporproduktet på, eratobservere atMn,n har en naturlig (for ikke at sige kanonisk) basis bestående af matri-cer hvor alle indgange er 0, bortset fra et enkelt sted hvor der står 1. Sporproduktet erdet indre produkt påMn,n der får denne naturlige basis til at blive ortonormal. Både

Page 7: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 7

tilgangen viavec-operatoren og tilgangen via den kanoniske basis forMn,n er uhyrenaturlige, men alligevel viser det sig at formlen (1.3) er den man vender tilbage tiligen og igen. Bemærk at denne formel udnytter andre strukturer vedMn,n end de renevektorrumsegenskaber.

På baggrund af et indre produkt påX kan man konstruere en norm ud fra den vel-kendte formel

‖x‖2 = 〈x, x〉 for x ∈ X .

Der findes mange normer derikke fremkommer ved et underliggende indre produkt.Men de der gør, er nemme at arbejde med, igen fordi ortogonalitet giver anledning tilmeget intuitive geometriske ræsonementer - f.eks. i form atPythagoras’ formel.

En meget vigtig sammenhæng mellem det indre produkt og den tilhørende norm erCauchy-Schwarz’ ulighed,

|〈x1, x2〉| ≤ ‖x1‖ ‖x2‖ for x1, x2 ∈ X , (1.4)

hvor det indre produkt vurderes op ved hjælp af normer. Omvendt kan man havebrug for at vurdere normer ved hjælp af indre produkter. Det gøres gerne ved hjælpaf relationen

‖x‖ = sup{< x, x1 >| x1 ∈ X, ‖x1‖ ≤ 1} , (1.5)

hvor den dene ulighed følger af Cauchy-Schwarz, og den andenulighed følger afdefinitionen på normen.

1.2 Lineære afbildninger

En afbildning L : X → Y mellem to endeligdimensionale vektorrumX og Y erlineær hvis

1) L (x1 + x2) = L x1 + L x2 for alle x1, x2 ∈ X ,

2) L (c x) = c L x for alle c ∈ R, x ∈ X .

Når man diskuterer lineære afbildninger, skriver man gerneL x i stedet forL(x).Det kaldesmultiplikativ skrivemåde. Skrivemåden udspringer formentlig af at mangemennesker tænker på lineære afbildninger i termer af matricer. Når man skriverL xtænker man sikkert nærmere på matrixmultiplikation end på afbildningsbegrebet. Vi

Page 8: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

8 Kapitel 1. Lineære og multilineære afbildninger

vil dog jævnligt bruge en anden notation, nemligL · x, der læses som “L virkendepåx”. En række formler, ikke mindst analysens kæderegler, bliver nemmest at forståhvis de udtrykkes i et “virkningssprog”.

Eksempel 1.5LadX ogY være to todimensionale underrum afR3. Begge er måskegivet ved en normalvektor, hhv.a og b. Afbildningen

x 7→ b× x ,

(hvor× betyder vektorkrydsprodukt) afbilder daX over iY. Regnereglerne for vek-torkrydsproduktet giver at afbildningen er lineær.

Afbildninger af denne type opstår i visse meget stiliseredefysiske problemer (“be-vægelige ledere i et magnetfelt”), men for så vidt er afbildningen ikke så spændende.Pointen er at den er givet ved nogle geometriske operationer- koordinater formplum-rer beskrivelsen, og der er ikke en matrix i syne.

Eksempel 1.6 Lad M og N være to flader i rummet, og ladf : M → N være en glatafbildning (vi vil ikke komme ind på hvornår en sådan afbildning er glat). Hvisp eret punkt påM, ogγ : (−ǫ, ǫ) → M er en glat kurve påM medγ(0) = p, så erf ◦ γ enkurve påN gennemf (p), og dermed giver kurven på naturlig måde anledning til envektorw = ( f ◦γ)′(0) ∈ T f (p)N. Kurven gav selvfølgelig også anledning til en vektorv = γ′(0) ∈ TpM.

Hvis γ1, γ2 : (−ǫ, ǫ) → M er to kurver med

γ1(0) = γ2(0) = p ,

og hvis de giver anledning til samme tangentvektor ip,

γ′1(0) = γ′2(0) ,

så kan man vise at de transformerede kurver påN også giver anledning til sammetangentvektor if (p),

( f ◦ γ1)′(0) = ( f ◦ γ2)′(0) .

Denne påstand er ikke helt nem at vise. Men når man har vist det, tillader den os atdefinere en afbildningD f (p) : TpM → T f (p)N ved følgende geometriske konstruk-tion:

Ladv ∈ TpM være givet.

Page 9: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 9

1) Find en kurveγ : (−ǫ, ǫ) → M medγ(0) = p ogγ′(0) = v.

2) SætD f (p)(v) := ( f ◦ γ)′(0).

Den konstruerede afbildningD f (p) kaldes gerne for den afledte aff i punktet p, ogden er et fundamentalt studieobjekt, når man undersøger flader i rummet.

Som vi var inde på i eksempel 1.2, er det ikke trivielt at addere tangentvektorer.Denne vanskelighed følger med, og det er ganske vanskeligt at se atD f (p) er lineær.Men deter den altså.

På mange måder erD f (p) : TpM → T f (p)N en meget bedre model for hvad lineæreafbildninger er for noget, end den sædvanlige matrixmultiplikation. Det er en geome-trisk konstruktion, helt fri for matricer og koordinater: den fortæller eksplicit hvordanvektorer i et vektorrum hver især skal afbildes over i vektorer i et andet vektorrum.Både primærrum og sekundærrum er for så vidt todimensionale. Men man må alli-gevel se på dem somforskellige vektorrum (tangentvektorer til to forskellige flader,i to forskellige punkter). Derfor nytter det ikke noget at ville identificere dem beggemedR2, og at ville udtrykkeD f (p) som en matrix.

Eller rettere sagt: sådanne identificeringer kan godt være hensigtmæssige i forskelligeberegningsmæssige trin, men de repræsenterer ikke den fulde sandhed, man skal heletiden være opmærksom på at der ligger andet bag end koordinater og matricer. Oggenerelle resultater bør formuleres koordinatfrit - for kun i så fald kan man fastholdeden geometriske intuition.

Eksempel 1.7LadA være enn×n matrix, og betragt afbildningenFA : Mn,n→ Mn,n

givet ved

FA X = AT X A for X ∈ Mn,n . (1.6)

Det er elementært at checke efter atFA er lineær. Hvis vi brugervec- og stack-operatorerne til at at identificereMn,n medRn2

, så kanFA naturligvis udtrykkes vedenn2× n2-matrix. Koordinaterne i denne matrix er udtryk for koordinaterne iA, mendisse udtryk er ingenlunde gennemskuelige. Hvisn = 2 og

A =

(

a bc d

)

,

Page 10: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

10 Kapitel 1. Lineære og multilineære afbildninger

så kan man - ved tilstrækkelig ihærdighed - vise at

vecFA X =

a2 ac ac c2

ab ad bc cdab bc ad cdb2 bd bd d2

vecX .

Og dermed har vi repræsenteret den lineære afbildningFA med 4× 4-matricen

a2 ac ac c2

ab ad bc cdab bc ad cdb2 bd bd d2

.

Man kan godt begynde at lede efter strukturer i denne matrix -man kan for eksempeldele den op i blokke, og se at den kan skrives

(

a AT c AT

b AT c AT

)

.

Men grundlæggende er den oprindelige dynamiske formulering (1.6) af den lineæreafbildning langt simplere og mere begribelig end matrixformuleringen.

Eksempel 1.8 Ikke alle afbildninger givet ved matrixoperationer er lineære. Form-len (1.6) i eksempel 1.7 definerer således for hvert fastA ∈ Mn,n en lineær afbildningFA fraMn,n ind i sig selv. Det vil sige at vi kan opfatteF som en afbildning

F : Mn,n→ Lin(Mn,n,Mn,n) ,

hvor sekundærmængder er rummet af lineære afbildninger afMn,n ind i sig selv (seeventuelt næste afsnit). Set på denne måde erF ikke lineær. Vi kan sammenligneFA+B medFA + FB ved at se hvordan de virker pån× n matricer:

FA+B X = (A+ B)T X (A+ B) = AT X A+ AT X B+ BT X A+ BT X B

= FA X + FB X + AT X B+ BT X A

Hvis vi blot kan finde én eneste matrixX så restleddetAT X B+BT X Aer forskelligefra nul-matricen, så erFA+B forskellig fra FA + FB. Og hvis vi blot kan finde tomatricerA og B og et X så restleddet er forskelligt fra nul-matricen, så erF ikkelineær. Et sådant modeksempel til linearitet kan f.eks. opnås ved at ladeA, B og Xvære enhedsmatricen.

Page 11: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 11

1.2.1 Rummet af lineære afbildninger

Rummet af alle lineære afbildninger fraX til Y kaldes Lin(X,Y). Hvis vi har toafbildningerL,S ∈ Lin(X,Y) defineres summenL + S som en afbildningX → Yved

(L + S)(x) = L x+ S x, for alle x ∈ X .

Og for L ∈ Lin(X,Y) ogc ∈ R defineresc L ved

(c L)(x) = c L x, for alle x ∈ X .

Det ses let at såvelL + S somc L selv er lineære. Med disse punktvise definitionerbliver Lin(X,Y) selv et vektorrum.

Lemma 1.9 LadX ogY være endeligdimensionale vektorrum. Da er Lin(X,Y) ogsået endeligdimensionalt vektorrum, og

dimLin(X,Y) = dimX dimY .

B: Lade1, . . . , en være en basis forX, og lad f1, . . . , fm være en basis forY. Derfindes fori = 1, . . . , n og j = 1, . . . ,m en entydigt bestemt lineær afbildningLi j deropfylder at

Li j (eℓ) =

f j hvis ℓ = i

0 ellers .

Man viser let at disse afbildningerLi j er et frembringersystem for Lin(X,Y) og erlinært uafhængige.

HvisX ogY er normerede vektorrum, definerer vi en norm på Lin(X,Y) ved at sætte

‖L‖ = sup{‖L x‖ | ‖x‖ ≤ 1} for L ∈ Lin(X,Y) .

Vi omtaler gerne‖L‖ somoperatornormen af L. Principielt kunne man forestille sigat denne “norm” bliver uendelig for visse lineære afbildninger. Og det er da også etreelt forekommende problem, hvis de indgående vektorrum eruendeligdimensionale.Men så længe vi holder os til endeligdimensionale vektorrum, gælder følgende:

Page 12: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

12 Kapitel 1. Lineære og multilineære afbildninger

Lemma 1.10 LadX ogY være endeligdimensionale, normerede vektorrum. Da er

‖L‖ < ∞ for alle L ∈ Lin(X,Y).

Endvidere er‖ · ‖ en norm på Lin(X,Y).

B: Den eneste af disse påstande, der ikke er triviel, er påstanden om at opera-tornormen altid er endelig. Det kan man komme med mere eller mindre indvikledeargumenter for - her er et, der ikke kræver en identificering af X ogYmed euklidiskerum.

Lade1, . . . , ek være en basis forX. Vi kan da indføre

|||

k∑

i=1

ai ei ||| =

k∑

i=1

|ai | .

Det eftervises let at||| · ||| er en norm påX, og da alle normer er ækvivalente, findesder en konstantC så

|||x||| ≤ C‖x‖ for alle x ∈ X .

Hvis vi ser påx =∑

i ai ei får vi at

‖Lx‖ = ‖k

i=1

ai Lei‖ ≤

k∑

i=1

|ai | ‖Lei‖ ≤ max{

‖Le1‖, . . . , ‖Lek‖}

k∑

i=1

|ai | .

Heraf slutter vi at‖L‖ ≤ max

{

‖Le1‖, . . . , ‖Lek‖}

C .

Vi kan muligvis ikke sige alverden om størrelsen af denne øvre grænse, men den er ihvert fald endelig.

I uendeligdimensionale sammenhænge er man nødt til at gøre et stort nummer udaf at skelne mellembegrænsedelineære afbildninger (de lineære afbilningerL, deropfylder at‖L‖ < ∞) og de ubegrænsede (som er dem med uendelig “norm”).

En lineær afbildningL ∈ Lin(X,Y) opfylder automatisk at

‖L x‖ ≤ ‖L‖ ‖x‖ for alle x ∈ X ,

og dermed‖L x1 − L x2‖ ≤ ‖L‖ ‖x1 − x2‖ for alle x1, x2 ∈ X .

En lineær afbildningL opfylder således altid en Lipschitz-betingelse med‖L‖ somLipschitz-konstant. Specielt er lineære afbildninger kontinuerte.

Page 13: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 13

Lemma 1.11 LadX,Y ogZ være normerede, endeligdimensionale vektorrum. ForL ∈ Lin(X,Y) og S∈ Lin(Y,Z) gælder at

‖S L‖ ≤ ‖S‖ ‖L‖ . (1.7)

B: Her skalS L forstås som sammensætningen af de to lineære afbildninger.Det er igen en multiplikativ skrivemåde, der anvendes for lineære afbildninger, i ste-det for den mere traditionelle notationS ◦ L. Uligheden (1.7) formuleres ofte på denmåde at operatornormen ersubmultiplikativ .

B: For hvertx med‖x‖ ≤ 1 har vi at

‖(S L) x‖ = ‖S(L x)‖ ≤ ‖S‖ ‖L x‖ ≤ ‖S‖ ‖L‖ ,

hvor vi har brugtS opfylder en Lipschitz-betingelse.�

Et forhold, der nogle gange fører til skrig og skrål, er at operatornormen på Lin(X,Y)er snævert knyttet op på normerne på de indgående rumX ogY. Hvis man skifternormer på de underliggende rum, så ændrer man operatornormen.

Hvis man udstyrerRk med normen‖ · ‖2, så fører det til én operatornorm påLin(Rk,Rk). Og hvis man udstyrerRk med normen‖ · ‖∞, så fører det til en andenoperatornorm på Lin(Rk,Rk). Og her undlader vi helt at komme ind på de problemer,der måtte opstå, hvis man skulle få den ide at udstyre de to kopier afRk med hver sinnorm. . .

Det er sådan set ikke vanskeligt at forstå dette forhold. Menproblemet er at det ikkeafspejles i notationen. Hvis man begynder at sætte fodtegn på operatornormstregerne,skal man være meget omhyggelig med at forklare hvad man mener, for der vil værealle muligheder for misforståelser. I almindelighed forventes læseren selv at kunneholde styr over hvilke underliggende normer, en operatornorm skal forstås i forholdtil. Og heldigvis vil to operatornormer jo altid være ækvivalente, når de underliggen-de rum er endeligdimensionale, så forvirringen er mest på det formelle plan: for deopnåede resultater, er det typisk lige meget hvilken operatornorm man refererer til.

Nogle gange er det nyttigt at udstyre Lin(X,Y) med et indre produkt. Hvis bådeXogY har et indre produkt, og hvise1, . . . , ek er en ortonormalbasis forX, så kan visætte

〈〈A, B〉〉 =k

i=1

〈Aei , Bei〉 for A, B ∈ Lin(X,Y) . (1.8)

Page 14: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

14 Kapitel 1. Lineære og multilineære afbildninger

Denne konstruktion er tæt beslægtet med sporproduktet påMn,n. Man kan vise at〈〈·, ·〉〉 ikke afhænger af det præcise valg af den ortonormale basis der indgår i kon-struktionen, men den afhænger dog af valget af indre produkter. Normen associeretmed〈〈·, ·〉〉 kaldes Hilbert-Schmidt normen. I almindelighed er Hilbert-Schmidt nor-men og operatornormenikke ens.

1.2.2 Det duale rum tilX

Et specielt rum af lineære afbildninger optræder så ofte at det har fået et specielt navn:Det er rummet af lineære afbildninger fraX over i det etdimensionale vektorrumR,skrevet Lin(X,R). Det kaldes detduale vektorrum tilX, og skrives gerneX∗. Detfølger af lemma 1.9 at det duale rumX∗ har samme dimension somX.

Vi kan eksplicit identificereX∗ medX hvisX er udstyret med et indre produkt〈·, ·〉.For hver vektorv ∈ X kan vi producere en lineær afbildningX → R ved

Lv x = 〈x, v〉 for x ∈ X . (1.9)

Vi ser atv 7→ Lv er en afbildningX → X∗, og denne afbildning er tydeligvis lineær.Hvis Lv = Lw, så er〈x, v − w〉 = 0 for alle x, og det følger af (1.5) atv − w = 0.Dermed erv 7→ Lv injektiv. Vi kan også nemt vise at den er surjektiv: Lade1, . . . , ek

være en ortonormalbasis forX, og ladL ∈ X. Vi har da at

L(x) = L

k∑

i=1

〈x, ei〉ei

=

k∑

i=1

〈x, ei〉L(ei ) = 〈x,k

i=1

L(ei)ei〉

Vi ser således atL = Lv hvor v =∑k

i=1 L(ei)ei .

Dermed erv 7→ Lv en isomorfiX → X∗. Det følger oven i købet af Cauchy-Schwarzat nårX∗ udstyres med operatornormen, så erv 7→ Lv en isometri.

Det er således fuldstændigt naturligt at identificere et rumX med dets duale rumX∗

ved hjælp af isomorfienv 7→ Lv. Men det er lige så ofte nyttigt at holde begreberneadskilt. Bemærk at isomorfienv 7→ Lv afhænger af det indre produkt. Har man flereindre produkter påX, svarer de til hver sin isomorfi mellemX ogX∗ - et forhold, detgodt kan afstedkomme en vis forvirring.

Page 15: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 15

1.2.3 Matricer

Enk×m-matrixA = (ai j )i=1,...,k, j=1,...,m en er organisation afkmreelle tal i et kvadratiskskema,

A =

a11 a12 . . . a1m

a21 a22 . . . a2m...

.... . .

...

ak1 ak2 . . . akm

.

Skal man være meget formel, kan man eventuelt sige at enk×m-matrix er er afbild-ning {1, . . . , k} × {1, . . . ,m} → R. Men skønt denne beskrivelse formelt set er korrekt,rammer den alligevel en smule ved siden af: den egentlige brug af matricer er snævertknyttet til deres grafiske fremtræden som talskemaer. Vi kalder gerne de enkelte tal iskemaet for matricens koordinater eller felter.

Systemet af allek×m-matricer kalderMk,m. Hvis vi indfører addition plads for pladsog skalar multiplikation plads for plads, ser vi atMk,m er et vektorrum. Tydeligvis erdimensionen afMk,m lig medkm.

Visse matricer kan ganges sammen: HvisA er enk×m-matrix, ogBer enm×n-matrix,så defineres matrixproduktetC = A B somk× n-matricen med koordinater

ci j =

m∑

ℓ=1

aiℓ bℓ j for i = 1, . . . , k, j = 1, . . . , n .

Matrixmultiplikation opfylder en lang række pæne regneregler - men den kommuta-tive lov hører ikke til iblandt dem. HvisA og B begge erm× m-matricer, vil beggeprodukterA B og BA være veldefineredem× m-matricer. Men de vil typisk væreforskellige.

Det er ganske naturligt at identificereRk med rummetMk,1 af k× 1-matricer - det vilfaktisk kræve en betydelig ihærdighed at sondre mellem enk-vektor og enk-søjle. Sålad os da foretage denne identificering. Men vi holder til gengæld fanen højt på denanden led, og undlader at identificerek-vektorer medk-rækker.

Enk×m-matrix A giver anledning til en lineær afbildningLA : Rm→ Rk, givet ved

LA x = A x , x ∈ Rm .

Page 16: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

16 Kapitel 1. Lineære og multilineære afbildninger

For at læse alle detaljer i denne definition højt:x er etm-tuppel, og oversættes strakstil en m× 1-matrix. Denne matrix multipliceres medA, og resultatet bliver enk × 1-matrix. Der tilbageoversættes til etk-tuppel. Regnereglerne for matrixmultiplikationsikrer atLA bliver lineær.

Ser vi påA 7→ LA, har vi konstrueret en afbildningMk,m → Lin(Rm,Rk). Denneafbildning ses let at være lineær og injektiv, og af dimensionsgrunde er den der-for en isomorfi. Faktisk er den også multiplikativ, i den forstand atLALB = LA B,når sammensætningerne og matrixprodukterne giver mening.Denne isormorfi tagesuhyre alvorligt i brede kredse, i en grad så det er en almindelig opfattelse at en lineærafbildninger en matrix, og at sammensætning af lineære afbildningerer matrixmul-tiplikation.

I indledningen har vi skitseret et antal eksempler på hvor uhensigtsmæssig et sådantsynspunkt er: den kraftige fokus på det kvadratiske talskema forhindrer at man kanfå en ordentlig forståelse af lineære afbildninger ind i rumaf lineære afbildningereller ind i rum af matricer, for den sags skyld. Og sådanne afbildninger er vitterligtnødvendige at kunne arbejde med. Og der bliver noget helt arbitrært over de matricer,man kan få til at “repræsentere” lineære afbildninger mellem vektorrum, der ikke apriori er identificeret med euklidiske rum.

Forholdet mellem matricer og lineære afbildninger beskrives udmærket i antonymer-ne passiv/aktiv. En lineær afbildning er et aktivt objekt, det er en operation der flyttervektorer fra et rum til et andet - eller fra et rum til sig selv,hvis det skal være. Essen-sen af den lineære afbildning er hvad dengør ved vektorerne.

En matrix er på den anden side et dødt, fladt talskema. Det “gør” ingen verdens ting,det står bare og fylder op på papiret. Man kan tænke på afbildningenA 7→ LA som enaktivering af talskemaet.

Tilsvarende kunne man opfatte den operation, hvor man repræsenterer en lineær af-bildningRm→ Rk med enk×m-matrix som en “fiksering” af den lineære afbildning.Billedlig talt svarende til hvad der sker når en sommerfugleentusiast sætter en nåligennem sit studieobjekt - så er det slut med at flagre rundt!

Skulle man have lyst til at foretage denne fiksering, er den for så vidt ikke vanskelig.Vi får brug for at udstyre de euklidiske rum med de sædvanligeindre produkter, og

Page 17: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 17

med de kanoniske baser. Den kanoniske basis forRk er

e1 =

10...

0

, e2 =

01...

0

, . . . , ek =

00...

1

.

Lemma 1.12 Lad L : Rm → Rk være en lineær afbildning. Definer k×m-matricenA ved

ai j = 〈ei , L f j〉 for i = 1, . . . , k, j = 1, . . . ,m,

hvor e1, . . . , ek og f1, . . . , fm er de kanoniske baser for hhv.Rk og Rm. Matricen Arepræsenterer L i den forstand at L= LA.

B: Udnyt at

x =m

j=1

〈x, f j〉 f j for alle x ∈ Rm , y =k

i=1

〈y, ei〉ei for alle y ∈ Rk .

Check efter atL og LA virker ens på alle vektorer! Eller eventuelt blot på vektorernei den kanoniske basis.

Et område, hvor der er rig lejlighed til at påvise den konceptuelle forskel mellemmatricer og lineære afbildninger, er i spørgsmålet om normer. Det er næsten umuligtat udtrykke operatornormen‖LA‖ ved hjælp af tallene i talskemaetA. Det kan ladesig gøre at opstille formler i 2× 2-tilfældet, men resultatet er ikke kønt. Og for størrematricer, er det regulært umuligt.

Til gengæld kan der lægges læssevis af normer påMk,m ved at udnytte at dette rumjo blot er en speciel måde at repræsentereRkm på. Vi kan f.eks. indføre

‖A‖1 =∑

i, j

|ai j | , ‖A‖2 =

i, j

ai j2

1/2

, ‖A‖∞ = maxi, j|ai j | .

Disse normer kan være nyttige i visse sammenhænge, ikke mindst kan de være simpleat regne ud i konkrete tilfælde. Men de siger stort set intet om den lineære afbildningLA, og dens dynamiske opførsel.

Page 18: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

18 Kapitel 1. Lineære og multilineære afbildninger

I hvert fald ikke i andet end den primitive forstand at alle normer på et givet endeligdi-mensionalt vektorrum er ækvivalente. Så en følge af lineæreafbildningerL1, L2, . . .

går mod nul i operatornorm hvis og kun hvis følgen af repræsenterende matricerA1,A2, . . . går mod nul i en hvilken som helst af ovenstående matrixnormer.

1.2.4 Adjungerede afbildninger

Hvis X ogY er udstyrede med indre produkter, så findes der for hver lineær afbild-ning L : X → Y en entydigt bestemt lineær afbildningL∗ : Y → X, der opfylderat

〈Lx, y〉 = 〈x, L∗y〉 for alle x ∈ X, y ∈ Y .

Denne afbildning kaldes gerne denadjungeredeafbildning til L.

Eksistensen af den adjungerede afbildning kan bevises på følgende måde: for hvertfasty ∈ Y er afbildningen

x 7→ 〈Lx, y〉

en lineær afbildningX → R. Sådan en afbildning repræsenteres ifølge afnsit 1.2.2 afen vektorvy ∈ X, så

〈Lx, y〉 = 〈x, vy〉 .

Afbildningen y 7→ vy er naturligvis en afbildningY → X, så tilbage står kun atchecke efter, at denne afbildning er lineær. Og det er relativt trivielt: additivitetenfølger således af følgende regning:

〈x, vy1+y2〉 = 〈Lx, y1 + y2〉 = 〈Lx, y1〉 + 〈Lx, y2〉 = 〈x, vy1〉 + 〈x, vy2〉 = 〈x, vy1 + vy2〉 .

Når det gælder for allex, må de toX-vektorervy1+y2 og vy1 + vy2 være ens.

Konstruktionen af den adjungerede afbildning er knyttet nøje op på valget af indreprodukter. Skifter man indre produkt på et eller begge rum, så ændrer man den adjun-gerede afbildning. Men så længe man holder fast i de indre produkter, kan begrebetvære ganske nyttigt.

Man kan se på∗-operationen som en afbildning Lin(X,Y) → Lin(Y,X). Det er letat se at den er lineær,

(A+ B)∗ = A∗ + B∗ for alle A, B ∈ Lin(X,Y) ,

(c A)∗ = c A∗ for alle A ∈ Lin(X,Y) , c ∈ R ,

Page 19: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.2. Lineære afbildninger 19

at den er involutorisk,

(

A∗)∗= A for alle A ∈ Lin(X,Y) ,

og antimultiplikativ,

(A B)∗ = B∗A∗ for alle A ∈ Lin(Y,Z) , B ∈ Lin(X,Y) .

Af involutionsegenskaben følger at∗-operationen er såvel injektiv som surjektiv, såvi kan se på∗-operationen som en isomorfi mellem Lin(X,Y) og Lin(Y,X). Faktisker det også en isometri: der gælder det relativt dybsindige resultat at

‖A∗ A‖ = ‖A‖2 for alle A ∈ Lin(X,Y) . (1.10)

Dette resultat går ofte under navnetC∗-identititen, i hvert fald nårX = Y. Kombine-res med det forhold at operatornormen er submultiplikativ,får vi at

‖A‖2 = ‖A∗ A‖ ≤ ‖A∗‖ ‖A‖ ,

og forkortes den ene‖A‖-faktor væk, står der at‖A‖ ≤ ‖A∗‖. Men involutionsegen-skaben betyder at denne ulighed indeholder den modsatte ulighed:

‖A‖ = ‖(

A∗)∗‖ ≤ ‖A∗‖ .

Og derfor er∗ en isometri.

Eksempel 1.13 Hvis vi udstyrerRk og Rm med de sædvanlige indre produkter, såkan vi let finde den adjungerede afbildning til en lineær afbildning LA : Rk → Rm,repræsenteret afm× k-matricenA. For x ∈ Rk ogy ∈ Rm, se vi at

〈LA x, y〉 =m

j=1

(LA x) j y j =

m∑

j=1

k∑

i=1

a ji xi

y j =

k∑

i=1

xi

m∑

j=1

a ji y j

= 〈x, LAT y〉 ,

hvor LAT er den lineære afbildning, der repræsenteres afA’s transponeredematrix

AT . Så en operator svarer til sin adjungerede på samme måde som en matrix svarertil sin transponerede.

Page 20: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

20 Kapitel 1. Lineære og multilineære afbildninger

1.3 Bilineære afbildninger

Hvis X,Y og Z er tre vektorrum, siges en afbildningB : X × Y → Z at værebilineær hvis

1) For hvert fasty ∈ Y er x 7→ B(x, y) en lineær afbildningX → Z.

2) For hvert fastx ∈ X ery 7→ B(x, y) en lineær afbildningY → Z.

Rummet af bilineære afbildninger fraX × Y → Z betegnes Bil(X,Y;Z). Ved desædvanlige punktvise definitioner, ser vi let at Bil(X,Y;Z) er et vektorrum.

En bilineær afbildningB : X × X → Z (bemærk: definitionsmængden er et produktaf to identiske faktorer) ersymmetrisk hvis

B(x1, x2) = B(x2, x1) for alle x1, x2 ∈ X .

Bilineære afbildningerB : X × Y → R omtales gerne sombilinearformer fremforbilineære afbildninger.

Bemærk atX × Y selv er et vektorrum. En afbildningB : X × Y → Z har derfor iprincippet mulighed for at være såvel lineær som bilineær, og man kan derfor spørgeom hvilke afbildninger, der opfylder begge krav.

Lemma 1.14 Hvis B : X ×Y → Z er såvel lineær som bilineær, så er

B(x, y) = 0 for alle x∈ X, y ∈ Y .

B: Bilinearitet gør at

B(x, 0) = B(x, 0y) = 0B(x, y) = 0 for alle x ∈ X .

Det indgåendey betyder blot et eller andetY-element - det kunne for eksempel værenul-vektoren, men det spiller faktisk ingen rolle. Helt tilsvarende viser man naturlig-vis at

B(0, y) = 0 for alley ∈ Y .

Hvis vi nu skriver(x, y) = (x, 0)+ (0, y) ,

Page 21: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.3. Bilineære afbildninger 21

får vi, ved at bruge lineariteten afB, at

B(x, y) = B(x, 0)+ B(0, y) = 0+ 0 = 0 for alle x ∈ X, y ∈ Y .

Vi kan således slå fast at “linearitet på et produktrum” og “bilinearitet” er to vidtforskellige begreber. Mankan formalisere en vis sammenhæng ved hjælp af begrebettensorprodukt, men det ligger ud over hvad vi vil beskæftigeos med her.

Eksempel 1.15Det simpleste eksempel på en bilineær afbildning er reel multiplika-tion. Vi ser på afbildningenR2 → R givet ved at (x, y) 7→ xy. At denne afbildningopfylder betingelserne for at være bilineær, ligger i de sædvanlige associative, kom-mutative og distributive regneregler. Bemærk at denne specielle bilineære afbildninger symmetrisk.

Eksempel 1.16 Matrixmultiplikation er bilineær. Vi taler altså om afbildningenMnk × Mkm → Mnm givet ved at (A, B) 7→ A B. Man checker let de nødvendigebetingelser efter. Bemærk at selv omn = k = m, så er matrixmultiplikation ikkesymmetrisk (medmindre den fælles værdi af dimensionerne er1).

Eksempel 1.17For A, B ∈ Mn,n kan vi definere en lineær afbildning fraMn,n til sigselv ved

HA,B X = A X BT for X ∈ Mn,n .

Løfter vi blikket en anelse, ser vi at vi på denne måde har defineret en afbildning

H : Mn,n ×Mn,n→ Lin(Mn,n,Mn,n) .

Det følger let af regnereglerne for matrixmultiplikation at H er bilineær. Man skriversædvanligvisA⊗B for den lineære afbildningHA,B, og man taler om tensorproduktetaf A og B. Disse tensorprodukter spiller en stor rolle i analysen af f.eks. flerdimensio-nale normalfordelingsmodeller, og eftersom man sjældent ser forfattere, der virkelighar styr over formalia, fører det gerne til notationsmæssige mareridt, hvor man insi-sterer på at se på et tensorprodukt som et firevejsskema mast fladt, så det kan være ito dimensioner.

Page 22: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

22 Kapitel 1. Lineære og multilineære afbildninger

Eksempel 1.18 LadX ogY være endeligdimensionale vektorrum med indre pro-dukter. Forx ∈ X og y ∈ Y kan vi indføre en afbildningx⊗ y : X ×Y → R ved

x⊗ y · (x′, y′) = 〈x, x′〉〈y, y′〉 for x′ ∈ X, y′ ∈ Y .

Det er let at se atx⊗ y er bilineær.◦

Eksempel 1.19 Sammensætning af lineære afbildninger er bilineær. Vi taler altsåom afbildningen Lin(Y,Z) × Lin(X,Y) → Lin(X,Z) (bemærk rækkefølgen af deindgående rum) givet ved

(L,S) 7→ L S .

Eftersom sammensætning af lineære afbildninger “svarer til” matrixmultiplikation,er det essentielt samme eksempel som det foregående. Selv omde tre vektorrumX,Y ogZ skulle være ens (eller isomorfe), er sammensætning af lineære afbildningersædvanligvis ikke symmetrisk.

Eksempel 1.20Endnu en variant af det samme princip er evalueringsafbildningen

ev : Lin(X,Y) × X → Y ,

givet vedev(L, x) = L x , for L ∈ Lin(X,Y), x ∈ X .

For fastL er x 7→ L x lineær per definition, og for fastx er L 7→ L x lineær, fordivektorrumsoperationerne på Lin(X,Y) er defineret punktvist. Altså er evalueringsaf-bildningen bilineær.

Til enhverk×m-matrix A findes en associeret bilineær afbildningBA : Rk×Rm→ R

givet vedBA(x, y) = xT Ay for x ∈ Rk y ∈ Rm .

For at læse højt: i denne definition identificeresk-vektorenx med enk × 1-matrix,mensm-vektoreny identificeres med enm× 1-matrix. Disse matricer udsættes formanipulationerne på højre side af lighedstegnet, og ud kommer en 1× 1-matrix, deridentificeres med et reelt tal. Regnereglerne for matrixprodukter medfører at denneafbilning vitterligt er bilineær. Evt. kan man skrive defintionen op i koordinater:

BA(x, y) =k

i=1

m∑

j=1

xi ai j y j .

Page 23: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.3. Bilineære afbildninger 23

Lemma 1.21 Lad B : Rk × Rm → R være en bilineær afbildning. Definer k× m-matricen Aved

ai j = B(ei , f j) for i = 1, . . . , k, j = 1, . . . ,m.

Her er e1, . . . , ek og f1, . . . , fm de kanoniske baser for hhv.Rk og Rm. Matricen Arepræsenterer B i den forstand at B= BA.

B: Udnyt at

x =m

j=1

〈x, f j〉 f j for alle x ∈ Rm , y =k

i=1

〈y, ei〉ei for alle y ∈ Rk .

Check efter atB og BA virker ens på alle par af vektorer! Eller eventuelt blot påvektorerne i de kanoniske baser.

Det er afgørende for dette resultat at de bilineære afbildning har værdier i det etdi-mensionale rumR. En bilineær afbildning med flerdimensionale værdier kanikkerepræsenteres på denne måde - med mindre man er parat til at inddrage tredimensio-nale “matricer”! Det er man typisk ikke villig til, for hele pointen med matricer ernetop den overskuelighed, som den flade, grafiske fremtrædengiver.

Men selv om man holder sig til bilinearformer, giver resultatet rigelige mulighederfor forvirring. Vi har identificeret matricer med lineære afbildninger. Vi kan nu i-dentificere matricer med bilinearformer. Og vi har lige vistat bilinearformerikkeer lineære! Der er ikke nogen modstrid i disse resultater, kun (tilstræbt) paradoksaleformuleringer. Hvis vi tænker på enk×m-matrix som en lineær afbilning, er der taleom en afbildningRm→ Rk. Når vil tænker på matricen som en bilineær afbildning,er der tale om en afbildningRk × Rm → R. Faktisk hænger de to afbilninger nøjesammen, idet

BA(x, y) = 〈x, LAy〉 for alle x ∈ Rk, y ∈ Rm ,

hvor 〈·, ·〉 er det sædvanlige indre produkt påRk.

Denne sammenhæng antyder til gengæld en sammenhæng mellem lineære og biline-ære afbildninger, der har vidtrækkende betydning:

Page 24: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

24 Kapitel 1. Lineære og multilineære afbildninger

Lemma 1.22 Rummet af lineære afbildningerX → Lin(Y,Z) er som vektorrumisomorft med Bil(X,Y;Z). I formler:

Lin(

X, Lin(Y,Z))

� Bil(X,Y;Z) .

Isomorfien er givet ved at en lineær afbildning L: X → Lin(Y,Z) sendes over i enbilineær afbildning BL ved konventionen

BL(x, y) = L(x)(y) . (1.11)

B: Bemærk at for givetx er L(x) en lineær afbildningY → Z. Det giver derformening at tage denne lineære afbildning på et konkrety, og derved fås et element iZ. Vi kan således konstatere atBL er en veldefineret afbildningX ×Y → Z.

Man checker let efter ved mekanisk regneri atBL er bilineær for hvertL, og at afbild-ningenL 7→ BL er en lineær afbildning. Tilbage står at undersøge om denne lineæreafbildning er en isomorfi.

Men det følger hvis vi kan producere den inverse afbildning.Og det er sådan set klarthvordan den inverse skal se ud: hvisB er en bilineær afbildningX ×Y → Z, så harvi for fast x at y 7→ B(x, y) er en lineær afbildningY → Z. Hvis vi skriver denneafbildning somB(x, ·), ser vi dernæst at

x 7→ B(x, ·)

er en lineær afbildningX → Lin(Y,Z). Vi har således produceret en afbildning,der sender bilineære afbildninger over i lineære afbildninger ind i rum af lineæreafbildninger, altså netop den modsatte vej af den mådeL 7→ BL virker. Man checkerlet efter at de to afbildninger er inverse til hinanden.

Første gang man støder på fænomenet lineære afbildninger ind i rum af lineære af-bildninger, giver det anledning til to ganske modsatrettede reaktioner: dels virker detskræmmende abstrakt, og ikke som noget man har lyst til at skulle beskæftige sigmed. Og dels virker det ganske trivielt, eftersom Lin(Y,Z) jo selv blot er et endelig-dimensionalt vektorrum. Det tager en hel del tilvænning at forlige disse reaktioner -man bliver gerne ved med at skifte mellem de to yderpunkter ganske længe.

Sagen er at lineære afbildninger ind i rum af lineære afbildninger ikke er noget ekso-tisk - denne type objekter dukker op af sig selv i mangfoldigesammenhænge, ikke

Page 25: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.3. Bilineære afbildninger 25

mindst i forbindelse med differentialregning i flere variable. Og derfor er man tvungettil at vænne sig til dem. Lemma 1.22 er en stor hjælp i tilvænningsprocessen, fordibilineære afbildninger ikke virker nær så skræmmende - her er ingen funktionsruminvolveret.

Lemmaet forklarer på den anden side hvorfor fænomenet lineære afbildninger ind irum af lineære afbildninger bliver ved med at mystificere: Hvis man arbejder med enmekanisk oversættelse af lineære afbildninger til matricer, så vil man oversætte enlineær afbildningRn → Lin(Rk,Rm) til en lineær afbildningRn→ Mmk. Matrixrum-met erm k-dimensionalt, så i princippet kan denne afbildning repræsenteres ved en(m k) × n-matrix.

Problemet er at ingen kan finde ud af at skrive denne store matrix fornuftigt op,uanset hvor meget de øver sig. De virkelige dimensioner i problemet relaterer sig tilet trevejsskema, ikke til et tovejsskema. Og når man forsøger at presse et trevejsskemafladt, så får man et tovejsskema, der ikke umiddelbart kan aflæses.

Den eneste måde at undgå denne evigt genkommende mystificering på, er at forladeforestillingen om at lineære afbildninger er “det samme” som matricer. Lineære af-bildninger er det fundamentale objekt. Nogle gange kan lineære afbildninger studeresved hjælp af matricer, men lige så ofte er matricer en hindring i stedet for en hjælp.

Hvis de tre vektorrumX, Y og Z alle tre har en norm, så kan man udstyreBil(X,Y;Z) med en operatornorm ved definitionen

‖B‖ = sup{‖B(x, y)‖ | ‖x‖ ≤ 1, ‖y‖ ≤ 1} for B ∈ Bil(X,Y;Z) .

Det kræver en vis indsats (analogt med indsatsen i lemma 1.10) at se efter at dervirkelig er tale om en norm. Men bilinearitet sikrer at

‖B(x, y)‖ ≤ ‖B‖ ‖x‖ ‖y‖ for alle x, y . (1.12)

Man kan vise at isomorfien i lemma 1.22 faktisk er en isometri med denne kon-vention - underforstået: når Lin(Y,Z) er udstyret med operatornormen, og nårLin(X, Lin(Y,Z)) er udstyret med den herudfra konstruerede operatornorm.

Et specielt eksempel på denne isometri, får man når man starter med enk×m-matrixA: den hertil hørende lineære afbildningLA : Rm→ Rk har en vis operatornorm, lige-

som den associerede bilineære afbildningBA : Rk×Rm→ R har en vis operatornorm.Isometrien sikrer at

‖LA‖ = ‖BA‖ .

Page 26: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

26 Kapitel 1. Lineære og multilineære afbildninger

En symmetrisk bilinearformB : X × X → R siges at værepositivt semidefinit,skrevetB ≥ 0, hvis

B(x, x) ≥ 0 for alle x ∈ X ,

ogpositivt definit , skrevetB > 0, hvis

B(x, x) > 0 for alle x ∈ X, x , 0 .

For en symmetrisk bilinearformBA påRk, repræsenteret af en matrixA, kan dissebegreber formuleres i termer afA’s egenværdier:BA er positivt semidefinit hvis alleA’s egenværdier er ikke-negative, ogBA er positivt definit hvis alleA’s egenværdierer strengt positive.

Lemma 1.23 LadX være et normeret vektorrum, og lad F: X × X → R være ensymmetrisk og positivt definit bilinearform. Der findes etǫ > 0 sådan at det for allesymmetriske bilinearformer G: X × X → R gælder at hvis‖G − F‖ < ǫ, så må Gvære positivt definit.

B: Da F er positivt definit, er

F(x, x) > 0 for alle x ∈ Xmed‖x‖ = 1.

Da {x | ‖x‖ = 1} er afsluttet og begrænset og derfor kompakt, må den kontinuertefunktion x 7→ F(x, x) antage et minimum over denne mængde. Dette minimum erikke nul, og der findes derfor etλ > 0 sådan at

F(x, x) ≥ λ for alle x ∈ X med‖x‖ = 1.

Men dermed er

F(x, x) = ‖x‖2F

(

x‖x‖,

x‖x‖

)

≥ λ ‖x‖2 for alle x , 0 ,

og såmænd også forx = 0, i det begge sider af uligheden i så fald er nul. Hvis‖F −G‖ < λ2, så er

G(x, x) = F(x, x) +G(x, x) − F(x, x) ≥ λ‖x‖2 − ‖F − G‖ ‖x‖2 ≥λ

2‖x‖2

for alle x ∈ X, hvilket viser atG er positivt definit.�

Page 27: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.4. Multilineære afbildninger 27

1.4 Multilineære afbildninger

En naturlig videreudvikling af bilinearitetsbegrebet fårman ved at studere afbildnin-ger fra et større produktrum,

M : X1 × . . . × Xk → Y .

Hvis en sådan afbildning er lineær i hver af dek koordinater for sig, taler man omenk-lineær afbildning. Eller blotmultilineær , hvis man underforstårk’et. Systemetaf allek-lineære afbildninger fraX1 × . . . × Xk til Y kaldes Link(X1, . . . ,Xk;Y), ogudgør naturligvis et endeligdimensionalt vektorrum.

En k-lineær afbildningM : X × . . . × X → Y (bemærk: definitionsmængden er etprodukt af identiske faktorerer) ersymmetrisk hvis

M(x1, . . . , xk) = M(xσ(1), . . . , xσ(k)) for alle x1, . . . , xk ∈ X og alleσ ∈ Sk ,

hvorSk er systemet af permutationer af tallene 1, 2, . . . , k.

Lemma 1.24 Rummet af lineære afbildningerX1 → Link−1(X2, . . . ,Xk;Y)) er somvektorrum isomorft med Link(X1, . . .Xk;Y). I formler:

Lin(

X1, Link−1(X2, . . . ,Xk;Y))

� Link(X1, . . . ,Xk;Y) .

Isomorfien er givet ved at en lineær afbildning M: X1 → Link−1(X2, . . . ,Xk;Y)sendes over i en k-lineær afbildning̃M ved konventionen

M̃(x1, . . . , xk) = L(x1)(x2, . . . , xk) .

Lineære afbildninger ind i rum afk − 1-lineære afbildninger optræder i visse sam-menhænge, ikke mindst i forbindelse med højere ordens afledede af flerdimensionalefunktioner. Det følger af lemma 1.24 at man kan tænke på sådanne afbildninger somom de erk-lineære.

Page 28: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

28 Kapitel 1. Lineære og multilineære afbildninger

1.5 Vektorrumsintegraler

Vi vil i dette afsnit diskutere hvad det vil sige at integrerefunktioner fra et målrum(X,E, µ) ind i et endeligdimensionalt normeret vektorrumY - eller ækvivalent der-med: hvad skal vi mene med ’middelværdien’ af en stokastisk variabelY med værdieri Y. For at gøre diskussionen så simpel som muligt, antager vi atY er udstyret medet indre produkt.

Definition 1.25 Hvis f : (X,E, µ) → Y er målelig og opfylder at∫

‖ f ‖dµ < ∞,så er f integrabel. Vi definerer i denne situation integralet

f dµ som det entydigtbestemt element iY der opfylder at

⟨∫

f (x) dµ(x), v

=

〈 f (x), v〉dµ(x) for alle v ∈ Y . (1.13)

Definition 1.25 hævder at derhøjst er et element iY der opfylder (1.13). Det er klart,for hvis der var flere, kunne man trække to af dem fra hinanden,og på den måde opnåetY-element, der stod ortogonalt på alleY-vektorer. Et sådant element må være nul,svarende til at de toY-elementer, der opfylder (1.13), er ens.

Omvendt hævder definition 1.25 at derer et element iY der opfylder (1.13). Mankan producere dette element helt eksplicit, ved at vælge en ortonormalbasise1, . . . , ek

for Y, og sætte∫

f (x) dµ(x) =k

i=1

〈 f (x), ei〉dµ(x) ei . (1.14)

Alle de reelle integranderx 7→ 〈 f (x), ei〉 er integrable på grund af Cauchy-Schwarz’ulighed, så højre side af (1.14) giver god mening. Og man ser at den opfylder (1.13):

⟨ k∑

i=1

〈 f (x), ei〉dµ(x) ei , v

=

∫ k∑

i=1

〈 f (x), ei〉 〈ei , v〉dµ(x) =∫

〈 f (x), v〉dµ(x) .

Formel (1.14) viser at hvisY = Rk (og er udstyret med det sædvanlige indre pro-dukt) så svarer definition 1.25 ganske nøje til den sædvanlige definition, hvor manintegrerer enRk-funktion ved at ’integrere koordinat for koordinat’.

Page 29: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.5. Vektorrumsintegraler 29

Det er relevant at vide at definitionen faktisk ikke afhængeraf det indre produkt - detindgår kun som en bekvem måde at skrive den definerende relation op på. Hvis〈〈·, ·〉〉er endnu et indre produkt, så findes der en lineær afbildningA : Y → Y så

〈〈y1, y2〉〉 = 〈y1,Ay2〉 for alle y1, y2 ∈ Y .

Heraf ser vi let at hvis (1.13) opfyldes med det ene indre produkt, opfyldes relationenogså med det andet.

Hvis Y er et rum af lineære afbildninger,Y = Lin(Z,W), så vil integralet∫

f (x) dµ(x) også være en lineær afbildning fraZ → W, og den vil dermed vir-ke påZ-vektorer. Hvad den mere præcist gør ved enZ-vektor er ikke klart ud fradefinitionen, så lad os undersøge det.

Sætning 1.26Lad f : (X,E, µ) → Lin(Z,W) være en målelig afbildning, der op-fylder at

‖ f ‖dµ < ∞. Da er∫

f dµ det element i Lin(Z,W) der opfylder at∫

f (x) dµ(x) · z=∫

f (x) · z dµ(x) for alle z∈ Z . (1.15)

B: Lad bådeV ogW være udstyret med et indre produkt, og vælg en ortonormlabasise1, . . . , ek for Z. Som i (1.8) indføerr vi et indre produkt på Lin(Z,W) ved

〈〈A, B〉〉 =k

i=1

〈Aei , Bei〉 for A, B ∈ Lin(Z,W) .

Vi definerer endvidere en lineær afbildningφ : Z×W → Lin(Z,W) ved

φ(z,w)(z′) = 〈z, z′〉w for alle z, z′ ∈ Z,w ∈ W

De lineære afbildningerφ(z,w) kaldes ofterang 1 operatorer. Pointen i disse kon-struktioner er at

〈〈A, φ(z,w)〉〉 = 〈A · z,w〉 for alle A ∈ Lin(Z,W), z ∈ Z,w ∈ W . (1.16)

Relation (1.16) fås frem ved en simpel udregning:

〈〈A, φ(z,w)〉〉 =n

i=1

〈Aei , φ(z,w)(ei)〉 =n

i=1

〈Aei , 〈z, ei〉w〉

= 〈

n∑

i=1

〈z, ei〉Aei ,w〉 = 〈An

i=1

〈z, ei〉ei ,w〉 .

Page 30: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

30 Kapitel 1. Lineære og multilineære afbildninger

Bruger man denne relation, ser man at∫

f (x) dµ(x) opfylder at

f (x) dµ(x) · z,w〉 = 〈〈∫

f (x) dµ(x), φ(z,w)〉〉 =∫

〈〈 f (x), φ(z,w)〉〉dµ(x)

=

〈 f (x) · z,w〉dµ(x) = 〈∫

f (x) · z dµ(x),w〉

hvor vi i andet og fjerde lighedstegn har brugt karakteriseringen (1.13) af vektor-rumsintegraler. Eftersom det holder for allew ∈ W, ser vi at (1.15) må være opfyldt.

På baggrund af definition 1.25 er det uproblematisk hvad man skal forstå ved ’mid-delværdien’ af en stokastisk variabelY med værdier i endeligdimensionalt normeretvektorrumY. Middelværdien eksisterer hvis den reelle stokastiske variabel ‖Y‖ har1. moment, og i bekræftende fald sættesE Y til at være det entydigt bestemteY-element, der opfylder at

〈E Y, v〉 = E 〈Y, v〉 for alle v ∈ Y . (1.17)

Sætning 1.27Lad Y være en stokastisk variabel med værdier iY og antag at Y har1. moment. Hvis L: Y → Z er en lineær afbildning, og hvis Z= L Y, så har Z også1. moment og

E Z = L E Y .

B: Idet ‖Z‖ ≤ ‖L‖ ‖Y‖ er det klart atZ har 1. moment. For ethvertz ∈ Z ser vi udfra (1.17) og definitionen af den adjungerede operator at

〈E Z, z〉 = E 〈Z, z〉 = E 〈Y, L∗ z〉 = 〈E Y, L∗z〉 = 〈L E Y, z〉

Da denne relation gælder for allez, ser vi atE Z = L E Y som ønsket.�

Det er noget mere indviklet at få hold på variansbegrebet. Vistarter med at erindrede såkaldtesimple tensorer fra eksempel 1.18: HvisY er et endeligdimensionalevektorrum med indre produkt, og hvisy, y′ ∈ Y er to vektorer, så kan vi danne enbilineær afbildningy⊗ y′ : Y ×Y → R ved

y⊗ y′ · (z, z′) = 〈y, z〉〈y′, z′〉 for z, z′ ∈ Y .

Page 31: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

1.5. Vektorrumsintegraler 31

Vi siger at en stokastisk variabelY med værdier iY har 2. moment hvisE ‖Y‖2 < ∞.I bekræftende fald defineres variansen som

V Y=∫

(Y − E Y) ⊗ (Y − E Y) dP (1.18)

Med denne definition er variansen afY altså et element i Bil(Y,Y;R). Bilinearfor-men forstås utvivlsomt bedst ud fra hvordan den virker på parafY-vektorer. Ifølgesætning 1.26 (eller rettere, den tilsvarende sætning om integral af bilineære afbild-ninger) er

V Y · (y1, y2) =∫

(Y − E Y) ⊗ (Y − E Y) · (y1, y2) dP

=

〈Y− E Y, y1〉〈Y − E Y, y2〉dP

=

(

〈Y, y1〉 − E〈Y, y1〉) (

〈Y, y2〉 − E〈Y, y2〉)

dP

= Cov(

〈Y, y1〉, 〈Y, y2〉)

HvisY = Rk ser vi let heraf at hvisV Yskal repræsenteres af en matrix, vil matricensforskellige pladser netop skulle fyldes op med kovarianserne mellemY’s forskelligekoordinater. Så i praksis svarer den nye abstrakte variansdefinition fuldstændigt tilden klassiske definition af variansmatricer.

Man skal dog være opmærksom på et ret ubehageligt fænomen: hvor definitionen afdet integral, der indgår i variansdefinitionen, ikke afhænger af hvordan man vælgerdet indre produkt, så er⊗-konstruktionen i sig selv afhængig af valget. Hvis manskifter indre produkt påY så ændrer man derfor hvilken bilinearform der udråbes tilat være ’varians’.

Sætning 1.28Lad Y være en stokastisk variabel med værdier iY og antag at Y har2. moment. Hvis L: Y → Z er en lineær afbildning, og hvis Z= L Y, så har Z også2. moment og

V Z · (z1, z2) = V Y · (L∗z1, L∗z2) for alle z1, z2 ∈ Z .

B: At Z har 2. moment følger af at‖Z‖ ≤ ‖L‖ ‖Y‖. Forz1, z2 ∈ Z ser vi at

V Z · (z1, z2) = Cov(

〈Z, z1〉, 〈Z, z2〉)

= Cov(

〈Y, L∗z1〉, 〈Y, L∗z2〉)

= V Y · (L∗z1, L∗z2)

som ønsket.�

Page 32: Lineære og multilineære afbildningerweb.math.ku.dk/~erhansen/ExpFam08/doku/noter/kap1.pdf4 Kapitel 1. Lineære og multilineære afbildninger er γ′(p) altså et element i tangentrummet

32 Kapitel 1. Lineære og multilineære afbildninger

Sætning 1.29Lad Y være en stokatisk variabel med værdier iY. Hvis Y har an-det moment, så er V Y symmetrisk og positivt semidefinit. Og V Yer positivt definit,medmindre der findes en hyperplan H⊂ V så P(Y ∈ H) = 1.

B: Vi ser at

V Y · (y, y′) = Cov(〈Y, y〉, 〈Y, y′〉) = Cov(〈Y, y′〉, 〈Y, y〉) = V Y · (y′, y)

eftersom konvariansen mellem to reelle stokastiske variable er symmetrisk. Den po-sitive semidefinithed følger tilsvarende, fordi

V Y · (y, y) = Cov(〈Y, y〉, 〈Y, y〉) = Var〈Y, y〉 ≥ 0 .

Hvis V Y ikke er positivt definit, så må der findes ety , 0, såV Y · (y, y) = 0. Vi seraltså at Var〈Y, y〉 = 0, hvilket betyder at〈Y, y〉 = c næsten sikkert for et passendec.Men

H = {y′ ∈ Y | 〈y′, y〉 = c} ,

er en hyperplan.�