Analytische Grundlagen der Geometrie · 2020-01-29 · 1 Skript zur Vorlesung \Analytische Grundlagen der Geometrie" 2 Michael Kerber 3 29. Januar 2020. 2. ... 38 5 Lineare Algebra,

$Page 1: Analytische Grundlagen der Geometrie · 2020-01-29 · 1 Skript zur Vorlesung \Analytische Grundlagen der Geometrie" 2 Michael Kerber 3 29. Januar 2020. 2. ... 38 5 Lineare Algebra,$
Skript zur Vorlesung “Analytische Grundlagen der Geometrie”1

Michael Kerber2

29. Januar 20203

2

Inhaltsverzeichnis4

1 Grundlagen 55

1.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

1.2 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

1.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

1.4 Der Rhythmus der Mathematik: Definition, Satz, Beweis . . . . . . . . . . . . . . . . . . . . 139

2 Analysis, Teil I 1910

2.1 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1911

2.2 Intervalle und beschrankte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2412

2.3 Folgen und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2613

2.4 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2914

2.5 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3215

2.6 Grenzwerte von Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3716

2.7 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4017

2.8 Eigenschaften stetiger Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4318

3 Lineare Algebra, Teil I 4919

3.1 Gruppen und Korper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4920

3.2 Vektorraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5221

3.3 Lineare Abhangigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5722

3.4 Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5923

3.5 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6224

3.6 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6625

3.7 Rechenverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7026

3.8 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7527

3.9 Skalarprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8128

3.10 Normen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8429

3.11 Orthogonale und orthonormale Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8530

3.12 Orthogonale Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9031

4 Analysis, Teil II 9332

4.1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9333

4.2 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9734

4.3 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9935

4.4 Eigenschaften differenzierbarer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10436

4.5 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10837

5 Lineare Algebra, Teil II 11338

5.1 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11339

5.2 Die lineare Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11940

5.3 Basistransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12041

5.4 Eigenvektoren und Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12742

3

4 INHALTSVERZEICHNIS

5.5 Orthogonale Abbildungen im R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13243

5.6 Hauptachsentransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13444

Kapitel 145

Grundlagen46

1.1 Aussagenlogik47

Mathematik ist eine exakte Wissenschaft. Das bedeutet, dass es in einem mathematischen Text (wie diesem48

hier) keinen Interpretationsspielraum geben soll, wie eine Aussage zu verstehen ist. Dies ist naturlich die49

Idealvorstellung und wird in der Realitat oft nicht erreicht. Ein Grund ist, dass Aussagen sonst zu langlich50

werden und der Autor einen gewissen Kontext beim Leser als verstanden voraussetzt (was nicht immer51

der Fall ist). Trotzdem wollen wir versuchen, Mehrdeutigkeiten soweit wie moglich zu vermeiden. Ein erster52

Schritt dafur ist die Einfuhrung einer klaren Sprache. Erfahrungsgemaß verursacht die formalisierte Sprache53

Anfangern oft Probleme, allerdings ist ein mathematische Diskussion ohne diese Voraussetzung unmoglich.54

Aussagen. Eine Aussage ist ein Satz, der entweder wahr oder falsch ist. Beispiele fur Aussagen sind55

“Graz liegt in der Steiermark.” oder “Linz ist die Hauptstadt von Osterreich.”. Dabei ist das erste Beispiel56

eine wahre Aussage und das zweite eine falsche Aussage. Andere Beispiele fur Aussagen sind “2+2=4” und57

“6 · 9 = 54” (beide wahr).58

Oft ist eine Aussage im Kontext zu verstehen. Zum Beispiel ist “Heute ist Samstag” eine Aussage, die59

wahr oder falsch ist, je nachdem wann Sie diesen Text lesen. Nicht jeder Aussagesatz ist auch eine Aussage60

in unserem Sinne. Zum Beispiel ist der Satz “Diese Aussage ist falsch.” keine Aussage, da sie weder wahr61

noch falsch ist. Wir werden uns aber nicht mit solchen logischen Spitzfindigkeiten auseinandersetzen.62

Beachten Sie, dass man einer Aussage nicht unbedingt ansieht, ob sie wahr oder falsch ist. Zum Beispiel63

ist “Die Wurzel aus 2 ist eine rationale Zahl.” eine falsche Aussage, aber offensichtlich ist das nicht.64

Zu jeder Aussage A konnen wir die Aussage65

“Es ist nicht so, dass A wahr ist.”66

bilden. Wir nennen diese Aussage auch die Negation von A, oder kurz ¬A. Diese Aussage ist wahr, wenn67

A falsch ist. Und sie ist falsch, wenn A wahr ist. Zum Beispiel ist die Negation von “2+2=4” dann “Es ist68

nicht so, dass 2 + 2 = 4 gilt”, oder kurzer “2 + 2 6= 4”.69

Wir konnen Aussagen auf verschiedene Weisen miteninander verknupfen. Betrachten wir zwei beliebige70

Aussagen A and B.71

1. Die Aussage “A und B” ist wahr, wenn sowohl A als auch B wahr sind. Sonst ist die Aussage falsch.72

Wir schreiben auch A ∧B fur diese Aussage (Konjunktion).73

2. Die Aussage “A oder B” ist wahr, wenn mindestens eine der beiden Aussagen A, B wahr ist. Sonst74

ist die Aussage falsch. Wir schreiben A ∨B dafur (Disjunktion).75

3. Die Aussage “Wenn A, dann B” ist falsch, wenn A wahr und B falsch ist. Sonst ist die Aussage wahr.76

Wir schreiben A⇒ B dafur (Implikation).77

5

6 KAPITEL 1. GRUNDLAGEN

4. Die Aussage “A genau dann wenn B” ist wahr wenn A und B entweder beide wahr sind oder A und78

B beide falsch sind. Sonst ist die Aussage falsch. Wir schreiben “A gdw B”, sowie A ⇔ B dafur79

(Aquivalenz).80

Hier sehen wir bereits kleine Unterschiede zur Alltagssprache. Zum Beispiel ist “oder” nicht im Sinne81

von “Entweder-oder” zu verstehen. Falls beide Aussage wahr sind, dann ist “A oder B” ebenfalls wahr.82

Die Implikation ist am Anfang gewohnungsbedurftig. Zum Beispiel ist die Aussage83

“Wenn 3 eine gerade Zahl ist, dann ist 1 + 1 = 3”84

eine wahre Aussage, denn der”Wenn“-Teil der Aussage ist falsch. Man sagt auch salopp: Aus etwas falschem85

folgt jede beliebige Aussage.86

Es folgen weitere Beispiele. Uberlegen Sie sich fur jeden Fall, warum die Aussage wahr oder falsch ist.87

• “2 ist ungerade und 6 ist gerade.” (falsch)88

• “3 ist ungerade oder 6 ist gerade.” (wahr)89

• “Wenn 4 gerade ist, dann ist 7 gerade.” (falsch)90

• “Wenn 6 ungerade ist, dann ist 4 gerade.” (wahr)91

• “6 ist ungerade gdw 1 + 1 = 3.” (wahr)92

• “6 ist gerade gdw 1 + 1 = 3.” (falsch)93

Quantoren. Betrachten wir nun den Satz94

“2 · x ist eine gerade Zahl.”95

Dies ist keine Aussage, da wir nicht wissen, was x ist, und damit konnen wir nicht entscheiden, ob der Satz96

wahr oder falsch ist (der Fall ware anders wenn wir aus dem Kontext wussten, dass z.B. x = 5 ist, aber das97

ist ja hier nicht der Fall). Dagegen ist98

“Fur alle naturlichen Zahlen x gilt: 3 · x ist eine gerade Zahl.”99

eine (falsche) Aussage. Aussagen dieser Form werden wir standig begegnen. Wir schreiben daher auch kurzer100

∀x ∈ N : 3 · x ist eine gerade Zahl.101

∀ nennt man auch den All-Quantor und er ist als”Fur alle. . .“ zu lesen.102

Ebenso kann man die (wahre) Aussage103

“Es gibt eine naturliche Zahl x, so dass gilt: 3 · x ist eine gerade Zahl.”104

bilden. Hier schreiben wir105

∃x ∈ N: 3 · x ist eine gerade Zahl.106

Das Symbol ∃ ist der Existenz-Quantor und er ist als”Es existiert ein. . .“ oder

”Es gibt ein. . .“ zu lesen.107

Hierbei ist zu beachten, dass”Es gibt ein. . .“ immer zu verstehen ist als

”Es gibt mindestens ein. . .“. Die108

Aussage ist also auch wahr wenn es zwei oder mehr x gibt, welche die Aussage erfullen.109

Der Begriff “Quantor” kommt von der Tatsache, dass eine Variable quantifiziert wird, um eine Aussage110

zu erhalten. Wir konnen (und werden haufig) auch Quantoren kombinieren. Zum Beispiel:111

“Es gibt eine ganze Zahl x, so dass fur jede ganze Zahl y gilt, dass x+ y = 0 ist.”112

Dies konnen wir schreiben als113

“∃x ∈ Z ∀y ∈ Z : x+ y = 0.”114

1.1. AUSSAGENLOGIK 7

Diese Aussage ist falsch. Allerdings wird sie wahr, wenn wir die Quantoren umdrehen:115

“∀y ∈ Z ∃x ∈ Z : x+ y = 0.”116

Die Reihenfolge der Quantoren ist also entscheidend!117

Es lasst nahezu jede mathematische Aussage (inklusive aller Aussagen, die wir in dieser LV sehen werden)118

als quantifizierte Aussage ausdrucken. Um die Sprache nicht zu formal zu machen, werden die Quantoren je-119

doch oft nur indirekt genannt. Um die Struktur einer Aussage zu verstehen, ist es aber manchmal notwendig,120

sie in Quantoren auszudrucken. Es lohnt sich, dies an einigen Beispielen zu uben.121

• Die Aussage122

“Wenn eine naturliche Zahl durch 6 teilbar ist, dann ist sie auch durch 3 teilbar.”123

konnen wir wie folgt umschreiben:124

“Fur alle naturlichen Zahlen n gilt: Wenn n durch 6 teilbar ist, dann ist n auch durch 3125

teilbar.”126

oder127

∀n ∈ N: (n durch 6 teilbar) ⇒ (n durch 3 teilbar).”128

• Die Aussage129

“Jede naturliche Zahl großer als 1 hat einen Primteiler.”130

kann man wie folgt schreiben. Schreibe P fur die Menge aller Primzahlen. Dann ist die Aussage von131

oben132

“Fur jede naturliche Zahl n gilt: Wenn n ≥ 2, dann gibt es eine Primzahl p, so dass n durch133

p teilbar ist.”134

oder in Kurzschreibweise135

“∀n ∈ N : (n ≥ 2)⇒ (∃p ∈ P : n ist teilbar durch p).”136

• Die Aussage137

“Die Wurzel aus 2 ist irrational.”138

konnen wir umschreiben als:139

“Es gibt kein q ∈ Q, so dass√

2 = q.”140

oder auch141

“Es ist nicht so, dass es ein q ∈ Q gibt, so dass√

2 = q.”142

oder auch143

¬(∃q ∈ Q : q =

√2)

144

145

Hausaufgabe 1.1.1. Betrachten Sie die Aussagen:146

A:”

Es gibt keine großte naturliche Zahl.“147

B:”0 ist die großte naturliche Zahl.“148

C:”

Die Gleichung x2 + x+ 1 = 0 hat genau eine Losung uber den reellen Zahlen.“149


Welche der Aussagen ist wahr? Schreiben Sie die Aussagen mit Hilfe von Quantoren.150

Hausaufgabe 1.1.2. Formulieren Sie die Negation der folgenden Aussagen in moglichst einfachen Worten:151

A:”

Fur jede rationale Zahl q gilt: q lasst sich als Kommazahl mit endlich vielen Ziffern schreiben.“152

B:”

Es gibt eine naturliche Zahl mit mindestens 10 Ziffern.“153

C:”

Alle ungeraden Zahlen sind Primzahlen.“154

1.2 Mengenlehre155

Wir kummern uns um grundlegende Eigenschaften von Mengen. Der Inhalt dieses Abschnitts sollte in großen156

Teilen aus der Schule bekannt sein.157

Eine Menge ist fur uns eine Sammlung von unterscheidbaren Objekten. Wir kennen zum Beispiel die158

Menge der naturlichen Zahlen, die wir als159

N = {0, 1, 2, . . .}

schreiben. Dies ist eine unendliche Menge. Ein anderes Beispiel ist W , die Menge aller Worter in der160

deutschen Sprache mit genau 4 Buchstaben. Diese Menge ist recht groß, aber endlich.161

Wir schreiben |A| fur die Anzahl der Elemente einer Menge A. Falls die Menge unendlich ist, setzen wir162

|A| =∞.163

Ist ein Objekt x in einer Menge A enthalten, schreiben wir x ∈ A. Ist es nicht enthalten, schreiben wir164

x /∈ A. Zum Beispiel ist 3 ∈ N, aber “Ast”/∈ W (W wie oben beschrieben). Zwei Mengen sind gleich, wenn165

sie die gleichen Elemente enthalten.166

Mengen konnen auf verschiedene Weisen festgelegt werden. Endliche Mengen kann man am einfachsten167

beschreiben, in dem man alle Elemente aufzahlt (die Reihenfolge ist dabei irrelevant). Zum Beispiel ist168

{1, 3, 5, 7, 9} = {1, 5, 9, 3, 7}

die Menge der einstelligen ungeraden Zahlen. Oft hilft die “Punktchen- Schreibweise” weiter: Zum Beispiel:169

{1, 10, 100, . . . , 1000000000}

Hierbei ist aber zu bemerken, dass es fur den Leser klar ersichtlich sein muss, wie die Punktchen zu inter-170

pretieren sind. Mit dieser Schreibweise kann man auch unendliche Mengen definieren.171

{1, 3, 5, 7, . . .}

ist die Menge aller ungeraden naturlichen Zahlen. Eine weitere, oft sehr bequeme Moglichkeit ist die folgende172

Schreibweise173

{x ∈ N | x2 < 100 ∧ x ist ungerade},die wie folgt zu lesen ist: “Die Menge aller x ∈ N, fur die gilt: x2 < 100 und x ist ungerade. Finden Sie eine174

alternative Beschreibung fur diese Menge? Statt des |-Symbols schreibt man auch einen Doppelpunkt – die175

Bedeutung ist gleich. Es ist auch ublich, ein Komma statt des ∧-Symbols zu setzen. Die gleiche Menge kann176

also auch so geschrieben werden:177

{x ∈ N : x2 < 100, x ist ungerade}.

Eine Menge A ist eine Teilmenge von B, A ⊆ B, wenn jedes Element von A auch ein Element von B ist178

(fur Quantorenfans: ∀x ∈ A : x ∈ B). Eine einfache, aber wichtige Eigenschaft ist, dass zwei Mengen A und179

B gleich sind, genau dann wenn A ⊆ B und B ⊆ A gilt. Beachten Sie auch, dass A immer eine Teilmenge180

von sich selbst ist. Wenn wir ausdrucken wollen, dass A eine Teilmenge von B ist, aber A 6= B ist, dann181

schreiben wir A ( B und nennen A eine echte Teilmenge von B.182

Die Notation “A ⊂ B” ist auch sehr verbreitet. Leider bedeutet sie in manchen Buchern A ⊆ B und in183

anderen Buchern A ( B. Der Klarheit halber verzichten wir auf diese Notation.184

Es folgen weitere Standardbegriffe. Der Einfachheit halber nehmen wir an, dass alle betrachteten Mengen185

Teilmengen eines “Universums” U sind.186

1.2. MENGENLEHRE 9

Vereinigung Sind A und B Mengen, so ist deren Vereinigung definiert als187

A ∪B := {x ∈ U | x ∈ A ∨ x ∈ B}.

Wir haben hier die Schreibweise “:=” verwendet, die wir sehr haufig gebrauchen werden. Dies druckt188

aus, dass wir den Begriff “A ∪B” an dieser Stelle einfuhren (bzw definieren).189

Schnitt Der (Durch)Schnitt von zwei Mengen A und B ist definiert als190

A ∩B := {x ∈ U | x ∈ A ∧ x ∈ B}.

Differenzmenge Die Differenzmenge von A und B ist definiert als191

A \B := {x ∈ A | x /∈ B}.

Beachten Sie, dass A \B nicht immer gleich zu B \A ist. Andererseits gilt immer, dass A \B ⊆ A.192

Leere Menge Die leere Menge ist die Menge ohne Elemente. Wir schreiben sie als ∅ oder {}. Es gilt also:193

∀x ∈ U : x /∈ ∅. Wir nennen zwei Mengen A, B disjunkt, wenn A ∩B = ∅.194

Komplementarmenge Das Komplement einer Menge A ist195

AC := {x ∈ U | x /∈ A}.

Produkte Ein Paar von Objekten x und y schreiben wir als (x, y). Bei einem Paar spielt die Reihenfolge196

eine Rolle; zum Beispiel ist (1, 2) 6= (2, 1). Sind A, B Mengen, dann schreiben wir197

A×B := {(a, b) | a ∈ A, b ∈ B}

als die Menge aller Paare uber A und B. Wir konnen auf ahnliche Weise die Triple A × B × C und198

allgemein k-Tupel uber k Mengen definieren.199

Interessanterweise konnen die Elemente einer Mengen selbst wieder Mengen sein. Als Beispiel betrachten200

wir201

X = {M ⊆ {1, 2, 3} |M enthalt genau zwei Elemente}}= {{1, 2}, {1, 3}, {2, 3}}.

Eine andere interessante Menge ist X = {∅}, also die Menge, die die leere Menge enthalt. Ist X selbst202

die leere Menge? Die Antwort ist nein, denn ∅ ∈ X, also ist X nicht leer.203

Wir erweitern noch den Begriff von Vereinigung und Schnitt. Sei M eine Menge von Mengen, die alle204

Teilmengen eines Universums U bilden. Dann setzen wir205 ⋃M∈M

M := {x ∈ U | ∃M ∈M : x ∈M}.

Das bedeutet, dass x in der Vereinigung liegt, wenn es in mindestens einer Menge aus M enthalten ist.206

Wenn wir M = {A,B} setzen, ergibt dies genau A ∪B von oben. Der Schnitt ist ahnlich definiert207 ⋂M∈M

M := {x ∈ U | ∀M ∈M : x ∈M}.

Also ist x im Schnitt, wenn es in allen Mengen aus M enthalten ist.208

Schauen wir uns ein geometrisches Beispiel an: Setze M als die Menge aller Kreisscheiben um den209

Ursprung mit einem Radius r mit 0 ≤ r ≤ 1. Jede Kreisscheibe ist eine Teilmenge von R2. Die Vereiningung210 ⋃M∈MM ist dann die Einheitskreisscheibe. Der Schnitt

⋂M∈MM besteht nur aus dem Punkt (0, 0). Es211

ist lohnenswert, grundlich nachzudenken, warum dies der Fall ist.212


Relationen. Ein zentrales Konzept in der gesamten Mathematik sind Relationen. Diese drucken aus, wie213

Elemente von Mengen miteinander in Beziehung stehen.214

Fur zwei Mengen M und N ist eine Relation R definiert als eine Teilmenge von M×N . Wenn (x, y) ∈ R,215

sagen wir auch, dass x und y in Relation R zueinander stehen. Wir schreiben auch manchmal “xR y” anstatt216

“(x, y) ∈ R” und “x 6R y” fur “(x, y) /∈ R” in diesem Fall. Falls M = N , nennen wir R eine Relation uber217

M .218

Ein bekanntes Beispiel einer Relation uber N ist ≤. In der Tat konnen wir ≤ als Menge uber N × N219

auffassen, in der alle Paare (a, b) enthalten sind, fur die a kleiner oder gleich b ist. Zum Beispiel ist dann220

(3, 7) ∈≤, aber (4, 1) /∈≤. Nehmen wir die Notation “xR y” von oben, dann ergibt sich Schreibweise 3 ≤ 7,221

4 � 1, die wir gewohnt sind.222

Relationen sind allgegenwartig. Ein nicht-mathematisches Beispiel ergibt sich, wenn wir S als die Menge223

aller SchauspielerInnen und F als die Menge aller Filme definieren und die Relation224

R = {(s, f) | SchauspielerIn s spielt in Film f mit}

einfuhren.225

Sei nun ∼ eine Relation uber einer Menge M . Wir nennen ∼226

• reflexiv, falls gilt: x ∼ x fur alle x ∈M .227

• symmetrisch, falls gilt: Wenn x ∼ y, dann auch y ∼ x (fur alle x, y in M).228

• transistiv, falls gilt: Wenn x ∼ y und y ∼ z, dann auch x ∼ z.229

Zum Beispiel ist die Relation ≤ von oben reflexiv (denn x ≤ x fur jede beliebige Zahl x) und transitiv230

(denn falls a ≤ b und b ≤ c ist auch a ≤ c), aber nicht symmetrisch, da 1 ≤ 2 und 2 � 1 gilt. Beachten Sie,231

dass dieses eine Gegenbeispiel als Argument ausreicht, denn die Symmetriebedingung fordert ja, dass aus232

x ≤ y auch y ≤ x folgt fur alle x, y ∈ N, und wir haben ein Gegenbeispiel gefunden, also ist die Aussage “≤233

ist symmetrisch” falsch.234

Wir nennen eine Relation ∼ auf M eine Aquivalenzrelation, wenn ∼ reflexiv, symmetrisch und transitiv235

ist. Aquivalenzrelationen haben besonders schone Eigenschaften. Eine davon ist, dass ∼ die Menge M in236

sogenannte Aquivalenzklassen237

Rx := {y ∈M | x ∼ y}

aufteilt. Wir demonstrieren das an einem Beispiel.238

Definiere die Relation ∼2 auf den naturlichen Zahlen als239

∼2:= {(a, b) | a und b lassen bei ganzzahliger Division durch 2 den gleichen Rest}

“Ganzzahlige Division” ist hier die Division mit Rest, die man (hoffentlich) aus der Schule kennt. Zum240

Beispiel ist 17 : 7 = 2 Rest 3 oder 15 : 5 = 3 Rest 0.241

Die Relation ∼2 ist nun in der Tat reflexiv, symmetrisch und transitiv, wie man sich sofort uberlegt, also242

eine Aquivalenzrelation. Schauen wir uns die Aquivalenzklassen an. R1 besteht aus allen naturlichen Zahlen,243

die den gleichen Rest bei Division durch 2 lassen wie 1. Da 1 : 2 = 0 Rest 1, ist dieser Rest gleich 1. Es ist244

nicht schwer zu sehen, dass die ungeraden Zahlen Rest 1 lassen, und die geraden Zahlen Rest 0 lassen. Damit245

ist R1 = {1, 3, 5, 7, 9, . . .}. Ebenso ist R0 = {0, 2, 4, 6, 8, . . .}. Wir sehen auch, dass R1 = R3 = R5 = . . . und246

R0 = R2 = R4 = . . .. Ausserdem sind R0 und R1 disjunkte Mengen.247

Die Beoachtungen, die wir fur die Aquivalenzklassen von ∼2 gemacht haben, gelten fur jede Aquivalenz-248

relation. Wir formulieren dies als mathematisches Theorem (= als Aussage).249

Theorem 1.1. Sei ∼ eine Aquivalenzrelation uber einer Menge M . Fur alle x, y in M gilt dann:250

• Ist x ∼ y, dann ist Rx = Ry.251

• Ist x 6∼ y, dann ist Rx ∩Ry = ∅.252

1.3. ABBILDUNGEN 11

Um es etwas unsauberer zu formulieren: Es kann nicht passieren, dass sich zwei Aquivalenzklassen253

teilweise uberlappen – entweder sind sie “komplett gleich” oder “komplett verschieden”. Es geht uns nun254

erstmal aber weniger um den Gehalt der Aussage selbst als um die Gestalt der Aussage. Dafur lohnt es sich,255

die Aussage mit Quantoren umzuformulieren:256

Fur jede Menge M , fur jede Aquivalenzrelation uber M und fur alle x, y ∈ M gilt: (x ∼ y ⇒257

Rx = Ry) ∧ (x 6∼ y ⇒ Rx ∩Ry = ∅).258

Diese Umformung macht den Satz nicht lesbarer, aber es wird deutlich, dass dieses Theorem sehr allgemein259

ist: es wird eine Aussage uber alle Aquivalenzrelationen getroffen (also auch solche, die wir noch nicht kennen,260

und auch solche, uber die noch nie jemand nachgedacht hat). Dies bringt einen großen Vorteil mit sich: Wenn261

wir zu einem spateren Zeitpunkt eine konkrete Relation R betrachten und konnen nachweisen, dass R eine262

Aquialenzrelation ist, dann wissen wir dank des Theorems schon einiges uber seine Aquivalenzklassen (ohne263

dass wir diese Aquivalenzklassen studieren mussen).264

Naturlich gilt das gerade Gesagte nur dann, wenn die Aussage wahr ist. Das ist in diesem Fall nicht265

offensichtlich, und erfordert einen Nachweis. Wir verschieben die Diskussion daruber in Abschnitt 1.4, wo266

wir Beweistechniken studieren werden.267

268

Hausaufgabe 1.2.1. Sei V die Menge der Facebook-User und ∼ definiert uber V als269

a ∼ b genau dann, wenn a und b Facebook-Freunde sind.

Ist ∼ reflexiv, symmetrisch, transitiv?270

Hausaufgabe 1.2.2. Betrachten Sie die Relation271

∼7:= {(a, b) | a und b lassen bei ganzzahliger Division durch 7 den gleichen Rest}

Ist ∼7 eine Aquivalenzrelation? Wie ist es mit ∼4, ∼10, ∼143, die auf gleiche Weise definiert sind? Formulie-272

ren Sie ein Theorem, das Ihre Beobachtung verallgemeinert (Sie brauchen das Theorem nicht zu beweisen).273

Geben Sie auch die Aquivalenzklassen bezuglich ∼7 an.274

Hausaufgabe 1.2.3. Sei Z0 die Menge {. . . ,−3,−2,−1, 1, 2, 3, . . .}, also die ganzen Zahlen ohne 0. Wir275

betrachten eine Relation auf Z× Z0:276

R := {((a, b), (c, d)) | ∃λ ∈ Z : (a = λc ∧ b = λd) ∨ (c = λa ∧ d = λb}

Ist R eine Aquivalenzrelation?277

1.3 Abbildungen278

Abbildungen (auch Funktionen genannt) sind bereits in der Schule ein zentrales Konzept des Mathematik-279

unterrichts, und sind auch fur uns von großer Bedeutung. Ein wesentlicher Aspekt von Abbildungen wird280

in der Schule jedoch meist vernachlassigt: man kann Abbildungen hintereinanderausfuhren und erhalt eine281

neue Abbildung. Wir werden diesen Begriff und weitere Grundlagen im Folgenden einfuhren.282

Fixiere zwei Mengen X, Y . Eine Abbildung f ist eine Relation zwischen X und Y , in der jedes x ∈ X283

mit genau einem y ∈ Y in Relation steht. Wir nennen diese y das Bild von x und schreiben y = f(x). In284

dem Fall heisst x ein Urbild von y (“ein” Urbild, nicht “das” Urbild, denn y kann mehrere Urbilder haben).285

Wir schreiben auch286

f : X → Y, x 7→ f(x)

fur eine Abbildung von X nach Y . Wir nennen X die Definitionsmenge und Y die Zielmenge der Abbildung.287

Formal ist eine Abbildung also einfach eine Menge von Paaren. Zum Beispiel kann288

f : {0, 1, 2, 3} ⇒ {5, 7, 9, 11}, x 7→ 2x+ 5

auch geschrieben werden als f = {(0, 5), (1, 7), (2, 9), (3, 11)}. Diese Schreibweise ist aber eher unublich.289

Wir nennen eine Abbildung f : X → Y290


• surjektiv, falls jedes y ∈ Y als Bild (mindestens) eines x ∈ X auftritt (∀y ∈ Y : ∃x ∈ X : f(x) = y).291

• injektiv, falls verschiedene x1, x2 aus X verschiedene Bilder haben in Y haben (∀x1, x2 ∈ X : x1 6=292

x2 ⇒ f(x1) 6= f(x2)).293

• bijektiv oder umkehrbar, falls f surjektiv und injektiv ist.294

Anders ausgedruckt: Surjektivitat bedeutet, dass jedes y ∈ Y mindestens ein Urbild hat. Injektivitat295

bedeutet, dass jedes y ∈ Y hochstens ein Urbild hat. Bijektivitat bedeutet dann folglich, dass jedes y ∈ Y296

genau ein Urbild hat, und wir konnen die Umkehrabbildung f−1 : Y → X definieren mit y 7→ x fur y = f(x).297

Schauen wir uns ein paar Beispiele an.298

1. Die Abbildung299

f : N→ N, x 7→ 2x

ist nicht surjektiv, denn es gibt kein x, welches auf 3 abbildet. Sie ist jedoch injektiv, denn ist x1 6= x2,300

dann ist auch 2x1 6= 2x2. Die Abbildung ist nicht bijektiv, da sie nicht surjektiv ist. Wenn wir die301

Zielmenge einschranken:302

f : N→ {0, 2, 4, 6, . . .}, x 7→ 2x

dann wird die Abbildung surjektiv und daher umkehrbar.303

2. Betrachten wir die Abbildung304

g : N→ N, x 7→⌈x+ 2

2

⌉.

d·e nennt man die obere Gaussklammer. Es bedeutet, dass die Zahl innerhalb der Gaussklammer zur305

nachstliegenden nicht kleineren ganzen Zahl aufgerundet wird. Zum Beispiel ist d3.1e = 4, d−7.2e = −7306

und d8e = 8. Es gibt auch die untere Gaussklammer b·c mit entsprechender Bedeutung.307

Nun also zur Abbildung g. Sie ist nicht surjektiv, denn 0 hat kein Urbild. Beachten Sie, dass jedes308

andere Element ein Urbild besitzt, y0 ≥ 1 wahlen wir einfach x0 = 2y0 − 2 und rechnen nach:309

g(x0) =

⌈x0 + 2

2

⌉=

⌈2y0 − 2 + 2

2

⌉= dy0e = y0

also ist x0 ein Urbild von y0. Allerdings andert das nichts an der Tatsache, dass die Funktion nicht310

surjektiv ist, denn ein Gegenbeispiel reicht aus. Die Abbildung ist jedoch nicht injektiv, denn zum311

Beispiel ist g(1) = 2 = g(2), wie man leicht nachrechnet, also hat 2 zwei Urbilder. Damit ist f auch312

nicht umkehrbar.313

Haben wir zwei Abbildungen f : A → B und g : B → C, dann konnen wir eine Abbildung von A nach314

C definieren, indem wir auf ein Element aus A erst f anwenden, und dann auf das Ergebnis g anwenden.315

Mit anderen Worten316

g ◦ f : A→ C : x 7→ g(f(x))

ist die Komposition von f und g. Man beachte hier, dass trotz der Notation g◦f zuerst f , dann g ausgefuhrt317

wird. Auch ist es notwendig, dass die Zielmenge von f eine Teilmenge der Definitionsmenge von g ist, sonst318

ergibt die Vorschrift keinen Sinn.319

Als Beispiel komponieren wir die beiden Abbildungen f und g aus dem letzten Beispiel. Dies ist moglich,320

da Definitions- und Zielmenge beider Abbildungen N ist. Es ergibt sich dann321

g ◦ f(x) = g(f(x)) = g(2x) =

⌈2x+ 2

2

⌉= dx+ 1e = x+ 1.

Man konnte in diesem Fall auch die Abbildung f ◦ g bilden und erhalt f ◦ g(x) = 2dx+22 e. Man erkennt also322

schon, dass g ◦ f im Allgemeinen nicht gleich f ◦ g ist.323

324

1.4. DER RHYTHMUS DER MATHEMATIK: DEFINITION, SATZ, BEWEIS 13

Hausaufgabe 1.3.1. Sie haben Abbildungen f : A → B, g : B → C and h : C → D gegeben. Definieren325

Sie sich daraus eine Abbildung h ◦ g ◦ f .326

Hausaufgabe 1.3.2. Untersuchen Sie die folgenden Abbildungen aus Surjektivitat, Injektivitat und Bijek-327

tivitat.328

a. f : N→ N, x 7→ x3 + 3x2 + 3x+ 1.329

b. f : N→ N, x 7→ x falls x 6= 2 und 2 7→ 100.330

c. f : M → {0}, x 7→ 0; dabei sei M 6= ∅ beliebig.331

Im letzten Beispiel ist eine Fallunterscheidung notwendig.332

Hausaufgabe 1.3.3. Sagen wir, im Jahr 2018 wurden 350.000 Postkarten nach Graz geschickt (die Zahl333

stimmt sicher nicht). Argumentieren Sie, dass es eine Person in Graz gibt, die mindestens zwei Postkarten334

erhalten hat.335

Hausaufgabe 1.3.4. Fur eine beliebige (nicht-leere) Menge X bezeichnet id : X → X,x 7→ x die Iden-336

titatsabbildung. Betrachten wir nun die Abbildung337

f : R→ R, x 7→ ax+ b

mit a 6= 0.338

a. Was stellt die Funktion f geometrisch dar?339

b. Finden Sie eine Funktion g : R→ R, so dass g ◦ f = id. Was erhalten Sie, wenn Sie f ◦ g berechnen?340

c. Intepretieren Sie g ebenfalls geometrisch.341

1.4 Der Rhythmus der Mathematik: Definition, Satz, Beweis342

Dieser Abschnitt ist eher philosophischer Natur und mochte erklaren, worum es in der Mathematik (nach343

Ansicht des Dozenten) eigentlich geht. Eigentlich sollte dies Thema des Schulunterrichts sein, aber wird dort344

wohl nicht immer genau besprochen.345

Was ist Mathematik? Auf der Wikipediaseite steht folgendes346

Die Mathematik [...] ist eine Wissenschaft, welche aus der Untersuchung von geometrischen Figu-347

ren und dem Rechnen mit Zahlen entstand. Fur Mathematik gibt es keine allgemein anerkannte348

Definition; heute wird sie ublicherweise als eine Wissenschaft beschrieben, die durch logische De-349

finitionen selbstgeschaffene abstrakte Strukturen mittels der Logik auf ihre Eigenschaften und350

Muster untersucht.351

Dies ist in der Tat eine akkurate Beschreibung. Es geht um die Eigenschaften von “selbstgeschaffenen”352

Strukturen (anders als z.B. in der Physik oder Biologie, wo die Strukturen aus der Natur stammen). Eine353

primare Motivation dieser selbstgeschaffenen Strukturen liegt darin, dass sie real-existierende Gegebenheiten354

modellieren. Ein Beispiel ist der Begriff der Relation von oben, welcher unter anderem soziale Netzwerke355

modelliert. Ein Ziel in der Mathematik ist es, die Strukturen moglichst allgemein zu halten. Der Vorteil ist,356

dass sich dann Eigenschaften dieser Strukturen auf viele Anwendungsbereiche erstrecken konnen – siehe die357

Diskussion oben nach Theorem 1.1, welches eine Eigenschaft der Struktur “Aquivalenzrelation” formuliert.358

Der Nachteil dieser Allgemeinheit ist, dass die Beschaftigung mit diesen Strukturen ein recht abstraktes359

Unterfangen ist – eine Aussage der Form “Jede Aquivalenzrelation/Jede Abbildung/. . .” ist schwieriger zu360

begreifen als eine Aussage uber eine fixierte Abbildung. Das ist eine der Hauptschwierigkeiten, die sich beim361

Ubergang von Schulmathematik auf Universitatsmathematik stellt.362

Wie gehen wir nun konkret vor? Im Wesentlichen in drei Schritten:363

1. Wir “erschaffen” unsere Struktur (Definition)364


2. Wir formulieren Eigenschaften uber diese Struktur (Satz/Theorem)365

3. Wir weisen nach, dass die postulierte Eigenschaft wirklich gilt (Beweis)366

Die vorangehenden Abschnitte erhalten bereits zahlreiche Definitionen. Zum Beispiel wurden die Begriffe367

“Funktion”, “Relation” oder “Aquivalenzrelation” eingefuhrt. In diesem Skript werden wir einen Begriff,368

wenn er definiert wird, kursiv schreiben. Wie oben bereits erwahnt, nutzen wir auch die Schreibweise “:=”,369

wenn wir einen Begriff per Formel einfuhren wollen. Besonders wichtige Definitionen werden wir auch in370

einer speziellen Umgebung angeben, zum Beispiel so:371

Definition 1.2. Eine Zahl p ∈ N heißt Primzahl, wenn p ≥ 2 und p durch keine naturliche Zahl ausser 1372

und p teilbar ist.373

Auch fur den zweiten Schritt gibt es in den vorherigen Kapiteln zahlreiche Beispiele. Ein Beispiel ware die374

Aussage, dass jede Primzahl ausser 2 ungerade ist. Zentrale Aussagen werden wir wiederum als abgesetzte375

Blocke schreiben, um sie besonders zu betonen.376

Theorem 1.3. Es gibt unendlich viele Primzahlen.377

Beweise. Wir kommen nun zum dritten Teil, dem Beweis. Grundsatzlich muss jede Aussage eines mathe-378

matischen Texts begrundet werden (eine Definition braucht naturlich keine Begrundung, denn man fuhrt ja379

nur einen neuen Begriff ein). Die Begrundung kann auf verschiedene Arten erfolgen. Zum einen kann man380

die Begrundung mit der Aussage mitliefern. Zum Beispiel: Jede Primzahl ausser 2 ist ungerade, denn eine381

gerade Zahl grosser als 2 ist immer auch durch 2 teilbar, was der Definition von Primzahl widerspricht. Es382

ist auch sehr ublich, einfach keine Begrundung anzugeben und diese dem Leser zu uberlassen. Das sollte383

jedoch nur bei einfachen Aussagen geschehen.384

Ist die Begrundung aufwendiger, schreibt man die Aussage ublicherweise als Theorem und liefert nach385

dem Theorem den Beweis nach.386

Theorem 1.4. Das Produkt von zwei ungeraden naturlichen Zahlen ist ungerade.387

Beweis. Seien a und b ungerade Zahlen. Das bedeutet, wir konnen a schreiben als a = 2k + 1 mit k eine388

andere naturliche Zahl. Ebenso ist b = 2`+ 1 mit ` ∈ N. Nun rechnen wir nach389

a · b = (2k + 1)(2`+ 1) = 4k`+ 2k + 2`+ 1 = 2(2k`+ k + `) + 1.

Das bedeutet, dass sich a ·b schreiben lasst als 2m+1 mit m eine naturliche Zahl. Also ist a ·b ungerade.390

Dies ist ein Beispiel fur einen direkten Beweis: Wir starten mit der Voraussetzung (in diesem Fall: a und391

b sind ungerade) und wir leiten daraus Schritt fur Schritt Konsequenzen ab, bis die gewunschte Aussage392

nachgewiesen ist. Naturlich muss jeder Schritt im Beweis selbst wieder fur den Leser nachvollziehbar sein.393

Eine wichtige Bemerkung: In der Schule besteht der Mathematikunterricht haufig aus Rechnungen, die394

oftmals auch noch in einer bestimmten Form verlangt werden. Das hat den Vorteil, dass es fur Aufgaben395

im Wesentlichen nur eine richtige Losung gibt. Dies ist in der “wahren” Mathematik anders. Es gibt nicht396

nur einen Beweis fur eine Aussage. Fur viele Aussagen kann man einen Beweis auf sehr verschiedene Weisen397

fuhren. Wichtig ist nur, dass jeder Schritt korrekt und nachvollziehbar ist. Dann nennen wir einen Beweis398

korrekt.399

Schauen wir uns weitere Beweistechniken an. Als nachstes kommt ein Beweis durch Widerspruch. Dabei400

nehmen wir an, die zu beweisende Aussage ist falsch. Aus dieser Annahme folgern wir dann eine Aussage,401

die nachweislich falsch ist. Das bedeutet, die Negation der Aussage fuhrt zu einem Widerspruch, und damit402

muss die Aussage selbst wahr sein.403

Definition 1.5. Sei n ∈ N mit n ≥ 2. Ein Primteiler von n ist eine Primzahl, die n teilt.404

Theorem 1.6. Jede naturliche Zahl n ≥ 2 hat einen Primteiler.405


Beweis. Nehmen wir an, die Aussage ist falsch. Das bedeutet, es gibt mindestens eine Zahl, die keinen406

Primteiler hat. Aus allen naturlichen Zahlen mit dieser Eigenschaft wahlen wir uns die kleinste aus und407

nennen sie n. Das bedeutet, n hat keinen Primteiler, aber jede naturliche Zahl kleiner als n (und grosser als408

1) hat einen Primteiler. Nun ist n selbst keine Primzahl, denn sonst hat n einen Primteiler, namlich sich409

selbst. Das bedeutet, es gibt eine naturliche Zahl m mit 1 < m < n, die n teilt. Nun hat m einen Primteiler410

p, denn wir haben n ja so gewahlt, dass jede Zahl kleiner n einen Primteiler hat. Also ist p ein Teiler von m,411

und damit auch ein Primteiler von n. Dies ist aber ein Widerspruch zur Annahme, dass n keinen Primteiler412

hat.413

Als weiteres Beispiel fur einen Widerspruchsbeweis beweisen wir das Theorem von oben.414

Beweis. (von Theorem 1.3) Nehmen wir an, dass es nur endlich viele Primzahlen gibt. Dann konnen wir415

die Primzahlen der Grosse nach schreiben als p1 < p2 < . . . < pn, wobei n die Anzahl der Primzahlen ist.416

Nun betrachten wir die Zahl417

q := p1 · p2 · . . . · pn + 1

Wir sehen, dass fur jedes pi mit i = 1, . . . , n die Division von q durch pi Rest 1 lasst. Damit ist kein pi ein418

Teiler von q. Da nach Annahme p1, . . . , pn samtliche Primzahlen sind, hat also q keinen Primteiler. Das ist419

aber ein Widerspruch zur Aussage in Theorem 1.6.420

Wir sehen hier ein wichtiges Prinzip. Bereits bewiesene Aussagen konnen in nachfolgenden Beweisen421

verwendet werden. Dieser modulare Aufbau dient dazu, dem Text Struktur zu geben und damit leserlicher422

zu machen. Auch hier gibt es keine fest definierten Regeln. Wir werden haufig Lemmas verwenden, um die423

Struktur noch klarer zu machen. Ein Lemma ist ein Hilfssatz und im Prinzip das gleiche wie ein Theorem (es424

muss also bewiesen werden). Die Unterscheidung Lemma/Theorem dient lediglich dazu, zu unterstreichen,425

welche Aussage von besonderer Wichtigkeit ist (Theorem) und welche nur ein technisches Hilfsmittel ist426

(Lemma), um ein Theorem zu beweisen.427

Vollstandige Induktion. Wir besprechen eine weitere wichtige Beweistechnik, die speziell fur Aussagen428

der Form429

∀n ∈ N : A(n)

anwendbar ist. Hier steht A(n) fur eine Aussage mit Variable n. Ein konkretes Beispiel fur A(n) ist430

A(n) : 1 + 2 + . . .+ n =n(n+ 1)

2.

Man kann eine solche Aussage in zwei Schritten beweisen:431

– Man zeigt zuerst, dass die Aussage A(0) gilt. Das nennt man den Induktionsanfang.432

– Man zeigt dann: wenn fur ein beliebiges n die Aussage A(n) gilt, dann gilt auch A(n+ 1). Man nennt433

A(n) die Induktionsannahme und den Schluss A(n)⇒ A(n+ 1) den Induktionsschritt.434

Warum reichen diese beiden Schritte? Der Induktionsanfang stellt sicher, dass A(0) gilt. Der Induktions-435

schritt fur n = 0 besagt, dass A(0) ⇒ A(1) gilt. Beide Aussagen zusammen implizieren, dass die Aussage436

A(1) ebenfalls wahr ist. Der Induktionsschritt fur n = 1 besagt, dass A(1) ⇒ A(2) gilt, also wissen wir437

auch, dass A(2) wahr ist. Dies konnen wir nun beliebig lange weitertreiben, und erhalten fur jedes fixierte438

n, dass A(n) ebenfalls wahr ist. Man kann sich dieses Beweisprinzip als einen Dominoeffekt vorstellen. Der439

Induktionsanfang stellt sicher, dass der erste (oder eher nullte) Stein fallt. Der Induktionsschritt stellt sicher,440

dass ein Stein fallt, wenn sein Vorganger fallt. Somit mussen alle Steine fallen.441

Schauen wir uns ein Beispiel an.442

Theorem 1.7.

∀n ∈ N : 20 + 21 + 22 + . . .+ 2n = 2n+1 − 1


Beweis. Wir beweisen dies mit vollstandiger Induktion. Fur den Induktionsanfang mussen wir nachweisen,443

dass die Aussage fur n = 0 gilt. Dies geschieht einfach durch Nachrechnen: Auf der linken Seite steht444

nur 20 = 1 (denn die Summe hort fur n = 0 nach einem Summanden auf). Auf der rechten Seite steht445

20+1 − 1 = 2− 1 = 1, also sind linke und rechte Seite in der Tat gleich.446

Fur den Induktionsschritt nehmen wir an, dass wir die Aussage fur ein n bereits bewiesen haben. Es gilt447

also448

20 + 21 + 22 + . . .+ 2n = 2n+1 − 1.

Schreiben wir die Aussage fur n+ 1 auf, ergibt sich,449

20 + 21 + 22 + . . .+ 2n + 2n+1 = 2n+2 − 1.

Dies mussen wir also beweisen. Dafur rechnen wir nach

20 + 21 + 22 + . . .+ 2n + 2n+1 = (20 + 21 + 22 + . . .+ 2n) + 2n+1

= 2n+1 − 1 + 2n+1

= 2 · 2n+1 − 1

= 2n+2 − 1,

wobei wir im zweiten Schritt der Rechnung die Induktionsannahme verwendet haben. Damit ist die Aussage450

bewiesen.451

Wenn die Aussage nicht uber alle naturlichen Zahlen ist, sondern nur fur alle naturlichen Zahlen ≥ k,452

dann lasst sich das Prinzip ebenso anwenden. Man muss den Induktionsanfang nur fur k durchfuhren.453

Theorem 1.8. Die Summe der ersten n geraden Zahlen (beginnend bei 2) addiert sich auf zu n(n + 1).454

Oder anders gesagt:455

∀n ≥ 1 : 2 + 4 + 6 + . . . 2n = n(n+ 1)

Beweis. Fur den Induktionsanfang zeigen rechnen wir fur n = 1 nach: links steht 2, rechts steht 1(1+1) = 2,also stimmt die Aussage fur n = 1. Nun nehmen wir an, dass die Aussage gilt fur ein n und rechnen furn+ 1 nach:

2 + 4 + 6 + . . .+ 2n+ 2(n+ 1) = (2 + 4 + 6 + . . .+ 2n) + 2(n+ 1)

= n(n+ 1) + 2(n+ 1)

= (n+ 1)(n+ 2).

Hier haben wir wiederum die Induktionsvoraussetzung im zweiten Schritt angenommen und im dritten456

Schritt den Faktor (n + 1) ausgeklammert. Wir haben also den Induktionschritt bewiesen, woraus die457

Aussage folgt.458

Wir fuhren fur Summen noch die folgende Notation ein: Statt 2 + 4 + 6 + . . .+ 2n schreiben wir459

n∑i=1

2i.

Hier ist i eine Laufvariable, die alle Werte von 1 bis n annimmt.460

Wir werden noch weitere Beweistechniken besprechen. Wann immer wir eine neue Methode zum ersten461

Mal anwenden, werden wir das im Skript kenntlich machen.462


Weiteres Vorgehen. Wir haben nun die mathematischen Werkezeuge zur Hand, um die eigentlichen The-463

men der Vorlesung zu besprechen. Grundsatzlich sollte eine Anfangervorlesung fur Mathematik moglichst464

rigoros sein, das heißt, alle Begriffe sollten klar definiert sein und alle nicht-offensichtlichen Aussagen sollten465

bewiesen werden. Aus Zeitgrunden werden wir diesem Anspruch nicht genugen konnen, sondern werden466

immer wieder Beweise auslassen mussen. Allerdings ist die Beschaftigung mit mathematischen Beweistech-467

niken, neben den mathematischen Konzepten, selbst Teil des Lerninhaltes. Daher werden wir auf Beweise468

nicht vollstandig verzichten. Wem dieser “Mittelweg” nicht befriedigend erscheint, dem sei ein gutes Lehr-469

buch des Stoffes oder der Besuch einer “echten” Mathematikvorlesung empfohlen.470

471

Hausaufgabe 1.4.1. Schreiben Sie472

a. Die Summe aus Theorem 1.7473

b. Die Summe der ersten 20 Quadratzahlen474

c. Die Summe aller geraden dreistelligen Zahlen475

mit Hilfe des Summenzeichens Σ.476

Hausaufgabe 1.4.2. Beweisen Sie mit Hilfe eines Widerspruchsbeweis Theorem 1.1.477

Hausaufgabe 1.4.3. Beweisen Sie durch vollstandige Induktion478

a. 3(1 · 2 + 2 · 3 + 3 · 4 + . . .+ n(n+ 1)) = n(n+ 1)(n+ 2)479

b. 2(30 + 31 + . . .+ 3n) = 3n+1 − 1480

Hausaufgabe 1.4.4. Wo steckt der Fehler im folgenden Induktionsbeweis?481

Satz: Aller Personen in einer Menge X von n Personen haben die gleiche Große.482

Beweis: Die Induktionsvoraussetzung fur n = 1 ist offensichtlich erfullt. Fur den Induktionschritt neh-483

men wir an, dass die Aussage fur alle Mengen mit bis zu n Personen gilt, und betrachten eine Menge X484

mit n + 1 Personen. Wir zerlegen X in Teilmengen Y and Z so, dass |Y | ≤ n, |Z| ≤ n, Y ∩ Z 6= ∅ und485

Y ∪Z = X gilt. Dann folgt nach Induktionsannahme, dass alle Personen in Y und Z gleich gross sind. Da486

der Schnitt von Y and Z nicht leer ist, sind also alle Personen in Y ∪ Z = X gleich gross.487

Hausaufgabe 1.4.5. Beweisen Sie, dass es genau eine naturliche Zahl n gibt, so dass n, n+ 2 und n+ 4488

Primzahlen sind. Argumentieren Sie in zwei Schritten: Erstens, dass es eine solche Zahl gibt, und zweitens489

dass es keine weitere Zahl mit dieser Eigenschaft gibt.490

Hausaufgabe 1.4.6. Die Fibonaccizahlen F1, F2, F3, . . . sind definiert wie folgt:491

F1 := 1, F2 := 1, Fi := Fi−1 + Fi−2 fur i ≥ 2

Die ersten Fibonaccizahlen sind also 1, 1, 2, 3, 5, 8, 13, 21. Beweisen Sie, dass fur alle n ≥ 1 gilt492

F1 + . . .+ Fn = Fn+2 − 1

Hausaufgabe 1.4.7. In einem Kloster leben 100 Monche. Jeder Monch sieht alle anderen Monche jeden493

Tag beim Morgengebet. Allerdings sprechen die Monche nicht miteinander oder kommunizieren in irgendei-494

ner anderen Form. Im Kloster gibt es auch keine Spiegel, also kann ein Monch sein eigenes Gesicht nicht495

sehen. In ihrer Freizeit studieren die Monche die analytischen Grundlagen der Geometrie, sie sind also496

bewandert im logischen Denken.497

Eines Tages (Tag 0) erscheint der Bischof im Kloster und spricht folgendes: “Ich brauche einige von498

Euch als Missionare in anderen Landern. Um Euren Intellekt zu trainieren, werde ich aber nicht verraten,499

wer gehen und wer bleiben muss. Stattdessen tun wir das folgende: In der nachsten Nacht werde ich einigen500

von Euch einen roten Punkt auf die Stirn zeichnen, wahrend Ihr schlaft. Ihr werdet davon nichts bemerken501

und wisst also nicht, ob Ihr markiert seid oder nicht. Wenn Ihr aber aus irgendeinem Grund sicher seid,502

dass Ihr markiert seid, dann musst Ihr in der darauffolgenden Nacht sofort das Kloster verlassen.”503

Am nachsten Morgen ist der Bischof nicht mehr im Kloster. In den nachsten 36 Tagen passiert im Kloster504

nichts. Am 37. Tag jedoch haben etliche Monche das Kloster verlassen. Beweisen Sie mittels Induktion wie505

viele Monche markiert waren.506


Kapitel 2507

Analysis, Teil I508

Die Analysis — zumindest so weit wie wir sie in diesem Kurs behandeln — beschaftigt sich mit reellwertigen509

Folgen und Funktionen und ihren Grenzwerteigenschaften (wir werden sehen, was dies bedeutet). Viele Teile510

der Analysis sind schon aus der Schule bekannt, z.B. Stetigkeit, Differentialrechnung und Integralrechnung.511

2.1 Die reellen Zahlen512

Die Menge R aller reellen Zahlen wird man als Maturant wohl schonmal gesehen haben. Aber was genau ist513

eine reelle Zahl? Es ist in der Tat recht viel Arbeit, die reellen Zahlen mathematisch exakt zu definieren.514

Wir werden die Konstruktion in weiten Teilen anreissen, aber einige Details nicht in allen Einzelheiten515

besprechen.516

Naturliche, ganze, rationale Zahlen. Wir setzen die naturlichen Zahlen N als intuitiv bekannt voraus517

und verzichten auf eine formale Definition. Die ganzen Zahlen Z erhalten wir aus den naturlichen Zahlen,518

indem wir zu jeder naturlichen Zahl n ≥ 1 ein additives Inverses −n definieren mit n + (−n) = 0. Die519

rationalen Zahlen Q erhalten wir als Menge aller Bruche der Form ab mit a, b ∈ Z, b 6= 0. Dabei werden520

zwei Bruche ab , c

d als gleich erachtet, wenn es eine ganze Zahl z gibt, so dass a = zc und b = zd gilt521

(oder aquivalent, wenn ad = bc gilt).1 Fur einen Bruch ab heißt a der Zahler und b der Nenner des Bruchs.522

Wir interpretieren Bruche der Form a1 als die ganze Zahl a — damit ist Z eine Teilmenge von Q. Es523

ist ab + c

d = ad+bcbd und a

b ·cd = ac

bd . Jeder Bruch ab mit a 6= 0 hat als multiplikatives Inverses b

a , denn524

ab ·

ba = ab

ab = 11 = 1. Wir bezeichnen einen Bruch a

b als vollstandig gekurzt, wenn es keine ganze Zahl ausser525

1 und −1 gibt, die sowohl a als auch b teilt. Jeder Bruch lasst sich mit positivem Nenner schreiben, denn526

ab = −a

−b .527

Seien ab und c

d Bruche mit positivem Nenner. Wir sagen, dass ab <

cd , wenn ad − bc < 0, und a

b >dc ,528

wenn ad− bc > 0. Dies entspricht der anschaulichen Methode, zwei Bruche zu vergleichen, in dem man sie529

auf einen gemeinsamen Nenner bringt und die Zahler vergleicht.530

Theorem 2.1. Zwischen zwei rationalen Zahlen ab <

cd liegt eine rationale Zahl p

q mit ab <

pq <

cd .531

Beweis. Wir definieren532

p

q:=

2ad+ 1

2bd

und rechnen einfach nach, dass533

aq − bp = 2abd− (2abd+ b) = −b < 0

also ist ab <

pq . Ausserdem ist534

pd− qc = 2ad2 + d− 2bcd = d(1 + 2(ad− bc))1Wem das nicht genau genug ist: Es bezeichne ∼ die Aquivalenzrelation auf der Menge Z×Z \ {0} mit (a, b) ∼ (c, d), wenn

ad = bc. Dann ist Q die Menge der Aquivalenzklassen von ∼.

19

20 KAPITEL 2. ANALYSIS, TEIL I

Da nach Voraussetzung ab <

cd , ist ad − bc < 0, also ad − bc ≤ −1, und somit 2(ad − bc) ≤ −2. Also ist535

(1 + 2(ad− bc)) ≤ −1, und somit ist aq − bp ≤ −d < 0. Es folgt, dass pq <

cd .536

Dies ist ein Beispiel fur eine Beweistechnik, in der wir eine geeignete Losung “vom Himmel fallen lassen”.537

In der Tat muss der Beweis nicht erklaren, wie wir auf die konkrete Zahl pq gekommen sind. Es ist nur wichtig538

nachzuweisen, dass die Zahl die geforderte Eigenschaft hat.539

Wir erhalten eine weitere Folgerung aus der Aussage:540

Theorem 2.2. Zwischen zwei rationalen Zahlen liegen unendlich viele rationale Zahlen.541

Beweis. Fixiere zwei rationale Zahlen q1 < q0. Nach Theorem 2.1 gibt es ein q2 mit q1 < q2 < q0. Wiederum542

nach Theorem 2.1 gibt es ein q3 mit q2 < q3 < q0. Wir konnen dies nun beliebig oft wiederholen und erhalten543

eine Sequenz von rationalen Zahlen q1, q2, q3, . . ., welche alle zwischen q1 und q0 liegen.544

Trotz dieser Eigenschaft haben die rationalen Zahlen “Locher”. Wir werden das spater prazisieren, aber545

nun beweisen wir ein klassisches Resultat, das auf die Unvollstandigkeit hinweist:546

Theorem 2.3. Es gibt keine rationale Zahl q, so dass q2 = 2 ist.547

Beweis. Wir beweisen die Aussage durch Widerspruch. Wir nehmen an, es gebe ein q ∈ Q, so dass q2 = 2.548

Schreibe q = ab mit a und b vollstandig gekurzt. Dann ist also a2

b2 = 2, und somit 2a2 = b2. Das bedeutet,549

b2 ist eine gerade Zahl. Da das Quadrat einer ungeraden Zahl wieder ungerade ist, muss b ebenfalls gerade550

sein. Also ist b = 2k fur irgendein k. Setzen wir das ein, ergibt sich 2a2 = 4k2, also a2 = 2k2. Mit dem551

gleichen Argument folgt dann, dass a ebenfalls gerade ist. Also ist der Bruch ab nicht vollstandig gekurzt,552

da a und b beide gerade, also durch 2 teilbar sind. Dies ist ein Widerspruch, also kann es ein q wie gewahlt553

nicht geben.554

Ziffernfolgen. Wir besprechen eine andere Art, die ganzen Zahlen zu erweitern: Als eine Ziffernfolge555

definieren wir eine unendliche Sequenz von Ziffern in {0, 1, . . . , 9} der Gestalt556

±znzn−1 . . . z1z0.z−1z−2z−3 . . .

mit n ∈ N wobei ± bedeutet, dass die Ziffernfolge entweder positiv ist, also mit + beginnt, oder negativ,557

also mit − beginnt. Der Punkt zwischen z0 und z−1 heißt Dezimalpunkt (oft nimmt man auch ein Komma558

im deutschsprachigen Raum). Eine Ziffernfolge heißt endlich, falls es ein i0 ∈ N gibt, so dass z−i = 0 fur559

alle i ≥ i0. Eine Ziffernfolge heißt periodisch, falls es ein i0 ∈ N und ein k ∈ N gibt, so dass fur alle i ≥ i0560

gilt, dass z−i = z−i−k.561

Hier sind ein paar Beispiele fur Ziffernfolgen

24662111.13466612555555 . . .

0.2460000 . . .

16.1426426426426426426 . . . = 16.1426

Im dritten Beispiel haben wir eine Notation fur Perioden eingefuhrt, die besagt, dass sich die Ziffernfolge562

426 von nun an unendlich oft wiederholt. Das erste und dritte Beispiel oben sind periodisch, das zweite563

endlich (genau gesagt sind endliche Ziffernfolgen nur ein Spezialfall periodischer Ziffernfolgen). Es gibt564

jedoch durchaus Ziffernfolgen, welche weder endlich noch periodisch sind. Ein einfaches Beispiel ware565

0.1010010001000010000010000001 . . .

Das Muster sollte erkennbar sein: die Anzahl der Nullen vor jeder 1 wachst pro Schritt um 1 an. Allerdings566

kann dies nicht als Periode, wie oben definiert, ausgedruckt werden.567

Eine ganze Zahl z kann man als Ziffernfolge der Art z.0000 . . . schreiben. Auch rationale Zahlen kann man568

in Ziffernfolgen umwandeln, mit Hilfe der ublichen Divisionsregel. Zum Beispiel entspricht 97 der Ziffernfolge569

1.285714, wie sich aus der Rechnung in Bild 2.1 ergibt.570

Es gilt im Allgemeinen, dass einer rationalen Zahl auf diese Weise eine periodische Ziffernfolde zugeordnet571

ist (den Beweis lassen wir weg; die Idee ist jedoch, dass sich z.B. bei Division durch 7 nur 6 verschiedene Reste572

2.1. DIE REELLEN ZAHLEN 21

Abbildung 2.1: Rechnung fur die Division 9 : 7.

in der Rechnung moglich sind, und sich das Muster deshalb nach spatestens 6 Durchgangen wiederholen573

muss). Es ist auch moglich, dass die Ziffernfolge einer rationalen Zahl endlich ist (wie gesagt ist das ein574

Spezialfall von periodischen Ziffernfolgen).575

Umgekehrt kann man aus einer endlichen oder periodischen Ziffernfolge auch eine rationale Zahl erzeu-gen. Fur endliche Ziffernfolgen ist das einfach. Wir interpretieren die Ziffernfolge einfach als Dezimalzahlim ublichen Sinn:

3.267 = 3 · 100 + 2 · 10−1 + 6 · 10−2 + 7 · 10−3

= 3 +2

10+

6

100+

7

1000

=3267

1000

Auch fur periodische Ziffernfolgen konnen wir den Bruch mit folgendem Trick bestimmen. Nehmen wir576

x = 6.537723772 . . .

Wie wir sehen, hat die Periode die Lange 4. Wenn wir mit 104 = 10000 multiplizieren, “schieben” wir die577

Periode um eine Periodenlange nach rechts.578

10000x = 65377.237723772 . . .

Wenn wir nun die obere Gleichung von der unteren abziehen, beobachten wir, dass sich die Periode aufhebt,579

und wir haben eine endliche Ziffernfolge. Also ergibt sich580

9999x = 65370.7 =653707

10

und durch Division durch 9999 ergibt sich also581

x =653707

99990

Die reellen Zahlen. Die Grundidee ist, einfach jede Zifferfolge als Zahl zu definieren, und die Menge dieser582

Zahlen die reellen Zahlen zu nennen. Allerdings gibt es noch ein technisches Problem. Es gibt verschiedene583

Ziffernfolgen, die die gleiche rationale Zahl darstellen.584

Sehen wir uns das Beispiel x = 0.389999 . . . an. Mit dem gleichen Trick wie vorher ergibt sich 10x =585

3.899999 . . ., und durch Subtraktion 9x = 3.51 = 351100 , also ist x = 351

900 = 39100 = 0.39. Ebenso kann man586

sehen, dass 0.9 = 1 gilt, denn beide Ziffernfolgen stellen die Zahl 1 dar.587

Wir losen dieses Problem, indem wir die Ziffernfolgen 0.38999 . . . und 0.390000 . . . als gleich (bzw.588

aquivalent) ansehen. Allgemein erachten wir die Ziffernfolge589

zn . . . z0.z−1 . . . z−k999 . . .

mit z−k 6= 9 als gleich der Ziffernfolge590

zn . . . z0.z−1 . . . (z−k + 1)000 . . .

Die Menge aller Ziffernfolgen mit dem gerade besprochenen Sonderfall nennen wir die Menge der reellen591

Zahlen R. Wie oben erwahnt ist Q ( R. Die Menge R \ Q nennen wir die Menge der irrationalen Zahlen.592

Wir nennen eine reelle Zahl endlich, wenn sie durch eine endliche Ziffernfolge dargestellt werden kann.593

Wie addieren wir zwei reelle Zahlen? Wenn die beiden Zahlen endlich sind, konnen wir einfach die594

bekannte Schuladdition durchfuhren. Wenn beide Zahlen periodisch sind, wird auch die Summe periodisch595


(oder wir wandeln die Zahlen in Bruche um und addieren die Bruche). Aber was, wenn mindestens eine der596

Zahlen irrational ist? Z.B.597

x = 0.909009000900009 . . .+ 0.365365365365 . . .

Die Idee ist folgende: Wir bilden eine Sequenz von Summen der Zahlen, wobei wir beide Summanden ander k-ten Stelle nach dem Punkt abschneiden:

x1 = 0.9 + 0.3 = 1.2

x2 = 0.90 + 0.36 = 1.26

x3 = 0.909 + 0.365 = 1.274

x4 = 1.2743

x5 = 1.27436

. . .

In diesem Prozess bleiben immer mehr Nachkommastellen der Summe unverandert (es ist muhsam,598

das formal zu beweisen). Damit liefert dieser Prozess eine eindeutige Ziffernfolge, welche die Summe der599

Zahlen darstellt. Fur Multiplikation, Subtraktion und Division gelten analoge Aussagen. Wir erwahnen600

einige wichtige Gesetze der Addition und Multiplikation in R, die Sie alle aus der Schule kennen sollten. Die601

Beweise lassen wir weg.602

Kommutativgesetz x+ y = y + x, xy = yx fur x, y ∈ R.603

Assoziativgesetz (x+ y) + z = x+ (y + z), (xy)z = x(yz) fur x, y ∈ R.604

Neutrales Element x+ 0 = x, x · 1 = x fur x ∈ R.605

Inverses Element der Addition Fur x ∈ R gibt es genau ein (−x) ∈ R mit x+ (−x) = 0.606

Inverses Element der Multiplikation Fur x ∈ R \ {0} gibt es genau ein 1x ∈ R mit x · 1

x = 1.607

Distributivgesetz x(y + z) = xy + xz fur x, y, z ∈ R.608

Multiplikation mit 0 x · 0 = 0 fur x ∈ R.609

Produktregel xy = 0 genau dann, wenn x = 0 oder y = 0.610

Wie vergleicht man reelle Zahlen? Wir sagen, dass x < y, wenn x 6= y und zusatzlich eine der folgenden611

Aussagen wahr ist:612

• x hat negatives und y positives Vorzeichen.613

• x und y haben beide positive Vorzeichen, und die erste Ziffer von links, in der sich x und y un-614

terscheiden, ist großer fur y. (z.B. ist 0.1257933 < 0.1258222, denn in der vierten Nachkommastelle615

unterscheiden sich die Zahlen zum ersten Mal, und 7 < 8).616

• x und y haben beide negatives Vorzeichen und (−y) < (−x).617

Fur zwei reelle Zahlen x, y gilt immer genau einer der drei folgenden Falle: x = y, x < y, oder y < x.618

Wir nennen Zahlen x > 0 positive Zahlen und x < 0 negative Zahlen. Sind x, y positive Zahlen, so gilt auch619

x+y > 0 und xy > 0. Daraus folgt, dass das Produkt zweier negativer Zahlen positiv ist, denn sind x, y < 0,620

so ist621

x · y = (−1) · (−1) · x · y = (−x) · (−y) > 0

Wir schreiben, wie ublich, x ≤ y, wenn x < y oder x = y.622

2.1. DIE REELLEN ZAHLEN 23

Betrage und Dreiecksungleichung. Fur x ∈ R schreiben wir623

|x| :=

{x x ≥ 0

−x x < 0

fur den (Absolut)betrag von x. Es gilt |x| ≥ 0 fur alle x und |x| = 0 genau dann, wenn x = 0. Der Abstand624

von x und y ist definiert als |x− y| (= |y − x|).625

Theorem 2.4 (Dreiecksungleichung). Fur alle reellen Zahlen x, y, z gilt:626

|x− z| ≤ |x− y|+ |y − z|

Der Name “Dreiecksungleichung” stammt aus der Anschauung dass eine Dreiecksseite kurzer ist als die627

Summe der anderen beiden. Hier reden wir jedoch nicht uber Punkte im Raum, sondern nur uber reelle628

Zahlen.629

Wir beweisen die Dreiecksungleichung mit Hilfe einer Fallunterscheidung. Das heißt, wir gehen verschie-630

dene Moglichkeiten fur x, y, z durch und beweisen die Aussage fur jede dieser Moglichkeiten. Ein solcher631

Beweis ist nur dann korrekt, wenn die besprochenen Moglichkeiten wirklich alle moglichen Falle abdecken.632

Beweis. Zunachst nehmen wir an, dass x > z, also |x − z| = x − z. Wir betrachten nun 3 Falle fur die633

Position von y:634

• Ist y ≥ x, dann ist auch y − z ≥ x− z. Also635

|x− z| = x− z ≤ y − z = |y − z| ≤ |x− y|︸︷︷︸≥0

+|y − z|

also ergibt sich die Dreiecksungleichung von links nach rechts gelesen.636

• Ist y ≤ z, dann ist −z ≤ −y. Also637

|x− z| = x− z ≤ x− y = |x− y| ≤ |x− y|+ |y − z|

• Ist x ≤ y ≤ z, dann ist638

|x− z| = x− z = x− y + y − z = (x− y) + (x− z) = |x− y|+ |x− z|

Dies sind die einzigen moglichen Falle. Also ist die Dreiecksungleichung bewiesen unter der Annahme, dass639

x > z gilt. Ist z < x, dann konnen wir den genau gleichen Beweis verwenden, indem wir einfach x und z640

vertauschen. Ist x = z, dann ist |x− z| = 0, und die rechte Seite ist (als Summe zweier Abstande) auf jeden641

Fall auch ≥ 0. Also stimmt die Ungleichung in allen Fallen.642

643

Hausaufgabe 2.1.1. Weisen Sie Kommutativgesetz, Assoziativgesetz und Distributivgesetz fur Addition644

und Multiplikation von rationalen Zahlen nach, unter der Annahme, dass diese Gesetze fur die ganzen645

Zahlen gelten.646

Hausaufgabe 2.1.2. Zeigen Sie, dass es keine rationale Zahl q gibt, so dass q2 = 3 gilt.647

Hausaufgabe 2.1.3. Fuhren Sie das Verfahren von oben durch, um einen Bruch fur die Zahl 1.285714 zu648

erhalten. Kurzen Sie den Bruch danach vollstandig. Warum ist das Ergebnis zu erwarten?649

Hausaufgabe 2.1.4. Eine reelle Zahl heißt normal, wenn sich jede beliebige endliche Ziffernfolge an ir-650

gendeiner Stelle in der Zahl finden lasst. Es ist nicht bekannt, ob die Kreiszahl π normal ist. (Sie konnen651

aber nach Ihrem Geburtstag in π suchen; schauen Sie unter http: // mypiday. com/ nach.)652

Wir vereinfachen das Problem etwas: wir nennen eine Zahl (0, 1)-normal, wenn jede Zifferfolge, die nur653

aus Nullen und Einsen besteht, irgendwann in der Zahl auftaucht.654


a. Argumentieren Sie, dass keine rationale Zahl (0, 1)-normal ist.655

b. Argumentieren Sie, dass die Zahl656

0.101001000100001000001 . . .

nicht (0, 1)-normal ist.657

c. Erklaren Sie, wie Sie eine (0, 1)-normale Zahl konstruieren konnen.658

Ihre Erklarungen brauchen nicht allzu formal zu sein. Es geht eher darum, uber das Problem nachzudenken.659

Hausaufgabe 2.1.5. Beweisen Sie: Zwischen zwei reellen Zahlen x 6= y liegen unendlich viele rationale660

Zahlen.661

Hausaufgabe 2.1.6. Beweisen Sie, dass fur eine reelle Zahl x gilt: x2 ≥ 0, und x2 = 0 genau dann, wenn662

x = 0.663

2.2 Intervalle und beschrankte Mengen664

Fur a, b ∈ R ist

[a, b] := {x ∈ R | a ≤ x ≤ b}(a, b) := {x ∈ R | a < x < b}(a, b] := {x ∈ R | a < x ≤ b}[a, b) := {x ∈ R | a ≤ x < b}.

Wir nennen diese Mengen Intervalle und sprechen (von oben nach unten) von geschlossenen, offenenund halb-offenen Intervallen. Wir definieren auch

(−∞, b] := {x ∈ R | x ≤ b}(−∞, b) := {x ∈ R | x < b}

[a,∞) := {x ∈ R | a ≤ x}(a,∞) := {x ∈ R | a < x}.

Das Symbol∞ steht fur “unendlich”. Wir legen fest, dass x <∞ und x > −∞ fur jede reelle Zahl x. Jedoch665

ist ∞ /∈ R!666

Sei nun M ⊆ R beliebig.667

• Wir nennen a ∈ R eine untere Schranke von M , falls gilt: ∀x ∈M : a ≤ x. Gibt es eine untere Schranke668

von M , dann nennen wir M nach unten beschrankt.669

• Wir nennen b ∈ R eine obere Schranke vom M , falls gilt: ∀x ∈M : x ≤ b. Gibt es eine obere Schranke670

von M , dann nennen wir M nach oben beschrankt.671

• M heißt beschrankt, wenn es nach unten und nach oben beschrankt ist.672

N ⊂ R nach unten beschrankt durch 0 (aber auch z.B. −5 oder − 73 sind untere Schranken). N ist jedoch673

nicht nach oben beschrankt. Z ⊂ R ist weder nach unten noch nach oben beschrankt. Ein Intervall (a, b)674

mit a, b ∈ R ist eine beschrankte Menge.675

Wie wir uns leicht uberlegen konnen, hat eine nach unten (oben) beschrankte Menge viele untere (obere)676

Schranken. Wir wollen uns nun die “beste” (scharfste) untere (obere) Schranke definieren.677

Definition 2.5. Sei M ⊆ R. Wir nennen a ∈ R ein Infimum von M , falls a eine untere Schranke ist, und678

ausserdem gilt: Jede untere Schranke a′ von M erfullt a′ ≤ a. Ist ein Infimum a selbst Teil der Menge M ,679

dann heißt es ein Minimum von M . Wir nennen b ∈ R ein Supremum von M , falls b eine obere Schranke680

ist und jede obere Schranke b′ von M b ≤ b′ erfullt. Ist ein Supremum b in M enthalten, so heißt es ein681

Maximum von M .682

2.2. INTERVALLE UND BESCHRANKTE MENGEN 25

Ein Infimum ist also eine “großte untere Schranke”, und ein Supremum eine “kleinste obere Schranke”.683

Lemma 2.6. Eine Menge hat hochstens ein Infimum und hochstens ein Supremum.684

Wir verwenden die folgende Beweistechnik, um die Eindeutigkeit einer Zahl mit einer gewissen Eigen-685

schaft zu zeigen. Wir nehmen zwei Zahlen mit der Eigenschaft an und beweisen, dass diese beiden Zahlen686

gleich sein mussen.687

Beweis. Seien a1, a2 beliebige Infima von M . Insbesondere sind a1 und a2 untere Schranken von M . Da a1688

Infimum und a2 untere Schranke ist, gilt also a2 ≤ a1. Da a2 Infimum und a1 untere Schranke, gilt auch689

a1 ≤ a2. Dies ist nur moglich, wenn a1 = a2 gilt. Fur Suprema geht man genauso vor.690

Das Lemma erlaubt es uns, von dem Infimum/Supremum, und auch dem Minimum/Maximum einer691

Menge zu sprechen. Schauen wir uns Beispiele an:692

• Z hat weder ein Infimum noch ein Supremum, da es weder nach unten noch nach oben beschrankt693

ist. Allgemeiner hat eine nach unten unbeschrankte Menge kein Infimum, und eine nach oben unbe-694

schrankte Menge kein Supremum (uberlegen Sie sich warum).695

• Ein Intervall der Form (a, b] mit a, b ∈ R hat das Infimum a und das Supremum/Maximum b. a ist696

jedoch kein Minimum von (a, b].697

• M = {1, 12 ,

13 ,

14 , . . .} hat 1 als Supremum und 0 als Infimum. Ferner ist 1 ein Maximum, da es in M698

enthalten ist. M hat jedoch kein Minimum, da 0 /∈M .699

Theorem 2.7 (Vollstandigkeitssatz). Eine nach unten beschrankte, nicht-leere Teilmenge von R hat ein700

Infimum. Eine nach oben beschrankte, nicht-leere Teilmenge von R hat ein Supremum.701

Der Satz mag aus der Anschauung heraus recht einleuchtend sein: wenn es irgendeine untere Schranke702

gibt, sollte es auch eine großte untere Schranke geben. Dass der Fall nicht so klar ist, verdeutlicht der703

folgende Umstand: hatten wir Infimum/Supremum uber Teilmengen von Q definiert, ist die Aussage des704

Satzes falsch. Der Beweis muss also auf die Definition der reelllen Zahlen zuruckgreifen.705

Beweis. Wir konzentieren uns auf den Infimum-Fall; der Supremum-Fall geht genauso.706

Nach Annahme ist M nach unten beschrankt. Also gibt es auch (mindestens) eine ganze Zahl, die untere707

Schranke von M ist. Sei z die großte ganze Zahl, die untere Schranke von M ist. Also ist z untere Schranke,708

aber z + 1 keine untere Schranke. Nun sei b1 ∈ {0, . . . , 9} so definiert, dass z.b1 immer noch eine untere709

Schranke von M ist, aber z.b1 + 0.1 nicht (ein solches b1 muss es geben, denn z ist untere Schranke, aber710

z.9 + 0.1 = z + 1 nicht). Nun sei b2 so definiert, dass z.b1b2 untere Schranke ist, aber z.b1b2 + 0.01 nicht.711

Wir konnen dieses Verfahren beliebig oft wiederholen und erhalten eine Ziffernfolge z.b1b2b3 . . ., welche eine712

reelle Zahl a definiert.713

Nun argumentieren wir, dass a eine untere Schranke ist: Angenommen, a ist keine untere Schranke714

(Beweis durch Widerspruch). Dann gibt es ein x ∈M mit x < a. Das bedeutet, es gibt ein i, so dass sich x715

und a in der i-ten Stelle nach dem Punkt unterscheiden. Sei ai die Zahl, die wir erhalten, wenn wir a nach716

der i-ten Stelle abschneiden. Es gilt dann auch x < ai. Nach Konstruktion oben ist ai = z.b1b2 . . . bi, und717

wir haben bi so gewahlt, dass ai eine untere Schranke ist. Dann ist aber ai ≤ x, was x < ai widerspricht.718

Zuletzt argumentieren wir, dass a das Infimum von M ist. Sei a′ 6= a irgendeine andere untere Schranke.719

Dann unterscheiden sich a und a′ in irgendeiner Ziffer, sagen wir in der i-ten Stelle nach dem Punkt.720

Wiederum bezeichnen wir mit ai und a′i die abgeschnittenen Versionen von a und a′. Es gilt dann ai =721

z.b1 . . . bi−1bi und a′i = z.b1 . . . bi−1b′i mit bi 6= b′i. Da a′i ≤ a′, ist a′i ebenfalls eine untere Schranke von M .722

Nach Konstruktion von a kann also bi nicht kleiner als b′i sein (denn dann hatten wir ja b′i als nachste Ziffer723

gewahlt). Also ist b′i < bi und damit a′ < a. Dies beweist die Infimumseigenschaft.724

Als Beispiel betrachten wir die Menge725

M := {x ∈ Q | x > 0, x2 ≥ 2}Diese Menge ist nach unten beschrankt (z.B. durch 0). Wir fuhren die Konstruktion aus dem Beweis726

durch:727


• z = 1, denn 12 < 2, 22 > 2728

• a1 = 1.4, denn 1.42 < 2, 1.52 > 2729

• a2 = 1.41, denn 1.412 < 2, 1.422 > 2730

• a3 = 1.414, denn 1.4142 < 2, 1.4152 > 2731

• a4 = 1.4142, . . .732

Mit ein bisschen mehr Arbeit kann man zeigen, dass das Infimum der Menge in der Tat x2 = 2 erfullt. Wir733

konnen auf diese Weise also zeigen, dass√

2 in R liegt.734

Im folgenden schreiben wir inf(M) fur das Infimum von M . Wir setzten inf(M) = −∞, falls M nicht nach735

unten beschrankt ist. Genauso schreiben wir sup(M) fur das Supremum von M und setzten sup(M) = ∞736

fur nach oben unbeschrankte Mengen.737

738

Hausaufgabe 2.2.1. Beantworten Sie die folgenden Fragen (mit Begrundung):739

a. Gibt es eine endliche unbeschrankte Menge?740

b. Gibt es eine endliche Menge, die ein Infimum, aber kein Minimum hat?741

c. Gibt es eine Menge, fur die Infimum und Supremum gleich sind?742

Hausaufgabe 2.2.2. Sind die folgenden Aussagen wahr oder falsch? Begrunden Sie Ihre Antwort.743

a. Hat eine Menge M ein Infimum, dann hat auch jede Teilmenge von M ein Infimum.744

b. Hat eine Menge M ein Minimum, dann hat auch jede Teilmenge von M ein Minimum.745

c. Hat eine Menge M ein Infimum, dann hat sein Komplement R \M ein Supremum.746

d. Es gibt eine beschrankte Menge M , deren Komplement R \M ebenfalls beschrankt ist.747

Hausaufgabe 2.2.3. Sind A ⊆ B nach unten beschrankt, zeigen Sie dass inf(A) ≥ inf(B). Formulieren748

Sie einen analogen Satz fur Suprema.749

Hausaufgabe 2.2.4. Untersuchen Sie die Menge750

(R \ Q) ∩ [0, 1]

auf Beschranktheit. Geben Sie, falls vorhanden, Infimum und Supremum an und stellen Sie fest, ob diese751

Minimum und Maximum sind.752

2.3 Folgen und Konvergenz753

Der Konvergenzbegriff ist zweifellos das grundlegenste Prinzip der Analysis. Alle weiterfuhrenden Konzepte754

wie Stetigkeit, Differenzierbarkeit und Integrierbarkeit bauen auf dem Begriff auf. Insofern ist es mehr als755

verwunderlich, dass das Konzept in Schulen in der Regel nicht behandelt wird.756

Definition 2.8. Als eine Folge von reellen Zahlen bezeichnen wir eine Sequenz757

(a0, a1, a2, . . .)

mit Folgengliedern ai ∈ R. Wir schreiben auch (an)n∈N fur die Folge. Wir erlauben auch Folgen, die uber758

N+ = {1, 2, 3, . . .} indiziert sind.759

2.3. FOLGEN UND KONVERGENZ 27

Wir konnen eine Folge auch als eine Abbildung760

a : N→ R

interpretieren, in der wir ai anstatt a(i) schreiben. Meistens sehen wir Folgen aber einfach als Liste von761

Zahlen an. Beachten Sie, dass eine Folge mehr als die Menge seiner Glieder ist, denn die Reihenfolge der762

Elemente spielt eine Rolle.763

Betrachten wir einige Beispiele fur Folgen764

• an := 1n! , (an)n∈N+ = (1, 1

2 ,16 ,

124 , . . .).765

• bn := n-ste Nachkommastelle von π, (bn)n∈N+ = (1, 4, 1, 5, 9, 3, 2, . . .).766

• Arithmetische Folge: Fur k, d ∈ R setze767

cn := k · n+ d

z.B. k = 2, d = 1: (cn)n∈N = (1, 3, 5, 7, 9, 11, . . .).768

• Geometrische Folge: fur q, c ∈ R setze769

dn := c · qn

z.B. q = 12 , c = 1: (dn)n∈N = (1, 1

2 ,14 ,

18 ,

116 , . . .)770

• Im Beispiel aus dem letzten Kapitel haben wir eine Sequenz von Zahlen konstruiert, die sich√

2 immer771

weiter annahern:772

(en)n∈N = (1, 1.4, 1.41, 1.414, 1.4142, . . .).

Auch diese Konstruktion liefert also eine Folge.773

Mit “Konvergenz” wollen wir das Verhalten einer Folge beschreiben, wenn wir den Index (n in den774

Beispielen oben) immer großer werden lassen (wir sagen auch “gegen unendlich laufen lassen”). Anschaulich775

sehen wir, dass an sich immer weiter der Zahl 0 annahert. Das Gleiche gilt fur die Folge dn. Wir wollen also776

sagen, dass diese Folgen “gegen 0 konvergieren”. Genauso haben wir ja bereits besprochen, dass en sich√

2777

immer weitere annaehert, also soll en gegen√

2 konvergieren.778

Die Folge (bn)n∈N verhalt sich anders. Da π irrational ist, springt die Folge immer zwischen den Ziffern779

0 bis 9 umher. Wir konnen hier nicht davon sprechen, dass die Folge gegen einen Wert konvergiert.780

Die Folge (cn)n∈N wachst fur steigende n immer weiter an. Auch hier konnen wir nicht sinnvoll sagen,781

dass die Folge gegen einen reellen Wert konvergiert.782

Wir haben uns also uberlegt, was eine sinnvolle Definition von Konvergenz fur die Beispiele von oben783

ergeben soll. Nun werden wir den Begriff mathematisch definieren.784

Definition 2.9. Eine Folge (an)n∈N konvergiert gegen α ∈ R, falls gilt785

∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : |an − α| < ε.

Wir schreiben dann auch ann→∞−−−−→ α786

Was bedeutet diese Definition? Beachten Sie, dass |an − α| < ε bedeutet, dass an ∈ (α − ε, α + ε). Die787

Definition besagt:”Egal, wie klein ich ein Intervall um α herum festlege: wenn ich in der Folge (an) nur788

weit genug nach rechts gehe, sind alle Folgenglieder ab einer gewissen Stelle in diesem Intervall enthalten.“789

In der Definition legt ε die Grosse des Intervalls fest, und n0 sagt, wie weit man nach rechts gehen muss.790

Wir werden nun einige Folgen formal auf Konvergenz untersuchen.791

• an := 1n konvergiert gegen 0.792

Beweis. Sei ε > 0 beliebig. Wir wahlen n0 ∈ N, so dass n0 · ε > 1 ist. (Egal wie klein ε ist, ein solches n0793

kann man immer finden, z.B. n0 = d 1ε e.) Fur n ≥ n0 gilt dann794

| 1n− 0| = 1

n≤ 1

n0< ε,

wobei die letzte Ungleichung aus n0 · ε > 1 durch Division durch ε folgt.795


• bn := (b, b, b, . . .) (konstante Folge) konvergiert gegen b.796

Beweis. Fur alle ε > 0 konnen wir n0 = 0 wahlen. Dann ist fur jedes n ∈ N : |bn − b| = |b− b| = 0 < ε.797

• Die Folge798

cn := (−1)n, (1,−1, 1,−1, 1,−1, . . .)

konvergiert gegen kein α ∈ R.799

Beweis. Durch Widerspruch. Angenommen, es gibt ein solches α. Fur ε = 12 gibt es dann ein n0 ∈ N, so800

dass |cn − α| ≤ 12 fur alle n ≥ n0. Nehmen wir an, n0 ist eine gerade Zahl (sonst erhohen wir n0 um eins).801

Dann ist802

2 = |1− (−1)| = |cn0 − cn0+1| = |(cn0 − α) + (α− cn0+1)|∆-Ungl.

≤ |cn0 − α|+ |α− cn0+1| ≤1

2+

1

2= 1

Es ergibt sich also 2 < 1, ein Widerspruch.803

Die Rechnung im letzten Beweis ist typisch fur die Analysis. Man schreibt die Zahl 2 etwas komplizierter804

hin, “schummelt” einen weiteren Term ein und folgert dann einen Widerspruch. Hier gilt wiederum, dass805

man als Leser des Beweises nicht unbedingt verstehen muss, warum der nachste Schritt durchgefuhrt wird.806

Man muss nur nachvollziehen konnen, dass jeder Schritt korrekt ist.807

Theorem 2.10 (Eindeutigkeit). Falls ann→∞−−−−→ α und an

n→∞−−−−→ β, dann ist α = β.808

Beweis. Durch Widerspruch. Angenommen, α 6= β. Dann ist δ := |α− β| > 0. Es gibt dann ein n1 ∈ N, so809

dass |an − α| < δ3 fur alle n ≥ n1. Und es gibt ein n2 ∈ N, so dass |an − β| < δ

3 fur alle n ≥ n2. Nun wahle810

n0 := max{n1, n2}. Fur jedes n ≥ n0 gilt nun811

δ = |α− β| = |(α− an) + (an − β)|∆-Ungl.

≤ |α− an|+ |an − β| ≤δ

3+δ

3=

2

3δ,

also δ < 23δ, ein Widerspruch.812

Definition 2.11. Sei (an)n∈N eine Folge, die gegen α konvergiert. Dann nennen wir α auch den Grenzwert813

der Folge und schreiben814

α = limn→∞

an

Eine Folge mit Grenzwert 0 nennen wir auch Nullfolge. Wir sagen, dass (an)n∈N divergiert, wenn die Folge815

keinen Grenzwert hat.816

Betrachten wir nochmals die divergente Folge (1, 3, 5, 7, . . .) von oben. Diese hat ein anderes Verhalten817

gegen unendlich als z.B. (1,−1, 1,−1, . . .) — wahrend erstere immer weiter wachst, springt letztere immer818

zwischen zwei Werten umher. Die folgende Definition erlaubt es uns, diese beiden Falle zu unterscheiden.819

Definition 2.12. Eine Folge (an)n∈N divergiert nach ∞, wenn gilt:820

∀t > 0 ∃n0 ∈ N : ∀n ≥ n0 : an > t.

Divergenz nach −∞ ist auf analoge Art definiert.821

Anschaulich bedeutet das:”Egal welche Schranke ich nehme, die Folge wird von einem bestimmten822

Zeitpunkt an oberhalb dieser Schranke bleiben“.823

824

Hausaufgabe 2.3.1. Betrachten Sie die folgenden Alternativvorschlage, was Konvergenz gegen a ∈ R825

bedeuten konnte:826

a. ∀ε ≥ 0 ∃n0 ∈ N ∀n ≥ n0 : |an − a| ≤ ε.827

2.4. KONVERGENZKRITERIEN 29

b. ∀n ∈ N : |a− an+1| < |a− an| (”

Die Folge kommt immer naher an a heran.“).828

c. ∀ε > 0 ∃n ∈ N : |an − a| < ε. (”

Egal wie klein ich das Intervall um a wahle, irgendwann liegt ein829

Folgenglied darin.“).830

Uberlegen Sie sich fur jede dieser Definitionen, warum sie nicht mit dem intuitiven Konvergenzbegriff zu-831

sammenpasst.832

Hausaufgabe 2.3.2. Beweisen Sie: Fur jede reelle Zahl x gibt es eine Folge (an)n∈N rationaler Zahlen,833

die gegen x konvergiert.834

Hausaufgabe 2.3.3. Eine Folge (an)n∈N heißt nach oben beschrankt, wenn die Menge {a0, a1, a2, . . .} nach835

oben beschrankt ist. Beweisen Sie, ob folgende Aussage wahr oder falsch ist:”

Eine nach oben unbeschrankte836

Folge divergiert nach +∞.“837

2.4 Konvergenzkriterien838

Die Konvergenz einer Folge mit Hilfe der Definition nachzuweisen ist ein recht muhsames Unterfangen. Wir839

werden nun einige Satze kennenlernen, die es erheblich erleichtern, das Konvergenzverhalten einer Folge zu840

bestimmen.841

Zunachst beobachten wir, dass wir aus zwei Folgen (an)n∈N und (bn)n∈N neue Folgen (an + bn)n∈N und842

(an · bn)n∈N konstruieren konnen, indem wir einfach gliedweise addieren/multiplizieren. Ist bn 6= 0 fur alle843

n ∈ N, konnen wir auch die Folge (anbn )n∈N bilden. Der nachste Satz besagt, dass wir den Grenzwert einer844

solchen zusammengesetzten Folge aus den Grenzwerten der Einzelteile ablesen konnen:845

Theorem 2.13. Seien (an)n∈N und (bn)n∈N konvergente Folgen mit ann→∞−−−−→ α und bn

n→∞−−−−→ β. Dann846

gilt847

1. an + bnn→∞−−−−→ α+ β,848

2. an · bnn→∞−−−−→ α · β,849

3. Ist bn 6= 0 fur alle n ∈ N und β 6= 0, anbn

n→∞−−−−→ αβ .850

Der Beweis der ersten Aussage ist sehr ahnlich zu den vorangehenden Beweisen und benutzt die Drei-851

ecksungleichung. Die Beweise der anderen beiden Aussagen sind etwas aufwandiger; wir lassen sie hier weg.852

Als Anwendungsbeispiel betrachten wir das Konvergenzverhalten von853

an :=2n+ 3

2 + n.

Die ersten Folgenglieder sind 53 ,

74 ,

95 ,

116 . Der Grenzwert scheint also 2 zu sein. Das weisen wir jetzt nach.854

Zuerst schreiben wir an um, indem wir Zahler und Nenner durch n dividieren (wir nehmen an, die Folge855

startet bei Index 1):856

an =2n+ 3

2 + n=

2 + 3n

2n + 1

=2 + 3 1

n

1 + 2 1n

.

Das Konvergenzverhalten aller einzelnen Terme ist uns bekannt: Wir wissen, dass 1n gegen 0 konvergiert,857

also konvergiert 3 1n auch gegen 0 (nach vorherigem Theorem, Teil 2). Genauso konvergiert 2 1

n gegen 0. Nach858

Teil 1 des Theorems konvergiert also 2 + 3n gegen 2 + 0 = 2, und 1 + 2

n konvergiert gegen 1 + 0 = 1. Der859

Nenner ist ausserdem niemals gleich 0. Also folgt nach dem dritten Teil des Theorems, dass860

2 + 3 1n

1 + 2 1n

n→∞−−−−→ 2

1= 2.

In Bild 2.2 sehen Sie ein zweites Beispiel. Die Argumentation ist komplett analog, nur etwas kurzer861

notiert.862

Eine Folge (an)n∈N heißt beschrankt, wenn die Menge {a1, a2, a3, . . .} beschrankt ist. Eine Folge heißt863

monoton wachsend (bzw. fallend), wenn fur alle i ∈ N ai ≤ ai+1 (bzw. ai ≥ ai+1) gilt. Eine Folge heißt864

monoton, wenn sie monoton wachsend oder fallend ist.865


Abbildung 2.2: Berechnung des Grenzwertes fur an = 4n2−3n+57n3−2n+1

Theorem 2.14. Jede konvergente Folge ist beschrankt.866

Beweis. Sei (an)n∈N eine Folge mit Grenzwert α. Es gibt dann ein n0 ∈ N, so dass |an−α| ≤ 1. Also ist die867

Menge {an0, an0+1, an0+2, . . .} im Intervall [α − 1, α + 1] enthalten, und so beschrankt (salopp gesagt: die868

Folge ist beschrankt ab n0). Aber die verbleibenden Folgenglieder {a0, a1, . . . , an0−1} bilden eine endliche869

Menge und endliche Mengen sind beschrankt (das ist leicht zu beweisen, z.B. durch vollstandige Induktion).870

Also ist min{a0, a1, . . . , an0−1, α− 1} eine untere und max{a0, a1, . . . , an0−1, α+ 1} eine obere Schranke fur871

die Folge.872

Ein kleiner Einschub: Gilt eine Aussage der Form:”Wenn A, dann B“, so gilt auch die Kontraposition873

”Wenn nicht B, dann nicht A.“ (Machen Sie sich das an Beispielen klar.) Angewandt auf den Satz oben874

bedeutet das als Folgerung (Korollar):875

Korollar 2.15. Ist eine Folge nicht beschrankt, dann konvergiert sie nicht.876

Also konvergiert zum Beispiel die Folge der Quadratzahlen (1, 4, 9, 16, . . .) nicht.877

Es ist jedoch nicht wahr, dass jede beschrankte Folge konvergiert! Zum Beispiel ist die Folge (−1)n zwar878

beschrankt aber divergent, wie wir vorher gesehen haben. Mit einer zusatzlichen Bedingung konnen wir879

aber Konvergenz nachweisen:880

Theorem 2.16. Jede beschrankte monotone Folge konvergiert.881

Beweis. Wir zeigen die Aussage fur monoton wachsende Folgen (es geht ganz analog fur fallende Folgen).882

Die Folge ist beschrankt, es gibt also eine obere Schranke. Also hat die Menge {a0, a1, . . .} ein Supremum883

s nach Theorem 2.7. Wir zeigen, dass ann→∞−−−−→ s.884

Sei ε > 0. Dann gibt es ein n0 ∈ N, so dass s− an0 = |s− an0 | < ε, denn ware dem nicht so, dann ware885

s − an0 > ε fur alle n0 ∈ N und folglich ware s − ε > an0 fur alle n0 ∈ N. Das wurde aber bedeuten, dass886

s− ε eine obere Schranke ist, was der Definition von s als Supremums widerspricht.887

Nun gilt fur n ≥ n0, dass |s − an| = s − an ≤ s − an0< ε, wobei der zweite Schritt gilt, weil an ≥ an0

888

wegen der Monotonie der Folge, also −an ≤ −an0.889

Zuletzt kommen wir nochmals zuruck auf den Konvergenzbegriff selbst. Statt zu fordern, dass die Folge890

beliebig nah an einen Grenzwert gehen soll, hatten wir auch die folgende Alternative gehabt: wir fordern,891

dass der Abstand zwischen zwei Folgengliedern ab einer gewissen Stelle beliebig klein wird. Wir definieren892

dies formal.893

Definition 2.17. Eine Folge (an)n∈N ist eine Cauchyfolge, wenn gilt894

∀ε > 0 ∃n0 ∀n,m ≥ n0 : |an − am| < ε.

Beachten Sie, dass es nicht reicht, dass sich zwei aufeinanderfolgende Glieder irgendwann hochstens um895

ε unterscheiden! In der Tat gibt es Folgen, die diese Bedingung erfullen, aber keine Cauchyfolgen sind.896

Wenn einer Folge konvergiert, dann ist sie auch eine Cauchyfolge. Das ist nicht schwer einzusehen: wenn897

ab einem gewissen n0 alle Folgenglieder im Intervall [α − ε, α + ε] liegen, dann haben alle diese Glieder898

Abstand hochstens 2ε. Wir schreiben diese Idee als Beweis:899

Lemma 2.18. Konvergente Folgen sind Cauchyfolgen.900

Beweis. Sei α = limn→∞ an und ε > 0. Es gibt ein n0 ∈ N so dass |an − α| < ε2 fur alle n ≥ n0. Fur alle901

n,m ≥ n0 gilt dann902

|an − am| = |(an − α) + (α− am)| ≤ |an − α|+ |α− am| ≤ε

2+ε

2= ε

903

2.4. KONVERGENZKRITERIEN 31

Es gilt auch die Ruckrichtung. Der Beweis ist etwas aufwandiger. Wir geben ihn hier dennoch der904

Vollstandigkeit halber an.905

Lemma 2.19. Jede Cauchyfolge konvergiert.906

Beweis. Sei (an)n∈N eine Cauchyfolge. Wir uberlegen uns erst, dass Cauchyfolgen beschrankt sind: Sei n0907

so, dass |an−am| < 1 fur alle n,m ≥ n0. Das bedeutet auch, dass |an−an0| < 1, also an ∈ [an0

−1, an0+ 1]908

fur alle n ≥ n0. Also ist die Folge beschrankt ab n0, und wie im Beweis von Theorem 2.14 folgt, dass die909

Folge insgesamt beschrankt ist.910

Wir basteln uns nun zwei Folgen (bk)k∈N und (ck)k∈N (wir nehmen k statt n der besseren Lesbarkeit911

halber) wie folgt: Fur jedes k ∈ N gibt es ein n0, so dass fur alle n,m ≥ n0 gilt: |an − am| < 1k . Wir setzen912

bk als das Infimum und ck als das Supremum der Menge Ak := {an0, an0+1, . . .}. Wir sehen nun: (bk)k∈N913

ist beschrankt (da die Folge beschrankt ist) und monoton wachsend (denn Ak ⊇ Ak+1, also inf(Ak) ≤914

inf(Ak+1)). Also konvergiert die Folge (bn)n∈N gegen einen Grenzwert β. Ebenso konvergiert (cn)n∈N gegen915

einen Grenzwert γ. Da bk ≤ ck fur alle k, ist auch β ≤ γ.916

Wir wollen nun zeigen, dass β = γ ist. Angenommen, dies ist nicht so. Setze δ := γ − β > 0. Fur jedes917

beliebige n0 finden wir nun ein k0 ∈ N, so dass fur alle k ≥ k0 gilt918

Ak ⊆ {an0 , an0+1, . . .}.

Wir konnen uns insbesondere ein k ≥ k0 wahlen, so dass zusatzlich |bk − β| ≤ δ5 gilt.919

In Ak gibt es ein Element an1mit n1 ≥ n0 so dass |an1

− inf(Ak)︸︷︷︸bk

| ≤ δ5 – ware dem nicht so, dann ware920

bk nicht das Infimum. Also ist nach Dreieckungleichung921

|an1 − β| ≤ |an1 − bk|+ |bk − β| ≤2δ

5.

Wir finden vollig analog einen Index n2 ≤ n0, so dass |an2−γ| ≤ 2δ

5 . Da der Abstand von β und γ gleich922

δ ist, folgt daraus, dass an1und an2

Abstand mindestens δ5 haben. Wir haben also gezeigt:923

∃ε > 0 ∀n0 ∈ N ∃n1, n2 ≥ n0 : |an1− an2

| ≥ ε

(hier ist ε = δ5 ). Das bedeutet, dass (an)n∈N keine Cauchyfolge ist, ein Widerspruch. Also ist β = γ.924

Nun zeigen wir, dass (an)n∈N gegen β konvergiert. Sei ε > 0. Es existiert ein k, so dass gilt, dass |bk−β| <925

ε2 und |ck−β| < ε

2 (die zweite Ungleichung nutzt aus, dass β = γ). Damit ist nach Dreiecksungleichung auch926

|bk − ck| ≤ ε. Fur n ≥ n0 gilt nun sowohl an ∈ [bk, ck] als auch β ∈ [bk, ck], also ist |an − β| ≤ |ck − bk| ≤ ε927

und wir haben Konvergenz bewiesen.928

Wir haben also zwei aquivalente Definitionen von Konvergenz. Die ursprungliche Definition und die einer929

Cauchyfolge. Die Cauchybedingung hat den Vorteil, dass die Definition ohne Einfuhrung eines Grenzwer-930

tes auskommt. Man kann daher manchmal einfacher zeigen, dass eine Folge eine Cauchyfolge ist, als die931

Konvergenz direkt zu zeigen (z.B. weil der Grenzwert nicht bekannt ist).932

Mit Hilfe von Cauchyfolgen kann man auch die reellen Zahlen definieren. Wir skizzieren dies kurz:933

Vergessen wir unsere Definition der reellen Zahlen als Ziffernfolgen fur einen Augenblick. Wir definieren eine934

Q-Folge (q0, q1, . . .) als Sequenz von rationalen Zahlen. Wir konnen nun Cauchyfolgen uber Q betrachten.935

Auch Konvergenz konnen wir definieren, wobei wir fordern, dass der Grenzwert in Q liegen muss.936

Nun definieren wir eine Relation auf der Menge aller Cauchyfolgen uber Q:937

(pn)n∈N ∼ (qn)n∈N wenn die Q-Folge (pn − qn)n∈N eine Nullfolge ist.

Man kann zeigen, dass dies eine Aquivalenzrelation ist. Nun definiert man R als die Menge der Aquivalenz-938

klassen dieser Relation. Diese Definition ist weniger anschaulich als die Definition uber Ziffernfolgen, aber939

viele Eigenschaften der reellen Zahlen folgen damit recht einfach. Zum Beispiel ist die Addition zweier Zahlen940

nun einfach zu definieren, als die Summe der entsprechenden Cauchyfolgen (wobei die Summe ebenfalls eine941

Cauchyfolge ist).942

943


Hausaufgabe 2.4.1. Sein (an)n∈N eine Folge und I eine endliche Teilmenge von N (z.B. I = {1, 2, 5, 7, 102,944

5034}). Betrachten Sie die Folge (bn)n∈N, die definiert ist als945

bn =

{0 n ∈ Ian n /∈ I

a. Wie hangt das Konvergenzverhalten von (bn)n∈N vom Konvergenzverhalten von (an)n∈N ab?946

b. Versuchen Sie, Ihre Beobachtung als allgemeines Theorem zu formulieren.947

c. Beweisen Sie das Theorem.948

Hausaufgabe 2.4.2. Beweisen Sie, ob die folgende Aussage wahr oder falsch ist:”

Ist eine Folge monoton949

wachsend und nach oben beschrankt, dann ist sie auch beschrankt.“950

Hausaufgabe 2.4.3. Wir nennen eine Folge schließlich-monoton, wenn es ein n0 ∈ N gibt, so dass die951

Folge ab der Stelle n0 monoton ist.952

a. Sind monotone Folgen immer auch schließlich-monoton? Gilt auch die Ruckrichtung?953

b. Zeigen Sie, dass Theorem 2.16 wahr bleibt, wenn die Folge schließlich-monoton ist.954

Hausaufgabe 2.4.4. Kurzlich wurde der Marathon-Weltrekord von Eliud Kipchoge auf 2 : 01 : 39 Stunden955

verbessert. Eine oft gestellte Frage ist, welche Zeit fur einen Menschen erreichbar ist.956

Zeigen Sie, dass eine Grenze existieren muss. Sei (an)n∈N die Weltrekordzeit fur einen Marathon am957

Ende des Jahres n in Sekunden (also a2018 = 7299, es sei denn, jemand lauft bis Ende des Jahres noch958

schneller). Beweisen Sie, dass die Folge (an)n∈N konvergiert.959

Hausaufgabe 2.4.5. Zeigen Sie, dass die Relation ∼ auf Cauchyfolgen uber Q wie oben definiert wirklich960

eine Aquivalenzrelation ist.961

2.5 Reihen962

Wir betrachten nun einen wichtigen Spezialfall von Folgen, bei dem wir Folgenglieder aufsummieren. Erin-963

nern Sie sich an das Summensymbol964

k∑n=1

an = a1 + a2 + . . .+ ak.

Es gelten die folgenden Rechenregeln965

k∑n=1

λ · an = λ

k∑n=1

an

k∑n=1

(an + bn) =

k∑n=1

an +

k∑n=1

bn

wie man sich sehr leicht uberlegt. Oft mochte man eine geschlossene Formel fur eine Summe herleiten, also966

eine aquivalente Beschreibung ohne Summenzeichen. Das bekannteste Beispiel fur eine solche Formel ist967

k∑n=0

n =k(k + 1)

2.

Wir haben diese Formel bereits in Theorem 1.8 mit vollstandiger Induktion bewiesen (wir mussen nur beide968

Seiten durch 2 teilen).969

Ein anderes Beispiel ist die geometrische Reihe:970

2.5. REIHEN 33

Lemma 2.20. Sei q 6= 1. Dann gilt971

k∑n=0

qn =1− qk+1

1− q

Dies kann man mit vollstandiger Induktion beweisen (wenn Sie Induktionsbeweise uben wollen, ist das972

eine gute Gelegenheit). Wir beweisen es auf eine etwas elegantere Art (erinnern Sie sich, dass es fur eine973

Aussage mehrere Beweise geben kann).974

Beweis. Wir schreiben sk = q0 + q1 + . . .+ qk. Dann ist q · · ·k = q1 + q2 + . . .+ qk+1. Also975

sk − q · sk︸︷︷︸(1−q)sk

= q0 − qk+1,

und Division durch (1− q) auf beiden Seiten gibt das Ergebnis, da q0 = 1 gilt.976

Die Summen waren bislang alle endlich. Wir interessieren uns nun fur “unendliche Summen”, also Sum-977

men, die aus unendlich vielen Summanden bestehen. Die formale Definition folgt978

Definition 2.21. Gegeben eine Folge (an)n∈N, definiere die k-te Partialsumme als979

sk :=

k∑n=0

an.

Die entsprechende Reihe ist dann einfach die Folge der Partialsummen (sk)k∈N. Falls diese Reihe konver-980

giert, also limk→∞ sk = α, so schreiben wir auch981

α =

∞∑n=0

an.

Wir schreiben auch∑∞n=0 an =∞, falls (sk)k∈N nach ∞ divergiert.982

Es ist auch ublich, die Reihe selbst mit∑∞n=0 an zu bezeichnen. Dies ist ein wenig unsauber, aber983

erleichtert erheblich die Notation.984

Wir besprechen eine konkrete Anwendung, namlich das Paradoxon von Zenon. Stellen Sie sich vor,985

Achilles (ein Held der griechischen Mythologie und sozusagen ein Usain Bolt seiner Zeit) veranstaltet ein986

Wettrennen gegen eine Schildkrote. Er gewahrt der Schildkrote einen Vorsprung von einem Meter. Die987

Rennstrecke ist z.B. 100 Meter lang (spielt keine Rolle).988

Zenon argumentiert nun, dass Achilles das Rennen verlieren muss. Den in der Zeit, in der er zum989

Startpunkt der Schildkrote lauft, hat diese ja bereits ein Stuck der Strecke zuruckgelegt. Nun muss Achilles990

erstmal zum aktuellen Standort der Schildkrote laufen, aber in diesr Zeit hat diese wiederum ein Stuck991

zuruckgelegt, usw. Achilles kann die Schildkrote also niemals einholen.992

Eine andere Formulierung besagt, dass man von einer Pistolenkugel nicht getroffen werden kann, solange993

man von ihr weglauft. Diese “Fakten” entsprechen naturlich nicht der realen Welt, also wo ist der Fehler?994

Rechnen wir aus, welchen Vorsprung sich die Schildkrote im Laufe des Rennens herauslauft. Nehmen995

wir der Einfachheit halber an, Achilles lauft einen Meter pro Sekunde (das ist langsam, aber vereinfacht996

die Rechnung), und die Schildkrote lauft q Meter pro Sekunde mit q < 1. Nach einer Sekunde ist Achilles997

am Startpunkt der Schildkrote, und sie ist um q Meter nach vorne gekommen. Um q Meter zuruckzulegen,998

braucht Achilles q Sekunden. In dieser Zeit hat die Schildkrote q2 Meter zuruckgelegt. Im nachsten Schritt999

legt sie q3 Meter zuruck, und so weiter. Insgesamt betragt ihr gesammelter Vorsprung also genau 1 + q +1000

q2 + . . . =∑∞n=0 q

n. Die Argumentation von Zenon nimmt an, dass diese Reihe nach ∞ divergiert.1001

Schauen wir uns den Grenzwert an. Dank Lemma 2.20 wissen wir bereits, dass1002

k∑n=0

qn =1− qk+1

1− q


und daher1003

∞∑n=0

qn = limk→∞

k∑n=0

qn = limk→∞

1−

→0︷︸︸︷qk+1

1− q=

1

1− q

Also wird die Schildkrote nach 11−q Metern eingeholt. Machen Sie sich klar, dass dies sinnvoll ist, indem1004

Sie fur q sehr kleine Werte und Werte nahe bei 1 einsetzen.1005

Eine weitere Reihe, die sehr haufig auftaucht ist die harmonische Reihe1006

∞∑n=1

1

n= 1 +

1

2+

1

3+ . . .

Gilt hier ebenfalls, dass die Reihe einen endlichen Grenzwert hat? Wie sich herausstellt, ist die Antwortnein. Die Idee ist wie folgt

∞∑n=0

1

n= 1 +

1

2+

1

3+

1

4︸︷︷︸+1

5+

1

6+

1

7+

1

8︸︷︷︸+1

9+· · ·+ 1

16︸︷︷︸+1

17+· · ·+ 1

32︸︷︷︸+ . . .

≥ 1 +1

2+

1

4+

1

4︸︷︷︸12

+1

8+

1

8+

1

8+

1

8︸︷︷︸12

+1

16+· · ·+ 1

16︸︷︷︸12

+1

32+· · ·+ 1

32︸︷︷︸12

+ . . .

und wir sehen, dass wir unendlich viele Summanden der Große 12 erzeugen, also ist die Reihe nicht be-1007

schrankt.1008

Dagegen gilt∑∞n=1

1n2 <∞, und der Grenzwert ist recht erstaunlich (siehe Hausaufgabe 2.5.3).1009

Konvergenzkriteiren fur Reihen. Wie sieht man einer Reihe an, ob sie konvergiert oder nicht? Dafur1010

gibt es einige interessante Kriterien. Da Reihen aber im weiteren Verlauf nicht wirklich im Fokus stehen1011

werden, beschranken wir uns hier nur auf zwei dieser Kriterien.1012

Theorem 2.22. Wenn die Reihe∑∞n=0 an konvergiert, dann ist (an)n∈N eine Nullfolge.1013

Die Wichtigkeit des Beweises liegt wiederum in der Kontraposition: Wenn (an)n∈N nicht gegen 0 kon-1014

vergiert, dann divergiert die Reihe. Also kann man mit Hilfe des Theorem Nicht-Konvergenz zeigen. Als1015

Beispiel ist die Reihe∑∞n=0(−1)n divergent, denn ((−1)n)n∈N ist keine Nullfolge.1016

Beweis. Sei ε > 0. Setze1017

sk :=

k∑n=0

an.

Nach Voraussetzung konvergiert die Folge (sk)k∈N. Also ist die Folge auch eine Cauchyfolge. Also gibt es1018

ein k0 so dass fur alle k, ` ≥ k0 gilt1019

|s` − sk| < ε.

Das gilt dann insbesondere auch, wenn wir ` = k + 1 setzen. Setzen wir die Definition von sn ein, ergibt1020

sich fur alle k ≥ k01021

ε > |sk+1 − sk| =k+1∑n=0

an −k∑

n=0

an = ak+1 = |ak+1 − 0|

und das bedeutet, dass limk→∞ ak = 0.1022

Die Umkehrung des Satzes gilt nicht: Ist (an)n∈N eine Nullfolge heißt das nicht, dass∑∞n=0 an konvergiert.1023

Ein Gegenbeispiel ist an = 1n , wie wir oben gesehen haben.1024

Wir besprechen noch ein weiteres Kriterium, mit welchem man in vielen Fallen Konvergenz der Reihe1025

nachweisen kann.1026

2.5. REIHEN 35

Theorem 2.23 (Quotientenkriterium). Sei (an)n∈N eine Folge. Wenn es ein q < 1 und ein n0 ∈ N gibt,1027

so dass fur alle n ≥ n0 gilt1028 ∣∣∣∣an+1

an

∣∣∣∣ < q,

dann konvergiert∑∞n=0 an.1029

Beachten Sie: Die Aussage:”Es gibt ein q < 1, so dass bn < q fur alle n ≥ n0.“ ist starker als zu sagen:1030

”bn < 1 fur alle n ≥ n0.“. Es bedeutet namlich, dass bn (ab der Stelle n0) einen Abstand 1− q von 1 hat. In1031

der Tat wird die Aussage des Satzes falsch, wenn wir nur∣∣∣ anan+1

∣∣∣ < 1 fordern, wie man an der harmonischen1032

Reihe sieht.1033

Beweis. Wir setzen wiederum1034

sk :=

k∑n=0

an

und zeigen, dass (sk)k∈N eine Cauchyfolge ist (und somit auch konvergiert).1035

Sei ε > 0 und sei sk :=∑kn=0 an die k-te Partialsumme. Weil q < 1, haben wir qn

n→∞−−−−→ 0. Nun wahlen1036

wir n1 ≥ n0 so, dass fur alle n ≥ n1 gilt:1037

qn <ε

|an0 |(1− q)qn0 (2.1)

Nach Voraussetzung ist |an+1| < q|an| und damit1038

|an+i| < q|an+i−1| < q2|an+i−2| < . . . < qi|an| (2.2)

fur n ≥ n0 und i ≥ 1. Nun weisen wir die Cauchybedingung fur (sn)n∈N nach. Es gilt fur n ≥ m ≥ n1:

|sn − sm| = |am+1 + am+2 + . . .+ an|≤ |am+1|+ |am+2|+ . . .+ |an| (wegen Dreiecksungleichung)

≤ |am+1|+ q|am+1|+ . . .+ qn−m+1|am+1| (wegen (2.2))

= |am+1|(1 + q + q2 + . . .+ qn−(m+1))

< |am+1|∞∑k=0

qk

≤ 1

1− q|am+1|

≤ 1

1− q· qm+1−n0 |an0

| (wegen (2.2))

=|an0 |

(1− q)qn0qm+1 (Umformungen)

≤ |an0|

(1− q)qn0

ε

|an0 |(1− q)qn0 (wegen (2.1), da m+ 1 ≥ n1)

= ε

1039

Beachten Sie, dass das Quotientenkriterium zwar garantiert, dass die Reihe konvergiert, aber nichts uber1040

den Grenzwert der Reihe aussagt. Die Ruckrichtung gilt ausserdem nicht: Es gibt konvergente Reihen, fur1041

die |an+1

an| beliebig nahe an 1 herankommt, zum Beispiel

∑∞n=1

1n2 .1042

Wir schauen uns ein wichtiges Beispiel an. Wir definieren n! := 1 · 2 · . . . · n (gelesen: “n Fakultat”). Wir1043

setzen auch 0! := 1. Nun definiere fur x ∈ R beliebig1044

an :=xn

n!, sk :=

k∑n=0

an = 1 + x+x2

2+x3

6+x4

24+ . . .+

xk

k!


Fur welche x Konvergiert diese Reihe? Wir rechnen nach1045 ∣∣∣∣an+1

an

∣∣∣∣ =

∣∣∣∣∣∣xn+1

(n+1)!xn

n!

∣∣∣∣∣∣ =

∣∣∣∣ xn+1n!

xn(n+ 1)!

∣∣∣∣ =|x|n+ 1

<1

2

fur n ≥ d2|x|e. Also folgt nach dem Quotientenkriterium, dass die Reihe fur jedes x ∈ R konvergiert. Wir1046

definieren eine Abbildung1047

exp : R→ R, x 7→∞∑n=0

xn

n!

und nennen diese die Exponentialfunktion. Wir nennen1048

e := exp(1) =

∞∑n=0

1

n!

die Eulersche Zahl. Wie man durch numerische Berechnung der Partialsummen sehen kann, ist e ≈ 2.7183.1049

1050

Hausaufgabe 2.5.1. Berechnen Sie eine geschlossene Formel fur die arithmetische Summe1051

k∑n=1

(αn+ β)

mit α, β ∈ R, α ≥ 0 beliebig.1052

Hausaufgabe 2.5.2. Losen Sie das Paradoxon von Zenon wie folgt: Stellen Sie fur Achilles und die Schild-1053

krote Funktionen A(x), S(x) auf, welche die zuruckgelegte Wegstrecke zur Zeit x angeben. Berechnen Sie1054

den Schnittpunkt der beiden Funktionsgraphen.1055

Hausaufgabe 2.5.3. Berechnen Sie fur die die Folge1056

sk :=

√√√√6

k∑n=1

1

n2

einige Folgenglieder mit einem Taschenrechner (etwa bis k = 100 ware gut, oder so weit wie Sie kommen).1057

Was sehen Sie? Leiten Sie daraus eine Vermutung fur den Wert von∑∞n=1

1n2 ab.1058

Hausaufgabe 2.5.4. Beweisen Sie, dass die Reihe1059

∞∑n=1

1

n(n+ 1)

gegen 1 konvergiert. Betrachten Sie dafur die k-te Partialsumme und versuchen Sie, fur diese eine geschlos-1060

sene Formel zu beweisen (es hilft, die ersten paar Partialsummen von Hand nachzurechnen, um eine Idee1061

zu bekommen).1062

Hausaufgabe 2.5.5. Zeigen Sie, dass die Zahl q < 1 im Quotientenkriterium nicht durch q = 1 ersetzt1063

werden kann: Sei (an)n∈N eine Folge. Wenn es ein n0 ∈ N gibt, so dass fur alle n ≥ n0 die Ungleichung1064 ∣∣∣an+1

an

∣∣∣ < 1 gilt, dann muss∑∞n=0 an nicht unbedingt konvergieren.1065

Hausaufgabe 2.5.6. Das Majorantenkriterium lautet:”

Wenn an ≥ bn ≥ 0 fur alle n und∑∞n=1 an1066

konvergiert, dann konvergiert auch∑∞n=1 bn.“1067

Uberlegen Sie sich, wie aus Hausaufgabe 2.5.4 und dem Majorantenkriterium folgt, dass∑∞n=1

1n2 kon-1068

vergiert.1069

2.6. GRENZWERTE VON ABBILDUNGEN 37

Abbildung 2.3: Von links nach rechts:f : R→ R, x 7→ |x|f : R→ R, x 7→ dxef : [0,∞]→ R, x 7→

√x

f : R→ R, x 7→ exp(x)

2.6 Grenzwerte von Abbildungen1070

In der Folge betrachten wir einen beliebigen Definitionsbereich D ⊆ R und eine Abbildung1071

f : D → R

Einige Beispiele fur Abbildungen, die wir im Folgenden betrachten werden, sind in Abbildung 2.3 als1072

Funktionsgraphen angegeben. Wir besprechen noch andere Abbildungen.1073

Ein Polynom p(x) ist ein Ausdruck der Form1074

p(x) = anxn + an−1x

n−1 + . . .+ a1x+ a0

mit a0, . . . , an ∈ R und an 6= 0. Hierbei nennen wir n den Grad des Polynoms und schreiben auch n = deg(p).1075

Ein Polynom definiert eine Abbildung R → R, die wir auch mit p bezeichnen. Fur x0 ∈ R ist p(x0) einfach1076

der Wert, den wir erhalten wenn wir x0 in das Polynom einsetzen.1077

Eine rationale Funktion hat die Form1078

f : D → R, x 7→ p(x)

q(x)

wobei p und q Polynome und D := {x ∈ R | q(x) 6= 0} (q(x) = 0 geht nicht, sonst wurden wir ja durch 01079

teilen). Zum Beispiel ist die rationale Funktion1080

f(x) =x+ 1

x2 − 3x+ 2

definiert fur D = R \ {1, 2}.1081

Es gibt auch Abbildungen, die sich nicht so einfach zeichnen lassen wie die Beispiel oben. Betrachte zum1082

Beispiel die Abbildung1083

f : R→ R, x 7→

{0 x ∈ Q

1 x ∈ R \ Q

Was ist der Graph dieser Funktion?1084

Fur eine Abbildung f : D → R und y = f(x) bezeichnen wir x als das Argument der Funktion und1085

y als den Funktionswert (manchmal nennen wir das Argument auch einfach x-Wert). Wir mochten nun1086

untersuchen, wie sich die Abbildung verhalt, wenn wir das Argument gegen einen bestimmten Wert x01087

laufen lassen (das heisst, das Argument nahert sich diesem x0 immer weiter an). Dabei muss die Funktion1088

nicht zwingend fur x0 definiert sein! Wir definieren dies gleich normal, aber schauen zunachst an, was in1089

Beispielen sinnvoll ware (diese Beispiele sind rein intuitiv zu verstehen, da die Begriffe noch nicht definiert1090

sind):1091

Betrachten wir f(x) = |x| und x0 = 0. Anhand des Funktionsgraphen beobachten wir: die Funktionwerte1092

von f nahern sich 0 an, wenn das Argument gegen 0 geht. Also”geht f(x) gegen 0 fur x gegen 0“.1093


Im Fall f(x) = dxe und x0 = 2 sehen wir ein anderes Verhalten: Wenn wir uns x0 von links nahern, ist1094

f(x) immer gleich 2 (und geht damit auch gegen 2). Wenn wir aber von rechts kommen, ist f(x) = 3, egal1095

wie nah wir mit dem Argument an x0 heranrucken (solange der Abstand > 0 ist). Hier geht die Funktion1096

also nicht gegen einen eindeutigen Wert fur x gegen 2.1097

Wie erwahnt ist das Konzept auch sinnvoll, wenn x0 nicht in D liegt. Zum Beispiel geht f(x) = 1x2 gegen1098

unendlich fur x gegen x0 = 0, denn der Funktionswert wird immer grosser, je naher wir an x = 0 kommen1099

(egal ob von rechts oder von links).1100

Die Funktion f(x) =√x geht fur x0 = 0, wie wir am Funktionsgraphen sehen konnen. Hier ist zu1101

beachten, dass wir uns x0 nur von rechts annahern konnen, da die Funktion ja links von 0 nicht definiert1102

ist. Wir konnen auch sehen, dass die Frage”Gegen was geht f(x) fur x0 = −1?“ nicht sinnvoll ist, denn wir1103

konnen uns −1 gar nicht annahern, ohne den Definitionsbereich zu verlassen.1104

Wir konnen fur x0 auch +∞ oder −∞ einsetzen. Zum Beispiel ist fur f(x) = 1x klar, dass f(x) gegen 01105

geht wenn x nach +∞ (oder auch −∞) geht.1106

Nach all diesen Vorbetrachtungen geht es nun zur Definition. Zunachst mussen wir definieren, gegen1107

welche x0 eine Abbildung f : D → R sinnvoll laufen kann. Dazu nennen wir x ∈ R einen Beruhrpunkt von1108

D, wenn es eine Folge (an)n∈N mit Folgegliedern in D gibt, die gegen x konvergiert. Wir erlauben auch −∞1109

und +∞ als (uneigentliche) Beruhrpunkte (dann muss es eine Folge in D geben die gegen +∞ bzw. −∞1110

divergiert). Beachten Sie, dass es nur von D abhangt, ob ein Punkt ein Beruhrpunkt ist oder nicht.1111

Jedes x ∈ D ist auch ein Beruhrpunkt von D, denn die konstante Folge x konvergiert gegen x. Hier sind1112

einige andere Beispiele:1113

• D = (−1,+1) \ {0} hat die Beruhrpunkte D ∪ {−1, 0,+1} = [−1,+1]1114

• D = R hat Beruhrpunkte R ∪ {−∞,+∞}1115

• D = Q hat die Beruhrpunkte R ∪ {−∞,+∞}1116

Nun folgt die Definition der Konvergenz fur Funktionen:1117

Definition 2.24. Sei f : D → R und x0 ein Beruhrpunkt von D. Wir schreiben1118

limx→x0

f(x) = c

falls fur jede Folge (an)n∈N mit Folgegliedern in D und limn→∞ an = x0 gilt, dass1119

limn→∞

f(an) = c.

Ist x0 = ±∞, betrachten wir alle Folgen in D die nach x0 divergieren. Auch c = ±∞ ist erlaubt, was1120

bedeutet, dass alle Folgen (f(an))n∈N nach ±∞ divergieren.1121

limx→x0f(x) = c bedeutet anschaulich, dass f gegen c geht wenn x gegen x0 geht: Egal, wie wir uns x01122

annahern (d.h., eine Folge mit Grenzwert x0 definieren), die entsprechenden Funktionswerte (d.h., f(an))1123

sollen immer gegen den gleichen Wert c gehen.1124

Wir schauen uns einige Beispiele an, die belegen, dass die Definition wirklich unsere Anschauung wider-1125

spiegelt:1126

• limx→0 |x| = 0,1127

denn fur jede Nullfolge (an)n∈N ist auch |an| eine Nullfolge.1128

• limx→2dxe existiert nicht,1129

denn z.B. definiert an = 2− 1n und bn = 2 + 1

n zwei Folgen, die beide gegen 2 konvergieren. Nun ist

d2− 1

ne = 2, also lim

n→∞d2− 1

ne = 2

d2 +1

ne = 3, also lim

n→∞d2 +

1

ne = 3

Somit gibt es zwei Folgen (in D), die gegen 2 konvergieren, aber die entsprechenden Folgen der Funktions-1130

werte konvergieren gegen verschiedene Werte.1131

2.6. GRENZWERTE VON ABBILDUNGEN 39

• Fur ein Polynom p(x) = xn + an−1xn−1 + . . .+ a1X + a0 gilt

limx→∞

p(x) = +∞

limx→−∞

p(x) =

{+∞ n gerade

−∞ n ungerade

Den Beweis lassen wir weg, aber man sollte sich diese Tatsache mit Hilfe von Beispielen klarmachen (z.B.1132

f(x) = x2, g(x) = x3).1133

• limx→0 exp(x) = 1.1134

Beweis. Erinnern Sie sich, dass exp(x) =∑∞n=0

xn

n! . Es ist aus der Definition klar, dass exp(0) = 1 gilt. Aus1135

dem Funktionsgraph (Abbildung 2.3) ist die Aussage auch anschaulich klar. Wir weisen es dennoch formal1136

nach:1137

Sei ε > 0. Wir mussen zeigen, dass es fur jede Nullfolge (xn)n∈N ein n0 ∈ N gibt, so dass1138

| exp(xn)− 1| < ε

fur alle n ≥ n0. Da xnn→∞−−−−→ 0, gibt es ein n0 so dass |xn| ≤ min{ 1

2 ,ε2} fur alle n ≥ n0. Beachten Sie, dass,1139

xknk!≤ |xn|

k

k!≤ |xn|k,

also auch1140

exp(xn) =

∞∑k=0

xknk!≤∞∑k=0

|xn|k =1

1− |xn|.

Damit beweisen wir die Aussage, denn fur |xn| < 12 gilt, dass1141

| exp(xn)− 1| ≤ 1

1− |xn|− 1 =

|xn|1− |xn|︸︷︷︸≥ 1

2

≤ 2|xn| ≤ ε

wobei die letzte Aussage folgt, da nach Wahl von n gilt, dass |xn| ≤ ε2 .1142

Wir sehen: auch diese Grenzwerte “von Hand” auszurechenen, ist ein muhsames Unterfangen. Zum1143

Gluck gibt es auch hier Rechenregeln, die das Leben erleichtern. Zunachst beoachten wir, dass fur zwei1144

Abbildungen f, g : D → R immer auch eine Abbildung f + g : D → R existiert, die definiert ist durch1145

(f + g)(x) = f(x) + g(x). Ebenso gibt es Abbildungen fg und fg , wobei der Definitionsbereich der letzteren1146

durch D \ {x | g(x) = 0} gegeben ist.1147

Theorem 2.25. Ist limx→x0 f(x) = α und limx→x0 g(x) = β, dann ist1148

• limx→x0(f + g)(x) = α+ β,1149

• limx→x0(f · g)(x) = α · β,1150

• Ist β 6= 0, so ist auch limx→x0

fg (x) = α

β .1151

Beweis. Dies folgt sofort aus den entsprechenden Aussagen uber Folgen (Theorem 2.13). Wir skizzieren den1152

Fall der Addition:1153

Fixiere eine Folge (an)n∈N, die gegen x0 konvergiert. Da limx→x0 f(x) = α und limx→x0 g(x) = β, folgt1154

damit f(an)n→∞−−−−→ α und g(an)

n→∞−−−−→ β. Nach Theorem 2.13 ist (f + g)(an) = f(an) + g(an)n→∞−−−−→ α+ β.1155

Da (an)n∈N als beliebige Folge gewahlt ist, gilt also auch limx→x0(f + g)(x) = α+ β.1156


Als Beispiel konnen wir Grenzwerte von rationalen Funktionen einfach berechnen:1157

limx→∞

x− 1

2− x= limx→∞

1− 1x

2x − 1

Da limx→∞1x = 0, konnen wir nun das Theorem wiederholt anwenden und erhalten1158

limx→∞

x− 1

2− x=

1− 0

0− 1= −1

1159

Hausaufgabe 2.6.1. Bestimmen Sie alle Beruhrpunkte der Mengen R \ Z, Z, R \ Q1160

Hausaufgabe 2.6.2. Zeigen Sie: Ist ann→∞−−−−→ 0, ist auch |an|

n→∞−−−−→ 0. Stimmt auch die Ruckrichtung?1161

Hausaufgabe 2.6.3. Fuhren Sie den Beweis von Theorem 2.25 fur die Multiplikation.1162

Hausaufgabe 2.6.4. Der Grenzwert einer Funktion in einem Punkt a kann manchmal nicht existieren, aber1163

dafur kann dieser einen linksseitigen und rechtsseitigen Grenzwert besitzen; das heißt, einen verschiedenen1164

Grenzwert, je nachdem ob man sich ihm von links oder rechts nahert. Ein Beispiel ist:1165

limx→0x>0

1

x= +∞, wahrend lim

x→0x<0

1

x= −∞ obwohl es lim

x→0x∈R\{0}

1

xnicht gibt.

Berechnen Sie die Grenzwerte:1166

limx→0x≥0

bxc, und limx→0x<0

bxc.

Was ist mit limx→0x≤0bxc?1167

Hausaufgabe 2.6.5. Ahnlich wie in Aufgabe 2.6.4, untersuchen Sie das Verhalten der Funktionen1168

f(x) =1

(x− 1)2, g(x) =

1

x2 − 1, h(x) =

x− 1

x2 − 1

fur x→ 1.1169

Hausaufgabe 2.6.6. Berechnen Sie:1170

(α) limx→∞

4x2 − 7x+ 3 (β) limx→∞

x3 − 2x+ 10

5x3 + 3x− 2(γ) lim

x→∞

√x2 + 6x+ 1− x.

Hausaufgabe 2.6.7. Beweisen Sie: Ist die Menge M 6= ∅ und beschrankt, dann sind inf M und supM1171

Beruhrpunkte von M (Bonus: Zeigen Sie dies auch, falls inf M = −∞, also wenn M nicht nach unten1172

beschrankt ist, gilt).1173

2.7 Stetigkeit1174

Wir kommen nun zu einem weiteren zentralen Begriff der Analysis. Stetigkeit einer Abbildung f : R → R1175

bedeutet intuitiv die folgenden Dinge:1176

• Die Funktion “springt nicht”.1177

• Man kann den Funktionsgraph mit einem Stift ohne abzusetzen zeichnen.1178

• Wenn man den x-Wert nur “ein bisschen” andert, andert sich auch f(x) nur “ein bisschen”.1179

2.7. STETIGKEIT 41

Wenn wir den Definitionsbereich der Abbildung einschranken (z.B. auf ein Intervall), konnen wir diese1180

Eigenschaften auch lokal in diesem eingeschranktem Bereich betrachten. Dann sprechen wir von lokaler1181

Stetigkeit.1182

Schauen wir uns die Bespiele von oben an, so sehen wir, dass die Abbildungen f(x) = |x|, f(x) =√x,1183

f(x) = exp(x) auf ihrem Definitionsbereich ohne Sprunge verlaufen, also intuitiv stetig sein sollten. Ferner1184

ist die Funktion f(x) = dxe nicht stetig, weil sie an ganzen Zahlen springt. Allerdings ist sie innerhalb1185

eines Intervalls (z, z+ 1) mit z ∈ Z wenigstens lokal stetig. Dagegen springt die Funktion, welche rationalen1186

Zahlen 0 und irrationalen Zahlen 1 zuordnet, an jedem Punkt ist daher auch lokal nicht stetig.1187

Definition 2.26. Sei f : D → R und x0 ∈ D. Wir nennen f stetig in x0, wenn gilt1188

limx→x0

f(x) = f(x0).

Ist D′ ⊆ D, so nennen wir f stetig auf D′, falls f in jedem x0 ∈ D′ stetig ist. Wir nennen f einfach nur1189

stetig, wenn es auf D stetig ist.1190

Anstatt zu fordern, dass limx→x0f(x) = f(x0) gilt, wurde es auch reichen zu fordern, dass limx→x0

f(x)1191

existiert: Dann muss der Grenzwert schon gleich f(x0) sein, da ja fur die konstante Folge an = x0 die Folge1192

(f(an))n∈N gegen f(x0) konvergiert.1193

Schauen wir uns einige Beispiele an:1194

• Die konstante Abbildung f(x) = c ist uber ganz R stetig.1195

• Die Abbildung f(x) = x ist stetig, denn es gilt fur jedes x0 ∈ R1196

limx→x0

f(x) = limx→x0

x = x0 = f(x0)

• Die Abbildung1197

sgn : R→ R, x 7→

+1 x > 0

0 x = 0

−1 x < 0

ist nicht stetig in 0, denn es gilt zum Beispiel1198

limn→∞

sgn(1

n) = lim

n→∞1 = 1, lim

n→∞sgn(− 1

n) = lim

n→∞−1 = −1

und die Folgen ( 1n )n∈N und (− 1

n )n∈N konvergieren beide gegen 0, also existiert limx→0 sgn(x) nicht.1199

Allerdings ist sgn in jedem anderen Punkt stetig (Beweis lassen wir weg).1200

• Die Funktion1201

f(x) =

{0 x ∈ Q

1 x ∈ R \ Q

ist in keinem x0 ∈ R stetig, denn es gibt fur jedes x0 ∈ R sowohl eine rationale Folge, als auch eine1202

irrationale Folge, die gegen x0 konvergiert, und diese liefern verschiedene Grenzwerte, wenn man f1203

anwendet.1204

Beachten Sie, dass die Aussage”Stetige Funktionen springen nicht“ sehr stark vereinfachend ist. Zum1205

Beispiel ist die Funktion f(x) = 1x auf ihrem gesamten Definitionsbereich R\{0} stetig, “springt” allerdings1206

an der Stelle 0 von −∞ nach +∞.1207

Auch fur stetige Funktionen gibt es einige Eigenschaften, die die Arbeit erleichtern:1208

Theorem 2.27. Sind f und g stetig in x0 ∈ R, so sind auch die Abbildungen f + g und fg stetig in x0. Ist1209

g(x0) 6= 0, ist auch fg stetig in x0.1210

Beweis. Das ist eine direkte Konsequenz aus Theorem 2.25 (Hausaufgabe).1211


Aus diesem Theorem folgt sofort:1212

Korollar 2.28. Jede rationale Funktion ist auf ihrem Definitionsbereich stetig.1213

Der Grund ist, dass jede rationale Funktion durch Addition, Multiplikation und Division von konstanten1214

Funktionen und der Funktion f(x) = x gebildet werden kann, und wir haben bereits gezeigt, dass diese1215

Funktionen stetig sind.1216

Man betrachtet oft auch stuckweise rationale Funktionen, unter welchen wir Abbildungen verstehen, die1217

auf Intervallen im Definitionsbereich rational sind. Also zum Beispiel1218

f(x) =

x2 + 1 x ≥ 1

6x− 4 −2 ≤ x < 13x−2x2+1 x < −2

Diese Abbildung ist auf ganz R definiert. Es ist nicht schwer zu erkennen, dass die Funktion innerhalb eines1219

Abschnitts stetig ist (das folgt aus dem Korollar oben). Es bleiben die Nahtstellen −2 und 1 zu untersuchen.1220

Wir erkennen, dass f(−2) = −16, allerdings ist der Grenzwert von f(x) gleich − 85 , wenn wir uns −2 von1221

links kommend annahern. Also ist die Funktion nicht stetig in −2. Fur x = 1 dagegen sehen wir, dass der1222

Grenzwert von f(x) 2 ist, egal ob wir von links oder von rechts kommen. Also ist die Abbildung stetig in 1.1223

Das Prinzip von oben ubertragt sich auf jede stuckweise rationale Funktion: Diese sind immer stetig1224

im Defintionsbereich ausserhalb der Nahtstellen. Die Nahtstellen mussen einzeln untersucht werden. Die1225

Abbildung ist stetig in der Nahtstelle x0 genau dann, wenn die beiden rationalen Funktionen links und1226

rechts von x0 den gleichen Grenzwert in x0 haben. Wir beweisen diese Aussagen nicht.1227

Erinnern Sie sich an die Komposition zweier Funktionen (f ◦ g)(x) = f(g(x))? Wir geben einen wichtige1228

Eigenschaft ohne Beweis an:1229

Theorem 2.29. Ist g stetig in x0 und f stetig in f(x0). Dann ist f ◦ g stetig in x0.1230

Als Konsequenz gilt dann auch, dass wenn f stetig (auf R) und g stetig (auf R) ist, dann sind auch f ◦ g1231

und g ◦ f stetige Funktionen. Wir werden dies spater ausnutzen.1232

Nun kommen wir noch zu einer alternativen Charakterisierung von Stetigkeit. Diese hat den “Vorteil”,1233

dass sie ohne den Begriff eines Grenzwertes auskommt. Ferner druckt sie die Intuition, dass sich die Funktion1234

nur ein bisschen andert, wenn sich das Argument ein bisschen andert, etwas direkter aus. Besonders “einfach”1235

ist sie aber auch nicht:1236

Theorem 2.30 (ε-δ-Kriterium fur Stetigkeit). Sei f : D → R. Dann ist f stetig in x0 genau dann, wenn1237

∀ε > 0 ∃δ > 0 ∀x ∈ D : |x− x0| < δ ⇒ |f(x)− f(x0)| < ε.

Eine Aussage der Form”A genau dann, wenn B“ bzw.

”A⇔ B“ kann man beweisen, indem man zeigt,1238

dass”A ⇒ B“ und auch

”B ⇒ A“ gilt. Man kann auch stattdessen zeigen, dass

”A ⇒ B“ und auch1239

”¬A ⇒ ¬B“ gilt (das ist die Kontraposition der Aussage

”B ⇒ A“). In beiden Fallen besteht der Beweis1240

aus zwei Teilen, die auch klar voneinander abgegrenzt sein sollten.1241

Beweis. Wir zeigen zunachst: Ist das ε-δ-Kriterium fur x0 erfullt, dann ist f stetig in x0:1242

Sei (xn)n∈N eine beliebige Folge in D mit Grenzwert x0. Wir mussen zeigen, dass limn→∞ f(xn) = f(x0).1243

Daraus folgt dann namlich, dass limx→x0 f(x) = f(x0), was nichts anderes bedeutet als dass f stetig in x01244

ist.1245

Sei ε > 0 beliebig. Nach dem ε-δ-Kriterium gibt es ein δ > 0, so dass fur alle x ∈ D mit |x−x0| < δ gilt,1246

dass |f(x)− f(x0)| < ε. Da xn gegen x0 konvergiert, gibt es ein n0 ∈ N, so dass fur alle n ≥ n0 gilt1247

|xn − x0| < δ

Also gilt auch |f(xn)− f(x0)| < ε fur alle n ≥ n0, und somit f(xn)n→∞−−−−→ f(x0).1248

Nun zeigen wir: Ist das ε-δ-Kriterium nicht erfullt in x0, ist auch f nicht stetig in x0.1249

2.8. EIGENSCHAFTEN STETIGER ABBILDUNGEN 43

Wenn das ε-δ-Kriterium in x0 nicht erfullt ist, gibt es ein ε, so dass wir fur alle δ > 0 ein x ∈ D finden,1250

so dass zwar |x− x0| < δ, aber |f(x)− f(x0)| ≥ ε.1251

Nun basteln wir uns eine Folge (an)n∈N wie folgt: Wir definieren an als ein Element in D, so dass1252

|an − x0| < 1n , aber |f(an)− f(x0)| ≥ ε; ein solches an existiert nach Vorraussetzung, da wir δ = 1

n setzen1253

konnen. Nun konvergiert die Folge (an)n∈N gegen x0, aber (f(an))n∈N konvergiert nicht gegen f(x0), da1254

jedes Folgenglied mindestens ε von f(x0) entfernt liegt. Also gilt nicht, dass limx→x0f(x) = f(x0), also ist1255

f nicht stetig in x0.1256

1257

Hausaufgabe 2.7.1. Beweisen Sie den ersten Teil von Theorem 2.27 (Addition).1258

Hausaufgabe 2.7.2. Geben Sie fur die Funktion1259

f(x) =

x x > 3

4x− 7 2 ≤ x ≤ 3

x2 0 < x < 2x−2x2−1 x ≤ 0

den Definitionsbereich an und untersuchen Sie die Funktion auf Stetigkeit.1260

Hausaufgabe 2.7.3. Seien f : D → R, g : D → R Abbildungen und x0 ∈ D. Sei ferner g stetig in x0.1261

a. Geben Sie ein Beispiel an, so dass f(x0) = g(x0), aber f nicht stetig in x0 ist.1262

b. Zeigen Sie: Gibt es ein ε > 0, so dass f(x) = g(x) fur alle x ∈ D mit |x − x0| < ε, dann ist auch f1263

stetig in x0.1264

Hausaufgabe 2.7.4. Bestimmen Sie alle Werte von a, b ∈ R, fur die die Funktion ha,b : R→ R,1265

x 7→

{5x3 + a x ≥ 1,

bx− 4 x < 1

stetig ist.1266

2.8 Eigenschaften stetiger Abbildungen1267

Zwischenwertsatz. Betrachten Sie eine stetige Abbildung f : [0, 1]→ R mit f(0) = 1 und f(1) = 3. Nun1268

ist es intuitiv klar, dass die Abbildung irgendwo zwischen 0 und 1 den Funktionswert 2 annehmen muss. In1269

der Tat mussen wir den Funktionsgraphen zeichnen konnen, ohne den Stift abzusetzen, und wir mussen die1270

horizontale Linie y = 2 irgendwann (mindestens) einmal uberschreiten. Der folgende Satz druckt diese Idee1271

allgemein aus.1272

Theorem 2.31 (Zwischenwertsatz). Sei f : [a, b]→ R stetig. Sei c ∈ R, so dass1273 {f(a) ≤ c ≤ f(b) falls f(a) ≤ f(b)

f(a) ≥ c ≥ f(b) falls f(a) > f(b).

Dann gibt es ein ξ ∈ [a, b], so dass f(ξ) = c.1274

Wir nennen ein solches ξ auch eine c-Stelle von f .1275

Beweis. Wir nehmen an, dass f(a) ≤ f(b) gilt (der andere Fall geht genauso). Wir konstruieren ein ξ wie1276

gewunscht. Dazu definieren wir zwei Folgen (an)n∈N und (bn)n∈N wie folgt: Wir setzen a0 := a und b0 := b.1277

Nun konstruieren wir aj und bj fur j ≥ 1 induktiv, d.h. wir nehmen an, dass wir aj−1 und bj−1 schon1278


konstruiert haben und definieren daraus aj und bj wie folgt. Zunachst betrachten wir mj−1 :=aj−1+bj−1

2 .1279

Geometrisch ist dies der Mittelpunkt der Strecke von aj−1 nach bj−1. Ist f(mj−1) ≤ c, setzen wir aj := mj−11280

und bj := bj−1. Ist f(mj−1) > c, setzen wir aj := aj−1 und bj := mj .1281

Wir unterbrechen den Beweis und geben eine Erklarung der Konstruktion: Anschaulich ist es nach1282

Voraussetzung klar, dass ein solches ξ existieren muss. Indem wir in der Mitte des Intervalls nachschauen,1283

konnen wir immer fur eine Halfte des Intervalls sicherstellen, dass dort mindestens eine c-Stelle enthalten ist:1284

Ist z.B. f(a) < c und f(m) > c (wobei m der Mittelpunkt des Intervalls [a, b] ist), dann ist (intuitiv) klar,1285

dass im Intervall [a,m] eine c-Stelle enthalten sein muss. (Naturlich konnen auch im Intervall [m, b] c-Stellen1286

enthalten sein.) Die Konstruktion definiert Intervalls [aj , bj ], die alle mindestens eine c-Stelle enthalten,1287

wobei jedes Interval genauso halb so großist wie das vorherige Intervall. Anschaulich approximieren wir die1288

c-Stelle also beliebig genau mit diesen Verfahren. Dies zeigen wir nun formal.1289

Die Folge (an)n∈N ist monoton steigend und beschrankt (z.B. durch b), also konvergiert sie gegen einen1290

Grenzwert α. Das gleiche gilt fur (bn)n∈N mit Grenzwert β. Nun mussen diese beiden Grenzwerte gleich1291

sein: α ≤ β ist klar, da an < bn fur alle n gilt, und ware α < β, dann gabe es zwischen an und bn immer1292

einen Mindestabstand |β−α|, aber nach Konstruktion ist |bn−an| = |b−a|2n

n→∞−−−−→ 0. Nennen wir ξ := α = β1293

diesen gemeinsamen Grenzwert. Nun gilt einerseits, wegen Stetigkeit von f1294

f(ξ) = limx→ξ

f(x) = limn→∞

f(an) ≤ c,

wobei die letzte Ungleichung gilt, da nach Konstruktion f(an) ≤ c fur alle n gilt. Genauso gilt1295

f(ξ) = limx→ξ

f(x) = limn→∞

f(bn) ≥ c.

Also ist f(ξ) ≤ c und f(ξ) ≥ c und damit f(ξ) = c.1296

Wir besprechen zwei wichtige Folgerungen aus dem Zwischenwertsatz. Wir nennen eine Funktion f :1297

D → R monoton wachsend (bzw. fallend), wenn fur a < b gilt, dass f(a) ≤ f(b) (bzw. f(a) ≥ f(b)). Wir1298

nennen f streng mononton wachsend (bzw. fallend), wenn fur a < b gilt, dass f(a) < f(b) (bzw. f(a) > f(b)).1299

Theorem 2.32 (Umkehrfunktionssatz). Ist f : [a, b] → R stetig und streng monoton wachsend, dann gibt1300

es eine stetige, streng monoton wachsende Abbildung1301

f−1 : [f(a), f(b)]→ R,

so dass gilt f−1(f(x)) = x fur alle x ∈ [a, b] und f(f−1(y)) = y fur alle y ∈ [f(a), f(b)].1302

Beachten Sie, dass streng monotone Funktionen immer injektiv sind (egal ob stetig oder nicht). Schranken1303

wir also eine fur eine solche Funktion den Wertbereich ein, ist sie immer umkehrbar. Der Umkehrfunktions-1304

satz sagt aus, dass fur stetige Funktionen der Wertebereich immer genau gleich dem Intervall [f(a), f(b)]1305

ist, also alle Werte im Intervall angenommen werden, und dass diese Funktion uberdies auch stetig ist.1306

Beweis. Nach dem Zwischenwertsatz gibt es fur y ∈ [f(a), f(b)] ein ξ ∈ [a, b] mit f(ξ) = y. Da f streng1307

monoton ist, ist ξ eindeutig bestimmt. Wir definieren f−1(y) := ξ. Es ist dann klar, dass f(f−1(y)) = y1308

und f(f−1(x)) = x gilt.1309

f−1 ist streng monoton wachsend, denn fur y < y′ in [f(a), f(b)] finden wir x, x′ ∈ [a, b] mit f(x) = y,1310

f(x′) = y′. Somit ist f−1(y) = x und f−1(y′) = x′, und es ist nur zu zeigen, dass x < x′ gilt. Ware dem1311

nicht so, z.B. x > x′, dann ist auch f(x) > f(x′), da f streng monoton ist, ein Widerspruch.1312

Fur den Beweis der Stetigkeit von f−1 wenden wir das ε-δ-Kriterium an. Wir fixieren ein y0 ∈ [f(a), f(b)].1313

Wir zeigen hier nur den Fall, dass y0 im Innern des Intervals liegt. Die Spezialfalle y0 = f(a) und y0 = f(b)1314

gehen ahnlich.1315

Nach dem oben gezeigtem ist y0 = f(x0) fur ein x0 ∈ [a, b]. Sei ε > 0. Wir mussen zeigen, dass es ein1316

δ > 0 gibt, so dass fur alle y = f(x) ∈ [f(a), f(b)]:1317

|y − y0| < δ ⇒ |f−1(y)− f−1(y0)| < ε

oder aquivalent1318

|f(x)− f(x0)| < δ ⇒ |x− x0| < ε.


Setze1319

x1 :=

{x0 − ε falls x0 − ε ∈ [a, b]

a sonst, x2 :=

{x0 + ε falls x0 + ε ∈ [a, b]

b sonst

Wegen der Monotonie ist f(x1) < f(x0) < f(x2) (es sind beide Ungleichungen strikt, da y0 im Innern von1320

[f(a), f(b)] liegt. Wir finden also ein δ > 0, so dass [f(x0)− δ, f(x0) + δ] komplett im Intervall [f(x1), f(x2)]1321

liegt. Wahlen wir also ein Element x ∈ [a, b], so dass |f(x)−f(x0)| < δ, dann ist f(x) ∈ [f(x0)−δ, f(x0)+δ].1322

Also ist f(x) ∈ [f(x1), f(x2)], und damit x ∈ [x1, x2], da f−1 streng monoton ist. Nach Wahl von x1 und1323

x2 ist also |x− x0| < ε, was die Stetigkeit beweist.1324

Hier ist ein wichtiges Beispiel: Die Abbildung f(x) = x2 ist im Intervall [0, b] mit b > 0 streng monoton1325

wachsend und stetig. Sie hat also eine stetige Umkehrfunktion, die wir mit√x bezeichnen. Da dies fur jedes1326

b > 0 gilt, ist√x auf [0,∞) definiert.1327

Eine weitere Anwendung des Zwischenwertsatzes: Ein Polynom1328

p(x) = xn + an−1xn−1 + . . .+ a1x+ a0

hat eine Nullstelle, wenn n ungerade ist. Das folgt sofort aus der Tatsache, dass limx→∞ p(x) = +∞ und1329

limx→−∞ p(x) = −∞ (weil n ungerade ist), also gibt es sicherlich ein b > 0, so dass p(b) > 0 und ein a < 0,1330

so dass p(a) < 0 ist. Nach dem Zwischenwertsatz gibt es also ein ξ ∈ [a, b], so dass p(ξ) = 0 gilt.1331

Beachten Sie, dass der Beweis des Zwischenwertsatzes nicht nur zeigt, dass es eine Nullstelle gibt, sondern1332

auch ein Verfahren liefert, wie man eine solche Nullstelle finden kann (mit einer beliebigen Genauigkeit)1333

Man sagt dazu auch konstruktiver Beweis.1334

Als Beispiel finden wir eine Nullstelle des Polynoms1335

p(x) = x5 − 7x2 + 3x− 2

Zunachst finden wir (durch Probieren) a und b, so dass p(a) < 0 ist und p(b) > 0 ist. Wir konnen nachrech-1336

nen, dass p(0) = −2 und p(2) = 32− 28 + 6− 2 = 8 > 0 ist, also liegt in [0, 2] eine Nullstelle.1337

Da p(1) = 1− 7 + 3− 2 = −5 < 0, liegt eine Nullstelle in [1, 2].1338

Da p(1.5) = −5.65 < 0, liegt eine Nullstelle in [1.5, 2].1339

Da p(1.75) = −1.77 . . ., liegt eine Nullstelle in [1.75, 2].1340

Da p(1.875) = 2.18 . . ., liegt eine Nullstelle in [1.75, 1.875]1341

Mit genugend vielen weiteren Iterationen konnen wir das Intervall beliebig klein machen.1342

Satz vom Minimum und Maximum. Wir haben im letzten Abschnitt von konstruktiven Beweisen1343

gesprochen. Die Frage stellt sich, ob es auch nicht-konstruktive Beweise gibt, die zwar die Existenz eines1344

Objekts zeigen, aber kein Verfahren angeben, wie ein solches Objekt zu finden ist. Wir lernen dafur nun ein1345

Beispiel kennen.1346

Eine Folge (bn)n∈N ist eine Teilfolge von (an)n∈N, wenn es Indices i1 < i2 < i3 < . . . gibt, so dass fur1347

alle n ∈ N bn = ain gilt.1348

Anschaulich erhalten wir eine Teilfolge von (an)n∈N, indem wir bei einem beliebigen Folgenglied von1349

(an)n∈N starten (mit Index i1) und das nachste Folgenglied erhalten, in dem wir beliebig viele Elemente1350

der Folge uberspringen (das ist die Differenz i1 − i0), und so weiter. Zum Beispiel ist (1, 2, 4, 8, 16, . . .) eine1351

Teilfolge von (1,2, 3,4, 5, 6, 7,8, 9, . . .).1352

Erinnern Sie sich, dass eine beschrankte Folge nicht konvergieren muss. Ein Beispiel ist die Folge1353

(−1,+1,−1,+1,−1, . . .). Nehmen wir jedoch die Teilfolge, die jedes zweite Element auswahlt, so erhal-1354

ten wir (1, 1, 1, 1, . . .), was konvergiert. Diese Folge hat also eine konvergente Teilfolge. Der nachste Satz1355

sagt, dass dies fur jede beschrankte Folge der Fall ist.1356

Theorem 2.33 (Satz von Bolzano-Weierstraß). Jede beschrankte Folge hat eine konvergente Teilfolge.1357

Beweis. Sei (an)n∈N beschrankt durch I0 = [α, β], d.h., alle Folgenglieder liegen in diesem Intervall. Setze1358

i0 := 0. Nun betrachte die Teilintervalle [α, α+β2 ] und [α+β

2 , β]. In mindestens einem der beiden Teilintervalle1359

liegen unendlich viele Folgenglieder. Nenne dieses Intervall I1. Setze i1 > i0, so dass ai1 ∈ I1 liegt. Nun1360


unterteile I1 in zwei gleich grosse Teilintervalle, und wahle I2 als eines der Teilintervalle aus, das unendlich1361

viele Folgenglieder enthalt. Wahle dann i2 > i1 so, dass ai2 ∈ I2. Dieses Verfahren fuhren wir nun immer1362

weiter aus, und die Indices i0, i1, i2, . . . definieren eine Teilfolge.1363

Diese Teilfolge ist eine Cauchyfolge, denn alle Folgenglieder aik , ai` mit k, ` > j liegen in einem Intervall1364

der Grosse β−α2j . Es ist damit leicht, die Cauchybedingung nachzuweisen.1365

Anders als im Zwischenwertsatz ist der Beweis oben nicht konstruktiv: selbst wenn wir eine konkrete1366

beschrankte Folge gegeben haben, liefert der Beweis kein realisierbares Verfahren, eine solche Teilfolge zu1367

finden. Der Grund ist, dass wir nicht wissen, in welchem Teilintervall unendlich viele Folgenglieder enthalten1368

sind.1369

Als Beispiel schauen wir uns die Folge1370

xn := 1.5n − b1.5nc

an (erinnern Sie sich, dass b·c Abrunden auf die nachste ganze Zahl bedeutet). Dann liege jedes Folgenglied1371

im Intervall [0, 1), also ist die Folge beschrankt. Wir erhalten als erste Folgenglieder1372

(0.5, 0.25, 0.375, 0.0625, 0.59375, . . .)

Wir wissen nach dem Satz von Bolazano-Weierstrass, dass es eine konvergente Teilfolge geben muss. Es ist1373

jedoch nicht bekannt, wie diese konvergente Teilfolge konstruiert werden kann.1374

Wir konnen diesen Satz verwenden, um eine weitere wichtige Eigenschaft stetiger Funktionen zu beweisen.1375

Theorem 2.34. Sei I = [α, β] mit α, β ∈ R und f : I → R stetig. Dann gibt es p, q ∈ I, so dass1376

f(p) ≤ f(x) fur alle x ∈ I,1377

f(q) ≥ f(x) fur alle x ∈ I.

Der Satz druckt zwei Dinge aus: Der Wertebereich einer stetigen Funktion uber einem beschrankten, ab-1378

geschlossenen Intervall ist beschrankt, und ferner nimmt die Funktion auch ein Minimum und ein Maximum1379

an.1380

Beweis. Wir beweisen die Aussage nur fur das Minimum p. Der Beweis fur das Maximum funktioniert ganz1381

ahnlich. Sei F := {f(x) | x ∈ I} und sei y∗ := inf F ∈ R ∪ {−∞}. Beachte, dass y∗ = −∞, wenn F nicht1382

nach unten beschrankt ist. In jedem Fall exisitiert jedoch eine Folge (yn)n∈N in F , die nach y∗ konvergiert1383

(bzw., im Fall y∗ = −∞ nach −∞ divergiert). Das folgt aus Hausaufgabe 2.6.7. Jedes yi ist ein Bild unter F ,1384

also konnen wir ein Urbild xi wahlen, so dass f(xi) = yi gilt. Die Folge (xn)n∈N ist nicht notwendigerweise1385

konvergent, aber sie ist beschrankt (da jedes Folgenglied in I liegt), und hat damit eine konvergente Teilfolge1386

(x′n)n∈N. Sei x∗ der Grenzwert dieser Folge. Wegen der Stetigkeit von f ist dann1387

f(x∗) = limn→∞

f(x′n) = limn→∞

f(xn) = limn→∞

yn = y∗

Damit ist also insbesondere y∗ = f(x∗) ∈ R, also ist das Infimum endlich, und gleichzeitig ein Minimum,1388

das an der Stelle x∗ ∈ I angenommen wird.1389

1390

Hausaufgabe 2.8.1. Zeigen Sie durch Gegenbeispiele, dass der Umkehrfunktionssatz nicht mehr gilt, wenn1391

a. f stetig auf [a, b], aber nicht streng monoton ist,1392

b. f streng monoton, aber nicht stetig auf [a, b] ist,1393

c. f : D → R stetig und streng monoton ist, aber D kein Intervall ist.1394


Hausaufgabe 2.8.2. Zeigen Sie, dass die Funktion1395

f : R→ R, x 7→ 3√x− 1

stetig ist.1396

Hausaufgabe 2.8.3. Bestimmen Sie die ersten 3 Nachkommastellen von√

5 (Sie konnen einen Taschen-1397

rechner benutzen, aber durfen ihn nur fur Additionen und Multiplikationen verwenden)1398

Hausaufgabe 2.8.4. Zeigen Sie, dass das Polynom x3 − 4x − 1 mindestens drei verschiedene Nullstellen1399

hat.1400

Hausaufgabe 2.8.5. Geben Sie Beispiele an, dass die Aussage von Theorem 2.34 nicht wahr ist, wenn I1401

als offen, halboffen, oder unbeschrankt angenommen wird, oder wenn f nicht stetig ist.1402

Hausaufgabe 2.8.6. Zeigen Sie, dass es keine stetige Funktion f : [0, 1]→ [0, 1] gibt, die jeden Funktions-1403

wert genau zwei mal annimmt.1404

Hinweis: Nutzen Sie den Satz vom Minimum und Maximum und den Zwischenwertsatz.1405

Hausaufgabe 2.8.7. Zeigen Sie, dass die Umkehrung des Satzes von Bolzano-Weierstraß nicht gilt: Wenn1406

eine Folge (an)n∈N eine konvergente Teilfolge hat, muss (an)n∈N nicht unbedingt beschrankt sein.1407


Kapitel 31408

Lineare Algebra, Teil I1409

Viele geometrische Sachverhalte lassen sich durch ein System von einfachen (linearen) Gleichungen beschrei-1410

ben, z.B. die Schnittpunktsberechnung einer Ebene und einer Geraden im R3. Die lineare Algebra liefert die1411

notwendigen Werkzeuge, um solche linearen Gleichungssysteme zu untersuchen.1412

Der ubliche Anschauungsraum fur geometrische Probleme ist entweder R2 oder R3. Allerdings ist es fur1413

weite Teile der Theorie nicht wichtig, dass wir die reellen Zahlen zugrundelegen — viele Aussagen gelten in1414

einem wesentlich allgemeineren Kontext.1415

3.1 Gruppen und Korper1416

Eine algebraische Struktur ist eine Menge von Objekten, ublicherweise mit einer oder mehreren Ver-1417

knupfungsfunktionen, die gewisse “angenehme” Eigenschaften haben. Hier ist ein Beispiel.1418

Definition 3.1. Sei G eine Menge und ◦ : G×G→ G eine Abbildung. Dann ist (G, ◦) eine Gruppe, wenn1419

die folgenden drei Eigenschaften gelten.1420

1. Fur alle a, b, c ∈ G ist (a ◦ b) ◦ c = a ◦ (b ◦ c) (Assoziativgesetz)1421

2. Es gibt ein e ∈ G, so dass e ◦ a = a = a ◦ e fur alle a ∈ G (neutrales Element)1422

3. Fur alle a ∈ G gibt es ein a−1 ∈ G, so dass a ◦ a−1 = e = a−1 ◦ a (inverses Element)1423

Die drei Eigenschaften nennt man auch die Gruppenaxiome. Eine Gruppe heißt kommutativ oder abelsch,1424

falls auch a ◦ b = b ◦ a fur alle a, b ∈ G gilt.1425

Man sagt oft auch einfach”G ist eine Gruppe.“ anstatt

”(G, ◦) ist eine Gruppe.“, falls die Verknupfung1426

aus dem Kontext heraus klar ist.1427

Es gibt zahlreiche Beispiele fur Gruppen. Wir geben Beispiele an, die aufzeigen, dass diese Struktur in1428

der Tat in vielen verschiedenen Kontexten auftritt.1429

• (Z,+) ist eine abelsche Gruppe mit neutralem Element 0 und inversem Element −a zu a ∈ Z.1430

• Ebenso sind (Q,+) und (R,+) abelsche Gruppen.1431

• (Q \ {0}, ·) ist ebenfalls eine abelsche Gruppe, mit neutralem Element 1 und inversem Element ba zu1432

ab . Genauso ist (R \ {0}, ·) eine abelsche Gruppe.1433

• ({+1,−1}, ·) ist eine abelsche Gruppe. 1 ist das neutrale Element, das inverse Element zu −1 ist −1.1434

• {e} mit einem beliebigen Element e ist eine Gruppe mit der Verknupfung e ◦ e = e. Dies nennt man1435

auch die triviale Gruppe.1436

49

50 KAPITEL 3. LINEARE ALGEBRA, TEIL I

• Sei M eine Menge und1437

G := {f : M →M |M ist bijektiv}.

Dann ist (G, ◦) eine Gruppe, wobei ◦ die Komposition von Abbildungen ist. Das neutrale Element ist1438

die Abbildung id : M → M mit id(x) = x. Das inverse Element zu f ist die Umkehrabbildung f−1,1439

wobei f−1(y) = x genau dann, wenn f(x) = y.1440

Allerdings ist die Gruppe G im Allgemeinen nicht abelsch. Ist zum Beispiel G = {1, 2, 3}, f =1441

{(1, 2), (2, 1), (3, 3)} und g = {(1, 3), (2, 1), (3, 2)} (hier verwenden wir mal die Mengenschreibweise1442

fur Abbildungen), dann sehen wird, dass f ◦ g = {(1, 3), (2, 2), (3, 1)} und g ◦ f = {(1, 1), (2, 3), (3, 2)},1443

also nicht gleich sind.1444

Mehr Beispiele fur Gruppen finden Sie in den Hausaufgaben 3.1.2 und 3.1.3.1445

In der Definition einer Gruppe ist nur gefordert, dass jedes Element mindestens ein inverses Element1446

hat. Es folgt jedoch aus den Gruppeneigenschaften, dass dieses Element auch eindeutig bestimmt ist.1447

Lemma 3.2. Sei (G, ◦) eine Gruppe und a ∈ G. Dann gibt es genau ein b ∈ G mit a ◦ b = e = b ◦ a.1448

Beweis. Nach Gruppenaxiom (3) gibt es mindestens ein solches b. Nehmen wir b, b′ ∈ G als Inverse Elemente1449

von a. Nun wenden wir die Gruppenaxiome an um zu zeigen:1450

b(2)= e ◦ b (3)

= (b′ ◦ a) ◦ b (1)= b′ ◦ (a ◦ b) (3)

= b′ ◦ e (2)= b′

Also sind die inversen Elemente gleich.1451

Beachten Sie, dass diese Aussage fur alle Gruppen gilt. Wenn wir also eine Menge als Gruppe identi-1452

fiziert haben, wissen wir bereits, dass Inverse Elemente eindeutig sind, ohne das fur die konkrete Gruppe1453

nachweisen zu mussen. Die Gruppentheorie befasst sich mit weiteren Eigenschaften von Gruppen, die aus1454

den Gruppenaxiomen folgen.1455

Wir befassen uns mit Mengen mit einer reichhaltigeren Struktur:1456

Definition 3.3. Eine Menge K mit Operationen

+ :K ×K → K

· :K ×K → K

ist ein Korper, wenn gilt1457

1. (K,+) ist eine abelsche Gruppe. Es bezeichne 0 ∈ K ihr neutrales Element.1458

2. (K \ {0}, ·) ist eine abelsche Gruppe. Es bezeichne 1 ∈ K ihr neutrales Element.1459

3. Fur alle a, b, c ∈ K gilt das Distributivgesetz1460

a · (b+ c) = a · b+ a · c

Es ist ublich, die Operation · nicht jedesmal hinzuschreiben, also z.B. statt x · y einfach xy zu schreiben.1461

Auch die “Punkt-vor-Strich” wendet man sinngemaß an, um Klammern zu sparen.1462

Zum Beispiel sind Q und R Korper, jeweils mit der ublichen Addition und Multiplikation als Ver-1463

knupfungen. Dagegen ist Z kein Korper, da (Z \ {0}, ·) keine Gruppe ist. Zum Beispiel hat 2 kein inverses1464

Element in Z bezuglich der Multiplikation.1465

Da Korper mehr Struktur haben als Gruppen, gibt es weniger Beispiele fur Korper. Dafur haben diese1466

wesentlich starkere Eigenschaften. Hier ist ein Beispiel:1467

Theorem 3.4. Sei K ein Korper mit 0 dem neutralen Element der Addition. Dann gilt1468

1. 0 · x = 0 fur alle x ∈ K.1469

3.1. GRUPPEN UND KORPER 51

2. xy = 0 genau dann, wenn x = 0 oder y = 0.1470

Beweis. Es gilt1471

0 · x = (0 + 0) · x = 0x+ 0x

Sei nun y das inverse Element zu 0x bezuglich der Addition, also y + 0x = 0 = 0x+ y. Dann gilt1472

0 = y + 0x = y + (0x+ 0x) = (y + 0x) + 0x = 0 + 0x = 0x,

was die erste Aussage beweist.1473

Fur die zweite Aussage mussen wir beide Richtungen zeigen. Falls x = 0 oder y = 0, dann ist auch1474

xy = 0, wie wir im ersten Teil des Theorems bewiesen haben. Umgekehrt, nehmen wir an dass xy = 01475

ist. Falls x = 0 gilt, sind wir fertig. Falls x 6= 0 gilt, gibt es ein multiplikatives Inverses x−1 zu x, so dass1476

x−1x = 1 gilt (mit 1 dem neutralen Element der Multiplikation in K). Also ist1477

y = 1 · y = (x−1x)y = x−1(xy) = x−1 · 0 = 0 · x−1 = 0,

wobei wir im letzten Schritt wiederum den ersten Teil des Theorems ausgenutzt haben.1478

Interessanterweise gibt es auch Korper mit endlich vielen Elementen. Wir konstruieren nun einen solchen1479

Korper: Fur zwei beliebige naturliche Zahlen a, b definieren wir1480

amod b

als Rest von ganzzahliger Division von a durch b. Zum Beispiel ist 47 mod 11 = 3, 18 mod 3 = 0 und1481

7 mod 11 = 7.1482

Es sei Zn := {0, 1, 2, . . . , n−1}. Da fur jedes a ∈ N gilt, dass amodn ∈ Zn, konnen wir nun die folgendenVerknupfungen definieren:

⊕ : Zn × Zn → Zn, a⊕ b := (a+ b) modn

� : Zn × Zn → Zn, a� b := (a · b) modn

Zum Beispiel ist in Z12 7⊕ 9 = 4 und 6� 9 = 6. Beachten Sie, dass Sie taglich in Z12 rechnen: Wenn es1483

11 Uhr ist, ist es in 3 Stunden 2 Uhr (nachmittags), also ist 11 + 3 = 2.1484

Wir konnen relativ leicht zeigen, dass1485

(((a+ b) modn) + c) modn = (a+ (b+ c) modn) modn

Damit folgt dann, dass (Zn,⊕) fur jedes n ∈ N eine abelsche Gruppe ist, wobei 0 das neutrale Element ist1486

und das inverse Element von a gleich n− amodn ist. Es gilt auch das Distributivgesetz1487

a� (b⊕ c) = a� b⊕ a� c.

Fur � gilt ebenfalls das Assoziativgesetz, und es gibt auch ein neutrales Element der Multiplikation, denn1488

1� a = a fur alle a 6= 0. Damit sind alle Korperaxiome erfullt, bis auf die Existenz von inversen Elementen1489

fur die Multiplikation.1490

Theorem 3.5. Zn ist ein Korper genau dann, wenn n eine Primzahl ist.1491

Beweis. Angenommen, Zn ist ein Korper, aber n keine Primzahl. Dann gibt es p, q ∈ {2, . . . , n − 1} mit1492

pq = n. In Zn ist dann p � q = 0, aber weder p noch q sind 0. Das widerspricht dem zweiten Teil von1493

Theorem 3.4.1494

Ist n eine Primzahl und a ∈ {1, . . . , n − 1}, dann haben a und n keinen gemeinsamen Teiler ausser 1.1495

Es folgt dann, dass es ganze Zahlen x und y gibt, so dass xa+ yn = 1 gilt (dies ist ein klassisches Resultat1496

von Euklid, welches wir hier nicht beweisen werden).1497

Setze a−1 := xmodn. Es gilt dann a−1a = 1−yn, und wenn wir auf beiden Seiten den Rest bei Division1498

durch n nehmen, a−1amodn = 1. Dies beweist, dass es ein inverses Element gibt.1499


1500

Hausaufgabe 3.1.1. Sei (G, ◦) eine Gruppe und a, b, c ∈ G. Beweisen Sie folgende Eigenschaften:1501

a. (a ◦ b = a ◦ c)⇒ b = c,1502

b. (a−1)−1 = a,1503

c. (a ◦ b)−1 = b−1 ◦ a−1.1504

Hausaufgabe 3.1.2. Prufen Sie fur jede der folgenden Strukturen, welche der Gruppenaxiome erfullt sind.1505

a. G = N, a ∗ b := max{a, b}1506

b. G = N, a ∗ b := ab1507

c. Sei M eine Menge und P (M) die Potenzmenge von M , also die Menge all seiner Teilmengen. Un-1508

tersuche (G,∪) und (G,∩).1509

d. G = P (M) wie oben, A ∗B := (A \B) ∪ (B \A).1510

Hausaufgabe 3.1.3. Die Symmetrien eines geometrischen Objekts sind alle Drehungen und Spiegelungen,1511

welche das Objekt in sich selbst abbilden. Nehmen wir z.B. das Quadrat [−1,+1]× [−1,+1], ist die Drehung1512

um 90 Grad eine Symmetrie, genauso wie Spiegelung am Ursprung. Ein weiteres Beispiel fur eine Symmetrie1513

ist die Identitatsabbildung, die um 0 Grad dreht.1514

a. Geben Sie samtliche Symmetrien fur das Quadrat an (es sind 8).1515

b. Argumentieren Sie, dass die Menge der Symmetrien eine Gruppe bildet.1516

c. Untersuchen Sie die Symmetrien des gleichseitigen Dreieck auf die gleiche Art.1517

Hausaufgabe 3.1.4. Beweisen Sie die Eindeutigkeit des neutralen Elements in jeder Gruppe.1518

Hausaufgabe 3.1.5. Fur n ∈ N bezeichne1519

Q[√n] := {a+ b

√n | a, b ∈ Q}.

a. Fur welche n ist Q[√n] = Q?1520

b. Zeigen Sie, dass Q[√n] ein Korper ist.1521

Hausaufgabe 3.1.6. Sei K ein Korper. Ist K ×K mit den Operationen1522

(a1, a2) + (b1, b2) := (a1 + b1, a2 + b2) (a1 + a2) · (b1, b2) = (a1b1, a2b2)

ein Korper? Untersuchen Sie, welche der Korperaxiome erfullt sind und welche nicht.1523

Hausaufgabe 3.1.7. Sei M eine Menge mit genau vier Elementen. Geben Sie alle moglichen Abbildungen1524

+ : M →M , · : M →M an, sodass (M,+, ·) ein Korper ist.1525

3.2 Vektorraume1526

Nun kommen wir zur Hauptstruktur der linearen Algebra, dem Vektorraum.1527

Definition 3.6. Sei K ein Korper mit 0 und 1 den neutralen Elementen der Addition und Multiplikation.Eine Menge V mit Abbildungen

+ : V × V → V

· : K × V → V

heißt K-Vektorraum (und seine Elemente Vektoren), wenn gilt1528

3.2. VEKTORRAUME 53

(V1) (V,+) ist eine abelsche Gruppe. Es bezeichne ~0 das neutrale Element (der Nullvektor).1529

(V2) Es gelten die Distributivgesetze

λ · (x+ y) = λ · x+ λ · y fur λ ∈ K,x, y ∈ V,(λ+ µ) · v = λ · v + µ · v fur λ, µ ∈ K,x ∈ V.

(V3) Es gilt ferner:

λ · (µ · x) = (λ · µ) · x fur λ, µ ∈ K,x ∈ V,1 · x = x fur x ∈ V.

Wir schreiben ~0, um den Nullvektor vom neutralen Element 0 in K zu unterscheiden. Hier sind einige1530

Beispiel fur Vektorraume:1531

• Das Standardbeispiel ist1532

Kn = K ×K × . . .×K,

dessen Vektoren wir mit1533

a =

a1

...an

bezeichnen. Kn wird durch die Operationen1534 a1

...an

+

b1...bn

=

a1 + b1...

an + bn

λ ·

a1

...an

=

λ · a1

...λ · an

zu einem K-Vektorraum. Um sich davon zu uberzeugen, muss man nun der Reihe nach alle Vektor-raumaxiome nachweisen. Wir tun das nur beispielhaft fur das Distributivgesetz:

(λ+ µ)x = (λ+ µ)

x1

...xn

=

(λ+ µ)x1

...(λ+ µ)xn

=

λx1 + µx1

...λxn + µxn

=

λx1

...λxn

+

µx1

...µxn

= λ · x+ µ · x

• Ein Polynom uber einem Korper K ist ein Ausdruck der Form1535

p = anxn + an−1x

n−1 + . . .+ a1x+ a0

wobei a0, . . . , an ∈ K und an 6= 0, falls n 6= 0. Die Menge aller Polynome bildet einen K-Vektorraum,1536

wobei Addition und Skalarmultiplikation auf die naturliche Weise definiert sind (Hausaufgabe).1537

• Die Menge V aller Funktionen f : K → K bildet einen Vektorraum. Dabei ist die Abbildung f + g1538

definiert durch (f + g)(x) := f(x) + g(x) und λf durch (λf)(x) := λ · f(x). Der Nullvektor ist hier1539

die Abbildung, die jedes Element auf 0 abbildet. Wieder weisen wir nur eine Eigenschaft als Beispiel1540

nach. Seien f, g Vektoren und λ ∈ K. Wir wollen zeigen, dass1541

λ · (f + g) = λ · f + λ · g.

Dafur weisen wir nach, dass die beiden Funktionen links und rechts fur jedes x ∈ K das gleiche1542

Ergebnis liefern:1543

(λ·(f+g))(x) = λ·(f+g)(x) = λ(f(x)+g(x)) = λf(x)+λg(x) = (λ·f)(x)+(λ·g)(x) = (λ·f+λ·g)(x)


• Die Menge {~0} ist ein K-Vektorraum fur jedes K. Dieser Vektorraum wird trivialer Vektorraum1544

genannt.1545

Theorem 3.7. In jedem K-Vektorraum V gilt:1546

• 0 · v = ~0 fur alle v ∈ V1547

• λ ·~0 = ~0 fur alle λ ∈ K.1548

Beweis. Es gilt1549

v + 0 · v = 1 · v + 0 · v = (1 + 0) · v = 1 · v = v

Also gilt nach beidseitiger Addition von −v, dass 0 · v = ~0.1550

Fur die zweite Aussage sehen wir1551

λ~0 = λ(~0 +~0) = λ~0 + λ~0

und die Aussage folgt durch Subtraktion von λ~0 auf beiden Seiten.1552

Theorem 3.8. Sei V ein K-Vektorraum und U ⊆ V eine Teilmenge, so dass gilt:1553

1. U 6= ∅1554

2. a, b ∈ U ⇒ a+ b ∈ U1555

3. a ∈ U , λ ∈ K ⇒ λa ∈ U .1556

Dann ist auch U ein K-Vektorraum. Wir nennen dann U einen Unter(vektor)raum von V .1557

Beweis. Wir mussen fur U die Vektorraumaxiome nachweisen. Die Gleichungen in (V2) und (V3) von1558

Definition 3.6 gelten sicherlich auch fur alle Elemente von U , da U eine Teilmenge von V ist. Es ist nur1559

nachzuweisen, dass (U,+) eine abelsche Gruppe ist. Die Kommutativitat und das Assoziativgesetz sind klar,1560

denn sie gelten wiederum fur alle Elemente aus V . Es gilt ferner:1561

– ~0, der Nullvektor von V , ist ein Element von U : Da U nicht leer ist, gibt es ein a ∈ U . Nach der dritten1562

Eigenschaft ist auch (−1)a = −a in U enthalten. Nach der zweiten Eigenschaft ist dann ~0 = a+ (−a)1563

ebenfalls in U .1564

– Wie gerade gezeigt, ist fur jedes a ∈ U und sein inverses Element −a ∈ U .1565

Damit folgen alle Gruppenaxiome, und daher ist (U,+) ein Unterraum.1566

Als Beispiel betrachten wir1567

U :=

x

y0

| x, y ∈ K

Dies ist eine Teilmenge von K3. Es ist auch ein Unterraum, denn1568

– U ist nicht leer.1569

– Fur

x1

y1

0

,

x2

y2

0

in U ist auch

x1 + x2

y1 + y2

0

in U .1570

– Fur λ ∈ K und

xy0

ist auch

λxλy0

in U .1571

3.2. VEKTORRAUME 55

Lemma 3.9. Sei V ein K-Vektorraum. Fur v ∈ V ist1572

{λv | λ ∈ K}

ein Unterraum von V , den wir mit [v] bezeichnen (wir lesen dies als “Spann von v”).1573

Beweis. [v] ist nicht leer, da z.B. v ∈ [V ]. Sind u,w ∈ [v], dann ist u = λ1v, w = λ2v, also u+w = (λ1 +λ2)v,1574

also ebenfalls im Spann. Fur µ ∈ K beliebig ist µu = µ(λ1v) = (µλ1)v, also ebenfalls im Spann.1575

Aus zwei Unterraumen von V lassen sich weitere Unterraume konstruieren:1576

Theorem 3.10. Sind U1, U2 Unterraume von V , so sind auch U1 ∩ U2 sowie1577

U1 + U2 = {v + w | v ∈ U1, w ∈ U2}

Unterraume von V .1578

Beweis. Der Beweis des ersten Teils ist eine Hausaufgabe.1579

Fur die Summe bemerken wir zunachst, dass U1 + U2 nicht leer ist, da weder U1 noch U2 leer ist (wir1580

konnen also zumindest eine Summe bilden). Nun seien a, b ∈ U1 +U2. Das bedeutet, wir konnen a = u1 +u21581

schreiben, mit u1 ∈ U1, u2 ∈ U2. Ebenso ist b = v1 + v2 mit v1 ∈ U1, v2 ∈ U2. Also ist1582

a+ b = (u1 + u2) + (v1 + v2) = (u1 + v1)︸︷︷︸∈U1

+ (u2 + v2)︸︷︷︸∈U2

und damit ist a+ b ebenfalls in U1 + U2. Ist λ ∈ K, dann ist1583

λ · a = λu1︸︷︷︸∈U1

+ λu2︸︷︷︸∈U2

,

also ebenfalls in der Summe enthalten.1584

Definition 3.11. Sind v1, . . . , vr ∈ V und λ1, . . . , λr ∈ K, so nennen wir1585

λ1v1 + λ2v2 + . . .+ λrvr

eine Linearkombination von v1, . . . , vr. Fur eine Menge M ⊆ V schreiben wir1586

[M ] := {λ1v1 + λ2v2 + . . . λrvr | λ1, . . . , λr ∈ K}

fur die Menge aller Linearkombinationen (genannt der Spann von M).1587

Lemma 3.12. Fur jede nicht-leere Menge M ⊆ V ist [M ] ein Unterraum von V .1588

Beweis. Wir beweisen die Aussage nur fur den Fall, dass M eine endliche Menge ist. Fur den unendlichen1589

Fall stimmt die Aussage auch, aber es wird eine andere Beweisidee benotigt.1590

Im endlichen Fall kann man die Aussage umformulieren zu:1591

∀n ≥ 1 : |M | = n⇒ [M ] ist Unterraum von V .

Wir beweisen die Aussage durch vollstandige Induktion n. Fur n = 1 ist M = {v1}, also [M ] = [v1], und1592

dies ist ein Unterraum wie in Lemma 3.9 gezeigt.1593

Nun sei M = {v1, . . . , vn+1} eine Menge mit n+1 Elementen. Nach Induktionssannahme ist [{v1, . . . , vn}]1594

ein Unterraum. Andererseits ist aber1595

[{v1, . . . , vn+1] = [{v1, . . . , vn}] + [{vn+1}] ,

also die Summe von zwei Unterraumen: der erste wie aus der Induktionsannahme und der zweite wiederum1596

wie im Lemma 3.9. Wie in Theorem 3.10 gezeigt, ist diese Summe auch wieder ein Vektorraum.1597


Die folgende Aussage druckt aus, dass [M ] der kleinste Unterraum von V ist, welcher M enthalt:1598

Lemma 3.13. Sei W ein Unterraum von V mit M ⊆W . Dann gilt auch [M ] ⊆W .1599

Beweis. Wenn ein Vektorraum Vektoren v1, . . . , vk enthalt, enthalt er notwendigerweise auch jede Linear-1600

kombination dieser Vektoren (einfacher Induktionsbeweis). Die Aussage folgt damit sofort.1601

Als Beispiel betrachten wir im R31602 1

11

,

100

.Dies ist die durch die beiden Vektoren aufgespannte Ebene durch den Ursprung.1603

Definition 3.14. Sei V ein Vektorraum und M ⊆ V . Dann heißt M ein Erzeugendensystem von V , falls1604

[M ] = V . V heißt endlich erzeugt, falls es ein endliches Erzeugendensystem gibt.1605

Zum Beispiel ist der Vektorraum K3 endlich erzeugt, da {

100

,

010

,

001

} ein Erzeugenden-1606

system ist. Dagegen ist der Vektorraum aller Polynome uber K nicht endlich erzeugt. Das kann man wie1607

folgt sehen: Eine endliche Menge von Polynomen {p1, . . . , pn} hat einen maximalen Grad D (d.h. jedes1608

Polynom hat Grad ≤ D). Jede Linearkombination von {p1, . . . , pn} hat dann auch Grad ≤ D, denn der1609

Grad kann sich durch Addition von Polynomen sowie durch Multiplikation mit einem Korperelement nicht1610

vergroßern. Damit erreicht der Spann von v1, . . . , vn nicht alle Polynome.1611

1612

Hausaufgabe 3.2.1. Sei (V,+, ·) ein Vektorraum uber den Korper K. Sei α ∈ K und v ∈ V . Nennen wir1613

−v das inverse Element von v fur + und −α das inverse Element von α fur die Addition in K. Beweisen1614

Sie folgende Eigenschaften:1615

a. −1 · v = −v,1616

b. (−α) · v = α · (−v).1617

Hausaufgabe 3.2.2. Weisen Sie nach, dass die Polynome uber den Korper K einen Vektorraum bilden.1618

Hausaufgabe 3.2.3. Sei V ein K-Vektorraum, λ ∈ K und v ∈ V . Zeigen Sie: Ist λ · v = ~0, so ist λ = 01619

oder v = ~0.1620

Hausaufgabe 3.2.4. Ist die Menge1621

U :=

x

y1

| x, y ∈ K

ein Unterraum von K3?1622

Hausaufgabe 3.2.5. Beweisen Sie, dass der Schnitt zweier Unterraume wiederum ein Unterraum ist. Gilt1623

dies auch fur die Vereinigung von zwei Unterraumen?1624

Hausaufgabe 3.2.6. Geben Sie einen Vektorraum mit genau 16 Elementen und einen Vektorraum mit1625

genau 125 Elementen an. Schließen Sie daraus eine allgemeine Regel fur die Konstruktion von endlichen1626

Vektorraumen.1627

3.3. LINEARE ABHANGIGKEIT 57

3.3 Lineare Abhangigkeit1628

Nehmen wir an, dass unser Vektorraum V endlich erzeugt ist. Wir wollen nun ein kleinstes Erzeugenden-1629

system definieren. Eine Moglichkeit ware zu sagen, dass ein Erzeugendensystem M minimal ist, wenn das1630

Weglassen eines Elementes x ∈M dazu fuhrt, dass M \ x kein Erzeugendensystem mehr ist.1631

Offenbar hat {

100

,

010

,

001

} jene Eigenschaft, denn wenn wir einen der Vektoren weglassen,1632

bleibt die entsprechende Koordiante immer 0. Allerdings ist es nicht ohne weiteres klar, dass es kein Erzeu-1633

gendensystem von K3 gibt, welches nur aus zwei Elementen besteht. Ebensowenig ist es klar, ob es nicht1634

auch ein minimales Erzeugendensystem mit 4 oder mehr Elementen geben konnte. Es ist auch nicht ohne1635

weiteres klar, ob es einen Unterraum eines endlich erzeugten Vektorraums gibt, der nicht endlich erzeugt1636

ist.1637

Die Theorie, die wir nun entwickeln werden, zeigt, dass die oben genannten Falle nicht auftreten konnen.1638

In einem endlich erzeugten Vektorraum haben alle minimalen Erzeugendensysteme die gleiche Grosse. Die1639

Anzahl dieser Element nennt man die Dimension des Vekttoraums. Ferner ist ein Unterraum eines n-1640

dimensionalen Vektorraums endlich erzeugt und hat eine Dimension von hochstens n.1641

Lemma 3.15. Sei M ⊆ V und sei x ∈ M , so dass x ∈ [M \ {x}] (d.h., x ist als Linearkombination von1642

anderen Elementen in M darstellbar). Dann ist [M ] = [M \ {x}].1643

Beweis. Es ist klar, dass [M \ {x}] ⊆ [M ]. Fur die andere Richtung beobachten wir, dass M ⊆ [M \ {x}]1644

nach Voraussetzung. Da [M \ {x}] ein Unterraum ist, der M enthalt, ist nach Lemma 3.13 auch [M ] ⊆1645

[M \ {x}].1646

Fur spater bemerken wir:1647

Korollar 3.16. Seien v1, . . . , vn ∈ V und sei1648

v = λ1v1 + . . .+ λnvn

mit λi 6= 0. Dann ist1649

[v1, . . . , vn] = [v1, . . . , vi−1, v, vi+1, . . . , vn] .

Beweis. Setze M := {v1, . . . , vn, v}. Da v Linearkombination der restlichen Elemente ist, ist [v1, . . . , vn] =1650

[M ] nach dem vorherigen Lemma. Andererseits ist auch vi eine Linearkombination der anderen Elemente,1651

da1652

vi = − 1

λiv +

λ1

λiv1 +

λ2

λiv2 + . . .+

λnλivn

ist, wobei in der rechten Summe der Summand fur i ausgelassen wird. Also ist auch1653

[v1, . . . , vi−1, v, vi+1, . . . , vn] = [M ]

und die Aussage folgt.1654

Lemma 3.15 zeigt uns: haben wir ein Erzeugendensystem eines Unterraums, konnen wir solange Elemente1655

“herauswerfen”, solange sie Linearkombination anderer Elemente sind. Dieser Prozess endet, wenn wir ein1656

Erzeugendensystem haben, in dem kein Element Linearkombination der restlichen Elemente ist. Die folgende1657

Definition druckt genau diese Eigenschaft aus.1658

Definition 3.17. Eine Menge M ⊆ V (endlich oder unendlich) heißt linear abhangig, wenn es eine endliche1659

Linearkombination1660

λ1x1 + . . .+ λrxr = ~0

gibt mit x1, . . . , xr ∈ V , λ1, . . . , λr ∈ K, und mindestens ein λi 6= 0. Wir nennen eine solche Linearkombina-1661

tion eine nicht-triviale Linearkombination des Nullvektors, im Gegensatz zur trivialen Linearkombination,1662

in der alle Koeffizienten 0 sind.1663

Ist eine Menge nicht linear abhangig, so nennen wir sie linear unabhangig.1664


Wir zeigen zunachst, dass die Definition genau das ausdruckt, was wir oben gesagt haben.1665

Lemma 3.18. Eine Menge M ist linear abhangig genau dann, wenn es ein x ∈ M gibt, dass sich als1666

Linearkombination der Elemente M \ {x} ausdrucken lasst.1667

Beweis. Ist x = λ1v1 + . . .+ λrvr mit v1, . . . , vr ∈M \ {x}, so ist1668

λ1v1 + . . .+ λrvr − x = ~0,

und nicht alle Koeffizienten sind 0, denn z.B. ist der Koeffizient von x gleich −1. Also ist M linear abhangig.1669

Das Argument lasst sich leicht umkehren, um die Ruckrichtung zu beweisen (Hausaufgabe).1670

Daraus folgt nun sofort die folgende Eigenschaft. Der Beweis ist eine Hausaufgabe.1671

Korollar 3.19. Eine Menge M ist linear unabhangig genau dann, wenn fur jedes x ∈M , [M \ {x}] ( [M ].1672

Hier sind nun einige Beispiele:1673

• Die Menge1674 {(23

),

(41

),

(213

)}ist linear abhangig, denn es ist zum Beispiel1675

5

(23

)+ (−2)

(41

)+ (−1)

(213

)=

(10− 8− 215− 2− 13

)= ~0

eine nichttriviale Linearkombination von ~0.1676

• {~0} ist linear abhangig, denn 1 ·~0 = ~0, und 1 ·~0 ist eine nicht-triviale Linearkombination.1677

• Andererseits ist {v} fur v 6= ~0 linear unabhangig, denn λ · v = ~0 bedeutet λ = 0 (Hausaufgabe 3.2.3)1678

• Die Vektoren1679

{

3214

,

2105

,

1006

}sind linear unabhangig. Um das zu sehen, nehmen wir an, dass1680

λ1

3214

+ λ2

2105

+ λ3

1006

= ~0

fur Koeffizienten λ1, λ2, λ3 ∈ K. Schreiben wir das um zu1681 3λ1 + 2λ2 + λ− 3

2λ1 + λ2

λ1

4λ1 + 5λ2 + 6λ3

=

0000

,

so erkennen wir aus der dritten Gleichung, dass λ1 = 0 gelten muss. Damit folgt aber aus der zweiten1682

Gleichung, dass λ2 = 0 gelten muss, und damit aus der ersten Gleichung, dass λ3 = 0 gelten muss.1683

Damit ist also die triviale Linearkombination die einzige Moglichkeit, den Nullvektor zu erhalten.1684

Im letzten Beispiel hat uns die spezielle Struktur der Vektoren geholfen, die lineare Unabhangigkeit1685

nachzuweisen. Im Allgemeinen ist es jedoch nicht ganz klar, wie man lineare Unabhangigkeit nachweist.1686

Lineare Abhangigkeit ist einfacher - man schreibt eine nicht-triviale Linearkombination des Nullvektors auf.1687

Wir kommen spater darauf zuruck.1688

1689

3.4. BASEN 59

Hausaufgabe 3.3.1. Zeigen Sie die Ruckrichtung von Lemma 3.18.1690

Hausaufgabe 3.3.2. Beweisen Sie Korollar 3.19.1691

Hausaufgabe 3.3.3. Was bedeutet es geometrisch, dass zwei Vektoren {x, y} im R2 abhangig sind?1692

Hausaufgabe 3.3.4. Zeigen Sie:1693

a. Ist M linear unabhangig, dann ist jede nicht-leere Teilmenge von M linear unabhangig.1694

b. Ist M linear abhangig, dann ist jede Menge, die M enthalt, ebenfalls linear abhangig.1695

Hausaufgabe 3.3.5. Untersuchen Sie, ob folgende Mengen linear unabhangig sind:1696

a.

(1−1

),

(−11

)in R2

1697

b.

(1−1

),

(11

)in R2

1698

c.

352

,

011

,

362

in R31699

d.

11−1

,

1−11

in R31700

e.

(1−1

),

(11

)in Z2

21701

f.

525

,

111

,

626

in R31702

g.

123

,

012

,

314

in Z351703

h.

024

,

313

,

421

in Z351704

Hausaufgabe 3.3.6. Der K-Vektorraum (RR,⊕,�) der Funktionen von R nach R enthalt unter anderem1705

die Elemente1706

f(x) = 1− x, g(x) = 1 + x, h(x) = x2 + 2x+ 1.

Die Operationen sind wie folgt auf intuitiver Art und Weise definiert:

⊕ : RR × RR → RR � : K × RR → RR

(f, g) 7→ f + g (λ, f) 7→ λf.

Zeigen Sie, das {f, g, h} linear unabhangig ist.1707

Hausaufgabe 3.3.7. Zeigen Sie, dass1708

U1 := {f ∈ RR|f(x) = f(−x) fur alle x ∈ R}

und1709

U2 := {f ∈ RR|f(x) = −f(−x) fur alle x ∈ R}

Unterraume von RR sind. Erklaren Sie auch die geometrischen Eigenschaften von U1 und U2.1710

3.4 Basen1711

Nun studieren wir linear unabhangige Erzeugendensysteme. Wir geben diesen einen kurzen Namen:1712

Definition 3.20. Eine Menge M heißt Basis von V , wenn gilt:1713

1. [M ] = V , d.h. M ist Erzeugendensystem von V ,1714

2. M ist linear unabhangig.1715

Eine Basis ist ein “kleinstes” Erzeugendensystem eines Vektorraums, denn nach Lemma 3.18 fuhrt das1716

Weglassen eines Basiselements dazu, dass die verkleinerte Menge kein Erzeugendensystem mehr ist.1717


Theorem 3.21. Jeder endlich erzeugte Vektorraum hat eine Basis.1718

Beweis. Ist der Vektorraum V endlich erzeugt durch M , dann gibt es zwei Falle. Ist M linear unabhangig,1719

sind wir fertig, denn dann ist M eine Basis. Sonst gibt es ein x ∈ M , welches Linearkombination der1720

restlichen Elemente ist, und Weglassen von x ergibt ein kleineres Erzeugendensystem. Wir wiederholen1721

dieses Verfahren so lange, bis die Menge linear unabhangig ist. Das muss nach endlich vielen Schritten1722

passieren, da M endlich ist.1723

Es gilt sogar allgemeiner, dass jeder Vektorraum eine Basis hat. Der Beweis von oben funktioniert aber1724

nicht fur diesen allgemeinen Fall.1725

Der folgende Satz sagt aus, dass wir unter bestimmten Voraussetzungen eine Basis durch eine andere1726

austauschen konnen.1727

Theorem 3.22 (Austauschsatz von Steinitz). Sei M = {b1, . . . , bn} eine Basis von V . Sei1728

v = λ1b1 + . . .+ λnbn

mit λi 6= 0 fur einen Index i. Dann ist auch1729

M ′ := {b1, . . . , bi−1, v, bi+1, . . . , bn}

eine Basis von V .1730

Beweis. Beachten Sie, dass [M ′] = [M ] gilt, wie wir in Lemma 3.16 gesehen haben. Es ist nur noch zu1731

zeigen, dass M ′ linear unabhangig ist. Dafur fixieren wir einen Linearkombination1732

λ1b1 + . . .+ λi−1bi−1 + λiv + λi+1bi+1 + . . .+ λnbn = ~0.

Nun zeigen wir zuerst, dass λi = 0 gelten muss. Falls dem nicht so ist, konnen wir v als Linearkombination1733

von {b1, . . . , bi−1, bi+1, . . . , bn} darstellen:1734

v = −λ1

λib1 − . . .−

λi−1

λibi−1 −

λi+1

λibi+1 − . . .−

λnλibn

und damit ist [M ] = [M ′] = [M − {bi}], was Korollar 3.19 widerspricht. Also ist λi = 0. Damit vereinfacht1735

sich die obige Linearkombination zu1736

λ1b1 + . . .+ λi−1bi−1 + λi+1bi+1 + . . .+ λnbn = ~0.

Da {b1, . . . , bn} linear unabhangig ist, ist auch die Teilmenge {b1, . . . , bi−1, bi+1, . . . , bn} linear unabhangig1737

(Hausaufgabe). Damit folgt nach Definition, dass die Koeffizienten λ1, . . . , λi−1, λi+1, . . . , λn ebenfalls alle1738

gleich 0 sind. Das beweist die lineare Unabhangigkeit von M ′.1739

Mit Hilfe des Austauschsatzes konnen wir beweisen, dass alle Basen eines Vektorraumes die gleiche1740

Anzahl an Elementen haben:1741

Theorem 3.23. Sei B = {b1, . . . , bn} eine Basis von V . Dann ist jede Menge M := {v1, . . . , vn+1} mit1742

n+ 1 Elementen in V linear abhangig.1743

Beweis. Durch Widerspruch. Nehmen wir an, M sei linear unabhangig. Dann ist jedes vi 6= ~0, denn eine1744

Menge, die den Nullvektor enthalt, ist immer linear abhangig. Da [B] = V , konnen wir schreiben1745

v1 = λ1b1 + . . .+ λnbn,

und weil v1 6= ~0, ist mindestens eines der λi 6= 0. Nehmen wir an, λ1 6= 0, (sonst vertausche die Indices der1746

bi). nach dem Austauschsatz 3.22 auch {v1, b2, . . . , bn} eine Basis.1747

Nun fahren wir induktiv fort: Ist {v1, . . . , vi, bi+1, . . . , bn} eine Basis, dann gibt es eine Linearkombination1748

vi+1 = λ1v1 + . . .+ λivi + λi+1bi+1 + . . .+ λnbn.

3.4. BASEN 61

Es kann nun nicht sein, dass λi+1 + . . . + λn = 0 gilt, denn dann ware vi+1 eine Linearkombination von1749

v1, . . . , vi und alsoM linear abhangig. Also ist wenigstens einer der Koeffizienten λi+1, . . . , λn ungleich 0. Wir1750

konnen wieder annehmen, dass λi+1 6= 0 gilt. Nach dem Austauschsatz ist dann {v1, . . . , vi+1, bi+2, . . . , bn}1751

ebenfalls eine Basis.1752

Nach n Schritten erhalten wir damit, dass {v1, . . . , vn} ebenfalls eine Basis von V ist. Damit ist aber vi+11753

als Linearkombination der v1, . . . , vn darstellbar, was der linearen Unabhangigkeit von M widerspricht.1754

Definition 3.24. Fur einen endlich erzeugten Vektorraum V ist die Dimension dim(V ) die Anzahl der1755

Elemente einer beliebigen Basis von V . Der triviale Vektorraum {~0} hat Dimension 0. Nicht endlich-erzeugte1756

Vektorraume nennen wir unendlichdimensional.1757

Zum Beispiel ist innerhalb von R3 ein zweidimensionaler Vektorraum mit Basis v1, v2 die (eindeutige)1758

Ebene, die den Ursprung, v1 und v2 enthalt. Ein eindimensionaler Vektorraum mit Basis v ist die Ursprungs-1759

gerade durch v. Der Dimensionsbegriff entspricht also in der Tat unserer intuitiven Vorstellung.1760

Wir besprechen nun einige weitere Eigenschaften von Basen. Die folgende angenehme Eigenschaft werden1761

wir haufig verwenden:1762

Theorem 3.25. Ist M eine Basis von V , dann lasst sich jedes x ∈ V eindeutig als Linearkombination von1763

Elementen in M schreiben.1764

Beweis. Da [M ] = V , gibt es mindestens eine Linearkombination fur x. Gibt es zwei Darstellungen

x = λ1v1 + . . .+ λnvn

x = µ1v1 + . . .+ µnvn,

dann fuhrt Subtraktion zur Linearkombination1765

~0 = (λ1 − µ1)v1 + . . .+ (λn − µn)vn.

Da die v1, . . . , vn linear unabhangig sind, muss also λi − µi = 0 fur alle i gelten, also λi = µi fur alle i.1766

Damit sind die beiden Darstellungen von x gleich.1767

Eine linear unabhangige Menge M eines n-dimensionalen Vektorraums V ist die Basis des Unterraums1768

[M ]. Der folgende Satz sagt aus, dass man M immer zu einer Basis von M erweitern kann.1769

Theorem 3.26 (Basiserweiterungssatz). Sei {v1, . . . , vi} eine linear unabhangige Menge in einem n-dimen-1770

sionalen Vektorraum V . Dann ist i ≤ n, und es gibt (n− i) Vektoren vi+1, . . . , vn, so dass {v1, . . . , vn} eine1771

Basis von V ist.1772

Eine Konsequenz des Theorems ist, dass V der einzige n-dimensionale Unterraum von V ist. Der Beweis1773

lauft ahnlich ab wie in Satz 3.23 (allerdings ohne Widerspruch): Man startet mit irgendeiner Basis von1774

V und ersetzt sukzessive die Basisvektoren mit v1, . . . , vn. Nach dem Austauschsatz erhalt man in jedem1775

Schritt eine Basis, und nach i Schritten ist die gewunschte Basis erreicht. Wir lassen weitere Details weg.1776

Erinnern Sie sich, dass wir zwei Vektorraume U , V auch U ∩ V und U + V stets Vektorraume sind. Das1777

folgende Resultat setzt die Dimensionen dieser Raume in Beziehung zueinander.1778

Theorem 3.27 (Dimensionssatz). Sind U und V endlich-dimensionale Vektorraume, so gilt1779

dimU + dimV = dim(U ∩ V ) + dim(U + V )

Beweis. Wir starten mit einer Basis {w1, . . . , ws} von U ∩ V mit s = dim(U ∩ V ). Dies ist ein Unterraum1780

sowohl von U als auch von V . Wir konnen also sowohl zu einer Basis {w1, . . . , ws, us+1, . . . , un} von U , also1781

auch zu einer Basis {w1, . . . , ws, vs+1, . . . , vm} von V erweitern, mit n = dimU und m = dimV .1782

Nun gilt, dass {w1, . . . , ws, us+1, . . . , un, vs+1, . . . , vm} eine Basis von U + V ist (wir lassen den Beweis1783

fur diese nicht ganz offensichtliche Aussage weg). Daraus folgt dann, dass dim(U + V ) = n + m − s =1784

dimU + dimV − dim(U ∩ V ).1785


Wir konnen den Dimensionssatz geometrisch deuten. Sei U ein zweidimensionaler Unterraum des R3,1786

und V ein eindimensionaler Unterraum. Das heißt, U ist eine Ebene durch den Ursprung, und V ist eine1787

Gerade durch den Ursprung. Beachten Sie, dass U + V erzeugt wird durch die Vereinigung der Basen von1788

U und V (Hausaufgabe 3.4.1). Es gibt nun zwei Falle:1789

• Gerade und Ebene schneiden sich nur im Urpsrung. Dann ist U ∩ V = {~0}, der triviale Unterraum,1790

welcher Dimension 0 hat. Nach dem Dimensionssatz ist also dimU+V = 3. In der Tat spannen Ebene1791

und Gerade gemeinsam den gesamten R3 auf.1792

• Die Gerade verlauft in der Ebene. Dann ist V ⊆ U , also ist U ∩ V = V , also dim(U ∩ V ) = 1. Nach1793

Dimensionssatz ist dim(U + V ) = 2. In der Tat ist U + V = U , denn man kann die Ebene durch1794

Hinzunehmen der Gerade nicht verlassen.1795

1796

Hausaufgabe 3.4.1. Es seien U und V Unterraume eines gemeinsamen Vektorraums mit Basen MU und1797

MV . Zeigen Sie, dass U + V durch MU ∪MV erzeugt wird. Ist dies auch immer eine Basis von U + V ?1798

Hausaufgabe 3.4.2. Zeigen Sie, dass folgende Vektoren eine Basis von R4 bilden:1799 1200

,

0230

,

0034

,

5004

.

Hausaufgabe 3.4.3. Im Vektorraum R4 ist ein Unterraum U1 = [b1, b2] mit b1 = (1, 2, 3, 4) und b2 =1800

(1, 0,−1,−2) gegeben. Welche Werte konnen die Dimensionen von U1 ∩ U2 und U1 + U2 fur einen 2-1801

dimensionalen Unterraum U2 annehmen? Geben Sie fur jede Moglichkeit ein konkretes Beispiel fur U2 an.1802

Hausaufgabe 3.4.4. Sei V ein Vektorraum. Seien U,W Unterrume von V . Es gelte dim(U) = 7, dim(W ) =1803

4. Zeigen Sie, welche Dimension U + W und U ∩W haben konnen. Wie groß kann die Dimension von V1804

sein?1805

Hausaufgabe 3.4.5. Wir betrachten folgende Vektoren:1806

v1 :=

4231

, v2 :=

2121

, v3 :=

2132

, v4 :=

4222

.

Bestimmen Sie eine Basis des Spanns von {v1, v2, v3, v4}.1807

Hausaufgabe 3.4.6. Sei M eine unendliche Menge, K ein Korper. Zeigen Sie, dass KM ein unendlich-1808

dimensionaler Vektorraum ist.1809

1810

3.5 Lineare Abbildungen1811

Seine wahre Kraft entfaltet die Theorie der Vektorraume erst, wenn wir Abbildungen zwischen Vektorraumen1812

betrachten.1813

Im folgenden werden wir die Basis eines Vektorraums nicht mehr als Menge {b1, . . . , bn}, sondern als1814

Tupel (b1, . . . , bn) schreiben, also eine Reihenfolge fixieren.1815

Definition 3.28. Seien V und W K-Vektorraume. Eine Abbildung1816

f : V →W

heißt linear, wenn gilt,1817

3.5. LINEARE ABBILDUNGEN 63

1. f(x+ y) = f(x) + f(y) fur alle x, y ∈ V ,1818

2. f(λx) = λf(x) fur alle x ∈ V und λ ∈ K.1819

Man kann die Linearitat alternativ auch mit nur einer Bedingung ausdrucken: Eine Abbildung ist linear1820

genau dann wenn1821

f(λx+ y) = λf(x) + f(y)

fur alle x, y ∈ V und λ ∈ K.1822

Beachten Sie, dass eine lineare Abbildung immer ~0 auf ~0 abbildet (Hausaufgabe).1823

Der nachste Satz besagt, dass eine lineare Abbildung f : V → W eindeutig festgelegt ist, wenn wir die1824

Bilder einer Basis V fixieren.1825

Theorem 3.29. Ist B = (b1, . . . , bn) eine Basis von V und a1, . . . , an ∈ W beliebig, dann gibt es genau1826

eine lineare Abbildung f : V →W mit f(bi) = ai fur i = 1, . . . , n.1827

Beweis. Wir zeigen zuerst, dass es eine solche lineare Abbildung gibt: Fur v ∈ V gibt es eine eindeutige1828

Linearkombination bezuglich der Basis B:1829

v = λ1b1 + . . .+ λnbn

Wir setzen nun1830

f(v) := λ1a1 + . . .+ λnan.

Es ist dann f(bi) = ai, und f ist linear, wie wir nun nachrechnen. Sei v wie oben, und w = µ1b1 + . . .+µnbnein anderer Vektor aus V , und ν ∈ K. Dann ist

f(νv + w) = f(νλ1b1 + . . .+ νλnbn + µ1b1 + . . .+ µnbn)

= f((νλ1 + µ1)b1 + . . .+ (νλn + µn)bn)

= (νλ1 + µ1)a1 + . . .+ (νλn + µn)an

= ν(λ1a1 + . . .+ λnan) + (µ1a1 + . . .+ µnan)

= νf(v) + f(w).

Es gibt also mindestens eine lineare Abbildung f mit der gewunschten Eigenschaft. Ist g eine beliebige1831

lineare Abbildung mit dieser Eigenschaft, dann ist mit v wie oben:1832

g(v) = g(λ1b1 + . . .+ λnbn) = λ1g(b1) + . . .+ λng(bn) = λ1a1 + . . .+ λnan = f(v)

also sind f und g identisch.1833

Als Beispiel betrachten wir einen n-dimensionalen Vektorraum V mit Basis B = (b1, . . . , bn). Fur Kn1834

sei (e1, . . . , en) die Standardbasis, die aus den Einheitsvektoren1835 100...0

,

010...0

, . . . ,

000...1

besteht. Es sei1836

KB : V → Kn

die lineare Abbildung, welche bi auf ei abbildet. Fur ein allgemeines v = λ1b1 + . . .+ λnbn in V gilt dann,1837

KB(v) =

λ1

λ2

...λn

.


Lemma 3.30. Sind f : U → V und g : V →W lineare Abbildungen zwischen Vektorraumen U, V,W , dann1838

gilt:1839

• g ◦ f : U →W ist linear.1840

• Ist f bijektiv, dann ist f−1 : V → U ebenfalls linear.1841

Beweis. Den erste Teil rechnen wir direkt nach:1842

(g ◦ f)(λx+ y) = g(f(λx+ y)) = g(λf(x) + f(y)) = λg(f(x)) + g(f(y)) = λg ◦ f(x) + g ◦ f(y).

Fur den zweiten Teil nehmen wir y1, y2 ∈ Y und λ ∈ K. Da f bijektiv ist, gibt es x1, x2 ∈ U mit1843

f(x1) = y1 und f(x2) = y2. Mit Hilfe der Linearitat von f rechnen wir nach:1844

f−1(λy1 + y2) = f−1(λf(x1) + f(x2)) = f−1(f(λx1 + x2)) = λx1 + x2 = λf−1(y1) + f−1(y2).

1845

Definition 3.31. Eine lineare bijektive Abbildung f : V →W heißt Vektorraumisomorphismus. V und W1846

heißen isomorph, wenn es einen Vektorraumisomorphismus V →W gibt.1847

Isomorph ist griechisch fur “von der gleichen Gestalt”. In der Tat werden zwei isomorphe Vektorraume1848

als gleich angesehen: man kann ganz beliebig von V nach W und zuruck wechseln, ohne die Struktur zu1849

andern. Zum Beispiel ist die Abbildung KB : V → Kn von oben ein Vektorraumisomorphismus. Das zeigt1850

sofort:1851

Theorem 3.32. Ein K-Vektorraum V mit dimV = n <∞ ist isomorph zu Kn.1852

Das heißt also, dass sich die Theorie der endlichdimensionalen Vektorraume sehr vereinfacht: Bis auf1853

Isomorphie ist Kn der einzige n-dimensionale K-Vektorraum.1854

Definition 3.33. Sei f : V →W linear. Dann ist

ker f := {x ∈ V | f(x) = ~0} (Kern von f)

Imf := {y ∈W | ∃x ∈ V : f(x) = y} (Bild von f)

Theorem 3.34. ker f ist ein Unterraum von V , und Imf ist ein Unterraum von W . Falls V endlich-1855

dimensional ist, gilt auch1856

dim ker f + dim Imf = dimV

Beweis. Fur ker f weisen wir die drei Eigenschaften aus Theorem 3.8 nach: Da f(~0) = ~0, ist ker f nicht1857

leer. Ausserdem ist mit a, b ∈ ker f auch f(a + b) = f(a) + f(b) = ~0 + ~0 = ~0, also a + b ∈ ker f . Ebenso1858

ist f(λa) = λf(a) = λ~0 = ~0, also λa ∈ ker f . Der Beweis, dass Imf ein Unterraum von W ist, geht ahnlich1859

einfach.1860

Zum Beweis der Dimensionsformel setzen wir n := dimV . Wir fixieren eine Basis des Kerns {b1, . . . , br}1861

(mit r ≤ n) und erweitern diese Basis zu einer Basis {b1, . . . , br, br+1, . . . , bn} von V . Da dies eine Basis von1862

V ist, ist das Bild von f durch die Bilder der Basisvektoren erzeugt, also1863

Imf =

{f(b1)︸︷︷︸=~0

, . . . , f(br)︸︷︷︸=~0

, f(br+1), . . . , f(bn)}

= [f(br+1), . . . , f(bn)}] .

Beachten Sie, dass wir n = dimV und r = dim ker f fixiert haben. Also mussen wir zeigen, dass dim Imf =1864

n− r gilt. Wie wir gerade gezeigt haben, ist Imf durch n− r Vektoren, namlich f(br+1), . . . , f(bn) erzeugt.1865

Wir mussen nur noch argumentieren, dass diese Vektoren eine Basis bilden, d.h. linear unabhangig sind.1866

Seien also λr+1, . . . , λn ∈ K und1867

~0 = λr+1f(br+1) + . . .+ λnf(bn).

3.6. MATRIZEN 65

Wegen der Linearitat von f folgt1868

~0 = f(λr+1br+1 + . . .+ λnbn︸︷︷︸=:v

),

also ist v ∈ ker f . Damit laßt sich v als Linearkombination von b1, . . . , br schreiben, da dies eine Basis des1869

Kerns ist. Also1870

v = λ1b1 + . . .+ λrbr

fur gewisse λ1, . . . , λr ∈ K. Nach Definition von v gilt also1871

λr+1br+1 + . . .+ λnbn = λ1b1 + . . .+ λrbr

und somit1872

~0 = −λ1b1 − . . .− λrbr + λr+1br+1 + . . .+ λnbn.

Da b1, . . . , bn eine Basis, und damit insbesondere linear unabhangig ist, folgt, dass alle λi Null sein mussen.1873

Also ist insbesondere λr+1 = . . . = λn = 0, was die lineare Unahbhangigkeit von f(br+1), . . . , f(bn) zeigt.1874

1875

Hausaufgabe 3.5.1. Sei f linear. Zeigen Sie, dass f(~0) = ~0.1876

Hausaufgabe 3.5.2. Zeigen Sie, dass eine lineare Abbildung f genau dann injektiv ist, wenn ker f der1877

triviale Unterraum ist.1878

Hausaufgabe 3.5.3. Es sei die lineare Abbildung f : V →W festgelegt durch f(bi) = ai, wobei (b1, . . . , bn)1879

eine Basis von V ist. Zeigen Sie: f ist bijektiv genau dann wenn (a1, . . . , an) eine Basis von W ist.1880

Hausaufgabe 3.5.4. Wir definieren eine Relation ∼ auf K-Vektorraumen durch V ∼W genau dann wenn1881

V und W isomorph sind. Ist ∼ eine Aquivalenzrelation? Was ist die Aquivalenzklasse von Kn?1882

Hausaufgabe 3.5.5. Zeigen Sie, dass Imf , f linear, ein Unterraum ist, wie es in Theorem 3.34 behauptet1883

ist.1884

Hausaufgabe 3.5.6. Sei dimV > dimW . Beweisen Sie, dass es keine injektive lineare Abbildung von V1885

nach W gibt. (Tipp: Verwenden Sie die Hausaufgabe 3.5.2)1886

Hausaufgabe 3.5.7. Sei dimV = dimW . Beweisen Sie, dass eine lineare Abbildung von V nach W injektiv1887

ist, genau dann wenn sie surjektiv ist. (Tipp: Verwenden Sie Hausaufgabe 3.5.2)1888

Hausaufgabe 3.5.8. Welche der folgenden Abbildungen f : K3 → K2 sind linear? (K beliebiger Korper,1889

wenn nicht anders angezeigt)1890

a. (x1, x2, x3) 7→ (x21 + x2

2, 0) fur K = R,Z2.1891

b. (x1, x2, x3) 7→ (0, x1 + x2 + x3)1892

c. (x1, x2, x3) 7→ (1, x1)1893

d. (x1, x2, x3) 7→ (x1, x1 + x2)1894

e. (x1, x2, x3) 7→ (x1, x1)1895


3.6 Matrizen1896

Wir mochten nun lineare Abbildungen von Kn nach Km genauer studieren. Wir fuhren dafur Matrizen als1897

Hilfsmittel ein.1898

Definition 3.35. Eine (m × n)-Matrix A uber einem Korper K ist eine Menge von Elementen aij ∈ K1899

mit 1 ≤ i ≤ m, 1 ≤ j ≤ n. Wir schreiben1900

A =

a11 a12 · · · a1n

a21 a22 · · · a2n

......

. . ....

am1 am2 · · · amn

Im Fall n = 1 ergibt sich der Spezialfall eines Spaltenvektors1901

a11

a21

...am1

und im Fall n = 1 ein Zeilenvektor1902 (

a11 a12 · · · a1n

).

Wir bezeichen die Menge aller (m× n)-Matrizen uber K als Km×n.1903

Wir definieren auch eine Addition auf Km×n auf die offensichtliche Art:1904 a11 a12 · · · a1n

a21 a22 · · · a2n

......

. . ....

am1 am2 · · · amn

+

b11 b12 · · · b1nb21 b22 · · · b2n...

.... . .

...bm1 bm2 · · · bmn

=

a11 + b11 a12 + b12 · · · a1n + b1na21 + b21 a22 + b22 · · · a2n + b2n

......

. . ....

am1 + bm1 am2 + bm2 · · · amn + bmn

Wir definieren auch eine Multiplikation von Matrizen A ∈ Km×r und B ∈ Kr×n (d.h., die Anzahl der1905

Spalten von A ist gleich der Anzahl der Zeilen von B). Zunachst behandeln wir den Fall n = m = 1. Dafur1906

definieren wir die Multiplikation von Zeilen- und Spaltenvektor durch1907

(a1 a2 · · · ar

)·

b1b2...br

:= a1b1 + a2b2 + . . .+ arbr.

Fur A ∈ Km×r und B ∈ Kr×n definieren wir A ·B als eine (m× n)-Matrix C, wobei the Eintrag cij in der1908

Matrix das Produkt der i-ten Zeile von A mit der j-ten Spalte von B ist:1909

cij :=(ai1 ai2 · · · air

)·

b1jb2j...brj

=

r∑k=1

aikbkj

Als Spezialfall ergibt fur A ∈ Km×n und einen Vektor v ∈ Kn die Multiplikation Av einen Spaltenvektor1910

in Km.1911

Hier sind ein paar Beispiel zum Nachrechnen.1912

3.6. MATRIZEN 67

(0 12 3

)·(

3 21 0

)=

(1 09 4

)(

3 21 0

)·(

0 12 3

)=

(4 90 1

)(

2 1 3 61 0 0 2

)·

0131

=

(162

)

Fur λ ∈ K bezeichnen λ · A die Matrix, die entsteht, wenn jeder Eintrag mit λ multipliziert wird. Es1913

gelten die folgenden Rechenregeln:1914

A(B + C) = AB +AC, (B + C)A = BA+ CA ∀A ∈ Km×n, B,C ∈ Kn×k

1915

A(λ ·B) = λ · (AB) ∀A ∈ Km×n, B ∈ Kn×k, λ ∈ K.

Der Nachweis dieser Regeln erfolgt durch direktes Nachrechnen. Da dies etwas langlich ist, fuhren wir1916

es nur fur die erste Gleichung A(B +C) = AB +AC durch: Auf der linken Seite steht, nach Definition des1917

Matrixprodukts, im i, j-Eintrag:1918

r∑k=1

aik(bkj + ckj) =

r∑k=1

aikbkj +

r∑k=1

aikckj .

Auf der rechten Seite steht an der gleichen Stelle1919

r∑k=1

aikbkj +

r∑k=1

aikckj ,

also sind die Matrizen in der Tat in jedem Eintrag gleich.1920

Fur A ∈ Km×n ist die transponierte Matrix AT ∈ Kn×m gegeben durch1921

AT =

a11 a21 · · · an1

a12 a22 · · · an2

......

. . ....

a1m a2m · · · anm

Es gilt (Nachweis ahnlich wie oben), dass1922

(A ·B)T = BT ·AT .

Lemma 3.36. Sei A ∈ Km×n eine Matrix. Dann ist1923

Kn → Km,

x1

...xn

7→ A ·

x1

...xn

eine lineare Abbildung.1924

Wir werden es vermeiden, fur diese Abbildung einen neuen Namen einzufuhren und bezeichnen mit A1925

sowohl die Matrix, als auch die Abbildung.1926

Beweis. Das folgt sofort aus den Rechenregeln von oben, denn A(x+ λy) = Ax+Aλy = Ax+ λAy.1927


Jede Matrix A ∈ Km×n entspricht also einer linearen Abbildung Kn → Km. Es ist vielleicht erstaunlich,1928

dass auch die Ruckrichtung gilt: Jede lineare Abbildung f : Kn → Km kann als Matrix geschrieben werden.1929

Lemma 3.37. Sei f : Kn → Km eine lineare Abbildung. Dann gibt es ein A ∈ Km×n, so dass fur1930

alle x ∈ Kn gilt, dass f(x) = Ax. Dabei ist die j-te Spalte von A als f(ej) gegeben, wobei ej der j-te1931

Einheitsvektor von Kn ist.1932

Beweis. Die Matrix A wie oben beschrieben definiert eine lineare Abbildung. Ferner gilt fur 1 ≤ j ≤ n, dass1933

A · ej = A ·

0...010...0

=

a1j

...amj

= f(ej),

d.h., f und A stimmen auf den Bilder der Basisvektoren e1, . . . , en uberein. Nach Theorem 3.29 heißt das1934

aber schon, dass die Abbildungen gleich sein mussen.1935

Der folgende Satz erklart, warum wir die Matrixmultiplikation auf diese bestimmte Art und Weise1936

eingefugt haben.1937

Lemma 3.38. Seien

f : Kn → Km, x 7→ B · xg : Km → K`, y 7→ A · y

linear mit B ∈ Km×n, A ∈ K`×m. Dann ist die lineare Abbildung1938

g ◦ f : Kn → K`

gegeben durch1939

x 7→ (A ·B)x

Das bedeutet, Matrixmultiplikation entspricht der Hintereinanderausfuhrung der Abbildungen, die durch1940

die Matrizen gegeben sind.1941

Beweis. Der Beweis ist im Prinzip eine Rechnung wie oben, allerdings etwas muhsamer. Fur einen Basis-1942

vektor ei von Kn ist1943

f(ei) =

n∑j=1

bjie′j ,

wobei e′j einen Basisvektor von Km bezeichnet. Genauso ist1944

g(e′j) =∑k=1

akje′′k

mit e′′k ein Basisvektor von K`. Nun konnen wir das Bild von ei unter g ◦ f aufschreiben:1945

(g ◦ f)(ei) = g(

n∑j=1

bjie′j) =

n∑j=1

bjig(e′j) =

n∑j=1

bji∑k=1

akje′′k =

n∑j=1

∑k=1

bjiakje′′k =

∑k=1

n∑j=1

akjbji

e′′k

3.6. MATRIZEN 69

Sei C die Matrix der linearen Abbildung g ◦f . Dann ist nach dieser Rechnung die i-te Spalte von C gegeben1946

durch1947 ∑nj=1 a1jbji∑nj=1 a2jbji

...∑nj=1 a`jbji

.

Das bedeutet aber, cki =∑nj=1 akjbji, also C = AB.1948

Als Beispiel betrachten wir den Vektorraum V aller Polynome vom Grad ≤ 3. Wir verwenden die Basis1949

B = (1, x, x2, x3). Wie ublich ist1950

KB : V → R4, ax3 + bx2 + cx+ d 7→

abcd

Nun betrachten wir folgende Abbildung:1951

δ : V → V, x 7→ K−1B ◦D ◦KB(x) mit D =

0 0 0 03 0 0 00 2 0 00 0 1 0

.

Zum Beispiel ist1952

δ(2x3 + 4x2 − 3x+ 6) = K−1B (D

24−36

) = K−1B (

068−3

) = 6x2 + 8x− 3

Es ist in der Tat so, dass δ die Ableitung eines Polynoms berechnet.1953

Wir kommen nun noch zu einer wesentlichen Definition, die uns im nachsten Abschnitt beschaftigen wird:1954

Definition 3.39. Fur eine Matrix A ∈ Km×n ist der Rang von A definiert als1955

rk A := dim ImA = dim [{A1, . . . , An}]

wobei A1, . . . , An die Spalten von A sind.1956

Lemma 3.40. rk A ist die maximale Anzahl von linear unabhangigen Spalten in A.1957

Beweis. ImA ist erzeugt von {A1, . . . , An}. Solange diese Menge nicht linear unabhangig ist, losche ein Ai aus1958

der Liste, welches eine Linearkombination der anderen Elemente ist. Wir erhalten eine linear unabhangige1959

Menge von Spalten; nehmen wir der Einfachheit halber an, die Spalten A1, . . . , Ar bleiben ubrig. Dann ist1960

ImA = [A1, . . . , Ar], also dim ImA = r. Andererseits kann es keine grossere Menge von linear unabhangigen1961

Spalten geben, denn diese wurden dann einen (mindestens) (r + 1)-dimensionalen Unterraum von ImA1962

erzeugen.1963

Es gilt daruberhinaus auch, dass rk A = rk AT (Beweis lassen wir weg). Damit ist rk A auch die1964

maximale Anzahl an linear unabhangigen Zeilen einer Matrix. Als Beispiel betrachten wir1965

A =

(3 2 4 3 2 16 5 1 −1 0 3

)


Es gilt dann1966

rk A = rk AT =

3 62 54 13 −12 01 3

= 2,

denn die beiden Spalten sind offensichtlich linear unabhangig.1967

1968

Hausaufgabe 3.6.1. Weisen Sie nach, dass Km×n mit Matrizenaddition eine abelsche Gruppe ist.1969

Hausaufgabe 3.6.2. Die Matrizenmultiplikation ergibt fur zwei Matrizen A,B ∈ Kn×n wieder eine Matrix1970

C ∈ Kn×n. Wird dadurch Kn×n mit Addition und Multiplikation zu einem Korper?1971

Hausaufgabe 3.6.3. Weisen Sie nach, dass (A ·B)T = BT ·AT .1972

Hausaufgabe 3.6.4. Passen Sie die Funktion δ von oben so an, dass nicht die Ableitung, sondern eine1973

Stammfunktion berechnet wird, d.h. fur ein Polynom f (vom Grad ≤ 3) soll sich ein Polynom g ergeben, so1974

dass g′ = f gilt.1975

3.7 Rechenverfahren1976

Bislang haben wir fur die meisten vorgestellten Konzepte keine allgemeinen Losungsverfahren. Wie findet1977

man fur eine Menge von Vektoren heraus, ob sie linear unabhangig sind? Wie bestimmen wir den Rang1978

einer Matrix? Wir finden wir eine Basis fur den Kern einer linearen Abbildung? Wir werden sehen, dass1979

sich alle diese Fragen mit einem einzigen Verfahren losen lassen, dem Gauß’schen Algorithmus.1980

Definition 3.41. Sei A ∈ Km×n eine Matrix mit Zeilen z1, . . . , zn, d.h.1981

A =

z1

...zm

.

Eine elementare Zeilenoperation auf A ist eine Manipulation der Matrix A zu einer Matrix A′ auf eine der1982

drei folgenden Arten:1983

(1) A′ =

z2

z1

z3

z4

...zn

(2) A′ =

z1

...zi−1

λzizi+1

...zn

(3) A′ =

z1

...zi−1

zi + λzjzi+1

...zn

1. Vertauschen von zwei Zeilen i 6= j (Zeile 1 und 2 im Beispiel).1984

2. Multiplikation einer Zeile zi mit λ ∈ K \ {0}.1985

3. Addition von λ · zj zu zi mit i 6= j.1986

Elementare Spaltenoperationen sind analog definiert.1987

Lemma 3.42. Der Rang einer Matrix andert sich durch eine elementare Zeilen- oder Spaltenoperation1988

nicht.1989

3.7. RECHENVERFAHREN 71

Beweis. Wir zeigen dies zunachst fur eine elementare Spaltenoperation: Erinnern Sie sich, dass der Rang1990

einer Matrix die Dimension des Raums ist, der durch die Spaltenvektoren aufgespannt ist. Es ist vollig klar,1991

dass sich dieser nicht andert, wenn wir die Reihenfolge der Spalten tauschen. Fur die anderen beiden Typen1992

von Operationen verwenden wir Korollar 3.16: Wir ersetzen Ai (die i-te Spalte von A) entweder durch λAi1993

mit λ 6= 0, oder durch Ai + λAj . In beiden Fallen ist die neue Spalte eine Linearkombination der alten1994

Spalten, in welcher der Koeffizient von Ai nicht 0 ist. Daraus folgt, dass sich der Spann der Spalten nicht1995

andert, also auch die Dimension nicht.1996

Fur elementare Zeilenoperationen bemerken wir, dass eine elementare Zeilenoperation auf A eine ele-1997

mentare Spaltenoperation auf AT ist. Da rk A = rk AT , folgt die Aussage damit sofort.1998

Das Lemma besagt naturlich auch, dass eine (endliche) Sequenz von elementaren Zeilen- und Spalten-1999

operationen den Rang nicht andert. Wir konnen also die Matrix durch eine solche Sequenz in eine “schone”2000

Gestalt bringen, fur welche wir den Rang sofort ablesen konnen. Diese Gestalt heißt Zeilenstufenform. In2001

Abbildung 3.1 erklaren wir diese intuitiv. Die formale Definition folgt.2002

Abbildung 3.1: Eine Matrix ist in Zeilenstufenform, wenn sie die abgebildete Gestalt hat: alle Eintrageunterhalb der Trennlinie mussen 0 sein, und alle Eintrage, die mit ∗ gekennzeichnet sind,mussen 6= 0 sein. Fur die restlichen Eintrage oberhalb der Trennlinie fordern wir keineweiteren Eigenschaften. Wir nennen die ∗-Eintrage Pivotelemente.

Definition 3.43. Eine Matrix A ∈ Km×n mit Zeilenvektoren z1, . . . , zm ist in Zeilenstufenform (ZSF),2003

wenn gilt:2004

1. Es gibt ein r ∈ {0, . . . , n}, zi 6= 0 fur i = 1, . . . , r, und zj = 0 fur j = i+ 1, . . . , n.2005

2. Fur i = 1, . . . , r bezeichne ji den kleinsten Spaltenindex fur den zi von 0 verschieden ist. Anders2006

gesagt:2007

ji := min{j | aij 6= 0}(ein solcher Eintrag existiert, da die i-Zeile nicht 0 ist). Es gilt dann2008

j1 < j2 < . . . < jr.

Die Eintrage an den Stellen (i, ji) fır i = 1, . . . , r heißen Pivotelemente von A.2009

Zum Beispiel sind die Matrizen2010 1 3 20 1 50 0 2

0 1 2 30 0 0 70 0 0 0

beide in ZSF. Die erste Matrix hat ihre Pivotelemente an der Stellen (1, 1), (2, 2) und (3, 3). Die zweite2011

Matrix an den Stellen (1, 2) und (2, 4). Dagegen ist die Matrix2012 1 1 4 0 70 0 3 4 00 1 6 1 30 0 0 0 0


nicht in ZSF, da j2 = 3 > 2 = j3 gilt. Die Matrix kann jedoch in ZSF gebracht werden, wenn man die zweite2013

und dritte Spalte vertauscht.2014

Beachten Sie auch, dass die Nullmatrix (mit allen Eintragen = 0) in ZSF ist (wahle r = 0 in der2015

Definition).2016

Theorem 3.44. Jede Matrix kann durch eine Sequenz von elementaren Zeilenoperationen in Zeilenstufen-2017

form gebracht werden.2018

Beweis. Der folgende Beweis ist konstruktiv und gibt ein Verfahren an, welches die gewunschte ZSF erreicht.2019

Man bezeichnet dieses Verfahren als Gauß’sches Eliminationsverfahren.2020

Sei A ∈ Km×n. Ist A die Nullmatrix, ist ZSF bereits erreicht. Sonst wahlen wir uns die Spalte j von2021

A mit kleinstem Index, welche nicht der Nullvektor ist (d.h. A1 = A2 = . . . = Aj−1 = ~0, Aj 6= ~0). Ist der2022

Eintrag aij = 0, so wahlen wir ein i mit aij 6= 0 und vertauschen die i-te und die j-te Zeile. Damit ist2023

a1j 6= 0 sichergestellt. Nun verwenden wir den Eintrag a1j , um alle Eintrage aij mit i > 1 zu eliminieren.2024

Das geschieht mit den Operationen2025

zi ← zi −aija1j

z1

fur i = 2, . . . ,m, wobei zi die i-te Zeile der Matrix ist. Nach diesen Schritten ist die j-te Spalte der Matrix2026

von der Form2027 ∗0...0

mit ∗ = aij 6= 0.2028

Nun betrachte die Matrix A′ ∈ K(m−1)×(n−j), die sich aus den Zeilen 2, . . . ,m und Spalten j + 1, . . . , n2029

zusammensetzt (falls j = n, ist nichts mehr zu tun). Wir bringen diese Matrix nun mit dem gleichen2030

Verfahren in Zeilenstufenform. Beachten Sie, dass Zeilenoperationen in A′ auch als Zeilenoperationen in A2031

aufgefasst werden konnen. Da alle Zeilen in A und in A′ sich nur durch fuhrende Nullen unterscheiden,2032

andert das an der Struktur von A nichts.2033

Wir mussen argumentieren, dass dieses Verfahren immer terminiert (d.h. nach endlich vielen Schritten2034

endet) und in der Tat eine Matrix in Zeilenstufenform liefert. Beachten Sie, dass das Verfahren sukzessive2035

auf immer kleineren Matrizen aufgerufen wird: In der Tat hat A′ eine Zeile weniger als A, und (mindestens)2036

eine Spalte weniger. Das bedeutet, wir mussen nach endlich vielen Iterationen terminieren. Wir erhalten2037

auch in der Tat eine Zeilenstufenform, da wir in jeder Iteration genau ein Pivotelement erzeugen. Wir lassen2038

weitere Details weg.2039

Schauen wir uns ein Beispiel an:2040 0 0 0 0 12 10 4 8 2 12 120 8 16 4 6 210 2 4 1 3 50 6 12 3 21 13

Hier ist j = 2 (die erste nicht-triviale Spalte). Da im Eintrag (1, 2) eine 0 steht, mussen wir die erste Zeile2041

mit einer anderen Zeile tauschen. Wir nehmen hier die vierte Zeile und erhalten2042 0 2 4 1 3 50 4 8 2 12 120 8 16 4 6 210 0 0 0 12 10 6 12 3 21 13

3.7. RECHENVERFAHREN 73

Nun verwenden wir die erste Zeile, um die zweite Spalte zu eliminieren: Wir ziehen von der zweiten Zeile2043

zweimal die erste Zeile ab und erhalten2044 0 2 4 1 3 50 0 0 0 6 20 8 16 4 6 210 0 0 0 12 10 6 12 3 21 13

Nun ziehen wir von der dritten Zeile viermal die erste ab, und von der funften Zeile dreimal die erste:2045

0 2 4 1 3 50 0 0 0 6 20 0 0 0 −6 10 0 0 0 12 10 0 0 0 12 −2

Nun bringen wir die Matrix, die aus den Zeilen 2 − 5 und den Spalten 3 − 6 besteht, in ZSF. Anstatt die2046

kleinere Matrix getrennt hinzuschreiben, fuhren wir dies direkt in der grosseren Matrix durch. Wir sehen,2047

dass die dritte Spalte der kleineren Matrix (d.h. die funfte Spalte der grossen Matrix) die erste nicht- triviale2048

Spalte ist. Hier steht in der obersten Zeile ein von 0 verschiedener Eintrag. Wir verwenden diesen, um den2049

Rest der Spalte zu eliminieren: Wir addieren die erste Zeile zur zweiten Zeile, und subtrahieren zweimal die2050

erste Zeile jeweils von der dritten und vierten Zeile (alles bezuglich der kleineren Matrix).2051 0 2 4 1 3 50 0 0 0 6 20 0 0 0 0 30 0 0 0 0 −30 0 0 0 0 −6

Nun bringen wir die 3× 1-Matrix in der letzten Spalte auf Zeilenstufenform. Das ist nun recht einfach: Wir2052

addieren die erste Zeile einmal auf die zweite Zeile, und zweimal auf die dritte Zeile. Dadurch ergibt sich2053

letztendlich2054 0 2 4 1 3 50 0 0 0 6 20 0 0 0 0 30 0 0 0 0 00 0 0 0 0 0

und diese Matrix ist in Zeilenstufenform. Die drei Pivotelemente sind fett geschrieben.2055

Einige Bemerkungen zu diesem Verfahren2056

• Im Beispiel oben konnten wir Bruche vermeiden. Allerdings ist das nicht immer moglich.2057

• Der zweite Typ von elementaren Zeilenoperationen (Multiplikation einer Zeile mit λ 6= 0) wird im2058

Verfahren nicht verwendet. Allerdings kann es manchmal hilfreich sein, solche Multiplikationen einzu-2059

bauen. Hat man zum Beispiel eine Zeile2060 (17 −51 34

).

Dann lasst sich diese durch Multiplikation von 117 in2061 (

1 −3 2)

uberfuhren. Das kann die Rechnungen erheblich vereinfachen. Man kann dies auch verwenden, um2062

Bruche zu vermeiden, indem man mit dem Hauptnenner multipliziert.2063


• Um eine Spalte zu eliminieren, fuhrt das Verfahren eventuell einen Zeilentausch aus, um einen Nullein-2064

trag in der obersten Zeile zu vermeiden. Selbst wenn der oberste Eintrag nicht 0 ist, ist ein Zeilentausch2065

naturlich erlaubt. Es ist meist ratsam, einen moglichst einfachen Eintrag zu wahlen, mit dem man2066

den Rest eliminert. Hat man zum Beispiel eine Matrix2067 72 ∗ . . . ∗−37 ∗ . . . ∗

1 ∗ . . . ∗103 ∗ . . . ∗

,

so ist es ratsam, die erste und dritte Zeile zu tauschen, bevor man eliminiert.2068

Lemma 3.45. Sei A eine Matrix in Zeilenstufenform mit r von 0 verschiedenen Zeilen. Dann ist rk A = r.2069

Beweis. Es seien z1, . . . , zm die Zeilen von A. Nach Voraussetzung ist zr+1 = zr+2 = . . . = zm = 0.2070

Andererseits ist rk A die Dimension des Raums, der von z1, . . . , zm aufgespannt wird (denn rk A = rk AT ).2071

Da Nullvektoren offenbar nichts zum Spann beitragen, gilt also2072

rk A = dim [z1, . . . , zr] ≤ r.

Um auszuschliessen, dass rk A < r ist, mussen wir zeigen, dass z1, . . . , zr linear unabhangig sind. Das folgt2073

aber leicht aus der Stufenform: Sei2074

λ1z1 + . . .+ λrzr = ~0

fur λ1, . . . , λr ∈ K. Wegen der Zeilenstufenform gibt es einen Spaltenindex j1, so dass z1 6= 0 in der Spalte2075

j1 ist, aber z2, . . . , zr alle in dieser Spalte eine 0 haben. Die Gleichung oben ergibt also in der Komponente2076

j1, dass2077

λ1z(j1)1 + λ2z

(j1)2 + . . .+ λ(j1)

r zr = 0 ⇔ λ1 z(j1)1︸︷︷︸6=0

= 0

d.h. λ1 = 0. Es gibt nun eine Spalte j2, in der z2 von 0 verschieden ist, aber z3, . . . , zn alle 0 sind. Es folgt dann2078

genauso, dass auch λ2 = 0 ist. Wiederholen wir das Argument r-mal, ergibt sich λ1 = λ2 = . . . = λr = 0,2079

also sind z1, . . . , zr linear unabhangig.2080

Wir haben damit ein Rechenverfahren, um den Rang einer beliebigen Matrix zu bestimmen:2081

1. Bringe A auf Zeilenstufenform.2082

2. Zahle die Zeilen, die von 0 verschieden sind.2083

Ebenso haben wir ein Verfahren, um festzustellen, ob Vektoren v1, . . . , vn linear unabhangig sind:2084

1. Berechne den Rang der Matrix A := (v1v2 . . . vn)2085

2. Ist rk A = n, dann sind die Vektoren linear unabhangig, sonst linear abhangig2086

Die Korrektheit folgt daraus, dass der Rang einer Matrix gleich der maximale Anzahl an linear un-2087

abhangigen Spalten ist (Lemma 3.40). Wir hatten die Matrix A auch so definieren konnen, dass ihre Zeilen2088

v1, . . . , vn sind (wiederum, weil rk A = rk AT ).2089

Wir konnen nun auch eine Basis fur den durch v1, . . . , vn aufgespannten Vektorraum berechnen:2090

1. Bringe2091

A :=

v1

...vn

in Zeilenstufenform.2092

2. Die von 0 verschiedenen Zeilen defineren eine Basis von [v1, . . . , vn].2093

3.8. LINEARE GLEICHUNGSSYSTEME 75

In der Tat andern elementare Zeilenoperationen den durch die Zeilen aufgespannten Raum nicht, al-2094

so spannen die von 0 verschiedenen Zeilen der ZSF den Raum [v1, . . . , vn] auf. Wie wir im Beweis von2095

Lemma 3.45 gesehen haben, sind diese Vektoren linear unabhangig, also eine Basis.2096

2097

Hausaufgabe 3.7.1. Zeigen Sie: Falls A′ aus A durch eine elementare Zeilenoperation hervorgeht, dann2098

geht auch A aus A′ durch eine elementare Zeilenoperation hervor.2099

Hausaufgabe 3.7.2. Berechnen Sie den Rang der folgenden Matrizen:2100

a.

1 2 3 42 3 4 53 4 5 64 5 6 7

2101

b.

1 2 3 22 3 4 23 4 5 2

2102

c.

1 2 1 2−2 −3 0 −54 9 6 71 −1 −5 5

2103

d.

1 1 −1 2λ 1 1 11 −1 3 −34 2 0 λ

2104

Hausaufgabe 3.7.3. Berechnen Sie den Rang der n× n-Matrize je nach Werten von a, b ∈ R:2105 a b · · · b

b. . .

. . ....

.... . .

. . . bb · · · b a

3.8 Lineare Gleichungssysteme2106

Betrachten Sie die folgenden mathematischen Problemstellungen:2107

Problem A: Eine Chemikerin hat die folgenden Flussigkeiten zur Verfugung:2108

– 300L mit 80% H2O (Wasser) und 20% andere Stoffe2109

– 1.4L mit 20% H2O und 70% H2SO4 (Schwefelsaure) (und 10% andere Stoffe)2110

– 3.2L mit 40% H2O und 60% H2SO42111

Ist es moglich, daraus eine Flussigkeit zu mischen, die zu 40% aus H2O, 56% aus H2SO4, und 4% aus2112

anderen Stoffen besteht?2113

Problem B: Sei E die Ebene im R3, die durch die Punkte2114 152

,

−124

,

013

aufgespannt wird. Bestimme einen Vektor v ∈ R3, so dass2115

E :={x ∈ R3 | vT · x = 1

}(v ist der Normalenvektor der Ebene).2116

Problem C: Bestimmen Sie ein Polynom vom Grad 4, welches durch die Punkte (−2, 3), (−1, 1), (0,−2),2117

(1, 3) und (2, 0) geht.2118


Alle diese Probleme lassen sich mit der gleichen Technik losen.2119

Definition 3.46. Ein lineares Gleichungssystem (LGS) in den Unbekannten x1, . . . , xn ist eine Sequenzvon Gleichungen der Form

a11x1 + a12x2 + . . .+ a1nxn = b1

a21x1 + a22x2 + . . .+ a2nxn = b2

...

am1x1 + am2x2 + . . .+ amnxn = bm

mit a11, . . . , amn, b1, . . . , bm ∈ K. Ein Vektor

x1

...xn

ist Losung eines LGS, wenn es alle m Gleichungen2120

erfullt. Wir konnen das LGS auch schreiben als2121

Ax = b

mit2122

A = (aij) ∈ Km×n, b =

b1...bm

, x =

x1

...xn

Wir behandeln drei Probleme bezuglich eines gegebenes Gleichungssystems:2123

1. Existiert eine Losung?2124

2. Falls ja, finde eine Losung.2125

3. Finde alle Losungen.2126

Beachten Sie, dass wir eine Matrix in Km×(n+1) als lineares Gleichungssystem auffassen konnen, in dem2127

wir die ersten n Spalten als A und die letzte Spalte als b interpretieren. Wir schreiben (A | b) fur eine solche2128

Matrix. Entscheidend wird die folgende Eigenschaft sein.2129

Lemma 3.47. Die Losungsmenge eines linearen Gleichungssystems (A | b) andert sich bei elementaren2130

Zeilenoperationen nicht.2131

Beweis. Sei x eine Losung von Ax = b. Dann bleibt x offensichtlich eine Losung, wenn man die Reihenfolge2132

der Gleichungen vertausche (erste elementare Operation). x bleibt auch eine Losung, wenn man eine Glei-2133

chung mit einem Vielfachen λ multiplizieren (zweite elementare Operation). Ebenfalls bleibt x eine Losung2134

der i-ten Gleichung, wenn man ein Vielfaches der j-ten Gleichung dazuaddiert (dritte elementare Operati-2135

on). Das bedeutet, dass die Losung x erhalten bleibt. Es kann auch keine neue Losung hinzukommen (das2136

folgt aus Hausaufgabe 3.7.1).2137

Fall b = ~0.2138

Wir betrachten zuerst den Spezialfall Ax = ~0. Hier gibt es immer mindestens eine Losung, namlich x = ~0.2139

Wir werden nun ein Verfahren angeben, alle Losungen zu bestimmen.2140

Zunachst bringen wir A auf Zeilenstufenform. Nach Lemma 3.47 andert sich dabei die Losungsmenge2141

von Ax = ~0 nicht (genau genommen mussten wir die Matrix (A | ~0) betrachten, aber da die letzte Spalte2142

immer gleich ~0 bleibt, konnen wir sie ignorieren). Nennen wir A′ die Zeilenstufenform von A.2143

Nun nennen wir die Variable xi gebunden, falls A′ ein Pivotelement in Spalte i hat. Falls xi nicht2144

gebunden ist, nennen wir es frei. Zum Beispiel sind fur die Matrix2145 1 2 3 40 0 5 60 0 0 0


die Variablen x1 und x3 gebunden (denn in der 1. und 3. Spalte stehen Pivotelemente), und die Variablen2146

x2 und x4 frei.2147

Wir wahlen nun Parameter fur die freien Variablen und drucken die gebundenen Variablen durch diese2148

Parameter aus. Fur jede Wahl der freien Parameter erhalten wir dann eine Losung des Systems (und wir2149

erhalten alle Losungen auf diese Weise).2150

Wir demonstrieren das Verfahren an einem Beispiel:

3x1 + 4x3 + 2x4 = 0

4x1 − x2 + x3 + 4x4 = 0

2x1 + x2 + 7x3 = 0

Als Matrix geschrieben ergibt sich die folgende Matrix, die wir gleich in Zeilenstufenform bringen2151 3 0 4 24 −1 1 42 1 7 0

→ 3 0 4 2

0 −1 − 133

43

0 1 133 − 4

3

→ 3 0 4 2

0 -1 − 133

43

0 0 0 0

Wir sehen, dass x3 und x4 frei sind. Wir setzen x3 auf λ und x4 auf µ, wobei λ, µ ∈ K beliebig sind. Die2152

zweite Zeile der ZSF liefert nun2153

−x2 −13

3λ+

4

3µ = 0 ⇔ x2 = −13

3λ+

4

3µ

Die erste Zeile ergibt2154

3x1 + 4λ+ 2µ = 0 ⇔ x1 = −4

3λ− 2

3µ

Das bedeutet, die Losungen von Ax = ~0 sind von der Form2155 − 4

3λ−23µ

− 133 λ+ 4

3µλµ

= λ

− 4

3− 13

310

+ µ

− 2

34301

oder anders ausgedruckt, die Losungsmenge des Gleichungssystems ist2156

43− 13

310

,

− 2

34301

.

Es ist kein Zufall, dass die Losungsmenge ein Vektorraum ist: Schliesslich ist Ax = ~0 genau dann, wenn2157

x ∈ kerA liegt, wenn wir A als lineare Abbildung auffassen. Und wir wissen bereits, dass kerA ein Unterraum2158

ist. Wir nennen daher die Losungsmenge auch den Losungsraum des Gleichungssystems.2159

Wir wissen auch, dass dim kerA = n−dim ImA, wobei n die Anzahl der Spalten von A ist. Da dim ImA =2160

rk A, ist n−dim ImA genau die Anzahl der freien Variablen. Wir erhalten Basisvektoren des Losungsraums,2161

indem wir eine freie Variable auf 1 und den Rest auf 0 setzen und die (eindeutige) Losung mit diesen freien2162

Variablen berechnen.2163

Im Beispiel oben ergibt sich fur x3 = 1 und x4 = 0:

−x2 −13

3= 0 ⇔ x2 = −13

3

3x1 + 4 = 0 ⇔ x1 = −4

3

also der Vektor2164 − 4

3− 13

310


und fur x3 = 0, x4 = 1 der Vektor2165 − 2

34301

.

Es ist eine Frage des Geschmacks, ob man lieber eine grossere Rechnung (wie oben) oder mehrere kleinere2166

Rechnungen (wie gerade gesehen) durchfuhren mochte.2167

Allgemeiner Fall.2168

Nun sprechen wir uber ein allgemeines System Ax = b. Hier ist es nicht mehr ohne weiteres klar, ob es eine2169

Losung gibt. Allerdings gibt die Zeilenstufenform die Antwort:2170

Lemma 3.48. Das Gleichungssystem Ax = b hat eine Losung genau dann, wenn es in der Zeilenstufenform2171

von (A | b) kein Pivotelement in der b-Spalte gibt.2172

Beweis. Gibt es in der b-Spalte ein Pivotelement, sagen wir in Zeile i, bedeutet dies, dass die i-te Zeile2173

komplett 0 ist bis auf den letzten Eintrag bi, welcher nicht 0 ist (denn Pivotlemente sind per Definition2174

nicht 0). Die entsprechende Gleichung ist dann 0x1 + 0x2 + . . . + 0xn = bi, und diese Gleichung kann2175

offenbar nicht erfullt werden.2176

Ist umgekehrt kein Pivotelement in der b-Spalte, so ergibt sich immer eine Losung, indem man (zum2177

Beispiel) die freien Variablen auf 0 setzt und die gebundenen Variablen so wahlt, dass alle Gleichungen2178

erfullt sind.2179

Statt die Details des zweiten Teils weiter auszubreiten, zeigen wir das Prinzip an einem Beispiel. Be-2180

trachte die folgende Matrix in Zeilenstufenform2181 1 3 5 30 2 4 −10 0 0 0

Es ist kein Pivotelement in der vierten Spalte, und x3 ist eine freie Variable. Setzen wir x3 = 0, ergibt sich2182

aus der zweiten Zeile 2x2 = −1, also ist x2 = − 12 . Die erste Zeile ergibt dann x1 − 3

2 = 3, also x1 = 92 . Es2183

ergibt sich also2184 92− 1

20

als eine Losung.2185

Wir haben nun ein Verfahren um zu bestimmen, ob Ax = b eine Losung besitzt, und konnen eine solche2186

Losung ausrechnen. Der folgende Satz liefert samtliche Losungen des Systems:2187

Theorem 3.49. Sei x0 eine Losung von Ax = b. Dann ist2188

x0 + ker A := {x0 + x′ | Ax′ = ~0}

die Losungsmenge von Ax = b.2189

Beweis. Ist Ax′ = ~0, dann ist2190

A(x0 + x′) = A(x0) +A(x′) = b+~0 = b

also ist x0 + x′ in der Tat eine Losung. Das bedeutet, x0 + ker A ist eine Teilmenge der Losungsmenge.2191

Umgekehrt, falls x1 eine Losung von Ax = b ist, dann ist Ax1 = b = Ax0, also A(x1 − x0) = ~0. Das heißt,2192

dass x′ := x1 − x0 ∈ ker A. Also ist x1 von der Form x0 + x′ mit x′ ∈ ker A.2193


Dieses Theorem liefert ein Rechenverfahren, um alle Losungen zu bestimmen. Zunachst schaut man, ob2194

uberhaupt eine Losung existiert, und berechnet gegebenenfalls eine Losung x0, wie in Lemma 3.48 erklart.2195

Dann lost man das Gleichungssystem Ax = 0 wie im vorherigen Abschnitt erklart und hat die Losungsmenge2196

x0 + ker A gefunden. Dieses Verfahren ist etwas umstandlich, denn man kann die gesamte Losungsmenge2197

auch in einem Schritt berechnen, wie wir gleich in einem Beispiel sehen werden. Allerdings gibt der Satz die2198

Struktur der Losungsmenge vor.2199

Definition 3.50. Ein affiner Raum im Kn ist eine Menge2200

A := x0 + U

mit x0 ∈ Kn und U ein Unterraum von Kn. Die Dimension von A ist als Dimension von U definiert.2201

Ein affiner Raum ist also einfach ein “verschobener” Unterraum. Beachten Sie, dass ein affiner Raum im2202

Allgemeinen kein Unterraum von Kn ist. Aus Theorem 3.49 folgt:2203

Korollar 3.51. Die Losungsmenge eines linearen Gleichungssystem ist entweder die leere Menge, oder ein2204

affiner Unterraum. Wir sprechen daher auch vom Losungsraum eines linearen Gleichungssystems.2205

Wir schauen uns nun ein geometrisches Beispiel an. Wir bestimmen E1 ∩ E2 mit E1, E2 zwei Ebenengegeben durch:

E1 :=

x ∈ R3 | x =

21−1

+ λ1

111

+ λ2

13−1

,

E2 :=

x ∈ R3 | x =

202

+ µ1

012

+ µ2

1−11

.

Die Punkte in E1 ∩ E2 sind durch ein lineares Gleichungssystem beschrieben. Wir sehen das wie folgt:2206

Falls x ∈ E1 ∩ E2, so gibt es λ1, λ2, so dass2207

x =

21−1

+ λ1

111

+ λ2

13−1

und µ1, µ2, so dass2208

x =

202

+ µ1

012

+ µ2

1−11

.

Gleichsetzen liefert dann, dass2209 21−1

+ λ1

111

+ λ2

13−1

− 2

02

− µ1

012

− µ2

1−11

= ~0

was sich aquivalent umschreiben lasst als2210

λ1

111

+ λ2

13−1

+ µ1

0−1−2

+ µ2

−11−1

=

0−13

bzw. in Matrixschreibweise als2211 1 1 0 −1

1 3 −1 11 −1 −2 −1

λ1

λ2

µ1

µ2

=

0−13


Wir losen dieses linear Gleichungssystem nun, in dem wir die Matrix (A | b) auf Zeilenstufenform bringen:2212 1 1 0 −1 01 3 −1 1 −11 −1 −2 −1 3

→ 1 1 0 −1 0

0 2 −1 2 −10 −2 −2 0 3

→ 1 1 0 −1 0

0 2 −1 2 −10 0 −3 2 2

Hier ist die vierte Variable (also µ2) frei. Wir setzen t := µ2. Damit ergibt sich aus der dritten Zeile, dass2213

µ1 = 2t−23 . Wir erhalten auch aus der zweiten Zeile, dass 2λ2 − µ1 + 2µ2 = −1, und Einsetzen von µ1 und2214

µ2 liefert λ2 = − 23 t−

56 . Aus der ersten Gleichung folgt dann λ1 = 5

3 t+ 56 . Es ergibt sich die Losungsmenge2215

53 t+ 5

6− 2

3 t−56

23 t−

23

t

| t ∈ R

.

Das liefert alle λ1, λ2, µ1, µ2, so dass x die beiden Gleichungen oben erfullt. Insbesondere ist x ∈ E1 ∩ E22216

genau dann, wenn2217

x =

202

+ (2

3t− 2

3)

012

+ t

1−11

=

2− 2

323

+ t

1− 1

373

mit t ∈ R beliebig. Es folgt, dass E1∩E2 die Gerade mit Richtungsvektor

1− 1

373

ist, die durch

2− 2

323

2218

verlauft.2219

2220

Hausaufgabe 3.8.1. Zeigen Sie, dass ein affiner Raum A genau dann ein Unterraum ist, wenn er ~02221

enthalt.2222

Hausaufgabe 3.8.2. Sei p(x) ein Grad 4 Polynom in R, mit p(1) = 18, p(2) = 174, p(3) = 776, p(4) = 23222223

und p(5) = 5502. Rechnen Sie die Koeffizienten von p(x) aus.2224

Hausaufgabe 3.8.3. Seien A und B zwei Geraden in R3. Berechnen Sie den Schnittpunkt von A und B,2225

falls es ihn gibt, wenn:2226

a. A =

10−415

+ λ ·

3−24

|λ ∈ R

und B =

17

12−9

+ λ ·

85−6

|λ ∈ R

,2227

b. A =

10

17−9

+ λ ·

35−5

|λ ∈ R

und B =

5

20−15

+ λ ·

29−9

|λ ∈ R

.2228

Hausaufgabe 3.8.4. Losen Sie die folgenden reellen linearen Gleichungssysteme Ax = s, wobei die erwei-2229

terte Matrix (A | s) wie folgt gegeben ist:2230

a.

1 2 0 3 30 0 1 −1 02 4 2 4 61 2 −1 4 3

2231 c.

1 −1 7 7 140 1 2 2 52 0 20 20 421 −2 5 5 10

2232

3.9. SKALARPRODUKTE 81

e.

2 1 0 4 71 3 −1 7 −50 −1 1 −2 41 1 0 3 2

2233

b.

1 2 0 3 40 0 1 −1 12 4 2 4 121 2 −1 4 4

2234

d.

1 −1 7 7 00 1 2 2 12 0 20 20 21 −2 5 5 −1

2235

f.

2 1 0 4 41 3 −1 7 40 −1 1 −2 01 1 0 3 3

2236

Hinweis: Je zwei Systeme mit der selben Matrix A simultan losen.2237

Hausaufgabe 3.8.5. Wenn ein Glas Limonade, drei belegte Brote und sieben Kekse 14 Schilling kosten,2238

und ein Glas Limonade, vier belegte Brote, zehn Kekse 17 Schilling, wieviel kosten dann (wenn moglich):2239

a. ein Glas Limonade, ein belegtes Brot und ein Keks?2240

b. zwei Glas Limonade, drei belegte Brote und funf Kekse?2241

c. nur ein Glas Limonade?2242

Hausaufgabe 3.8.6. Betrachten Sie die Punkte im R32243

a =

123

b =

−12−3

c =

345

und geben Sie als Losungsmenge eines linearen Gleichungssystems die jeweils kleinsten affinen Unterraume2244

an,2245

a. die a enthalten,2246

b. die a, b enthalten,2247

c. die a, b, c enthalten.2248

3.9 Skalarprodukte2249

Bislang haben wir uns nur um lineare Abhangigkeiten von Vektoren gekummert und zentrale geometrische2250

Konzepte wie Langen und Winkel vernachlassigt. Dies holen wir jetzt nach.2251

Von nun an beschranken wir uns auf Rn als Vektorraum, obwohl sich viele der Konzepte verallgemeinern2252

lassen.2253

Definition 3.52. Eine Abbildung2254

〈·, ·〉 : Rn × Rn → R, (x, y) 7→ 〈x, y〉

heißt Skalarprodukt, wenn gilt:2255

(bilinear) Fur alle λ ∈ R, x, y, z ∈ Rn gilt

〈λx+ y, z〉 = λ〈x, z〉+ 〈y, z〉 (3.1)

〈x, λy + z〉 = λ〈x, y〉+ 〈x, z〉. (3.2)

Mit anderen Worten: Fur ein fixiertes z ∈ Rn sind die Abbildungen x 7→ 〈x, z〉 und x 7→ 〈z, x〉 linear.2256

(symmetrisch) Es gilt 〈x, y〉 = 〈y, x〉 fur alle x, y ∈ Rn.2257

(positiv definit) Es gilt 〈x, x〉 ≥ 0 fur alle x und 〈x, x〉 = 0 genau dann, wenn x = ~0.2258


Das gebrauchlichste Beispiel ist das Standardskalarprodukt2259

〈x, y〉 = x1y1 + . . .+ xnyn.

Wir konnen leicht nachrechnen, dass dieses Produkt bilinear und symmetrisch ist. Außerdem ist2260

〈x, x〉 = x21 + . . .+ x2

n

und diese Summe ist immer strikt positiv, außer wenn alle xi = 0 sind.2261

Es gibt jedoch auch andere Skalarprodukte. Zum Beispiel die folgende Abbildung:2262

R3 × R3 → R, (x, y) 7→ xT ·

1 1 −21 2 −4−2 −4 3

y.

Hier wird also das erste Argument als Zeilenvektor von links heranmultipliziert, und das zweite Argument2263

als Spaltenvektor von rechts. Man uberzeugt sich leicht, dass dies in der Tat eine reelle Zahl ergibt, zum2264

Beispiel ist:2265

(−1 1 0

) 1 1 −21 2 −4−2 −4 3

32−5

=(

0 1 −2) 3

2−5

= 12

(naturlich kann man in der anderen Reihenfolge multiplizieren, denn die Matrixmultiplikation ist assoziativ).2266

Wir konnen auch leicht nachweisen, dass die Abbildung bilinear und symmetrisch ist (lassen wir weg). Dass2267

sie positiv definit ist, konnen wir jedoch im Moment noch nicht einfach zeigen.2268

Es gilt in der Tat, dass jedes Skalarprodukt geschrieben werden kann als2269

〈x, y〉 = xTAy

mit A ∈ Rn×n. Fur das Standardskalarprodukt ware A die Einheitsmatrix2270

En :=

1 0 · · · 0

0. . .

. . ....

.... . .

. . . 00 · · · 0 1

.

Allerdings ist es nicht wahr, dass umgekehrt jede Matrix A auch ein Skalarprodukt liefert. Wir liefern eine2271

Charakterisierung am Ende des Skriptes in Theorem 5.29.2272

Wir bezeichnen den Vektorraum Rn, indem ein Skalarprodukt 〈·, ·〉 definiert ist, als euklidischen Vek-2273

torraum. In allen Beispielen werden wir, falls nicht explizit anders erwahnt, das Standardskalarprodukt2274

verwenden.2275

Definition 3.53. In einem euklidischen Vektorraum V sind zwei Vektoren x, y ∈ V orthogonal, x ⊥ y,2276

wenn 〈x, y〉 = 0 gilt. Fur eine Teilmenge M ⊆ V bezeichnet2277

M⊥ := {x ∈ V | x ⊥ y fur alle y ∈M}

den Orthogonalraum von M .2278

Es ist eine leichte Ubung zu zeigen, dass M⊥ ein Unterraum von V ist. Wir konnen einen konkreten2279

Orthogonalraum auch ausrechnen. Zum Beispiel ist fur:2280

M := {

111

,

20−1

}

3.9. SKALARPRODUKTE 83

der Raum M⊥ gegeben durch alle Vektoren v, fur die gilt2281

〈

111

, v〉 = 0, 〈

20−1

, v〉 = 0.

Schreiben wir das in den Koordinaten von v, ergibt sich

v1 + v2 + v3 = 0

2v1 − v3 = 0

und wir haben ein (homogenes) lineares Gleichungssystem, welches den Losungsraum2282 −13−2

ergibt (wir fuhren diese Rechnung nicht durch).2283

Wir sind besonders an Orthognalraumen von Unterraumen interessiert:2284

Lemma 3.54. Sei U ein Unterraum eines euklidischen Vektorraums V . Dann gilt dimU+dimU⊥ = dimV .2285

Beweis. Sei {u1, . . . , ur} eine Basis von U . Es ist leicht zu sehen, dass x ∈ U⊥ aquivalent dazu ist, dass x2286

zu jedem ui, 1 ≤ i ≤ r, orthogonal ist. Das bedeutet wiederum, dass x die folgende Gleichung erfullt2287 uT1...uTr

x = 0.

Das folgt aus dem gleichen Argument wie im Beispiel oben. Wir bezeichnen die Matrix von oben mit A.2288

Dann ist also U⊥ = ker A. Ferner ist2289

dim ImA = rkA = r = dimU

da u1, . . . , ur eine Basis ist. Es folgt nach Theorem 3.34, dass2290

dimV = dim ker A+ dim ImA = dimU⊥ + dimU

2291

Es gilt auch, dass U ∩ U⊥ = {~0}. Denn ware v 6= ~0 im Schnitt enthalten, folgt nach Definition, dass2292

v ⊥ v, also 〈v, v〉 = 0, was der positiven Definitheit des Skalarproduktes wiederspricht.2293

Theorem 3.55. Sei V ein euklidischer Vektorraum und U ein Unterraum. Dann lasst sich jedes x ∈ V2294

eindeutig schreiben als2295

x = u+ v

mit u ∈ U und v ∈ U⊥. Die Abbildung2296

pU : V → U, x 7→ u

heißt Orthogonalprojektion auf U .2297

Beweis. Wir verwenden den Dimensionssatz (Theorem 3.27), welcher besagt, dass2298

dim(U + U⊥) + dim(U ∩ U⊥)︸︷︷︸=0

= dimU + dimU⊥︸︷︷︸=dimV

,

wobei die beiden Gleichheiten aus dem gerade eben gezeigten folgen. Damit ist also dim(U +U⊥) = dimV ,2299

und damit muss schon U +U⊥ = V sein (da U +U⊥ ja ein Unterraum von V ist). Das bedeutet aber, jedes2300

x ∈ V lasst sich in u+ v wie gewunscht zerlegen.2301

Die Zerlegung ist auch eindeutig. Denn ist auch x = u′+v′, dann ist u+v = u′+v′, also u−u′ = v′−v.2302

Das heißt aber, dass u − u′ ∈ U und u − u′ = v′ − v ∈ U⊥, also u − u′ ∈ U ∩ U⊥ = {~0}, und damit ist2303

u = u′.2304


2305

Hausaufgabe 3.9.1. Orthogonalitat kann auch fur bilineare Operationen generell definiert werden. Geben2306

Sie ein Beispiel fur eine Bilinearform, so dass v ⊥ v, auch wenn v nicht null ist.2307

Hausaufgabe 3.9.2. Zeigen Sie, dass man in der Definition des Skalarproduktes die Bedingung2308

〈x, λy + z〉 = λ〈x, y〉+ 〈x, z〉

auch weglassen kann, da sie aus den restlichen Eigenschaften folgt.2309

Hausaufgabe 3.9.3. Zeigen Sie, dass die Abbildung2310

(x, y) 7→ xT

1 1 −11 2 −4−2 −4 3

y

kein Skalarprodukt ist.2311

Hausaufgabe 3.9.4. Zeigen Sie, dass M⊥, M ⊆ V , ein Unterraum von V ist.2312

Hausaufgabe 3.9.5. Gegeben ist die Bilinearform σ(x, y) = xT y. Bestimmen Sie den Orthogonalraum U⊥2313

bezuglich σ fur die folgenden Unterraume des R3:2314

a. U =

123

, b. U =

123

,

321

, c. U =

x1

x2

x3

| x1 + x2 + x3 = 0

.

3.10 Normen2315

Wir definieren nun die Lange eines Vektors und den Abstand zweier Punkte im Rn fur allgemeine Skalar-2316

produkte. Naturlich stimmt die Definition mit dem ublichen Abstandsbegriff uberein.2317

Definition 3.56. Die Norm oder Lange eines Vektors ist gegeben durch2318

‖x‖ :=√〈x, x〉.

Ein Vektor heißt normiert, wenn seine Lange 1 ist. Wir definieren d(p, q) := ‖p− q‖ als den (euklidischen)2319

Abstand zweier Punkte.2320

Fur einen Vektor v 6= ~0 ist der Vektor v := v‖v‖ normiert, wie man leicht nachrechnet (Hausaufgabe).2321

Wir sprechen davon, dass wir einen Vektor normieren, wenn wir v durch v ersetzen.2322

Theorem 3.57 (Satz des Pythagoras). In einem euklidischen Vektorraum seien x und y orthogonal. Dann2323

gilt2324

‖x+ y‖2 = ‖x‖2 + ‖y‖2

Beachten Sie, dass die drei Vektoren x, y, x + y in der Tat ein rechtwinkliges Dreieck mit Hypotenuse2325

x+ y definieren.2326

Beweis.‖x+ y‖2 = 〈x+ y, x+ y〉 = 〈x, x〉+ 〈x, y〉︸︷︷︸

=0

+ 〈y, x〉︸︷︷︸=0

+〈y, y〉 = ‖x‖2 + ‖y‖2

2327

Theorem 3.58 (Cauchy-Schwarz’sche Ungleichung). In einem euklidischen Vektorraum V gilt fur u, v ∈ V ,2328

dass2329

〈u, v〉 ≤ ‖u‖‖v‖.

3.11. ORTHOGONALE UND ORTHONORMALE BASEN 85

Gleichheit gilt genau dann, wenn u und v linear abhangig sind.2330

Der Beweis ist eine etwas umstandliche Rechnerei. Wir lassen ihn weg, und besprechen stattdessen ein2331

Beispiel fur eine Anwendung:2332

Theorem 3.59 (Dreiecksungleichung). Fur zwei Vektoren x, y gilt stets2333

‖x+ y‖ ≤ ‖x‖+ ‖y‖.

Beweis.

‖x+ y‖2 = 〈x+ y, x+ y〉 = 〈x, x〉+ 2〈x, y〉+ 〈y, y〉 ≤ ‖x‖2 + 2‖x‖ · ‖y‖+ ‖y‖2 = (‖x‖+ ‖y‖)2

Das Ergebnis ergibt sich durch Wurzelziehen auf beiden Seiten.2334

2335

Hausaufgabe 3.10.1. Zeigen Sie, dass ‖λv‖ = |λ| · ‖v‖ gilt fur alle λ ∈ R und v ∈ Rn. Folgern Sie daraus,2336

dass v := v‖v‖ .2337

Hausaufgabe 3.10.2. Zeigen Sie, dass d(p, q) = d(q, p) gilt.2338

Hausaufgabe 3.10.3. Zeigen Sie, dass fur zwei normierte Vektoren u, v stets gilt, dass 〈u, v〉 ∈ [0, 1].2339

Hausaufgabe 3.10.4. Beweisen Sie die allgemeinere Form der Dreiecksungleichung:2340

‖x1 + . . .+ xn‖ ≤ ‖x1‖+ . . .+ ‖xn‖.

Hausaufgabe 3.10.5. Zeigen Sie, dass in einem euklidischen Vektorraum folgendes gilt:2341

(a+ b) ⊥ (a− b)⇔ ‖a‖ = ‖b‖.

3.11 Orthogonale und orthonormale Basen2342

Definition 3.60. Eine Basis B eines euklidischen Vektorraums heißt Orthogonalbasis falls fur alle b 6= b′2343

in B gilt, dass b ⊥ b′. B heißt Orthonormalbasis, falls zusatzlich alle Vektoren normiert sind.2344

Zum Beispiel ist die Basis2345 12−1

,

3−11

,

−210

keine Orthogonalbasis von R3, da der zweite und dritte Basisvektor nicht orthogonal zueinander sind. Da-2346

gegen ist2347 (31

),

(−13

)eine Orthogonalbasis des R2. Es ist jedoch keine Orthonormalbasis, da die Vektoren nicht Lange 1 haben.2348

Wir erhalten eine solche Basis, in dem wir normieren:2349 (3√101√10

),

(− 1√

103√10

).

Dieses Prinzip gilt ganz allgemein:2350

Lemma 3.61. Ist b1, . . . , bn eine Orthogonalbasis, dann ist b1, . . . , bn eine Orthonormalbasis des gleichen2351

Raums, wobei bi der normierte Vektor fur bi ist.2352


Der Beweis sollte klar sein: Normierung andert den Spann nicht, und ebenso bleiben Vektoren nach2353

Normierung orthogonal zueinander.2354

Es stellt sich die Frage, ob es zu jedem Vektorraum eine Orthogonalbasis (und damit auch eine Orthonor-2355

malbasis) gibt. Die Antwort lautet ja. Wir konnen eine beliebige Basis in eine Orthonormalbasis uberfuhren,2356

wie wir nun sehen werden.2357

Theorem 3.62 (Gram-Schmidt Orthonormalisierungsverfahren). Sei a1, . . . , an eine Basis eines euklidi-2358

schen Vektorraums V . Dann gibt es eine Orthonormalbasis b1, . . . , bn von V , so dass gleichzeitig2359

[a1, . . . , ak] = [b1, . . . , bk]

fur alle k = 1, . . . , n gilt.2360

Beweis. Der Beweis ist konstruktiv. Wir geben ein Verfahren an, um b1, . . . , bn zu bestimmen, das Gram-2361

Schmidt Orthogonalisierungsverfahren. Genauer gesagt geben wir ein Verfahren an, um eine Orthogonalbasis2362

zu erhalten. Wir erhalten dann eine Orthonormalbasis, in dem wir jeden Basisvektor normaliseren.2363

Fur k = 1 setzen wir einfach b1 := a1. Nun nehmen wir an, dass wir b1, . . . , bk bereits fur ein k < n2364

konstruiert haben. Wir setzen nun2365

bk+1 := ak+1 −〈ak+1, b1〉〈b1, b1〉

b1 −〈ak+1, b2〉〈b2, b2〉

b2 − . . .−〈ak+1, bk〉〈bk, bk〉

bk

Wir mussen nun nachweisen, dass die b1, . . . , bn die Eigenschaft [a1, . . . , ak] = [b1, . . . , bk] erfullen und alle2366

orthogonal zueinander stehen.2367

Fur die Spanneigenschaft verwenden wir Induktion uber k. Fur k = 1 ist die Aussage klar. Nun nehmen2368

wir an, dass [a1, . . . , ak] = [b1, . . . , bk] bereits gezeigt ist. Es gilt nun, dass2369

[a1, . . . , ak, ak+1] = [a1, . . . , ak] + [ak+1] = [b1, . . . , bk] + [ak+1] = [b1, . . . , bk, ak+1] .

Andererseits ist aber bk+1 nach Definition eine Linearkombination dieser Basisvektoren, wobei der Koeffi-2370

zient von ak+1 nicht 0 ist. Es folgt daher nach dem Austauschsatz (Theorem 3.22), dass [b1, . . . , bk, ak+1] =2371

[b1, . . . , bk, bk+1], und die Eigenschaft ist per Induktion bewiesen.2372

Nun zur Orthogonalitat. Auch hier verwenden wir Induktion uber k. Genauer zeigen wir, dass alleVektoren in der Menge {b1, . . . , bk} paarweise orthogonal zueinander sind. Fur k = 1 ist nicht zu zeigen(denn es existiert kein Paar). Wir nehmen an, die Eigenschaft ist erfullt fur {b1, . . . , bk}. Wir berechneneinfach 〈bk+1, bi〉 fur i < k + 1. Nach der Bilinearitat des Skalarprodukts ergibt sich:

〈bi, bk+1〉 = 〈bi, ak+1 −〈ak+1, b1〉〈b1, b1〉

b1 −〈ak+1, b2〉〈b2, b2〉

b2 − . . .−〈ak+1, bk〉〈bk, bk〉

bk〉

= 〈bi, ak+1〉 −〈ak+1, b1〉〈b1, b1〉

〈bi, b1〉 −〈ak+1, b2〉〈b2, b2〉

〈bi, b2〉 − . . .−〈ak+1, bk〉〈bk, bk〉

〈bi, bk〉

In der letzten Summe sind fast alle Summanden 0, da nach Induktionsvoraussetzing 〈bi, bj〉 = 0. Es verbleibt2373

nur der Term fur bi selbst:2374

. . . = 〈bi, ak+1〉 −〈ak+1, bi〉〈bi, bi〉

〈bi, bi〉 = 〈bi, ak+1〉 − 〈ak+1, bi〉 = 0.

Damit ist die Orthogonalitat bewiesen.2375

Was ist der Nutzen einer Orthonormalbasis? Sei b1, . . . , bn eine Basis von V und v ∈ V beliebig. Wir2376

wissen bereits (Theorem 3.25), dass sich v eindeutig als Linearkombination von b1, . . . , bn schreiben lasst.2377

Um eine solche Linearkombination zu finden, mussen wir aber noch ein lineares Gleichungssytem losen. Ist2378

b1, . . . , bn jedoch eine Orthonormalbasis, ist dieser letzte Schritt nicht notwendig:2379

Lemma 3.63. Ist b1, . . . , bn eine Orthonormalbasis von V und v ∈ V , so ist2380

v = 〈v, b1〉b1 + . . .+ 〈v, bn〉bn


Beweis. Wir konnen v mit Hilfe der Basisvektoren b1, . . . , bn eindeutig schreiben:2381

v = λ1b1 + . . .+ λnbn

Nun rechnen wir fur ein beliebigen 1 ≤ i ≤ n nach2382

〈v, bi〉 = λ1 〈b1, bi〉︸︷︷︸=0

+ . . .+ λi 〈bi, bi〉︸︷︷︸=1

+ . . .+ λn 〈bn, bi〉︸︷︷︸=0

= λi

2383

Auch die Norm eines Vektors lasst sich leicht aus einer Linearkombination ablesen:2384

Lemma 3.64. Sei b1, . . . , bn eine Orthonormalbasis von V und2385

x = λ1b1 + . . .+ λnbn.

Dann ist ‖x‖2 =∑ni=1 λ

2i .2386

Beweis. Einfach Nachrechnen:2387

‖x‖2 = 〈x, x〉 = 〈n∑i=1

λibi,

n∑j=1

λjbj〉 =

n∑i=1

n∑j=1

λiλj〈bi, bj〉 =

n∑i=1

λ2i

wobei die letzte Gleichung gilt, weil 〈bi, bj〉 = 0 fur i 6= j, also bleiben nur die Terme ubrig, fur die i = j2388

gilt.2389

Projektionen und Spiegelungen. Als kleine Anwendung des gerade gezeigten befassen wir uns mit2390

(orthogonalen) Projektionen auf Unterraume. Wir beschranken uns auf R3 und fangen mit dem einfachen2391

Fall an. Sei L eine Gerade durch den Ursprung, und x ein Punkt. Es gibt nun genau einen Punkt y auf2392

der Geraden, so dass die Gerade durch x und y senkrecht auf L steht (das ist die Projektion von x auf L).2393

Wie finden wir diesen Punkt? Nennen wir u einen Richtungsvektor der Gerade, so suchen wir ein λ, so dass2394

〈u, x − λu〉 = 0. Da 〈u, u〉 = 1, ist das aquivalant zu 〈x, u〉 = λ. Das lost sich auf zu λ = 〈u,x〉〈u,u〉 , also haben2395

wir2396

〈u, x〉〈u, u〉

u

fur die Projektion von x auf die Gerade.2397

Nun schauen wir uns Ebenen an. Sei E eine Ebene durch den Urpsrung, und x ∈ R3 beliebig. Wieder-2398

um gibt es genau einen Punkt y, so dass x − y senkrecht auf E steht, und wir nennen y wiederum den2399

Projektionspunkt.2400

Wir besprechen zwei Moglichkeiten, den Projektionspunkt zu bestimmen. Haben wir eine Orthogonal-2401

basis u1, u2 der Ebene gegeben, ergibt sich sofort, dass2402

y =〈u1, x〉〈u1, u1〉

u1 +〈u2, x〉〈u2, u2〉

u2.

In der Tat liegt y in der Ebene, da es eine Linearkombination von u1 und u2 ist. Es ist auch x− y ⊥ u1 und2403

x− y ⊥ u2, wie man leicht nachrechnet.2404

Als Beispiel nehmen wir die Ebene aufgespannt durch die Vektoren2405

v1 :=

111

, v2 :=

2−10

Die beiden Vektoren stehen nicht ortogonal zueinander. Wir verwenden das Gram-Schmidt Verfahren und2406

erhalten2407

u1 := v1, u2 := v2 −〈v2, u1, 〉〈u1, u1〉

u1 =

2−10

− 1

3

111

=

53− 4

3− 1

3

.


Beachten Sie, dass wir jeden Vektor mit einem beliebigen Skalar (ausser 0) multiplizieren konnen ohne den2408

Spann zu andern. Es ist hier sinnvoll, u2 mit 3 zu skalieren, um die Bruche loszuwerden. Wir nehmen also2409

b1 :=

111

, b2 :=

5−4−1

als Orthogonalbasis der Ebene.2410

Sei nun2411

x =

20−3

Dann ist die Projektion auf die Ebene gegeben durch2412

y =〈x, b1〉〈b1, b1〉

b1 +〈x, b2〉〈b2, b2〉

b2

=−1

3

111

+13

42

5−4−1

=1

42

−14 + 65−14− 52−14− 13

=1

42

51−66−27

=1

14

17−22−9

Ein alternativer Rechnungsweg folgt nun. Es sei w ein Vektor, der senkrecht auf der Ebene steht (wir2413

nennen solch einen Vektor Normalenvektor). Dann gilt2414

y = x− 〈x,w〉〈w,w〉

w

Die Richtigkeit kann man in der Tat wieder nachrechnen: y − x ist ein Vielfaches von w, also orthogonal2415

zur Ebene, und 〈y, w〉 = 0, was bedeutet, dass y in der Ebene liegt.2416

Nehmen wir nochmals das Beispiel von oben. Wir mussen einen Vektor finden, der zu v1 und zu v22417

orthogonal ist. Es gibt mindestens drei Moglichkeiten, einen solchen Vektor zu finden: (1) durch Raten2418

(manchmal geht das, und es ist am Schnellsten), (2) durch Losen eines linearen Gleichungssystems, (3)2419

durch das Kreuzprodukt:2420 x1

x2

x3

× y1

y2

y3

:=

x2y3 − x3y2

x3y1 − x1y3

x1y2 − x2y1

.

Eine Losung im konkreten Fall ist2421

w =

12−3

und wir erhalten

y =

20−3

−〈

20−3

,

12−3

〉〈

12−3

,

12−3

〉 1

2−3

=

20−3

− 11

14

12−3

=1

14

28− 11−22

−42 + 33

=1

14

17−22−9

.


Schauen wir uns die Formel2422

y = x− 〈x,w〉〈w,w〉

w

nochmals genauer an. Wir nehmen nun der Einfachheit halber an, dass w normiert ist, womit sich der2423

Ausdruck vereinfacht zu2424

y = x− 〈x,w〉w.Der Vektor −〈x,w〉w gibt die Verbindungsstrecke von x zu seinem Projektionspunkt y an. Wenn wir die-2425

se Verbindungsstrecke verdoppeln, erhalten wir die Spiegelung von x an der Ebene, welche wir mit σ(x)2426

bezeichnen:2427

σ(x) = x− 2〈x,w〉w.Beachten Sie, dass wir das Skalarprodukt auch als Matrixmultiplikation schreiben konnen: 〈x,w〉 = 〈w, x〉 =2428

wTx. Damit ist also σ(x) = x − 2(wTx)w. Man kann leicht nachrechnen, dass (wTx)w = (wwT )x gilt (im2429

Allgemeinen ist das Matrixprodukt nicht kommutativ, aber fur diesen Spezialfall schon). Beachten Sie, dass2430

w · wT eine (3× 3)-Matrix ist. Also erhalten wir2431

σ(x) = x− 2(wwT )x = (En − 2wwT )x,

wobei En wie ublich die (n× n)-Einheitsmatrix ist. Wenn wir den Faktor 2 weglassen, ergibt sich auch2432

y = (En − wwT )x.

Damit ergibt sich:2433

Lemma 3.65. Sei E eine Ebene durch den Ursprung mit normierten Normalenvektor w. Dann ist die2434

Projektionsabbildung, die jedem Punkt in R3 seinen Projektionspunkt zuordnet, eine lineare Abbildung mit2435

x 7→ (En − wwT )x.

Auch die Spiegelungsabbildung ist linear mit2436

x 7→ (En − 2wwT )x.

Rechnen wir die Projektion von oben ein drittes Mal aus. Wie schon gesehen ist w =

12−3

senkrecht2437

auf der Ebene. Normiert ergibt sich der Vektor:2438

w =1√14

12−3

.

Wir berechnen die Projektionsmatrix:

E3 − wwT =

1 0 00 1 00 0 1

− 1√14

12−3

· 1√14

(1 2 −3

)

=

1 0 00 1 00 0 1

− 1

14

1 2 −32 4 −6−3 −6 9

=

1

14

13 −2 3−2 10 63 6 5

.

Nun berechnen wir den Projektionspunkt durch Multiplikation:2439

y =1

14

13 −2 3−2 10 63 6 5

20−3

=1

14

26− 9−4− 186− 15

=1

14

17−22−9

.

2440


Hausaufgabe 3.11.1. Wie finden Sie Projektionspunkte auf Geraden/Ebenen, die nicht durch den Urps-2441

rung gehen?2442

Hausaufgabe 3.11.2. Wenden Sie das Gram-Schmidt-Orthonormalisierungsverfahren fur den Standards-2443

kalarprodukt auf folgenden Vektoren an:2444

a.

23−1

,

1−22

,

−221

∈ R3,2445b.

2142

,

1326

,

1101

,

3−3−13

∈ R4,2446

3.12 Orthogonale Abbildungen2447

Definition 3.66. Eine lineare Abbildung f : V → V in einem euklidischen Vektorraum heißt orthogonal,2448

wenn fur alle x, y ∈ V gilt, dass2449

〈f(x), f(y)〉 = 〈x, y〉.

Orthogonale Abbildungen erhalten also das Skalarprodukt von Vektoren. Es ist nicht ohne weiteres2450

intuitiv klar, was dies bedeutet. Hier ist ein aquivalentes Kriterium, welches anschaulicher ist: eine lineare2451

Abbildung ist orthogonal genau dann, wenn sie die Lange von Vektoren erhalt.2452

Lemma 3.67. Eine lineare Abbildung f : V → V ist orthogonal genau dann, wenn fur alle x ∈ V gilt, dass2453

‖f(x)‖ = ‖x‖.2454

Beweis. Ist f orthogonal, dann ist2455

‖f(x)‖ =√〈f(x), f(x)〉 =

√〈x, x〉 = ‖x‖.

Umgekehrt sei ‖f(x)‖ = ‖x‖. Da2456

〈x+ y, x+ y〉 = 〈x, x〉+ 〈y, y〉+ 2〈x, y〉,

folgt, dass2457

〈x, y〉 =1

2(〈x+ y, x+ y〉 − 〈x, x〉 − 〈y, y〉) =

1

2(‖x+ y‖2 − ‖x‖2 − ‖y‖2).

(Wir konnen also das Skalarprodukt mit Hilfe von Normen ausdrucken). Es ergibt sich

〈f(x), f(y)〉 =1

2(‖f(x) + f(y)‖2 − ‖f(x)‖2 − ‖f(y)‖2)

=1

2(‖f(x+ y)‖2 − ‖f(x)‖2 − ‖f(y)‖2)

=1

2(‖x+ y‖2 − ‖x‖2 − ‖y‖2)

= 〈x, y〉.

2458

Ein Beispiel fur eine orthogonal Abbildung ist die Spiegelung an einer Ursprungsgerade. Das ist geome-trisch recht anschaulich, und wir rechnen es nun nach. Sei w ein Normalenvektor einer Ebene mit ‖w‖ = 1.Wir wissen dass die Spiegelung eines Punktes x gegeben ist durch x− 2〈x,w〉w (und nach Lemma 3.65 istdiese Abbildung linear). Nun gilt

‖x− 2〈x,w〉w‖2 = 〈x− 2〈x,w〉w, x− 2〈x,w〉w〉= 〈x, x〉 − 4〈x, 〈x,w〉w〉+ 4〈〈x,w〉w, 〈x,w〉w〉= 〈x, x〉 − 4〈x,w〉〈x,w〉+ 4〈x,w〉〈x,w〉〈w,w〉︸︷︷︸

=1

= ‖x‖.

3.12. ORTHOGONALE ABBILDUNGEN 91

Lemma 3.68. Sei b1, . . . , bn eine Orthonormalbasis von V und f : V → V linear. Dann ist f : V → V2459

eine orthogonale Abbildung genau dann, wenn f(b1), . . . , f(bn) eine Orthonormalbasis von V ist.2460

Beweis. Ist f ortgonal, dann ist ‖f(bi)‖ = ‖bi‖ = 1 fur alle i = 1, . . . , n. Außerdem ist fur i 6= j2461

〈f(bi), f(bj)〉 = 〈bi, bj〉 = 0,

also sind die Vektoren f(b1), . . . , f(bn) paarweise orthogonal. Das beweist, dass f(b1), . . . , f(bn) eine Ortho-2462

normalbasis ist.2463

Umgekehrt, sei f(b1), . . . , f(bn) Orthonormalbasis. Sei x ∈ V beliebig. Schreibe2464

x = λ1b1 + . . .+ λnbn

mit λ1, . . . , λn ∈ R. Es gilt nach Linearitat von f , dass2465

f(x) = λ1f(b1) + . . .+ λnf(bn).

Nach Lemma 3.64 ist ‖x‖2 =∑ni=1 λ

2i und auch ‖f(x)‖2 =

∑ni=1 λ

2i , also ist ‖x‖2 = ‖f(x)‖2 und damit2466

auch ‖x‖ = ‖f(x)‖.2467

Bekanntlich sind lineare Abbildungen durch Matrizen ausdruckbar. Welche Matrizen stellen orthogonale2468

Abbildungen dar?2469

Definition 3.69. Eine Matrix A ∈ Rn×n heißt orthogonal, wenn ATA = En.2470

Aquivalent ist die Bedingung, dass die Spalten von A eine Orthonormalbasis von V bilden.2471

Lemma 3.70. Eine Matrix A ist orthogonal genau dann, wenn die Abbildung x 7→ Ax eine orthogonale2472

Abbildung bezuglich des Standardskalarprodukts ist.2473

Beweis. Die Spalten von A sind die Bilder von A bezuglich der Orthonormalbasis e1, . . . , en von V . Diese2474

Bilder bilden eine Orthonormalbasis genau dann, wenn die Abbildung orthogonal ist (nach Lemma 3.68).2475

Orthogonale Abbildungen im R2. Wir klassifizieren alle orthogonale Abbildungen im R2. Eine solche2476

Abbildung f muss den Vektor

(10

)auf einen Vektor

(cs

)der Lange 1 abbilden. Damit gilt c2 +s2 = 1.2477

Das Bild von

(01

)muss orthogonal zu

(cs

)stehen und ebenfalls Lange 1 haben. Das bedeutet, dass2478

f(

(01

)) =

(−sc

)oder f(

(01

)) =

(s−c

).

Es gibt also zwei Typen von orthogonalen Abbildungen. Zunachst die Form2479 (c −ss c

).

Dies entspricht einer Drehung um den Ursprung. Die andere Form ist2480 (c ss −c

)und entspricht einer Spiegelung an der Geraden mit Richtungsvektor

(s

1− c

). Dies kann man wie folgt2481

sehen:2482

Der orthogonale Vektor zu dieser Geraden ist w :=

(1− c−s

). Beachten Sie, dass sich das vorangehende2483

Kapitel uber Projektionen und Spiegelungen in weiten Teilen auf den Fall von Spiegelungen an Geraden im2484

R2 ubertragt. Insbesondere ist die Spiegelung an der betrachteten Gerade gegeben durch2485

σ(p) = p− 2〈w, p〉〈w,w〉

w.


Wir rechnen nun nach2486

σ(

(10

)) =

(10

)− 2

1− c(1− c)2 + s2

(1− c−s

)=

(10

)− 2

1− c2− 2c︸︷︷︸

=1

(1− c−s

)=

(cs

)

wobei wir im zweiten Schritt s2 + c2 = 1 ausgenutzt haben. Ebenso gilt2487

σ(

(01

)) =

(01

)− 2

−s(1− c)2 + s2

(1− c−s

)=

(01

)− s

(1− c)

(1− cs

)=

(s

1− s2

1−c

)und die zweite Koordinate vereinfacht sich (wegen c2 + s2 = 1) zu2488

1− s2

1− c= 1− 1− c2

1− c= 1− (1 + c) = −c

Damit ist also gezeigt: Die Spiegelung an besagter Gerade bildet e1 auf

(cs

)und e2 auf

(s−c

)ab und2489

ist damit durch die Matrix2490 (c ss −c

)dargestellt. Dies impliziert, dass jede orthogonale Abbildung im R2 entweder eine Drehung oder eine Spie-2491

gelung ist.2492

2493

Hausaufgabe 3.12.1. Zeigen Sie, dass eine orthogonale Matrix A auch AAT = En erfullt.2494

Hausaufgabe 3.12.2. Bestimmen Sie die Matrix der Spiegelung an der Gerade x−3y = 0 im euklidischen2495

R2.2496

Hausaufgabe 3.12.3. Bestimmen Sie die Matrix der Orthogonalprojektion auf die Ebene x+ y+ z = 0 im2497

euklidischen R3.2498

Hausaufgabe 3.12.4. Erganzen Sie die fehlende Eintrage in den folgenden Matrizen, so dass diese ortho-2499

gonal werden:2500

a. 17

−3 2 ∗−6 −3 ∗∗ ∗ ∗

,2501

b. 15

3 ∗ 00 ∗ 5∗ ∗ ∗

,2502

c.

(0 ∗∗ ∗

),2503

d.

(1 ∗∗ ∗

).2504

Wieviele Losungen gibt es?2505

Kapitel 42506

Analysis, Teil II2507

4.1 Komplexe Zahlen2508

Wir fuhren einen weiteren Korper ein, der die reellen Zahlen erweitert.2509

Definition 4.1. Eine komplexe Zahl ist ein Paar (a, b) ∈ R2, geschrieben als a+ bi, wobei das Symbol i die2510

imaginare Einheit genannt wird. Wir nennen a den Realteil und b den Imaginarteil der komplexen Zahl.2511

Wir schreiben2512

C := {a+ bi | a, b ∈ R}als die Menge der komplexen Zahlen. Wir definieren Addition und Multiplikation wie folgt:

(a+ bi) + (c+ di) = (a+ c) + (b+ d)i

(a+ bi) · (c+ di) = (ac− bd) + (ad+ bc)i.

Die rellen Zahlen sind in den komplexen Zahlen eingebettet als2513

R = {r + 0i | r ∈ R}.

Anschaulich kann man i intepretieren als√−1, d.h., es gilt i2 = −1. In der Tat ergibt die Multiplikati-2514

onsregel von oben dann Sinn, denn2515

(a+ bi) + (c+ di) = ac+ bci+ adi+ bdi2 = ac+ bci+ adi− bd = ac− bd+ (bc+ ad)i

wie in der Definition.2516

Wenn wir eine komplexe Zahl a+bi als Vektor

(ab

)auffassen, dann entspricht die Addition komplexer2517

Zahlen genau der Vektoraddition. Ferner entspricht die Multiplikation mit einer reellen Zahl genau der2518

Skalarmultiplikation2519

λ(a+ bi) = (λ+ 0i)(a+ bi) = λa+ λbi

und damit ist C ein zweidimensionaler R-Vektorraum mit Basis {1, i}. Allerdings hat C mehr Struktur:2520

Theorem 4.2. C ist ein Korper. Das neutrale Element der Addition ist 0 = 0+0i, und das inverse Element2521

von a+bi bezuglich Addition ist −a−bi. Das neutrale Element der Multiplikation ist 1 = 1+0i. Das inverse2522

Element zu a+ bi bezuglich Multiplikation ist2523

a

a2 + b2− b

a2 + b2i.

Hier sind ein paar Beispielrechnungen:

(2 + 3i) + (4− 2i) = 6 + i

(2 + 3i) · (4− 2i) = 8 + 12i− 4i− 6i2 = 14 + 8i

2 + 3i

4− 2i=

2 + 3i

4− 2i· 4 + 2i

4 + 2i=

8 + 12i+ 4i+ 6i2

16− 8i+ 8i− 4i2=

2 + 16i

20=

1

10+

4

5i.

93

94 KAPITEL 4. ANALYSIS, TEIL II

Eine wichtige Eigenschaft, die die komplexen Zahlen von den reellen Zahlen unterscheidet, geben wir2524

ohne Beweis an:2525

Theorem 4.3 (Fundamentalsatz der Algebra). Jedes reelle Polynom2526

p(x) = anxn + . . .+ a0

besitzt eine Nullstelle uber C.2527

Definition 4.4. Fur z = a+ bi bezeichnet2528

|z| =√a2 + b2

den Betrag von z.2529

Der Betrag stimmt mit der Norm von

(ab

)uberein. Es folgt sofort, dass die Dreiecksungleichung2530

|z1 + z2| ≤ |z1|+ |z2|

fur komplexe Zahlen z1, z2 erfullt ist.2531

Geometrische Interpretation. Wie bereits mehrfach erwahnt konnen wir eine komplexe Zahl a+ bi als2532

Punkt

(ab

)im R2 auffassen. Wir sprechen auch von der komplexen Ebene, wenn wir komplexe Zahlen so2533

darstellen.2534

Die Addition mit einem Vektor c+di bewirkt eine Translation mit dem Vektor

(cd

). Der Betrag einer2535

komplexen Zahl ist der Abstand zum Ursprung. Die Multiplikation kann man wie folgt deuten.2536

Lemma 4.5. Fur y = c+ di ist die Abbildung2537

f : C→ C, z 7→ y · z

linear, wobei C als R-Vektorraum aufgefasst wird.2538

• Ist |y| = 1, so ist f die Drehung, die

(10

)in

(cd

)uberfuhrt.2539

• Ist y ∈ R, so ist f eine zentrische Streckung mit Faktor y.2540

• Andernfalls ist f eine Drehung um y|y| , gefolgt von einer Streckung mit |y|.2541

Beweis. Die Linearitat von f rechnen wir nach. Fur z1, z2 ∈ C und λ ∈ R ist2542

f(λz1 + z2) = y(λz1 + z2) = λyz1 + yz2 = λf(z1) + f(z2).

Wie wir wissen, ist f als Matrix darstellbar, wobei die Spalten der Matrix den Bildern der Standardbasis2543

entsprechen. In unserem Fall ist die “Standardbasis” {1, i} (denn in der komplexen Ebene entspricht 1 dem2544

Vektor

(10

)und i dem Vektor

(01

). Wir rechnen nach:2545

f(1) = y = c+ di, f(i) = ci+ di2 = −d+ ci

Damit ist die Abbildung f durch die Matrix2546 (c −dd c

)gegeben. Ist |y| = 1, also c2 +d2 = 1, entspricht das einer Drehmatrix, wie wir am Ende des letzten Kapitels2547

gesehen haben.2548

4.1. KOMPLEXE ZAHLEN 95

Ist y ∈ R, dann ist d = 0, also ist die Matrix gleich c ·E2, was genau der Skalarmultiplikation mit Faktor2549

c entspricht. Geometrisch ist das eine Streckung.2550

Im allgemeinen Fall haben wir, dass2551

y = |y| y|y|

und die lineare Abbildung von oben ist eine Komposition von zwei linearen Abbildungen (Multiplikation2552

mit y|y| , gefolgt von Multiplikation mit |y|), die vom Fall 1 und 2 sind.2553

Komplexe Analysis. Der nachste Schritt besteht nun darin, die gesamte Theorie der Analysis, die wir2554

auf den reellen Zahlen entwickelt haben, auf die komplexen Zahlen zu ubertragen. Wir tun das nicht im2555

Detail, aber zeigen beispielhaft, dass sich in der Tat viele Definitionen und Satze ohne große Probleme2556

verallgemeinern.2557

Definieren wir zum Beispiel Folgen uber C in der offensichtlichen Art und Weise, dann konvergiert eine2558

Folge gegen den Grenzwert a ∈ C, wenn2559

∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : |an − a|︸︷︷︸∈R

< ε

(hier ist ε eine reelle Zahl). Der Konvergenzbegriff fur Reihen ist ebenfalls komplett analog. Wir haben auch2560

das Quotientenkriterium:2561

Theorem 4.6 (Quotientenkriterium uber C). Gibt es fur eine komplexe Folge (an)n∈N, ein q < 1 und ein2562

n0 ∈ N mit2563

|an+1||an|

≤ q ∀n ≥ n0

dann konvergiert die Reihe∑∞n=0 an gegen einen Grenzwert in C.2564

Der Beweis ist ganz ahnlich zum reellen Fall. Damit konnen wir die komplexe Exponentialfunktion defi-2565

nieren als2566

exp : C→ C, z 7→∞∑n=0

zn

n!= 1 + z +

z2

2+z3

6+z4

24+ . . .

Die wichtigste Eigenschaft der Exponentialfunktion ist die sogenannte Funktionalgleichung.2567

Theorem 4.7. Fur alle x, y ∈ C gilt2568

exp(x+ y) = exp(x) · exp(y)

Der Beweis besteht aus einer langlichen Rechnung uber die Reihendefinition von oben. Wir lassen dies2569

weg. Eine Folgerung aus der Funktionalgleichung ist, dass2570

1

exp(x)= exp(−x),

denn es gilt2571

exp(x) exp(−x) = exp(x− x) = exp(0) = 1.

Also ist exp(−x) in der Tat das inverse Element bezuglich Multiplikation.2572

Auch der Begriff der Stetigkeit ubertragt sich auf komplexe Funktionen. Wir schreiben limx→a f(x) = z,2573

wenn fur jede komplexe Folge (an)n∈N, die gegen a ∈ C konvergiert, auch die Folge (f(an))n∈N gegen z ∈ C2574

konvergiert. Die Funktion ist dann stetig in a ∈ C, falls2575

limx→a

f(x) = f(a)

gilt. f heißt stetig, wenn es in jedem Punkt des Definitionsbereichs stetig ist. Das ist alles vollig analog zum2576

reellen Fall. Es gilt weiterhin, genau wie im reellen Fall, dass die Addition, Multiplikation, Division, und2577

Komposition stetiger Funktionen auch wieder stetig ist.2578


Ein einfaches Beispiel fur stetige Funktionen sind die Abbildungen2579

Re : C→ R, (a+ bi) 7→ a, Im : C→ R, (a+ bi) 7→ b,

welche jeder komplexen Zahl ihren Real- bzw Imaginarteil zuordnet. Der Beweis, dass diese Funktionen2580

stetig sind, ist einfach. Daraus folgt auch, dass die Betragsfunktion2581

C→ R, z 7→ |z|

stetig ist (Hausaufgabe).2582

Lemma 4.8. Die komplexe Exponentialfunktion ist stetig.2583

Beweis. Wir zeigen erst, dass exp stetig in 0 ist. Wir zeigen dafur, dass fur x ∈ C mit |x| ≤ 12 gilt, dass2584

| exp(x)− 1| ≤ 2|x|.

Der Beweis ist komplett analog zur Rechnung, die fur die reelle Exponentialfunktion im Abschnitt 2.6durchgefuhrt wurde:

| exp(x)− 1| =∣∣∣∣ limk→∞

(1 + |x|+ |x|2

2+ . . .+

|x|k

k!)− 1

∣∣∣∣=

∣∣∣∣ limk→∞

|x|+ |x|2

2+ . . .+

|x|k

k!

∣∣∣∣≤ |x| lim

k→∞(1 + |x|+ |x|2 + . . .+ |x|k)

≤ |x|1− |x|

≤ 2|x|

(wir haben hier ausgenutzt, dass die Betragsfunktion x → |x| uber C stetig ist) Daraus folgt direkt, dass2585

exp stetig in 0 ist. Fur a ∈ C beobachten wir, dass wir jede gegen a konvergente Folge (an)n∈N schreiben2586

konnen als an = a+ hn mit hn eine Nullfolge. Damit ergibt sich (mit der Funktionalgleichung)2587

limx→a

exp(x) = limh→0

exp(a+ h) = limh→0

exp(a) exp(h) = exp(a) limh→0

exp(h) = exp(a) exp(0) = exp(a)

wobei der vorletzte Schritt folgt, da exp stetig in 0 ist.2588

2589

Hausaufgabe 4.1.1. Weisen Sie nach, dass2590

a

a2 + b2− b

a2 + b2i

in der Tat invers zu a+ bi ist.2591

Hausaufgabe 4.1.2. Geben Sie ein geometrisches Verfahren an, um 1a+bi zu bestimmen.2592

Hausaufgabe 4.1.3. Beweisen Sie die Stetigkeit der Betragsfunktion (Hinweis: Drucken Sie den Betrag2593

als Komposition/Addition/Multiplikation anderer Funktionen aus).2594

Hausaufgabe 4.1.4. Schreiben Sie die folgenden komplexen Zahlen in der Form a+ bi, mit a, b ∈ R:

a.1 + i

7− i, b. |4 + 3i|, c.

∣∣∣∣2− 8i

3 + 8i

∣∣∣∣ ,d. (9 + 6i)4, e. i101, f.

1234∑n=1

in.

Hausaufgabe 4.1.5. Untersuchen Sie, ob die folgende komplexe Folge und komplexe Reihe konvergieren:2595

a. an =

(3 + 4i

5

)n, b.

∞∑k=1

ik

k!.

4.2. TRIGONOMETRISCHE FUNKTIONEN 97

4.2 Trigonometrische Funktionen2596

Nach dieser Vorarbeit konnen wir die Sinus- und Kosinusfunktion definieren:2597

Definition 4.9. Fur x ∈ R sei exp(ix) = c+ si mit c, s ∈ R. Wir schreiben2598

cosx := c, sinx := s.

fur den Sinus und Kosinus von x. Ferner ist der Tangens definiert als tan(x) := sin(x)cos(x) und der Kotangens2599

als cot(x) = cos(x)sin(x) .2600

Als Funktion konnen wir schreiben

cos : R→ R, x 7→ Re(exp(ix))

sin : R→ R, x 7→ Im(exp(ix)).

Beides sind stetige Funktionen (als Komposition von stetigen Funktionen). Beachten Sie auch, dass dies2601

reelle Funktionen sind, aber die Definition einen “Umweg” uber die komplexen Zahlen macht. Wir konnen2602

diesen Umweg auch vermeiden, und Sinus und Kosinus mit Hilfe einer Reihenentwicklung angeben:2603

Lemma 4.10. Fur x ∈ R gilt

cos(x) =

∞∑k=0

(−1)kx2k

(2k)!= 1− x2

2+x4

4!− x6

6!+ . . .

sin(x) =

∞∑k=0

(−1)kx2k+1

(2k + 1)!= x− x3

3!+x5

5!− x7

7!+ . . .

Beweis. Es gilt nach Definition

exp(ix) =

∞∑n=0

(ix)n

n!=

∞∑n=0

inxn

n!

=∑

n gerade

inxn

n!+

∑n ungerade

inxn

n!

=

∞∑k=0

i2kx2k

(2k)!+

∞∑k=0

i2k+1 x2k+1

(2k + 1)!

=

∞∑k=0

(i2)kx2k

(2k)!+ i

∞∑k=0

(i2)kx2k+1

(2k + 1)!

=

∞∑k=0

(−1)kx2k

(2k)!︸︷︷︸Realteil

+i

∞∑k=0

(−1)kx2k+1

(2k + 1)!︸︷︷︸Imaginarteil

.

2604

Damit ergiben sich sofort einige der wohlbekannten Eigenschaften von Sinus und Kosinus. Zum Beispielist

cos(−x) =

∞∑k=0

(−1)k(−x)2k

(2k)!=

∞∑k=0

(−1)kx2k

(2k)!= cos(x)

sin(−x) =

∞∑k=0

(−1)k(−x)2k+1

(2k + 1)!= −

∞∑k=0

(−1)kx2k+1

(2k + 1)!= − sin(x)


Es folgt ausserdem, dass2605

exp(−ix) = exp(i(−x)) = cos(−x) + i sin(−x) = cos(x)− i sin(x).

Damit haben wir sofort, dass2606

cos(x)2 + sin(x)2 = (cos(x) + i sin(x))(cos(x)− i sin(x)) = exp(ix) exp(−ix) = exp(ix− ix) = exp(0) = 1.

Wir konnen nun auch die Kreiszahl π definieren. Erst brauchen wir ein Zwischenresultat:2607

Lemma 4.11. Die Funktion cos(x) hat im Intervall [0, 2] eine Nullstelle.2608

Beweis. Es ist cos(0) = 1. Wenn wir die Reihenentwicklung des Kosinus verwenden und x = 2 einsetzen,2609

sehen wir, dass cos 2 ≈ −0.4 < 0. Ferner ist cos eine stetige Funktion. Nach dem Zwischenwertsatz gibt es2610

also (mindestens) eine Nullstelle in [0, 2].2611

Definition 4.12. Wir definieren π ∈ R so, dass π2 die kleinste positive Nullstelle von cos ist. Nach dem2612

vorangehenden Lemma ist 0 < π < 4.2613

Theorem 4.13 (Additionstheoreme). Fur x, y ∈ R gilt

cos(x+ y) = cosx cos y − sinx sin y

sin(x+ y) = cosx sin y + sinx cos y

Beweis. Es gilt, dass

cos(x+ y) + i sin(x+ y) = exp(i(x+ y))

= exp(ix) exp(iy)

= (cosx+ i sinx) + (cos y + i sin y)

= (cosx cos y − sinx sin y) + i(cosx sin y + sinx cos y).

Die Aussagen folgen nun beide durch den Vergleich von Real- und Imaginarteil.2614

Wegen cos2 x+ sin2 x = 1, ist

(cosxsinx

)ein Punkt auf dem Einheitskreis S1 = {p ∈ R2 | ‖p‖ = 1} (fur2615

jedes x). Man kann zeigen, dass die Abbildung2616

C : [0, 2π)→ S1, φ 7→(

cosφsinφ

)bijektiv (und stetig) ist, also den Einheitskreis parametrisiert (dafur nutzt man die Differentialrechnung als2617

Hilfsmittel). Fur einen Punkt p ∈ S1 nennen wir φ = C−1(p) ∈ [0, 2π) den Polarwinkel von p. Allgemeiner2618

kann man jeden Punkt p 6= 0 ∈ R2 eindeutig darstellen als Paar (r, φ) mit r > 0 und φ ∈ [0, 2π), so dass2619

p = r · C(φ) gilt. (r, φ) heißen Polarkoordinaten von p.2620

Fur zwei Vektoren x1 und x2 mit Polarkoordinaten (r1, φ1) und (r2, φ2) konnen wir damit auch den2621

Winkel (im Bogenmass) definieren: Angenommen φ2 ≥ φ1, dann ist2622

^(x1, x2) := min{φ2 − φ1, 2π − (φ2 − φ1)}

(das ist nicht die einzig mogliche Definition, aber eine sinnvolle Variante). Beachten Sie, dass mit dieser2623

Definition ^(x1, x2) ∈ [0, π] gilt.2624

Wir definieren2625

arccos : [−1,+1]→ [0, π], φ 7→ cos−1(φ)

als die Umkehrabbildung des Kosinus im Bereich [0, π]. Dann gilt:2626

Theorem 4.14.

^(x1, x2) = arccos〈x1, x2〉‖x1‖‖x2‖

4.3. DIFFERENZIERBARKEIT 99

Beweis. Wir geben die Beweisskizze geometrisch an: Wir definieren y1 := x1

‖x1‖ , y2 := x2

‖x2‖ . Nun drehen wir2627

y1 und y2 so, dass y2 auf e1 abbildet. Das ist eine Drehung um −φ2. Der Polarwinkel des gedrehten y1,2628

nennen wir es z1, ist also φ1 − φ2. Damit ist2629

z1 =

(cos(φ2 − φ1)sin(φ2 − φ1)

).

Andererseits ist die x-Koordinate von z1 auch gleich 〈z1, e1〉. Da die Drehung eine orthogonale Abbildung2630

ist, ist aber 〈z1, e1〉 = 〈y1, y2〉. Insgesamt gilt also2631

cos(φ2 − φ1) = 〈y1, y2〉 = 〈 x1

‖x1‖,x2

‖x2‖〉 =

〈x1, x2〉‖x1‖‖x2‖

.

Schließlich gilt auch, dass cos(x) = cos(2π − x) (Additionstheorem), also gilt auch2632

cos(2π − (φ2 − φ1)) =〈x1, x2〉‖x1‖‖x2‖

.

Da ^x1, x2 entweder φ2 − φ1 oder 2π − (φ2 − φ1), folgt damit2633

cos(^x1, x2) =〈x1, x2〉‖x1‖‖x2‖

und die Behauptung folgt durch die Anwendung von arccos auf beiden Seiten.2634

2635

Hausaufgabe 4.2.1. Es gilt, dass sin(π2 ) = 1 (das konnen Sie ohne Beweis verwenden). Berechnen Sie2636

daraus nacheinander die Werte cos(π), sin(π), cos(2π), sin(2π). Zeigen Sie dann, dass2637

a. sin(x+ π) = − sin(x),2638

b. cos(π − x) = − cos(π),2639

c. sin(x+ 2π) = sin(x),2640

d. cos(x+ 2π) = cos(x).2641

Hausaufgabe 4.2.2. Folgern Sie aus dem Additionstheorem, dass2642

a. sinx− sin y = 2 · cos x+y2 · sin

x−y2 ,2643

b. cosx− cos y = −2 · sin x+y2 · sin

x−y2 .2644


tan(x+ y) =tanx+ tan y

1− tanx tan y.


a. sinx

2= ±

√1− cosx

2, b. cos

x

2= ±

√1 + cosx

2.

4.3 Differenzierbarkeit2647

Die Differentialrechnung ist ein weiteres zentrales Thema der Analysis. Die Grundidee ist die folgende:2648

Gegeben eine Funktion f und ein Punkt p = (a, f(a)) wollen wir die Funktion “in der Nahe” von p durch2649

eine Gerade annahern. Welche Gerade soll das sein? Es liegt auf der Hand, dass die Gerade durch p gehen2650

sollte. Außerdem soll sie sich an den Funktionsgraphen bestmoglich “anschmiegen”. Diese Gerade nennt man2651

auch Tangente der Funktion am Punkt p (wir definieren das gleich formal). Beispiele sind in Abbildung 4.12652

angegeben.2653


Abbildung 4.1: Zwei Funktionsgraphen und Tangenten an jeweils zwei Punkten.

Abbildung 4.2: Zwei Funktionsgraphen, fur die (an einer gewissen Stelle) keine eindeutige Tangente definiertwerden kann.

Allerdings kann man eine solche Gerade nicht fur alle Funktionen finden. Ist zum Beispiel die Funktion2654

nicht stetig in a, fallt es uns schwer, eine sinnvolle Tangente einzuzeichnen. Aber selbst wenn bei stetigen2655

Funktionen ist dies mitunter schwierig, wie die Beispiele in Abbildung 4.2 zeigen. Der Grund ist anschaulich,2656

dass die Funktion an der entsprechende Stelle einen “Knick” hat, also nicht “glatt” ist.2657

Wie definieren wir diese Tangente nun formal? Es reicht, die Steigung der Tangente anzugeben, denn,2658

da die Tangente durch den Punkt p gehen soll, ist sie damit festgelegt. Nun sei h ∈ R beliebig und q =2659

(a+h, f(a+h)) ein weiterer Punkt auf dem Funktionsgraph. Ist h 6= 0, gibt es eine eindeutige Gerade durch2660

p und q, die man als Sekante bezeichnet. Die Steigung dieser Sekante ist gegeben durch2661

f(a+ h)− f(a)

h,

denn wenn x um h wachst, wachst die Gerade um f(a+h)− f(a) (die Formel stimmt auch, wenn h negativ2662

ist). Betrachten wir nun eine Nullfolge (hn)n∈N, dann konnen wir fur jedes hn die Sekantensteigung sn2663

betrachten. Abbildung 4.3 zeigt diesen Prozess. Wir konnen beobachten, dass die Folge sn in der Tat gegen2664

die gewunschte Tangentensteigung konvergiert. Dies motiviert die nachfolgende Definition.2665

Definition 4.15. Sei D ⊂ R und F : D → R. Existiert fur a ∈ D der Grenzwert2666

limh→0

h 6=0,a+h∈D

f(a+ h)− f(a)

h=: f ′(a)

a a+h

p

Abbildung 4.3: Die Sekanten nahern sich immer weiter der Tangente an, wenn wir den zweiten Sekantenpunktnaher an p heranschieben.


so heißt f differenzierbar in a, und f ′(a) die Ableitung von f an der Stelle a. f heißt differenzierbar, wenn2667

es fur jedes x ∈ D differenzierbar ist. In diesem Fall ist2668

f ′ : D → R, x 7→ f ′(x)

die Ableitung von f .2669

Die Grenzwertdefintion mit h → 0, h 6= 0, a + h ∈ D bedeutet, dass wir alle Nullfolgen betrachten, fur2670

die kein Folgeglied gleich 0 ist, und so, dass a + h im Definitionsbereich liegt. Eine alternative aquivalente2671

Definition ist2672

f ′(a) = limx→a

x 6=a,x∈D

f(x)− f(a)

x− a.

Wir definieren auch die Tangente von f an der Stelle a als Gerade mit der Gleichung2673

y = f ′(a)(x− a) + f(a).

Dies ist die Gerade durch den Punkt (a, f(a)), mit der Steigung f ′(a).2674

Wir besprechen nun einige Beispiele:2675

• Die konstante Funktion f(x) = c ist differenzierbar, denn2676

limh→0

h6=0

f(a+ h)− f(a)

h= lim

h→0

h6=0

c− ch

= limh→0

h6=0

0 = 0

Also ist f ′(x) = 0 fur alle x ∈ R.2677

• Fur f(x) = cx ist2678

limh→0

h6=0

f(a+ h)− f(a)

h= lim

h→0

h6=0

c(a+ h)− cah

= limh→0

h6=0

ch

h= c

Also ist f ′(x) = c fur alle x ∈ R.2679

• Fur f(x) = exp(x) ist

limh→0

h6=0

f(a+ h)− f(a)

h= lim

h→0

h6=0

exp(a+ h)− exp(a)

h

= limh→0

h6=0

exp(a) exp(h)− exp(a)

h= exp(a) lim

h→0

h6=0

exp(h)− 1

h

Es gilt, dass2680

limh→0

exp(h)− 1

h= 1.

Das sieht man nicht sofort, da sowohl Zahler als auch Nenner gegen 0 konvergieren und daher die2681

Grenzwertsatze keine Anwendung finden. Ein plausibles Argument, warum der Grenzwert 1 ist, er-2682

halten wir indem wir die Reihenentwicklung von exp(h) verwenden:2683

exp(h)− 1

h=

(1 + h+ h2

2 + h3

6 + . . .)− 1

h=h+ h2

2 + h3

6 + . . .

h= 1 +

h

2︸︷︷︸→0

+h2

6︸︷︷︸→0

+ . . .→ 1.

Beachten Sie, dass dies kein echter Beweis ist, da wir eine unendliche Summe haben und daher den2684

Grenzwertsatz nicht anwenden konnen. Wir werden spater einen richtigen Beweis nachreichen.2685

Mit dieser Aussage ist dann jedenfalls exp′(a) = exp(a), dass heißt, die Ableitung der Exponential-2686

funktion ist die Exponentialfunktion selbst.2687


• Wir berechnen die Ableitung von sin(x): Zunachst folgt aus Hausaufgabe 4.2.2, dass2688

sin(a+ h)− sin(a) = 2 cos(a+h

2) sin(

h

2).

Ferner gilt2689

limx→0

sin(x)

x= 1.

Wir geben wiederum nur ein halb-formales Argument mit Hilfe der Reihenentwicklung des Sinus an:2690

sin(x)

x=x− x3

3! + x5

5! − . . .x

= 1− x2

3!︸︷︷︸→0

+x4

5!︸︷︷︸→0

− . . .→ 1

Nun konnen wir nachrechnen2691

limh→0

h6=0

sin(ah)− sin(a)

h= lim

h→0

h6=0

2 cos(a+ h2 ) sin(h2 )

h= lim

h→0

h6=0

cos(a+h

2)

︸︷︷︸=cos(a), da cos stetig ist

limh→0

h6=0

sin(h2 )h2︸︷︷︸

=1

= cos(a)

Also ist sin′(a) = cos(a).2692

• Die Betragsfunktion |x| ist fur x = 0 nicht differenzierbar. Denn zum Beispiel ist fur die Folge hn = 1n2693

|x+ hn| − |x|hn

=|0 + 1

n | − |0|1n

= 1n→∞−−−−→ 1

und fur die Folge hn = − 1n2694

|x+ hn| − |x|hn

=|0− 1

n | − |0|− 1n

= −1n→∞−−−−→ −1

Also existiert der Grenzwert2695

limh→0

h 6=0

|a+ h| − |a|h

nicht.2696

Wie wir anfangs gesehen haben, ist es fur nicht-stetige Funktionen problematisch, eine eindeutige Tan-2697

gente zu definieren. Der folgende Satz druckt dies aus, denn seine Kontraposition lautet: Ist eine Funktion2698

nicht stetig in a, dann ist sie auch nicht differenzierbar in a.2699

Theorem 4.16. Ist f : D → R differenzierbar in a, so ist f auch stetig in a.2700

Beweis. Wir definieren2701

φ : D → R, x 7→ f(x)− (f ′(a)(x− a) + f(a))

Anschaulich ist φ die Differenzfunktion von f und der Tangente von f an a. Es gilt nun

limx→a

x 6=aφ(x) = lim

x→a

x6=a(x− a)

(f(x)− f(a)

x− a− f ′(a)

)

= limx→a

x 6=a(x− a)︸︷︷︸=0

limx→a

x6=a

f(x)− f(a)

x− a︸︷︷︸=f ′(a)

− limx→a

x6=af ′(a)︸︷︷︸

=f ′(a)

= 0


Da φ(a) = 0, ist damit auch limx→a φ(x) = 0. Nun ist nach Definition2702

f(x) = f ′(a)(x− a) + f(a) + φ(x)

und somit2703

limx→a

f(x) = f ′(a) limx→a

(x− a)︸︷︷︸=0

+f(a) + limx→a

φ(x)︸︷︷︸=0

= f(a)

und somit ist die Stetigkeit von f in a bewiesen.2704

Ableitungsregeln. Es gibt zahlreiche Regeln, wie man zusammengesetzte Funktionen ableitet.2705

Theorem 4.17 (Ableitungen fur Summen und Produkte). Sind f und g differenzierbare Funktionen in xund λ ∈ R, so sind auch f + g, λg und f · g differenzierbar in x, und es gilt

(f + g)′(x) = f ′(x) + g′(x)

(λf)′(x) = λf ′(x)

(fg)′(x) = f ′(x)g(x) + f(x)g′(x)

Beweis. Wir fuhren nur die Produktregel vor. Die ersten beiden Regeln sind einfacher:

limh→0

f(x+ h)g(x+ h)− f(x)g(x)

h

= limh→0

f(x+ h)g(x+ h)− f(x)g(x+ h) + f(x)g(x+ h)− f(x)g(x)

h

= limh→0

g(x+ h)f(x+ h)− f(x)

h+ limh→0

f(x)g(x+ h)− g(x)

h

= limh→0

g(x+ h) limh→0

f(x+ h)− f(x)

h+ limh→0

f(x) limh→0

g(x+ h)− g(x)

h

=g(x)f ′(x) + f(x)g′(x),

wobei wir im letzten Schritt im ersten Grenzwert die Stetigkeit von g ausgenutzt haben.2706

Als Beispiel konnen wir zeigen, dass fur f(x) = xn mit n ∈ N gilt, dass2707

f ′(x) = nxn−1.

Der Beweis kombiniert vollstandige Induktion und die Produktregel. Es ist eine Ubungsaufgabe. Damit2708

konnen wir sofort alle Polynomfunktionen ableiten. Zum Beispiel ist fur f(x) = 3x5 − 4x2 + 7:2709

f ′(x) = 3 · 5x4 − 4 · 2x+ 0 = 15x4 − 8x.

Von großer Bedeutung ist auch die folgende Regel fur Kompositionen.2710

Theorem 4.18 (Kettenregel). Ist f differenzierbar in x und g differenzierbar in f(x), dann ist auch g ◦ f2711

differenzierbar in x und es gilt2712

(g ◦ f)′(x) = g′(f(x))f ′(x).

Wir lassen den Beweis weg und besprechen stattdessen ein Beispiel: Die Funktion f(x) = sin(x2) ist eine2713

Komposition aus der Quadratsfunktion und der Sinusfunktion, und damit ist2714

f ′(x) = cos(x2) · 2x

Wir erwahnen auch eine Regel, um Umkehrabbildungen abzuleiten:2715

Theorem 4.19 (Umkerhrregel). Sei f bijektiv und differenzierbar an der Stelle x und f ′(x) 6= 0. Dann ist2716

f−1 differenzierbar an der Stelle y = f(x) und es gilt2717

(f−1)′(y) =1

f ′(f−1(y))=

1

f ′(x)


Auch hier geben wir nur ein Beispiel an: Die Quadratfunktion f(x) = x2 ist auf dem Intervall [0,∞)2718

bijektiv und f ′(x) = 2x > 0 fur x > 0. Also ist die Umkehrabbildung g(y) :=√y differenzierbar auf (0,∞)2719

und es gilt2720

g′(y) =1

2 · √y.

2721

Hausaufgabe 4.3.1. Berechnen Sie cos′(a) und tan′(a).2722

Hausaufgabe 4.3.2. Beweisen Sie, dass nxn−1 die Ableitung von xn fur alle naturlichen Zahlen n ist.2723

Hausaufgabe 4.3.3. Beweisen Sie, dass 12√x

die Ableitung von√x ist ohne Verwendung der Umkehrregel.2724

(Tipp: Dritte binomische Formel)2725

Hausaufgabe 4.3.4. Beweisen Sie, dass die Ableitung der Funktion 1x die Funktion − 1

x2 ist.2726

Hausaufgabe 4.3.5. Verwenden Sie die Umkehrregel, um zu zeigen, dass2727

arccos′(x) = − 1√1− x2

.

Hausaufgabe 4.3.6. Untersuchen Sie die Differenzierbarkeit von 1x .2728

Hausaufgabe 4.3.7. Bestimmen Sie die Ableitung der Funktionen f(x) = cos(ex) und g(x) = x3 sin(x)√x.2729

Fur welche x ∈ R gilt der hergeleitete Ausdruck?2730

Hinweis: Benutzen Sie die vorherigen Aufgaben.2731

Hausaufgabe 4.3.8. Geben Sie eine Ableitungsregel fur den Quotienten fg an und beweisen Sie diese mit2732

Hilfe der Produktregel, Kettenregel und der Hausaufgabe 4.3.4.2733

4.4 Eigenschaften differenzierbarer Funktionen2734

Die Ableitung einer Funktion gibt viele Informationen uber das Verhalten der Funktion. Wir besprechen2735

einige Eigenschaften.2736

Maxima und Minima. Sei D ⊂ R. Wir nennen x ∈ D einen inneren Punkt von D, falls es ein ε > 02737

gibt, so dass (x − ε, x + ε) ⊂ D. Anschaulich bedeutet dies, das x in D ist, aber kein Randpunkt ist. Zum2738

Beispiel sind die inneren Punkte eines abgeschlossenen Intervalls [a, b] alle Punkte in (a, b).2739

Theorem 4.20. Sei f : D → R differenzierbar und a ein innerer Punkt von D. Dann gibt es ein Intervall2740

I = [a− ε, a+ ε] ⊂ D mit ε > 0, so dass gilt:2741

• Ist f ′(a) > 0, dann gilt fur x ∈ I:

x > a⇒ f(x) > f(a)

x < a⇒ f(x) < f(a).

• Ist f ′(a) < 0, dann gilt fur x ∈ I:

x > a⇒ f(x) < f(a)

x < a⇒ f(x) > f(a).

Beweis. Hier ist die Beweisidee: Angenommen, f ′(a) > 0, aber es gibt kein Intervall I wie gefordert. Dann2742

konnen wir fur jedes n ∈ N einen Punkt xn ∈ [a − 1n , a + 1

n ] finden, so dass xn 6= a, f(xn) ≤ f(a) falls2743

4.4. EIGENSCHAFTEN DIFFERENZIERBARER FUNKTIONEN 105

xn > a und f(xn) ≥ f(a) falls xn < a. Die Folge der xn konvergiert klarerweise gegen a, und fur jedes n ist2744

der Quotient f(xn)−f(a)xn−a ≤ 0. Damit ist der Grenzwert dieser Folge auch ≤ 0. Es gilt also2745

f ′(a) = limx→a

x6=a,x∈D

f(x)− f(a)

x− a= limn→∞

f(xn)− f(a)

xn − a≤ 0

was der Voraussetzung f ′(a) > 0 widerspricht. Der Fall f ′(a) < 0 geht analog.2746

Wir sagen, dass ein innerer Punkt x0 ∈ D ein lokales Maximum ist, falls es ein I = [x0 − ε, x0 + ε] gibt,2747

so dass f(x0) ≥ f(x) fur alle x ∈ I. Ein lokales Minimum ist ein Punkt, so dass f(x0) ≤ f(x) fur alle x ∈ I.2748

Nach dem vorherigen Satz folgt sofort:2749

Korollar 4.21. Ist x0 ein lokales Minimum oder lokales Maximum einer differenzierbaren Funktion, dann2750

ist f ′(x0) = 0.2751

Wir wissen, dass eine stetige Funktion auf einem abgeschlossenen Intervall sein Maximum und Minimum2752

annimmt (Satz 2.34). Allerdings gab uns der Beweis kein Verfahren, um das Maximum und Minimum zu2753

bestimmen. Fur differenzierbare Funktionen ist dies jedoch moglich:2754

Theorem 4.22. Sei f : [a, b]→ R differenzierbar und sei x0 ∈ [a, b], so dass f(x0) ein Maximum von f ist.2755

Dann gilt2756

1. f ′(x0) = 0, oder2757

2. x0 = a oder x0 = b.2758

Beweis. Ist x0 6= a und x0 6= b, dann ist x0 ein innerer Punkt. Da f(x0) das (globale) Maximum uber [a, b]2759

ist, muss x0 auch lokales Maximum sein. Wie oben gesehen ist damit f ′(x0) = 0.2760

Die gleiche Aussage gilt auch fur das Minimum von f .2761

Als Beispiel berechnen wir das Maximum der Funktion2762

f(x) = x2 − 3x+ 1 +4

x

auf dem Intervall [1, 4]. f ist differenzierbar und wir berechnen die Ableitung als2763

f ′(x) = 2x− 3− 4

x2.

Um die lokalen Extremstellen zu finden, mussen wir die Gleichung f ′(x) = 0 losen. Da auf dem Definitions-2764

gebiet x2 6= 0, konnen wir mit x2 multiplizieren und erhalten2765

2x3 − 3x2 − 4 = 0.

Wir “raten” hier, dass x = 2 eine Losung ist. Durch Polynomdivision erhalten wir2766

(x− 2)(2x2 + x+ 2) = 0

und durch quadratische Erganzung (oder p-q-Formel) sehen wir, dass 2x2 + x + 2 keine reellen Losungen2767

besitzt. Daraus folgt, dass das Maximum der Funktion an der Stelle x = 1, x = 2, oder x = 4 angenommen2768

wird. Wir rechnen nach2769

f(1) = 1− 3 + 1 + 4 = 3, f(2) = 4− 6 + 1 + 2 = 1, f(4) = 16− 12 + 1 + 1 = 6.

Das Maximum der Funktion ist also 6 und wird an der Stelle x = 4 angenommen.2770


a b

Abbildung 4.4: Die gestrichtelte Tangente ist parallel zur Sekante durch (a, f(a)) und (b, f(b)).

Mittelwertsatz. Der Mittelwertsatz lasst sich anschaulich so ausdrucken: Fur eine differenzierbare Funk-2771

tion f und eine beliebige Sekante von (a, f(a)) nach (b, f(b)) gibt es zwischen a und b eine Tangente an f ,2772

die parallel zur Sekante verlauft. Abbildung 4.4 illustriert diesen Sachverhalt.2773

Fur den Beweis betrachten wir erstmal den Spezialfall, dass die Sekante horizontal ist.2774

Lemma 4.23 (Satz von Rolle). Sei f : [a, b]→ R differenzierbar und f(a) = f(b). Dann gibt es ein ξ ∈ (a, b)2775

mit f ′(ξ) = 0.2776

Beweis. Ist f die konstante Funktion, dann ist f ′(x) = 0 fur alle x ∈ [a, b], und die Aussage ist klar.2777

Sonst gibt es ein x0 ∈ (a, b) mit f(x0) 6= f(a). Wir nehmen an, dass f(x0) > f(a), der andere Fall geht2778

genauso. Da f stetig auf [a, b] ist, nimmt f sein Maximum an. Dieses Maximum muss aber im Innern von2779

[a, b] liegen (denn f(a) ist kein Maximum wegen f(x0) > f(a)). Nach Theorem 4.22 ist das Maximum also2780

ein lokales Maximum, und daher muss an der Stelle ξ, an der das Maximum angenommen wird, f ′(ξ) = 02781

gelten.2782

Eine Folgerung dieses Lemmas ist, dass zwischen zwei Nullstellen von f immer eine Nullstelle der Ab-2783

leitung liegen muss.2784

Theorem 4.24 (Mittelwertsatz). Ist f : [a, b]→ R differenzierbar, dann gibt es ein ξ ∈ (a, b) mit2785

f ′(ξ) =f(b)− f(a)

b− a.

Das ist in der Tat die Aussage von oben: f ′(ξ) ist die Tangentensteigung an der Stelle ξ, und f(b)−f(a)b−a2786

ist die Sekantensteigung fur die Sekante von a nach b. Das diese Steigungen gleich sind bedeutet, dass die2787

Geraden parallel (oder gleich) sind.2788

Beweis. Definiere die Hilfsfunktion2789

F (x) := f(x)− f(b)− f(a)

b− a(x− a)

Man rechnet nun leicht nach, dass F (a) = f(a) = F (b) gilt. Ferner ist F differenzierbar, weil f differenzierbar2790

ist. Nach dem Satz von Rolle gibt es also ein ξ ∈ (a, b) mit F ′(ξ) = 0. Wir rechnen nach, dass2791

F ′(x) = f ′(x)− f(b)− f(a)

b− a

Also impliziert F ′(ξ) = 0, dass2792

f ′(ξ) =f(b)− f(a)

b− a.

2793

Eine Konsequenz aus dem Mittelwertsatz ist das Monotonieverhalten differenzierbarer Funktionen.2794

4.4. EIGENSCHAFTEN DIFFERENZIERBARER FUNKTIONEN 107

Korollar 4.25. Sei f : [a, b]→ R differenzierbar.2795

1. Ist f ′(x) > 0 fur alle x ∈ [a, b], dann ist f streng monoton wachsend.2796

2. Ist f ′(x) ≥ 0 fur alle x ∈ [a, b], dann ist f monoton wachsend.2797

3. Ist f ′(x) < 0 fur alle [a, b], dann ist f streng monoton fallend.2798

4. Ist f ′(x) ≤ 0 fur alle [a, b], dann ist f monoton fallend.2799

Beweis. Wir fuhren nur den ersten Teil vor (der Rest geht ganz ahnlich). Angenommen, f ′(x) > 0 fur alle2800

x ∈ [a, b], aber f ist nicht streng monoton wachsend. Dann gibt es u < v ∈ [a, b], so dass f(u) ≥ f(v). Das2801

heißt, die Sekante von u nach v hat Steigung ≤ 0, oder formaler, f(v)−f(u)v−u ≤ 0. Nach dem Mittelwertsatz2802

gibt es ein ξ ∈ (u, v) mit f ′(ξ) ≤ 0. Da ξ ∈ [a, b], ist das ein Widerspruch zur Voraussetzung.2803

Wir wissen bereits, dass die Ableitung einer konstanten Funktion die Nullfunktion ist. Wir zeigen nun,2804

dass auch die Umkehrung gilt.2805

Korollar 4.26. Sei f : R → R differenzierbar mit f ′(x) = 0 fur alle x ∈ R. Dann gibt es ein c so dass2806

f(x) = c fur alle x ∈ R (d.h., f ist eine konstante Funktion).2807

Beweis. Wir beweisen die Aussage durch Kontraposition. Sei f nicht konstant. Dann gibt es x, y ∈ R mit2808

f(x) 6= f(y). Damit ist f(x)−f(y)x−y 6= 0. Nach dem Mittelwertsatz gibt es also ein ξ ∈ R mit f ′(ξ) 6= 0. Also2809

ist f ′ nicht die Nullfunktion.2810

Wir konnen nun eine interessante Charakterisierung der Exponentialfunktion herleiten:2811

Theorem 4.27. Sei f : R→ R differenzierbar mit f(0) = 1 und f ′ = f . Dann ist f = exp.2812

Beweis. Gegeben ein f wie oben, definiere2813

F (x) := f(x) exp(−x)

F ist differenzierbar. Wir berechnen die Ableitung mit der Produktregel2814

F ′(x) = f ′(x) exp(−x)− f(x) exp(−x) = f(x) exp(−x)− f(x) exp(−x) = 0

(das Minus in der Ableitung kommt von der inneren Ableitung von exp(−x)!). Es folgt, dass F eine konstante2815

Funktion ist (nach dem vorangehenden Korollar). Es gilt ferner2816

F (0) = f(0) exp(0) = 1 · 1 = 1.

Also ist f(x) exp(−x) = 1 fur alle x, und Multiplikation mit exp(x) auf beiden Seiten ergibt f(x) =2817

exp(x).2818

L’Hopital’sche Regel. Wir besprechen noch kurz einen Satz, mit dem man das Grenzwertverhalten von2819

Quotienten oft sehr leicht untersuchen kann.2820

Theorem 4.28. Sei I ein offenes Intervall und seien f, g : I → R differenzierbar mit x0 ∈ I und seig(x) 6= 0 fur alle x ∈ I \ {x0}. Falls

limx→x0

f(x) = 0 und limx→x0

g(x) = 0

oder limx→x0

f(x) =∞ und limx→x0

g(x) =∞

dann gilt: Falls2821

c := limx→x0

f ′(x)

g′(x)

existiert, so gilt2822

limx→x0

f(x)

g(x)= c.

Der Satz gilt auch fur x0 = ±∞ und c = ±∞.2823


Auf den Beweis verzichten wir, verwenden den Satz jedoch, um zwei Grenzwerte aus diesem Kapitel2824

auszurechnen:2825

• Betrachte2826

limx→0

sin(x)

x

Da f(x) = sin(x) und g(x) = x beide fur x→ 0 gegen 0 konvergieren (und differenzierbare Funktionen2827

sind), ist die L’Hopital’sche Regel anwendbar. Es ist also2828

limx→0

f(x)

g(x)= limx→0

f ′(x)

g′(x)= limx→0

cos(x)

1= cos 0 = 1.

• Betrachte2829

limx→0

exp(x)− 1

x

Auch hier ist mit f(x) = exp(x)− 1 und g(x) = x die Regel anwendbar:2830

limx→0

f(x)

g(x)= limx→0

f ′(x)

g′(x)= limx→0

exp(x)

1= exp(0) = 1.

2831

Hausaufgabe 4.4.1. Geben Sie fur folgende Funktionen alle Intervalle an, fur die der Mittelwertsatz der2832

Differentialrechnung gilt:2833

a. f(x) =

{1x x 6= 0,

0 sonst,, b. g(x) = |x− 5| .

Geben Sie ein Gegenbeispiel fur ein Intervall, fur das der Mittelwertsatz der Differentialrechnung nicht gilt.2834

Hausaufgabe 4.4.2. Bestimmen Sie alle lokalen Minima und Maxima der Funktion f(x) = c · sin(x) fur2835

c ∈ R.2836

Hausaufgabe 4.4.3. Untersuchen Sie das Vorzeichen der Ableitung von f , die Monotonie von f und die2837

Extremwerte von f fur:2838

a. f(x) = x3 − 3

2x2 + 2, b. f(x) =

1

1 + x2, c. f(x) = e−x

2

.

4.5 Integralrechnung2839

Die Motivation fur die Integralrechnung besteht in der Berechnung eines Flacheninhalts (oder Volumens, in2840

hoheren Dimensionen) eines Objekts, welches durch eine Funktion begrenzt wird. Nehmen wir der Einfach-2841

heit halber an, dass unsere Funktion nicht-negativ ist und uber dem Intervall [a, b] definiert ist. Wir wollen2842

den Flacheninhalt der markierten Flache in Abbildung 4.5 bestimmen.2843

Wie berechnet man diesen Flacheninhalt? Eine Idee ist wie folgt: Wir unterteilen das Intervall [a, b] in2844

kleinere Teilintervalle und approximieren den Flacheninhalt uber dem Teilintervall durch ein Rechteck. Die2845

Hohe des Rechtecks konnen wir zum Beispiel als minimalen Funktionswert uber dem Teilintervall wahlen,2846

so wie in Abbildung 4.6 links, oder als das Maximum so wie in Abbildung 4.6 rechts. Es gibt auch andere2847

Moglichkeiten (zum Beispiel den Mittelpunkt zwischen Minimum und Maximum als Hohe zu wahlen). In2848

jedem Fall ist die Idee, dass sich die Vereinigung aller Rechtecke immer weiter der gesuchten Flache annahert,2849

je kleiner man die Teilintervalle wahlt. Wir konnen also den Flacheninhalt als Grenzwert dieses Prozesses2850

audrucken, wobei die Lange der Teilintervalle gegen 0 konvergiert. Die folgenden Definitionen formalisieren2851

diese Idee weiter und fuhren zum Begriff des Integrals.2852

4.5. INTEGRALRECHNUNG 109

a b

Abbildung 4.5: Der zu bestimmende Flacheninhalt.

a b a b

Abbildung 4.6: Approximation des Flacheninhalts durch Rechtecke.

Definition 4.29. Eine Unterteilung Z von [a, b] mit Stutzstellen a = x0 < x1 . . . < xn = b besteht aus2853

n Teilintervallen [xi−1, xi]. Wir bezeichnen die Lange des großten Teilintervalls maxi=1,...,n(xi − xi−1) als2854

Feinheit der Unterteilung. Wahlen t1, . . . , tn so dass ti ∈ [xi−1, xi]. Wir definieren die Riemannsumme von2855

f bezuglich t1, . . . , tn als2856

SZ(t1, . . . , tn) :=

n∑i=1

(xi − xi−1)f(ti)

Beachten Sie, dass (xi − xi−1)f(ti) der Flacheninhalt des Rechtecks mit Lange [xi−1, xi] und Hohe2857

[0, f(ti)] ist. Die Riemannsumme addiert also den Flacheninhalt dieser Rechtecke. Wir erhalten Abbil-2858

dung 4.6 links, wenn wir ti so wahlen, dass f(ti) minimal in [xi−1, xi] ist, und Abbildung 4.6 rechts, wenn2859

f(ti) maximal gewahlt wird.2860

Definition 4.30. Eine Funktion f ; [a, b] → R heißt integrierbar falls fur jede Folge von Unterteilungen,2861

deren Feinheiten gegen 0 konvergieren, die Riemannsummen gegen den gleichen Grenzwert konvergieren2862

(unabhangig von der Wahl der ti). In diesem Fall schreiben wir den Grenzwert als2863 ∫ b

a

f(x)dx

und nennen diesen Wert das Integral von f uber dem Intervall [a, b]. Falls b < a, definieren wir auch2864 ∫ b

a

f(x)dx := −∫ a

b

f(x)dx.

Auf den Ausdruck “dx” gehen wir nicht weiter ein; er zeigt an, uber welche Variable integriert wird (was2865

meistens ohnehin klar ist).2866

Welche Funktionen sind integrierbar? Recht viele! Wir notieren ohne Beweis:2867

Theorem 4.31. Fur f : [a, b]→ R:2868

• Ist f stetig, dann ist f auch integrierbar.2869


• Ist f monoton, dann ist f auch integrierbar.2870

Ein Beispiel fur eine nicht-integrierbare Funktion ist2871

f(x) =

1x x > 0

0 x = 0

− 1x x < 0

auf dem Intervall [−1,+1].2872

Es ist anhand der Definition alles andere als klar, wie man ein Integral konkret ausrechnet (man kann2873

es durch eine Summe annahern, aber nicht exakt bestimmen). Das folgende Resultat liefert eine Antwort,2874

die Integrale mit Differentialrechnung in Verbindung setzt.2875

Theorem 4.32 (Hauptsatz der Integralrechnung, Teil 1). Fur f : [a, b]→ R stetig sei2876

F (x) : [a, b]→ R, x 7→∫ x

a

f(t)dt

Dann ist F differenzierbar und es gilt F ′ = f .2877

Obwohl der Beweis nicht schwierig ist, uberspringen wir ihn.2878

Definition 4.33. Wir nennen eine Funktion F : [a, b] → R eine Stammfunktion von f auf [a, b], wenn2879

F ′(x) = f(x) fur alle x ∈ [a, b].2880

Zwei Stammfunktionen F und G von f unterscheiden sich nur durch eine Konstante, denn (F −G)′ =2881

F ′ −G′ = f − f = 0, also ist F −G eine konstante Funktion (nach Korollar 4.26).2882

Theorem 4.34 (Hauptsatz der Integralrechnung, Teil 2). Sei F eine Stammfunktion von f auf [a, b]. Dann2883

gilt2884 ∫ b

a

f(x)dx = F (b)− F (a)

Auch hier lassen wir den Beweis weg. Man schreibt oft auch ein unbestimmtes Integral2885 ∫f(x)dx = F

um auszudrucken, dass F Stammfunktion von f fur jedes Intervall ist. Dabei ist zu beachten, dass die2886

Stammfunktion nur bis auf eine Konstante festgelegt ist.2887

Das Verfahren, um ein Integral zu bestimmen, laßt sich also wie folgt zusammenfassen:2888

1. Bestimme eine Stammfunktion F von f .2889

2. Werte F an den Integralgrenzen aus.2890

Wenig uberraschend ist der erste Schritte der schwierigere. Wahrend eine Ableitung zu berechnen relativ2891

einfach ist, ist die Umkehrung (das Berechnen der Stammfunktion) deutlich schwieriger. In der Tat ist der2892

beste Weg haufig, eine Stammfunktion F fur f zu “raten” — und durch Ableiten nachzuweisen, dass2893

F ′ = f in der Tat gilt. Naturlich muss man geschickt raten, was man nur durch Ubung erreichen kann. Es2894

gibt auch einige allgemeine Techniken, um Stammfunktionen zu berechnen, aber wir besprechen diese nicht2895

und schliessen das Kapitel mit ein paar Beispielen ab.2896

• Wir berechnen2897 ∫ 2π

0

sin(x)dx

Wir wissen, dass cos′ = − sin, also ist − cos′ = sin, und somit ist − cos(x) eine Stammfunktion des2898

Sinus. Also ist2899 ∫ 2π

0

sin(x)dx = − cos(2π)− (− cos(0)) = −1 + 1 = 0

4.5. INTEGRALRECHNUNG 111

Abbildung 4.7: Das Integral der Sinuskurve.

Um das Ergebnis zu verstehen schauen wir uns Abbildung 4.7 an, welches die Sinusfunktion zwischen2900

0 und 2π darstellt. Wir beachten, dass das Integral mit Vorzeichen behaftet ist, d.h. wenn die Funktion2901

unterhalb der x-Achse verlauft, geht der entsprechende Flacheninhalt negativ in das Integral ein. Da2902

sich in diesem Fall die positiven und negativen Flacheninhalte offenbar aufheben, ist der Wert 0 des2903

Integrals zwangslaufig. Rechnen wir nun den linken Teil aus, ergibt sich ein positiver Wert:2904 ∫ π

0

sin(x)dx = − cos(π)− (− cos(0)) = 1 + 1 = 2

• Besteht die Funktion f aus einer Summe, so kann man die Stammfunktion jedes Summanden bestim-2905

men und aufaddieren (das folgt sofort aus der Tatsache, dass die Ableitung einer Summe gleich der2906

Summe der Ableitungen ist). Als Beispiel betrachten wir2907 ∫ 2

1

(x2 − 3x+ 4)dx.

Eine Stammfunktion von x2 ist 13x

3, wie man leicht nachrechnet. Ebenso ist − 32x

2 Stammfunktion2908

von −3x und 4x Stammfunktion von 4. Also ist2909

F (x) :=1

3x3 − 3

2x2 + 4x

Stammfunktion. Da F (2) = 143 und F (1) = 17

6 , gilt2910 ∫ 2

1

(x2 − 3x+ 4)dx =14

3− 17

6=

11

6.

• Die Integralgrenzen konnen auch ±∞ sein. Zum Beispiel ist2911 ∫ ∞1

1

x2dx = lim

y→∞

∫ y

1

1

x2dx.

Anschaulich enspricht dies dem Flacheninhalt des unbegrenzten Gebiets unter dem Funktiongraph 1x22912

uber [1,∞) (siehe Abbildung 4.8).2913

Zur Berechnung brauchen wir wiederum die Stammfunktion von 1x2 . Diese ist − 1

x , wie man leicht2914

nachrechnet. Es ist also2915 ∫ y

1

1

x2dx = −1

y− (−1

1) = 1− 1

y

und daher2916 ∫ ∞1

1

x2dx = lim

y→∞(1− 1

y) = 1.

2917


Abbildung 4.8: Die Kurve 1x2 .

Hausaufgabe 4.5.1. Berechnen Sie den Flacheninhalt einer halben Kreisscheibe mit Hilfe der Integral-2918

rechnung (Tipp: Hausaufgabe 4.3.5 kann sehr hilfreich sein).2919

Hausaufgabe 4.5.2. Bestimme fur n ∈ N eine Stammfunktion von xn.2920

Hausaufgabe 4.5.3. Sei n ∈ N. Drucken Sie2921 ∫xnexdx

ohne einen Integraloperator aus.2922

Hausaufgabe 4.5.4. Bestimmen Sie alle α ∈ R, fur die der Grenzwert2923

limy→∞

∫ y

1

1

xαdx

existiert.2924

Hinweis: Sie durfen ohne Beweis benutzen, dass lima→∞ a−b genau dann konvergiert, wenn b ≥ 0 ist.2925

Hausaufgabe 4.5.5. Die x-Achse und der Graph der Funktion f(x) = x(x − 1)(x + 2) umschließen zwei2926

beschrankte Bereiche. Bestimme ihren Gesamt-Flacheninhalt (also unbeachtet auf positiver und negativer2927

Flache).2928

Kapitel 52929

Lineare Algebra, Teil II2930

5.1 Determinanten2931

Wir motivieren den Determinantenbegriff zunachst in niedrigen Dimensionen. Betrachten wir x, y ∈ R2.2932

1. Wir wissen bereits, dass α := ^(x, y) der (kleinere) Winkel ist, der durch x und y definiert ist. Wir2933

fragen nun: Erhalten wir y aus x, indem wir x um α im oder gegen den Uhrzeigersinn drehen? Im2934

ersten Fall heißt das Paar (x, y) negativ orientiert, sonst positiv orientiert.2935

2. Wie groß ist der Flacheninhalt des Parallelogramms, welches durch x und y aufgespannt wird?2936

Fur die erste Frage: Erinnern Sie sich, dass2937

^(x, y) = arccos〈x, y〉‖x‖‖y‖

.

Da cos(x) ≥ 0 auf [0, π2 ] und cos(x) ≤ 0 auf [π2 , π] ist, folgt daraus sofort:2938

^(x, y) =

< π

2 wenn 〈x, y〉 > 0

= π2 wenn 〈x, y〉 = 0

> π2 wenn 〈x, y〉 < 0.

Mit anderen Worten: das Vorzeichen des Skalarproduktes 〈x, y〉 gibt an, ob der Winkel zwischen x und y spitz2939

(< π2 ) oder stumpf (> π

2 ) ist. Die folgende Aussage folgt sofort durch einfache geometrische Betrachtungen:2940

Lemma 5.1. Sei x⊥ der Vektor, der aus x durch eine Drehung um π2 hervorgeht (gegen den Uhrzeigersinn).2941

Dann gilt:2942

• Ist 〈x⊥, y〉 > 0, dann ist (x, y) positiv orientiert.2943

• Ist 〈x⊥, y〉 < 0, dann ist (x, y) negativ orientiert.2944

• Ist 〈x⊥, y〉 = 0, dann sind x und y linear abhanging.2945

Der Vektor x⊥ lasst sich aus x einfach durch die entsprechende Drehmatrix berechnen:2946

x⊥ =

(cos π2 − sin π

2sin π

2 cos π2

)(x1

x2

)=

(0 −11 0

)(x1

x2

)=

(−x2

x1

).

Daher ist die Antwort auf die Frage durch das Vorzeichen von2947

〈x⊥, y〉 = x1y2 − x2y1

gegeben.2948

113

114 KAPITEL 5. LINEARE ALGEBRA, TEIL II

Abbildung 5.1: Die sechs Summanden der Determinante.

Zur zweiten Frage (Flacheninhalt des Parallelogramms) bemerken wir, dass dieser Flacheninhalt gegeben2949

ist durch Grundseite mal Hohe. Wahlen wir den Vektor x als Grundseite, ist die Lange naturlich ‖x‖. Fur2950

die Hohe beobachten wir, dass x, x⊥ (wie oben definiert) eine Orthogonalbasis ist. Schreiben wir x, x⊥ fur2951

die normierten Vektoren, ergibt sich eine Orthonormalbasis. Wir konnen dann y schreiben als2952

y = 〈y, x〉x+ 〈y, x⊥〉x⊥

und die Hohe des Parallelogramms entspricht dann genau dem Betrag des zweiten Koeffizient |〈y, x⊥〉|.2953

Beachten Sie auch, dass ‖x⊥‖ = ‖x‖ gilt. Also ist der Flacheninhalt2954

‖x‖|〈y, x⊥〉| = ‖x‖|〈y, x⊥

‖x‖〉| = |〈y, x⊥〉| = |x1y2 − x2y1|,

also gibt der Absolutbetrag des gleichen Ausdrucks wie oben den Flacheninhalt an.2955

Wir nennen die Funktion2956

det : R2 × R2 → R, (x, y) 7→ x1y2 − x2y1

die Determinante in R2.2957

Im R3 definieren wir ebenfalls eine Determinante. Dafur betrachten wir zuerst das Kreuzprodukt2958

x× y :=

x2y3 − x3y2

x3y1 − x1y3

x1y2 − x2y1

und definieren die Determinante im R3 als2959

det(x, y, z) := 〈x× y, z〉

Ausgeschrieben ergibt das2960

det(x, y, z) = x1y2z3 + x2y3z1 + x3y1z2 − x3y2z1 − x2y1z3 − x1y3z2.

Man merkt sich diese Form leichter mit der Regel van Sarrus, die in Abbildung 5.1 dargestellt ist. Mit ein2961

wenig Ubung lasst sich die Determinate so auch recht schnell berechnen.2962

Wir berechnen als Beispiel2963

det(

134

,

2−13

,

013

) = −3 + 8 + 0− 0− 3− 18 = −16

Alternativ konnen wir auch das Kreuzprodukt berechnen:2964 134

× 2−13

=

9 + 48− 3−1− 6

=

135−7

und2965

det = 〈

135−7

,

013

〉 = 5− 21 = −16.

5.1. DETERMINANTEN 115

Die Interpretation der Determinante im R3 ist dem ebenen Fall ganz ahnlich. Der Betrag von det(x, y, z)2966

gibt das Volumen des Spats an, der durch die drei Vektoren aufgespannt wird (der Spat ist eine Art verzerrter2967

Wurfel). Das Volumen ist 0 genau dann, wenn die drei Vektoren linear abhangig sind. Das Vorzeichen gibt2968

an, ob die durch x, y, z aufgespannte Basis positiv oder negative orientiert ist. Was das bedeutet, kann man2969

mit dem folgenden Verfahren erklaren:2970

1. Sind (x, y) positiv orientiert (innerhalb der aufgespannten Ebene), nimm die rechte Hand, sonst die2971

linke Hand.2972

2. Halte Daumen, Zeige- und Mittelfinger der entsprechenden Hand so, dass der Daumen in Richtung2973

von x und der Zeigefinger in Richtung von y zeigt. Halte den Mittelfinger so, dass er senkrecht auf den2974

beiden anderen Fingern steht. Außer fur Leute mit sehr großer Flexibilitat gibt es nur eine Richtung,2975

in der dies moglich ist.2976

3. Die Determinante ist positiv, genau dann wenn der Vektor z in den gleichen Halbraum zeigt wie der2977

Mittelfinger.2978

Dies hat durchaus praktische Anwendungen, zum Beispiel in der Physik und Elektrotechnik (siehe https:2979

//de.wikipedia.org/wiki/Drei-Finger-Regel).2980

Der allgemeine Determinantenbegriff.2981

Definition 5.2. Eine Abbildung2982

det : Kn × . . .×Kn︸︷︷︸n mal

→ K

heißt Determinante, wenn gilt:2983

(multi-linear) Fur alle i = 1, . . . , n gilt2984

det(x1, . . . , λxi + x′i, . . . , xn) = λ det(x1, . . . , xi, . . . , xn) + det(x1, . . . , x′i, . . . , xn).

(alternierend) Ist xi = xj fur i 6= j, dann gilt2985

det(x1, . . . , xn) = 0

(normiert)det(e1, . . . , en) = 1

Fur eine Matrix A ∈ Kn definieren wir det(A) als die Determinante der Zeilenvektoren von A. Im Folgenden2986

bezeichnen wir mit A1, . . . , An diese Zeilenvektoren.2987

Man kann nachweisen (Hausaufgabe), dass die Determinanten, die wir in R2 und in R3 definiert haben2988

in der Tat diese drei Eigenschaften erfullen.2989

Theorem 5.3. Fur jedes n ≥ 2 existiert eine Determinantenabbildung. Diese ist auch eindeutig definiert.2990

Wir werden die Existenz fur n > 3 nicht im Detail zeigen, geben allerdings eine Formel fur die allgemeine2991

Determinante an (die sogenannte Laplace’sche Entwicklungsformel). Fur j = 1, . . . , n beliebig ist2992

det(A) =

n∑i=1

(−1)i+jaij det(Aij)

wobei aij der (i, j)-Eintrag der Matrix A ist, und Aij die (n1) × (n − 1)-Matrix ist, die aus A entsteht2993

wenn wir die i-te Zeile und die j-te Spalte loschen. Man kann die drei Eigenschaften der Determinante mit2994

vollstandiger Induktion beweisen.2995

Die Eindeutigkeit der Determinante folgt aus den Eigenschaften, die wir im Folgenden studieren werden.2996

Zunachst uberlegen wir uns, was mit der Determinante von A passiert, wenn wir elementare Zeilenopera-2997

tionen anwenden.2998


Lemma 5.4. Es gilt2999

1. Fur λ ∈ K ist3000

det(A1, . . . , λAi, . . . , An) = λ det(A1, . . . , Ai, . . . , An).

2. Fur i < j ist3001

det(A1, . . . , Aj , . . . , Ai, . . . , An) = −det(A1, . . . , Ai, . . . , Aj , . . . , An)

(d.h., Vertauschen von zwei Zeilen andert das Vorzeichen der Determinante).3002

3. Es gilt3003

det(A1, . . . , Ai, . . . , Aj + λAi, . . . , An) = det(A1, . . . , Ai, . . . , Aj , . . . , An)

(d.h. eine Zeilenaddition andert die Determinante nicht).3004

Beweis. Die erste Eigenschaft folgt sofort aus der Linearitat der Determinante. Die dritte Eigenschaft folgt3005

auch einfach:3006

det(A1, . . . , Ai, . . . , Aj+λAi, . . . , An) = det(A1, . . . , Ai, . . . , Aj , . . . , An)+λ det(A1, . . . , Ai, . . . , Ai, . . . , An)︸︷︷︸= 0, da det alternierend ist

.

Fur die zweite Eigenschaft zeigen wir, dass3007

det(A1, . . . , Ai, . . . , Aj , . . . , An) + det(A1, . . . , Aj , . . . , Ai, . . . , An) = 0,

was offensichtlich die Aussage impliziert. Da det alternierend und linear ist, folgt

det(A1, . . . , Ai, . . . , Aj , . . . , An) + det(A1, . . . , Aj , . . . , Ai, . . . , An)

= det(A1, . . . , Ai, . . . , Aj , . . . , An) + det(A1, . . . , Ai, . . . , Ai, . . . , An)︸︷︷︸=0

+

det(A1, . . . , Aj , . . . , Ai, . . . , An) + det(A1, . . . , Aj , . . . , Aj , . . . , An)︸︷︷︸=0

= det(A1, . . . , Ai, . . . , Ai +Aj , . . . , An) + det(A1, . . . , Aj , . . . , Ai +Aj , . . . , An)

=0.

3008

Es folgt eine weitere wichtige Eigenschaft der Determinanten: Ist die Matrix in Dreiecksgestalt (d.h.3009

unter der Diagonalen sind nur Nullen), so lasst sich der Wert einfach berechnen:3010

Lemma 5.5. Ist A eine obere Dreiecksmatrix, d.h3011

A =

λ1 ∗. . .

0 λn

mit λ1, . . . , λn ∈ K (nicht notwendigerweise 6= 0), dann ist3012

detA = λ1 · . . . · λn.

Beweis. Wir skizzieren den Beweis nur: Sind alle λi 6= 0, dann konnen wir durch weitere elementare Zeilen-3013

operationen (vom Typ 3 in Lemma 5.4) A auf die Gestalt3014 λ1 0. . .

0 λn

5.1. DETERMINANTEN 117

bringen (also mit samtlichen Eintragen 0, außer auf der Diagonalen). Diese Operationen andern die Deter-3015

minante nicht. Mit dem ersten Fall von Lemma 5.4 ergibt sich also3016

detA = det

λ1 0. . .

0 λn

= λ1 . . . λn det En = λ1 . . . λn,

wobei wir im letzten Schritt ausgenutzt haben, dass det normiert ist.3017

Es fehlt noch der Fall, dass ein λi = 0 ist. In dem Fall lasst sich durch Zeilenoperationen eine ganze3018

Zeile von A auf 0 bringen. Es ist dann leicht zu sehen, dass die Determinante auch 0 sein muss, denn3019

det(. . . , 0, . . .) = det(. . . , 0 · 0, . . .) = 0 det(. . . , 0, . . .) = 0

Dies beweist die Aussage.3020

Damit haben wir einen Algorithmus, um die Determinante zu berechnen:3021

1. Bringe die Matrix in Zeilenstufenform (mit Operationen vom Typ 2 und 3 in Lemma 5.4). Sei k die3022

Anzahl von durchgeuhrten Zeilenvertauschungen und3023 λ1 ∗. . .

0 λn

die Zeilenstufenform.3024

2. Berechne (−1)kλ1 · . . . · λn.3025

Der Faktor (−1)k ist so zu interpretieren: Ist die Anzahl der Zeilenvertauschungen ungerade, dann muss3026

das Vorzeichen von λ1 · . . . · λn umgedreht werden.3027

Es ist auch moglich, Operationen vom Typ 1 anzuwenden (also eine Zeile mit einem Skalar zu multipli-3028

zieren). In dem Fall muss das Endergebnis durch den gleichen Skalarwert dividiert werden.3029

Als Beispiel berechnen wir

det(

013

,

51520

,

2−13

) = det

0 1 35 15 202 −1 3

= 5 det

0 1 31 3 42 −1 3

=− 5 det

1 3 40 1 32 −1 3

= −5 det

1 3 40 1 30 −7 −5

= −5 det

1 3 40 1 30 0 16

=− 5 · 1 · 1 · 16 = −80.

Naturlich kann man hier auch die Sarrusregel anwenden — allerdings funktioniert diese Methode fur3030

beliebig grosse Matrizen.3031

Wir konnen nun beweisen, dass die Determinantenabbildung eindeutig ist (der zweite Teil von Theo-3032

rem 5.3): der vorgestellte Algorithmus liefert den Wert jeder Determinantenabbildung (wir haben die kon-3033

krete Definition der Determinante nicht verwendet, sondern nur, dass die Abbildung linear, alternierend3034

und normiert ist). Das bedeutet, alle Funktionen mit diesen drei Eigenschaft mussen ubereinstimmen, was3035

bedeutet, dass die Funktion eindeutig ist.3036

Wir besprechen noch einige weitere Eigenschaften der Determinante:3037

Theorem 5.6. Fur eine Matrix A ∈ Kn×n gilt:3038

• det(A) = det(AT )3039


• det(AB) = det(A) det(B)3040

• det(A) = 0⇔ rk(A) < n.3041

Beweis. Wir besprechen nur die letzte Eigenschaft: Sei A′ die Matrix in Zeilenstufenform, die sich aus A3042

durch das Gaussverfahren ergibt. Es gilt dann |detA| = |detA′| (die Betragsstriche sind notig, weil sich das3043

Vorzeichen durch Zeilenvertauschungen umdrehen kann). Jedenfalls ist also detA = 0 genau dann, wenn3044

detA′ = 0. In der Zeilenstufenform einer (n×n)-Matrix gibt es zwei Moglichkeiten: Ist rk(A′) < n, dann ist3045

die letzte Zeile von A′ gleich 0 und damit auch detA′ = 0. Ist rkA′ = n, dann sind die Pivotelemente alle3046

auf der Diagonalen, und diese sind alle 6= 0, also ist auch deren Produkt 6= 0. Dieses Produkt ist jedoch, bis3047

auf Vorzeichen, gleich der Determinante von A′. Also gilt detA′ 6= 0 genau dann, wenn rkA′ < n.3048

Ein Zusammenhang mit dem Losen von linearen Gleichungssystemen ergibt sich durch die folgende3049

Regel:3050

Theorem 5.7 (Cramer’sche Regel). Sei A ∈ Kn×n eine Matrix mit rkA = n. Sei b ∈ Kn und x ∈ Kn die3051

(eindeutige) Losung von3052

Ax = b.

Seien a1, . . . , an die Spalten von A, dann gilt3053

xi =1

detAdet(a1, . . . , ai−1, b, ai+1, . . . , an).

Den Beweis fuhren wir nicht durch. Als Beispiel betrachten wir das Gleichungssystem:3054 1 1 00 1 13 2 1

x =

110

.

Mit Hilfe des Gaussverfahrens konnen wir ausrechnen, dass dieses Gleichungssystem die eindeutige Losung3055 −12−1

besitzt. Wir konnen diese Losung auch mit der Cramer’schen Regel berechnen. Zunachst rechnen wir aus3056

(z.B. mit Sarrusregel):3057

det

1 1 00 1 13 2 1

= 2

Nun berechnen wir

x1 =1

2· det

1 1 01 1 10 2 1

=1

2· (−2) = −1

x2 =1

2· det

1 1 00 1 13 0 1

=1

2· 4 = 2

x3 =1

2· det

1 1 10 1 13 2 0

=1

2· (−2) = −1.

Von einem algorithmischen Standpunkt aus ist dieses Verfahren nicht schneller als die Losung mit Hilfe3058

des Gaussverfahrens. Wir erwahnen jedoch eine wichtige Eigenschaft: Fur ein fixes n konnen wir det als3059

Funktion von Kn2

nach K auffassen. Wenn wir K = R setzen, ist diese Funktion stetig in den Koordinaten3060

(wir haben Stetigkeit fur solche Funktionen nicht formal definiert, aber anschaulich heißt es, dass die Funk-3061

tion nicht springt, also sich nur sehr wenig andert, wenn wir die Eintrage in der Matrix wenig andern). Die3062

5.2. DIE LINEARE GRUPPE 119

Cramer’sche Regel sagt nun, dass die Losung eines (eindeutig losbaren) linearen Gleichungssystems Ax = b3063

ebenfalls stetig von den Eintragen in A und in b abhangt.3064

3065

Hausaufgabe 5.1.1. Weisen Sie nach, dass die Determinanten im R2 und R3 in der Tat multi-linear,3066

alternierend und normiert sind. Weisen Sie auch nach, dass diese Abbildungen mit der Entwicklungsformel,3067

die wir fur allgemeine n angegeben haben, ubereinstimmt.3068

Hausaufgabe 5.1.2. Bestimmen Sie die Determinanten der folgenden reellen Matrizen:3069

a.

1 2 31 2 1−2 0 2

, b.

2 0 2 11 2 0 00 2 1 10 1 2 3

.

Hausaufgabe 5.1.3. Sei n ∈ N. Berechnen Sie die Determinante der (n× n)-Matrix A = (aij), wobei3070

aij =

{0 wenn i = j,

1 sonst.

Hausaufgabe 5.1.4. Losen Sie folgende Gleichungssysteme mit der Cramer’sche Regel:3071

a.

(1 23 −1

)x =

(13

),3072

b.

1 2 01 −1 21 0 0

x =

111

,3073

c.

1 3 43 5 −44 7 −2

x =

50231

.3074

5.2 Die lineare Gruppe3075

Definition 5.8. Wir nennen eine Matrix A ∈ Kn×n regular, wenn rkA = n gilt. Andernfalls heißt die3076

Matrix A singular. Wir schreiben GL(n;K) fur die Menge aller regularen Matrizen in Kn×n.3077

Beachten Sie, dass eine Matrix A regular ist genau dann, wenn detA 6= 0. Daraus folgt sofort:3078

Lemma 5.9. Sind A, B regular, so ist auch A ·B regular.3079

Beweis. det(AB) = det(A) · det(B) 6= 0, da A und B regular sind.3080

Theorem 5.10. Gl(n;K) wird mit Matrizenmultiplikation zu einer (nicht-abelschen) Gruppe. Das neutrale3081

Element ist die Einheitsmatrix3082

En =

1 0. . .

0 1

Das Inverse Element zu A wird mit A−1 bezeichnet.3083

Beweis. Wie wir im vorherigen Lemma gezeigt haben, liefert die Matrizenmultiplikation in der Tat eine3084

Verknupfung3085

Gl(n;K)×Gl(n;K)→ Gl(n;K).

Man uberzeugt sich leicht, dass Matrizenmultiplikation assoziativ ist (das hatten wir bereits an fruherer3086

Stelle erwahnt). Auch ist offenbar AEn = A = EnA, also ist En das neutrale Element.3087

Zur Existenz von A−1 bemerken wir, dass A, aufgefasst als lineare Abbildung f : Kn → Kn, x 7→ Ax3088

bijektiv ist: In der Tat bedeutet rkA = n, dass f surjektiv ist, und wegen n = dimKn = dim ker A +3089

dim ImA, folgt, dass dim ker A = 0, was bedeutet, dass f auch injektiv ist. Also hat die lineare Abbildung3090

f eine Umkehrabbildung f−1, welche ebenfalls linear ist (Lemma 3.30), und daher durch eine Matrix A−13091

dargestellt ist. Es gilt nun offenbar fur jedes x, dass AA−1x = x = A−1Ax, also ist A−1A = En.3092


Korollar 5.11. Ist A regular, so hat das Gleichungssystem Ax = b genau eine Losung fur jedes b ∈ Kn.3093

Beweis. Da A regular ist, gibt es A−1 invers zu A. Nun ist A−1b eine Losung des Systems, denn3094

A(A−1b) = (AA−1)b = Enb = b

Außerdem gilt fur jedes x mit Ax = b, dass3095

x = Enx = (A−1A)x = A−1(Ax) = A−1b,

was die Eindeutigkeit zeigt.3096

Kennen wir zur Matrix A also die inverse Matrix A−1, dann konnen wir Ax = b durch eine Matrixmul-3097

tiplikation A−1b losen (was einfacher ist als ein Gaussverfahren). Allerdings ist die Berechnung von A−13098

im Allgemeinen nicht weniger aufwandig als die Losung des Gleichungssystems. Wir werden im nachsten3099

Abschnitt ein Verfahren kennenlernen.3100

3101

Hausaufgabe 5.2.1. Weisen Sie nach, dass3102 0 −1 112

12 − 1

2− 1

212

12

die inverse Matrix fur3103

A =

1 2 00 1 11 1 1

ist. Losen Sie die Gleichungssysteme3104

a. Ax =

121

, b. Ax =

−203

, c. Ax =

24−1

.

Hausaufgabe 5.2.2. Fur welche t ∈ R ist folgende Matrix At singular? Bestimmen Sie fur alle t ∈ R den3105

Rang von At.3106

At =

5− 9t −4 −2−4 5− 9t −2−2 −2 8− 9t

5.3 Basistransformationen3107

Ein Vektorraum hat viele verschiedene Basen. Es ist von vorherein nicht klar, welche Basis die “angenehms-3108

te” zur Arbeit in einem Vektorraum ist. Naturlich ist im Kn die Standardbasis (e1, . . . , en) naheliegend,3109

Wir schauen uns nun genauer an, wie wir von einer Basis zu einer anderen wechseln konnen. Wie wir sehen3110

werden, lasst sich jede regulare Matrix (also jede bijektive Abbildung im Kn) als Basiswechsel interpretieren.3111

Seien B = (v1, . . . , vn) und B′ = (w1, . . . , wn) zwei Basen des Kn. Wie wir wissen, hat jedes x ∈ Kn

eindeutige Darstellungen:

x = λ1v1 + . . .+ λnvn (bezuglich B),

x = µ1w1 + . . .+ µnwn (bezuglich B′).

Wir betrachten nun die Abbildung, welche

λ1

...λn

nach

µ1

...µn

abbildet. Dies ist eine Abbildung von3112

Kn nach Kn und man rechnet leicht nach, dass sie linear ist. Also lasst sie sich als Matrix schreiben. Wir3113

nennen3114

MB→B′ ∈ Kn×n

5.3. BASISTRANSFORMATIONEN 121

die Matrix des Basiswechsels von B nach B′. Die i-te Spalte

m1i

...mni

von MB→B′ erhalten wir, indem wir3115

vi als Linearkombination der wi ausdrucken, also3116

vi = m1iw1 + . . .+mniwn.

Als Beispiel nehmen wir3117

B = (

100

,

110

,

111

) = (v1, v2, v3), B′ = (

200

,

−111

,

023

) = (w1, w2, w3).

Fur die Matrix MB→B′ mussen wir die vi’s als Linearkombination der wi’s ausdrucken. Im Allgemeinengeschieht dies durch das Losen eines Gleichungssystems. In diesem einfachen Beispiel kann man jedochwenigstens zwei der drei Losungen auch durch “scharfes Hinschauen” losen. Es ergibt sich jedenfalls

v1 =1

2w1

v2 = 2w1 + 3w2 − w3

v3 = w1 + w2

und damit3118

MB→B′ =

12 2 10 3 10 −1 0

Sei nun zum Beispiel x = 5v1 + 3v2 − v3. Wir konnen nachrechnen, dass3119

x =

72−1

in Standardkoordinaten ist. Wenn wir nun x als Linearkombination von B′ ausdrucken wollen, rechnen wir3120

einfach3121

MB→B′

53−1

=

1528−3

und in der Tat ist3122

15

2w1 + 8w2 − 3w3 =

72−1

.

Wir schreiben ab jetzt E = (e1, . . . , en) fur die Standardbasis. Wir sehen dann, dass jede regulare Matrix3123

A ∈ Kn×n die Matrix eines Basiswechsels ist:3124

A = MB→E

wobei B durch die Spalten von A gegeben ist (welche eine Basis bilden, da A regular ist).3125

Als Beispiel nehmen wir3126

A =

2 0 13 1 11 2 1

und3127

x = 2

231

− 5

012

+ 1

111


dargestellt in B, der Spaltenbasis von A. Wir berechnen nun3128

A

2−51

=

52−7

= 5e1 + 2e2 − 7e3

und wir sehen, dass dies in der Tat der Vektor x in Standardkoordinaten ist.3129

Umgekehrt ist jede Basiswechselmatrix auch regular, weil die zugehorige Abbildung Kn → Kn bijektiv3130

ist. Es gibt also eine inverse Matrix, und es gilt3131

M−1B→B′ = MB′→B.

In der Tat ist MB′→B ·MB→B′ die Komposition der Abbildungen, die folgendes tut: Ein Vektor dargestellt3132

in der Basis B wird zunachst in der Basis B′ und dann wieder in der Basis B ausgedruckt. Wegen der3133

Eindeutigkeit der Basisdarstellung ist diese Komposition also die Identitat, dargestellt durch En. Wir lassen3134

einen fomalen Beweis weg.3135

Als Beispiel betrachten wir das Beispiel von oben. Wir drucken nun die wi’s durch die vi’s aus:

w1 = 2v1

w2 = −2v1 + v3

w3 = −2v1 − v2 + 3v3

und damit3136

MB′→B =

2 −2 −20 0 −10 1 3

.

Wir konnen nun nachrechnen3137

MB→B′MB′→B =

12 2 10 3 10 −1 0

· 2 −2 −2

0 0 −10 1 3

=

1 0 00 1 00 0 1

Nun sind wir auch in der Lage, fur eine regulare Matrix A die inverse Matrix A−1 auszurechnen: Wir3138

intepretieren A = MB→E , und wir berechnen ME→B. Das bedeutet, wir mussen e1, . . . , en mit Hilfe der3139

Basis B (also den Spalten von A) ausdrucken.3140

Nehmen wir die Matrix A von oben. Um e1 durch die Spalten von A darzustellen, losen wir das Glei-3141

chungssystem3142 2 0 1 13 1 1 01 2 1 0

→ 1 2 1 0

3 1 1 02 0 1 1

→ 1 2 1 0

0 −5 −2 00 −4 −1 1

→ 1 2 1 0

0 −5 −2 00 0 3

5 1

An dieser Stelle konnten wir bereits auflosen: x3 = 5

3 , x2 = − 23 , x1 = − 1

3 . Wir konnen jedoch auch3143

anders vorgehen: Wir konnen weitere Zeilenoperationen durchfuhren, um auch alle Eintrage oberhalb der3144

Diagonalen auf 0 zu setzen, und auch die Diagonaleintrage auf der linken Seiten zusatzlich alle auf 1 setzen3145

(dies geht deshalb, weil die Matrix regular ist):3146

. . .→

1 2 1 00 1 2

5 00 0 1 5

3

→ 1 2 0 − 5

30 1 0 − 2

30 0 1 5

3

1 0 0 − 13

0 1 0 − 23

0 0 1 53

Das bedeutet also, dass3147

−1

3

231

− 2

3

012

+5

3

111

= e1


wie man leicht zur Probe nachrechnet. Fur e2 gehen wir ahnlich vor 2 0 1 03 1 1 11 2 1 0

→ 1 2 1 0

3 1 1 12 0 1 0

→ 1 2 1 0

0 −5 −2 10 −4 −1 0

→ 1 2 1 0

0 −5 −2 10 0 3

5 − 45

→

1 2 1 00 1 2

5 − 15

0 0 1 − 43

→ 1 2 0 4

30 1 0 1

30 0 1 − 4

3

→ 1 0 0 2

30 1 0 1

30 0 1 − 4

3

Und fur e3 analog: 2 0 1 0

3 1 1 01 2 1 1

→ 1 2 1 1

3 1 1 02 0 1 0

→ 1 2 1 1

0 −5 −2 −30 −4 −1 −2

→ 1 2 1 1

0 −5 −2 −30 0 3

525

→

1 2 1 10 1 2

535

0 0 1 23

→ 1 2 0 1

30 1 0 1

30 0 1 2

3

→ 1 0 0 − 1

30 1 0 1

30 0 1 2

3

Insgesamt ergibt sich also3148

A−1 =

− 13

23 − 1

3− 2

313

13

53 − 4

323

Wir konnen jedoch folgendes beobachten: In allen drei Rechnungen von oben wurden exakt die gleichenZeilenoperationen durchgefuhrt! Der einzige Unterschied waren die Ergebnisse im Spaltenvektor ganz rechts.Wir hatten also die Rechnung auch simultan auf allen drei Einheitsvektoren durchfuhren konnen wie folgt: 2 0 1 1 0 0

3 1 1 0 1 01 2 1 0 0 1

→ 1 2 1 0 0 1

3 1 1 0 1 02 0 1 1 0 0

→ 1 2 1 0 0 1

0 −5 −2 0 1 −30 −4 −1 1 0 −2

→

1 2 1 0 0 10 −5 −2 0 1 −30 0 3

5 1 − 45

25

→ 1 2 1 0 0 1

0 1 25 0 − 1

535

0 0 1 53 − 4

323

→ 1 2 0 − 5

343

13

0 1 0 − 23

13

13

0 0 1 53 − 4

323

→

1 0 0 − 13

23 − 1

30 1 0 − 2

313

13

0 0 1 53 − 4

323

Dies ist ein allgemeines Verfahren zur Berechnung von A−1:3149

• Wende elementare Zeilenoperationen auf die Matrix (A | En) an bis die linke Seite gleich En ist.3150

• Die rechte Seite ist dann A−1.3151

Darstellung von linearen Abbildungen. Sei f : Kn → Kn eine lineare Abbildung (nicht notwenider-3152

weise bijektiv) und B = (v1, . . . , vn) eine Basis von Kn. Die Matrix3153

MfB ∈ K

n×n

heißt Darstellung von f bezuglich Basis B, falls fur alle x ∈ Kn gilt: Ist3154

x = λ1v1 + . . .+ λnvn

und3155

f(x) = µ1v1 + . . .+ µnvn


dann ist3156

MfB

λ1

...λn

=

µ1

...µn

.

Die i-te Spalte von MfB ist definiert als

m1i

...mni

, wobei3157

f(vi) = m1iv1 + . . .+mnivn,

also, die Koordinaten von f(vi) ausgedruckt in der Basis B.3158

Diese Definition liefert also eine Matrix, wenn wir eine lineare Abbildung und eine Basis fixieren. Erinnern3159

Sie sich (Lemma 3.37), dass wir jeder linearen Abbildung bereits eine Matrix A zugeordnet haben: Dabei3160

haben wir die Spalten von A als die Bilder von e1, . . . , en definiert. Unsere neue Definition ist also eine3161

Verallgemeinerung der alten Definition und es gilt3162

A = MfE .

Als Beispiel betrachten wir die lineare Abbildung f , fur die gilt3163

f(e1) =

123

, f(e2) =

−110

, f(e3) =

02−1

(beachten Sie, dass f durch die Bilder auf einer Basis eindeutig definiert ist) und sei3164

B = (v1, v2, v3) := (

100

,

110

,

111

).

Wir wollen MfB berechnen. Dazu mussen wir f(vi) berechnen und als Linearkombination der vi ausdrucken:

f(v1) =

123

= −v1 − v2 + 3v3

f(v2) = f(e1 + e2) = f(e1) + f(e2) =

033

= −3v1 + 3v3

f(v3) = f(e1) + f(e2) + f(e3) =

052

= −5v1 + 3v2 + 2v3

Also ist3165

MfB =

−1 −3 −5−1 0 33 3 2

Setzen wir nun zum Beispiel3166

x = 4v1 − 3v2 + v3

Dann gilt wegen3167

MfB

4−31

=

0−15

,


dass3168

f(x) = −v2 + 5v3.

Wir konnen nachrechnen, dass dies stimmt. In Standarkoordinaten ist3169

x = 4

100

− 3

110

+

111

=

2−21

und damit3170

f(x) = f(2e1−2e2+e3) = 2f(e1)−2f(e2)+f(e3) = 2

123

−2

−110

+

02−1

=

445

= −v2+5v3.

Fur eine lineare Abbildung f und zwei Basen B, B′ gilt3171

MfB = MB′→B · Mf

B′ · MB→B′ .

Das ist klar: Um f bezuglich Basis B darzustellen, konnen wir zunachst zur Basis B′ wechseln, dann f3172

bezuglich Basis B′ darstellen, und dann zuruck zur Basis B wechseln.3173

Als Beispiel rechnen wir MfB von oben nochmals aus. Sei B′ = E , wir wissen schon:3174

MB→B′ =

1 1 10 1 10 0 1

.

Da wir die Bilder von f unter e1, e2 und e3 kennen, wissen wir auch3175

MfB′ =

1 −1 02 1 23 0 1

.

Es fehlt noch die Matrix Mbasis′→B. Dies ist die inverse Matrix zu MB→B′ von oben. Wir rechnen nach,3176

dass3177

MB′→B =

1 −1 00 1 −10 0 1

.

Damit ist also3178

MfB =

1 1 10 1 10 0 1

1 −1 02 1 23 0 1

1 −1 00 1 −10 0 1

=

−1 −3 −5−1 0 33 3 2

Definition 5.12. Zwei Matrizen X, Y in Kn×n heißen ahnlich, wenn es eine regulare Matrix M ∈ Kn×n

3179

gibt mit3180

Y = M−1 ·X ·M.

Lemma 5.13. Zwei Matrizen X und Y sind ahnlich genau dann, wenn es eine lineare Abbildung f und3181

zwei Basen B, B′ gibt, so dass3182

X = MfB , Y = Mf

B′

gilt (also X und Y sind Darstellungen der gleichen Abbildungen bezuglich zweier Basen).3183

Beweis. Ist X = MfB und Y = Mf

B′ , dann ist3184

Y = Y = MfB′ = MB→B′M

fBMB′→B = M−1XM

mit M = MB′→B, also sind X und Y ahnlich.3185


Umgekehrt, sind X und Y ahnlich mit Y = M−1XM , dann konnen wir die regulare Matrix M inter-3186

pretieren als M = MB→E und X als lineare Abbildung f durch X = MfE . Dann ist3187

Y = M−1XM = ME→BMfEMB→E = Mf

E

also sind X und Y von der gewunschten Form.3188

Es stellt sich nun die Frage: Gegeben eine lineare Abbildung f : Kn → Kn, gibt es eine Basis, bezuglich3189

der f eine besonders einfache Gestalt hat? Dies ist eine motivierende Frage fur das nachste Kapitel.3190

3191

Hausaufgabe 5.3.1. Bestimmen Sie die Inverse der folgende Matrizen:3192

a.

1 2 32 3 42 4 5

,3193

b.

1 0 02 4 12 −1 0

,3194

c.

0 1 1−1 1 1−1 0 1

,3195

d.

0 2 1−1 1 1−1 0 1

.3196

Hausaufgabe 5.3.2. Gegeben sind die Basen B und B′ im R3:3197

B = (

123

,

234

,

245

), B′ = (

100

,

241

,

2−10

).

a. Bestimmen Sie die Matrizen ME→B und MB→E der Basiswechsel zwischen der kanonischen Basis E3198

im R3 und B.3199

b. Bestimmen Sie die Matrizen MB→B′ und MB′→B.3200

c. Geben Sie die Representation des Vektors x =

123

∈ R3 in B und B′ an.3201

Hausaufgabe 5.3.3. Sei f : R3 → R3, x 7→ Ax die lineare Abbildung definiert durch die Matrix:3202

A =

1 3 20 2 10 0 3

.

Geben Sie die Darstellungsmatrix MfB fur folgenden Basen an:3203

a. B = (

100

,

310

,

522

), b. B = (

112

,

121

,

211

).

Hausaufgabe 5.3.4. Zeigen Sie, dass Ahnlichkeit eine Aquivalenzrelation auf Kn×n ist. Geben Sie auch3204

die Aquivalenzklasse der Matrix En an.3205

Hausaufgabe 5.3.5. Zeigen Sie: Wenn X, Y ahnlich sind, dann ist rkX = rkY .3206

Hausaufgabe 5.3.6. Seien B, B′ Orthonormalbasen von Kn. Zeigen Sie, dass MB→B′ eine orthogonale3207

Matrix ist.3208

5.4. EIGENVEKTOREN UND EIGENWERTE 127

5.4 Eigenvektoren und Eigenwerte3209

Eine lineare Abbildung f : Kn → Kn ordnet jedem Vektoren einen anderen Vektor zu. Setzen wir zum3210

Beispiel K = R und n = 2, dann konnen wir diese Zuordnung wie folgt interpretieren: Wir drehen den3211

Vektor um einen Winkel in [0, π) und skalieren den Vektor um einen gewissen Faktor λ ∈ R (wobei ein3212

negativer Faktor bedeutet, dass der Vektor umgedreht wird). Ein Eigenvektor einer linearen Abbildung3213

ist ein Vektor, der von f nicht gedreht, sondern nur skaliert wird. Der Skalierungsfaktor λ heißt dann der3214

Eigenwert des Vektors. Es folgt die allgemeine Definition, die diese Intuition verallgemeinert.3215

Definition 5.14. Sei f : Kn → Kn eine lineare Abbildung. Ein Vektor x 6= 0 heißt Eigenvektor von f zu3216

einem Eigenwert λ ∈ K, falls gilt3217

f(x) = λx.

Hier folgen einige Beispiele:3218

• Ist x ∈ ker f und x 6= 0, dann ist x Eigenvektor zum Eigenwert 0.3219

• Ist f eine Spiegelung im R2 an der Ursprungsgerade y = sx, dann ist

(1s

)ein Eigenvektor zum3220

Eigenwert 1 (d.h., f(x) = x). Gleiches gilt fur jeden anderen Punkt auf der Gerade y = sx (ausser dem3221

Ursprung). Der Vektor

(s−1

)steht senkrecht auf

(1s

)und seine Spiegelung ist folglich

(−s1

)3222

(man mache sich das durch ein Bild klar). Also ist

(1s

)ein Eigenvektor zum Eigenwert −1.3223

• Sei f die Drehung im R2 um π2 . Dann hat f keinen Eigenvektor.3224

Definition 5.15. Wir nennen eine lineare Abbildung f : Kn → Kn diagonalisierbar wenn es eine Basis3225

B = (v1, . . . , vn) von Kn gibt, die aus Eigenvektoren von f besteht. In diesem Fall gilt3226

MfB =

λ1 0. . .

0 λn

wobei λi der Eigenwert zum Eigenvektor vi ist.3227

Das bedeutet: Bezuglich einer Basis B aus Eigenvektoren hat f eine besonders einfache Gestalt. Wir3228

notieren die direkte Folgerung aus dieser Definition:3229

Korollar 5.16. Eine Matrix A ist ahnlich zu einer Diagonalmatrix (d.h. einer Matrix mit 0-Eintragen3230

außerhalb der Diagonalen) genau dann wenn die Abbildung f : Kn → Kn, x 7→ Ax diagonalisierbar ist.3231

Berechnung von Eigenwerten und Eigenvektoren3232

Lemma 5.17. Sei f : Kn → Kn, x 7→ Ax. Dann ist λ ein Eigenwert von f genau dann, wenn gilt3233

det(A− λEn) = 0.

Beweis. Es gilt

λ ist Eigenwert von f

⇔ ∃v 6= 0 : Av = λ · v⇔ ∃v 6= 0 : Av − λ · v = 0

⇔ ∃v 6= 0 : (A− λEn)v = 0

⇔ ker(A− λEn) 6= {0}⇔ rk(A− λEn) < n

⇔ det(A− λEn) = 0.

3234


Um alle λ mit obiger Eigenschaft zu finden, definieren wir uns ein Polynom, dessen Nullstellen genau3235

die gesuchten Eigenwerte sind:3236

Definition 5.18. Sei t eine Variable. Dann ist fur eine Matrix A ∈ Kn×n,3237

PA(t) := det(A− tEn)

ein Polynom uber K vom Grad n. Wir nennen PA(t) das charakteristische Polynom von A.3238

Fur den Rest des Abschnitts fixieren wir die Beispiele:3239

A =

0 −1 1−3 −2 3−2 −2 3

, B =

(cosα − sinαsinα cosα

).

Wir rechnen nun nach:

PA(t) = det

0− t −1 1−3 −2− t 3−2 −2 3− t

= (0− t)(−2− t)(3− t) + 6 + 6 + 2(−2− t) + 6(0− t)− 3(3− t)

= −t3 + t2 + t− 1 = (t− 1)(−t2 + 1) = (t− 1)2(t+ 1),

PB(t) = det

(cosα− t − sinα

sinα cosα− t

)= (cosα− t)2 + sin2 α = (cosα− t)2 + 1− (cosα)2.

Lemma 5.19. Sind X und Y ahnliche Matrizen, dann ist PX(t) = PY (t).3240

Diese Lemma erlaubt es uns, das charakterische Polynom einer linearen Abbildung f , Pf (t) zu definieren3241

als PM (t) mit M = MfB beuglich einer beliebigen Basis B. Die Definition hangt nicht von der Basis ab, da ein3242

Basiswechsel zu einer ahnlichen Matrix und damit nach Lemma zum gleichen charakteristischen Polynom3243

fuhrt.3244

Beweis. Sei Y = M−1XM mit einer regularen Matrix M . Es gilt dass3245

tEn = tM−1EnM = M−1tEnM

(vergleiche die Rechenregeln fur Matrizen im Abschnitt 3.6). Also ist

PY (t)

= det(Y − tEn)

= det(M−1XM +M−1tEnM)

= det(M−1(X − tEn)M)

= det(M−1) det(X − tEn) detM

= det(M−1) det(M) det(X − tEn)︸︷︷︸=PX(t)

= det(M−1M︸︷︷︸=En

)PX(t).

3246

Der nachste Satz liefert ein Rechenverfahren zur Bestimmung von Eigenvektoren.3247

Theorem 5.20. Sei f : Kn → Kn eine lineare Abbildung und A = MfB bezuglich irgendeiner Basis B (zum3248

Beispiel der Standardbasis). Dann gilt3249

1. λ ist ein Eigenwert von f genau dann, wenn PA(λ) = 0.3250


2. Ist λ ein Eigenwert von f , so ergeben sich alle Eigenvektoren zum Eigenwert λ als nicht-trivale3251

Losungen des Gleichungssystems3252

(A− λEn)x = 0

Beweis. Wir schreiben M := MfE . Beachten Sie, dass PA(t) = PM (t) nach dem vorangehenden Lemma. Mit3253

Hilfe von Lemma 5.17 gilt nun3254

PA(λ) = 0 ⇔ PM (λ) = 0 ⇔ det(M − λEn) = 0 ⇔ λ ist Eigenwert von f

und der erste Teil ist bewiesen. Der zweite Teil ist einfach, denn x ist eine Losung von (A − λEn)x = 03255

genau dann, wenn Ax− λx = 0, d.h. Ax = λx.3256

Wir setzen die Beispiele von eben fort. Wegen3257

PA(t) = −(t− 1)2(t+ 1)

Sind λ = 1 und λ = −1 die Eigenwerte. Fur λ = −1 bringen wir A+ En auf Zeilenstufenform3258 0 + 1 −1 1−3 −2 + 1 3−2 −2 3 + 1

=

1 −1 1−3 −1 3−2 −2 4

⇒ 1 −1 1

0 −4 60 −4 6

⇒ 1 −1 1

0 −4 60 0 0

und der Losungsraum ist gegeben durch3259

{µ

132

| µ ∈ R}.

Damit sind alle diese Vektoren, außer dem Nullvektor, die Eigenvektoren zum Eigenwert −1.3260

Fur λ = 1 ergibt sich3261 0− 1 −1 1−3 −2− 1 3−2 −2 3− 1

=

−1 −1 1−3 −3 3−2 −2 2

⇒ −1 −1 1

0 0 00 0 0

und der Losungsraum ist3262

{λ

101

+ µ

011

| λ, µ ∈ R}.

Also sind alle diese Vektoren, außer dem Nullvektor, Eigenvektoren zum Eigenwert +1.3263

Kommen wir zur Matrix B. Wir haben berechnet3264

PB(t) = (t− cosα)2 + 1− (cosα)2

Wir sehen: Ist | cosα| < 1, dann ist 1− (cosα)2 > 0, und damit PB(λ) > 0 fur alle λ (da der erste Term als3265

Quadrat auch immer ≥ 0 ist). Es gibt also dann keinen Eigenwert, und auch keinen Eigenvektor. Es bleiben3266

nur die Falle α = 0 und α = π:3267

Fur α = 0 ist3268

B =

(1 00 1

)und wir sehen sofort, dass jeder Vektor Eigenvektor zum Eigenwert 1 ist.3269

Fur α = π ist3270

B =

(−1 00 −1

)Also ist B die Spiegelung am Ursprung, und jeder Vektor ist Eigenvektor zum Eigenwert −1.3271


Diagonalisierbarkeit. Nun wissen wir also, wie wir (alle) Eigenvektoren einer Abbildung berechnen.3272

Allerdings war es unser Ziel, eine Basis aus Eigenvektoren zu berechnen.3273

Theorem 5.21. Sind v1, . . . , vk Eigenvektoren bezuglich paarweise verschiedener Eigenwerte von f . Dann3274

sind v1, . . . , vk linear unabhangig.3275

Beweis. Es seien λ1, . . . , λk die Eigenwerte von v1, . . . , vk. Wir beweisen die Aussage mit vollstandiger3276

Induktion uber k. Fur k = 1 ist v1 linear unabhangig, da v1 6= 0.3277

Nun seien v1, . . . , vk−1 als linear unabhangig angenommen. Sei3278

(∗) α1v1 + . . .+ αkvk = 0

mit α1, . . . , αk ∈ K. Wenden wir f auf beiden Seiten an, ergibt sich wegen f(0) = 0 und f(vi) = λivi, dass3279

α1λ1v1 + . . .+ αkλkvk = 0.

Andererseits konnen wir auch die Gleichung (*) mit λk multiplizieren und erhalten3280

α1λkv1 + . . .+ αkλkvk = 0.

Nun ziehen wir die beiden Gleichungen voneinander ab und erhalten3281

α1(λ1 − λk)v1 + . . .+ αk−1(λk−1 − λk)vk−1 = 0

Da v1, . . . , vk−1 linear unabhangig sind, mussen alle αi(λi − λk) = 0 sein. Da die λ-Werte paarweise ver-3282

schieden sind, ist λi − λk 6= 0, also muss αi = 0 gelten fur 1 ≤ i ≤ k − 1. Damit ist dann auch λk = 0.3283

Korollar 5.22. Zerfallt das charakteristische Polynom Pf (t) in n paarweise verschiedene Linearfaktoren,3284

d.h.3285

Pf (t) = ±(t− λ1) · . . . · (t− λn)

mit λi 6= λj fur 1 ≤ i < j ≤ n, dann ist f diagonalisierbar.3286

Beweis. Fur jedes λi gibt es einen Eigenvektor vi, und diese bilden nach dem vorangehenden Theorem eine3287

Basis.3288

Theorem 5.23. Ist f diagonalisierbar, dann zerfallt Pf (t) in Linearfaktoren.3289

Beweis. Sei B = (v1, . . . , vn) eine Basis aus Eigenvektoren von f . Dann ist3290

MfB =

λ1 0. . .

0 λn

und da Pf (t) nicht von der Basis abhangt, ist3291

Pf (t) = (λ1 − t) · . . . · (λn − t).

3292

Beachte, dass f nicht unbedingt diagonalisierbar ist, selbst wenn Pf (t) in Linearfaktoren zerfallt. Der3293

Grund ist, dass ein λ eine mehrfache Nullstelle von Pf (t) sein kann (d.h., die λi sind nicht paarweise3294

verschieden) und es nicht “genugend” Eigenvektoren fur λ gibt. Das einfachste Beispiel ist die Abbildung f3295

gegeben durch3296

A =

(1 10 1

).

Wir erhalten3297

Pf (t) = PA(t) = (1− t)2


also ist λ = 1 eine doppelte Nullstelle. Allerdings ist3298 (1− 1 1

0 1− 1

)=

(0 10 0

)und wir sehen, dass nur die Vektoren

(a0

)mit a ∈ K\{0} Eigenvektoren sind. Dies ist ein eindimensionaler3299

Unterraum und daher gibt es keine Basis aus Eigenvektoren.3300

Wir notieren das vollstandige Kriterium fur Diagonalisierbarkeit. Der Beweis ist nicht mehr schwierig3301

(es ist eine kleine Erweiterung von Theorem 5.21), aber wir lassen ihn weg.3302

Theorem 5.24. Eine lineare Abbildung f : Kn → Kn ist diagonalisierbar genau dann, wenn die beiden3303

folgenden Aussagen gelten:3304

1. Pf (t) zerfallt in Linearfaktoren,3305

2. es seien λ1, . . . , λk die verschiedenen Eigenwerte von f (mit k ≤ n). Es bezeichne dk die Dimension3306

des Eigenraumes bezuglich des Eigenwerts λk (vergleiche Hausaufgabe 5.4.1). Dann d1 + . . .+ dk = n.3307

In diesem Fall ist die Vereinigung der Basen aller Eigenraume eine Basis von Kn aus Eigenvektoren von f .3308

3309

Hausaufgabe 5.4.1. Sei f : Kn → Kn linear und λ ∈ K beliebig. Definiere3310

Eig(f, λ) := {x ∈ Kn | f(x) = λx}

als die Menge aller Eigenvektoren zum Eigenwert λ zusammen mit dem Nullvektor. Zeige, dass Eig(f, λ)3311

ein Unterraum von Kn ist, der sogenannte Eigenraum zum Eigenwert λ.3312

Hausaufgabe 5.4.2. Finden Sie eine reelle Matrix A ∈ R3×3, wo die dazugehorige lineare Abbildung3313

f : C3 → C3, x 7→ Ax die Eigenvektoren3314 11−1

,

01i

,

01−i

zu Eigenwerten 0, i, bzw. −i hat.3315

Hausaufgabe 5.4.3. Bestimmen Sie die Eigenwerte und Eigenraume der reellen Matrizen:3316

a.

1 1 00 1 10 0 1

, b.

1 0 00 1 10 0 1

Hausaufgabe 5.4.4. Bestimmen Sie die Eigenwerte und Eigenraume der Matrix:3317

t 1 0 · · · 0

0 t 1. . .

......

. . . t. . . 0

.... . .

. . . 10 · · · · · · 0 t

∈ Kn×n.

Hausaufgabe 5.4.5. Sei f : R4 → R4, x 7→ Ax definiert durch:3318

A =

1 −1 2 −20 0 1 −11 −1 1 01 −1 1 0

.

Ist f diagonalisierbar?3319


5.5 Orthogonale Abbildungen im R33320

Erinnerung: Eine lineare Abbildung f : Rn → Rn heißt orthogonal, wenn 〈x, y〉 = 〈Ax,Ay〉 fur alle x, y3321

gilt. Schreiben wir f mit Hilfe der Matrix A, so ist f orthogonal genau dann, wenn ATA = En gilt, also3322

A−1 = AT .3323

Orthogonale Abbildungen/Matrizen haben die folgenden weiteren Eigenschaften:3324

Lemma 5.25. Sei A ∈ Rn×n orthogonal. Dann gilt3325

• |detA| = 13326

• Ist λ ein Eigenwert von A, dann ist |λ| = 1.3327

Die Aussage ist plausibel, wenn wir uns an die Intuition erinnern: betrachte den n-dimensionalen Ein-3328

heitswurfel, der durch e1, . . . , en aufgespannt wird. Der Betrag von detA gibt das Volumen des Bildes dieses3329

Wurfels unter der Abbildung A an. Da eine orthogonale Abbildung Winkel und Langen erhalt, muss sie3330

auch das Volumen des Wurfels erhalten, also kommen nur die Werte +1 und −1 in Frage.3331

Die zweite Aussage ist noch einfacher: Gabe es zum Beispiel den Eigenwert 2, dann ist der Vektor Av3332

doppelt so lang wie v, was der Tatsache widerspricht, dass A Langen erhalten muss.3333

Beweis. Wegen detAT = detA gilt3334

(detA)2 = detAT detA = det(ATA) = detEn = 1,

also detA = ±1.3335

Fur die zweite Aussage: Ist λ ein Eigenwert und v ein Eigenvektor fur λ, so gilt3336

〈v, v〉 = 〈Av,Av〉 = 〈λv, λv〉 = λ2〈v, v〉.

Also λ2 = 1 (wegen 〈v, v〉 6= 0).3337

Fur R2 haben wir alle orthonalen Abbildungen bereits am Ende von Abschnitt 3.12 klassifiziert. Einerseits3338

hatten wir Drehungen von der Form3339 (cosα − sinαsinα cosα

).

Die Determinante der Matrix ist cos2 α + sin2 α = 1 (das ist auch sinnvoll, denn eine Drehung ist orien-3340

tierungserhaltend, also sollte das Vorzeichen der Determinante positiv sein). Wir hatten schon im letzten3341

Abschnitt in einem Beispiel nachgerechnet, dass die Drehung keine Eigenwerte hat (ausser fur α = 0 oder3342

α = π).3343

Andererseits gibt es Spiegelungen von der Form3344 (− cosα sinαsinα cosα

)Hier ist die Determinante − cosα− sin2 α = −1. Das charakteristische Polynom ist3345

(− cosα− t)(cosα− t)− sin2 α = t2 − cos2 α− sin2 α = t2 − 1 = (t− 1)(t+ 1).

Also gibt es Eigenvektoren zu den Eigenwerten 1 und −1.3346

Kommen wir nun zur Klassifikation im R3. Sei F : R3 → R3 eine orthogonale Abbildung. Das charakte-3347

ristische Polynom hat Grad 3, also gibt es eine reelle Nullstelle λ1 nach dem Zwischenwertsatz. Der Wert3348

λ1 ist ein Eigenwert von F , also ist |λ1| = 1 nach Lemma 5.25. Wir wahlen w1 als Eigenvektor zu λ1 mit3349

‖w1‖ = 1.3350

Nun erganzen wir w1 zu einer Orthonormalbasis B = (w1, w2, w3) des R3. Dies ist moglich, indem wir3351

w1 erst zu einer Basis (w1, v2, v3) erweitern (Satz 3.26) und dann mit Gram-Schmidt orthonormalisieren3352

(Satz 3.62). Beachten Sie, dass dieses Verfahren w1 unverandert lasst.3353

5.5. ORTHOGONALE ABBILDUNGEN IM R3 133

Sei W := [w2, w3] die Ebene orthogonal zu w1. Da w1 ⊥ w2 ist auch F (w1) ⊥ F (w2), weil F ortho-3354

gonal ist. Anderseits ist aber F (w1) = ±w1, weil w1 ein Eigenvektor ist, also ist w1 ⊥ F (w2). Genauso3355

ist w1 ⊥ F (w3). Es folgt also, dass F (w2), F (w3) ∈ W . Naturlich gilt auch F (w2) ⊥ F (w3). Das be-3356

deutet, F eingeschrankt auf die Ebene W bildet die Orthonormalbasis (w1, w2) auf die Orthonormalbasis3357

(F (w1), F (w2)) ab und ist daher eingeschrankt auf W ebenfalls eine orthogonale Abbildung. Damit gilt3358

A := MFB =

(λ1 0 00 A′0

),

wobei A′ eine Drehungs- oder Spiegelungsmatrix im R2 ist. Beachten Sie auch, dass detA = λ1 · detA′ gilt3359

(Hausaufgabe).3360

Nun gibt es die folgenden Falle zu unterscheiden:3361

1. detA = +1, λ1 = −1. Dann ist detA′ = −1, also ist A′ eine Spiegelung. Wir konnen w2 und w3 dann3362

als die Eigenvektoren zu den Eigenwerten +1, −1 in W wahlen und erhalten3363

A =

−1 0 00 1 00 0 −1

.

Dies entspricht einer Spiegelung bzw. Drehung um 180 Grad um die Achse, die durch w2 gegeben ist.3364

2. detA = 1, λ1 = 1. Dann ist detA′ = 1, also ist A′ eine Drehmatrix, und wir erhalten3365

A =

1 0 00 cosα − sinα0 sinα cosα

.

Dies entspricht einer Drehung um die Achse w1 um α. Der Fall 1 ist ein Spezialfall mit α = π.3366

3. detA = −1, λ1 = 1. Ahnlich zum ersten Fall erhalten wir3367

A =

1 0 00 1 00 0 −1

.

Dies enspricht einer Spiegelung an der Ebene, die durch w1 und w2 augespannt wird.3368

4. detA = −1, λ1 = −1. Hier ergibt sich ahnlich wie im zweiten Fall3369 −1 0 00 cosα − sinα0 sinα cosα

.

Dies ist eine sogenannte Drehspiegelung, also eine Drehung um α um die Achse w1 kombiniert mit3370

einer Spiegelung an der (w2, w3)-Ebene. Der dritte Fall ist wiederum ein Spezialfall mit α = 0. Fur3371

α = π erhalten wir die Spiegelung am Ursprung.3372

Zusammengefasst ergibt sich:3373

Theorem 5.26. Fur jede orthogonale Abbildung F : R3 → R3 gibt es eine Orthonormalbasis B und ein3374

α ∈ [0, 2π), so dass gilt:3375

• Ist detF = 1, dann ist3376

MFB =

1 0 00 cosα − sinα0 sinα cosα

,

also eine Drehung um eine Achse3377


• Ist detF = −1, dann ist3378

MFB =

−1 0 00 cosα − sinα0 sinα cosα

,

also eine Drehspiegelung um eine Achse.3379

Als Folgerung notieren wir3380

Korollar 5.27 (Satz vom Fußball). Bei einem Fußballspiel liegt der Ball zu Beginn der ersten und der3381

zweiten Halbzeit auf dem Anstoßpunkt. Es gibt mindestens einen Punkt auf der Oberflache des Balles, der3382

zu Beginn von beiden Halbzeiten an der exakt gleichen Position ist.3383

Beweis. Die Transformation T des Balles von 1. zu 2. Halbzeit ist orthogonal und erhalt die Orientierung,3384

also ist detT = 1. Nach dem Theorem gibt es also einen Eigenvektor zum Eigenwert 1.3385

Anschaulich bedeutet der Satz das folgende: Statt einen Ball beliebig oft in verschiedene Richtungen zu3386

drehen, konnen wir die gleiche Rotation auch mit einer einzigen Drehung um eine bestimmte Drehachse3387

erreichen. Das ist intuitiv sicherlich kein vollig offensichtliches Resultat (zumindest nicht fur den Dozenten).3388

3389

Hausaufgabe 5.5.1. Berechnen Sie fur die Spiegelungsmatrix3390 (− cosα sinαsinα cosα

)im R2 Eigenvektoren zu den Eigenwerten 1 und −1. Wie sind diese geometrisch zu interpretieren?3391

Hausaufgabe 5.5.2. Zeigen Sie detA = λ1 detA′ fur die Matrix3392 (λ1 0 00 A′0

).

5.6 Hauptachsentransformation3393

Wir haben bereits gesehen, dass nicht fur jede Matrix eine Basis aus Eigenvektoren existiert. Allerdings gibt3394

es eine recht naturliche Teilmenge von Matrizen, die in der Tat immer diagonalisierbar sind.3395

Man sagt, dass eine Matrix A ∈ Kn×n symmetrisch ist, falls A = AT .3396

Theorem 5.28 (Spektralsatz). Jede symmetrische Matrix ist diagonalisierbar, es gibt also eine Basis des3397

Rn aus Eigenvektoren fur A. Es gilt sogar, dass es eine Orthonormalbasis aus Eigenvektoren (bezuglich des3398

Standardskalarproduktes) gibt.3399

Wir verzichten hier auf den Beweis des (schwierigeren) ersten Teils. Fur den zweiten Teil zeigen wir3400

nur, dass Eigenvektoren zu verschiedenen Eigenwerten in der Tat orthogonal sein mussen. Seien λ1 6= λ23401

Eigenwerte mit Eigenvektoren x1, x2. Es gilt fur jede Matrix M und Vektoren u, v ∈ Rn:3402

〈Mu, v〉 = (Mu)T v = (uTMT )v = uT (MT v) = 〈u,MT v〉.

Also, da A symmetrisch ist, gilt 〈Au, v〉 = 〈u,Av〉. Nun rechnen wir nach, dass3403

λ1〈x1, x2〉 = 〈λ1x1, x2〉 = 〈Ax1, x2〉 = 〈x1, Ax2〉 = 〈x1, λ2x2〉 = λ2〈x1, x2〉.

Da λ1 6= λ2 ist diese Gleichung nur erfullt, wenn 〈x1, x2〉 = 0 ist.3404

Wir notieren das folgende Resultat:3405

5.6. HAUPTACHSENTRANSFORMATION 135

Theorem 5.29. Eine Abbildung3406

s : Rn × Rn → R, (x, y) 7→ xTAy

mit A ∈ Rn×n ist ein Skalarprodukt genau dann, wenn A symmetrisch ist und alle Eigenwerte von A positiv3407

sind.3408

Beweis. s ist bilinear nach Definition. Es ist auch leicht zu sehen, dass s eine symmetrische Abbildung (also3409

s(x, y) = s(y, x)) ist genau dann, wenn A symmetrisch ist.3410

Sei A symmetrisch. Dann ist s also linear and symmetrisch. Sei B = (v1, . . . , vn) eine Orthonormalbasis3411

aus Eigenvektoren von A und seien λ1, . . . , λn die zugehorigen Eigenwerte. Nun schreiben wir x 6= 0 als3412

Linearkombination der vi:3413

x = α1v1 + . . .+ αnvn.

Es folgt nun durch eine leichte Rechnung, dass

s(x, x) = (α1v1 + . . .+ αnvn)TA(α1v1 + . . .+ αnvn)

= (α1v1 + . . .+ αnvn)T (α1Av1 + . . .+ αnAvn)

= (α1v1 + . . .+ αnvn)T (α1λ1v1 + . . .+ αnλnvn)

= α21λ1 + . . . α2

nλn.

Beachten Sie, dass samtliche Mischterme wegfallen, da (v1, . . . , vn) orthogonal sind. Nun ist jeder Term α2iλi3414

nicht-negativ, da die λi’s positiv sind, und mindestens einer der Summanden ist nicht Null, da (mindestens)3415

ein αi 6= 0 (da x 6= 0). Es folgt also positive Definitheit, und damit ist s ein Skalarprodukt.3416

Umgekehrt, nehmen wir an, dass s ein Skalarprodukt ist. Dann ist also s symmetrisch, und damit auch3417

A. Angenommen, A hat einen negativen Eigenwert λ. Sei v ein Eigenvektor zum Eigenwert λ. Dann ist3418

s(v, v) = vTAv = vTλv = λ(vT v) < 0,

was der positiven Definitheit widerspricht. Falls A den Eigenwert 0 hat, dann gibt es ein v 6= 0 mit Av = 0,3419

also auch3420

s(v, v) = vTAv = vT 0 = 0.

Das widerspricht ebenfalls der positiven Definitheit.3421

Nun kommen wir zur Hauptachsentransformation als Anwendung des Spektralsatzes. Eine Quadrik im3422

R2 ist die Losungsmenge einer quadratischen Gleichung:3423

Q := {(xy

)| ax2 + by2 + cxy + dx+ ey + f = 0},

mit a, . . . , f ∈ R und mindestens einem der Koeffizienten a, b, c nicht 0 (sonst ist es ja keine quadratische3424

Gleichung).3425

Hier sind einige Beispiele fur Quadriken, die sogennanten Kegelschnitte. Fur alle Beispiele seien α, β > 0.3426

1. Eine Ellipse, gegeben durch die Gleichung3427

x2

α2+y2

β2− 1 = 0.

Falls α = β ergibt sich der Spezialfall eines Kreises mit Radius α.3428

2. Eine Hyperbel, gegeben durch3429

x2

α2− y2

β2− 1 = 0.

3. Eine Parabel, gegeben durch3430

x2

α2± y = 0.


4. Ein sich-schneidendes Geradenpaar3431

x2

α2− y2

β2= 0.

5. Ein paralleles Geradenpaar3432

x2

α2− 1 = 0.

6. Eine einzelne Gerade3433

x2

α2= 0.

7. Ein Punkt3434

x2

α2+y2

β2= 0.

8. Die leere Menge3435

−x2

α2− y2

β2− 1 = 0.

oder auch3436

−x2

α2− 1 = 0.

Im Wesentlichen enthalt die Liste oben alle Beispiele, wie der folgende Satz aussagt:3437

Theorem 5.30 (Hauptachsentransformation). Sei Q eine beliebige Quadrik. Dann existiert eine Drehung3438

im R2, gefolgt von einer Translation, so dass Q unter dieser Transformation eine der Formen 1–8 von oben3439

annimmt.3440

Der Name des Theorems kommt daher, dass die Eigenvektoren der gewahlten Drehmatrix als Hauptach-3441

sen der Quadrik bezeichnet werden.3442

Der Beweis lasst sich so zusammenfassen: Eine Quadrik3443

ax2 + by2 + cxy + dx+ ey + f = 0

lasst sich schreiben als3444 (x y

)( a c2

c2 b

)︸︷︷︸

=:A

(xy

)+(d e

)( xy

)+ f = 0.

Nun konnen wir eine Orthonormalbasis B aus Eigenvektoren von A finden. Die Basiswechselmatrix ME→B3445

hat dann Determinante +1, wenn wir die Basisvektoren von B in geeigneter Reihenfolge wahlen. Dieser3446

Basiswechsel entspricht einer Drehung im R2. Nach dieser Drehung hat die Quadrik die Form3447 (x y

)( a′ 00 b′

)(xy

)+(x y

)( d′

e′

)+ f = 0,

bzw.3448

a′x2 + b′y2 + d′x+ e′y + f = 0,

mit anderen Worten: Der Mischterm cxy ist durch die Drehung verschwunden.3449

Sind nun a′ und b′ beide von 0 verschieden, so lasst sich diese Gliechung umschreiben zu3450

α(x− x0)2 + β(y − y0)2 + γ = 0,

mit α, β, γ ∈ R. Durch eine Translation

(x0

y0

)vereinfacht sich dies zu3451

αx2 + βy2 + γ = 0


und je nach Vorzeichen ergibt sich einer der Falle 1, 2, 4, 7 oder 8 von oben.3452

Ist b′ = 0, so muss a′ 6= 0 sein (sonst liegt keine Quadrik vor). Wir haben dann3453

a′x2 + d′x+ e′y + f = 0.

Ist nun e′ 6= 0, dann lasst sich dies umschreiben zu3454

α(x− x0)2 + (y − β) = 0.

Und nach einer Translation ergibt sich Fall 3 (Parabel).3455

Ist jedoch auch e′ = 0, dann vereinfacht sich die Gleichung zu3456

α(x− x0)2 + γ = 0

und je nach Vorzeichen von α und γ ergibt sich einer der Falle 5, 6 oder 8. Fur a′ = 0 ist der Fall analog,3457

mit den Rollen von x und y vertauscht.3458

Wir rechnen zum Abschluss zwei Beispiele durch. Als erstes betrachten wir3459

5x2 + 5y2 − 2xy − 12x+ 12y + 4 = 0,

bzw.3460 (x y

)( 5 −1−1 5

)︸︷︷︸

=:A

(xy

)+(−12 12

)( xy

)+ 4 = 0.

Im ersten Schritt mussen wir A diagonalisieren. Dafur berechnen wir die Eigenwerte:3461

det

(5− t −1−1 5− t

)= t2 − 10t+ 24 = (t− 6)(t− 4)

Also sind die Eigenwerte 4 und 6. Fur Eigenwert 4 ergibt sich3462 (1 −1−1 1

)→(

1 −10 0

)

und wir sehen, dass ein (normierter) Eigenvektor 1√2

(11

)ist. Fur Eigenwert 6 ergibt sich3463

(−1 −1−1 −1

)→(

1 10 0

)

und der Eigenwert ist 1√2

(1−1

).3464

Damit ist die Orthonormalbasis aus Eigenvektoren gefunden. Wir mussen die Basisvektoren jedoch in3465

umgekehrter Reihenfolge nehmen, damit die Determinante der Matrix 1 ist. Also3466

B = (1√2

(1−1

),

1√2

(11

))

und3467

MB→E =1√2

(1 1−1 1

).

Es bezeichne der Vektor

(x′

y′

)die Darstellung von

(xy

)bezuglich der Basis B, also3468

(xy

)= MB→E

(x′

y′

)


Bezuglich der Basis B nimmt A die Diagonalform3469 (6 00 4

)an. Also ergibt sich die Gleichung3470

(x′ y′

)( 6 00 4

)(x′

y′

)+(−12 12

)MB→E

(x′

y′

)+ 4 = 0.

Wir rechnen aus und erhalten3471

6x′2 + 4y′2 − 24√2x′ + 4 = 0.

Nun erganzen wir quadratisch, um die x′-Terme zu faktorisieren (das gleiche musste fur y′ geschehen, aberda der lineare Term in y′ verschwindet, haben wir hier weniger Aufwand).

⇔ 6(x′2 − 2√

2x′) + 4y′2 = −4

⇔ 6(x′2 − 2√

2x′ + 2) + 4y′2 = 8

⇔ 6(x′ −√

2)2 + 4y′2 = 8.

Und durch die Translation3472 (x′′

y′′

)=

(x′

y′

)+

(−√

20

)erhalten wir3473

6x′′2 + 4y′′2 = 8,

bzw.3474

x′′2

43

+y′′2

2− 1 = 0,

also die Gleichung einer Ellipse.3475

Als weiteres Beispiel betrachten wir3476

4x2 + y2 + 4xy + 3x− y + 1 = 0 ⇔(x y

)( 4 22 1

)(xy

)+(

3 −1)( x

y

)+ 1 = 0.

Hier ist3477

det

(4− t 2

2 1− t

)= t2 − 5t+ 4− 4 = t(t− 5).

Als Eigenvektor zum Eigenwert 0 ergibt sich

(1−2

)und als Eigenvektor zum Eigenwert 5 ergibt sich3478 (

21

). Somit3479

MB→E =1√5

(1 2−2 1

)(Determinante ist 1, also richtige Reihenfolge), und wir erhalten3480

(x′ y′

)( 0 00 5

)(x′

y′

)+(

3 −1)MB→E

(x′

y′

)+ 1 = 0.

Durch Nachrechnen ergibt sich3481

5y′2 +√

5x′ +√

5y′ + 1 = 0.


Nun erganzen wir zunachst den y′-Anteil quadratisch, und bringen dann den konstanten Faktor mit Hilfevon x′ zu 0:

⇔ 5(y′2 +

√5

5y′) +

√5x′ = −1

⇔ 5(y′2 +

√5

5y′ +

5

100) +√

5x′ = −1 + 55

100

⇔ 5(y′2 +

√5

10)2 +

√5x′ = −3

4

⇔ 5(y′2 +

√5

10)2 +

√5(x′ +

3√

5

20) = −3

4+

3

4

⇔ 5(y′2 +

√5

10)2 +

√5(x′ +

3√

5

20) = 0

Durch die Translation3482 (x′′

y′′

)=

(x′

y′

)+

(3√

520√

510

)ergibt sich damit3483

5y′′2 +√

5x′′ = 0,

bzw.3484

x′′ = −√

5y′′2,

also eine Parabel.3485

Die gleiche Methodik kann man auch anwenden auf Quadriken im R3, also quadratische Gleichungen der3486

Form3487

ax2 + by2 + cz2 + dxy + exz + fyz + gx+ hy + iz + j = 0,

bzw.3488 (x y z

) a d2

e2

d2 b f

2e2

f2 c

︸︷︷︸

=:A

xyz

+(g h i

) xyz

+ j = 0.

Wiederum ist A symmetrisch, und es lasst sich eine Drehmatrix konstruieren, so dass alle Mischterme (xy,3489

xz, yz) verschwinden. Durch eine Translation erreicht man dann auch eine Normalform. Es gibt jedoch3490

mehr Falle als im R2. Fur eine Ubersicht sei auf https://de.wikipedia.org/wiki/Quadrik#Quadriken_3491

im_Raum verwiesen.3492

3493

Hausaufgabe 5.6.1. Sei f : x 7→ Mx diejenige lineare Abbildung des R2 in sich selbst, welche Vektoren3494

u =

(12

)und v =

(−21

)mit dem Faktor 2 bzw. 1

2 streckt. Berechnen Sie M .3495

Hinweis: Nach Theorem 5.29 muss M symmetrisch sein.3496

Hausaufgabe 5.6.2. Transformieren Sie die folgenden quadratischen Gleichungen im R2 durch Verschie-3497

bung des Ursprungs und Wechsel zu einer anderen Orthonormalbasis in Normalform und geben Sie jedesmal3498

an, um welchen Typ von Kegelschnitt bzw. Quadrik es sich handelt. Wir verwenden Koordianten u, v im R23499

und u, v, w im R3.3500

a. 9u2 − 24uv − 10u+ 16v2 + 180v + 325 = 0,3501

b. 52u2 + 28uv − 208u+ 73v2 − 56v − 512 = 0,3502

c. 7u2 + 2uv − 14u+ 7v2 − 2v − 9 = 0,3503


d. 5u2 + 4uv + 8uw − 10u+ 8v2 − 4vw − 4v + 5w2 − 8w + 1114 = 0,3504

e. 4u2 − 4uv − 4uw − 5u+ 4v2 − 4vw + 7v + 4w2 + 7w + 1 = 0,3505

f. 13u2 − 10uv + 13v2 + 18w2 − 72 = 0.3506

Hausaufgabe 5.6.3. Bestimmen Sie Eigenwerte und Eigenvektoren der folgenden Matrizen M und stellen3507

Sie diese in der Form M = BDBT mit B orthogonal und D diagonal dar:3508

a. M = 125

(41 −12−12 34

),3509

b. M = 125

(−16 1212 −9

),3510

c. M =

(0 11 −1

),3511

d. M = 15

(4 33 17

2

).3512

Hinweis: Aufgrund des Spektralsatzes findet man eine orthonormale Basis B = (b1, b2) aus Eigenvekto-3513

ren.3514

Documents

Analytische Grundlagen der Geometrie · 2020-01-29 · 1 Skript zur Vorlesung \Analytische Grundlagen der Geometrie" 2 Michael Kerber 3 29. Januar 2020. 2. ... 38 5 Lineare Algebra,