Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Skript zur Vorlesung “Analytische Grundlagen der Geometrie”1
Michael Kerber2
29. Januar 20203
2
Inhaltsverzeichnis4
1 Grundlagen 55
1.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
1.2 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
1.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
1.4 Der Rhythmus der Mathematik: Definition, Satz, Beweis . . . . . . . . . . . . . . . . . . . . 139
2 Analysis, Teil I 1910
2.1 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1911
2.2 Intervalle und beschrankte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2412
2.3 Folgen und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2613
2.4 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2914
2.5 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3215
2.6 Grenzwerte von Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3716
2.7 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4017
2.8 Eigenschaften stetiger Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4318
3 Lineare Algebra, Teil I 4919
3.1 Gruppen und Korper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4920
3.2 Vektorraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5221
3.3 Lineare Abhangigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5722
3.4 Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5923
3.5 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6224
3.6 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6625
3.7 Rechenverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7026
3.8 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7527
3.9 Skalarprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8128
3.10 Normen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8429
3.11 Orthogonale und orthonormale Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8530
3.12 Orthogonale Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9031
4 Analysis, Teil II 9332
4.1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9333
4.2 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9734
4.3 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9935
4.4 Eigenschaften differenzierbarer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10436
4.5 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10837
5 Lineare Algebra, Teil II 11338
5.1 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11339
5.2 Die lineare Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11940
5.3 Basistransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12041
5.4 Eigenvektoren und Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12742
3
4 INHALTSVERZEICHNIS
5.5 Orthogonale Abbildungen im R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13243
5.6 Hauptachsentransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13444
Kapitel 145
Grundlagen46
1.1 Aussagenlogik47
Mathematik ist eine exakte Wissenschaft. Das bedeutet, dass es in einem mathematischen Text (wie diesem48
hier) keinen Interpretationsspielraum geben soll, wie eine Aussage zu verstehen ist. Dies ist naturlich die49
Idealvorstellung und wird in der Realitat oft nicht erreicht. Ein Grund ist, dass Aussagen sonst zu langlich50
werden und der Autor einen gewissen Kontext beim Leser als verstanden voraussetzt (was nicht immer51
der Fall ist). Trotzdem wollen wir versuchen, Mehrdeutigkeiten soweit wie moglich zu vermeiden. Ein erster52
Schritt dafur ist die Einfuhrung einer klaren Sprache. Erfahrungsgemaß verursacht die formalisierte Sprache53
Anfangern oft Probleme, allerdings ist ein mathematische Diskussion ohne diese Voraussetzung unmoglich.54
Aussagen. Eine Aussage ist ein Satz, der entweder wahr oder falsch ist. Beispiele fur Aussagen sind55
“Graz liegt in der Steiermark.” oder “Linz ist die Hauptstadt von Osterreich.”. Dabei ist das erste Beispiel56
eine wahre Aussage und das zweite eine falsche Aussage. Andere Beispiele fur Aussagen sind “2+2=4” und57
“6 · 9 = 54” (beide wahr).58
Oft ist eine Aussage im Kontext zu verstehen. Zum Beispiel ist “Heute ist Samstag” eine Aussage, die59
wahr oder falsch ist, je nachdem wann Sie diesen Text lesen. Nicht jeder Aussagesatz ist auch eine Aussage60
in unserem Sinne. Zum Beispiel ist der Satz “Diese Aussage ist falsch.” keine Aussage, da sie weder wahr61
noch falsch ist. Wir werden uns aber nicht mit solchen logischen Spitzfindigkeiten auseinandersetzen.62
Beachten Sie, dass man einer Aussage nicht unbedingt ansieht, ob sie wahr oder falsch ist. Zum Beispiel63
ist “Die Wurzel aus 2 ist eine rationale Zahl.” eine falsche Aussage, aber offensichtlich ist das nicht.64
Zu jeder Aussage A konnen wir die Aussage65
“Es ist nicht so, dass A wahr ist.”66
bilden. Wir nennen diese Aussage auch die Negation von A, oder kurz ¬A. Diese Aussage ist wahr, wenn67
A falsch ist. Und sie ist falsch, wenn A wahr ist. Zum Beispiel ist die Negation von “2+2=4” dann “Es ist68
nicht so, dass 2 + 2 = 4 gilt”, oder kurzer “2 + 2 6= 4”.69
Wir konnen Aussagen auf verschiedene Weisen miteninander verknupfen. Betrachten wir zwei beliebige70
Aussagen A and B.71
1. Die Aussage “A und B” ist wahr, wenn sowohl A als auch B wahr sind. Sonst ist die Aussage falsch.72
Wir schreiben auch A ∧B fur diese Aussage (Konjunktion).73
2. Die Aussage “A oder B” ist wahr, wenn mindestens eine der beiden Aussagen A, B wahr ist. Sonst74
ist die Aussage falsch. Wir schreiben A ∨B dafur (Disjunktion).75
3. Die Aussage “Wenn A, dann B” ist falsch, wenn A wahr und B falsch ist. Sonst ist die Aussage wahr.76
Wir schreiben A⇒ B dafur (Implikation).77
5
6 KAPITEL 1. GRUNDLAGEN
4. Die Aussage “A genau dann wenn B” ist wahr wenn A und B entweder beide wahr sind oder A und78
B beide falsch sind. Sonst ist die Aussage falsch. Wir schreiben “A gdw B”, sowie A ⇔ B dafur79
(Aquivalenz).80
Hier sehen wir bereits kleine Unterschiede zur Alltagssprache. Zum Beispiel ist “oder” nicht im Sinne81
von “Entweder-oder” zu verstehen. Falls beide Aussage wahr sind, dann ist “A oder B” ebenfalls wahr.82
Die Implikation ist am Anfang gewohnungsbedurftig. Zum Beispiel ist die Aussage83
“Wenn 3 eine gerade Zahl ist, dann ist 1 + 1 = 3”84
eine wahre Aussage, denn der”Wenn“-Teil der Aussage ist falsch. Man sagt auch salopp: Aus etwas falschem85
folgt jede beliebige Aussage.86
Es folgen weitere Beispiele. Uberlegen Sie sich fur jeden Fall, warum die Aussage wahr oder falsch ist.87
• “2 ist ungerade und 6 ist gerade.” (falsch)88
• “3 ist ungerade oder 6 ist gerade.” (wahr)89
• “Wenn 4 gerade ist, dann ist 7 gerade.” (falsch)90
• “Wenn 6 ungerade ist, dann ist 4 gerade.” (wahr)91
• “6 ist ungerade gdw 1 + 1 = 3.” (wahr)92
• “6 ist gerade gdw 1 + 1 = 3.” (falsch)93
Quantoren. Betrachten wir nun den Satz94
“2 · x ist eine gerade Zahl.”95
Dies ist keine Aussage, da wir nicht wissen, was x ist, und damit konnen wir nicht entscheiden, ob der Satz96
wahr oder falsch ist (der Fall ware anders wenn wir aus dem Kontext wussten, dass z.B. x = 5 ist, aber das97
ist ja hier nicht der Fall). Dagegen ist98
“Fur alle naturlichen Zahlen x gilt: 3 · x ist eine gerade Zahl.”99
eine (falsche) Aussage. Aussagen dieser Form werden wir standig begegnen. Wir schreiben daher auch kurzer100
∀x ∈ N : 3 · x ist eine gerade Zahl.101
∀ nennt man auch den All-Quantor und er ist als”Fur alle. . .“ zu lesen.102
Ebenso kann man die (wahre) Aussage103
“Es gibt eine naturliche Zahl x, so dass gilt: 3 · x ist eine gerade Zahl.”104
bilden. Hier schreiben wir105
∃x ∈ N: 3 · x ist eine gerade Zahl.106
Das Symbol ∃ ist der Existenz-Quantor und er ist als”Es existiert ein. . .“ oder
”Es gibt ein. . .“ zu lesen.107
Hierbei ist zu beachten, dass”Es gibt ein. . .“ immer zu verstehen ist als
”Es gibt mindestens ein. . .“. Die108
Aussage ist also auch wahr wenn es zwei oder mehr x gibt, welche die Aussage erfullen.109
Der Begriff “Quantor” kommt von der Tatsache, dass eine Variable quantifiziert wird, um eine Aussage110
zu erhalten. Wir konnen (und werden haufig) auch Quantoren kombinieren. Zum Beispiel:111
“Es gibt eine ganze Zahl x, so dass fur jede ganze Zahl y gilt, dass x+ y = 0 ist.”112
Dies konnen wir schreiben als113
“∃x ∈ Z ∀y ∈ Z : x+ y = 0.”114
1.1. AUSSAGENLOGIK 7
Diese Aussage ist falsch. Allerdings wird sie wahr, wenn wir die Quantoren umdrehen:115
“∀y ∈ Z ∃x ∈ Z : x+ y = 0.”116
Die Reihenfolge der Quantoren ist also entscheidend!117
Es lasst nahezu jede mathematische Aussage (inklusive aller Aussagen, die wir in dieser LV sehen werden)118
als quantifizierte Aussage ausdrucken. Um die Sprache nicht zu formal zu machen, werden die Quantoren je-119
doch oft nur indirekt genannt. Um die Struktur einer Aussage zu verstehen, ist es aber manchmal notwendig,120
sie in Quantoren auszudrucken. Es lohnt sich, dies an einigen Beispielen zu uben.121
• Die Aussage122
“Wenn eine naturliche Zahl durch 6 teilbar ist, dann ist sie auch durch 3 teilbar.”123
konnen wir wie folgt umschreiben:124
“Fur alle naturlichen Zahlen n gilt: Wenn n durch 6 teilbar ist, dann ist n auch durch 3125
teilbar.”126
oder127
∀n ∈ N: (n durch 6 teilbar) ⇒ (n durch 3 teilbar).”128
• Die Aussage129
“Jede naturliche Zahl großer als 1 hat einen Primteiler.”130
kann man wie folgt schreiben. Schreibe P fur die Menge aller Primzahlen. Dann ist die Aussage von131
oben132
“Fur jede naturliche Zahl n gilt: Wenn n ≥ 2, dann gibt es eine Primzahl p, so dass n durch133
p teilbar ist.”134
oder in Kurzschreibweise135
“∀n ∈ N : (n ≥ 2)⇒ (∃p ∈ P : n ist teilbar durch p).”136
• Die Aussage137
“Die Wurzel aus 2 ist irrational.”138
konnen wir umschreiben als:139
“Es gibt kein q ∈ Q, so dass√
2 = q.”140
oder auch141
“Es ist nicht so, dass es ein q ∈ Q gibt, so dass√
2 = q.”142
oder auch143
¬(∃q ∈ Q : q =
√2)
144
145
Hausaufgabe 1.1.1. Betrachten Sie die Aussagen:146
A:”
Es gibt keine großte naturliche Zahl.“147
B:”0 ist die großte naturliche Zahl.“148
C:”
Die Gleichung x2 + x+ 1 = 0 hat genau eine Losung uber den reellen Zahlen.“149
8 KAPITEL 1. GRUNDLAGEN
Welche der Aussagen ist wahr? Schreiben Sie die Aussagen mit Hilfe von Quantoren.150
Hausaufgabe 1.1.2. Formulieren Sie die Negation der folgenden Aussagen in moglichst einfachen Worten:151
A:”
Fur jede rationale Zahl q gilt: q lasst sich als Kommazahl mit endlich vielen Ziffern schreiben.“152
B:”
Es gibt eine naturliche Zahl mit mindestens 10 Ziffern.“153
C:”
Alle ungeraden Zahlen sind Primzahlen.“154
1.2 Mengenlehre155
Wir kummern uns um grundlegende Eigenschaften von Mengen. Der Inhalt dieses Abschnitts sollte in großen156
Teilen aus der Schule bekannt sein.157
Eine Menge ist fur uns eine Sammlung von unterscheidbaren Objekten. Wir kennen zum Beispiel die158
Menge der naturlichen Zahlen, die wir als159
N = {0, 1, 2, . . .}
schreiben. Dies ist eine unendliche Menge. Ein anderes Beispiel ist W , die Menge aller Worter in der160
deutschen Sprache mit genau 4 Buchstaben. Diese Menge ist recht groß, aber endlich.161
Wir schreiben |A| fur die Anzahl der Elemente einer Menge A. Falls die Menge unendlich ist, setzen wir162
|A| =∞.163
Ist ein Objekt x in einer Menge A enthalten, schreiben wir x ∈ A. Ist es nicht enthalten, schreiben wir164
x /∈ A. Zum Beispiel ist 3 ∈ N, aber “Ast”/∈ W (W wie oben beschrieben). Zwei Mengen sind gleich, wenn165
sie die gleichen Elemente enthalten.166
Mengen konnen auf verschiedene Weisen festgelegt werden. Endliche Mengen kann man am einfachsten167
beschreiben, in dem man alle Elemente aufzahlt (die Reihenfolge ist dabei irrelevant). Zum Beispiel ist168
{1, 3, 5, 7, 9} = {1, 5, 9, 3, 7}
die Menge der einstelligen ungeraden Zahlen. Oft hilft die “Punktchen- Schreibweise” weiter: Zum Beispiel:169
{1, 10, 100, . . . , 1000000000}
Hierbei ist aber zu bemerken, dass es fur den Leser klar ersichtlich sein muss, wie die Punktchen zu inter-170
pretieren sind. Mit dieser Schreibweise kann man auch unendliche Mengen definieren.171
{1, 3, 5, 7, . . .}
ist die Menge aller ungeraden naturlichen Zahlen. Eine weitere, oft sehr bequeme Moglichkeit ist die folgende172
Schreibweise173
{x ∈ N | x2 < 100 ∧ x ist ungerade},die wie folgt zu lesen ist: “Die Menge aller x ∈ N, fur die gilt: x2 < 100 und x ist ungerade. Finden Sie eine174
alternative Beschreibung fur diese Menge? Statt des |-Symbols schreibt man auch einen Doppelpunkt – die175
Bedeutung ist gleich. Es ist auch ublich, ein Komma statt des ∧-Symbols zu setzen. Die gleiche Menge kann176
also auch so geschrieben werden:177
{x ∈ N : x2 < 100, x ist ungerade}.
Eine Menge A ist eine Teilmenge von B, A ⊆ B, wenn jedes Element von A auch ein Element von B ist178
(fur Quantorenfans: ∀x ∈ A : x ∈ B). Eine einfache, aber wichtige Eigenschaft ist, dass zwei Mengen A und179
B gleich sind, genau dann wenn A ⊆ B und B ⊆ A gilt. Beachten Sie auch, dass A immer eine Teilmenge180
von sich selbst ist. Wenn wir ausdrucken wollen, dass A eine Teilmenge von B ist, aber A 6= B ist, dann181
schreiben wir A ( B und nennen A eine echte Teilmenge von B.182
Die Notation “A ⊂ B” ist auch sehr verbreitet. Leider bedeutet sie in manchen Buchern A ⊆ B und in183
anderen Buchern A ( B. Der Klarheit halber verzichten wir auf diese Notation.184
Es folgen weitere Standardbegriffe. Der Einfachheit halber nehmen wir an, dass alle betrachteten Mengen185
Teilmengen eines “Universums” U sind.186
1.2. MENGENLEHRE 9
Vereinigung Sind A und B Mengen, so ist deren Vereinigung definiert als187
A ∪B := {x ∈ U | x ∈ A ∨ x ∈ B}.
Wir haben hier die Schreibweise “:=” verwendet, die wir sehr haufig gebrauchen werden. Dies druckt188
aus, dass wir den Begriff “A ∪B” an dieser Stelle einfuhren (bzw definieren).189
Schnitt Der (Durch)Schnitt von zwei Mengen A und B ist definiert als190
A ∩B := {x ∈ U | x ∈ A ∧ x ∈ B}.
Differenzmenge Die Differenzmenge von A und B ist definiert als191
A \B := {x ∈ A | x /∈ B}.
Beachten Sie, dass A \B nicht immer gleich zu B \A ist. Andererseits gilt immer, dass A \B ⊆ A.192
Leere Menge Die leere Menge ist die Menge ohne Elemente. Wir schreiben sie als ∅ oder {}. Es gilt also:193
∀x ∈ U : x /∈ ∅. Wir nennen zwei Mengen A, B disjunkt, wenn A ∩B = ∅.194
Komplementarmenge Das Komplement einer Menge A ist195
AC := {x ∈ U | x /∈ A}.
Produkte Ein Paar von Objekten x und y schreiben wir als (x, y). Bei einem Paar spielt die Reihenfolge196
eine Rolle; zum Beispiel ist (1, 2) 6= (2, 1). Sind A, B Mengen, dann schreiben wir197
A×B := {(a, b) | a ∈ A, b ∈ B}
als die Menge aller Paare uber A und B. Wir konnen auf ahnliche Weise die Triple A × B × C und198
allgemein k-Tupel uber k Mengen definieren.199
Interessanterweise konnen die Elemente einer Mengen selbst wieder Mengen sein. Als Beispiel betrachten200
wir201
X = {M ⊆ {1, 2, 3} |M enthalt genau zwei Elemente}}= {{1, 2}, {1, 3}, {2, 3}}.
Eine andere interessante Menge ist X = {∅}, also die Menge, die die leere Menge enthalt. Ist X selbst202
die leere Menge? Die Antwort ist nein, denn ∅ ∈ X, also ist X nicht leer.203
Wir erweitern noch den Begriff von Vereinigung und Schnitt. Sei M eine Menge von Mengen, die alle204
Teilmengen eines Universums U bilden. Dann setzen wir205 ⋃M∈M
M := {x ∈ U | ∃M ∈M : x ∈M}.
Das bedeutet, dass x in der Vereinigung liegt, wenn es in mindestens einer Menge aus M enthalten ist.206
Wenn wir M = {A,B} setzen, ergibt dies genau A ∪B von oben. Der Schnitt ist ahnlich definiert207 ⋂M∈M
M := {x ∈ U | ∀M ∈M : x ∈M}.
Also ist x im Schnitt, wenn es in allen Mengen aus M enthalten ist.208
Schauen wir uns ein geometrisches Beispiel an: Setze M als die Menge aller Kreisscheiben um den209
Ursprung mit einem Radius r mit 0 ≤ r ≤ 1. Jede Kreisscheibe ist eine Teilmenge von R2. Die Vereiningung210 ⋃M∈MM ist dann die Einheitskreisscheibe. Der Schnitt
⋂M∈MM besteht nur aus dem Punkt (0, 0). Es211
ist lohnenswert, grundlich nachzudenken, warum dies der Fall ist.212
10 KAPITEL 1. GRUNDLAGEN
Relationen. Ein zentrales Konzept in der gesamten Mathematik sind Relationen. Diese drucken aus, wie213
Elemente von Mengen miteinander in Beziehung stehen.214
Fur zwei Mengen M und N ist eine Relation R definiert als eine Teilmenge von M×N . Wenn (x, y) ∈ R,215
sagen wir auch, dass x und y in Relation R zueinander stehen. Wir schreiben auch manchmal “xR y” anstatt216
“(x, y) ∈ R” und “x 6R y” fur “(x, y) /∈ R” in diesem Fall. Falls M = N , nennen wir R eine Relation uber217
M .218
Ein bekanntes Beispiel einer Relation uber N ist ≤. In der Tat konnen wir ≤ als Menge uber N × N219
auffassen, in der alle Paare (a, b) enthalten sind, fur die a kleiner oder gleich b ist. Zum Beispiel ist dann220
(3, 7) ∈≤, aber (4, 1) /∈≤. Nehmen wir die Notation “xR y” von oben, dann ergibt sich Schreibweise 3 ≤ 7,221
4 � 1, die wir gewohnt sind.222
Relationen sind allgegenwartig. Ein nicht-mathematisches Beispiel ergibt sich, wenn wir S als die Menge223
aller SchauspielerInnen und F als die Menge aller Filme definieren und die Relation224
R = {(s, f) | SchauspielerIn s spielt in Film f mit}
einfuhren.225
Sei nun ∼ eine Relation uber einer Menge M . Wir nennen ∼226
• reflexiv, falls gilt: x ∼ x fur alle x ∈M .227
• symmetrisch, falls gilt: Wenn x ∼ y, dann auch y ∼ x (fur alle x, y in M).228
• transistiv, falls gilt: Wenn x ∼ y und y ∼ z, dann auch x ∼ z.229
Zum Beispiel ist die Relation ≤ von oben reflexiv (denn x ≤ x fur jede beliebige Zahl x) und transitiv230
(denn falls a ≤ b und b ≤ c ist auch a ≤ c), aber nicht symmetrisch, da 1 ≤ 2 und 2 � 1 gilt. Beachten Sie,231
dass dieses eine Gegenbeispiel als Argument ausreicht, denn die Symmetriebedingung fordert ja, dass aus232
x ≤ y auch y ≤ x folgt fur alle x, y ∈ N, und wir haben ein Gegenbeispiel gefunden, also ist die Aussage “≤233
ist symmetrisch” falsch.234
Wir nennen eine Relation ∼ auf M eine Aquivalenzrelation, wenn ∼ reflexiv, symmetrisch und transitiv235
ist. Aquivalenzrelationen haben besonders schone Eigenschaften. Eine davon ist, dass ∼ die Menge M in236
sogenannte Aquivalenzklassen237
Rx := {y ∈M | x ∼ y}
aufteilt. Wir demonstrieren das an einem Beispiel.238
Definiere die Relation ∼2 auf den naturlichen Zahlen als239
∼2:= {(a, b) | a und b lassen bei ganzzahliger Division durch 2 den gleichen Rest}
“Ganzzahlige Division” ist hier die Division mit Rest, die man (hoffentlich) aus der Schule kennt. Zum240
Beispiel ist 17 : 7 = 2 Rest 3 oder 15 : 5 = 3 Rest 0.241
Die Relation ∼2 ist nun in der Tat reflexiv, symmetrisch und transitiv, wie man sich sofort uberlegt, also242
eine Aquivalenzrelation. Schauen wir uns die Aquivalenzklassen an. R1 besteht aus allen naturlichen Zahlen,243
die den gleichen Rest bei Division durch 2 lassen wie 1. Da 1 : 2 = 0 Rest 1, ist dieser Rest gleich 1. Es ist244
nicht schwer zu sehen, dass die ungeraden Zahlen Rest 1 lassen, und die geraden Zahlen Rest 0 lassen. Damit245
ist R1 = {1, 3, 5, 7, 9, . . .}. Ebenso ist R0 = {0, 2, 4, 6, 8, . . .}. Wir sehen auch, dass R1 = R3 = R5 = . . . und246
R0 = R2 = R4 = . . .. Ausserdem sind R0 und R1 disjunkte Mengen.247
Die Beoachtungen, die wir fur die Aquivalenzklassen von ∼2 gemacht haben, gelten fur jede Aquivalenz-248
relation. Wir formulieren dies als mathematisches Theorem (= als Aussage).249
Theorem 1.1. Sei ∼ eine Aquivalenzrelation uber einer Menge M . Fur alle x, y in M gilt dann:250
• Ist x ∼ y, dann ist Rx = Ry.251
• Ist x 6∼ y, dann ist Rx ∩Ry = ∅.252
1.3. ABBILDUNGEN 11
Um es etwas unsauberer zu formulieren: Es kann nicht passieren, dass sich zwei Aquivalenzklassen253
teilweise uberlappen – entweder sind sie “komplett gleich” oder “komplett verschieden”. Es geht uns nun254
erstmal aber weniger um den Gehalt der Aussage selbst als um die Gestalt der Aussage. Dafur lohnt es sich,255
die Aussage mit Quantoren umzuformulieren:256
Fur jede Menge M , fur jede Aquivalenzrelation uber M und fur alle x, y ∈ M gilt: (x ∼ y ⇒257
Rx = Ry) ∧ (x 6∼ y ⇒ Rx ∩Ry = ∅).258
Diese Umformung macht den Satz nicht lesbarer, aber es wird deutlich, dass dieses Theorem sehr allgemein259
ist: es wird eine Aussage uber alle Aquivalenzrelationen getroffen (also auch solche, die wir noch nicht kennen,260
und auch solche, uber die noch nie jemand nachgedacht hat). Dies bringt einen großen Vorteil mit sich: Wenn261
wir zu einem spateren Zeitpunkt eine konkrete Relation R betrachten und konnen nachweisen, dass R eine262
Aquialenzrelation ist, dann wissen wir dank des Theorems schon einiges uber seine Aquivalenzklassen (ohne263
dass wir diese Aquivalenzklassen studieren mussen).264
Naturlich gilt das gerade Gesagte nur dann, wenn die Aussage wahr ist. Das ist in diesem Fall nicht265
offensichtlich, und erfordert einen Nachweis. Wir verschieben die Diskussion daruber in Abschnitt 1.4, wo266
wir Beweistechniken studieren werden.267
268
Hausaufgabe 1.2.1. Sei V die Menge der Facebook-User und ∼ definiert uber V als269
a ∼ b genau dann, wenn a und b Facebook-Freunde sind.
Ist ∼ reflexiv, symmetrisch, transitiv?270
Hausaufgabe 1.2.2. Betrachten Sie die Relation271
∼7:= {(a, b) | a und b lassen bei ganzzahliger Division durch 7 den gleichen Rest}
Ist ∼7 eine Aquivalenzrelation? Wie ist es mit ∼4, ∼10, ∼143, die auf gleiche Weise definiert sind? Formulie-272
ren Sie ein Theorem, das Ihre Beobachtung verallgemeinert (Sie brauchen das Theorem nicht zu beweisen).273
Geben Sie auch die Aquivalenzklassen bezuglich ∼7 an.274
Hausaufgabe 1.2.3. Sei Z0 die Menge {. . . ,−3,−2,−1, 1, 2, 3, . . .}, also die ganzen Zahlen ohne 0. Wir275
betrachten eine Relation auf Z× Z0:276
R := {((a, b), (c, d)) | ∃λ ∈ Z : (a = λc ∧ b = λd) ∨ (c = λa ∧ d = λb}
Ist R eine Aquivalenzrelation?277
1.3 Abbildungen278
Abbildungen (auch Funktionen genannt) sind bereits in der Schule ein zentrales Konzept des Mathematik-279
unterrichts, und sind auch fur uns von großer Bedeutung. Ein wesentlicher Aspekt von Abbildungen wird280
in der Schule jedoch meist vernachlassigt: man kann Abbildungen hintereinanderausfuhren und erhalt eine281
neue Abbildung. Wir werden diesen Begriff und weitere Grundlagen im Folgenden einfuhren.282
Fixiere zwei Mengen X, Y . Eine Abbildung f ist eine Relation zwischen X und Y , in der jedes x ∈ X283
mit genau einem y ∈ Y in Relation steht. Wir nennen diese y das Bild von x und schreiben y = f(x). In284
dem Fall heisst x ein Urbild von y (“ein” Urbild, nicht “das” Urbild, denn y kann mehrere Urbilder haben).285
Wir schreiben auch286
f : X → Y, x 7→ f(x)
fur eine Abbildung von X nach Y . Wir nennen X die Definitionsmenge und Y die Zielmenge der Abbildung.287
Formal ist eine Abbildung also einfach eine Menge von Paaren. Zum Beispiel kann288
f : {0, 1, 2, 3} ⇒ {5, 7, 9, 11}, x 7→ 2x+ 5
auch geschrieben werden als f = {(0, 5), (1, 7), (2, 9), (3, 11)}. Diese Schreibweise ist aber eher unublich.289
Wir nennen eine Abbildung f : X → Y290
12 KAPITEL 1. GRUNDLAGEN
• surjektiv, falls jedes y ∈ Y als Bild (mindestens) eines x ∈ X auftritt (∀y ∈ Y : ∃x ∈ X : f(x) = y).291
• injektiv, falls verschiedene x1, x2 aus X verschiedene Bilder haben in Y haben (∀x1, x2 ∈ X : x1 6=292
x2 ⇒ f(x1) 6= f(x2)).293
• bijektiv oder umkehrbar, falls f surjektiv und injektiv ist.294
Anders ausgedruckt: Surjektivitat bedeutet, dass jedes y ∈ Y mindestens ein Urbild hat. Injektivitat295
bedeutet, dass jedes y ∈ Y hochstens ein Urbild hat. Bijektivitat bedeutet dann folglich, dass jedes y ∈ Y296
genau ein Urbild hat, und wir konnen die Umkehrabbildung f−1 : Y → X definieren mit y 7→ x fur y = f(x).297
Schauen wir uns ein paar Beispiele an.298
1. Die Abbildung299
f : N→ N, x 7→ 2x
ist nicht surjektiv, denn es gibt kein x, welches auf 3 abbildet. Sie ist jedoch injektiv, denn ist x1 6= x2,300
dann ist auch 2x1 6= 2x2. Die Abbildung ist nicht bijektiv, da sie nicht surjektiv ist. Wenn wir die301
Zielmenge einschranken:302
f : N→ {0, 2, 4, 6, . . .}, x 7→ 2x
dann wird die Abbildung surjektiv und daher umkehrbar.303
2. Betrachten wir die Abbildung304
g : N→ N, x 7→⌈x+ 2
2
⌉.
d·e nennt man die obere Gaussklammer. Es bedeutet, dass die Zahl innerhalb der Gaussklammer zur305
nachstliegenden nicht kleineren ganzen Zahl aufgerundet wird. Zum Beispiel ist d3.1e = 4, d−7.2e = −7306
und d8e = 8. Es gibt auch die untere Gaussklammer b·c mit entsprechender Bedeutung.307
Nun also zur Abbildung g. Sie ist nicht surjektiv, denn 0 hat kein Urbild. Beachten Sie, dass jedes308
andere Element ein Urbild besitzt, y0 ≥ 1 wahlen wir einfach x0 = 2y0 − 2 und rechnen nach:309
g(x0) =
⌈x0 + 2
2
⌉=
⌈2y0 − 2 + 2
2
⌉= dy0e = y0
also ist x0 ein Urbild von y0. Allerdings andert das nichts an der Tatsache, dass die Funktion nicht310
surjektiv ist, denn ein Gegenbeispiel reicht aus. Die Abbildung ist jedoch nicht injektiv, denn zum311
Beispiel ist g(1) = 2 = g(2), wie man leicht nachrechnet, also hat 2 zwei Urbilder. Damit ist f auch312
nicht umkehrbar.313
Haben wir zwei Abbildungen f : A → B und g : B → C, dann konnen wir eine Abbildung von A nach314
C definieren, indem wir auf ein Element aus A erst f anwenden, und dann auf das Ergebnis g anwenden.315
Mit anderen Worten316
g ◦ f : A→ C : x 7→ g(f(x))
ist die Komposition von f und g. Man beachte hier, dass trotz der Notation g◦f zuerst f , dann g ausgefuhrt317
wird. Auch ist es notwendig, dass die Zielmenge von f eine Teilmenge der Definitionsmenge von g ist, sonst318
ergibt die Vorschrift keinen Sinn.319
Als Beispiel komponieren wir die beiden Abbildungen f und g aus dem letzten Beispiel. Dies ist moglich,320
da Definitions- und Zielmenge beider Abbildungen N ist. Es ergibt sich dann321
g ◦ f(x) = g(f(x)) = g(2x) =
⌈2x+ 2
2
⌉= dx+ 1e = x+ 1.
Man konnte in diesem Fall auch die Abbildung f ◦ g bilden und erhalt f ◦ g(x) = 2dx+22 e. Man erkennt also322
schon, dass g ◦ f im Allgemeinen nicht gleich f ◦ g ist.323
324
1.4. DER RHYTHMUS DER MATHEMATIK: DEFINITION, SATZ, BEWEIS 13
Hausaufgabe 1.3.1. Sie haben Abbildungen f : A → B, g : B → C and h : C → D gegeben. Definieren325
Sie sich daraus eine Abbildung h ◦ g ◦ f .326
Hausaufgabe 1.3.2. Untersuchen Sie die folgenden Abbildungen aus Surjektivitat, Injektivitat und Bijek-327
tivitat.328
a. f : N→ N, x 7→ x3 + 3x2 + 3x+ 1.329
b. f : N→ N, x 7→ x falls x 6= 2 und 2 7→ 100.330
c. f : M → {0}, x 7→ 0; dabei sei M 6= ∅ beliebig.331
Im letzten Beispiel ist eine Fallunterscheidung notwendig.332
Hausaufgabe 1.3.3. Sagen wir, im Jahr 2018 wurden 350.000 Postkarten nach Graz geschickt (die Zahl333
stimmt sicher nicht). Argumentieren Sie, dass es eine Person in Graz gibt, die mindestens zwei Postkarten334
erhalten hat.335
Hausaufgabe 1.3.4. Fur eine beliebige (nicht-leere) Menge X bezeichnet id : X → X,x 7→ x die Iden-336
titatsabbildung. Betrachten wir nun die Abbildung337
f : R→ R, x 7→ ax+ b
mit a 6= 0.338
a. Was stellt die Funktion f geometrisch dar?339
b. Finden Sie eine Funktion g : R→ R, so dass g ◦ f = id. Was erhalten Sie, wenn Sie f ◦ g berechnen?340
c. Intepretieren Sie g ebenfalls geometrisch.341
1.4 Der Rhythmus der Mathematik: Definition, Satz, Beweis342
Dieser Abschnitt ist eher philosophischer Natur und mochte erklaren, worum es in der Mathematik (nach343
Ansicht des Dozenten) eigentlich geht. Eigentlich sollte dies Thema des Schulunterrichts sein, aber wird dort344
wohl nicht immer genau besprochen.345
Was ist Mathematik? Auf der Wikipediaseite steht folgendes346
Die Mathematik [...] ist eine Wissenschaft, welche aus der Untersuchung von geometrischen Figu-347
ren und dem Rechnen mit Zahlen entstand. Fur Mathematik gibt es keine allgemein anerkannte348
Definition; heute wird sie ublicherweise als eine Wissenschaft beschrieben, die durch logische De-349
finitionen selbstgeschaffene abstrakte Strukturen mittels der Logik auf ihre Eigenschaften und350
Muster untersucht.351
Dies ist in der Tat eine akkurate Beschreibung. Es geht um die Eigenschaften von “selbstgeschaffenen”352
Strukturen (anders als z.B. in der Physik oder Biologie, wo die Strukturen aus der Natur stammen). Eine353
primare Motivation dieser selbstgeschaffenen Strukturen liegt darin, dass sie real-existierende Gegebenheiten354
modellieren. Ein Beispiel ist der Begriff der Relation von oben, welcher unter anderem soziale Netzwerke355
modelliert. Ein Ziel in der Mathematik ist es, die Strukturen moglichst allgemein zu halten. Der Vorteil ist,356
dass sich dann Eigenschaften dieser Strukturen auf viele Anwendungsbereiche erstrecken konnen – siehe die357
Diskussion oben nach Theorem 1.1, welches eine Eigenschaft der Struktur “Aquivalenzrelation” formuliert.358
Der Nachteil dieser Allgemeinheit ist, dass die Beschaftigung mit diesen Strukturen ein recht abstraktes359
Unterfangen ist – eine Aussage der Form “Jede Aquivalenzrelation/Jede Abbildung/. . .” ist schwieriger zu360
begreifen als eine Aussage uber eine fixierte Abbildung. Das ist eine der Hauptschwierigkeiten, die sich beim361
Ubergang von Schulmathematik auf Universitatsmathematik stellt.362
Wie gehen wir nun konkret vor? Im Wesentlichen in drei Schritten:363
1. Wir “erschaffen” unsere Struktur (Definition)364
14 KAPITEL 1. GRUNDLAGEN
2. Wir formulieren Eigenschaften uber diese Struktur (Satz/Theorem)365
3. Wir weisen nach, dass die postulierte Eigenschaft wirklich gilt (Beweis)366
Die vorangehenden Abschnitte erhalten bereits zahlreiche Definitionen. Zum Beispiel wurden die Begriffe367
“Funktion”, “Relation” oder “Aquivalenzrelation” eingefuhrt. In diesem Skript werden wir einen Begriff,368
wenn er definiert wird, kursiv schreiben. Wie oben bereits erwahnt, nutzen wir auch die Schreibweise “:=”,369
wenn wir einen Begriff per Formel einfuhren wollen. Besonders wichtige Definitionen werden wir auch in370
einer speziellen Umgebung angeben, zum Beispiel so:371
Definition 1.2. Eine Zahl p ∈ N heißt Primzahl, wenn p ≥ 2 und p durch keine naturliche Zahl ausser 1372
und p teilbar ist.373
Auch fur den zweiten Schritt gibt es in den vorherigen Kapiteln zahlreiche Beispiele. Ein Beispiel ware die374
Aussage, dass jede Primzahl ausser 2 ungerade ist. Zentrale Aussagen werden wir wiederum als abgesetzte375
Blocke schreiben, um sie besonders zu betonen.376
Theorem 1.3. Es gibt unendlich viele Primzahlen.377
Beweise. Wir kommen nun zum dritten Teil, dem Beweis. Grundsatzlich muss jede Aussage eines mathe-378
matischen Texts begrundet werden (eine Definition braucht naturlich keine Begrundung, denn man fuhrt ja379
nur einen neuen Begriff ein). Die Begrundung kann auf verschiedene Arten erfolgen. Zum einen kann man380
die Begrundung mit der Aussage mitliefern. Zum Beispiel: Jede Primzahl ausser 2 ist ungerade, denn eine381
gerade Zahl grosser als 2 ist immer auch durch 2 teilbar, was der Definition von Primzahl widerspricht. Es382
ist auch sehr ublich, einfach keine Begrundung anzugeben und diese dem Leser zu uberlassen. Das sollte383
jedoch nur bei einfachen Aussagen geschehen.384
Ist die Begrundung aufwendiger, schreibt man die Aussage ublicherweise als Theorem und liefert nach385
dem Theorem den Beweis nach.386
Theorem 1.4. Das Produkt von zwei ungeraden naturlichen Zahlen ist ungerade.387
Beweis. Seien a und b ungerade Zahlen. Das bedeutet, wir konnen a schreiben als a = 2k + 1 mit k eine388
andere naturliche Zahl. Ebenso ist b = 2`+ 1 mit ` ∈ N. Nun rechnen wir nach389
a · b = (2k + 1)(2`+ 1) = 4k`+ 2k + 2`+ 1 = 2(2k`+ k + `) + 1.
Das bedeutet, dass sich a ·b schreiben lasst als 2m+1 mit m eine naturliche Zahl. Also ist a ·b ungerade.390
Dies ist ein Beispiel fur einen direkten Beweis: Wir starten mit der Voraussetzung (in diesem Fall: a und391
b sind ungerade) und wir leiten daraus Schritt fur Schritt Konsequenzen ab, bis die gewunschte Aussage392
nachgewiesen ist. Naturlich muss jeder Schritt im Beweis selbst wieder fur den Leser nachvollziehbar sein.393
Eine wichtige Bemerkung: In der Schule besteht der Mathematikunterricht haufig aus Rechnungen, die394
oftmals auch noch in einer bestimmten Form verlangt werden. Das hat den Vorteil, dass es fur Aufgaben395
im Wesentlichen nur eine richtige Losung gibt. Dies ist in der “wahren” Mathematik anders. Es gibt nicht396
nur einen Beweis fur eine Aussage. Fur viele Aussagen kann man einen Beweis auf sehr verschiedene Weisen397
fuhren. Wichtig ist nur, dass jeder Schritt korrekt und nachvollziehbar ist. Dann nennen wir einen Beweis398
korrekt.399
Schauen wir uns weitere Beweistechniken an. Als nachstes kommt ein Beweis durch Widerspruch. Dabei400
nehmen wir an, die zu beweisende Aussage ist falsch. Aus dieser Annahme folgern wir dann eine Aussage,401
die nachweislich falsch ist. Das bedeutet, die Negation der Aussage fuhrt zu einem Widerspruch, und damit402
muss die Aussage selbst wahr sein.403
Definition 1.5. Sei n ∈ N mit n ≥ 2. Ein Primteiler von n ist eine Primzahl, die n teilt.404
Theorem 1.6. Jede naturliche Zahl n ≥ 2 hat einen Primteiler.405
1.4. DER RHYTHMUS DER MATHEMATIK: DEFINITION, SATZ, BEWEIS 15
Beweis. Nehmen wir an, die Aussage ist falsch. Das bedeutet, es gibt mindestens eine Zahl, die keinen406
Primteiler hat. Aus allen naturlichen Zahlen mit dieser Eigenschaft wahlen wir uns die kleinste aus und407
nennen sie n. Das bedeutet, n hat keinen Primteiler, aber jede naturliche Zahl kleiner als n (und grosser als408
1) hat einen Primteiler. Nun ist n selbst keine Primzahl, denn sonst hat n einen Primteiler, namlich sich409
selbst. Das bedeutet, es gibt eine naturliche Zahl m mit 1 < m < n, die n teilt. Nun hat m einen Primteiler410
p, denn wir haben n ja so gewahlt, dass jede Zahl kleiner n einen Primteiler hat. Also ist p ein Teiler von m,411
und damit auch ein Primteiler von n. Dies ist aber ein Widerspruch zur Annahme, dass n keinen Primteiler412
hat.413
Als weiteres Beispiel fur einen Widerspruchsbeweis beweisen wir das Theorem von oben.414
Beweis. (von Theorem 1.3) Nehmen wir an, dass es nur endlich viele Primzahlen gibt. Dann konnen wir415
die Primzahlen der Grosse nach schreiben als p1 < p2 < . . . < pn, wobei n die Anzahl der Primzahlen ist.416
Nun betrachten wir die Zahl417
q := p1 · p2 · . . . · pn + 1
Wir sehen, dass fur jedes pi mit i = 1, . . . , n die Division von q durch pi Rest 1 lasst. Damit ist kein pi ein418
Teiler von q. Da nach Annahme p1, . . . , pn samtliche Primzahlen sind, hat also q keinen Primteiler. Das ist419
aber ein Widerspruch zur Aussage in Theorem 1.6.420
Wir sehen hier ein wichtiges Prinzip. Bereits bewiesene Aussagen konnen in nachfolgenden Beweisen421
verwendet werden. Dieser modulare Aufbau dient dazu, dem Text Struktur zu geben und damit leserlicher422
zu machen. Auch hier gibt es keine fest definierten Regeln. Wir werden haufig Lemmas verwenden, um die423
Struktur noch klarer zu machen. Ein Lemma ist ein Hilfssatz und im Prinzip das gleiche wie ein Theorem (es424
muss also bewiesen werden). Die Unterscheidung Lemma/Theorem dient lediglich dazu, zu unterstreichen,425
welche Aussage von besonderer Wichtigkeit ist (Theorem) und welche nur ein technisches Hilfsmittel ist426
(Lemma), um ein Theorem zu beweisen.427
Vollstandige Induktion. Wir besprechen eine weitere wichtige Beweistechnik, die speziell fur Aussagen428
der Form429
∀n ∈ N : A(n)
anwendbar ist. Hier steht A(n) fur eine Aussage mit Variable n. Ein konkretes Beispiel fur A(n) ist430
A(n) : 1 + 2 + . . .+ n =n(n+ 1)
2.
Man kann eine solche Aussage in zwei Schritten beweisen:431
– Man zeigt zuerst, dass die Aussage A(0) gilt. Das nennt man den Induktionsanfang.432
– Man zeigt dann: wenn fur ein beliebiges n die Aussage A(n) gilt, dann gilt auch A(n+ 1). Man nennt433
A(n) die Induktionsannahme und den Schluss A(n)⇒ A(n+ 1) den Induktionsschritt.434
Warum reichen diese beiden Schritte? Der Induktionsanfang stellt sicher, dass A(0) gilt. Der Induktions-435
schritt fur n = 0 besagt, dass A(0) ⇒ A(1) gilt. Beide Aussagen zusammen implizieren, dass die Aussage436
A(1) ebenfalls wahr ist. Der Induktionsschritt fur n = 1 besagt, dass A(1) ⇒ A(2) gilt, also wissen wir437
auch, dass A(2) wahr ist. Dies konnen wir nun beliebig lange weitertreiben, und erhalten fur jedes fixierte438
n, dass A(n) ebenfalls wahr ist. Man kann sich dieses Beweisprinzip als einen Dominoeffekt vorstellen. Der439
Induktionsanfang stellt sicher, dass der erste (oder eher nullte) Stein fallt. Der Induktionsschritt stellt sicher,440
dass ein Stein fallt, wenn sein Vorganger fallt. Somit mussen alle Steine fallen.441
Schauen wir uns ein Beispiel an.442
Theorem 1.7.
∀n ∈ N : 20 + 21 + 22 + . . .+ 2n = 2n+1 − 1
16 KAPITEL 1. GRUNDLAGEN
Beweis. Wir beweisen dies mit vollstandiger Induktion. Fur den Induktionsanfang mussen wir nachweisen,443
dass die Aussage fur n = 0 gilt. Dies geschieht einfach durch Nachrechnen: Auf der linken Seite steht444
nur 20 = 1 (denn die Summe hort fur n = 0 nach einem Summanden auf). Auf der rechten Seite steht445
20+1 − 1 = 2− 1 = 1, also sind linke und rechte Seite in der Tat gleich.446
Fur den Induktionsschritt nehmen wir an, dass wir die Aussage fur ein n bereits bewiesen haben. Es gilt447
also448
20 + 21 + 22 + . . .+ 2n = 2n+1 − 1.
Schreiben wir die Aussage fur n+ 1 auf, ergibt sich,449
20 + 21 + 22 + . . .+ 2n + 2n+1 = 2n+2 − 1.
Dies mussen wir also beweisen. Dafur rechnen wir nach
20 + 21 + 22 + . . .+ 2n + 2n+1 = (20 + 21 + 22 + . . .+ 2n) + 2n+1
= 2n+1 − 1 + 2n+1
= 2 · 2n+1 − 1
= 2n+2 − 1,
wobei wir im zweiten Schritt der Rechnung die Induktionsannahme verwendet haben. Damit ist die Aussage450
bewiesen.451
Wenn die Aussage nicht uber alle naturlichen Zahlen ist, sondern nur fur alle naturlichen Zahlen ≥ k,452
dann lasst sich das Prinzip ebenso anwenden. Man muss den Induktionsanfang nur fur k durchfuhren.453
Theorem 1.8. Die Summe der ersten n geraden Zahlen (beginnend bei 2) addiert sich auf zu n(n + 1).454
Oder anders gesagt:455
∀n ≥ 1 : 2 + 4 + 6 + . . . 2n = n(n+ 1)
Beweis. Fur den Induktionsanfang zeigen rechnen wir fur n = 1 nach: links steht 2, rechts steht 1(1+1) = 2,also stimmt die Aussage fur n = 1. Nun nehmen wir an, dass die Aussage gilt fur ein n und rechnen furn+ 1 nach:
2 + 4 + 6 + . . .+ 2n+ 2(n+ 1) = (2 + 4 + 6 + . . .+ 2n) + 2(n+ 1)
= n(n+ 1) + 2(n+ 1)
= (n+ 1)(n+ 2).
Hier haben wir wiederum die Induktionsvoraussetzung im zweiten Schritt angenommen und im dritten456
Schritt den Faktor (n + 1) ausgeklammert. Wir haben also den Induktionschritt bewiesen, woraus die457
Aussage folgt.458
Wir fuhren fur Summen noch die folgende Notation ein: Statt 2 + 4 + 6 + . . .+ 2n schreiben wir459
n∑i=1
2i.
Hier ist i eine Laufvariable, die alle Werte von 1 bis n annimmt.460
Wir werden noch weitere Beweistechniken besprechen. Wann immer wir eine neue Methode zum ersten461
Mal anwenden, werden wir das im Skript kenntlich machen.462
1.4. DER RHYTHMUS DER MATHEMATIK: DEFINITION, SATZ, BEWEIS 17
Weiteres Vorgehen. Wir haben nun die mathematischen Werkezeuge zur Hand, um die eigentlichen The-463
men der Vorlesung zu besprechen. Grundsatzlich sollte eine Anfangervorlesung fur Mathematik moglichst464
rigoros sein, das heißt, alle Begriffe sollten klar definiert sein und alle nicht-offensichtlichen Aussagen sollten465
bewiesen werden. Aus Zeitgrunden werden wir diesem Anspruch nicht genugen konnen, sondern werden466
immer wieder Beweise auslassen mussen. Allerdings ist die Beschaftigung mit mathematischen Beweistech-467
niken, neben den mathematischen Konzepten, selbst Teil des Lerninhaltes. Daher werden wir auf Beweise468
nicht vollstandig verzichten. Wem dieser “Mittelweg” nicht befriedigend erscheint, dem sei ein gutes Lehr-469
buch des Stoffes oder der Besuch einer “echten” Mathematikvorlesung empfohlen.470
471
Hausaufgabe 1.4.1. Schreiben Sie472
a. Die Summe aus Theorem 1.7473
b. Die Summe der ersten 20 Quadratzahlen474
c. Die Summe aller geraden dreistelligen Zahlen475
mit Hilfe des Summenzeichens Σ.476
Hausaufgabe 1.4.2. Beweisen Sie mit Hilfe eines Widerspruchsbeweis Theorem 1.1.477
Hausaufgabe 1.4.3. Beweisen Sie durch vollstandige Induktion478
a. 3(1 · 2 + 2 · 3 + 3 · 4 + . . .+ n(n+ 1)) = n(n+ 1)(n+ 2)479
b. 2(30 + 31 + . . .+ 3n) = 3n+1 − 1480
Hausaufgabe 1.4.4. Wo steckt der Fehler im folgenden Induktionsbeweis?481
Satz: Aller Personen in einer Menge X von n Personen haben die gleiche Große.482
Beweis: Die Induktionsvoraussetzung fur n = 1 ist offensichtlich erfullt. Fur den Induktionschritt neh-483
men wir an, dass die Aussage fur alle Mengen mit bis zu n Personen gilt, und betrachten eine Menge X484
mit n + 1 Personen. Wir zerlegen X in Teilmengen Y and Z so, dass |Y | ≤ n, |Z| ≤ n, Y ∩ Z 6= ∅ und485
Y ∪Z = X gilt. Dann folgt nach Induktionsannahme, dass alle Personen in Y und Z gleich gross sind. Da486
der Schnitt von Y and Z nicht leer ist, sind also alle Personen in Y ∪ Z = X gleich gross.487
Hausaufgabe 1.4.5. Beweisen Sie, dass es genau eine naturliche Zahl n gibt, so dass n, n+ 2 und n+ 4488
Primzahlen sind. Argumentieren Sie in zwei Schritten: Erstens, dass es eine solche Zahl gibt, und zweitens489
dass es keine weitere Zahl mit dieser Eigenschaft gibt.490
Hausaufgabe 1.4.6. Die Fibonaccizahlen F1, F2, F3, . . . sind definiert wie folgt:491
F1 := 1, F2 := 1, Fi := Fi−1 + Fi−2 fur i ≥ 2
Die ersten Fibonaccizahlen sind also 1, 1, 2, 3, 5, 8, 13, 21. Beweisen Sie, dass fur alle n ≥ 1 gilt492
F1 + . . .+ Fn = Fn+2 − 1
Hausaufgabe 1.4.7. In einem Kloster leben 100 Monche. Jeder Monch sieht alle anderen Monche jeden493
Tag beim Morgengebet. Allerdings sprechen die Monche nicht miteinander oder kommunizieren in irgendei-494
ner anderen Form. Im Kloster gibt es auch keine Spiegel, also kann ein Monch sein eigenes Gesicht nicht495
sehen. In ihrer Freizeit studieren die Monche die analytischen Grundlagen der Geometrie, sie sind also496
bewandert im logischen Denken.497
Eines Tages (Tag 0) erscheint der Bischof im Kloster und spricht folgendes: “Ich brauche einige von498
Euch als Missionare in anderen Landern. Um Euren Intellekt zu trainieren, werde ich aber nicht verraten,499
wer gehen und wer bleiben muss. Stattdessen tun wir das folgende: In der nachsten Nacht werde ich einigen500
von Euch einen roten Punkt auf die Stirn zeichnen, wahrend Ihr schlaft. Ihr werdet davon nichts bemerken501
und wisst also nicht, ob Ihr markiert seid oder nicht. Wenn Ihr aber aus irgendeinem Grund sicher seid,502
dass Ihr markiert seid, dann musst Ihr in der darauffolgenden Nacht sofort das Kloster verlassen.”503
Am nachsten Morgen ist der Bischof nicht mehr im Kloster. In den nachsten 36 Tagen passiert im Kloster504
nichts. Am 37. Tag jedoch haben etliche Monche das Kloster verlassen. Beweisen Sie mittels Induktion wie505
viele Monche markiert waren.506
18 KAPITEL 1. GRUNDLAGEN
Kapitel 2507
Analysis, Teil I508
Die Analysis — zumindest so weit wie wir sie in diesem Kurs behandeln — beschaftigt sich mit reellwertigen509
Folgen und Funktionen und ihren Grenzwerteigenschaften (wir werden sehen, was dies bedeutet). Viele Teile510
der Analysis sind schon aus der Schule bekannt, z.B. Stetigkeit, Differentialrechnung und Integralrechnung.511
2.1 Die reellen Zahlen512
Die Menge R aller reellen Zahlen wird man als Maturant wohl schonmal gesehen haben. Aber was genau ist513
eine reelle Zahl? Es ist in der Tat recht viel Arbeit, die reellen Zahlen mathematisch exakt zu definieren.514
Wir werden die Konstruktion in weiten Teilen anreissen, aber einige Details nicht in allen Einzelheiten515
besprechen.516
Naturliche, ganze, rationale Zahlen. Wir setzen die naturlichen Zahlen N als intuitiv bekannt voraus517
und verzichten auf eine formale Definition. Die ganzen Zahlen Z erhalten wir aus den naturlichen Zahlen,518
indem wir zu jeder naturlichen Zahl n ≥ 1 ein additives Inverses −n definieren mit n + (−n) = 0. Die519
rationalen Zahlen Q erhalten wir als Menge aller Bruche der Form ab mit a, b ∈ Z, b 6= 0. Dabei werden520
zwei Bruche ab , c
d als gleich erachtet, wenn es eine ganze Zahl z gibt, so dass a = zc und b = zd gilt521
(oder aquivalent, wenn ad = bc gilt).1 Fur einen Bruch ab heißt a der Zahler und b der Nenner des Bruchs.522
Wir interpretieren Bruche der Form a1 als die ganze Zahl a — damit ist Z eine Teilmenge von Q. Es523
ist ab + c
d = ad+bcbd und a
b ·cd = ac
bd . Jeder Bruch ab mit a 6= 0 hat als multiplikatives Inverses b
a , denn524
ab ·
ba = ab
ab = 11 = 1. Wir bezeichnen einen Bruch a
b als vollstandig gekurzt, wenn es keine ganze Zahl ausser525
1 und −1 gibt, die sowohl a als auch b teilt. Jeder Bruch lasst sich mit positivem Nenner schreiben, denn526
ab = −a
−b .527
Seien ab und c
d Bruche mit positivem Nenner. Wir sagen, dass ab <
cd , wenn ad − bc < 0, und a
b >dc ,528
wenn ad− bc > 0. Dies entspricht der anschaulichen Methode, zwei Bruche zu vergleichen, in dem man sie529
auf einen gemeinsamen Nenner bringt und die Zahler vergleicht.530
Theorem 2.1. Zwischen zwei rationalen Zahlen ab <
cd liegt eine rationale Zahl p
q mit ab <
pq <
cd .531
Beweis. Wir definieren532
p
q:=
2ad+ 1
2bd
und rechnen einfach nach, dass533
aq − bp = 2abd− (2abd+ b) = −b < 0
also ist ab <
pq . Ausserdem ist534
pd− qc = 2ad2 + d− 2bcd = d(1 + 2(ad− bc))1Wem das nicht genau genug ist: Es bezeichne ∼ die Aquivalenzrelation auf der Menge Z×Z \ {0} mit (a, b) ∼ (c, d), wenn
ad = bc. Dann ist Q die Menge der Aquivalenzklassen von ∼.
19
20 KAPITEL 2. ANALYSIS, TEIL I
Da nach Voraussetzung ab <
cd , ist ad − bc < 0, also ad − bc ≤ −1, und somit 2(ad − bc) ≤ −2. Also ist535
(1 + 2(ad− bc)) ≤ −1, und somit ist aq − bp ≤ −d < 0. Es folgt, dass pq <
cd .536
Dies ist ein Beispiel fur eine Beweistechnik, in der wir eine geeignete Losung “vom Himmel fallen lassen”.537
In der Tat muss der Beweis nicht erklaren, wie wir auf die konkrete Zahl pq gekommen sind. Es ist nur wichtig538
nachzuweisen, dass die Zahl die geforderte Eigenschaft hat.539
Wir erhalten eine weitere Folgerung aus der Aussage:540
Theorem 2.2. Zwischen zwei rationalen Zahlen liegen unendlich viele rationale Zahlen.541
Beweis. Fixiere zwei rationale Zahlen q1 < q0. Nach Theorem 2.1 gibt es ein q2 mit q1 < q2 < q0. Wiederum542
nach Theorem 2.1 gibt es ein q3 mit q2 < q3 < q0. Wir konnen dies nun beliebig oft wiederholen und erhalten543
eine Sequenz von rationalen Zahlen q1, q2, q3, . . ., welche alle zwischen q1 und q0 liegen.544
Trotz dieser Eigenschaft haben die rationalen Zahlen “Locher”. Wir werden das spater prazisieren, aber545
nun beweisen wir ein klassisches Resultat, das auf die Unvollstandigkeit hinweist:546
Theorem 2.3. Es gibt keine rationale Zahl q, so dass q2 = 2 ist.547
Beweis. Wir beweisen die Aussage durch Widerspruch. Wir nehmen an, es gebe ein q ∈ Q, so dass q2 = 2.548
Schreibe q = ab mit a und b vollstandig gekurzt. Dann ist also a2
b2 = 2, und somit 2a2 = b2. Das bedeutet,549
b2 ist eine gerade Zahl. Da das Quadrat einer ungeraden Zahl wieder ungerade ist, muss b ebenfalls gerade550
sein. Also ist b = 2k fur irgendein k. Setzen wir das ein, ergibt sich 2a2 = 4k2, also a2 = 2k2. Mit dem551
gleichen Argument folgt dann, dass a ebenfalls gerade ist. Also ist der Bruch ab nicht vollstandig gekurzt,552
da a und b beide gerade, also durch 2 teilbar sind. Dies ist ein Widerspruch, also kann es ein q wie gewahlt553
nicht geben.554
Ziffernfolgen. Wir besprechen eine andere Art, die ganzen Zahlen zu erweitern: Als eine Ziffernfolge555
definieren wir eine unendliche Sequenz von Ziffern in {0, 1, . . . , 9} der Gestalt556
±znzn−1 . . . z1z0.z−1z−2z−3 . . .
mit n ∈ N wobei ± bedeutet, dass die Ziffernfolge entweder positiv ist, also mit + beginnt, oder negativ,557
also mit − beginnt. Der Punkt zwischen z0 und z−1 heißt Dezimalpunkt (oft nimmt man auch ein Komma558
im deutschsprachigen Raum). Eine Ziffernfolge heißt endlich, falls es ein i0 ∈ N gibt, so dass z−i = 0 fur559
alle i ≥ i0. Eine Ziffernfolge heißt periodisch, falls es ein i0 ∈ N und ein k ∈ N gibt, so dass fur alle i ≥ i0560
gilt, dass z−i = z−i−k.561
Hier sind ein paar Beispiele fur Ziffernfolgen
24662111.13466612555555 . . .
0.2460000 . . .
16.1426426426426426426 . . . = 16.1426
Im dritten Beispiel haben wir eine Notation fur Perioden eingefuhrt, die besagt, dass sich die Ziffernfolge562
426 von nun an unendlich oft wiederholt. Das erste und dritte Beispiel oben sind periodisch, das zweite563
endlich (genau gesagt sind endliche Ziffernfolgen nur ein Spezialfall periodischer Ziffernfolgen). Es gibt564
jedoch durchaus Ziffernfolgen, welche weder endlich noch periodisch sind. Ein einfaches Beispiel ware565
0.1010010001000010000010000001 . . .
Das Muster sollte erkennbar sein: die Anzahl der Nullen vor jeder 1 wachst pro Schritt um 1 an. Allerdings566
kann dies nicht als Periode, wie oben definiert, ausgedruckt werden.567
Eine ganze Zahl z kann man als Ziffernfolge der Art z.0000 . . . schreiben. Auch rationale Zahlen kann man568
in Ziffernfolgen umwandeln, mit Hilfe der ublichen Divisionsregel. Zum Beispiel entspricht 97 der Ziffernfolge569
1.285714, wie sich aus der Rechnung in Bild 2.1 ergibt.570
Es gilt im Allgemeinen, dass einer rationalen Zahl auf diese Weise eine periodische Ziffernfolde zugeordnet571
ist (den Beweis lassen wir weg; die Idee ist jedoch, dass sich z.B. bei Division durch 7 nur 6 verschiedene Reste572
2.1. DIE REELLEN ZAHLEN 21
Abbildung 2.1: Rechnung fur die Division 9 : 7.
in der Rechnung moglich sind, und sich das Muster deshalb nach spatestens 6 Durchgangen wiederholen573
muss). Es ist auch moglich, dass die Ziffernfolge einer rationalen Zahl endlich ist (wie gesagt ist das ein574
Spezialfall von periodischen Ziffernfolgen).575
Umgekehrt kann man aus einer endlichen oder periodischen Ziffernfolge auch eine rationale Zahl erzeu-gen. Fur endliche Ziffernfolgen ist das einfach. Wir interpretieren die Ziffernfolge einfach als Dezimalzahlim ublichen Sinn:
3.267 = 3 · 100 + 2 · 10−1 + 6 · 10−2 + 7 · 10−3
= 3 +2
10+
6
100+
7
1000
=3267
1000
Auch fur periodische Ziffernfolgen konnen wir den Bruch mit folgendem Trick bestimmen. Nehmen wir576
x = 6.537723772 . . .
Wie wir sehen, hat die Periode die Lange 4. Wenn wir mit 104 = 10000 multiplizieren, “schieben” wir die577
Periode um eine Periodenlange nach rechts.578
10000x = 65377.237723772 . . .
Wenn wir nun die obere Gleichung von der unteren abziehen, beobachten wir, dass sich die Periode aufhebt,579
und wir haben eine endliche Ziffernfolge. Also ergibt sich580
9999x = 65370.7 =653707
10
und durch Division durch 9999 ergibt sich also581
x =653707
99990
Die reellen Zahlen. Die Grundidee ist, einfach jede Zifferfolge als Zahl zu definieren, und die Menge dieser582
Zahlen die reellen Zahlen zu nennen. Allerdings gibt es noch ein technisches Problem. Es gibt verschiedene583
Ziffernfolgen, die die gleiche rationale Zahl darstellen.584
Sehen wir uns das Beispiel x = 0.389999 . . . an. Mit dem gleichen Trick wie vorher ergibt sich 10x =585
3.899999 . . ., und durch Subtraktion 9x = 3.51 = 351100 , also ist x = 351
900 = 39100 = 0.39. Ebenso kann man586
sehen, dass 0.9 = 1 gilt, denn beide Ziffernfolgen stellen die Zahl 1 dar.587
Wir losen dieses Problem, indem wir die Ziffernfolgen 0.38999 . . . und 0.390000 . . . als gleich (bzw.588
aquivalent) ansehen. Allgemein erachten wir die Ziffernfolge589
zn . . . z0.z−1 . . . z−k999 . . .
mit z−k 6= 9 als gleich der Ziffernfolge590
zn . . . z0.z−1 . . . (z−k + 1)000 . . .
Die Menge aller Ziffernfolgen mit dem gerade besprochenen Sonderfall nennen wir die Menge der reellen591
Zahlen R. Wie oben erwahnt ist Q ( R. Die Menge R \ Q nennen wir die Menge der irrationalen Zahlen.592
Wir nennen eine reelle Zahl endlich, wenn sie durch eine endliche Ziffernfolge dargestellt werden kann.593
Wie addieren wir zwei reelle Zahlen? Wenn die beiden Zahlen endlich sind, konnen wir einfach die594
bekannte Schuladdition durchfuhren. Wenn beide Zahlen periodisch sind, wird auch die Summe periodisch595
22 KAPITEL 2. ANALYSIS, TEIL I
(oder wir wandeln die Zahlen in Bruche um und addieren die Bruche). Aber was, wenn mindestens eine der596
Zahlen irrational ist? Z.B.597
x = 0.909009000900009 . . .+ 0.365365365365 . . .
Die Idee ist folgende: Wir bilden eine Sequenz von Summen der Zahlen, wobei wir beide Summanden ander k-ten Stelle nach dem Punkt abschneiden:
x1 = 0.9 + 0.3 = 1.2
x2 = 0.90 + 0.36 = 1.26
x3 = 0.909 + 0.365 = 1.274
x4 = 1.2743
x5 = 1.27436
. . .
In diesem Prozess bleiben immer mehr Nachkommastellen der Summe unverandert (es ist muhsam,598
das formal zu beweisen). Damit liefert dieser Prozess eine eindeutige Ziffernfolge, welche die Summe der599
Zahlen darstellt. Fur Multiplikation, Subtraktion und Division gelten analoge Aussagen. Wir erwahnen600
einige wichtige Gesetze der Addition und Multiplikation in R, die Sie alle aus der Schule kennen sollten. Die601
Beweise lassen wir weg.602
Kommutativgesetz x+ y = y + x, xy = yx fur x, y ∈ R.603
Assoziativgesetz (x+ y) + z = x+ (y + z), (xy)z = x(yz) fur x, y ∈ R.604
Neutrales Element x+ 0 = x, x · 1 = x fur x ∈ R.605
Inverses Element der Addition Fur x ∈ R gibt es genau ein (−x) ∈ R mit x+ (−x) = 0.606
Inverses Element der Multiplikation Fur x ∈ R \ {0} gibt es genau ein 1x ∈ R mit x · 1
x = 1.607
Distributivgesetz x(y + z) = xy + xz fur x, y, z ∈ R.608
Multiplikation mit 0 x · 0 = 0 fur x ∈ R.609
Produktregel xy = 0 genau dann, wenn x = 0 oder y = 0.610
Wie vergleicht man reelle Zahlen? Wir sagen, dass x < y, wenn x 6= y und zusatzlich eine der folgenden611
Aussagen wahr ist:612
• x hat negatives und y positives Vorzeichen.613
• x und y haben beide positive Vorzeichen, und die erste Ziffer von links, in der sich x und y un-614
terscheiden, ist großer fur y. (z.B. ist 0.1257933 < 0.1258222, denn in der vierten Nachkommastelle615
unterscheiden sich die Zahlen zum ersten Mal, und 7 < 8).616
• x und y haben beide negatives Vorzeichen und (−y) < (−x).617
Fur zwei reelle Zahlen x, y gilt immer genau einer der drei folgenden Falle: x = y, x < y, oder y < x.618
Wir nennen Zahlen x > 0 positive Zahlen und x < 0 negative Zahlen. Sind x, y positive Zahlen, so gilt auch619
x+y > 0 und xy > 0. Daraus folgt, dass das Produkt zweier negativer Zahlen positiv ist, denn sind x, y < 0,620
so ist621
x · y = (−1) · (−1) · x · y = (−x) · (−y) > 0
Wir schreiben, wie ublich, x ≤ y, wenn x < y oder x = y.622
2.1. DIE REELLEN ZAHLEN 23
Betrage und Dreiecksungleichung. Fur x ∈ R schreiben wir623
|x| :=
{x x ≥ 0
−x x < 0
fur den (Absolut)betrag von x. Es gilt |x| ≥ 0 fur alle x und |x| = 0 genau dann, wenn x = 0. Der Abstand624
von x und y ist definiert als |x− y| (= |y − x|).625
Theorem 2.4 (Dreiecksungleichung). Fur alle reellen Zahlen x, y, z gilt:626
|x− z| ≤ |x− y|+ |y − z|
Der Name “Dreiecksungleichung” stammt aus der Anschauung dass eine Dreiecksseite kurzer ist als die627
Summe der anderen beiden. Hier reden wir jedoch nicht uber Punkte im Raum, sondern nur uber reelle628
Zahlen.629
Wir beweisen die Dreiecksungleichung mit Hilfe einer Fallunterscheidung. Das heißt, wir gehen verschie-630
dene Moglichkeiten fur x, y, z durch und beweisen die Aussage fur jede dieser Moglichkeiten. Ein solcher631
Beweis ist nur dann korrekt, wenn die besprochenen Moglichkeiten wirklich alle moglichen Falle abdecken.632
Beweis. Zunachst nehmen wir an, dass x > z, also |x − z| = x − z. Wir betrachten nun 3 Falle fur die633
Position von y:634
• Ist y ≥ x, dann ist auch y − z ≥ x− z. Also635
|x− z| = x− z ≤ y − z = |y − z| ≤ |x− y|︸ ︷︷ ︸≥0
+|y − z|
also ergibt sich die Dreiecksungleichung von links nach rechts gelesen.636
• Ist y ≤ z, dann ist −z ≤ −y. Also637
|x− z| = x− z ≤ x− y = |x− y| ≤ |x− y|+ |y − z|
• Ist x ≤ y ≤ z, dann ist638
|x− z| = x− z = x− y + y − z = (x− y) + (x− z) = |x− y|+ |x− z|
Dies sind die einzigen moglichen Falle. Also ist die Dreiecksungleichung bewiesen unter der Annahme, dass639
x > z gilt. Ist z < x, dann konnen wir den genau gleichen Beweis verwenden, indem wir einfach x und z640
vertauschen. Ist x = z, dann ist |x− z| = 0, und die rechte Seite ist (als Summe zweier Abstande) auf jeden641
Fall auch ≥ 0. Also stimmt die Ungleichung in allen Fallen.642
643
Hausaufgabe 2.1.1. Weisen Sie Kommutativgesetz, Assoziativgesetz und Distributivgesetz fur Addition644
und Multiplikation von rationalen Zahlen nach, unter der Annahme, dass diese Gesetze fur die ganzen645
Zahlen gelten.646
Hausaufgabe 2.1.2. Zeigen Sie, dass es keine rationale Zahl q gibt, so dass q2 = 3 gilt.647
Hausaufgabe 2.1.3. Fuhren Sie das Verfahren von oben durch, um einen Bruch fur die Zahl 1.285714 zu648
erhalten. Kurzen Sie den Bruch danach vollstandig. Warum ist das Ergebnis zu erwarten?649
Hausaufgabe 2.1.4. Eine reelle Zahl heißt normal, wenn sich jede beliebige endliche Ziffernfolge an ir-650
gendeiner Stelle in der Zahl finden lasst. Es ist nicht bekannt, ob die Kreiszahl π normal ist. (Sie konnen651
aber nach Ihrem Geburtstag in π suchen; schauen Sie unter http: // mypiday. com/ nach.)652
Wir vereinfachen das Problem etwas: wir nennen eine Zahl (0, 1)-normal, wenn jede Zifferfolge, die nur653
aus Nullen und Einsen besteht, irgendwann in der Zahl auftaucht.654
24 KAPITEL 2. ANALYSIS, TEIL I
a. Argumentieren Sie, dass keine rationale Zahl (0, 1)-normal ist.655
b. Argumentieren Sie, dass die Zahl656
0.101001000100001000001 . . .
nicht (0, 1)-normal ist.657
c. Erklaren Sie, wie Sie eine (0, 1)-normale Zahl konstruieren konnen.658
Ihre Erklarungen brauchen nicht allzu formal zu sein. Es geht eher darum, uber das Problem nachzudenken.659
Hausaufgabe 2.1.5. Beweisen Sie: Zwischen zwei reellen Zahlen x 6= y liegen unendlich viele rationale660
Zahlen.661
Hausaufgabe 2.1.6. Beweisen Sie, dass fur eine reelle Zahl x gilt: x2 ≥ 0, und x2 = 0 genau dann, wenn662
x = 0.663
2.2 Intervalle und beschrankte Mengen664
Fur a, b ∈ R ist
[a, b] := {x ∈ R | a ≤ x ≤ b}(a, b) := {x ∈ R | a < x < b}(a, b] := {x ∈ R | a < x ≤ b}[a, b) := {x ∈ R | a ≤ x < b}.
Wir nennen diese Mengen Intervalle und sprechen (von oben nach unten) von geschlossenen, offenenund halb-offenen Intervallen. Wir definieren auch
(−∞, b] := {x ∈ R | x ≤ b}(−∞, b) := {x ∈ R | x < b}
[a,∞) := {x ∈ R | a ≤ x}(a,∞) := {x ∈ R | a < x}.
Das Symbol∞ steht fur “unendlich”. Wir legen fest, dass x <∞ und x > −∞ fur jede reelle Zahl x. Jedoch665
ist ∞ /∈ R!666
Sei nun M ⊆ R beliebig.667
• Wir nennen a ∈ R eine untere Schranke von M , falls gilt: ∀x ∈M : a ≤ x. Gibt es eine untere Schranke668
von M , dann nennen wir M nach unten beschrankt.669
• Wir nennen b ∈ R eine obere Schranke vom M , falls gilt: ∀x ∈M : x ≤ b. Gibt es eine obere Schranke670
von M , dann nennen wir M nach oben beschrankt.671
• M heißt beschrankt, wenn es nach unten und nach oben beschrankt ist.672
N ⊂ R nach unten beschrankt durch 0 (aber auch z.B. −5 oder − 73 sind untere Schranken). N ist jedoch673
nicht nach oben beschrankt. Z ⊂ R ist weder nach unten noch nach oben beschrankt. Ein Intervall (a, b)674
mit a, b ∈ R ist eine beschrankte Menge.675
Wie wir uns leicht uberlegen konnen, hat eine nach unten (oben) beschrankte Menge viele untere (obere)676
Schranken. Wir wollen uns nun die “beste” (scharfste) untere (obere) Schranke definieren.677
Definition 2.5. Sei M ⊆ R. Wir nennen a ∈ R ein Infimum von M , falls a eine untere Schranke ist, und678
ausserdem gilt: Jede untere Schranke a′ von M erfullt a′ ≤ a. Ist ein Infimum a selbst Teil der Menge M ,679
dann heißt es ein Minimum von M . Wir nennen b ∈ R ein Supremum von M , falls b eine obere Schranke680
ist und jede obere Schranke b′ von M b ≤ b′ erfullt. Ist ein Supremum b in M enthalten, so heißt es ein681
Maximum von M .682
2.2. INTERVALLE UND BESCHRANKTE MENGEN 25
Ein Infimum ist also eine “großte untere Schranke”, und ein Supremum eine “kleinste obere Schranke”.683
Lemma 2.6. Eine Menge hat hochstens ein Infimum und hochstens ein Supremum.684
Wir verwenden die folgende Beweistechnik, um die Eindeutigkeit einer Zahl mit einer gewissen Eigen-685
schaft zu zeigen. Wir nehmen zwei Zahlen mit der Eigenschaft an und beweisen, dass diese beiden Zahlen686
gleich sein mussen.687
Beweis. Seien a1, a2 beliebige Infima von M . Insbesondere sind a1 und a2 untere Schranken von M . Da a1688
Infimum und a2 untere Schranke ist, gilt also a2 ≤ a1. Da a2 Infimum und a1 untere Schranke, gilt auch689
a1 ≤ a2. Dies ist nur moglich, wenn a1 = a2 gilt. Fur Suprema geht man genauso vor.690
Das Lemma erlaubt es uns, von dem Infimum/Supremum, und auch dem Minimum/Maximum einer691
Menge zu sprechen. Schauen wir uns Beispiele an:692
• Z hat weder ein Infimum noch ein Supremum, da es weder nach unten noch nach oben beschrankt693
ist. Allgemeiner hat eine nach unten unbeschrankte Menge kein Infimum, und eine nach oben unbe-694
schrankte Menge kein Supremum (uberlegen Sie sich warum).695
• Ein Intervall der Form (a, b] mit a, b ∈ R hat das Infimum a und das Supremum/Maximum b. a ist696
jedoch kein Minimum von (a, b].697
• M = {1, 12 ,
13 ,
14 , . . .} hat 1 als Supremum und 0 als Infimum. Ferner ist 1 ein Maximum, da es in M698
enthalten ist. M hat jedoch kein Minimum, da 0 /∈M .699
Theorem 2.7 (Vollstandigkeitssatz). Eine nach unten beschrankte, nicht-leere Teilmenge von R hat ein700
Infimum. Eine nach oben beschrankte, nicht-leere Teilmenge von R hat ein Supremum.701
Der Satz mag aus der Anschauung heraus recht einleuchtend sein: wenn es irgendeine untere Schranke702
gibt, sollte es auch eine großte untere Schranke geben. Dass der Fall nicht so klar ist, verdeutlicht der703
folgende Umstand: hatten wir Infimum/Supremum uber Teilmengen von Q definiert, ist die Aussage des704
Satzes falsch. Der Beweis muss also auf die Definition der reelllen Zahlen zuruckgreifen.705
Beweis. Wir konzentieren uns auf den Infimum-Fall; der Supremum-Fall geht genauso.706
Nach Annahme ist M nach unten beschrankt. Also gibt es auch (mindestens) eine ganze Zahl, die untere707
Schranke von M ist. Sei z die großte ganze Zahl, die untere Schranke von M ist. Also ist z untere Schranke,708
aber z + 1 keine untere Schranke. Nun sei b1 ∈ {0, . . . , 9} so definiert, dass z.b1 immer noch eine untere709
Schranke von M ist, aber z.b1 + 0.1 nicht (ein solches b1 muss es geben, denn z ist untere Schranke, aber710
z.9 + 0.1 = z + 1 nicht). Nun sei b2 so definiert, dass z.b1b2 untere Schranke ist, aber z.b1b2 + 0.01 nicht.711
Wir konnen dieses Verfahren beliebig oft wiederholen und erhalten eine Ziffernfolge z.b1b2b3 . . ., welche eine712
reelle Zahl a definiert.713
Nun argumentieren wir, dass a eine untere Schranke ist: Angenommen, a ist keine untere Schranke714
(Beweis durch Widerspruch). Dann gibt es ein x ∈M mit x < a. Das bedeutet, es gibt ein i, so dass sich x715
und a in der i-ten Stelle nach dem Punkt unterscheiden. Sei ai die Zahl, die wir erhalten, wenn wir a nach716
der i-ten Stelle abschneiden. Es gilt dann auch x < ai. Nach Konstruktion oben ist ai = z.b1b2 . . . bi, und717
wir haben bi so gewahlt, dass ai eine untere Schranke ist. Dann ist aber ai ≤ x, was x < ai widerspricht.718
Zuletzt argumentieren wir, dass a das Infimum von M ist. Sei a′ 6= a irgendeine andere untere Schranke.719
Dann unterscheiden sich a und a′ in irgendeiner Ziffer, sagen wir in der i-ten Stelle nach dem Punkt.720
Wiederum bezeichnen wir mit ai und a′i die abgeschnittenen Versionen von a und a′. Es gilt dann ai =721
z.b1 . . . bi−1bi und a′i = z.b1 . . . bi−1b′i mit bi 6= b′i. Da a′i ≤ a′, ist a′i ebenfalls eine untere Schranke von M .722
Nach Konstruktion von a kann also bi nicht kleiner als b′i sein (denn dann hatten wir ja b′i als nachste Ziffer723
gewahlt). Also ist b′i < bi und damit a′ < a. Dies beweist die Infimumseigenschaft.724
Als Beispiel betrachten wir die Menge725
M := {x ∈ Q | x > 0, x2 ≥ 2}Diese Menge ist nach unten beschrankt (z.B. durch 0). Wir fuhren die Konstruktion aus dem Beweis726
durch:727
26 KAPITEL 2. ANALYSIS, TEIL I
• z = 1, denn 12 < 2, 22 > 2728
• a1 = 1.4, denn 1.42 < 2, 1.52 > 2729
• a2 = 1.41, denn 1.412 < 2, 1.422 > 2730
• a3 = 1.414, denn 1.4142 < 2, 1.4152 > 2731
• a4 = 1.4142, . . .732
Mit ein bisschen mehr Arbeit kann man zeigen, dass das Infimum der Menge in der Tat x2 = 2 erfullt. Wir733
konnen auf diese Weise also zeigen, dass√
2 in R liegt.734
Im folgenden schreiben wir inf(M) fur das Infimum von M . Wir setzten inf(M) = −∞, falls M nicht nach735
unten beschrankt ist. Genauso schreiben wir sup(M) fur das Supremum von M und setzten sup(M) = ∞736
fur nach oben unbeschrankte Mengen.737
738
Hausaufgabe 2.2.1. Beantworten Sie die folgenden Fragen (mit Begrundung):739
a. Gibt es eine endliche unbeschrankte Menge?740
b. Gibt es eine endliche Menge, die ein Infimum, aber kein Minimum hat?741
c. Gibt es eine Menge, fur die Infimum und Supremum gleich sind?742
Hausaufgabe 2.2.2. Sind die folgenden Aussagen wahr oder falsch? Begrunden Sie Ihre Antwort.743
a. Hat eine Menge M ein Infimum, dann hat auch jede Teilmenge von M ein Infimum.744
b. Hat eine Menge M ein Minimum, dann hat auch jede Teilmenge von M ein Minimum.745
c. Hat eine Menge M ein Infimum, dann hat sein Komplement R \M ein Supremum.746
d. Es gibt eine beschrankte Menge M , deren Komplement R \M ebenfalls beschrankt ist.747
Hausaufgabe 2.2.3. Sind A ⊆ B nach unten beschrankt, zeigen Sie dass inf(A) ≥ inf(B). Formulieren748
Sie einen analogen Satz fur Suprema.749
Hausaufgabe 2.2.4. Untersuchen Sie die Menge750
(R \ Q) ∩ [0, 1]
auf Beschranktheit. Geben Sie, falls vorhanden, Infimum und Supremum an und stellen Sie fest, ob diese751
Minimum und Maximum sind.752
2.3 Folgen und Konvergenz753
Der Konvergenzbegriff ist zweifellos das grundlegenste Prinzip der Analysis. Alle weiterfuhrenden Konzepte754
wie Stetigkeit, Differenzierbarkeit und Integrierbarkeit bauen auf dem Begriff auf. Insofern ist es mehr als755
verwunderlich, dass das Konzept in Schulen in der Regel nicht behandelt wird.756
Definition 2.8. Als eine Folge von reellen Zahlen bezeichnen wir eine Sequenz757
(a0, a1, a2, . . .)
mit Folgengliedern ai ∈ R. Wir schreiben auch (an)n∈N fur die Folge. Wir erlauben auch Folgen, die uber758
N+ = {1, 2, 3, . . .} indiziert sind.759
2.3. FOLGEN UND KONVERGENZ 27
Wir konnen eine Folge auch als eine Abbildung760
a : N→ R
interpretieren, in der wir ai anstatt a(i) schreiben. Meistens sehen wir Folgen aber einfach als Liste von761
Zahlen an. Beachten Sie, dass eine Folge mehr als die Menge seiner Glieder ist, denn die Reihenfolge der762
Elemente spielt eine Rolle.763
Betrachten wir einige Beispiele fur Folgen764
• an := 1n! , (an)n∈N+ = (1, 1
2 ,16 ,
124 , . . .).765
• bn := n-ste Nachkommastelle von π, (bn)n∈N+ = (1, 4, 1, 5, 9, 3, 2, . . .).766
• Arithmetische Folge: Fur k, d ∈ R setze767
cn := k · n+ d
z.B. k = 2, d = 1: (cn)n∈N = (1, 3, 5, 7, 9, 11, . . .).768
• Geometrische Folge: fur q, c ∈ R setze769
dn := c · qn
z.B. q = 12 , c = 1: (dn)n∈N = (1, 1
2 ,14 ,
18 ,
116 , . . .)770
• Im Beispiel aus dem letzten Kapitel haben wir eine Sequenz von Zahlen konstruiert, die sich√
2 immer771
weiter annahern:772
(en)n∈N = (1, 1.4, 1.41, 1.414, 1.4142, . . .).
Auch diese Konstruktion liefert also eine Folge.773
Mit “Konvergenz” wollen wir das Verhalten einer Folge beschreiben, wenn wir den Index (n in den774
Beispielen oben) immer großer werden lassen (wir sagen auch “gegen unendlich laufen lassen”). Anschaulich775
sehen wir, dass an sich immer weiter der Zahl 0 annahert. Das Gleiche gilt fur die Folge dn. Wir wollen also776
sagen, dass diese Folgen “gegen 0 konvergieren”. Genauso haben wir ja bereits besprochen, dass en sich√
2777
immer weitere annaehert, also soll en gegen√
2 konvergieren.778
Die Folge (bn)n∈N verhalt sich anders. Da π irrational ist, springt die Folge immer zwischen den Ziffern779
0 bis 9 umher. Wir konnen hier nicht davon sprechen, dass die Folge gegen einen Wert konvergiert.780
Die Folge (cn)n∈N wachst fur steigende n immer weiter an. Auch hier konnen wir nicht sinnvoll sagen,781
dass die Folge gegen einen reellen Wert konvergiert.782
Wir haben uns also uberlegt, was eine sinnvolle Definition von Konvergenz fur die Beispiele von oben783
ergeben soll. Nun werden wir den Begriff mathematisch definieren.784
Definition 2.9. Eine Folge (an)n∈N konvergiert gegen α ∈ R, falls gilt785
∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : |an − α| < ε.
Wir schreiben dann auch ann→∞−−−−→ α786
Was bedeutet diese Definition? Beachten Sie, dass |an − α| < ε bedeutet, dass an ∈ (α − ε, α + ε). Die787
Definition besagt:”Egal, wie klein ich ein Intervall um α herum festlege: wenn ich in der Folge (an) nur788
weit genug nach rechts gehe, sind alle Folgenglieder ab einer gewissen Stelle in diesem Intervall enthalten.“789
In der Definition legt ε die Grosse des Intervalls fest, und n0 sagt, wie weit man nach rechts gehen muss.790
Wir werden nun einige Folgen formal auf Konvergenz untersuchen.791
• an := 1n konvergiert gegen 0.792
Beweis. Sei ε > 0 beliebig. Wir wahlen n0 ∈ N, so dass n0 · ε > 1 ist. (Egal wie klein ε ist, ein solches n0793
kann man immer finden, z.B. n0 = d 1ε e.) Fur n ≥ n0 gilt dann794
| 1n− 0| = 1
n≤ 1
n0< ε,
wobei die letzte Ungleichung aus n0 · ε > 1 durch Division durch ε folgt.795
28 KAPITEL 2. ANALYSIS, TEIL I
• bn := (b, b, b, . . .) (konstante Folge) konvergiert gegen b.796
Beweis. Fur alle ε > 0 konnen wir n0 = 0 wahlen. Dann ist fur jedes n ∈ N : |bn − b| = |b− b| = 0 < ε.797
• Die Folge798
cn := (−1)n, (1,−1, 1,−1, 1,−1, . . .)
konvergiert gegen kein α ∈ R.799
Beweis. Durch Widerspruch. Angenommen, es gibt ein solches α. Fur ε = 12 gibt es dann ein n0 ∈ N, so800
dass |cn − α| ≤ 12 fur alle n ≥ n0. Nehmen wir an, n0 ist eine gerade Zahl (sonst erhohen wir n0 um eins).801
Dann ist802
2 = |1− (−1)| = |cn0 − cn0+1| = |(cn0 − α) + (α− cn0+1)|∆-Ungl.
≤ |cn0 − α|+ |α− cn0+1| ≤1
2+
1
2= 1
Es ergibt sich also 2 < 1, ein Widerspruch.803
Die Rechnung im letzten Beweis ist typisch fur die Analysis. Man schreibt die Zahl 2 etwas komplizierter804
hin, “schummelt” einen weiteren Term ein und folgert dann einen Widerspruch. Hier gilt wiederum, dass805
man als Leser des Beweises nicht unbedingt verstehen muss, warum der nachste Schritt durchgefuhrt wird.806
Man muss nur nachvollziehen konnen, dass jeder Schritt korrekt ist.807
Theorem 2.10 (Eindeutigkeit). Falls ann→∞−−−−→ α und an
n→∞−−−−→ β, dann ist α = β.808
Beweis. Durch Widerspruch. Angenommen, α 6= β. Dann ist δ := |α− β| > 0. Es gibt dann ein n1 ∈ N, so809
dass |an − α| < δ3 fur alle n ≥ n1. Und es gibt ein n2 ∈ N, so dass |an − β| < δ
3 fur alle n ≥ n2. Nun wahle810
n0 := max{n1, n2}. Fur jedes n ≥ n0 gilt nun811
δ = |α− β| = |(α− an) + (an − β)|∆-Ungl.
≤ |α− an|+ |an − β| ≤δ
3+δ
3=
2
3δ,
also δ < 23δ, ein Widerspruch.812
Definition 2.11. Sei (an)n∈N eine Folge, die gegen α konvergiert. Dann nennen wir α auch den Grenzwert813
der Folge und schreiben814
α = limn→∞
an
Eine Folge mit Grenzwert 0 nennen wir auch Nullfolge. Wir sagen, dass (an)n∈N divergiert, wenn die Folge815
keinen Grenzwert hat.816
Betrachten wir nochmals die divergente Folge (1, 3, 5, 7, . . .) von oben. Diese hat ein anderes Verhalten817
gegen unendlich als z.B. (1,−1, 1,−1, . . .) — wahrend erstere immer weiter wachst, springt letztere immer818
zwischen zwei Werten umher. Die folgende Definition erlaubt es uns, diese beiden Falle zu unterscheiden.819
Definition 2.12. Eine Folge (an)n∈N divergiert nach ∞, wenn gilt:820
∀t > 0 ∃n0 ∈ N : ∀n ≥ n0 : an > t.
Divergenz nach −∞ ist auf analoge Art definiert.821
Anschaulich bedeutet das:”Egal welche Schranke ich nehme, die Folge wird von einem bestimmten822
Zeitpunkt an oberhalb dieser Schranke bleiben“.823
824
Hausaufgabe 2.3.1. Betrachten Sie die folgenden Alternativvorschlage, was Konvergenz gegen a ∈ R825
bedeuten konnte:826
a. ∀ε ≥ 0 ∃n0 ∈ N ∀n ≥ n0 : |an − a| ≤ ε.827
2.4. KONVERGENZKRITERIEN 29
b. ∀n ∈ N : |a− an+1| < |a− an| (”
Die Folge kommt immer naher an a heran.“).828
c. ∀ε > 0 ∃n ∈ N : |an − a| < ε. (”
Egal wie klein ich das Intervall um a wahle, irgendwann liegt ein829
Folgenglied darin.“).830
Uberlegen Sie sich fur jede dieser Definitionen, warum sie nicht mit dem intuitiven Konvergenzbegriff zu-831
sammenpasst.832
Hausaufgabe 2.3.2. Beweisen Sie: Fur jede reelle Zahl x gibt es eine Folge (an)n∈N rationaler Zahlen,833
die gegen x konvergiert.834
Hausaufgabe 2.3.3. Eine Folge (an)n∈N heißt nach oben beschrankt, wenn die Menge {a0, a1, a2, . . .} nach835
oben beschrankt ist. Beweisen Sie, ob folgende Aussage wahr oder falsch ist:”
Eine nach oben unbeschrankte836
Folge divergiert nach +∞.“837
2.4 Konvergenzkriterien838
Die Konvergenz einer Folge mit Hilfe der Definition nachzuweisen ist ein recht muhsames Unterfangen. Wir839
werden nun einige Satze kennenlernen, die es erheblich erleichtern, das Konvergenzverhalten einer Folge zu840
bestimmen.841
Zunachst beobachten wir, dass wir aus zwei Folgen (an)n∈N und (bn)n∈N neue Folgen (an + bn)n∈N und842
(an · bn)n∈N konstruieren konnen, indem wir einfach gliedweise addieren/multiplizieren. Ist bn 6= 0 fur alle843
n ∈ N, konnen wir auch die Folge (anbn )n∈N bilden. Der nachste Satz besagt, dass wir den Grenzwert einer844
solchen zusammengesetzten Folge aus den Grenzwerten der Einzelteile ablesen konnen:845
Theorem 2.13. Seien (an)n∈N und (bn)n∈N konvergente Folgen mit ann→∞−−−−→ α und bn
n→∞−−−−→ β. Dann846
gilt847
1. an + bnn→∞−−−−→ α+ β,848
2. an · bnn→∞−−−−→ α · β,849
3. Ist bn 6= 0 fur alle n ∈ N und β 6= 0, anbn
n→∞−−−−→ αβ .850
Der Beweis der ersten Aussage ist sehr ahnlich zu den vorangehenden Beweisen und benutzt die Drei-851
ecksungleichung. Die Beweise der anderen beiden Aussagen sind etwas aufwandiger; wir lassen sie hier weg.852
Als Anwendungsbeispiel betrachten wir das Konvergenzverhalten von853
an :=2n+ 3
2 + n.
Die ersten Folgenglieder sind 53 ,
74 ,
95 ,
116 . Der Grenzwert scheint also 2 zu sein. Das weisen wir jetzt nach.854
Zuerst schreiben wir an um, indem wir Zahler und Nenner durch n dividieren (wir nehmen an, die Folge855
startet bei Index 1):856
an =2n+ 3
2 + n=
2 + 3n
2n + 1
=2 + 3 1
n
1 + 2 1n
.
Das Konvergenzverhalten aller einzelnen Terme ist uns bekannt: Wir wissen, dass 1n gegen 0 konvergiert,857
also konvergiert 3 1n auch gegen 0 (nach vorherigem Theorem, Teil 2). Genauso konvergiert 2 1
n gegen 0. Nach858
Teil 1 des Theorems konvergiert also 2 + 3n gegen 2 + 0 = 2, und 1 + 2
n konvergiert gegen 1 + 0 = 1. Der859
Nenner ist ausserdem niemals gleich 0. Also folgt nach dem dritten Teil des Theorems, dass860
2 + 3 1n
1 + 2 1n
n→∞−−−−→ 2
1= 2.
In Bild 2.2 sehen Sie ein zweites Beispiel. Die Argumentation ist komplett analog, nur etwas kurzer861
notiert.862
Eine Folge (an)n∈N heißt beschrankt, wenn die Menge {a1, a2, a3, . . .} beschrankt ist. Eine Folge heißt863
monoton wachsend (bzw. fallend), wenn fur alle i ∈ N ai ≤ ai+1 (bzw. ai ≥ ai+1) gilt. Eine Folge heißt864
monoton, wenn sie monoton wachsend oder fallend ist.865
30 KAPITEL 2. ANALYSIS, TEIL I
Abbildung 2.2: Berechnung des Grenzwertes fur an = 4n2−3n+57n3−2n+1
Theorem 2.14. Jede konvergente Folge ist beschrankt.866
Beweis. Sei (an)n∈N eine Folge mit Grenzwert α. Es gibt dann ein n0 ∈ N, so dass |an−α| ≤ 1. Also ist die867
Menge {an0, an0+1, an0+2, . . .} im Intervall [α − 1, α + 1] enthalten, und so beschrankt (salopp gesagt: die868
Folge ist beschrankt ab n0). Aber die verbleibenden Folgenglieder {a0, a1, . . . , an0−1} bilden eine endliche869
Menge und endliche Mengen sind beschrankt (das ist leicht zu beweisen, z.B. durch vollstandige Induktion).870
Also ist min{a0, a1, . . . , an0−1, α− 1} eine untere und max{a0, a1, . . . , an0−1, α+ 1} eine obere Schranke fur871
die Folge.872
Ein kleiner Einschub: Gilt eine Aussage der Form:”Wenn A, dann B“, so gilt auch die Kontraposition873
”Wenn nicht B, dann nicht A.“ (Machen Sie sich das an Beispielen klar.) Angewandt auf den Satz oben874
bedeutet das als Folgerung (Korollar):875
Korollar 2.15. Ist eine Folge nicht beschrankt, dann konvergiert sie nicht.876
Also konvergiert zum Beispiel die Folge der Quadratzahlen (1, 4, 9, 16, . . .) nicht.877
Es ist jedoch nicht wahr, dass jede beschrankte Folge konvergiert! Zum Beispiel ist die Folge (−1)n zwar878
beschrankt aber divergent, wie wir vorher gesehen haben. Mit einer zusatzlichen Bedingung konnen wir879
aber Konvergenz nachweisen:880
Theorem 2.16. Jede beschrankte monotone Folge konvergiert.881
Beweis. Wir zeigen die Aussage fur monoton wachsende Folgen (es geht ganz analog fur fallende Folgen).882
Die Folge ist beschrankt, es gibt also eine obere Schranke. Also hat die Menge {a0, a1, . . .} ein Supremum883
s nach Theorem 2.7. Wir zeigen, dass ann→∞−−−−→ s.884
Sei ε > 0. Dann gibt es ein n0 ∈ N, so dass s− an0 = |s− an0 | < ε, denn ware dem nicht so, dann ware885
s − an0 > ε fur alle n0 ∈ N und folglich ware s − ε > an0 fur alle n0 ∈ N. Das wurde aber bedeuten, dass886
s− ε eine obere Schranke ist, was der Definition von s als Supremums widerspricht.887
Nun gilt fur n ≥ n0, dass |s − an| = s − an ≤ s − an0< ε, wobei der zweite Schritt gilt, weil an ≥ an0
888
wegen der Monotonie der Folge, also −an ≤ −an0.889
Zuletzt kommen wir nochmals zuruck auf den Konvergenzbegriff selbst. Statt zu fordern, dass die Folge890
beliebig nah an einen Grenzwert gehen soll, hatten wir auch die folgende Alternative gehabt: wir fordern,891
dass der Abstand zwischen zwei Folgengliedern ab einer gewissen Stelle beliebig klein wird. Wir definieren892
dies formal.893
Definition 2.17. Eine Folge (an)n∈N ist eine Cauchyfolge, wenn gilt894
∀ε > 0 ∃n0 ∀n,m ≥ n0 : |an − am| < ε.
Beachten Sie, dass es nicht reicht, dass sich zwei aufeinanderfolgende Glieder irgendwann hochstens um895
ε unterscheiden! In der Tat gibt es Folgen, die diese Bedingung erfullen, aber keine Cauchyfolgen sind.896
Wenn einer Folge konvergiert, dann ist sie auch eine Cauchyfolge. Das ist nicht schwer einzusehen: wenn897
ab einem gewissen n0 alle Folgenglieder im Intervall [α − ε, α + ε] liegen, dann haben alle diese Glieder898
Abstand hochstens 2ε. Wir schreiben diese Idee als Beweis:899
Lemma 2.18. Konvergente Folgen sind Cauchyfolgen.900
Beweis. Sei α = limn→∞ an und ε > 0. Es gibt ein n0 ∈ N so dass |an − α| < ε2 fur alle n ≥ n0. Fur alle901
n,m ≥ n0 gilt dann902
|an − am| = |(an − α) + (α− am)| ≤ |an − α|+ |α− am| ≤ε
2+ε
2= ε
903
2.4. KONVERGENZKRITERIEN 31
Es gilt auch die Ruckrichtung. Der Beweis ist etwas aufwandiger. Wir geben ihn hier dennoch der904
Vollstandigkeit halber an.905
Lemma 2.19. Jede Cauchyfolge konvergiert.906
Beweis. Sei (an)n∈N eine Cauchyfolge. Wir uberlegen uns erst, dass Cauchyfolgen beschrankt sind: Sei n0907
so, dass |an−am| < 1 fur alle n,m ≥ n0. Das bedeutet auch, dass |an−an0| < 1, also an ∈ [an0
−1, an0+ 1]908
fur alle n ≥ n0. Also ist die Folge beschrankt ab n0, und wie im Beweis von Theorem 2.14 folgt, dass die909
Folge insgesamt beschrankt ist.910
Wir basteln uns nun zwei Folgen (bk)k∈N und (ck)k∈N (wir nehmen k statt n der besseren Lesbarkeit911
halber) wie folgt: Fur jedes k ∈ N gibt es ein n0, so dass fur alle n,m ≥ n0 gilt: |an − am| < 1k . Wir setzen912
bk als das Infimum und ck als das Supremum der Menge Ak := {an0, an0+1, . . .}. Wir sehen nun: (bk)k∈N913
ist beschrankt (da die Folge beschrankt ist) und monoton wachsend (denn Ak ⊇ Ak+1, also inf(Ak) ≤914
inf(Ak+1)). Also konvergiert die Folge (bn)n∈N gegen einen Grenzwert β. Ebenso konvergiert (cn)n∈N gegen915
einen Grenzwert γ. Da bk ≤ ck fur alle k, ist auch β ≤ γ.916
Wir wollen nun zeigen, dass β = γ ist. Angenommen, dies ist nicht so. Setze δ := γ − β > 0. Fur jedes917
beliebige n0 finden wir nun ein k0 ∈ N, so dass fur alle k ≥ k0 gilt918
Ak ⊆ {an0 , an0+1, . . .}.
Wir konnen uns insbesondere ein k ≥ k0 wahlen, so dass zusatzlich |bk − β| ≤ δ5 gilt.919
In Ak gibt es ein Element an1mit n1 ≥ n0 so dass |an1
− inf(Ak)︸ ︷︷ ︸bk
| ≤ δ5 – ware dem nicht so, dann ware920
bk nicht das Infimum. Also ist nach Dreieckungleichung921
|an1 − β| ≤ |an1 − bk|+ |bk − β| ≤2δ
5.
Wir finden vollig analog einen Index n2 ≤ n0, so dass |an2−γ| ≤ 2δ
5 . Da der Abstand von β und γ gleich922
δ ist, folgt daraus, dass an1und an2
Abstand mindestens δ5 haben. Wir haben also gezeigt:923
∃ε > 0 ∀n0 ∈ N ∃n1, n2 ≥ n0 : |an1− an2
| ≥ ε
(hier ist ε = δ5 ). Das bedeutet, dass (an)n∈N keine Cauchyfolge ist, ein Widerspruch. Also ist β = γ.924
Nun zeigen wir, dass (an)n∈N gegen β konvergiert. Sei ε > 0. Es existiert ein k, so dass gilt, dass |bk−β| <925
ε2 und |ck−β| < ε
2 (die zweite Ungleichung nutzt aus, dass β = γ). Damit ist nach Dreiecksungleichung auch926
|bk − ck| ≤ ε. Fur n ≥ n0 gilt nun sowohl an ∈ [bk, ck] als auch β ∈ [bk, ck], also ist |an − β| ≤ |ck − bk| ≤ ε927
und wir haben Konvergenz bewiesen.928
Wir haben also zwei aquivalente Definitionen von Konvergenz. Die ursprungliche Definition und die einer929
Cauchyfolge. Die Cauchybedingung hat den Vorteil, dass die Definition ohne Einfuhrung eines Grenzwer-930
tes auskommt. Man kann daher manchmal einfacher zeigen, dass eine Folge eine Cauchyfolge ist, als die931
Konvergenz direkt zu zeigen (z.B. weil der Grenzwert nicht bekannt ist).932
Mit Hilfe von Cauchyfolgen kann man auch die reellen Zahlen definieren. Wir skizzieren dies kurz:933
Vergessen wir unsere Definition der reellen Zahlen als Ziffernfolgen fur einen Augenblick. Wir definieren eine934
Q-Folge (q0, q1, . . .) als Sequenz von rationalen Zahlen. Wir konnen nun Cauchyfolgen uber Q betrachten.935
Auch Konvergenz konnen wir definieren, wobei wir fordern, dass der Grenzwert in Q liegen muss.936
Nun definieren wir eine Relation auf der Menge aller Cauchyfolgen uber Q:937
(pn)n∈N ∼ (qn)n∈N wenn die Q-Folge (pn − qn)n∈N eine Nullfolge ist.
Man kann zeigen, dass dies eine Aquivalenzrelation ist. Nun definiert man R als die Menge der Aquivalenz-938
klassen dieser Relation. Diese Definition ist weniger anschaulich als die Definition uber Ziffernfolgen, aber939
viele Eigenschaften der reellen Zahlen folgen damit recht einfach. Zum Beispiel ist die Addition zweier Zahlen940
nun einfach zu definieren, als die Summe der entsprechenden Cauchyfolgen (wobei die Summe ebenfalls eine941
Cauchyfolge ist).942
943
32 KAPITEL 2. ANALYSIS, TEIL I
Hausaufgabe 2.4.1. Sein (an)n∈N eine Folge und I eine endliche Teilmenge von N (z.B. I = {1, 2, 5, 7, 102,944
5034}). Betrachten Sie die Folge (bn)n∈N, die definiert ist als945
bn =
{0 n ∈ Ian n /∈ I
a. Wie hangt das Konvergenzverhalten von (bn)n∈N vom Konvergenzverhalten von (an)n∈N ab?946
b. Versuchen Sie, Ihre Beobachtung als allgemeines Theorem zu formulieren.947
c. Beweisen Sie das Theorem.948
Hausaufgabe 2.4.2. Beweisen Sie, ob die folgende Aussage wahr oder falsch ist:”
Ist eine Folge monoton949
wachsend und nach oben beschrankt, dann ist sie auch beschrankt.“950
Hausaufgabe 2.4.3. Wir nennen eine Folge schließlich-monoton, wenn es ein n0 ∈ N gibt, so dass die951
Folge ab der Stelle n0 monoton ist.952
a. Sind monotone Folgen immer auch schließlich-monoton? Gilt auch die Ruckrichtung?953
b. Zeigen Sie, dass Theorem 2.16 wahr bleibt, wenn die Folge schließlich-monoton ist.954
Hausaufgabe 2.4.4. Kurzlich wurde der Marathon-Weltrekord von Eliud Kipchoge auf 2 : 01 : 39 Stunden955
verbessert. Eine oft gestellte Frage ist, welche Zeit fur einen Menschen erreichbar ist.956
Zeigen Sie, dass eine Grenze existieren muss. Sei (an)n∈N die Weltrekordzeit fur einen Marathon am957
Ende des Jahres n in Sekunden (also a2018 = 7299, es sei denn, jemand lauft bis Ende des Jahres noch958
schneller). Beweisen Sie, dass die Folge (an)n∈N konvergiert.959
Hausaufgabe 2.4.5. Zeigen Sie, dass die Relation ∼ auf Cauchyfolgen uber Q wie oben definiert wirklich960
eine Aquivalenzrelation ist.961
2.5 Reihen962
Wir betrachten nun einen wichtigen Spezialfall von Folgen, bei dem wir Folgenglieder aufsummieren. Erin-963
nern Sie sich an das Summensymbol964
k∑n=1
an = a1 + a2 + . . .+ ak.
Es gelten die folgenden Rechenregeln965
k∑n=1
λ · an = λ
k∑n=1
an
k∑n=1
(an + bn) =
k∑n=1
an +
k∑n=1
bn
wie man sich sehr leicht uberlegt. Oft mochte man eine geschlossene Formel fur eine Summe herleiten, also966
eine aquivalente Beschreibung ohne Summenzeichen. Das bekannteste Beispiel fur eine solche Formel ist967
k∑n=0
n =k(k + 1)
2.
Wir haben diese Formel bereits in Theorem 1.8 mit vollstandiger Induktion bewiesen (wir mussen nur beide968
Seiten durch 2 teilen).969
Ein anderes Beispiel ist die geometrische Reihe:970
2.5. REIHEN 33
Lemma 2.20. Sei q 6= 1. Dann gilt971
k∑n=0
qn =1− qk+1
1− q
Dies kann man mit vollstandiger Induktion beweisen (wenn Sie Induktionsbeweise uben wollen, ist das972
eine gute Gelegenheit). Wir beweisen es auf eine etwas elegantere Art (erinnern Sie sich, dass es fur eine973
Aussage mehrere Beweise geben kann).974
Beweis. Wir schreiben sk = q0 + q1 + . . .+ qk. Dann ist q · · ·k = q1 + q2 + . . .+ qk+1. Also975
sk − q · sk︸ ︷︷ ︸(1−q)sk
= q0 − qk+1,
und Division durch (1− q) auf beiden Seiten gibt das Ergebnis, da q0 = 1 gilt.976
Die Summen waren bislang alle endlich. Wir interessieren uns nun fur “unendliche Summen”, also Sum-977
men, die aus unendlich vielen Summanden bestehen. Die formale Definition folgt978
Definition 2.21. Gegeben eine Folge (an)n∈N, definiere die k-te Partialsumme als979
sk :=
k∑n=0
an.
Die entsprechende Reihe ist dann einfach die Folge der Partialsummen (sk)k∈N. Falls diese Reihe konver-980
giert, also limk→∞ sk = α, so schreiben wir auch981
α =
∞∑n=0
an.
Wir schreiben auch∑∞n=0 an =∞, falls (sk)k∈N nach ∞ divergiert.982
Es ist auch ublich, die Reihe selbst mit∑∞n=0 an zu bezeichnen. Dies ist ein wenig unsauber, aber983
erleichtert erheblich die Notation.984
Wir besprechen eine konkrete Anwendung, namlich das Paradoxon von Zenon. Stellen Sie sich vor,985
Achilles (ein Held der griechischen Mythologie und sozusagen ein Usain Bolt seiner Zeit) veranstaltet ein986
Wettrennen gegen eine Schildkrote. Er gewahrt der Schildkrote einen Vorsprung von einem Meter. Die987
Rennstrecke ist z.B. 100 Meter lang (spielt keine Rolle).988
Zenon argumentiert nun, dass Achilles das Rennen verlieren muss. Den in der Zeit, in der er zum989
Startpunkt der Schildkrote lauft, hat diese ja bereits ein Stuck der Strecke zuruckgelegt. Nun muss Achilles990
erstmal zum aktuellen Standort der Schildkrote laufen, aber in diesr Zeit hat diese wiederum ein Stuck991
zuruckgelegt, usw. Achilles kann die Schildkrote also niemals einholen.992
Eine andere Formulierung besagt, dass man von einer Pistolenkugel nicht getroffen werden kann, solange993
man von ihr weglauft. Diese “Fakten” entsprechen naturlich nicht der realen Welt, also wo ist der Fehler?994
Rechnen wir aus, welchen Vorsprung sich die Schildkrote im Laufe des Rennens herauslauft. Nehmen995
wir der Einfachheit halber an, Achilles lauft einen Meter pro Sekunde (das ist langsam, aber vereinfacht996
die Rechnung), und die Schildkrote lauft q Meter pro Sekunde mit q < 1. Nach einer Sekunde ist Achilles997
am Startpunkt der Schildkrote, und sie ist um q Meter nach vorne gekommen. Um q Meter zuruckzulegen,998
braucht Achilles q Sekunden. In dieser Zeit hat die Schildkrote q2 Meter zuruckgelegt. Im nachsten Schritt999
legt sie q3 Meter zuruck, und so weiter. Insgesamt betragt ihr gesammelter Vorsprung also genau 1 + q +1000
q2 + . . . =∑∞n=0 q
n. Die Argumentation von Zenon nimmt an, dass diese Reihe nach ∞ divergiert.1001
Schauen wir uns den Grenzwert an. Dank Lemma 2.20 wissen wir bereits, dass1002
k∑n=0
qn =1− qk+1
1− q
34 KAPITEL 2. ANALYSIS, TEIL I
und daher1003
∞∑n=0
qn = limk→∞
k∑n=0
qn = limk→∞
1−
→0︷︸︸︷qk+1
1− q=
1
1− q
Also wird die Schildkrote nach 11−q Metern eingeholt. Machen Sie sich klar, dass dies sinnvoll ist, indem1004
Sie fur q sehr kleine Werte und Werte nahe bei 1 einsetzen.1005
Eine weitere Reihe, die sehr haufig auftaucht ist die harmonische Reihe1006
∞∑n=1
1
n= 1 +
1
2+
1
3+ . . .
Gilt hier ebenfalls, dass die Reihe einen endlichen Grenzwert hat? Wie sich herausstellt, ist die Antwortnein. Die Idee ist wie folgt
∞∑n=0
1
n= 1 +
1
2+
1
3+
1
4︸ ︷︷ ︸+1
5+
1
6+
1
7+
1
8︸ ︷︷ ︸+1
9+· · ·+ 1
16︸ ︷︷ ︸+1
17+· · ·+ 1
32︸ ︷︷ ︸+ . . .
≥ 1 +1
2+
1
4+
1
4︸ ︷︷ ︸12
+1
8+
1
8+
1
8+
1
8︸ ︷︷ ︸12
+1
16+· · ·+ 1
16︸ ︷︷ ︸12
+1
32+· · ·+ 1
32︸ ︷︷ ︸12
+ . . .
und wir sehen, dass wir unendlich viele Summanden der Große 12 erzeugen, also ist die Reihe nicht be-1007
schrankt.1008
Dagegen gilt∑∞n=1
1n2 <∞, und der Grenzwert ist recht erstaunlich (siehe Hausaufgabe 2.5.3).1009
Konvergenzkriteiren fur Reihen. Wie sieht man einer Reihe an, ob sie konvergiert oder nicht? Dafur1010
gibt es einige interessante Kriterien. Da Reihen aber im weiteren Verlauf nicht wirklich im Fokus stehen1011
werden, beschranken wir uns hier nur auf zwei dieser Kriterien.1012
Theorem 2.22. Wenn die Reihe∑∞n=0 an konvergiert, dann ist (an)n∈N eine Nullfolge.1013
Die Wichtigkeit des Beweises liegt wiederum in der Kontraposition: Wenn (an)n∈N nicht gegen 0 kon-1014
vergiert, dann divergiert die Reihe. Also kann man mit Hilfe des Theorem Nicht-Konvergenz zeigen. Als1015
Beispiel ist die Reihe∑∞n=0(−1)n divergent, denn ((−1)n)n∈N ist keine Nullfolge.1016
Beweis. Sei ε > 0. Setze1017
sk :=
k∑n=0
an.
Nach Voraussetzung konvergiert die Folge (sk)k∈N. Also ist die Folge auch eine Cauchyfolge. Also gibt es1018
ein k0 so dass fur alle k, ` ≥ k0 gilt1019
|s` − sk| < ε.
Das gilt dann insbesondere auch, wenn wir ` = k + 1 setzen. Setzen wir die Definition von sn ein, ergibt1020
sich fur alle k ≥ k01021
ε > |sk+1 − sk| =k+1∑n=0
an −k∑
n=0
an = ak+1 = |ak+1 − 0|
und das bedeutet, dass limk→∞ ak = 0.1022
Die Umkehrung des Satzes gilt nicht: Ist (an)n∈N eine Nullfolge heißt das nicht, dass∑∞n=0 an konvergiert.1023
Ein Gegenbeispiel ist an = 1n , wie wir oben gesehen haben.1024
Wir besprechen noch ein weiteres Kriterium, mit welchem man in vielen Fallen Konvergenz der Reihe1025
nachweisen kann.1026
2.5. REIHEN 35
Theorem 2.23 (Quotientenkriterium). Sei (an)n∈N eine Folge. Wenn es ein q < 1 und ein n0 ∈ N gibt,1027
so dass fur alle n ≥ n0 gilt1028 ∣∣∣∣an+1
an
∣∣∣∣ < q,
dann konvergiert∑∞n=0 an.1029
Beachten Sie: Die Aussage:”Es gibt ein q < 1, so dass bn < q fur alle n ≥ n0.“ ist starker als zu sagen:1030
”bn < 1 fur alle n ≥ n0.“. Es bedeutet namlich, dass bn (ab der Stelle n0) einen Abstand 1− q von 1 hat. In1031
der Tat wird die Aussage des Satzes falsch, wenn wir nur∣∣∣ anan+1
∣∣∣ < 1 fordern, wie man an der harmonischen1032
Reihe sieht.1033
Beweis. Wir setzen wiederum1034
sk :=
k∑n=0
an
und zeigen, dass (sk)k∈N eine Cauchyfolge ist (und somit auch konvergiert).1035
Sei ε > 0 und sei sk :=∑kn=0 an die k-te Partialsumme. Weil q < 1, haben wir qn
n→∞−−−−→ 0. Nun wahlen1036
wir n1 ≥ n0 so, dass fur alle n ≥ n1 gilt:1037
qn <ε
|an0 |(1− q)qn0 (2.1)
Nach Voraussetzung ist |an+1| < q|an| und damit1038
|an+i| < q|an+i−1| < q2|an+i−2| < . . . < qi|an| (2.2)
fur n ≥ n0 und i ≥ 1. Nun weisen wir die Cauchybedingung fur (sn)n∈N nach. Es gilt fur n ≥ m ≥ n1:
|sn − sm| = |am+1 + am+2 + . . .+ an|≤ |am+1|+ |am+2|+ . . .+ |an| (wegen Dreiecksungleichung)
≤ |am+1|+ q|am+1|+ . . .+ qn−m+1|am+1| (wegen (2.2))
= |am+1|(1 + q + q2 + . . .+ qn−(m+1))
< |am+1|∞∑k=0
qk
≤ 1
1− q|am+1|
≤ 1
1− q· qm+1−n0 |an0
| (wegen (2.2))
=|an0 |
(1− q)qn0qm+1 (Umformungen)
≤ |an0|
(1− q)qn0
ε
|an0 |(1− q)qn0 (wegen (2.1), da m+ 1 ≥ n1)
= ε
1039
Beachten Sie, dass das Quotientenkriterium zwar garantiert, dass die Reihe konvergiert, aber nichts uber1040
den Grenzwert der Reihe aussagt. Die Ruckrichtung gilt ausserdem nicht: Es gibt konvergente Reihen, fur1041
die |an+1
an| beliebig nahe an 1 herankommt, zum Beispiel
∑∞n=1
1n2 .1042
Wir schauen uns ein wichtiges Beispiel an. Wir definieren n! := 1 · 2 · . . . · n (gelesen: “n Fakultat”). Wir1043
setzen auch 0! := 1. Nun definiere fur x ∈ R beliebig1044
an :=xn
n!, sk :=
k∑n=0
an = 1 + x+x2
2+x3
6+x4
24+ . . .+
xk
k!
36 KAPITEL 2. ANALYSIS, TEIL I
Fur welche x Konvergiert diese Reihe? Wir rechnen nach1045 ∣∣∣∣an+1
an
∣∣∣∣ =
∣∣∣∣∣∣xn+1
(n+1)!xn
n!
∣∣∣∣∣∣ =
∣∣∣∣ xn+1n!
xn(n+ 1)!
∣∣∣∣ =|x|n+ 1
<1
2
fur n ≥ d2|x|e. Also folgt nach dem Quotientenkriterium, dass die Reihe fur jedes x ∈ R konvergiert. Wir1046
definieren eine Abbildung1047
exp : R→ R, x 7→∞∑n=0
xn
n!
und nennen diese die Exponentialfunktion. Wir nennen1048
e := exp(1) =
∞∑n=0
1
n!
die Eulersche Zahl. Wie man durch numerische Berechnung der Partialsummen sehen kann, ist e ≈ 2.7183.1049
1050
Hausaufgabe 2.5.1. Berechnen Sie eine geschlossene Formel fur die arithmetische Summe1051
k∑n=1
(αn+ β)
mit α, β ∈ R, α ≥ 0 beliebig.1052
Hausaufgabe 2.5.2. Losen Sie das Paradoxon von Zenon wie folgt: Stellen Sie fur Achilles und die Schild-1053
krote Funktionen A(x), S(x) auf, welche die zuruckgelegte Wegstrecke zur Zeit x angeben. Berechnen Sie1054
den Schnittpunkt der beiden Funktionsgraphen.1055
Hausaufgabe 2.5.3. Berechnen Sie fur die die Folge1056
sk :=
√√√√6
k∑n=1
1
n2
einige Folgenglieder mit einem Taschenrechner (etwa bis k = 100 ware gut, oder so weit wie Sie kommen).1057
Was sehen Sie? Leiten Sie daraus eine Vermutung fur den Wert von∑∞n=1
1n2 ab.1058
Hausaufgabe 2.5.4. Beweisen Sie, dass die Reihe1059
∞∑n=1
1
n(n+ 1)
gegen 1 konvergiert. Betrachten Sie dafur die k-te Partialsumme und versuchen Sie, fur diese eine geschlos-1060
sene Formel zu beweisen (es hilft, die ersten paar Partialsummen von Hand nachzurechnen, um eine Idee1061
zu bekommen).1062
Hausaufgabe 2.5.5. Zeigen Sie, dass die Zahl q < 1 im Quotientenkriterium nicht durch q = 1 ersetzt1063
werden kann: Sei (an)n∈N eine Folge. Wenn es ein n0 ∈ N gibt, so dass fur alle n ≥ n0 die Ungleichung1064 ∣∣∣an+1
an
∣∣∣ < 1 gilt, dann muss∑∞n=0 an nicht unbedingt konvergieren.1065
Hausaufgabe 2.5.6. Das Majorantenkriterium lautet:”
Wenn an ≥ bn ≥ 0 fur alle n und∑∞n=1 an1066
konvergiert, dann konvergiert auch∑∞n=1 bn.“1067
Uberlegen Sie sich, wie aus Hausaufgabe 2.5.4 und dem Majorantenkriterium folgt, dass∑∞n=1
1n2 kon-1068
vergiert.1069
2.6. GRENZWERTE VON ABBILDUNGEN 37
Abbildung 2.3: Von links nach rechts:f : R→ R, x 7→ |x|f : R→ R, x 7→ dxef : [0,∞]→ R, x 7→
√x
f : R→ R, x 7→ exp(x)
2.6 Grenzwerte von Abbildungen1070
In der Folge betrachten wir einen beliebigen Definitionsbereich D ⊆ R und eine Abbildung1071
f : D → R
Einige Beispiele fur Abbildungen, die wir im Folgenden betrachten werden, sind in Abbildung 2.3 als1072
Funktionsgraphen angegeben. Wir besprechen noch andere Abbildungen.1073
Ein Polynom p(x) ist ein Ausdruck der Form1074
p(x) = anxn + an−1x
n−1 + . . .+ a1x+ a0
mit a0, . . . , an ∈ R und an 6= 0. Hierbei nennen wir n den Grad des Polynoms und schreiben auch n = deg(p).1075
Ein Polynom definiert eine Abbildung R → R, die wir auch mit p bezeichnen. Fur x0 ∈ R ist p(x0) einfach1076
der Wert, den wir erhalten wenn wir x0 in das Polynom einsetzen.1077
Eine rationale Funktion hat die Form1078
f : D → R, x 7→ p(x)
q(x)
wobei p und q Polynome und D := {x ∈ R | q(x) 6= 0} (q(x) = 0 geht nicht, sonst wurden wir ja durch 01079
teilen). Zum Beispiel ist die rationale Funktion1080
f(x) =x+ 1
x2 − 3x+ 2
definiert fur D = R \ {1, 2}.1081
Es gibt auch Abbildungen, die sich nicht so einfach zeichnen lassen wie die Beispiel oben. Betrachte zum1082
Beispiel die Abbildung1083
f : R→ R, x 7→
{0 x ∈ Q
1 x ∈ R \ Q
Was ist der Graph dieser Funktion?1084
Fur eine Abbildung f : D → R und y = f(x) bezeichnen wir x als das Argument der Funktion und1085
y als den Funktionswert (manchmal nennen wir das Argument auch einfach x-Wert). Wir mochten nun1086
untersuchen, wie sich die Abbildung verhalt, wenn wir das Argument gegen einen bestimmten Wert x01087
laufen lassen (das heisst, das Argument nahert sich diesem x0 immer weiter an). Dabei muss die Funktion1088
nicht zwingend fur x0 definiert sein! Wir definieren dies gleich normal, aber schauen zunachst an, was in1089
Beispielen sinnvoll ware (diese Beispiele sind rein intuitiv zu verstehen, da die Begriffe noch nicht definiert1090
sind):1091
Betrachten wir f(x) = |x| und x0 = 0. Anhand des Funktionsgraphen beobachten wir: die Funktionwerte1092
von f nahern sich 0 an, wenn das Argument gegen 0 geht. Also”geht f(x) gegen 0 fur x gegen 0“.1093
38 KAPITEL 2. ANALYSIS, TEIL I
Im Fall f(x) = dxe und x0 = 2 sehen wir ein anderes Verhalten: Wenn wir uns x0 von links nahern, ist1094
f(x) immer gleich 2 (und geht damit auch gegen 2). Wenn wir aber von rechts kommen, ist f(x) = 3, egal1095
wie nah wir mit dem Argument an x0 heranrucken (solange der Abstand > 0 ist). Hier geht die Funktion1096
also nicht gegen einen eindeutigen Wert fur x gegen 2.1097
Wie erwahnt ist das Konzept auch sinnvoll, wenn x0 nicht in D liegt. Zum Beispiel geht f(x) = 1x2 gegen1098
unendlich fur x gegen x0 = 0, denn der Funktionswert wird immer grosser, je naher wir an x = 0 kommen1099
(egal ob von rechts oder von links).1100
Die Funktion f(x) =√x geht fur x0 = 0, wie wir am Funktionsgraphen sehen konnen. Hier ist zu1101
beachten, dass wir uns x0 nur von rechts annahern konnen, da die Funktion ja links von 0 nicht definiert1102
ist. Wir konnen auch sehen, dass die Frage”Gegen was geht f(x) fur x0 = −1?“ nicht sinnvoll ist, denn wir1103
konnen uns −1 gar nicht annahern, ohne den Definitionsbereich zu verlassen.1104
Wir konnen fur x0 auch +∞ oder −∞ einsetzen. Zum Beispiel ist fur f(x) = 1x klar, dass f(x) gegen 01105
geht wenn x nach +∞ (oder auch −∞) geht.1106
Nach all diesen Vorbetrachtungen geht es nun zur Definition. Zunachst mussen wir definieren, gegen1107
welche x0 eine Abbildung f : D → R sinnvoll laufen kann. Dazu nennen wir x ∈ R einen Beruhrpunkt von1108
D, wenn es eine Folge (an)n∈N mit Folgegliedern in D gibt, die gegen x konvergiert. Wir erlauben auch −∞1109
und +∞ als (uneigentliche) Beruhrpunkte (dann muss es eine Folge in D geben die gegen +∞ bzw. −∞1110
divergiert). Beachten Sie, dass es nur von D abhangt, ob ein Punkt ein Beruhrpunkt ist oder nicht.1111
Jedes x ∈ D ist auch ein Beruhrpunkt von D, denn die konstante Folge x konvergiert gegen x. Hier sind1112
einige andere Beispiele:1113
• D = (−1,+1) \ {0} hat die Beruhrpunkte D ∪ {−1, 0,+1} = [−1,+1]1114
• D = R hat Beruhrpunkte R ∪ {−∞,+∞}1115
• D = Q hat die Beruhrpunkte R ∪ {−∞,+∞}1116
Nun folgt die Definition der Konvergenz fur Funktionen:1117
Definition 2.24. Sei f : D → R und x0 ein Beruhrpunkt von D. Wir schreiben1118
limx→x0
f(x) = c
falls fur jede Folge (an)n∈N mit Folgegliedern in D und limn→∞ an = x0 gilt, dass1119
limn→∞
f(an) = c.
Ist x0 = ±∞, betrachten wir alle Folgen in D die nach x0 divergieren. Auch c = ±∞ ist erlaubt, was1120
bedeutet, dass alle Folgen (f(an))n∈N nach ±∞ divergieren.1121
limx→x0f(x) = c bedeutet anschaulich, dass f gegen c geht wenn x gegen x0 geht: Egal, wie wir uns x01122
annahern (d.h., eine Folge mit Grenzwert x0 definieren), die entsprechenden Funktionswerte (d.h., f(an))1123
sollen immer gegen den gleichen Wert c gehen.1124
Wir schauen uns einige Beispiele an, die belegen, dass die Definition wirklich unsere Anschauung wider-1125
spiegelt:1126
• limx→0 |x| = 0,1127
denn fur jede Nullfolge (an)n∈N ist auch |an| eine Nullfolge.1128
• limx→2dxe existiert nicht,1129
denn z.B. definiert an = 2− 1n und bn = 2 + 1
n zwei Folgen, die beide gegen 2 konvergieren. Nun ist
d2− 1
ne = 2, also lim
n→∞d2− 1
ne = 2
d2 +1
ne = 3, also lim
n→∞d2 +
1
ne = 3
Somit gibt es zwei Folgen (in D), die gegen 2 konvergieren, aber die entsprechenden Folgen der Funktions-1130
werte konvergieren gegen verschiedene Werte.1131
2.6. GRENZWERTE VON ABBILDUNGEN 39
• Fur ein Polynom p(x) = xn + an−1xn−1 + . . .+ a1X + a0 gilt
limx→∞
p(x) = +∞
limx→−∞
p(x) =
{+∞ n gerade
−∞ n ungerade
Den Beweis lassen wir weg, aber man sollte sich diese Tatsache mit Hilfe von Beispielen klarmachen (z.B.1132
f(x) = x2, g(x) = x3).1133
• limx→0 exp(x) = 1.1134
Beweis. Erinnern Sie sich, dass exp(x) =∑∞n=0
xn
n! . Es ist aus der Definition klar, dass exp(0) = 1 gilt. Aus1135
dem Funktionsgraph (Abbildung 2.3) ist die Aussage auch anschaulich klar. Wir weisen es dennoch formal1136
nach:1137
Sei ε > 0. Wir mussen zeigen, dass es fur jede Nullfolge (xn)n∈N ein n0 ∈ N gibt, so dass1138
| exp(xn)− 1| < ε
fur alle n ≥ n0. Da xnn→∞−−−−→ 0, gibt es ein n0 so dass |xn| ≤ min{ 1
2 ,ε2} fur alle n ≥ n0. Beachten Sie, dass,1139
xknk!≤ |xn|
k
k!≤ |xn|k,
also auch1140
exp(xn) =
∞∑k=0
xknk!≤∞∑k=0
|xn|k =1
1− |xn|.
Damit beweisen wir die Aussage, denn fur |xn| < 12 gilt, dass1141
| exp(xn)− 1| ≤ 1
1− |xn|− 1 =
|xn|1− |xn|︸ ︷︷ ︸≥ 1
2
≤ 2|xn| ≤ ε
wobei die letzte Aussage folgt, da nach Wahl von n gilt, dass |xn| ≤ ε2 .1142
Wir sehen: auch diese Grenzwerte “von Hand” auszurechenen, ist ein muhsames Unterfangen. Zum1143
Gluck gibt es auch hier Rechenregeln, die das Leben erleichtern. Zunachst beoachten wir, dass fur zwei1144
Abbildungen f, g : D → R immer auch eine Abbildung f + g : D → R existiert, die definiert ist durch1145
(f + g)(x) = f(x) + g(x). Ebenso gibt es Abbildungen fg und fg , wobei der Definitionsbereich der letzteren1146
durch D \ {x | g(x) = 0} gegeben ist.1147
Theorem 2.25. Ist limx→x0 f(x) = α und limx→x0 g(x) = β, dann ist1148
• limx→x0(f + g)(x) = α+ β,1149
• limx→x0(f · g)(x) = α · β,1150
• Ist β 6= 0, so ist auch limx→x0
fg (x) = α
β .1151
Beweis. Dies folgt sofort aus den entsprechenden Aussagen uber Folgen (Theorem 2.13). Wir skizzieren den1152
Fall der Addition:1153
Fixiere eine Folge (an)n∈N, die gegen x0 konvergiert. Da limx→x0 f(x) = α und limx→x0 g(x) = β, folgt1154
damit f(an)n→∞−−−−→ α und g(an)
n→∞−−−−→ β. Nach Theorem 2.13 ist (f + g)(an) = f(an) + g(an)n→∞−−−−→ α+ β.1155
Da (an)n∈N als beliebige Folge gewahlt ist, gilt also auch limx→x0(f + g)(x) = α+ β.1156
40 KAPITEL 2. ANALYSIS, TEIL I
Als Beispiel konnen wir Grenzwerte von rationalen Funktionen einfach berechnen:1157
limx→∞
x− 1
2− x= limx→∞
1− 1x
2x − 1
Da limx→∞1x = 0, konnen wir nun das Theorem wiederholt anwenden und erhalten1158
limx→∞
x− 1
2− x=
1− 0
0− 1= −1
1159
Hausaufgabe 2.6.1. Bestimmen Sie alle Beruhrpunkte der Mengen R \ Z, Z, R \ Q1160
Hausaufgabe 2.6.2. Zeigen Sie: Ist ann→∞−−−−→ 0, ist auch |an|
n→∞−−−−→ 0. Stimmt auch die Ruckrichtung?1161
Hausaufgabe 2.6.3. Fuhren Sie den Beweis von Theorem 2.25 fur die Multiplikation.1162
Hausaufgabe 2.6.4. Der Grenzwert einer Funktion in einem Punkt a kann manchmal nicht existieren, aber1163
dafur kann dieser einen linksseitigen und rechtsseitigen Grenzwert besitzen; das heißt, einen verschiedenen1164
Grenzwert, je nachdem ob man sich ihm von links oder rechts nahert. Ein Beispiel ist:1165
limx→0x>0
1
x= +∞, wahrend lim
x→0x<0
1
x= −∞ obwohl es lim
x→0x∈R\{0}
1
xnicht gibt.
Berechnen Sie die Grenzwerte:1166
limx→0x≥0
bxc, und limx→0x<0
bxc.
Was ist mit limx→0x≤0bxc?1167
Hausaufgabe 2.6.5. Ahnlich wie in Aufgabe 2.6.4, untersuchen Sie das Verhalten der Funktionen1168
f(x) =1
(x− 1)2, g(x) =
1
x2 − 1, h(x) =
x− 1
x2 − 1
fur x→ 1.1169
Hausaufgabe 2.6.6. Berechnen Sie:1170
(α) limx→∞
4x2 − 7x+ 3 (β) limx→∞
x3 − 2x+ 10
5x3 + 3x− 2(γ) lim
x→∞
√x2 + 6x+ 1− x.
Hausaufgabe 2.6.7. Beweisen Sie: Ist die Menge M 6= ∅ und beschrankt, dann sind inf M und supM1171
Beruhrpunkte von M (Bonus: Zeigen Sie dies auch, falls inf M = −∞, also wenn M nicht nach unten1172
beschrankt ist, gilt).1173
2.7 Stetigkeit1174
Wir kommen nun zu einem weiteren zentralen Begriff der Analysis. Stetigkeit einer Abbildung f : R → R1175
bedeutet intuitiv die folgenden Dinge:1176
• Die Funktion “springt nicht”.1177
• Man kann den Funktionsgraph mit einem Stift ohne abzusetzen zeichnen.1178
• Wenn man den x-Wert nur “ein bisschen” andert, andert sich auch f(x) nur “ein bisschen”.1179
2.7. STETIGKEIT 41
Wenn wir den Definitionsbereich der Abbildung einschranken (z.B. auf ein Intervall), konnen wir diese1180
Eigenschaften auch lokal in diesem eingeschranktem Bereich betrachten. Dann sprechen wir von lokaler1181
Stetigkeit.1182
Schauen wir uns die Bespiele von oben an, so sehen wir, dass die Abbildungen f(x) = |x|, f(x) =√x,1183
f(x) = exp(x) auf ihrem Definitionsbereich ohne Sprunge verlaufen, also intuitiv stetig sein sollten. Ferner1184
ist die Funktion f(x) = dxe nicht stetig, weil sie an ganzen Zahlen springt. Allerdings ist sie innerhalb1185
eines Intervalls (z, z+ 1) mit z ∈ Z wenigstens lokal stetig. Dagegen springt die Funktion, welche rationalen1186
Zahlen 0 und irrationalen Zahlen 1 zuordnet, an jedem Punkt ist daher auch lokal nicht stetig.1187
Definition 2.26. Sei f : D → R und x0 ∈ D. Wir nennen f stetig in x0, wenn gilt1188
limx→x0
f(x) = f(x0).
Ist D′ ⊆ D, so nennen wir f stetig auf D′, falls f in jedem x0 ∈ D′ stetig ist. Wir nennen f einfach nur1189
stetig, wenn es auf D stetig ist.1190
Anstatt zu fordern, dass limx→x0f(x) = f(x0) gilt, wurde es auch reichen zu fordern, dass limx→x0
f(x)1191
existiert: Dann muss der Grenzwert schon gleich f(x0) sein, da ja fur die konstante Folge an = x0 die Folge1192
(f(an))n∈N gegen f(x0) konvergiert.1193
Schauen wir uns einige Beispiele an:1194
• Die konstante Abbildung f(x) = c ist uber ganz R stetig.1195
• Die Abbildung f(x) = x ist stetig, denn es gilt fur jedes x0 ∈ R1196
limx→x0
f(x) = limx→x0
x = x0 = f(x0)
• Die Abbildung1197
sgn : R→ R, x 7→
+1 x > 0
0 x = 0
−1 x < 0
ist nicht stetig in 0, denn es gilt zum Beispiel1198
limn→∞
sgn(1
n) = lim
n→∞1 = 1, lim
n→∞sgn(− 1
n) = lim
n→∞−1 = −1
und die Folgen ( 1n )n∈N und (− 1
n )n∈N konvergieren beide gegen 0, also existiert limx→0 sgn(x) nicht.1199
Allerdings ist sgn in jedem anderen Punkt stetig (Beweis lassen wir weg).1200
• Die Funktion1201
f(x) =
{0 x ∈ Q
1 x ∈ R \ Q
ist in keinem x0 ∈ R stetig, denn es gibt fur jedes x0 ∈ R sowohl eine rationale Folge, als auch eine1202
irrationale Folge, die gegen x0 konvergiert, und diese liefern verschiedene Grenzwerte, wenn man f1203
anwendet.1204
Beachten Sie, dass die Aussage”Stetige Funktionen springen nicht“ sehr stark vereinfachend ist. Zum1205
Beispiel ist die Funktion f(x) = 1x auf ihrem gesamten Definitionsbereich R\{0} stetig, “springt” allerdings1206
an der Stelle 0 von −∞ nach +∞.1207
Auch fur stetige Funktionen gibt es einige Eigenschaften, die die Arbeit erleichtern:1208
Theorem 2.27. Sind f und g stetig in x0 ∈ R, so sind auch die Abbildungen f + g und fg stetig in x0. Ist1209
g(x0) 6= 0, ist auch fg stetig in x0.1210
Beweis. Das ist eine direkte Konsequenz aus Theorem 2.25 (Hausaufgabe).1211
42 KAPITEL 2. ANALYSIS, TEIL I
Aus diesem Theorem folgt sofort:1212
Korollar 2.28. Jede rationale Funktion ist auf ihrem Definitionsbereich stetig.1213
Der Grund ist, dass jede rationale Funktion durch Addition, Multiplikation und Division von konstanten1214
Funktionen und der Funktion f(x) = x gebildet werden kann, und wir haben bereits gezeigt, dass diese1215
Funktionen stetig sind.1216
Man betrachtet oft auch stuckweise rationale Funktionen, unter welchen wir Abbildungen verstehen, die1217
auf Intervallen im Definitionsbereich rational sind. Also zum Beispiel1218
f(x) =
x2 + 1 x ≥ 1
6x− 4 −2 ≤ x < 13x−2x2+1 x < −2
Diese Abbildung ist auf ganz R definiert. Es ist nicht schwer zu erkennen, dass die Funktion innerhalb eines1219
Abschnitts stetig ist (das folgt aus dem Korollar oben). Es bleiben die Nahtstellen −2 und 1 zu untersuchen.1220
Wir erkennen, dass f(−2) = −16, allerdings ist der Grenzwert von f(x) gleich − 85 , wenn wir uns −2 von1221
links kommend annahern. Also ist die Funktion nicht stetig in −2. Fur x = 1 dagegen sehen wir, dass der1222
Grenzwert von f(x) 2 ist, egal ob wir von links oder von rechts kommen. Also ist die Abbildung stetig in 1.1223
Das Prinzip von oben ubertragt sich auf jede stuckweise rationale Funktion: Diese sind immer stetig1224
im Defintionsbereich ausserhalb der Nahtstellen. Die Nahtstellen mussen einzeln untersucht werden. Die1225
Abbildung ist stetig in der Nahtstelle x0 genau dann, wenn die beiden rationalen Funktionen links und1226
rechts von x0 den gleichen Grenzwert in x0 haben. Wir beweisen diese Aussagen nicht.1227
Erinnern Sie sich an die Komposition zweier Funktionen (f ◦ g)(x) = f(g(x))? Wir geben einen wichtige1228
Eigenschaft ohne Beweis an:1229
Theorem 2.29. Ist g stetig in x0 und f stetig in f(x0). Dann ist f ◦ g stetig in x0.1230
Als Konsequenz gilt dann auch, dass wenn f stetig (auf R) und g stetig (auf R) ist, dann sind auch f ◦ g1231
und g ◦ f stetige Funktionen. Wir werden dies spater ausnutzen.1232
Nun kommen wir noch zu einer alternativen Charakterisierung von Stetigkeit. Diese hat den “Vorteil”,1233
dass sie ohne den Begriff eines Grenzwertes auskommt. Ferner druckt sie die Intuition, dass sich die Funktion1234
nur ein bisschen andert, wenn sich das Argument ein bisschen andert, etwas direkter aus. Besonders “einfach”1235
ist sie aber auch nicht:1236
Theorem 2.30 (ε-δ-Kriterium fur Stetigkeit). Sei f : D → R. Dann ist f stetig in x0 genau dann, wenn1237
∀ε > 0 ∃δ > 0 ∀x ∈ D : |x− x0| < δ ⇒ |f(x)− f(x0)| < ε.
Eine Aussage der Form”A genau dann, wenn B“ bzw.
”A⇔ B“ kann man beweisen, indem man zeigt,1238
dass”A ⇒ B“ und auch
”B ⇒ A“ gilt. Man kann auch stattdessen zeigen, dass
”A ⇒ B“ und auch1239
”¬A ⇒ ¬B“ gilt (das ist die Kontraposition der Aussage
”B ⇒ A“). In beiden Fallen besteht der Beweis1240
aus zwei Teilen, die auch klar voneinander abgegrenzt sein sollten.1241
Beweis. Wir zeigen zunachst: Ist das ε-δ-Kriterium fur x0 erfullt, dann ist f stetig in x0:1242
Sei (xn)n∈N eine beliebige Folge in D mit Grenzwert x0. Wir mussen zeigen, dass limn→∞ f(xn) = f(x0).1243
Daraus folgt dann namlich, dass limx→x0 f(x) = f(x0), was nichts anderes bedeutet als dass f stetig in x01244
ist.1245
Sei ε > 0 beliebig. Nach dem ε-δ-Kriterium gibt es ein δ > 0, so dass fur alle x ∈ D mit |x−x0| < δ gilt,1246
dass |f(x)− f(x0)| < ε. Da xn gegen x0 konvergiert, gibt es ein n0 ∈ N, so dass fur alle n ≥ n0 gilt1247
|xn − x0| < δ
Also gilt auch |f(xn)− f(x0)| < ε fur alle n ≥ n0, und somit f(xn)n→∞−−−−→ f(x0).1248
Nun zeigen wir: Ist das ε-δ-Kriterium nicht erfullt in x0, ist auch f nicht stetig in x0.1249
2.8. EIGENSCHAFTEN STETIGER ABBILDUNGEN 43
Wenn das ε-δ-Kriterium in x0 nicht erfullt ist, gibt es ein ε, so dass wir fur alle δ > 0 ein x ∈ D finden,1250
so dass zwar |x− x0| < δ, aber |f(x)− f(x0)| ≥ ε.1251
Nun basteln wir uns eine Folge (an)n∈N wie folgt: Wir definieren an als ein Element in D, so dass1252
|an − x0| < 1n , aber |f(an)− f(x0)| ≥ ε; ein solches an existiert nach Vorraussetzung, da wir δ = 1
n setzen1253
konnen. Nun konvergiert die Folge (an)n∈N gegen x0, aber (f(an))n∈N konvergiert nicht gegen f(x0), da1254
jedes Folgenglied mindestens ε von f(x0) entfernt liegt. Also gilt nicht, dass limx→x0f(x) = f(x0), also ist1255
f nicht stetig in x0.1256
1257
Hausaufgabe 2.7.1. Beweisen Sie den ersten Teil von Theorem 2.27 (Addition).1258
Hausaufgabe 2.7.2. Geben Sie fur die Funktion1259
f(x) =
x x > 3
4x− 7 2 ≤ x ≤ 3
x2 0 < x < 2x−2x2−1 x ≤ 0
den Definitionsbereich an und untersuchen Sie die Funktion auf Stetigkeit.1260
Hausaufgabe 2.7.3. Seien f : D → R, g : D → R Abbildungen und x0 ∈ D. Sei ferner g stetig in x0.1261
a. Geben Sie ein Beispiel an, so dass f(x0) = g(x0), aber f nicht stetig in x0 ist.1262
b. Zeigen Sie: Gibt es ein ε > 0, so dass f(x) = g(x) fur alle x ∈ D mit |x − x0| < ε, dann ist auch f1263
stetig in x0.1264
Hausaufgabe 2.7.4. Bestimmen Sie alle Werte von a, b ∈ R, fur die die Funktion ha,b : R→ R,1265
x 7→
{5x3 + a x ≥ 1,
bx− 4 x < 1
stetig ist.1266
2.8 Eigenschaften stetiger Abbildungen1267
Zwischenwertsatz. Betrachten Sie eine stetige Abbildung f : [0, 1]→ R mit f(0) = 1 und f(1) = 3. Nun1268
ist es intuitiv klar, dass die Abbildung irgendwo zwischen 0 und 1 den Funktionswert 2 annehmen muss. In1269
der Tat mussen wir den Funktionsgraphen zeichnen konnen, ohne den Stift abzusetzen, und wir mussen die1270
horizontale Linie y = 2 irgendwann (mindestens) einmal uberschreiten. Der folgende Satz druckt diese Idee1271
allgemein aus.1272
Theorem 2.31 (Zwischenwertsatz). Sei f : [a, b]→ R stetig. Sei c ∈ R, so dass1273 {f(a) ≤ c ≤ f(b) falls f(a) ≤ f(b)
f(a) ≥ c ≥ f(b) falls f(a) > f(b).
Dann gibt es ein ξ ∈ [a, b], so dass f(ξ) = c.1274
Wir nennen ein solches ξ auch eine c-Stelle von f .1275
Beweis. Wir nehmen an, dass f(a) ≤ f(b) gilt (der andere Fall geht genauso). Wir konstruieren ein ξ wie1276
gewunscht. Dazu definieren wir zwei Folgen (an)n∈N und (bn)n∈N wie folgt: Wir setzen a0 := a und b0 := b.1277
Nun konstruieren wir aj und bj fur j ≥ 1 induktiv, d.h. wir nehmen an, dass wir aj−1 und bj−1 schon1278
44 KAPITEL 2. ANALYSIS, TEIL I
konstruiert haben und definieren daraus aj und bj wie folgt. Zunachst betrachten wir mj−1 :=aj−1+bj−1
2 .1279
Geometrisch ist dies der Mittelpunkt der Strecke von aj−1 nach bj−1. Ist f(mj−1) ≤ c, setzen wir aj := mj−11280
und bj := bj−1. Ist f(mj−1) > c, setzen wir aj := aj−1 und bj := mj .1281
Wir unterbrechen den Beweis und geben eine Erklarung der Konstruktion: Anschaulich ist es nach1282
Voraussetzung klar, dass ein solches ξ existieren muss. Indem wir in der Mitte des Intervalls nachschauen,1283
konnen wir immer fur eine Halfte des Intervalls sicherstellen, dass dort mindestens eine c-Stelle enthalten ist:1284
Ist z.B. f(a) < c und f(m) > c (wobei m der Mittelpunkt des Intervalls [a, b] ist), dann ist (intuitiv) klar,1285
dass im Intervall [a,m] eine c-Stelle enthalten sein muss. (Naturlich konnen auch im Intervall [m, b] c-Stellen1286
enthalten sein.) Die Konstruktion definiert Intervalls [aj , bj ], die alle mindestens eine c-Stelle enthalten,1287
wobei jedes Interval genauso halb so großist wie das vorherige Intervall. Anschaulich approximieren wir die1288
c-Stelle also beliebig genau mit diesen Verfahren. Dies zeigen wir nun formal.1289
Die Folge (an)n∈N ist monoton steigend und beschrankt (z.B. durch b), also konvergiert sie gegen einen1290
Grenzwert α. Das gleiche gilt fur (bn)n∈N mit Grenzwert β. Nun mussen diese beiden Grenzwerte gleich1291
sein: α ≤ β ist klar, da an < bn fur alle n gilt, und ware α < β, dann gabe es zwischen an und bn immer1292
einen Mindestabstand |β−α|, aber nach Konstruktion ist |bn−an| = |b−a|2n
n→∞−−−−→ 0. Nennen wir ξ := α = β1293
diesen gemeinsamen Grenzwert. Nun gilt einerseits, wegen Stetigkeit von f1294
f(ξ) = limx→ξ
f(x) = limn→∞
f(an) ≤ c,
wobei die letzte Ungleichung gilt, da nach Konstruktion f(an) ≤ c fur alle n gilt. Genauso gilt1295
f(ξ) = limx→ξ
f(x) = limn→∞
f(bn) ≥ c.
Also ist f(ξ) ≤ c und f(ξ) ≥ c und damit f(ξ) = c.1296
Wir besprechen zwei wichtige Folgerungen aus dem Zwischenwertsatz. Wir nennen eine Funktion f :1297
D → R monoton wachsend (bzw. fallend), wenn fur a < b gilt, dass f(a) ≤ f(b) (bzw. f(a) ≥ f(b)). Wir1298
nennen f streng mononton wachsend (bzw. fallend), wenn fur a < b gilt, dass f(a) < f(b) (bzw. f(a) > f(b)).1299
Theorem 2.32 (Umkehrfunktionssatz). Ist f : [a, b] → R stetig und streng monoton wachsend, dann gibt1300
es eine stetige, streng monoton wachsende Abbildung1301
f−1 : [f(a), f(b)]→ R,
so dass gilt f−1(f(x)) = x fur alle x ∈ [a, b] und f(f−1(y)) = y fur alle y ∈ [f(a), f(b)].1302
Beachten Sie, dass streng monotone Funktionen immer injektiv sind (egal ob stetig oder nicht). Schranken1303
wir also eine fur eine solche Funktion den Wertbereich ein, ist sie immer umkehrbar. Der Umkehrfunktions-1304
satz sagt aus, dass fur stetige Funktionen der Wertebereich immer genau gleich dem Intervall [f(a), f(b)]1305
ist, also alle Werte im Intervall angenommen werden, und dass diese Funktion uberdies auch stetig ist.1306
Beweis. Nach dem Zwischenwertsatz gibt es fur y ∈ [f(a), f(b)] ein ξ ∈ [a, b] mit f(ξ) = y. Da f streng1307
monoton ist, ist ξ eindeutig bestimmt. Wir definieren f−1(y) := ξ. Es ist dann klar, dass f(f−1(y)) = y1308
und f(f−1(x)) = x gilt.1309
f−1 ist streng monoton wachsend, denn fur y < y′ in [f(a), f(b)] finden wir x, x′ ∈ [a, b] mit f(x) = y,1310
f(x′) = y′. Somit ist f−1(y) = x und f−1(y′) = x′, und es ist nur zu zeigen, dass x < x′ gilt. Ware dem1311
nicht so, z.B. x > x′, dann ist auch f(x) > f(x′), da f streng monoton ist, ein Widerspruch.1312
Fur den Beweis der Stetigkeit von f−1 wenden wir das ε-δ-Kriterium an. Wir fixieren ein y0 ∈ [f(a), f(b)].1313
Wir zeigen hier nur den Fall, dass y0 im Innern des Intervals liegt. Die Spezialfalle y0 = f(a) und y0 = f(b)1314
gehen ahnlich.1315
Nach dem oben gezeigtem ist y0 = f(x0) fur ein x0 ∈ [a, b]. Sei ε > 0. Wir mussen zeigen, dass es ein1316
δ > 0 gibt, so dass fur alle y = f(x) ∈ [f(a), f(b)]:1317
|y − y0| < δ ⇒ |f−1(y)− f−1(y0)| < ε
oder aquivalent1318
|f(x)− f(x0)| < δ ⇒ |x− x0| < ε.
2.8. EIGENSCHAFTEN STETIGER ABBILDUNGEN 45
Setze1319
x1 :=
{x0 − ε falls x0 − ε ∈ [a, b]
a sonst, x2 :=
{x0 + ε falls x0 + ε ∈ [a, b]
b sonst
Wegen der Monotonie ist f(x1) < f(x0) < f(x2) (es sind beide Ungleichungen strikt, da y0 im Innern von1320
[f(a), f(b)] liegt. Wir finden also ein δ > 0, so dass [f(x0)− δ, f(x0) + δ] komplett im Intervall [f(x1), f(x2)]1321
liegt. Wahlen wir also ein Element x ∈ [a, b], so dass |f(x)−f(x0)| < δ, dann ist f(x) ∈ [f(x0)−δ, f(x0)+δ].1322
Also ist f(x) ∈ [f(x1), f(x2)], und damit x ∈ [x1, x2], da f−1 streng monoton ist. Nach Wahl von x1 und1323
x2 ist also |x− x0| < ε, was die Stetigkeit beweist.1324
Hier ist ein wichtiges Beispiel: Die Abbildung f(x) = x2 ist im Intervall [0, b] mit b > 0 streng monoton1325
wachsend und stetig. Sie hat also eine stetige Umkehrfunktion, die wir mit√x bezeichnen. Da dies fur jedes1326
b > 0 gilt, ist√x auf [0,∞) definiert.1327
Eine weitere Anwendung des Zwischenwertsatzes: Ein Polynom1328
p(x) = xn + an−1xn−1 + . . .+ a1x+ a0
hat eine Nullstelle, wenn n ungerade ist. Das folgt sofort aus der Tatsache, dass limx→∞ p(x) = +∞ und1329
limx→−∞ p(x) = −∞ (weil n ungerade ist), also gibt es sicherlich ein b > 0, so dass p(b) > 0 und ein a < 0,1330
so dass p(a) < 0 ist. Nach dem Zwischenwertsatz gibt es also ein ξ ∈ [a, b], so dass p(ξ) = 0 gilt.1331
Beachten Sie, dass der Beweis des Zwischenwertsatzes nicht nur zeigt, dass es eine Nullstelle gibt, sondern1332
auch ein Verfahren liefert, wie man eine solche Nullstelle finden kann (mit einer beliebigen Genauigkeit)1333
Man sagt dazu auch konstruktiver Beweis.1334
Als Beispiel finden wir eine Nullstelle des Polynoms1335
p(x) = x5 − 7x2 + 3x− 2
Zunachst finden wir (durch Probieren) a und b, so dass p(a) < 0 ist und p(b) > 0 ist. Wir konnen nachrech-1336
nen, dass p(0) = −2 und p(2) = 32− 28 + 6− 2 = 8 > 0 ist, also liegt in [0, 2] eine Nullstelle.1337
Da p(1) = 1− 7 + 3− 2 = −5 < 0, liegt eine Nullstelle in [1, 2].1338
Da p(1.5) = −5.65 < 0, liegt eine Nullstelle in [1.5, 2].1339
Da p(1.75) = −1.77 . . ., liegt eine Nullstelle in [1.75, 2].1340
Da p(1.875) = 2.18 . . ., liegt eine Nullstelle in [1.75, 1.875]1341
Mit genugend vielen weiteren Iterationen konnen wir das Intervall beliebig klein machen.1342
Satz vom Minimum und Maximum. Wir haben im letzten Abschnitt von konstruktiven Beweisen1343
gesprochen. Die Frage stellt sich, ob es auch nicht-konstruktive Beweise gibt, die zwar die Existenz eines1344
Objekts zeigen, aber kein Verfahren angeben, wie ein solches Objekt zu finden ist. Wir lernen dafur nun ein1345
Beispiel kennen.1346
Eine Folge (bn)n∈N ist eine Teilfolge von (an)n∈N, wenn es Indices i1 < i2 < i3 < . . . gibt, so dass fur1347
alle n ∈ N bn = ain gilt.1348
Anschaulich erhalten wir eine Teilfolge von (an)n∈N, indem wir bei einem beliebigen Folgenglied von1349
(an)n∈N starten (mit Index i1) und das nachste Folgenglied erhalten, in dem wir beliebig viele Elemente1350
der Folge uberspringen (das ist die Differenz i1 − i0), und so weiter. Zum Beispiel ist (1, 2, 4, 8, 16, . . .) eine1351
Teilfolge von (1,2, 3,4, 5, 6, 7,8, 9, . . .).1352
Erinnern Sie sich, dass eine beschrankte Folge nicht konvergieren muss. Ein Beispiel ist die Folge1353
(−1,+1,−1,+1,−1, . . .). Nehmen wir jedoch die Teilfolge, die jedes zweite Element auswahlt, so erhal-1354
ten wir (1, 1, 1, 1, . . .), was konvergiert. Diese Folge hat also eine konvergente Teilfolge. Der nachste Satz1355
sagt, dass dies fur jede beschrankte Folge der Fall ist.1356
Theorem 2.33 (Satz von Bolzano-Weierstraß). Jede beschrankte Folge hat eine konvergente Teilfolge.1357
Beweis. Sei (an)n∈N beschrankt durch I0 = [α, β], d.h., alle Folgenglieder liegen in diesem Intervall. Setze1358
i0 := 0. Nun betrachte die Teilintervalle [α, α+β2 ] und [α+β
2 , β]. In mindestens einem der beiden Teilintervalle1359
liegen unendlich viele Folgenglieder. Nenne dieses Intervall I1. Setze i1 > i0, so dass ai1 ∈ I1 liegt. Nun1360
46 KAPITEL 2. ANALYSIS, TEIL I
unterteile I1 in zwei gleich grosse Teilintervalle, und wahle I2 als eines der Teilintervalle aus, das unendlich1361
viele Folgenglieder enthalt. Wahle dann i2 > i1 so, dass ai2 ∈ I2. Dieses Verfahren fuhren wir nun immer1362
weiter aus, und die Indices i0, i1, i2, . . . definieren eine Teilfolge.1363
Diese Teilfolge ist eine Cauchyfolge, denn alle Folgenglieder aik , ai` mit k, ` > j liegen in einem Intervall1364
der Grosse β−α2j . Es ist damit leicht, die Cauchybedingung nachzuweisen.1365
Anders als im Zwischenwertsatz ist der Beweis oben nicht konstruktiv: selbst wenn wir eine konkrete1366
beschrankte Folge gegeben haben, liefert der Beweis kein realisierbares Verfahren, eine solche Teilfolge zu1367
finden. Der Grund ist, dass wir nicht wissen, in welchem Teilintervall unendlich viele Folgenglieder enthalten1368
sind.1369
Als Beispiel schauen wir uns die Folge1370
xn := 1.5n − b1.5nc
an (erinnern Sie sich, dass b·c Abrunden auf die nachste ganze Zahl bedeutet). Dann liege jedes Folgenglied1371
im Intervall [0, 1), also ist die Folge beschrankt. Wir erhalten als erste Folgenglieder1372
(0.5, 0.25, 0.375, 0.0625, 0.59375, . . .)
Wir wissen nach dem Satz von Bolazano-Weierstrass, dass es eine konvergente Teilfolge geben muss. Es ist1373
jedoch nicht bekannt, wie diese konvergente Teilfolge konstruiert werden kann.1374
Wir konnen diesen Satz verwenden, um eine weitere wichtige Eigenschaft stetiger Funktionen zu beweisen.1375
Theorem 2.34. Sei I = [α, β] mit α, β ∈ R und f : I → R stetig. Dann gibt es p, q ∈ I, so dass1376
f(p) ≤ f(x) fur alle x ∈ I,1377
f(q) ≥ f(x) fur alle x ∈ I.
Der Satz druckt zwei Dinge aus: Der Wertebereich einer stetigen Funktion uber einem beschrankten, ab-1378
geschlossenen Intervall ist beschrankt, und ferner nimmt die Funktion auch ein Minimum und ein Maximum1379
an.1380
Beweis. Wir beweisen die Aussage nur fur das Minimum p. Der Beweis fur das Maximum funktioniert ganz1381
ahnlich. Sei F := {f(x) | x ∈ I} und sei y∗ := inf F ∈ R ∪ {−∞}. Beachte, dass y∗ = −∞, wenn F nicht1382
nach unten beschrankt ist. In jedem Fall exisitiert jedoch eine Folge (yn)n∈N in F , die nach y∗ konvergiert1383
(bzw., im Fall y∗ = −∞ nach −∞ divergiert). Das folgt aus Hausaufgabe 2.6.7. Jedes yi ist ein Bild unter F ,1384
also konnen wir ein Urbild xi wahlen, so dass f(xi) = yi gilt. Die Folge (xn)n∈N ist nicht notwendigerweise1385
konvergent, aber sie ist beschrankt (da jedes Folgenglied in I liegt), und hat damit eine konvergente Teilfolge1386
(x′n)n∈N. Sei x∗ der Grenzwert dieser Folge. Wegen der Stetigkeit von f ist dann1387
f(x∗) = limn→∞
f(x′n) = limn→∞
f(xn) = limn→∞
yn = y∗
Damit ist also insbesondere y∗ = f(x∗) ∈ R, also ist das Infimum endlich, und gleichzeitig ein Minimum,1388
das an der Stelle x∗ ∈ I angenommen wird.1389
1390
Hausaufgabe 2.8.1. Zeigen Sie durch Gegenbeispiele, dass der Umkehrfunktionssatz nicht mehr gilt, wenn1391
a. f stetig auf [a, b], aber nicht streng monoton ist,1392
b. f streng monoton, aber nicht stetig auf [a, b] ist,1393
c. f : D → R stetig und streng monoton ist, aber D kein Intervall ist.1394
2.8. EIGENSCHAFTEN STETIGER ABBILDUNGEN 47
Hausaufgabe 2.8.2. Zeigen Sie, dass die Funktion1395
f : R→ R, x 7→ 3√x− 1
stetig ist.1396
Hausaufgabe 2.8.3. Bestimmen Sie die ersten 3 Nachkommastellen von√
5 (Sie konnen einen Taschen-1397
rechner benutzen, aber durfen ihn nur fur Additionen und Multiplikationen verwenden)1398
Hausaufgabe 2.8.4. Zeigen Sie, dass das Polynom x3 − 4x − 1 mindestens drei verschiedene Nullstellen1399
hat.1400
Hausaufgabe 2.8.5. Geben Sie Beispiele an, dass die Aussage von Theorem 2.34 nicht wahr ist, wenn I1401
als offen, halboffen, oder unbeschrankt angenommen wird, oder wenn f nicht stetig ist.1402
Hausaufgabe 2.8.6. Zeigen Sie, dass es keine stetige Funktion f : [0, 1]→ [0, 1] gibt, die jeden Funktions-1403
wert genau zwei mal annimmt.1404
Hinweis: Nutzen Sie den Satz vom Minimum und Maximum und den Zwischenwertsatz.1405
Hausaufgabe 2.8.7. Zeigen Sie, dass die Umkehrung des Satzes von Bolzano-Weierstraß nicht gilt: Wenn1406
eine Folge (an)n∈N eine konvergente Teilfolge hat, muss (an)n∈N nicht unbedingt beschrankt sein.1407
48 KAPITEL 2. ANALYSIS, TEIL I
Kapitel 31408
Lineare Algebra, Teil I1409
Viele geometrische Sachverhalte lassen sich durch ein System von einfachen (linearen) Gleichungen beschrei-1410
ben, z.B. die Schnittpunktsberechnung einer Ebene und einer Geraden im R3. Die lineare Algebra liefert die1411
notwendigen Werkzeuge, um solche linearen Gleichungssysteme zu untersuchen.1412
Der ubliche Anschauungsraum fur geometrische Probleme ist entweder R2 oder R3. Allerdings ist es fur1413
weite Teile der Theorie nicht wichtig, dass wir die reellen Zahlen zugrundelegen — viele Aussagen gelten in1414
einem wesentlich allgemeineren Kontext.1415
3.1 Gruppen und Korper1416
Eine algebraische Struktur ist eine Menge von Objekten, ublicherweise mit einer oder mehreren Ver-1417
knupfungsfunktionen, die gewisse “angenehme” Eigenschaften haben. Hier ist ein Beispiel.1418
Definition 3.1. Sei G eine Menge und ◦ : G×G→ G eine Abbildung. Dann ist (G, ◦) eine Gruppe, wenn1419
die folgenden drei Eigenschaften gelten.1420
1. Fur alle a, b, c ∈ G ist (a ◦ b) ◦ c = a ◦ (b ◦ c) (Assoziativgesetz)1421
2. Es gibt ein e ∈ G, so dass e ◦ a = a = a ◦ e fur alle a ∈ G (neutrales Element)1422
3. Fur alle a ∈ G gibt es ein a−1 ∈ G, so dass a ◦ a−1 = e = a−1 ◦ a (inverses Element)1423
Die drei Eigenschaften nennt man auch die Gruppenaxiome. Eine Gruppe heißt kommutativ oder abelsch,1424
falls auch a ◦ b = b ◦ a fur alle a, b ∈ G gilt.1425
Man sagt oft auch einfach”G ist eine Gruppe.“ anstatt
”(G, ◦) ist eine Gruppe.“, falls die Verknupfung1426
aus dem Kontext heraus klar ist.1427
Es gibt zahlreiche Beispiele fur Gruppen. Wir geben Beispiele an, die aufzeigen, dass diese Struktur in1428
der Tat in vielen verschiedenen Kontexten auftritt.1429
• (Z,+) ist eine abelsche Gruppe mit neutralem Element 0 und inversem Element −a zu a ∈ Z.1430
• Ebenso sind (Q,+) und (R,+) abelsche Gruppen.1431
• (Q \ {0}, ·) ist ebenfalls eine abelsche Gruppe, mit neutralem Element 1 und inversem Element ba zu1432
ab . Genauso ist (R \ {0}, ·) eine abelsche Gruppe.1433
• ({+1,−1}, ·) ist eine abelsche Gruppe. 1 ist das neutrale Element, das inverse Element zu −1 ist −1.1434
• {e} mit einem beliebigen Element e ist eine Gruppe mit der Verknupfung e ◦ e = e. Dies nennt man1435
auch die triviale Gruppe.1436
49
50 KAPITEL 3. LINEARE ALGEBRA, TEIL I
• Sei M eine Menge und1437
G := {f : M →M |M ist bijektiv}.
Dann ist (G, ◦) eine Gruppe, wobei ◦ die Komposition von Abbildungen ist. Das neutrale Element ist1438
die Abbildung id : M → M mit id(x) = x. Das inverse Element zu f ist die Umkehrabbildung f−1,1439
wobei f−1(y) = x genau dann, wenn f(x) = y.1440
Allerdings ist die Gruppe G im Allgemeinen nicht abelsch. Ist zum Beispiel G = {1, 2, 3}, f =1441
{(1, 2), (2, 1), (3, 3)} und g = {(1, 3), (2, 1), (3, 2)} (hier verwenden wir mal die Mengenschreibweise1442
fur Abbildungen), dann sehen wird, dass f ◦ g = {(1, 3), (2, 2), (3, 1)} und g ◦ f = {(1, 1), (2, 3), (3, 2)},1443
also nicht gleich sind.1444
Mehr Beispiele fur Gruppen finden Sie in den Hausaufgaben 3.1.2 und 3.1.3.1445
In der Definition einer Gruppe ist nur gefordert, dass jedes Element mindestens ein inverses Element1446
hat. Es folgt jedoch aus den Gruppeneigenschaften, dass dieses Element auch eindeutig bestimmt ist.1447
Lemma 3.2. Sei (G, ◦) eine Gruppe und a ∈ G. Dann gibt es genau ein b ∈ G mit a ◦ b = e = b ◦ a.1448
Beweis. Nach Gruppenaxiom (3) gibt es mindestens ein solches b. Nehmen wir b, b′ ∈ G als Inverse Elemente1449
von a. Nun wenden wir die Gruppenaxiome an um zu zeigen:1450
b(2)= e ◦ b (3)
= (b′ ◦ a) ◦ b (1)= b′ ◦ (a ◦ b) (3)
= b′ ◦ e (2)= b′
Also sind die inversen Elemente gleich.1451
Beachten Sie, dass diese Aussage fur alle Gruppen gilt. Wenn wir also eine Menge als Gruppe identi-1452
fiziert haben, wissen wir bereits, dass Inverse Elemente eindeutig sind, ohne das fur die konkrete Gruppe1453
nachweisen zu mussen. Die Gruppentheorie befasst sich mit weiteren Eigenschaften von Gruppen, die aus1454
den Gruppenaxiomen folgen.1455
Wir befassen uns mit Mengen mit einer reichhaltigeren Struktur:1456
Definition 3.3. Eine Menge K mit Operationen
+ :K ×K → K
· :K ×K → K
ist ein Korper, wenn gilt1457
1. (K,+) ist eine abelsche Gruppe. Es bezeichne 0 ∈ K ihr neutrales Element.1458
2. (K \ {0}, ·) ist eine abelsche Gruppe. Es bezeichne 1 ∈ K ihr neutrales Element.1459
3. Fur alle a, b, c ∈ K gilt das Distributivgesetz1460
a · (b+ c) = a · b+ a · c
Es ist ublich, die Operation · nicht jedesmal hinzuschreiben, also z.B. statt x · y einfach xy zu schreiben.1461
Auch die “Punkt-vor-Strich” wendet man sinngemaß an, um Klammern zu sparen.1462
Zum Beispiel sind Q und R Korper, jeweils mit der ublichen Addition und Multiplikation als Ver-1463
knupfungen. Dagegen ist Z kein Korper, da (Z \ {0}, ·) keine Gruppe ist. Zum Beispiel hat 2 kein inverses1464
Element in Z bezuglich der Multiplikation.1465
Da Korper mehr Struktur haben als Gruppen, gibt es weniger Beispiele fur Korper. Dafur haben diese1466
wesentlich starkere Eigenschaften. Hier ist ein Beispiel:1467
Theorem 3.4. Sei K ein Korper mit 0 dem neutralen Element der Addition. Dann gilt1468
1. 0 · x = 0 fur alle x ∈ K.1469
3.1. GRUPPEN UND KORPER 51
2. xy = 0 genau dann, wenn x = 0 oder y = 0.1470
Beweis. Es gilt1471
0 · x = (0 + 0) · x = 0x+ 0x
Sei nun y das inverse Element zu 0x bezuglich der Addition, also y + 0x = 0 = 0x+ y. Dann gilt1472
0 = y + 0x = y + (0x+ 0x) = (y + 0x) + 0x = 0 + 0x = 0x,
was die erste Aussage beweist.1473
Fur die zweite Aussage mussen wir beide Richtungen zeigen. Falls x = 0 oder y = 0, dann ist auch1474
xy = 0, wie wir im ersten Teil des Theorems bewiesen haben. Umgekehrt, nehmen wir an dass xy = 01475
ist. Falls x = 0 gilt, sind wir fertig. Falls x 6= 0 gilt, gibt es ein multiplikatives Inverses x−1 zu x, so dass1476
x−1x = 1 gilt (mit 1 dem neutralen Element der Multiplikation in K). Also ist1477
y = 1 · y = (x−1x)y = x−1(xy) = x−1 · 0 = 0 · x−1 = 0,
wobei wir im letzten Schritt wiederum den ersten Teil des Theorems ausgenutzt haben.1478
Interessanterweise gibt es auch Korper mit endlich vielen Elementen. Wir konstruieren nun einen solchen1479
Korper: Fur zwei beliebige naturliche Zahlen a, b definieren wir1480
amod b
als Rest von ganzzahliger Division von a durch b. Zum Beispiel ist 47 mod 11 = 3, 18 mod 3 = 0 und1481
7 mod 11 = 7.1482
Es sei Zn := {0, 1, 2, . . . , n−1}. Da fur jedes a ∈ N gilt, dass amodn ∈ Zn, konnen wir nun die folgendenVerknupfungen definieren:
⊕ : Zn × Zn → Zn, a⊕ b := (a+ b) modn
� : Zn × Zn → Zn, a� b := (a · b) modn
Zum Beispiel ist in Z12 7⊕ 9 = 4 und 6� 9 = 6. Beachten Sie, dass Sie taglich in Z12 rechnen: Wenn es1483
11 Uhr ist, ist es in 3 Stunden 2 Uhr (nachmittags), also ist 11 + 3 = 2.1484
Wir konnen relativ leicht zeigen, dass1485
(((a+ b) modn) + c) modn = (a+ (b+ c) modn) modn
Damit folgt dann, dass (Zn,⊕) fur jedes n ∈ N eine abelsche Gruppe ist, wobei 0 das neutrale Element ist1486
und das inverse Element von a gleich n− amodn ist. Es gilt auch das Distributivgesetz1487
a� (b⊕ c) = a� b⊕ a� c.
Fur � gilt ebenfalls das Assoziativgesetz, und es gibt auch ein neutrales Element der Multiplikation, denn1488
1� a = a fur alle a 6= 0. Damit sind alle Korperaxiome erfullt, bis auf die Existenz von inversen Elementen1489
fur die Multiplikation.1490
Theorem 3.5. Zn ist ein Korper genau dann, wenn n eine Primzahl ist.1491
Beweis. Angenommen, Zn ist ein Korper, aber n keine Primzahl. Dann gibt es p, q ∈ {2, . . . , n − 1} mit1492
pq = n. In Zn ist dann p � q = 0, aber weder p noch q sind 0. Das widerspricht dem zweiten Teil von1493
Theorem 3.4.1494
Ist n eine Primzahl und a ∈ {1, . . . , n − 1}, dann haben a und n keinen gemeinsamen Teiler ausser 1.1495
Es folgt dann, dass es ganze Zahlen x und y gibt, so dass xa+ yn = 1 gilt (dies ist ein klassisches Resultat1496
von Euklid, welches wir hier nicht beweisen werden).1497
Setze a−1 := xmodn. Es gilt dann a−1a = 1−yn, und wenn wir auf beiden Seiten den Rest bei Division1498
durch n nehmen, a−1amodn = 1. Dies beweist, dass es ein inverses Element gibt.1499
52 KAPITEL 3. LINEARE ALGEBRA, TEIL I
1500
Hausaufgabe 3.1.1. Sei (G, ◦) eine Gruppe und a, b, c ∈ G. Beweisen Sie folgende Eigenschaften:1501
a. (a ◦ b = a ◦ c)⇒ b = c,1502
b. (a−1)−1 = a,1503
c. (a ◦ b)−1 = b−1 ◦ a−1.1504
Hausaufgabe 3.1.2. Prufen Sie fur jede der folgenden Strukturen, welche der Gruppenaxiome erfullt sind.1505
a. G = N, a ∗ b := max{a, b}1506
b. G = N, a ∗ b := ab1507
c. Sei M eine Menge und P (M) die Potenzmenge von M , also die Menge all seiner Teilmengen. Un-1508
tersuche (G,∪) und (G,∩).1509
d. G = P (M) wie oben, A ∗B := (A \B) ∪ (B \A).1510
Hausaufgabe 3.1.3. Die Symmetrien eines geometrischen Objekts sind alle Drehungen und Spiegelungen,1511
welche das Objekt in sich selbst abbilden. Nehmen wir z.B. das Quadrat [−1,+1]× [−1,+1], ist die Drehung1512
um 90 Grad eine Symmetrie, genauso wie Spiegelung am Ursprung. Ein weiteres Beispiel fur eine Symmetrie1513
ist die Identitatsabbildung, die um 0 Grad dreht.1514
a. Geben Sie samtliche Symmetrien fur das Quadrat an (es sind 8).1515
b. Argumentieren Sie, dass die Menge der Symmetrien eine Gruppe bildet.1516
c. Untersuchen Sie die Symmetrien des gleichseitigen Dreieck auf die gleiche Art.1517
Hausaufgabe 3.1.4. Beweisen Sie die Eindeutigkeit des neutralen Elements in jeder Gruppe.1518
Hausaufgabe 3.1.5. Fur n ∈ N bezeichne1519
Q[√n] := {a+ b
√n | a, b ∈ Q}.
a. Fur welche n ist Q[√n] = Q?1520
b. Zeigen Sie, dass Q[√n] ein Korper ist.1521
Hausaufgabe 3.1.6. Sei K ein Korper. Ist K ×K mit den Operationen1522
(a1, a2) + (b1, b2) := (a1 + b1, a2 + b2) (a1 + a2) · (b1, b2) = (a1b1, a2b2)
ein Korper? Untersuchen Sie, welche der Korperaxiome erfullt sind und welche nicht.1523
Hausaufgabe 3.1.7. Sei M eine Menge mit genau vier Elementen. Geben Sie alle moglichen Abbildungen1524
+ : M →M , · : M →M an, sodass (M,+, ·) ein Korper ist.1525
3.2 Vektorraume1526
Nun kommen wir zur Hauptstruktur der linearen Algebra, dem Vektorraum.1527
Definition 3.6. Sei K ein Korper mit 0 und 1 den neutralen Elementen der Addition und Multiplikation.Eine Menge V mit Abbildungen
+ : V × V → V
· : K × V → V
heißt K-Vektorraum (und seine Elemente Vektoren), wenn gilt1528
3.2. VEKTORRAUME 53
(V1) (V,+) ist eine abelsche Gruppe. Es bezeichne ~0 das neutrale Element (der Nullvektor).1529
(V2) Es gelten die Distributivgesetze
λ · (x+ y) = λ · x+ λ · y fur λ ∈ K,x, y ∈ V,(λ+ µ) · v = λ · v + µ · v fur λ, µ ∈ K,x ∈ V.
(V3) Es gilt ferner:
λ · (µ · x) = (λ · µ) · x fur λ, µ ∈ K,x ∈ V,1 · x = x fur x ∈ V.
Wir schreiben ~0, um den Nullvektor vom neutralen Element 0 in K zu unterscheiden. Hier sind einige1530
Beispiel fur Vektorraume:1531
• Das Standardbeispiel ist1532
Kn = K ×K × . . .×K,
dessen Vektoren wir mit1533
a =
a1
...an
bezeichnen. Kn wird durch die Operationen1534 a1
...an
+
b1...bn
=
a1 + b1...
an + bn
λ ·
a1
...an
=
λ · a1
...λ · an
zu einem K-Vektorraum. Um sich davon zu uberzeugen, muss man nun der Reihe nach alle Vektor-raumaxiome nachweisen. Wir tun das nur beispielhaft fur das Distributivgesetz:
(λ+ µ)x = (λ+ µ)
x1
...xn
=
(λ+ µ)x1
...(λ+ µ)xn
=
λx1 + µx1
...λxn + µxn
=
λx1
...λxn
+
µx1
...µxn
= λ · x+ µ · x
• Ein Polynom uber einem Korper K ist ein Ausdruck der Form1535
p = anxn + an−1x
n−1 + . . .+ a1x+ a0
wobei a0, . . . , an ∈ K und an 6= 0, falls n 6= 0. Die Menge aller Polynome bildet einen K-Vektorraum,1536
wobei Addition und Skalarmultiplikation auf die naturliche Weise definiert sind (Hausaufgabe).1537
• Die Menge V aller Funktionen f : K → K bildet einen Vektorraum. Dabei ist die Abbildung f + g1538
definiert durch (f + g)(x) := f(x) + g(x) und λf durch (λf)(x) := λ · f(x). Der Nullvektor ist hier1539
die Abbildung, die jedes Element auf 0 abbildet. Wieder weisen wir nur eine Eigenschaft als Beispiel1540
nach. Seien f, g Vektoren und λ ∈ K. Wir wollen zeigen, dass1541
λ · (f + g) = λ · f + λ · g.
Dafur weisen wir nach, dass die beiden Funktionen links und rechts fur jedes x ∈ K das gleiche1542
Ergebnis liefern:1543
(λ·(f+g))(x) = λ·(f+g)(x) = λ(f(x)+g(x)) = λf(x)+λg(x) = (λ·f)(x)+(λ·g)(x) = (λ·f+λ·g)(x)
54 KAPITEL 3. LINEARE ALGEBRA, TEIL I
• Die Menge {~0} ist ein K-Vektorraum fur jedes K. Dieser Vektorraum wird trivialer Vektorraum1544
genannt.1545
Theorem 3.7. In jedem K-Vektorraum V gilt:1546
• 0 · v = ~0 fur alle v ∈ V1547
• λ ·~0 = ~0 fur alle λ ∈ K.1548
Beweis. Es gilt1549
v + 0 · v = 1 · v + 0 · v = (1 + 0) · v = 1 · v = v
Also gilt nach beidseitiger Addition von −v, dass 0 · v = ~0.1550
Fur die zweite Aussage sehen wir1551
λ~0 = λ(~0 +~0) = λ~0 + λ~0
und die Aussage folgt durch Subtraktion von λ~0 auf beiden Seiten.1552
Theorem 3.8. Sei V ein K-Vektorraum und U ⊆ V eine Teilmenge, so dass gilt:1553
1. U 6= ∅1554
2. a, b ∈ U ⇒ a+ b ∈ U1555
3. a ∈ U , λ ∈ K ⇒ λa ∈ U .1556
Dann ist auch U ein K-Vektorraum. Wir nennen dann U einen Unter(vektor)raum von V .1557
Beweis. Wir mussen fur U die Vektorraumaxiome nachweisen. Die Gleichungen in (V2) und (V3) von1558
Definition 3.6 gelten sicherlich auch fur alle Elemente von U , da U eine Teilmenge von V ist. Es ist nur1559
nachzuweisen, dass (U,+) eine abelsche Gruppe ist. Die Kommutativitat und das Assoziativgesetz sind klar,1560
denn sie gelten wiederum fur alle Elemente aus V . Es gilt ferner:1561
– ~0, der Nullvektor von V , ist ein Element von U : Da U nicht leer ist, gibt es ein a ∈ U . Nach der dritten1562
Eigenschaft ist auch (−1)a = −a in U enthalten. Nach der zweiten Eigenschaft ist dann ~0 = a+ (−a)1563
ebenfalls in U .1564
– Wie gerade gezeigt, ist fur jedes a ∈ U und sein inverses Element −a ∈ U .1565
Damit folgen alle Gruppenaxiome, und daher ist (U,+) ein Unterraum.1566
Als Beispiel betrachten wir1567
U :=
x
y0
| x, y ∈ K
Dies ist eine Teilmenge von K3. Es ist auch ein Unterraum, denn1568
– U ist nicht leer.1569
– Fur
x1
y1
0
,
x2
y2
0
in U ist auch
x1 + x2
y1 + y2
0
in U .1570
– Fur λ ∈ K und
xy0
ist auch
λxλy0
in U .1571
3.2. VEKTORRAUME 55
Lemma 3.9. Sei V ein K-Vektorraum. Fur v ∈ V ist1572
{λv | λ ∈ K}
ein Unterraum von V , den wir mit [v] bezeichnen (wir lesen dies als “Spann von v”).1573
Beweis. [v] ist nicht leer, da z.B. v ∈ [V ]. Sind u,w ∈ [v], dann ist u = λ1v, w = λ2v, also u+w = (λ1 +λ2)v,1574
also ebenfalls im Spann. Fur µ ∈ K beliebig ist µu = µ(λ1v) = (µλ1)v, also ebenfalls im Spann.1575
Aus zwei Unterraumen von V lassen sich weitere Unterraume konstruieren:1576
Theorem 3.10. Sind U1, U2 Unterraume von V , so sind auch U1 ∩ U2 sowie1577
U1 + U2 = {v + w | v ∈ U1, w ∈ U2}
Unterraume von V .1578
Beweis. Der Beweis des ersten Teils ist eine Hausaufgabe.1579
Fur die Summe bemerken wir zunachst, dass U1 + U2 nicht leer ist, da weder U1 noch U2 leer ist (wir1580
konnen also zumindest eine Summe bilden). Nun seien a, b ∈ U1 +U2. Das bedeutet, wir konnen a = u1 +u21581
schreiben, mit u1 ∈ U1, u2 ∈ U2. Ebenso ist b = v1 + v2 mit v1 ∈ U1, v2 ∈ U2. Also ist1582
a+ b = (u1 + u2) + (v1 + v2) = (u1 + v1)︸ ︷︷ ︸∈U1
+ (u2 + v2)︸ ︷︷ ︸∈U2
und damit ist a+ b ebenfalls in U1 + U2. Ist λ ∈ K, dann ist1583
λ · a = λu1︸︷︷︸∈U1
+ λu2︸︷︷︸∈U2
,
also ebenfalls in der Summe enthalten.1584
Definition 3.11. Sind v1, . . . , vr ∈ V und λ1, . . . , λr ∈ K, so nennen wir1585
λ1v1 + λ2v2 + . . .+ λrvr
eine Linearkombination von v1, . . . , vr. Fur eine Menge M ⊆ V schreiben wir1586
[M ] := {λ1v1 + λ2v2 + . . . λrvr | λ1, . . . , λr ∈ K}
fur die Menge aller Linearkombinationen (genannt der Spann von M).1587
Lemma 3.12. Fur jede nicht-leere Menge M ⊆ V ist [M ] ein Unterraum von V .1588
Beweis. Wir beweisen die Aussage nur fur den Fall, dass M eine endliche Menge ist. Fur den unendlichen1589
Fall stimmt die Aussage auch, aber es wird eine andere Beweisidee benotigt.1590
Im endlichen Fall kann man die Aussage umformulieren zu:1591
∀n ≥ 1 : |M | = n⇒ [M ] ist Unterraum von V .
Wir beweisen die Aussage durch vollstandige Induktion n. Fur n = 1 ist M = {v1}, also [M ] = [v1], und1592
dies ist ein Unterraum wie in Lemma 3.9 gezeigt.1593
Nun sei M = {v1, . . . , vn+1} eine Menge mit n+1 Elementen. Nach Induktionssannahme ist [{v1, . . . , vn}]1594
ein Unterraum. Andererseits ist aber1595
[{v1, . . . , vn+1] = [{v1, . . . , vn}] + [{vn+1}] ,
also die Summe von zwei Unterraumen: der erste wie aus der Induktionsannahme und der zweite wiederum1596
wie im Lemma 3.9. Wie in Theorem 3.10 gezeigt, ist diese Summe auch wieder ein Vektorraum.1597
56 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Die folgende Aussage druckt aus, dass [M ] der kleinste Unterraum von V ist, welcher M enthalt:1598
Lemma 3.13. Sei W ein Unterraum von V mit M ⊆W . Dann gilt auch [M ] ⊆W .1599
Beweis. Wenn ein Vektorraum Vektoren v1, . . . , vk enthalt, enthalt er notwendigerweise auch jede Linear-1600
kombination dieser Vektoren (einfacher Induktionsbeweis). Die Aussage folgt damit sofort.1601
Als Beispiel betrachten wir im R31602 1
11
,
100
.Dies ist die durch die beiden Vektoren aufgespannte Ebene durch den Ursprung.1603
Definition 3.14. Sei V ein Vektorraum und M ⊆ V . Dann heißt M ein Erzeugendensystem von V , falls1604
[M ] = V . V heißt endlich erzeugt, falls es ein endliches Erzeugendensystem gibt.1605
Zum Beispiel ist der Vektorraum K3 endlich erzeugt, da {
100
,
010
,
001
} ein Erzeugenden-1606
system ist. Dagegen ist der Vektorraum aller Polynome uber K nicht endlich erzeugt. Das kann man wie1607
folgt sehen: Eine endliche Menge von Polynomen {p1, . . . , pn} hat einen maximalen Grad D (d.h. jedes1608
Polynom hat Grad ≤ D). Jede Linearkombination von {p1, . . . , pn} hat dann auch Grad ≤ D, denn der1609
Grad kann sich durch Addition von Polynomen sowie durch Multiplikation mit einem Korperelement nicht1610
vergroßern. Damit erreicht der Spann von v1, . . . , vn nicht alle Polynome.1611
1612
Hausaufgabe 3.2.1. Sei (V,+, ·) ein Vektorraum uber den Korper K. Sei α ∈ K und v ∈ V . Nennen wir1613
−v das inverse Element von v fur + und −α das inverse Element von α fur die Addition in K. Beweisen1614
Sie folgende Eigenschaften:1615
a. −1 · v = −v,1616
b. (−α) · v = α · (−v).1617
Hausaufgabe 3.2.2. Weisen Sie nach, dass die Polynome uber den Korper K einen Vektorraum bilden.1618
Hausaufgabe 3.2.3. Sei V ein K-Vektorraum, λ ∈ K und v ∈ V . Zeigen Sie: Ist λ · v = ~0, so ist λ = 01619
oder v = ~0.1620
Hausaufgabe 3.2.4. Ist die Menge1621
U :=
x
y1
| x, y ∈ K
ein Unterraum von K3?1622
Hausaufgabe 3.2.5. Beweisen Sie, dass der Schnitt zweier Unterraume wiederum ein Unterraum ist. Gilt1623
dies auch fur die Vereinigung von zwei Unterraumen?1624
Hausaufgabe 3.2.6. Geben Sie einen Vektorraum mit genau 16 Elementen und einen Vektorraum mit1625
genau 125 Elementen an. Schließen Sie daraus eine allgemeine Regel fur die Konstruktion von endlichen1626
Vektorraumen.1627
3.3. LINEARE ABHANGIGKEIT 57
3.3 Lineare Abhangigkeit1628
Nehmen wir an, dass unser Vektorraum V endlich erzeugt ist. Wir wollen nun ein kleinstes Erzeugenden-1629
system definieren. Eine Moglichkeit ware zu sagen, dass ein Erzeugendensystem M minimal ist, wenn das1630
Weglassen eines Elementes x ∈M dazu fuhrt, dass M \ x kein Erzeugendensystem mehr ist.1631
Offenbar hat {
100
,
010
,
001
} jene Eigenschaft, denn wenn wir einen der Vektoren weglassen,1632
bleibt die entsprechende Koordiante immer 0. Allerdings ist es nicht ohne weiteres klar, dass es kein Erzeu-1633
gendensystem von K3 gibt, welches nur aus zwei Elementen besteht. Ebensowenig ist es klar, ob es nicht1634
auch ein minimales Erzeugendensystem mit 4 oder mehr Elementen geben konnte. Es ist auch nicht ohne1635
weiteres klar, ob es einen Unterraum eines endlich erzeugten Vektorraums gibt, der nicht endlich erzeugt1636
ist.1637
Die Theorie, die wir nun entwickeln werden, zeigt, dass die oben genannten Falle nicht auftreten konnen.1638
In einem endlich erzeugten Vektorraum haben alle minimalen Erzeugendensysteme die gleiche Grosse. Die1639
Anzahl dieser Element nennt man die Dimension des Vekttoraums. Ferner ist ein Unterraum eines n-1640
dimensionalen Vektorraums endlich erzeugt und hat eine Dimension von hochstens n.1641
Lemma 3.15. Sei M ⊆ V und sei x ∈ M , so dass x ∈ [M \ {x}] (d.h., x ist als Linearkombination von1642
anderen Elementen in M darstellbar). Dann ist [M ] = [M \ {x}].1643
Beweis. Es ist klar, dass [M \ {x}] ⊆ [M ]. Fur die andere Richtung beobachten wir, dass M ⊆ [M \ {x}]1644
nach Voraussetzung. Da [M \ {x}] ein Unterraum ist, der M enthalt, ist nach Lemma 3.13 auch [M ] ⊆1645
[M \ {x}].1646
Fur spater bemerken wir:1647
Korollar 3.16. Seien v1, . . . , vn ∈ V und sei1648
v = λ1v1 + . . .+ λnvn
mit λi 6= 0. Dann ist1649
[v1, . . . , vn] = [v1, . . . , vi−1, v, vi+1, . . . , vn] .
Beweis. Setze M := {v1, . . . , vn, v}. Da v Linearkombination der restlichen Elemente ist, ist [v1, . . . , vn] =1650
[M ] nach dem vorherigen Lemma. Andererseits ist auch vi eine Linearkombination der anderen Elemente,1651
da1652
vi = − 1
λiv +
λ1
λiv1 +
λ2
λiv2 + . . .+
λnλivn
ist, wobei in der rechten Summe der Summand fur i ausgelassen wird. Also ist auch1653
[v1, . . . , vi−1, v, vi+1, . . . , vn] = [M ]
und die Aussage folgt.1654
Lemma 3.15 zeigt uns: haben wir ein Erzeugendensystem eines Unterraums, konnen wir solange Elemente1655
“herauswerfen”, solange sie Linearkombination anderer Elemente sind. Dieser Prozess endet, wenn wir ein1656
Erzeugendensystem haben, in dem kein Element Linearkombination der restlichen Elemente ist. Die folgende1657
Definition druckt genau diese Eigenschaft aus.1658
Definition 3.17. Eine Menge M ⊆ V (endlich oder unendlich) heißt linear abhangig, wenn es eine endliche1659
Linearkombination1660
λ1x1 + . . .+ λrxr = ~0
gibt mit x1, . . . , xr ∈ V , λ1, . . . , λr ∈ K, und mindestens ein λi 6= 0. Wir nennen eine solche Linearkombina-1661
tion eine nicht-triviale Linearkombination des Nullvektors, im Gegensatz zur trivialen Linearkombination,1662
in der alle Koeffizienten 0 sind.1663
Ist eine Menge nicht linear abhangig, so nennen wir sie linear unabhangig.1664
58 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Wir zeigen zunachst, dass die Definition genau das ausdruckt, was wir oben gesagt haben.1665
Lemma 3.18. Eine Menge M ist linear abhangig genau dann, wenn es ein x ∈ M gibt, dass sich als1666
Linearkombination der Elemente M \ {x} ausdrucken lasst.1667
Beweis. Ist x = λ1v1 + . . .+ λrvr mit v1, . . . , vr ∈M \ {x}, so ist1668
λ1v1 + . . .+ λrvr − x = ~0,
und nicht alle Koeffizienten sind 0, denn z.B. ist der Koeffizient von x gleich −1. Also ist M linear abhangig.1669
Das Argument lasst sich leicht umkehren, um die Ruckrichtung zu beweisen (Hausaufgabe).1670
Daraus folgt nun sofort die folgende Eigenschaft. Der Beweis ist eine Hausaufgabe.1671
Korollar 3.19. Eine Menge M ist linear unabhangig genau dann, wenn fur jedes x ∈M , [M \ {x}] ( [M ].1672
Hier sind nun einige Beispiele:1673
• Die Menge1674 {(23
),
(41
),
(213
)}ist linear abhangig, denn es ist zum Beispiel1675
5
(23
)+ (−2)
(41
)+ (−1)
(213
)=
(10− 8− 215− 2− 13
)= ~0
eine nichttriviale Linearkombination von ~0.1676
• {~0} ist linear abhangig, denn 1 ·~0 = ~0, und 1 ·~0 ist eine nicht-triviale Linearkombination.1677
• Andererseits ist {v} fur v 6= ~0 linear unabhangig, denn λ · v = ~0 bedeutet λ = 0 (Hausaufgabe 3.2.3)1678
• Die Vektoren1679
{
3214
,
2105
,
1006
}sind linear unabhangig. Um das zu sehen, nehmen wir an, dass1680
λ1
3214
+ λ2
2105
+ λ3
1006
= ~0
fur Koeffizienten λ1, λ2, λ3 ∈ K. Schreiben wir das um zu1681 3λ1 + 2λ2 + λ− 3
2λ1 + λ2
λ1
4λ1 + 5λ2 + 6λ3
=
0000
,
so erkennen wir aus der dritten Gleichung, dass λ1 = 0 gelten muss. Damit folgt aber aus der zweiten1682
Gleichung, dass λ2 = 0 gelten muss, und damit aus der ersten Gleichung, dass λ3 = 0 gelten muss.1683
Damit ist also die triviale Linearkombination die einzige Moglichkeit, den Nullvektor zu erhalten.1684
Im letzten Beispiel hat uns die spezielle Struktur der Vektoren geholfen, die lineare Unabhangigkeit1685
nachzuweisen. Im Allgemeinen ist es jedoch nicht ganz klar, wie man lineare Unabhangigkeit nachweist.1686
Lineare Abhangigkeit ist einfacher - man schreibt eine nicht-triviale Linearkombination des Nullvektors auf.1687
Wir kommen spater darauf zuruck.1688
1689
3.4. BASEN 59
Hausaufgabe 3.3.1. Zeigen Sie die Ruckrichtung von Lemma 3.18.1690
Hausaufgabe 3.3.2. Beweisen Sie Korollar 3.19.1691
Hausaufgabe 3.3.3. Was bedeutet es geometrisch, dass zwei Vektoren {x, y} im R2 abhangig sind?1692
Hausaufgabe 3.3.4. Zeigen Sie:1693
a. Ist M linear unabhangig, dann ist jede nicht-leere Teilmenge von M linear unabhangig.1694
b. Ist M linear abhangig, dann ist jede Menge, die M enthalt, ebenfalls linear abhangig.1695
Hausaufgabe 3.3.5. Untersuchen Sie, ob folgende Mengen linear unabhangig sind:1696
a.
(1−1
),
(−11
)in R2
1697
b.
(1−1
),
(11
)in R2
1698
c.
352
,
011
,
362
in R31699
d.
11−1
,
1−11
in R31700
e.
(1−1
),
(11
)in Z2
21701
f.
525
,
111
,
626
in R31702
g.
123
,
012
,
314
in Z351703
h.
024
,
313
,
421
in Z351704
Hausaufgabe 3.3.6. Der K-Vektorraum (RR,⊕,�) der Funktionen von R nach R enthalt unter anderem1705
die Elemente1706
f(x) = 1− x, g(x) = 1 + x, h(x) = x2 + 2x+ 1.
Die Operationen sind wie folgt auf intuitiver Art und Weise definiert:
⊕ : RR × RR → RR � : K × RR → RR
(f, g) 7→ f + g (λ, f) 7→ λf.
Zeigen Sie, das {f, g, h} linear unabhangig ist.1707
Hausaufgabe 3.3.7. Zeigen Sie, dass1708
U1 := {f ∈ RR|f(x) = f(−x) fur alle x ∈ R}
und1709
U2 := {f ∈ RR|f(x) = −f(−x) fur alle x ∈ R}
Unterraume von RR sind. Erklaren Sie auch die geometrischen Eigenschaften von U1 und U2.1710
3.4 Basen1711
Nun studieren wir linear unabhangige Erzeugendensysteme. Wir geben diesen einen kurzen Namen:1712
Definition 3.20. Eine Menge M heißt Basis von V , wenn gilt:1713
1. [M ] = V , d.h. M ist Erzeugendensystem von V ,1714
2. M ist linear unabhangig.1715
Eine Basis ist ein “kleinstes” Erzeugendensystem eines Vektorraums, denn nach Lemma 3.18 fuhrt das1716
Weglassen eines Basiselements dazu, dass die verkleinerte Menge kein Erzeugendensystem mehr ist.1717
60 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Theorem 3.21. Jeder endlich erzeugte Vektorraum hat eine Basis.1718
Beweis. Ist der Vektorraum V endlich erzeugt durch M , dann gibt es zwei Falle. Ist M linear unabhangig,1719
sind wir fertig, denn dann ist M eine Basis. Sonst gibt es ein x ∈ M , welches Linearkombination der1720
restlichen Elemente ist, und Weglassen von x ergibt ein kleineres Erzeugendensystem. Wir wiederholen1721
dieses Verfahren so lange, bis die Menge linear unabhangig ist. Das muss nach endlich vielen Schritten1722
passieren, da M endlich ist.1723
Es gilt sogar allgemeiner, dass jeder Vektorraum eine Basis hat. Der Beweis von oben funktioniert aber1724
nicht fur diesen allgemeinen Fall.1725
Der folgende Satz sagt aus, dass wir unter bestimmten Voraussetzungen eine Basis durch eine andere1726
austauschen konnen.1727
Theorem 3.22 (Austauschsatz von Steinitz). Sei M = {b1, . . . , bn} eine Basis von V . Sei1728
v = λ1b1 + . . .+ λnbn
mit λi 6= 0 fur einen Index i. Dann ist auch1729
M ′ := {b1, . . . , bi−1, v, bi+1, . . . , bn}
eine Basis von V .1730
Beweis. Beachten Sie, dass [M ′] = [M ] gilt, wie wir in Lemma 3.16 gesehen haben. Es ist nur noch zu1731
zeigen, dass M ′ linear unabhangig ist. Dafur fixieren wir einen Linearkombination1732
λ1b1 + . . .+ λi−1bi−1 + λiv + λi+1bi+1 + . . .+ λnbn = ~0.
Nun zeigen wir zuerst, dass λi = 0 gelten muss. Falls dem nicht so ist, konnen wir v als Linearkombination1733
von {b1, . . . , bi−1, bi+1, . . . , bn} darstellen:1734
v = −λ1
λib1 − . . .−
λi−1
λibi−1 −
λi+1
λibi+1 − . . .−
λnλibn
und damit ist [M ] = [M ′] = [M − {bi}], was Korollar 3.19 widerspricht. Also ist λi = 0. Damit vereinfacht1735
sich die obige Linearkombination zu1736
λ1b1 + . . .+ λi−1bi−1 + λi+1bi+1 + . . .+ λnbn = ~0.
Da {b1, . . . , bn} linear unabhangig ist, ist auch die Teilmenge {b1, . . . , bi−1, bi+1, . . . , bn} linear unabhangig1737
(Hausaufgabe). Damit folgt nach Definition, dass die Koeffizienten λ1, . . . , λi−1, λi+1, . . . , λn ebenfalls alle1738
gleich 0 sind. Das beweist die lineare Unabhangigkeit von M ′.1739
Mit Hilfe des Austauschsatzes konnen wir beweisen, dass alle Basen eines Vektorraumes die gleiche1740
Anzahl an Elementen haben:1741
Theorem 3.23. Sei B = {b1, . . . , bn} eine Basis von V . Dann ist jede Menge M := {v1, . . . , vn+1} mit1742
n+ 1 Elementen in V linear abhangig.1743
Beweis. Durch Widerspruch. Nehmen wir an, M sei linear unabhangig. Dann ist jedes vi 6= ~0, denn eine1744
Menge, die den Nullvektor enthalt, ist immer linear abhangig. Da [B] = V , konnen wir schreiben1745
v1 = λ1b1 + . . .+ λnbn,
und weil v1 6= ~0, ist mindestens eines der λi 6= 0. Nehmen wir an, λ1 6= 0, (sonst vertausche die Indices der1746
bi). nach dem Austauschsatz 3.22 auch {v1, b2, . . . , bn} eine Basis.1747
Nun fahren wir induktiv fort: Ist {v1, . . . , vi, bi+1, . . . , bn} eine Basis, dann gibt es eine Linearkombination1748
vi+1 = λ1v1 + . . .+ λivi + λi+1bi+1 + . . .+ λnbn.
3.4. BASEN 61
Es kann nun nicht sein, dass λi+1 + . . . + λn = 0 gilt, denn dann ware vi+1 eine Linearkombination von1749
v1, . . . , vi und alsoM linear abhangig. Also ist wenigstens einer der Koeffizienten λi+1, . . . , λn ungleich 0. Wir1750
konnen wieder annehmen, dass λi+1 6= 0 gilt. Nach dem Austauschsatz ist dann {v1, . . . , vi+1, bi+2, . . . , bn}1751
ebenfalls eine Basis.1752
Nach n Schritten erhalten wir damit, dass {v1, . . . , vn} ebenfalls eine Basis von V ist. Damit ist aber vi+11753
als Linearkombination der v1, . . . , vn darstellbar, was der linearen Unabhangigkeit von M widerspricht.1754
Definition 3.24. Fur einen endlich erzeugten Vektorraum V ist die Dimension dim(V ) die Anzahl der1755
Elemente einer beliebigen Basis von V . Der triviale Vektorraum {~0} hat Dimension 0. Nicht endlich-erzeugte1756
Vektorraume nennen wir unendlichdimensional.1757
Zum Beispiel ist innerhalb von R3 ein zweidimensionaler Vektorraum mit Basis v1, v2 die (eindeutige)1758
Ebene, die den Ursprung, v1 und v2 enthalt. Ein eindimensionaler Vektorraum mit Basis v ist die Ursprungs-1759
gerade durch v. Der Dimensionsbegriff entspricht also in der Tat unserer intuitiven Vorstellung.1760
Wir besprechen nun einige weitere Eigenschaften von Basen. Die folgende angenehme Eigenschaft werden1761
wir haufig verwenden:1762
Theorem 3.25. Ist M eine Basis von V , dann lasst sich jedes x ∈ V eindeutig als Linearkombination von1763
Elementen in M schreiben.1764
Beweis. Da [M ] = V , gibt es mindestens eine Linearkombination fur x. Gibt es zwei Darstellungen
x = λ1v1 + . . .+ λnvn
x = µ1v1 + . . .+ µnvn,
dann fuhrt Subtraktion zur Linearkombination1765
~0 = (λ1 − µ1)v1 + . . .+ (λn − µn)vn.
Da die v1, . . . , vn linear unabhangig sind, muss also λi − µi = 0 fur alle i gelten, also λi = µi fur alle i.1766
Damit sind die beiden Darstellungen von x gleich.1767
Eine linear unabhangige Menge M eines n-dimensionalen Vektorraums V ist die Basis des Unterraums1768
[M ]. Der folgende Satz sagt aus, dass man M immer zu einer Basis von M erweitern kann.1769
Theorem 3.26 (Basiserweiterungssatz). Sei {v1, . . . , vi} eine linear unabhangige Menge in einem n-dimen-1770
sionalen Vektorraum V . Dann ist i ≤ n, und es gibt (n− i) Vektoren vi+1, . . . , vn, so dass {v1, . . . , vn} eine1771
Basis von V ist.1772
Eine Konsequenz des Theorems ist, dass V der einzige n-dimensionale Unterraum von V ist. Der Beweis1773
lauft ahnlich ab wie in Satz 3.23 (allerdings ohne Widerspruch): Man startet mit irgendeiner Basis von1774
V und ersetzt sukzessive die Basisvektoren mit v1, . . . , vn. Nach dem Austauschsatz erhalt man in jedem1775
Schritt eine Basis, und nach i Schritten ist die gewunschte Basis erreicht. Wir lassen weitere Details weg.1776
Erinnern Sie sich, dass wir zwei Vektorraume U , V auch U ∩ V und U + V stets Vektorraume sind. Das1777
folgende Resultat setzt die Dimensionen dieser Raume in Beziehung zueinander.1778
Theorem 3.27 (Dimensionssatz). Sind U und V endlich-dimensionale Vektorraume, so gilt1779
dimU + dimV = dim(U ∩ V ) + dim(U + V )
Beweis. Wir starten mit einer Basis {w1, . . . , ws} von U ∩ V mit s = dim(U ∩ V ). Dies ist ein Unterraum1780
sowohl von U als auch von V . Wir konnen also sowohl zu einer Basis {w1, . . . , ws, us+1, . . . , un} von U , also1781
auch zu einer Basis {w1, . . . , ws, vs+1, . . . , vm} von V erweitern, mit n = dimU und m = dimV .1782
Nun gilt, dass {w1, . . . , ws, us+1, . . . , un, vs+1, . . . , vm} eine Basis von U + V ist (wir lassen den Beweis1783
fur diese nicht ganz offensichtliche Aussage weg). Daraus folgt dann, dass dim(U + V ) = n + m − s =1784
dimU + dimV − dim(U ∩ V ).1785
62 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Wir konnen den Dimensionssatz geometrisch deuten. Sei U ein zweidimensionaler Unterraum des R3,1786
und V ein eindimensionaler Unterraum. Das heißt, U ist eine Ebene durch den Ursprung, und V ist eine1787
Gerade durch den Ursprung. Beachten Sie, dass U + V erzeugt wird durch die Vereinigung der Basen von1788
U und V (Hausaufgabe 3.4.1). Es gibt nun zwei Falle:1789
• Gerade und Ebene schneiden sich nur im Urpsrung. Dann ist U ∩ V = {~0}, der triviale Unterraum,1790
welcher Dimension 0 hat. Nach dem Dimensionssatz ist also dimU+V = 3. In der Tat spannen Ebene1791
und Gerade gemeinsam den gesamten R3 auf.1792
• Die Gerade verlauft in der Ebene. Dann ist V ⊆ U , also ist U ∩ V = V , also dim(U ∩ V ) = 1. Nach1793
Dimensionssatz ist dim(U + V ) = 2. In der Tat ist U + V = U , denn man kann die Ebene durch1794
Hinzunehmen der Gerade nicht verlassen.1795
1796
Hausaufgabe 3.4.1. Es seien U und V Unterraume eines gemeinsamen Vektorraums mit Basen MU und1797
MV . Zeigen Sie, dass U + V durch MU ∪MV erzeugt wird. Ist dies auch immer eine Basis von U + V ?1798
Hausaufgabe 3.4.2. Zeigen Sie, dass folgende Vektoren eine Basis von R4 bilden:1799 1200
,
0230
,
0034
,
5004
.
Hausaufgabe 3.4.3. Im Vektorraum R4 ist ein Unterraum U1 = [b1, b2] mit b1 = (1, 2, 3, 4) und b2 =1800
(1, 0,−1,−2) gegeben. Welche Werte konnen die Dimensionen von U1 ∩ U2 und U1 + U2 fur einen 2-1801
dimensionalen Unterraum U2 annehmen? Geben Sie fur jede Moglichkeit ein konkretes Beispiel fur U2 an.1802
Hausaufgabe 3.4.4. Sei V ein Vektorraum. Seien U,W Unterrume von V . Es gelte dim(U) = 7, dim(W ) =1803
4. Zeigen Sie, welche Dimension U + W und U ∩W haben konnen. Wie groß kann die Dimension von V1804
sein?1805
Hausaufgabe 3.4.5. Wir betrachten folgende Vektoren:1806
v1 :=
4231
, v2 :=
2121
, v3 :=
2132
, v4 :=
4222
.
Bestimmen Sie eine Basis des Spanns von {v1, v2, v3, v4}.1807
Hausaufgabe 3.4.6. Sei M eine unendliche Menge, K ein Korper. Zeigen Sie, dass KM ein unendlich-1808
dimensionaler Vektorraum ist.1809
1810
3.5 Lineare Abbildungen1811
Seine wahre Kraft entfaltet die Theorie der Vektorraume erst, wenn wir Abbildungen zwischen Vektorraumen1812
betrachten.1813
Im folgenden werden wir die Basis eines Vektorraums nicht mehr als Menge {b1, . . . , bn}, sondern als1814
Tupel (b1, . . . , bn) schreiben, also eine Reihenfolge fixieren.1815
Definition 3.28. Seien V und W K-Vektorraume. Eine Abbildung1816
f : V →W
heißt linear, wenn gilt,1817
3.5. LINEARE ABBILDUNGEN 63
1. f(x+ y) = f(x) + f(y) fur alle x, y ∈ V ,1818
2. f(λx) = λf(x) fur alle x ∈ V und λ ∈ K.1819
Man kann die Linearitat alternativ auch mit nur einer Bedingung ausdrucken: Eine Abbildung ist linear1820
genau dann wenn1821
f(λx+ y) = λf(x) + f(y)
fur alle x, y ∈ V und λ ∈ K.1822
Beachten Sie, dass eine lineare Abbildung immer ~0 auf ~0 abbildet (Hausaufgabe).1823
Der nachste Satz besagt, dass eine lineare Abbildung f : V → W eindeutig festgelegt ist, wenn wir die1824
Bilder einer Basis V fixieren.1825
Theorem 3.29. Ist B = (b1, . . . , bn) eine Basis von V und a1, . . . , an ∈ W beliebig, dann gibt es genau1826
eine lineare Abbildung f : V →W mit f(bi) = ai fur i = 1, . . . , n.1827
Beweis. Wir zeigen zuerst, dass es eine solche lineare Abbildung gibt: Fur v ∈ V gibt es eine eindeutige1828
Linearkombination bezuglich der Basis B:1829
v = λ1b1 + . . .+ λnbn
Wir setzen nun1830
f(v) := λ1a1 + . . .+ λnan.
Es ist dann f(bi) = ai, und f ist linear, wie wir nun nachrechnen. Sei v wie oben, und w = µ1b1 + . . .+µnbnein anderer Vektor aus V , und ν ∈ K. Dann ist
f(νv + w) = f(νλ1b1 + . . .+ νλnbn + µ1b1 + . . .+ µnbn)
= f((νλ1 + µ1)b1 + . . .+ (νλn + µn)bn)
= (νλ1 + µ1)a1 + . . .+ (νλn + µn)an
= ν(λ1a1 + . . .+ λnan) + (µ1a1 + . . .+ µnan)
= νf(v) + f(w).
Es gibt also mindestens eine lineare Abbildung f mit der gewunschten Eigenschaft. Ist g eine beliebige1831
lineare Abbildung mit dieser Eigenschaft, dann ist mit v wie oben:1832
g(v) = g(λ1b1 + . . .+ λnbn) = λ1g(b1) + . . .+ λng(bn) = λ1a1 + . . .+ λnan = f(v)
also sind f und g identisch.1833
Als Beispiel betrachten wir einen n-dimensionalen Vektorraum V mit Basis B = (b1, . . . , bn). Fur Kn1834
sei (e1, . . . , en) die Standardbasis, die aus den Einheitsvektoren1835 100...0
,
010...0
, . . . ,
000...1
besteht. Es sei1836
KB : V → Kn
die lineare Abbildung, welche bi auf ei abbildet. Fur ein allgemeines v = λ1b1 + . . .+ λnbn in V gilt dann,1837
KB(v) =
λ1
λ2
...λn
.
64 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Lemma 3.30. Sind f : U → V und g : V →W lineare Abbildungen zwischen Vektorraumen U, V,W , dann1838
gilt:1839
• g ◦ f : U →W ist linear.1840
• Ist f bijektiv, dann ist f−1 : V → U ebenfalls linear.1841
Beweis. Den erste Teil rechnen wir direkt nach:1842
(g ◦ f)(λx+ y) = g(f(λx+ y)) = g(λf(x) + f(y)) = λg(f(x)) + g(f(y)) = λg ◦ f(x) + g ◦ f(y).
Fur den zweiten Teil nehmen wir y1, y2 ∈ Y und λ ∈ K. Da f bijektiv ist, gibt es x1, x2 ∈ U mit1843
f(x1) = y1 und f(x2) = y2. Mit Hilfe der Linearitat von f rechnen wir nach:1844
f−1(λy1 + y2) = f−1(λf(x1) + f(x2)) = f−1(f(λx1 + x2)) = λx1 + x2 = λf−1(y1) + f−1(y2).
1845
Definition 3.31. Eine lineare bijektive Abbildung f : V →W heißt Vektorraumisomorphismus. V und W1846
heißen isomorph, wenn es einen Vektorraumisomorphismus V →W gibt.1847
Isomorph ist griechisch fur “von der gleichen Gestalt”. In der Tat werden zwei isomorphe Vektorraume1848
als gleich angesehen: man kann ganz beliebig von V nach W und zuruck wechseln, ohne die Struktur zu1849
andern. Zum Beispiel ist die Abbildung KB : V → Kn von oben ein Vektorraumisomorphismus. Das zeigt1850
sofort:1851
Theorem 3.32. Ein K-Vektorraum V mit dimV = n <∞ ist isomorph zu Kn.1852
Das heißt also, dass sich die Theorie der endlichdimensionalen Vektorraume sehr vereinfacht: Bis auf1853
Isomorphie ist Kn der einzige n-dimensionale K-Vektorraum.1854
Definition 3.33. Sei f : V →W linear. Dann ist
ker f := {x ∈ V | f(x) = ~0} (Kern von f)
Imf := {y ∈W | ∃x ∈ V : f(x) = y} (Bild von f)
Theorem 3.34. ker f ist ein Unterraum von V , und Imf ist ein Unterraum von W . Falls V endlich-1855
dimensional ist, gilt auch1856
dim ker f + dim Imf = dimV
Beweis. Fur ker f weisen wir die drei Eigenschaften aus Theorem 3.8 nach: Da f(~0) = ~0, ist ker f nicht1857
leer. Ausserdem ist mit a, b ∈ ker f auch f(a + b) = f(a) + f(b) = ~0 + ~0 = ~0, also a + b ∈ ker f . Ebenso1858
ist f(λa) = λf(a) = λ~0 = ~0, also λa ∈ ker f . Der Beweis, dass Imf ein Unterraum von W ist, geht ahnlich1859
einfach.1860
Zum Beweis der Dimensionsformel setzen wir n := dimV . Wir fixieren eine Basis des Kerns {b1, . . . , br}1861
(mit r ≤ n) und erweitern diese Basis zu einer Basis {b1, . . . , br, br+1, . . . , bn} von V . Da dies eine Basis von1862
V ist, ist das Bild von f durch die Bilder der Basisvektoren erzeugt, also1863
Imf =
{f(b1)︸ ︷︷ ︸=~0
, . . . , f(br)︸ ︷︷ ︸=~0
, f(br+1), . . . , f(bn)}
= [f(br+1), . . . , f(bn)}] .
Beachten Sie, dass wir n = dimV und r = dim ker f fixiert haben. Also mussen wir zeigen, dass dim Imf =1864
n− r gilt. Wie wir gerade gezeigt haben, ist Imf durch n− r Vektoren, namlich f(br+1), . . . , f(bn) erzeugt.1865
Wir mussen nur noch argumentieren, dass diese Vektoren eine Basis bilden, d.h. linear unabhangig sind.1866
Seien also λr+1, . . . , λn ∈ K und1867
~0 = λr+1f(br+1) + . . .+ λnf(bn).
3.6. MATRIZEN 65
Wegen der Linearitat von f folgt1868
~0 = f(λr+1br+1 + . . .+ λnbn︸ ︷︷ ︸=:v
),
also ist v ∈ ker f . Damit laßt sich v als Linearkombination von b1, . . . , br schreiben, da dies eine Basis des1869
Kerns ist. Also1870
v = λ1b1 + . . .+ λrbr
fur gewisse λ1, . . . , λr ∈ K. Nach Definition von v gilt also1871
λr+1br+1 + . . .+ λnbn = λ1b1 + . . .+ λrbr
und somit1872
~0 = −λ1b1 − . . .− λrbr + λr+1br+1 + . . .+ λnbn.
Da b1, . . . , bn eine Basis, und damit insbesondere linear unabhangig ist, folgt, dass alle λi Null sein mussen.1873
Also ist insbesondere λr+1 = . . . = λn = 0, was die lineare Unahbhangigkeit von f(br+1), . . . , f(bn) zeigt.1874
1875
Hausaufgabe 3.5.1. Sei f linear. Zeigen Sie, dass f(~0) = ~0.1876
Hausaufgabe 3.5.2. Zeigen Sie, dass eine lineare Abbildung f genau dann injektiv ist, wenn ker f der1877
triviale Unterraum ist.1878
Hausaufgabe 3.5.3. Es sei die lineare Abbildung f : V →W festgelegt durch f(bi) = ai, wobei (b1, . . . , bn)1879
eine Basis von V ist. Zeigen Sie: f ist bijektiv genau dann wenn (a1, . . . , an) eine Basis von W ist.1880
Hausaufgabe 3.5.4. Wir definieren eine Relation ∼ auf K-Vektorraumen durch V ∼W genau dann wenn1881
V und W isomorph sind. Ist ∼ eine Aquivalenzrelation? Was ist die Aquivalenzklasse von Kn?1882
Hausaufgabe 3.5.5. Zeigen Sie, dass Imf , f linear, ein Unterraum ist, wie es in Theorem 3.34 behauptet1883
ist.1884
Hausaufgabe 3.5.6. Sei dimV > dimW . Beweisen Sie, dass es keine injektive lineare Abbildung von V1885
nach W gibt. (Tipp: Verwenden Sie die Hausaufgabe 3.5.2)1886
Hausaufgabe 3.5.7. Sei dimV = dimW . Beweisen Sie, dass eine lineare Abbildung von V nach W injektiv1887
ist, genau dann wenn sie surjektiv ist. (Tipp: Verwenden Sie Hausaufgabe 3.5.2)1888
Hausaufgabe 3.5.8. Welche der folgenden Abbildungen f : K3 → K2 sind linear? (K beliebiger Korper,1889
wenn nicht anders angezeigt)1890
a. (x1, x2, x3) 7→ (x21 + x2
2, 0) fur K = R,Z2.1891
b. (x1, x2, x3) 7→ (0, x1 + x2 + x3)1892
c. (x1, x2, x3) 7→ (1, x1)1893
d. (x1, x2, x3) 7→ (x1, x1 + x2)1894
e. (x1, x2, x3) 7→ (x1, x1)1895
66 KAPITEL 3. LINEARE ALGEBRA, TEIL I
3.6 Matrizen1896
Wir mochten nun lineare Abbildungen von Kn nach Km genauer studieren. Wir fuhren dafur Matrizen als1897
Hilfsmittel ein.1898
Definition 3.35. Eine (m × n)-Matrix A uber einem Korper K ist eine Menge von Elementen aij ∈ K1899
mit 1 ≤ i ≤ m, 1 ≤ j ≤ n. Wir schreiben1900
A =
a11 a12 · · · a1n
a21 a22 · · · a2n
......
. . ....
am1 am2 · · · amn
Im Fall n = 1 ergibt sich der Spezialfall eines Spaltenvektors1901
a11
a21
...am1
und im Fall n = 1 ein Zeilenvektor1902 (
a11 a12 · · · a1n
).
Wir bezeichen die Menge aller (m× n)-Matrizen uber K als Km×n.1903
Wir definieren auch eine Addition auf Km×n auf die offensichtliche Art:1904 a11 a12 · · · a1n
a21 a22 · · · a2n
......
. . ....
am1 am2 · · · amn
+
b11 b12 · · · b1nb21 b22 · · · b2n...
.... . .
...bm1 bm2 · · · bmn
=
a11 + b11 a12 + b12 · · · a1n + b1na21 + b21 a22 + b22 · · · a2n + b2n
......
. . ....
am1 + bm1 am2 + bm2 · · · amn + bmn
Wir definieren auch eine Multiplikation von Matrizen A ∈ Km×r und B ∈ Kr×n (d.h., die Anzahl der1905
Spalten von A ist gleich der Anzahl der Zeilen von B). Zunachst behandeln wir den Fall n = m = 1. Dafur1906
definieren wir die Multiplikation von Zeilen- und Spaltenvektor durch1907
(a1 a2 · · · ar
)·
b1b2...br
:= a1b1 + a2b2 + . . .+ arbr.
Fur A ∈ Km×r und B ∈ Kr×n definieren wir A ·B als eine (m× n)-Matrix C, wobei the Eintrag cij in der1908
Matrix das Produkt der i-ten Zeile von A mit der j-ten Spalte von B ist:1909
cij :=(ai1 ai2 · · · air
)·
b1jb2j...brj
=
r∑k=1
aikbkj
Als Spezialfall ergibt fur A ∈ Km×n und einen Vektor v ∈ Kn die Multiplikation Av einen Spaltenvektor1910
in Km.1911
Hier sind ein paar Beispiel zum Nachrechnen.1912
3.6. MATRIZEN 67
(0 12 3
)·(
3 21 0
)=
(1 09 4
)(
3 21 0
)·(
0 12 3
)=
(4 90 1
)(
2 1 3 61 0 0 2
)·
0131
=
(162
)
Fur λ ∈ K bezeichnen λ · A die Matrix, die entsteht, wenn jeder Eintrag mit λ multipliziert wird. Es1913
gelten die folgenden Rechenregeln:1914
A(B + C) = AB +AC, (B + C)A = BA+ CA ∀A ∈ Km×n, B,C ∈ Kn×k
1915
A(λ ·B) = λ · (AB) ∀A ∈ Km×n, B ∈ Kn×k, λ ∈ K.
Der Nachweis dieser Regeln erfolgt durch direktes Nachrechnen. Da dies etwas langlich ist, fuhren wir1916
es nur fur die erste Gleichung A(B +C) = AB +AC durch: Auf der linken Seite steht, nach Definition des1917
Matrixprodukts, im i, j-Eintrag:1918
r∑k=1
aik(bkj + ckj) =
r∑k=1
aikbkj +
r∑k=1
aikckj .
Auf der rechten Seite steht an der gleichen Stelle1919
r∑k=1
aikbkj +
r∑k=1
aikckj ,
also sind die Matrizen in der Tat in jedem Eintrag gleich.1920
Fur A ∈ Km×n ist die transponierte Matrix AT ∈ Kn×m gegeben durch1921
AT =
a11 a21 · · · an1
a12 a22 · · · an2
......
. . ....
a1m a2m · · · anm
Es gilt (Nachweis ahnlich wie oben), dass1922
(A ·B)T = BT ·AT .
Lemma 3.36. Sei A ∈ Km×n eine Matrix. Dann ist1923
Kn → Km,
x1
...xn
7→ A ·
x1
...xn
eine lineare Abbildung.1924
Wir werden es vermeiden, fur diese Abbildung einen neuen Namen einzufuhren und bezeichnen mit A1925
sowohl die Matrix, als auch die Abbildung.1926
Beweis. Das folgt sofort aus den Rechenregeln von oben, denn A(x+ λy) = Ax+Aλy = Ax+ λAy.1927
68 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Jede Matrix A ∈ Km×n entspricht also einer linearen Abbildung Kn → Km. Es ist vielleicht erstaunlich,1928
dass auch die Ruckrichtung gilt: Jede lineare Abbildung f : Kn → Km kann als Matrix geschrieben werden.1929
Lemma 3.37. Sei f : Kn → Km eine lineare Abbildung. Dann gibt es ein A ∈ Km×n, so dass fur1930
alle x ∈ Kn gilt, dass f(x) = Ax. Dabei ist die j-te Spalte von A als f(ej) gegeben, wobei ej der j-te1931
Einheitsvektor von Kn ist.1932
Beweis. Die Matrix A wie oben beschrieben definiert eine lineare Abbildung. Ferner gilt fur 1 ≤ j ≤ n, dass1933
A · ej = A ·
0...010...0
=
a1j
...amj
= f(ej),
d.h., f und A stimmen auf den Bilder der Basisvektoren e1, . . . , en uberein. Nach Theorem 3.29 heißt das1934
aber schon, dass die Abbildungen gleich sein mussen.1935
Der folgende Satz erklart, warum wir die Matrixmultiplikation auf diese bestimmte Art und Weise1936
eingefugt haben.1937
Lemma 3.38. Seien
f : Kn → Km, x 7→ B · xg : Km → K`, y 7→ A · y
linear mit B ∈ Km×n, A ∈ K`×m. Dann ist die lineare Abbildung1938
g ◦ f : Kn → K`
gegeben durch1939
x 7→ (A ·B)x
Das bedeutet, Matrixmultiplikation entspricht der Hintereinanderausfuhrung der Abbildungen, die durch1940
die Matrizen gegeben sind.1941
Beweis. Der Beweis ist im Prinzip eine Rechnung wie oben, allerdings etwas muhsamer. Fur einen Basis-1942
vektor ei von Kn ist1943
f(ei) =
n∑j=1
bjie′j ,
wobei e′j einen Basisvektor von Km bezeichnet. Genauso ist1944
g(e′j) =∑k=1
akje′′k
mit e′′k ein Basisvektor von K`. Nun konnen wir das Bild von ei unter g ◦ f aufschreiben:1945
(g ◦ f)(ei) = g(
n∑j=1
bjie′j) =
n∑j=1
bjig(e′j) =
n∑j=1
bji∑k=1
akje′′k =
n∑j=1
∑k=1
bjiakje′′k =
∑k=1
n∑j=1
akjbji
e′′k
3.6. MATRIZEN 69
Sei C die Matrix der linearen Abbildung g ◦f . Dann ist nach dieser Rechnung die i-te Spalte von C gegeben1946
durch1947 ∑nj=1 a1jbji∑nj=1 a2jbji
...∑nj=1 a`jbji
.
Das bedeutet aber, cki =∑nj=1 akjbji, also C = AB.1948
Als Beispiel betrachten wir den Vektorraum V aller Polynome vom Grad ≤ 3. Wir verwenden die Basis1949
B = (1, x, x2, x3). Wie ublich ist1950
KB : V → R4, ax3 + bx2 + cx+ d 7→
abcd
Nun betrachten wir folgende Abbildung:1951
δ : V → V, x 7→ K−1B ◦D ◦KB(x) mit D =
0 0 0 03 0 0 00 2 0 00 0 1 0
.
Zum Beispiel ist1952
δ(2x3 + 4x2 − 3x+ 6) = K−1B (D
24−36
) = K−1B (
068−3
) = 6x2 + 8x− 3
Es ist in der Tat so, dass δ die Ableitung eines Polynoms berechnet.1953
Wir kommen nun noch zu einer wesentlichen Definition, die uns im nachsten Abschnitt beschaftigen wird:1954
Definition 3.39. Fur eine Matrix A ∈ Km×n ist der Rang von A definiert als1955
rk A := dim ImA = dim [{A1, . . . , An}]
wobei A1, . . . , An die Spalten von A sind.1956
Lemma 3.40. rk A ist die maximale Anzahl von linear unabhangigen Spalten in A.1957
Beweis. ImA ist erzeugt von {A1, . . . , An}. Solange diese Menge nicht linear unabhangig ist, losche ein Ai aus1958
der Liste, welches eine Linearkombination der anderen Elemente ist. Wir erhalten eine linear unabhangige1959
Menge von Spalten; nehmen wir der Einfachheit halber an, die Spalten A1, . . . , Ar bleiben ubrig. Dann ist1960
ImA = [A1, . . . , Ar], also dim ImA = r. Andererseits kann es keine grossere Menge von linear unabhangigen1961
Spalten geben, denn diese wurden dann einen (mindestens) (r + 1)-dimensionalen Unterraum von ImA1962
erzeugen.1963
Es gilt daruberhinaus auch, dass rk A = rk AT (Beweis lassen wir weg). Damit ist rk A auch die1964
maximale Anzahl an linear unabhangigen Zeilen einer Matrix. Als Beispiel betrachten wir1965
A =
(3 2 4 3 2 16 5 1 −1 0 3
)
70 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Es gilt dann1966
rk A = rk AT =
3 62 54 13 −12 01 3
= 2,
denn die beiden Spalten sind offensichtlich linear unabhangig.1967
1968
Hausaufgabe 3.6.1. Weisen Sie nach, dass Km×n mit Matrizenaddition eine abelsche Gruppe ist.1969
Hausaufgabe 3.6.2. Die Matrizenmultiplikation ergibt fur zwei Matrizen A,B ∈ Kn×n wieder eine Matrix1970
C ∈ Kn×n. Wird dadurch Kn×n mit Addition und Multiplikation zu einem Korper?1971
Hausaufgabe 3.6.3. Weisen Sie nach, dass (A ·B)T = BT ·AT .1972
Hausaufgabe 3.6.4. Passen Sie die Funktion δ von oben so an, dass nicht die Ableitung, sondern eine1973
Stammfunktion berechnet wird, d.h. fur ein Polynom f (vom Grad ≤ 3) soll sich ein Polynom g ergeben, so1974
dass g′ = f gilt.1975
3.7 Rechenverfahren1976
Bislang haben wir fur die meisten vorgestellten Konzepte keine allgemeinen Losungsverfahren. Wie findet1977
man fur eine Menge von Vektoren heraus, ob sie linear unabhangig sind? Wie bestimmen wir den Rang1978
einer Matrix? Wir finden wir eine Basis fur den Kern einer linearen Abbildung? Wir werden sehen, dass1979
sich alle diese Fragen mit einem einzigen Verfahren losen lassen, dem Gauß’schen Algorithmus.1980
Definition 3.41. Sei A ∈ Km×n eine Matrix mit Zeilen z1, . . . , zn, d.h.1981
A =
z1
...zm
.
Eine elementare Zeilenoperation auf A ist eine Manipulation der Matrix A zu einer Matrix A′ auf eine der1982
drei folgenden Arten:1983
(1) A′ =
z2
z1
z3
z4
...zn
(2) A′ =
z1
...zi−1
λzizi+1
...zn
(3) A′ =
z1
...zi−1
zi + λzjzi+1
...zn
1. Vertauschen von zwei Zeilen i 6= j (Zeile 1 und 2 im Beispiel).1984
2. Multiplikation einer Zeile zi mit λ ∈ K \ {0}.1985
3. Addition von λ · zj zu zi mit i 6= j.1986
Elementare Spaltenoperationen sind analog definiert.1987
Lemma 3.42. Der Rang einer Matrix andert sich durch eine elementare Zeilen- oder Spaltenoperation1988
nicht.1989
3.7. RECHENVERFAHREN 71
Beweis. Wir zeigen dies zunachst fur eine elementare Spaltenoperation: Erinnern Sie sich, dass der Rang1990
einer Matrix die Dimension des Raums ist, der durch die Spaltenvektoren aufgespannt ist. Es ist vollig klar,1991
dass sich dieser nicht andert, wenn wir die Reihenfolge der Spalten tauschen. Fur die anderen beiden Typen1992
von Operationen verwenden wir Korollar 3.16: Wir ersetzen Ai (die i-te Spalte von A) entweder durch λAi1993
mit λ 6= 0, oder durch Ai + λAj . In beiden Fallen ist die neue Spalte eine Linearkombination der alten1994
Spalten, in welcher der Koeffizient von Ai nicht 0 ist. Daraus folgt, dass sich der Spann der Spalten nicht1995
andert, also auch die Dimension nicht.1996
Fur elementare Zeilenoperationen bemerken wir, dass eine elementare Zeilenoperation auf A eine ele-1997
mentare Spaltenoperation auf AT ist. Da rk A = rk AT , folgt die Aussage damit sofort.1998
Das Lemma besagt naturlich auch, dass eine (endliche) Sequenz von elementaren Zeilen- und Spalten-1999
operationen den Rang nicht andert. Wir konnen also die Matrix durch eine solche Sequenz in eine “schone”2000
Gestalt bringen, fur welche wir den Rang sofort ablesen konnen. Diese Gestalt heißt Zeilenstufenform. In2001
Abbildung 3.1 erklaren wir diese intuitiv. Die formale Definition folgt.2002
Abbildung 3.1: Eine Matrix ist in Zeilenstufenform, wenn sie die abgebildete Gestalt hat: alle Eintrageunterhalb der Trennlinie mussen 0 sein, und alle Eintrage, die mit ∗ gekennzeichnet sind,mussen 6= 0 sein. Fur die restlichen Eintrage oberhalb der Trennlinie fordern wir keineweiteren Eigenschaften. Wir nennen die ∗-Eintrage Pivotelemente.
Definition 3.43. Eine Matrix A ∈ Km×n mit Zeilenvektoren z1, . . . , zm ist in Zeilenstufenform (ZSF),2003
wenn gilt:2004
1. Es gibt ein r ∈ {0, . . . , n}, zi 6= 0 fur i = 1, . . . , r, und zj = 0 fur j = i+ 1, . . . , n.2005
2. Fur i = 1, . . . , r bezeichne ji den kleinsten Spaltenindex fur den zi von 0 verschieden ist. Anders2006
gesagt:2007
ji := min{j | aij 6= 0}(ein solcher Eintrag existiert, da die i-Zeile nicht 0 ist). Es gilt dann2008
j1 < j2 < . . . < jr.
Die Eintrage an den Stellen (i, ji) fır i = 1, . . . , r heißen Pivotelemente von A.2009
Zum Beispiel sind die Matrizen2010 1 3 20 1 50 0 2
0 1 2 30 0 0 70 0 0 0
beide in ZSF. Die erste Matrix hat ihre Pivotelemente an der Stellen (1, 1), (2, 2) und (3, 3). Die zweite2011
Matrix an den Stellen (1, 2) und (2, 4). Dagegen ist die Matrix2012 1 1 4 0 70 0 3 4 00 1 6 1 30 0 0 0 0
72 KAPITEL 3. LINEARE ALGEBRA, TEIL I
nicht in ZSF, da j2 = 3 > 2 = j3 gilt. Die Matrix kann jedoch in ZSF gebracht werden, wenn man die zweite2013
und dritte Spalte vertauscht.2014
Beachten Sie auch, dass die Nullmatrix (mit allen Eintragen = 0) in ZSF ist (wahle r = 0 in der2015
Definition).2016
Theorem 3.44. Jede Matrix kann durch eine Sequenz von elementaren Zeilenoperationen in Zeilenstufen-2017
form gebracht werden.2018
Beweis. Der folgende Beweis ist konstruktiv und gibt ein Verfahren an, welches die gewunschte ZSF erreicht.2019
Man bezeichnet dieses Verfahren als Gauß’sches Eliminationsverfahren.2020
Sei A ∈ Km×n. Ist A die Nullmatrix, ist ZSF bereits erreicht. Sonst wahlen wir uns die Spalte j von2021
A mit kleinstem Index, welche nicht der Nullvektor ist (d.h. A1 = A2 = . . . = Aj−1 = ~0, Aj 6= ~0). Ist der2022
Eintrag aij = 0, so wahlen wir ein i mit aij 6= 0 und vertauschen die i-te und die j-te Zeile. Damit ist2023
a1j 6= 0 sichergestellt. Nun verwenden wir den Eintrag a1j , um alle Eintrage aij mit i > 1 zu eliminieren.2024
Das geschieht mit den Operationen2025
zi ← zi −aija1j
z1
fur i = 2, . . . ,m, wobei zi die i-te Zeile der Matrix ist. Nach diesen Schritten ist die j-te Spalte der Matrix2026
von der Form2027 ∗0...0
mit ∗ = aij 6= 0.2028
Nun betrachte die Matrix A′ ∈ K(m−1)×(n−j), die sich aus den Zeilen 2, . . . ,m und Spalten j + 1, . . . , n2029
zusammensetzt (falls j = n, ist nichts mehr zu tun). Wir bringen diese Matrix nun mit dem gleichen2030
Verfahren in Zeilenstufenform. Beachten Sie, dass Zeilenoperationen in A′ auch als Zeilenoperationen in A2031
aufgefasst werden konnen. Da alle Zeilen in A und in A′ sich nur durch fuhrende Nullen unterscheiden,2032
andert das an der Struktur von A nichts.2033
Wir mussen argumentieren, dass dieses Verfahren immer terminiert (d.h. nach endlich vielen Schritten2034
endet) und in der Tat eine Matrix in Zeilenstufenform liefert. Beachten Sie, dass das Verfahren sukzessive2035
auf immer kleineren Matrizen aufgerufen wird: In der Tat hat A′ eine Zeile weniger als A, und (mindestens)2036
eine Spalte weniger. Das bedeutet, wir mussen nach endlich vielen Iterationen terminieren. Wir erhalten2037
auch in der Tat eine Zeilenstufenform, da wir in jeder Iteration genau ein Pivotelement erzeugen. Wir lassen2038
weitere Details weg.2039
Schauen wir uns ein Beispiel an:2040 0 0 0 0 12 10 4 8 2 12 120 8 16 4 6 210 2 4 1 3 50 6 12 3 21 13
Hier ist j = 2 (die erste nicht-triviale Spalte). Da im Eintrag (1, 2) eine 0 steht, mussen wir die erste Zeile2041
mit einer anderen Zeile tauschen. Wir nehmen hier die vierte Zeile und erhalten2042 0 2 4 1 3 50 4 8 2 12 120 8 16 4 6 210 0 0 0 12 10 6 12 3 21 13
3.7. RECHENVERFAHREN 73
Nun verwenden wir die erste Zeile, um die zweite Spalte zu eliminieren: Wir ziehen von der zweiten Zeile2043
zweimal die erste Zeile ab und erhalten2044 0 2 4 1 3 50 0 0 0 6 20 8 16 4 6 210 0 0 0 12 10 6 12 3 21 13
Nun ziehen wir von der dritten Zeile viermal die erste ab, und von der funften Zeile dreimal die erste:2045
0 2 4 1 3 50 0 0 0 6 20 0 0 0 −6 10 0 0 0 12 10 0 0 0 12 −2
Nun bringen wir die Matrix, die aus den Zeilen 2 − 5 und den Spalten 3 − 6 besteht, in ZSF. Anstatt die2046
kleinere Matrix getrennt hinzuschreiben, fuhren wir dies direkt in der grosseren Matrix durch. Wir sehen,2047
dass die dritte Spalte der kleineren Matrix (d.h. die funfte Spalte der grossen Matrix) die erste nicht- triviale2048
Spalte ist. Hier steht in der obersten Zeile ein von 0 verschiedener Eintrag. Wir verwenden diesen, um den2049
Rest der Spalte zu eliminieren: Wir addieren die erste Zeile zur zweiten Zeile, und subtrahieren zweimal die2050
erste Zeile jeweils von der dritten und vierten Zeile (alles bezuglich der kleineren Matrix).2051 0 2 4 1 3 50 0 0 0 6 20 0 0 0 0 30 0 0 0 0 −30 0 0 0 0 −6
Nun bringen wir die 3× 1-Matrix in der letzten Spalte auf Zeilenstufenform. Das ist nun recht einfach: Wir2052
addieren die erste Zeile einmal auf die zweite Zeile, und zweimal auf die dritte Zeile. Dadurch ergibt sich2053
letztendlich2054 0 2 4 1 3 50 0 0 0 6 20 0 0 0 0 30 0 0 0 0 00 0 0 0 0 0
und diese Matrix ist in Zeilenstufenform. Die drei Pivotelemente sind fett geschrieben.2055
Einige Bemerkungen zu diesem Verfahren2056
• Im Beispiel oben konnten wir Bruche vermeiden. Allerdings ist das nicht immer moglich.2057
• Der zweite Typ von elementaren Zeilenoperationen (Multiplikation einer Zeile mit λ 6= 0) wird im2058
Verfahren nicht verwendet. Allerdings kann es manchmal hilfreich sein, solche Multiplikationen einzu-2059
bauen. Hat man zum Beispiel eine Zeile2060 (17 −51 34
).
Dann lasst sich diese durch Multiplikation von 117 in2061 (
1 −3 2)
uberfuhren. Das kann die Rechnungen erheblich vereinfachen. Man kann dies auch verwenden, um2062
Bruche zu vermeiden, indem man mit dem Hauptnenner multipliziert.2063
74 KAPITEL 3. LINEARE ALGEBRA, TEIL I
• Um eine Spalte zu eliminieren, fuhrt das Verfahren eventuell einen Zeilentausch aus, um einen Nullein-2064
trag in der obersten Zeile zu vermeiden. Selbst wenn der oberste Eintrag nicht 0 ist, ist ein Zeilentausch2065
naturlich erlaubt. Es ist meist ratsam, einen moglichst einfachen Eintrag zu wahlen, mit dem man2066
den Rest eliminert. Hat man zum Beispiel eine Matrix2067 72 ∗ . . . ∗−37 ∗ . . . ∗
1 ∗ . . . ∗103 ∗ . . . ∗
,
so ist es ratsam, die erste und dritte Zeile zu tauschen, bevor man eliminiert.2068
Lemma 3.45. Sei A eine Matrix in Zeilenstufenform mit r von 0 verschiedenen Zeilen. Dann ist rk A = r.2069
Beweis. Es seien z1, . . . , zm die Zeilen von A. Nach Voraussetzung ist zr+1 = zr+2 = . . . = zm = 0.2070
Andererseits ist rk A die Dimension des Raums, der von z1, . . . , zm aufgespannt wird (denn rk A = rk AT ).2071
Da Nullvektoren offenbar nichts zum Spann beitragen, gilt also2072
rk A = dim [z1, . . . , zr] ≤ r.
Um auszuschliessen, dass rk A < r ist, mussen wir zeigen, dass z1, . . . , zr linear unabhangig sind. Das folgt2073
aber leicht aus der Stufenform: Sei2074
λ1z1 + . . .+ λrzr = ~0
fur λ1, . . . , λr ∈ K. Wegen der Zeilenstufenform gibt es einen Spaltenindex j1, so dass z1 6= 0 in der Spalte2075
j1 ist, aber z2, . . . , zr alle in dieser Spalte eine 0 haben. Die Gleichung oben ergibt also in der Komponente2076
j1, dass2077
λ1z(j1)1 + λ2z
(j1)2 + . . .+ λ(j1)
r zr = 0 ⇔ λ1 z(j1)1︸︷︷︸6=0
= 0
d.h. λ1 = 0. Es gibt nun eine Spalte j2, in der z2 von 0 verschieden ist, aber z3, . . . , zn alle 0 sind. Es folgt dann2078
genauso, dass auch λ2 = 0 ist. Wiederholen wir das Argument r-mal, ergibt sich λ1 = λ2 = . . . = λr = 0,2079
also sind z1, . . . , zr linear unabhangig.2080
Wir haben damit ein Rechenverfahren, um den Rang einer beliebigen Matrix zu bestimmen:2081
1. Bringe A auf Zeilenstufenform.2082
2. Zahle die Zeilen, die von 0 verschieden sind.2083
Ebenso haben wir ein Verfahren, um festzustellen, ob Vektoren v1, . . . , vn linear unabhangig sind:2084
1. Berechne den Rang der Matrix A := (v1v2 . . . vn)2085
2. Ist rk A = n, dann sind die Vektoren linear unabhangig, sonst linear abhangig2086
Die Korrektheit folgt daraus, dass der Rang einer Matrix gleich der maximale Anzahl an linear un-2087
abhangigen Spalten ist (Lemma 3.40). Wir hatten die Matrix A auch so definieren konnen, dass ihre Zeilen2088
v1, . . . , vn sind (wiederum, weil rk A = rk AT ).2089
Wir konnen nun auch eine Basis fur den durch v1, . . . , vn aufgespannten Vektorraum berechnen:2090
1. Bringe2091
A :=
v1
...vn
in Zeilenstufenform.2092
2. Die von 0 verschiedenen Zeilen defineren eine Basis von [v1, . . . , vn].2093
3.8. LINEARE GLEICHUNGSSYSTEME 75
In der Tat andern elementare Zeilenoperationen den durch die Zeilen aufgespannten Raum nicht, al-2094
so spannen die von 0 verschiedenen Zeilen der ZSF den Raum [v1, . . . , vn] auf. Wie wir im Beweis von2095
Lemma 3.45 gesehen haben, sind diese Vektoren linear unabhangig, also eine Basis.2096
2097
Hausaufgabe 3.7.1. Zeigen Sie: Falls A′ aus A durch eine elementare Zeilenoperation hervorgeht, dann2098
geht auch A aus A′ durch eine elementare Zeilenoperation hervor.2099
Hausaufgabe 3.7.2. Berechnen Sie den Rang der folgenden Matrizen:2100
a.
1 2 3 42 3 4 53 4 5 64 5 6 7
2101
b.
1 2 3 22 3 4 23 4 5 2
2102
c.
1 2 1 2−2 −3 0 −54 9 6 71 −1 −5 5
2103
d.
1 1 −1 2λ 1 1 11 −1 3 −34 2 0 λ
2104
Hausaufgabe 3.7.3. Berechnen Sie den Rang der n× n-Matrize je nach Werten von a, b ∈ R:2105 a b · · · b
b. . .
. . ....
.... . .
. . . bb · · · b a
3.8 Lineare Gleichungssysteme2106
Betrachten Sie die folgenden mathematischen Problemstellungen:2107
Problem A: Eine Chemikerin hat die folgenden Flussigkeiten zur Verfugung:2108
– 300L mit 80% H2O (Wasser) und 20% andere Stoffe2109
– 1.4L mit 20% H2O und 70% H2SO4 (Schwefelsaure) (und 10% andere Stoffe)2110
– 3.2L mit 40% H2O und 60% H2SO42111
Ist es moglich, daraus eine Flussigkeit zu mischen, die zu 40% aus H2O, 56% aus H2SO4, und 4% aus2112
anderen Stoffen besteht?2113
Problem B: Sei E die Ebene im R3, die durch die Punkte2114 152
,
−124
,
013
aufgespannt wird. Bestimme einen Vektor v ∈ R3, so dass2115
E :={x ∈ R3 | vT · x = 1
}(v ist der Normalenvektor der Ebene).2116
Problem C: Bestimmen Sie ein Polynom vom Grad 4, welches durch die Punkte (−2, 3), (−1, 1), (0,−2),2117
(1, 3) und (2, 0) geht.2118
76 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Alle diese Probleme lassen sich mit der gleichen Technik losen.2119
Definition 3.46. Ein lineares Gleichungssystem (LGS) in den Unbekannten x1, . . . , xn ist eine Sequenzvon Gleichungen der Form
a11x1 + a12x2 + . . .+ a1nxn = b1
a21x1 + a22x2 + . . .+ a2nxn = b2
...
am1x1 + am2x2 + . . .+ amnxn = bm
mit a11, . . . , amn, b1, . . . , bm ∈ K. Ein Vektor
x1
...xn
ist Losung eines LGS, wenn es alle m Gleichungen2120
erfullt. Wir konnen das LGS auch schreiben als2121
Ax = b
mit2122
A = (aij) ∈ Km×n, b =
b1...bm
, x =
x1
...xn
Wir behandeln drei Probleme bezuglich eines gegebenes Gleichungssystems:2123
1. Existiert eine Losung?2124
2. Falls ja, finde eine Losung.2125
3. Finde alle Losungen.2126
Beachten Sie, dass wir eine Matrix in Km×(n+1) als lineares Gleichungssystem auffassen konnen, in dem2127
wir die ersten n Spalten als A und die letzte Spalte als b interpretieren. Wir schreiben (A | b) fur eine solche2128
Matrix. Entscheidend wird die folgende Eigenschaft sein.2129
Lemma 3.47. Die Losungsmenge eines linearen Gleichungssystems (A | b) andert sich bei elementaren2130
Zeilenoperationen nicht.2131
Beweis. Sei x eine Losung von Ax = b. Dann bleibt x offensichtlich eine Losung, wenn man die Reihenfolge2132
der Gleichungen vertausche (erste elementare Operation). x bleibt auch eine Losung, wenn man eine Glei-2133
chung mit einem Vielfachen λ multiplizieren (zweite elementare Operation). Ebenfalls bleibt x eine Losung2134
der i-ten Gleichung, wenn man ein Vielfaches der j-ten Gleichung dazuaddiert (dritte elementare Operati-2135
on). Das bedeutet, dass die Losung x erhalten bleibt. Es kann auch keine neue Losung hinzukommen (das2136
folgt aus Hausaufgabe 3.7.1).2137
Fall b = ~0.2138
Wir betrachten zuerst den Spezialfall Ax = ~0. Hier gibt es immer mindestens eine Losung, namlich x = ~0.2139
Wir werden nun ein Verfahren angeben, alle Losungen zu bestimmen.2140
Zunachst bringen wir A auf Zeilenstufenform. Nach Lemma 3.47 andert sich dabei die Losungsmenge2141
von Ax = ~0 nicht (genau genommen mussten wir die Matrix (A | ~0) betrachten, aber da die letzte Spalte2142
immer gleich ~0 bleibt, konnen wir sie ignorieren). Nennen wir A′ die Zeilenstufenform von A.2143
Nun nennen wir die Variable xi gebunden, falls A′ ein Pivotelement in Spalte i hat. Falls xi nicht2144
gebunden ist, nennen wir es frei. Zum Beispiel sind fur die Matrix2145 1 2 3 40 0 5 60 0 0 0
3.8. LINEARE GLEICHUNGSSYSTEME 77
die Variablen x1 und x3 gebunden (denn in der 1. und 3. Spalte stehen Pivotelemente), und die Variablen2146
x2 und x4 frei.2147
Wir wahlen nun Parameter fur die freien Variablen und drucken die gebundenen Variablen durch diese2148
Parameter aus. Fur jede Wahl der freien Parameter erhalten wir dann eine Losung des Systems (und wir2149
erhalten alle Losungen auf diese Weise).2150
Wir demonstrieren das Verfahren an einem Beispiel:
3x1 + 4x3 + 2x4 = 0
4x1 − x2 + x3 + 4x4 = 0
2x1 + x2 + 7x3 = 0
Als Matrix geschrieben ergibt sich die folgende Matrix, die wir gleich in Zeilenstufenform bringen2151 3 0 4 24 −1 1 42 1 7 0
→ 3 0 4 2
0 −1 − 133
43
0 1 133 − 4
3
→ 3 0 4 2
0 -1 − 133
43
0 0 0 0
Wir sehen, dass x3 und x4 frei sind. Wir setzen x3 auf λ und x4 auf µ, wobei λ, µ ∈ K beliebig sind. Die2152
zweite Zeile der ZSF liefert nun2153
−x2 −13
3λ+
4
3µ = 0 ⇔ x2 = −13
3λ+
4
3µ
Die erste Zeile ergibt2154
3x1 + 4λ+ 2µ = 0 ⇔ x1 = −4
3λ− 2
3µ
Das bedeutet, die Losungen von Ax = ~0 sind von der Form2155 − 4
3λ−23µ
− 133 λ+ 4
3µλµ
= λ
− 4
3− 13
310
+ µ
− 2
34301
oder anders ausgedruckt, die Losungsmenge des Gleichungssystems ist2156
43− 13
310
,
− 2
34301
.
Es ist kein Zufall, dass die Losungsmenge ein Vektorraum ist: Schliesslich ist Ax = ~0 genau dann, wenn2157
x ∈ kerA liegt, wenn wir A als lineare Abbildung auffassen. Und wir wissen bereits, dass kerA ein Unterraum2158
ist. Wir nennen daher die Losungsmenge auch den Losungsraum des Gleichungssystems.2159
Wir wissen auch, dass dim kerA = n−dim ImA, wobei n die Anzahl der Spalten von A ist. Da dim ImA =2160
rk A, ist n−dim ImA genau die Anzahl der freien Variablen. Wir erhalten Basisvektoren des Losungsraums,2161
indem wir eine freie Variable auf 1 und den Rest auf 0 setzen und die (eindeutige) Losung mit diesen freien2162
Variablen berechnen.2163
Im Beispiel oben ergibt sich fur x3 = 1 und x4 = 0:
−x2 −13
3= 0 ⇔ x2 = −13
3
3x1 + 4 = 0 ⇔ x1 = −4
3
also der Vektor2164 − 4
3− 13
310
78 KAPITEL 3. LINEARE ALGEBRA, TEIL I
und fur x3 = 0, x4 = 1 der Vektor2165 − 2
34301
.
Es ist eine Frage des Geschmacks, ob man lieber eine grossere Rechnung (wie oben) oder mehrere kleinere2166
Rechnungen (wie gerade gesehen) durchfuhren mochte.2167
Allgemeiner Fall.2168
Nun sprechen wir uber ein allgemeines System Ax = b. Hier ist es nicht mehr ohne weiteres klar, ob es eine2169
Losung gibt. Allerdings gibt die Zeilenstufenform die Antwort:2170
Lemma 3.48. Das Gleichungssystem Ax = b hat eine Losung genau dann, wenn es in der Zeilenstufenform2171
von (A | b) kein Pivotelement in der b-Spalte gibt.2172
Beweis. Gibt es in der b-Spalte ein Pivotelement, sagen wir in Zeile i, bedeutet dies, dass die i-te Zeile2173
komplett 0 ist bis auf den letzten Eintrag bi, welcher nicht 0 ist (denn Pivotlemente sind per Definition2174
nicht 0). Die entsprechende Gleichung ist dann 0x1 + 0x2 + . . . + 0xn = bi, und diese Gleichung kann2175
offenbar nicht erfullt werden.2176
Ist umgekehrt kein Pivotelement in der b-Spalte, so ergibt sich immer eine Losung, indem man (zum2177
Beispiel) die freien Variablen auf 0 setzt und die gebundenen Variablen so wahlt, dass alle Gleichungen2178
erfullt sind.2179
Statt die Details des zweiten Teils weiter auszubreiten, zeigen wir das Prinzip an einem Beispiel. Be-2180
trachte die folgende Matrix in Zeilenstufenform2181 1 3 5 30 2 4 −10 0 0 0
Es ist kein Pivotelement in der vierten Spalte, und x3 ist eine freie Variable. Setzen wir x3 = 0, ergibt sich2182
aus der zweiten Zeile 2x2 = −1, also ist x2 = − 12 . Die erste Zeile ergibt dann x1 − 3
2 = 3, also x1 = 92 . Es2183
ergibt sich also2184 92− 1
20
als eine Losung.2185
Wir haben nun ein Verfahren um zu bestimmen, ob Ax = b eine Losung besitzt, und konnen eine solche2186
Losung ausrechnen. Der folgende Satz liefert samtliche Losungen des Systems:2187
Theorem 3.49. Sei x0 eine Losung von Ax = b. Dann ist2188
x0 + ker A := {x0 + x′ | Ax′ = ~0}
die Losungsmenge von Ax = b.2189
Beweis. Ist Ax′ = ~0, dann ist2190
A(x0 + x′) = A(x0) +A(x′) = b+~0 = b
also ist x0 + x′ in der Tat eine Losung. Das bedeutet, x0 + ker A ist eine Teilmenge der Losungsmenge.2191
Umgekehrt, falls x1 eine Losung von Ax = b ist, dann ist Ax1 = b = Ax0, also A(x1 − x0) = ~0. Das heißt,2192
dass x′ := x1 − x0 ∈ ker A. Also ist x1 von der Form x0 + x′ mit x′ ∈ ker A.2193
3.8. LINEARE GLEICHUNGSSYSTEME 79
Dieses Theorem liefert ein Rechenverfahren, um alle Losungen zu bestimmen. Zunachst schaut man, ob2194
uberhaupt eine Losung existiert, und berechnet gegebenenfalls eine Losung x0, wie in Lemma 3.48 erklart.2195
Dann lost man das Gleichungssystem Ax = 0 wie im vorherigen Abschnitt erklart und hat die Losungsmenge2196
x0 + ker A gefunden. Dieses Verfahren ist etwas umstandlich, denn man kann die gesamte Losungsmenge2197
auch in einem Schritt berechnen, wie wir gleich in einem Beispiel sehen werden. Allerdings gibt der Satz die2198
Struktur der Losungsmenge vor.2199
Definition 3.50. Ein affiner Raum im Kn ist eine Menge2200
A := x0 + U
mit x0 ∈ Kn und U ein Unterraum von Kn. Die Dimension von A ist als Dimension von U definiert.2201
Ein affiner Raum ist also einfach ein “verschobener” Unterraum. Beachten Sie, dass ein affiner Raum im2202
Allgemeinen kein Unterraum von Kn ist. Aus Theorem 3.49 folgt:2203
Korollar 3.51. Die Losungsmenge eines linearen Gleichungssystem ist entweder die leere Menge, oder ein2204
affiner Unterraum. Wir sprechen daher auch vom Losungsraum eines linearen Gleichungssystems.2205
Wir schauen uns nun ein geometrisches Beispiel an. Wir bestimmen E1 ∩ E2 mit E1, E2 zwei Ebenengegeben durch:
E1 :=
x ∈ R3 | x =
21−1
+ λ1
111
+ λ2
13−1
,
E2 :=
x ∈ R3 | x =
202
+ µ1
012
+ µ2
1−11
.
Die Punkte in E1 ∩ E2 sind durch ein lineares Gleichungssystem beschrieben. Wir sehen das wie folgt:2206
Falls x ∈ E1 ∩ E2, so gibt es λ1, λ2, so dass2207
x =
21−1
+ λ1
111
+ λ2
13−1
und µ1, µ2, so dass2208
x =
202
+ µ1
012
+ µ2
1−11
.
Gleichsetzen liefert dann, dass2209 21−1
+ λ1
111
+ λ2
13−1
− 2
02
− µ1
012
− µ2
1−11
= ~0
was sich aquivalent umschreiben lasst als2210
λ1
111
+ λ2
13−1
+ µ1
0−1−2
+ µ2
−11−1
=
0−13
bzw. in Matrixschreibweise als2211 1 1 0 −1
1 3 −1 11 −1 −2 −1
λ1
λ2
µ1
µ2
=
0−13
80 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Wir losen dieses linear Gleichungssystem nun, in dem wir die Matrix (A | b) auf Zeilenstufenform bringen:2212 1 1 0 −1 01 3 −1 1 −11 −1 −2 −1 3
→ 1 1 0 −1 0
0 2 −1 2 −10 −2 −2 0 3
→ 1 1 0 −1 0
0 2 −1 2 −10 0 −3 2 2
Hier ist die vierte Variable (also µ2) frei. Wir setzen t := µ2. Damit ergibt sich aus der dritten Zeile, dass2213
µ1 = 2t−23 . Wir erhalten auch aus der zweiten Zeile, dass 2λ2 − µ1 + 2µ2 = −1, und Einsetzen von µ1 und2214
µ2 liefert λ2 = − 23 t−
56 . Aus der ersten Gleichung folgt dann λ1 = 5
3 t+ 56 . Es ergibt sich die Losungsmenge2215
53 t+ 5
6− 2
3 t−56
23 t−
23
t
| t ∈ R
.
Das liefert alle λ1, λ2, µ1, µ2, so dass x die beiden Gleichungen oben erfullt. Insbesondere ist x ∈ E1 ∩ E22216
genau dann, wenn2217
x =
202
+ (2
3t− 2
3)
012
+ t
1−11
=
2− 2
323
+ t
1− 1
373
mit t ∈ R beliebig. Es folgt, dass E1∩E2 die Gerade mit Richtungsvektor
1− 1
373
ist, die durch
2− 2
323
2218
verlauft.2219
2220
Hausaufgabe 3.8.1. Zeigen Sie, dass ein affiner Raum A genau dann ein Unterraum ist, wenn er ~02221
enthalt.2222
Hausaufgabe 3.8.2. Sei p(x) ein Grad 4 Polynom in R, mit p(1) = 18, p(2) = 174, p(3) = 776, p(4) = 23222223
und p(5) = 5502. Rechnen Sie die Koeffizienten von p(x) aus.2224
Hausaufgabe 3.8.3. Seien A und B zwei Geraden in R3. Berechnen Sie den Schnittpunkt von A und B,2225
falls es ihn gibt, wenn:2226
a. A =
10−415
+ λ ·
3−24
|λ ∈ R
und B =
17
12−9
+ λ ·
85−6
|λ ∈ R
,2227
b. A =
10
17−9
+ λ ·
35−5
|λ ∈ R
und B =
5
20−15
+ λ ·
29−9
|λ ∈ R
.2228
Hausaufgabe 3.8.4. Losen Sie die folgenden reellen linearen Gleichungssysteme Ax = s, wobei die erwei-2229
terte Matrix (A | s) wie folgt gegeben ist:2230
a.
1 2 0 3 30 0 1 −1 02 4 2 4 61 2 −1 4 3
2231 c.
1 −1 7 7 140 1 2 2 52 0 20 20 421 −2 5 5 10
2232
3.9. SKALARPRODUKTE 81
e.
2 1 0 4 71 3 −1 7 −50 −1 1 −2 41 1 0 3 2
2233
b.
1 2 0 3 40 0 1 −1 12 4 2 4 121 2 −1 4 4
2234
d.
1 −1 7 7 00 1 2 2 12 0 20 20 21 −2 5 5 −1
2235
f.
2 1 0 4 41 3 −1 7 40 −1 1 −2 01 1 0 3 3
2236
Hinweis: Je zwei Systeme mit der selben Matrix A simultan losen.2237
Hausaufgabe 3.8.5. Wenn ein Glas Limonade, drei belegte Brote und sieben Kekse 14 Schilling kosten,2238
und ein Glas Limonade, vier belegte Brote, zehn Kekse 17 Schilling, wieviel kosten dann (wenn moglich):2239
a. ein Glas Limonade, ein belegtes Brot und ein Keks?2240
b. zwei Glas Limonade, drei belegte Brote und funf Kekse?2241
c. nur ein Glas Limonade?2242
Hausaufgabe 3.8.6. Betrachten Sie die Punkte im R32243
a =
123
b =
−12−3
c =
345
und geben Sie als Losungsmenge eines linearen Gleichungssystems die jeweils kleinsten affinen Unterraume2244
an,2245
a. die a enthalten,2246
b. die a, b enthalten,2247
c. die a, b, c enthalten.2248
3.9 Skalarprodukte2249
Bislang haben wir uns nur um lineare Abhangigkeiten von Vektoren gekummert und zentrale geometrische2250
Konzepte wie Langen und Winkel vernachlassigt. Dies holen wir jetzt nach.2251
Von nun an beschranken wir uns auf Rn als Vektorraum, obwohl sich viele der Konzepte verallgemeinern2252
lassen.2253
Definition 3.52. Eine Abbildung2254
〈·, ·〉 : Rn × Rn → R, (x, y) 7→ 〈x, y〉
heißt Skalarprodukt, wenn gilt:2255
(bilinear) Fur alle λ ∈ R, x, y, z ∈ Rn gilt
〈λx+ y, z〉 = λ〈x, z〉+ 〈y, z〉 (3.1)
〈x, λy + z〉 = λ〈x, y〉+ 〈x, z〉. (3.2)
Mit anderen Worten: Fur ein fixiertes z ∈ Rn sind die Abbildungen x 7→ 〈x, z〉 und x 7→ 〈z, x〉 linear.2256
(symmetrisch) Es gilt 〈x, y〉 = 〈y, x〉 fur alle x, y ∈ Rn.2257
(positiv definit) Es gilt 〈x, x〉 ≥ 0 fur alle x und 〈x, x〉 = 0 genau dann, wenn x = ~0.2258
82 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Das gebrauchlichste Beispiel ist das Standardskalarprodukt2259
〈x, y〉 = x1y1 + . . .+ xnyn.
Wir konnen leicht nachrechnen, dass dieses Produkt bilinear und symmetrisch ist. Außerdem ist2260
〈x, x〉 = x21 + . . .+ x2
n
und diese Summe ist immer strikt positiv, außer wenn alle xi = 0 sind.2261
Es gibt jedoch auch andere Skalarprodukte. Zum Beispiel die folgende Abbildung:2262
R3 × R3 → R, (x, y) 7→ xT ·
1 1 −21 2 −4−2 −4 3
y.
Hier wird also das erste Argument als Zeilenvektor von links heranmultipliziert, und das zweite Argument2263
als Spaltenvektor von rechts. Man uberzeugt sich leicht, dass dies in der Tat eine reelle Zahl ergibt, zum2264
Beispiel ist:2265
(−1 1 0
) 1 1 −21 2 −4−2 −4 3
32−5
=(
0 1 −2) 3
2−5
= 12
(naturlich kann man in der anderen Reihenfolge multiplizieren, denn die Matrixmultiplikation ist assoziativ).2266
Wir konnen auch leicht nachweisen, dass die Abbildung bilinear und symmetrisch ist (lassen wir weg). Dass2267
sie positiv definit ist, konnen wir jedoch im Moment noch nicht einfach zeigen.2268
Es gilt in der Tat, dass jedes Skalarprodukt geschrieben werden kann als2269
〈x, y〉 = xTAy
mit A ∈ Rn×n. Fur das Standardskalarprodukt ware A die Einheitsmatrix2270
En :=
1 0 · · · 0
0. . .
. . ....
.... . .
. . . 00 · · · 0 1
.
Allerdings ist es nicht wahr, dass umgekehrt jede Matrix A auch ein Skalarprodukt liefert. Wir liefern eine2271
Charakterisierung am Ende des Skriptes in Theorem 5.29.2272
Wir bezeichnen den Vektorraum Rn, indem ein Skalarprodukt 〈·, ·〉 definiert ist, als euklidischen Vek-2273
torraum. In allen Beispielen werden wir, falls nicht explizit anders erwahnt, das Standardskalarprodukt2274
verwenden.2275
Definition 3.53. In einem euklidischen Vektorraum V sind zwei Vektoren x, y ∈ V orthogonal, x ⊥ y,2276
wenn 〈x, y〉 = 0 gilt. Fur eine Teilmenge M ⊆ V bezeichnet2277
M⊥ := {x ∈ V | x ⊥ y fur alle y ∈M}
den Orthogonalraum von M .2278
Es ist eine leichte Ubung zu zeigen, dass M⊥ ein Unterraum von V ist. Wir konnen einen konkreten2279
Orthogonalraum auch ausrechnen. Zum Beispiel ist fur:2280
M := {
111
,
20−1
}
3.9. SKALARPRODUKTE 83
der Raum M⊥ gegeben durch alle Vektoren v, fur die gilt2281
〈
111
, v〉 = 0, 〈
20−1
, v〉 = 0.
Schreiben wir das in den Koordinaten von v, ergibt sich
v1 + v2 + v3 = 0
2v1 − v3 = 0
und wir haben ein (homogenes) lineares Gleichungssystem, welches den Losungsraum2282 −13−2
ergibt (wir fuhren diese Rechnung nicht durch).2283
Wir sind besonders an Orthognalraumen von Unterraumen interessiert:2284
Lemma 3.54. Sei U ein Unterraum eines euklidischen Vektorraums V . Dann gilt dimU+dimU⊥ = dimV .2285
Beweis. Sei {u1, . . . , ur} eine Basis von U . Es ist leicht zu sehen, dass x ∈ U⊥ aquivalent dazu ist, dass x2286
zu jedem ui, 1 ≤ i ≤ r, orthogonal ist. Das bedeutet wiederum, dass x die folgende Gleichung erfullt2287 uT1...uTr
x = 0.
Das folgt aus dem gleichen Argument wie im Beispiel oben. Wir bezeichnen die Matrix von oben mit A.2288
Dann ist also U⊥ = ker A. Ferner ist2289
dim ImA = rkA = r = dimU
da u1, . . . , ur eine Basis ist. Es folgt nach Theorem 3.34, dass2290
dimV = dim ker A+ dim ImA = dimU⊥ + dimU
2291
Es gilt auch, dass U ∩ U⊥ = {~0}. Denn ware v 6= ~0 im Schnitt enthalten, folgt nach Definition, dass2292
v ⊥ v, also 〈v, v〉 = 0, was der positiven Definitheit des Skalarproduktes wiederspricht.2293
Theorem 3.55. Sei V ein euklidischer Vektorraum und U ein Unterraum. Dann lasst sich jedes x ∈ V2294
eindeutig schreiben als2295
x = u+ v
mit u ∈ U und v ∈ U⊥. Die Abbildung2296
pU : V → U, x 7→ u
heißt Orthogonalprojektion auf U .2297
Beweis. Wir verwenden den Dimensionssatz (Theorem 3.27), welcher besagt, dass2298
dim(U + U⊥) + dim(U ∩ U⊥)︸ ︷︷ ︸=0
= dimU + dimU⊥︸ ︷︷ ︸=dimV
,
wobei die beiden Gleichheiten aus dem gerade eben gezeigten folgen. Damit ist also dim(U +U⊥) = dimV ,2299
und damit muss schon U +U⊥ = V sein (da U +U⊥ ja ein Unterraum von V ist). Das bedeutet aber, jedes2300
x ∈ V lasst sich in u+ v wie gewunscht zerlegen.2301
Die Zerlegung ist auch eindeutig. Denn ist auch x = u′+v′, dann ist u+v = u′+v′, also u−u′ = v′−v.2302
Das heißt aber, dass u − u′ ∈ U und u − u′ = v′ − v ∈ U⊥, also u − u′ ∈ U ∩ U⊥ = {~0}, und damit ist2303
u = u′.2304
84 KAPITEL 3. LINEARE ALGEBRA, TEIL I
2305
Hausaufgabe 3.9.1. Orthogonalitat kann auch fur bilineare Operationen generell definiert werden. Geben2306
Sie ein Beispiel fur eine Bilinearform, so dass v ⊥ v, auch wenn v nicht null ist.2307
Hausaufgabe 3.9.2. Zeigen Sie, dass man in der Definition des Skalarproduktes die Bedingung2308
〈x, λy + z〉 = λ〈x, y〉+ 〈x, z〉
auch weglassen kann, da sie aus den restlichen Eigenschaften folgt.2309
Hausaufgabe 3.9.3. Zeigen Sie, dass die Abbildung2310
(x, y) 7→ xT
1 1 −11 2 −4−2 −4 3
y
kein Skalarprodukt ist.2311
Hausaufgabe 3.9.4. Zeigen Sie, dass M⊥, M ⊆ V , ein Unterraum von V ist.2312
Hausaufgabe 3.9.5. Gegeben ist die Bilinearform σ(x, y) = xT y. Bestimmen Sie den Orthogonalraum U⊥2313
bezuglich σ fur die folgenden Unterraume des R3:2314
a. U =
123
, b. U =
123
,
321
, c. U =
x1
x2
x3
| x1 + x2 + x3 = 0
.
3.10 Normen2315
Wir definieren nun die Lange eines Vektors und den Abstand zweier Punkte im Rn fur allgemeine Skalar-2316
produkte. Naturlich stimmt die Definition mit dem ublichen Abstandsbegriff uberein.2317
Definition 3.56. Die Norm oder Lange eines Vektors ist gegeben durch2318
‖x‖ :=√〈x, x〉.
Ein Vektor heißt normiert, wenn seine Lange 1 ist. Wir definieren d(p, q) := ‖p− q‖ als den (euklidischen)2319
Abstand zweier Punkte.2320
Fur einen Vektor v 6= ~0 ist der Vektor v := v‖v‖ normiert, wie man leicht nachrechnet (Hausaufgabe).2321
Wir sprechen davon, dass wir einen Vektor normieren, wenn wir v durch v ersetzen.2322
Theorem 3.57 (Satz des Pythagoras). In einem euklidischen Vektorraum seien x und y orthogonal. Dann2323
gilt2324
‖x+ y‖2 = ‖x‖2 + ‖y‖2
Beachten Sie, dass die drei Vektoren x, y, x + y in der Tat ein rechtwinkliges Dreieck mit Hypotenuse2325
x+ y definieren.2326
Beweis.‖x+ y‖2 = 〈x+ y, x+ y〉 = 〈x, x〉+ 〈x, y〉︸ ︷︷ ︸
=0
+ 〈y, x〉︸ ︷︷ ︸=0
+〈y, y〉 = ‖x‖2 + ‖y‖2
2327
Theorem 3.58 (Cauchy-Schwarz’sche Ungleichung). In einem euklidischen Vektorraum V gilt fur u, v ∈ V ,2328
dass2329
〈u, v〉 ≤ ‖u‖‖v‖.
3.11. ORTHOGONALE UND ORTHONORMALE BASEN 85
Gleichheit gilt genau dann, wenn u und v linear abhangig sind.2330
Der Beweis ist eine etwas umstandliche Rechnerei. Wir lassen ihn weg, und besprechen stattdessen ein2331
Beispiel fur eine Anwendung:2332
Theorem 3.59 (Dreiecksungleichung). Fur zwei Vektoren x, y gilt stets2333
‖x+ y‖ ≤ ‖x‖+ ‖y‖.
Beweis.
‖x+ y‖2 = 〈x+ y, x+ y〉 = 〈x, x〉+ 2〈x, y〉+ 〈y, y〉 ≤ ‖x‖2 + 2‖x‖ · ‖y‖+ ‖y‖2 = (‖x‖+ ‖y‖)2
Das Ergebnis ergibt sich durch Wurzelziehen auf beiden Seiten.2334
2335
Hausaufgabe 3.10.1. Zeigen Sie, dass ‖λv‖ = |λ| · ‖v‖ gilt fur alle λ ∈ R und v ∈ Rn. Folgern Sie daraus,2336
dass v := v‖v‖ .2337
Hausaufgabe 3.10.2. Zeigen Sie, dass d(p, q) = d(q, p) gilt.2338
Hausaufgabe 3.10.3. Zeigen Sie, dass fur zwei normierte Vektoren u, v stets gilt, dass 〈u, v〉 ∈ [0, 1].2339
Hausaufgabe 3.10.4. Beweisen Sie die allgemeinere Form der Dreiecksungleichung:2340
‖x1 + . . .+ xn‖ ≤ ‖x1‖+ . . .+ ‖xn‖.
Hausaufgabe 3.10.5. Zeigen Sie, dass in einem euklidischen Vektorraum folgendes gilt:2341
(a+ b) ⊥ (a− b)⇔ ‖a‖ = ‖b‖.
3.11 Orthogonale und orthonormale Basen2342
Definition 3.60. Eine Basis B eines euklidischen Vektorraums heißt Orthogonalbasis falls fur alle b 6= b′2343
in B gilt, dass b ⊥ b′. B heißt Orthonormalbasis, falls zusatzlich alle Vektoren normiert sind.2344
Zum Beispiel ist die Basis2345 12−1
,
3−11
,
−210
keine Orthogonalbasis von R3, da der zweite und dritte Basisvektor nicht orthogonal zueinander sind. Da-2346
gegen ist2347 (31
),
(−13
)eine Orthogonalbasis des R2. Es ist jedoch keine Orthonormalbasis, da die Vektoren nicht Lange 1 haben.2348
Wir erhalten eine solche Basis, in dem wir normieren:2349 (3√101√10
),
(− 1√
103√10
).
Dieses Prinzip gilt ganz allgemein:2350
Lemma 3.61. Ist b1, . . . , bn eine Orthogonalbasis, dann ist b1, . . . , bn eine Orthonormalbasis des gleichen2351
Raums, wobei bi der normierte Vektor fur bi ist.2352
86 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Der Beweis sollte klar sein: Normierung andert den Spann nicht, und ebenso bleiben Vektoren nach2353
Normierung orthogonal zueinander.2354
Es stellt sich die Frage, ob es zu jedem Vektorraum eine Orthogonalbasis (und damit auch eine Orthonor-2355
malbasis) gibt. Die Antwort lautet ja. Wir konnen eine beliebige Basis in eine Orthonormalbasis uberfuhren,2356
wie wir nun sehen werden.2357
Theorem 3.62 (Gram-Schmidt Orthonormalisierungsverfahren). Sei a1, . . . , an eine Basis eines euklidi-2358
schen Vektorraums V . Dann gibt es eine Orthonormalbasis b1, . . . , bn von V , so dass gleichzeitig2359
[a1, . . . , ak] = [b1, . . . , bk]
fur alle k = 1, . . . , n gilt.2360
Beweis. Der Beweis ist konstruktiv. Wir geben ein Verfahren an, um b1, . . . , bn zu bestimmen, das Gram-2361
Schmidt Orthogonalisierungsverfahren. Genauer gesagt geben wir ein Verfahren an, um eine Orthogonalbasis2362
zu erhalten. Wir erhalten dann eine Orthonormalbasis, in dem wir jeden Basisvektor normaliseren.2363
Fur k = 1 setzen wir einfach b1 := a1. Nun nehmen wir an, dass wir b1, . . . , bk bereits fur ein k < n2364
konstruiert haben. Wir setzen nun2365
bk+1 := ak+1 −〈ak+1, b1〉〈b1, b1〉
b1 −〈ak+1, b2〉〈b2, b2〉
b2 − . . .−〈ak+1, bk〉〈bk, bk〉
bk
Wir mussen nun nachweisen, dass die b1, . . . , bn die Eigenschaft [a1, . . . , ak] = [b1, . . . , bk] erfullen und alle2366
orthogonal zueinander stehen.2367
Fur die Spanneigenschaft verwenden wir Induktion uber k. Fur k = 1 ist die Aussage klar. Nun nehmen2368
wir an, dass [a1, . . . , ak] = [b1, . . . , bk] bereits gezeigt ist. Es gilt nun, dass2369
[a1, . . . , ak, ak+1] = [a1, . . . , ak] + [ak+1] = [b1, . . . , bk] + [ak+1] = [b1, . . . , bk, ak+1] .
Andererseits ist aber bk+1 nach Definition eine Linearkombination dieser Basisvektoren, wobei der Koeffi-2370
zient von ak+1 nicht 0 ist. Es folgt daher nach dem Austauschsatz (Theorem 3.22), dass [b1, . . . , bk, ak+1] =2371
[b1, . . . , bk, bk+1], und die Eigenschaft ist per Induktion bewiesen.2372
Nun zur Orthogonalitat. Auch hier verwenden wir Induktion uber k. Genauer zeigen wir, dass alleVektoren in der Menge {b1, . . . , bk} paarweise orthogonal zueinander sind. Fur k = 1 ist nicht zu zeigen(denn es existiert kein Paar). Wir nehmen an, die Eigenschaft ist erfullt fur {b1, . . . , bk}. Wir berechneneinfach 〈bk+1, bi〉 fur i < k + 1. Nach der Bilinearitat des Skalarprodukts ergibt sich:
〈bi, bk+1〉 = 〈bi, ak+1 −〈ak+1, b1〉〈b1, b1〉
b1 −〈ak+1, b2〉〈b2, b2〉
b2 − . . .−〈ak+1, bk〉〈bk, bk〉
bk〉
= 〈bi, ak+1〉 −〈ak+1, b1〉〈b1, b1〉
〈bi, b1〉 −〈ak+1, b2〉〈b2, b2〉
〈bi, b2〉 − . . .−〈ak+1, bk〉〈bk, bk〉
〈bi, bk〉
In der letzten Summe sind fast alle Summanden 0, da nach Induktionsvoraussetzing 〈bi, bj〉 = 0. Es verbleibt2373
nur der Term fur bi selbst:2374
. . . = 〈bi, ak+1〉 −〈ak+1, bi〉〈bi, bi〉
〈bi, bi〉 = 〈bi, ak+1〉 − 〈ak+1, bi〉 = 0.
Damit ist die Orthogonalitat bewiesen.2375
Was ist der Nutzen einer Orthonormalbasis? Sei b1, . . . , bn eine Basis von V und v ∈ V beliebig. Wir2376
wissen bereits (Theorem 3.25), dass sich v eindeutig als Linearkombination von b1, . . . , bn schreiben lasst.2377
Um eine solche Linearkombination zu finden, mussen wir aber noch ein lineares Gleichungssytem losen. Ist2378
b1, . . . , bn jedoch eine Orthonormalbasis, ist dieser letzte Schritt nicht notwendig:2379
Lemma 3.63. Ist b1, . . . , bn eine Orthonormalbasis von V und v ∈ V , so ist2380
v = 〈v, b1〉b1 + . . .+ 〈v, bn〉bn
3.11. ORTHOGONALE UND ORTHONORMALE BASEN 87
Beweis. Wir konnen v mit Hilfe der Basisvektoren b1, . . . , bn eindeutig schreiben:2381
v = λ1b1 + . . .+ λnbn
Nun rechnen wir fur ein beliebigen 1 ≤ i ≤ n nach2382
〈v, bi〉 = λ1 〈b1, bi〉︸ ︷︷ ︸=0
+ . . .+ λi 〈bi, bi〉︸ ︷︷ ︸=1
+ . . .+ λn 〈bn, bi〉︸ ︷︷ ︸=0
= λi
2383
Auch die Norm eines Vektors lasst sich leicht aus einer Linearkombination ablesen:2384
Lemma 3.64. Sei b1, . . . , bn eine Orthonormalbasis von V und2385
x = λ1b1 + . . .+ λnbn.
Dann ist ‖x‖2 =∑ni=1 λ
2i .2386
Beweis. Einfach Nachrechnen:2387
‖x‖2 = 〈x, x〉 = 〈n∑i=1
λibi,
n∑j=1
λjbj〉 =
n∑i=1
n∑j=1
λiλj〈bi, bj〉 =
n∑i=1
λ2i
wobei die letzte Gleichung gilt, weil 〈bi, bj〉 = 0 fur i 6= j, also bleiben nur die Terme ubrig, fur die i = j2388
gilt.2389
Projektionen und Spiegelungen. Als kleine Anwendung des gerade gezeigten befassen wir uns mit2390
(orthogonalen) Projektionen auf Unterraume. Wir beschranken uns auf R3 und fangen mit dem einfachen2391
Fall an. Sei L eine Gerade durch den Ursprung, und x ein Punkt. Es gibt nun genau einen Punkt y auf2392
der Geraden, so dass die Gerade durch x und y senkrecht auf L steht (das ist die Projektion von x auf L).2393
Wie finden wir diesen Punkt? Nennen wir u einen Richtungsvektor der Gerade, so suchen wir ein λ, so dass2394
〈u, x − λu〉 = 0. Da 〈u, u〉 = 1, ist das aquivalant zu 〈x, u〉 = λ. Das lost sich auf zu λ = 〈u,x〉〈u,u〉 , also haben2395
wir2396
〈u, x〉〈u, u〉
u
fur die Projektion von x auf die Gerade.2397
Nun schauen wir uns Ebenen an. Sei E eine Ebene durch den Urpsrung, und x ∈ R3 beliebig. Wieder-2398
um gibt es genau einen Punkt y, so dass x − y senkrecht auf E steht, und wir nennen y wiederum den2399
Projektionspunkt.2400
Wir besprechen zwei Moglichkeiten, den Projektionspunkt zu bestimmen. Haben wir eine Orthogonal-2401
basis u1, u2 der Ebene gegeben, ergibt sich sofort, dass2402
y =〈u1, x〉〈u1, u1〉
u1 +〈u2, x〉〈u2, u2〉
u2.
In der Tat liegt y in der Ebene, da es eine Linearkombination von u1 und u2 ist. Es ist auch x− y ⊥ u1 und2403
x− y ⊥ u2, wie man leicht nachrechnet.2404
Als Beispiel nehmen wir die Ebene aufgespannt durch die Vektoren2405
v1 :=
111
, v2 :=
2−10
Die beiden Vektoren stehen nicht ortogonal zueinander. Wir verwenden das Gram-Schmidt Verfahren und2406
erhalten2407
u1 := v1, u2 := v2 −〈v2, u1, 〉〈u1, u1〉
u1 =
2−10
− 1
3
111
=
53− 4
3− 1
3
.
88 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Beachten Sie, dass wir jeden Vektor mit einem beliebigen Skalar (ausser 0) multiplizieren konnen ohne den2408
Spann zu andern. Es ist hier sinnvoll, u2 mit 3 zu skalieren, um die Bruche loszuwerden. Wir nehmen also2409
b1 :=
111
, b2 :=
5−4−1
als Orthogonalbasis der Ebene.2410
Sei nun2411
x =
20−3
Dann ist die Projektion auf die Ebene gegeben durch2412
y =〈x, b1〉〈b1, b1〉
b1 +〈x, b2〉〈b2, b2〉
b2
=−1
3
111
+13
42
5−4−1
=1
42
−14 + 65−14− 52−14− 13
=1
42
51−66−27
=1
14
17−22−9
Ein alternativer Rechnungsweg folgt nun. Es sei w ein Vektor, der senkrecht auf der Ebene steht (wir2413
nennen solch einen Vektor Normalenvektor). Dann gilt2414
y = x− 〈x,w〉〈w,w〉
w
Die Richtigkeit kann man in der Tat wieder nachrechnen: y − x ist ein Vielfaches von w, also orthogonal2415
zur Ebene, und 〈y, w〉 = 0, was bedeutet, dass y in der Ebene liegt.2416
Nehmen wir nochmals das Beispiel von oben. Wir mussen einen Vektor finden, der zu v1 und zu v22417
orthogonal ist. Es gibt mindestens drei Moglichkeiten, einen solchen Vektor zu finden: (1) durch Raten2418
(manchmal geht das, und es ist am Schnellsten), (2) durch Losen eines linearen Gleichungssystems, (3)2419
durch das Kreuzprodukt:2420 x1
x2
x3
× y1
y2
y3
:=
x2y3 − x3y2
x3y1 − x1y3
x1y2 − x2y1
.
Eine Losung im konkreten Fall ist2421
w =
12−3
und wir erhalten
y =
20−3
−〈
20−3
,
12−3
〉〈
12−3
,
12−3
〉 1
2−3
=
20−3
− 11
14
12−3
=1
14
28− 11−22
−42 + 33
=1
14
17−22−9
.
3.11. ORTHOGONALE UND ORTHONORMALE BASEN 89
Schauen wir uns die Formel2422
y = x− 〈x,w〉〈w,w〉
w
nochmals genauer an. Wir nehmen nun der Einfachheit halber an, dass w normiert ist, womit sich der2423
Ausdruck vereinfacht zu2424
y = x− 〈x,w〉w.Der Vektor −〈x,w〉w gibt die Verbindungsstrecke von x zu seinem Projektionspunkt y an. Wenn wir die-2425
se Verbindungsstrecke verdoppeln, erhalten wir die Spiegelung von x an der Ebene, welche wir mit σ(x)2426
bezeichnen:2427
σ(x) = x− 2〈x,w〉w.Beachten Sie, dass wir das Skalarprodukt auch als Matrixmultiplikation schreiben konnen: 〈x,w〉 = 〈w, x〉 =2428
wTx. Damit ist also σ(x) = x − 2(wTx)w. Man kann leicht nachrechnen, dass (wTx)w = (wwT )x gilt (im2429
Allgemeinen ist das Matrixprodukt nicht kommutativ, aber fur diesen Spezialfall schon). Beachten Sie, dass2430
w · wT eine (3× 3)-Matrix ist. Also erhalten wir2431
σ(x) = x− 2(wwT )x = (En − 2wwT )x,
wobei En wie ublich die (n× n)-Einheitsmatrix ist. Wenn wir den Faktor 2 weglassen, ergibt sich auch2432
y = (En − wwT )x.
Damit ergibt sich:2433
Lemma 3.65. Sei E eine Ebene durch den Ursprung mit normierten Normalenvektor w. Dann ist die2434
Projektionsabbildung, die jedem Punkt in R3 seinen Projektionspunkt zuordnet, eine lineare Abbildung mit2435
x 7→ (En − wwT )x.
Auch die Spiegelungsabbildung ist linear mit2436
x 7→ (En − 2wwT )x.
Rechnen wir die Projektion von oben ein drittes Mal aus. Wie schon gesehen ist w =
12−3
senkrecht2437
auf der Ebene. Normiert ergibt sich der Vektor:2438
w =1√14
12−3
.
Wir berechnen die Projektionsmatrix:
E3 − wwT =
1 0 00 1 00 0 1
− 1√14
12−3
· 1√14
(1 2 −3
)
=
1 0 00 1 00 0 1
− 1
14
1 2 −32 4 −6−3 −6 9
=
1
14
13 −2 3−2 10 63 6 5
.
Nun berechnen wir den Projektionspunkt durch Multiplikation:2439
y =1
14
13 −2 3−2 10 63 6 5
20−3
=1
14
26− 9−4− 186− 15
=1
14
17−22−9
.
2440
90 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Hausaufgabe 3.11.1. Wie finden Sie Projektionspunkte auf Geraden/Ebenen, die nicht durch den Urps-2441
rung gehen?2442
Hausaufgabe 3.11.2. Wenden Sie das Gram-Schmidt-Orthonormalisierungsverfahren fur den Standards-2443
kalarprodukt auf folgenden Vektoren an:2444
a.
23−1
,
1−22
,
−221
∈ R3,2445b.
2142
,
1326
,
1101
,
3−3−13
∈ R4,2446
3.12 Orthogonale Abbildungen2447
Definition 3.66. Eine lineare Abbildung f : V → V in einem euklidischen Vektorraum heißt orthogonal,2448
wenn fur alle x, y ∈ V gilt, dass2449
〈f(x), f(y)〉 = 〈x, y〉.
Orthogonale Abbildungen erhalten also das Skalarprodukt von Vektoren. Es ist nicht ohne weiteres2450
intuitiv klar, was dies bedeutet. Hier ist ein aquivalentes Kriterium, welches anschaulicher ist: eine lineare2451
Abbildung ist orthogonal genau dann, wenn sie die Lange von Vektoren erhalt.2452
Lemma 3.67. Eine lineare Abbildung f : V → V ist orthogonal genau dann, wenn fur alle x ∈ V gilt, dass2453
‖f(x)‖ = ‖x‖.2454
Beweis. Ist f orthogonal, dann ist2455
‖f(x)‖ =√〈f(x), f(x)〉 =
√〈x, x〉 = ‖x‖.
Umgekehrt sei ‖f(x)‖ = ‖x‖. Da2456
〈x+ y, x+ y〉 = 〈x, x〉+ 〈y, y〉+ 2〈x, y〉,
folgt, dass2457
〈x, y〉 =1
2(〈x+ y, x+ y〉 − 〈x, x〉 − 〈y, y〉) =
1
2(‖x+ y‖2 − ‖x‖2 − ‖y‖2).
(Wir konnen also das Skalarprodukt mit Hilfe von Normen ausdrucken). Es ergibt sich
〈f(x), f(y)〉 =1
2(‖f(x) + f(y)‖2 − ‖f(x)‖2 − ‖f(y)‖2)
=1
2(‖f(x+ y)‖2 − ‖f(x)‖2 − ‖f(y)‖2)
=1
2(‖x+ y‖2 − ‖x‖2 − ‖y‖2)
= 〈x, y〉.
2458
Ein Beispiel fur eine orthogonal Abbildung ist die Spiegelung an einer Ursprungsgerade. Das ist geome-trisch recht anschaulich, und wir rechnen es nun nach. Sei w ein Normalenvektor einer Ebene mit ‖w‖ = 1.Wir wissen dass die Spiegelung eines Punktes x gegeben ist durch x− 2〈x,w〉w (und nach Lemma 3.65 istdiese Abbildung linear). Nun gilt
‖x− 2〈x,w〉w‖2 = 〈x− 2〈x,w〉w, x− 2〈x,w〉w〉= 〈x, x〉 − 4〈x, 〈x,w〉w〉+ 4〈〈x,w〉w, 〈x,w〉w〉= 〈x, x〉 − 4〈x,w〉〈x,w〉+ 4〈x,w〉〈x,w〉 〈w,w〉︸ ︷︷ ︸
=1
= ‖x‖.
3.12. ORTHOGONALE ABBILDUNGEN 91
Lemma 3.68. Sei b1, . . . , bn eine Orthonormalbasis von V und f : V → V linear. Dann ist f : V → V2459
eine orthogonale Abbildung genau dann, wenn f(b1), . . . , f(bn) eine Orthonormalbasis von V ist.2460
Beweis. Ist f ortgonal, dann ist ‖f(bi)‖ = ‖bi‖ = 1 fur alle i = 1, . . . , n. Außerdem ist fur i 6= j2461
〈f(bi), f(bj)〉 = 〈bi, bj〉 = 0,
also sind die Vektoren f(b1), . . . , f(bn) paarweise orthogonal. Das beweist, dass f(b1), . . . , f(bn) eine Ortho-2462
normalbasis ist.2463
Umgekehrt, sei f(b1), . . . , f(bn) Orthonormalbasis. Sei x ∈ V beliebig. Schreibe2464
x = λ1b1 + . . .+ λnbn
mit λ1, . . . , λn ∈ R. Es gilt nach Linearitat von f , dass2465
f(x) = λ1f(b1) + . . .+ λnf(bn).
Nach Lemma 3.64 ist ‖x‖2 =∑ni=1 λ
2i und auch ‖f(x)‖2 =
∑ni=1 λ
2i , also ist ‖x‖2 = ‖f(x)‖2 und damit2466
auch ‖x‖ = ‖f(x)‖.2467
Bekanntlich sind lineare Abbildungen durch Matrizen ausdruckbar. Welche Matrizen stellen orthogonale2468
Abbildungen dar?2469
Definition 3.69. Eine Matrix A ∈ Rn×n heißt orthogonal, wenn ATA = En.2470
Aquivalent ist die Bedingung, dass die Spalten von A eine Orthonormalbasis von V bilden.2471
Lemma 3.70. Eine Matrix A ist orthogonal genau dann, wenn die Abbildung x 7→ Ax eine orthogonale2472
Abbildung bezuglich des Standardskalarprodukts ist.2473
Beweis. Die Spalten von A sind die Bilder von A bezuglich der Orthonormalbasis e1, . . . , en von V . Diese2474
Bilder bilden eine Orthonormalbasis genau dann, wenn die Abbildung orthogonal ist (nach Lemma 3.68).2475
Orthogonale Abbildungen im R2. Wir klassifizieren alle orthogonale Abbildungen im R2. Eine solche2476
Abbildung f muss den Vektor
(10
)auf einen Vektor
(cs
)der Lange 1 abbilden. Damit gilt c2 +s2 = 1.2477
Das Bild von
(01
)muss orthogonal zu
(cs
)stehen und ebenfalls Lange 1 haben. Das bedeutet, dass2478
f(
(01
)) =
(−sc
)oder f(
(01
)) =
(s−c
).
Es gibt also zwei Typen von orthogonalen Abbildungen. Zunachst die Form2479 (c −ss c
).
Dies entspricht einer Drehung um den Ursprung. Die andere Form ist2480 (c ss −c
)und entspricht einer Spiegelung an der Geraden mit Richtungsvektor
(s
1− c
). Dies kann man wie folgt2481
sehen:2482
Der orthogonale Vektor zu dieser Geraden ist w :=
(1− c−s
). Beachten Sie, dass sich das vorangehende2483
Kapitel uber Projektionen und Spiegelungen in weiten Teilen auf den Fall von Spiegelungen an Geraden im2484
R2 ubertragt. Insbesondere ist die Spiegelung an der betrachteten Gerade gegeben durch2485
σ(p) = p− 2〈w, p〉〈w,w〉
w.
92 KAPITEL 3. LINEARE ALGEBRA, TEIL I
Wir rechnen nun nach2486
σ(
(10
)) =
(10
)− 2
1− c(1− c)2 + s2
(1− c−s
)=
(10
)− 2
1− c2− 2c︸ ︷︷ ︸
=1
(1− c−s
)=
(cs
)
wobei wir im zweiten Schritt s2 + c2 = 1 ausgenutzt haben. Ebenso gilt2487
σ(
(01
)) =
(01
)− 2
−s(1− c)2 + s2
(1− c−s
)=
(01
)− s
(1− c)
(1− cs
)=
(s
1− s2
1−c
)und die zweite Koordinate vereinfacht sich (wegen c2 + s2 = 1) zu2488
1− s2
1− c= 1− 1− c2
1− c= 1− (1 + c) = −c
Damit ist also gezeigt: Die Spiegelung an besagter Gerade bildet e1 auf
(cs
)und e2 auf
(s−c
)ab und2489
ist damit durch die Matrix2490 (c ss −c
)dargestellt. Dies impliziert, dass jede orthogonale Abbildung im R2 entweder eine Drehung oder eine Spie-2491
gelung ist.2492
2493
Hausaufgabe 3.12.1. Zeigen Sie, dass eine orthogonale Matrix A auch AAT = En erfullt.2494
Hausaufgabe 3.12.2. Bestimmen Sie die Matrix der Spiegelung an der Gerade x−3y = 0 im euklidischen2495
R2.2496
Hausaufgabe 3.12.3. Bestimmen Sie die Matrix der Orthogonalprojektion auf die Ebene x+ y+ z = 0 im2497
euklidischen R3.2498
Hausaufgabe 3.12.4. Erganzen Sie die fehlende Eintrage in den folgenden Matrizen, so dass diese ortho-2499
gonal werden:2500
a. 17
−3 2 ∗−6 −3 ∗∗ ∗ ∗
,2501
b. 15
3 ∗ 00 ∗ 5∗ ∗ ∗
,2502
c.
(0 ∗∗ ∗
),2503
d.
(1 ∗∗ ∗
).2504
Wieviele Losungen gibt es?2505
Kapitel 42506
Analysis, Teil II2507
4.1 Komplexe Zahlen2508
Wir fuhren einen weiteren Korper ein, der die reellen Zahlen erweitert.2509
Definition 4.1. Eine komplexe Zahl ist ein Paar (a, b) ∈ R2, geschrieben als a+ bi, wobei das Symbol i die2510
imaginare Einheit genannt wird. Wir nennen a den Realteil und b den Imaginarteil der komplexen Zahl.2511
Wir schreiben2512
C := {a+ bi | a, b ∈ R}als die Menge der komplexen Zahlen. Wir definieren Addition und Multiplikation wie folgt:
(a+ bi) + (c+ di) = (a+ c) + (b+ d)i
(a+ bi) · (c+ di) = (ac− bd) + (ad+ bc)i.
Die rellen Zahlen sind in den komplexen Zahlen eingebettet als2513
R = {r + 0i | r ∈ R}.
Anschaulich kann man i intepretieren als√−1, d.h., es gilt i2 = −1. In der Tat ergibt die Multiplikati-2514
onsregel von oben dann Sinn, denn2515
(a+ bi) + (c+ di) = ac+ bci+ adi+ bdi2 = ac+ bci+ adi− bd = ac− bd+ (bc+ ad)i
wie in der Definition.2516
Wenn wir eine komplexe Zahl a+bi als Vektor
(ab
)auffassen, dann entspricht die Addition komplexer2517
Zahlen genau der Vektoraddition. Ferner entspricht die Multiplikation mit einer reellen Zahl genau der2518
Skalarmultiplikation2519
λ(a+ bi) = (λ+ 0i)(a+ bi) = λa+ λbi
und damit ist C ein zweidimensionaler R-Vektorraum mit Basis {1, i}. Allerdings hat C mehr Struktur:2520
Theorem 4.2. C ist ein Korper. Das neutrale Element der Addition ist 0 = 0+0i, und das inverse Element2521
von a+bi bezuglich Addition ist −a−bi. Das neutrale Element der Multiplikation ist 1 = 1+0i. Das inverse2522
Element zu a+ bi bezuglich Multiplikation ist2523
a
a2 + b2− b
a2 + b2i.
Hier sind ein paar Beispielrechnungen:
(2 + 3i) + (4− 2i) = 6 + i
(2 + 3i) · (4− 2i) = 8 + 12i− 4i− 6i2 = 14 + 8i
2 + 3i
4− 2i=
2 + 3i
4− 2i· 4 + 2i
4 + 2i=
8 + 12i+ 4i+ 6i2
16− 8i+ 8i− 4i2=
2 + 16i
20=
1
10+
4
5i.
93
94 KAPITEL 4. ANALYSIS, TEIL II
Eine wichtige Eigenschaft, die die komplexen Zahlen von den reellen Zahlen unterscheidet, geben wir2524
ohne Beweis an:2525
Theorem 4.3 (Fundamentalsatz der Algebra). Jedes reelle Polynom2526
p(x) = anxn + . . .+ a0
besitzt eine Nullstelle uber C.2527
Definition 4.4. Fur z = a+ bi bezeichnet2528
|z| =√a2 + b2
den Betrag von z.2529
Der Betrag stimmt mit der Norm von
(ab
)uberein. Es folgt sofort, dass die Dreiecksungleichung2530
|z1 + z2| ≤ |z1|+ |z2|
fur komplexe Zahlen z1, z2 erfullt ist.2531
Geometrische Interpretation. Wie bereits mehrfach erwahnt konnen wir eine komplexe Zahl a+ bi als2532
Punkt
(ab
)im R2 auffassen. Wir sprechen auch von der komplexen Ebene, wenn wir komplexe Zahlen so2533
darstellen.2534
Die Addition mit einem Vektor c+di bewirkt eine Translation mit dem Vektor
(cd
). Der Betrag einer2535
komplexen Zahl ist der Abstand zum Ursprung. Die Multiplikation kann man wie folgt deuten.2536
Lemma 4.5. Fur y = c+ di ist die Abbildung2537
f : C→ C, z 7→ y · z
linear, wobei C als R-Vektorraum aufgefasst wird.2538
• Ist |y| = 1, so ist f die Drehung, die
(10
)in
(cd
)uberfuhrt.2539
• Ist y ∈ R, so ist f eine zentrische Streckung mit Faktor y.2540
• Andernfalls ist f eine Drehung um y|y| , gefolgt von einer Streckung mit |y|.2541
Beweis. Die Linearitat von f rechnen wir nach. Fur z1, z2 ∈ C und λ ∈ R ist2542
f(λz1 + z2) = y(λz1 + z2) = λyz1 + yz2 = λf(z1) + f(z2).
Wie wir wissen, ist f als Matrix darstellbar, wobei die Spalten der Matrix den Bildern der Standardbasis2543
entsprechen. In unserem Fall ist die “Standardbasis” {1, i} (denn in der komplexen Ebene entspricht 1 dem2544
Vektor
(10
)und i dem Vektor
(01
). Wir rechnen nach:2545
f(1) = y = c+ di, f(i) = ci+ di2 = −d+ ci
Damit ist die Abbildung f durch die Matrix2546 (c −dd c
)gegeben. Ist |y| = 1, also c2 +d2 = 1, entspricht das einer Drehmatrix, wie wir am Ende des letzten Kapitels2547
gesehen haben.2548
4.1. KOMPLEXE ZAHLEN 95
Ist y ∈ R, dann ist d = 0, also ist die Matrix gleich c ·E2, was genau der Skalarmultiplikation mit Faktor2549
c entspricht. Geometrisch ist das eine Streckung.2550
Im allgemeinen Fall haben wir, dass2551
y = |y| y|y|
und die lineare Abbildung von oben ist eine Komposition von zwei linearen Abbildungen (Multiplikation2552
mit y|y| , gefolgt von Multiplikation mit |y|), die vom Fall 1 und 2 sind.2553
Komplexe Analysis. Der nachste Schritt besteht nun darin, die gesamte Theorie der Analysis, die wir2554
auf den reellen Zahlen entwickelt haben, auf die komplexen Zahlen zu ubertragen. Wir tun das nicht im2555
Detail, aber zeigen beispielhaft, dass sich in der Tat viele Definitionen und Satze ohne große Probleme2556
verallgemeinern.2557
Definieren wir zum Beispiel Folgen uber C in der offensichtlichen Art und Weise, dann konvergiert eine2558
Folge gegen den Grenzwert a ∈ C, wenn2559
∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : |an − a|︸ ︷︷ ︸∈R
< ε
(hier ist ε eine reelle Zahl). Der Konvergenzbegriff fur Reihen ist ebenfalls komplett analog. Wir haben auch2560
das Quotientenkriterium:2561
Theorem 4.6 (Quotientenkriterium uber C). Gibt es fur eine komplexe Folge (an)n∈N, ein q < 1 und ein2562
n0 ∈ N mit2563
|an+1||an|
≤ q ∀n ≥ n0
dann konvergiert die Reihe∑∞n=0 an gegen einen Grenzwert in C.2564
Der Beweis ist ganz ahnlich zum reellen Fall. Damit konnen wir die komplexe Exponentialfunktion defi-2565
nieren als2566
exp : C→ C, z 7→∞∑n=0
zn
n!= 1 + z +
z2
2+z3
6+z4
24+ . . .
Die wichtigste Eigenschaft der Exponentialfunktion ist die sogenannte Funktionalgleichung.2567
Theorem 4.7. Fur alle x, y ∈ C gilt2568
exp(x+ y) = exp(x) · exp(y)
Der Beweis besteht aus einer langlichen Rechnung uber die Reihendefinition von oben. Wir lassen dies2569
weg. Eine Folgerung aus der Funktionalgleichung ist, dass2570
1
exp(x)= exp(−x),
denn es gilt2571
exp(x) exp(−x) = exp(x− x) = exp(0) = 1.
Also ist exp(−x) in der Tat das inverse Element bezuglich Multiplikation.2572
Auch der Begriff der Stetigkeit ubertragt sich auf komplexe Funktionen. Wir schreiben limx→a f(x) = z,2573
wenn fur jede komplexe Folge (an)n∈N, die gegen a ∈ C konvergiert, auch die Folge (f(an))n∈N gegen z ∈ C2574
konvergiert. Die Funktion ist dann stetig in a ∈ C, falls2575
limx→a
f(x) = f(a)
gilt. f heißt stetig, wenn es in jedem Punkt des Definitionsbereichs stetig ist. Das ist alles vollig analog zum2576
reellen Fall. Es gilt weiterhin, genau wie im reellen Fall, dass die Addition, Multiplikation, Division, und2577
Komposition stetiger Funktionen auch wieder stetig ist.2578
96 KAPITEL 4. ANALYSIS, TEIL II
Ein einfaches Beispiel fur stetige Funktionen sind die Abbildungen2579
Re : C→ R, (a+ bi) 7→ a, Im : C→ R, (a+ bi) 7→ b,
welche jeder komplexen Zahl ihren Real- bzw Imaginarteil zuordnet. Der Beweis, dass diese Funktionen2580
stetig sind, ist einfach. Daraus folgt auch, dass die Betragsfunktion2581
C→ R, z 7→ |z|
stetig ist (Hausaufgabe).2582
Lemma 4.8. Die komplexe Exponentialfunktion ist stetig.2583
Beweis. Wir zeigen erst, dass exp stetig in 0 ist. Wir zeigen dafur, dass fur x ∈ C mit |x| ≤ 12 gilt, dass2584
| exp(x)− 1| ≤ 2|x|.
Der Beweis ist komplett analog zur Rechnung, die fur die reelle Exponentialfunktion im Abschnitt 2.6durchgefuhrt wurde:
| exp(x)− 1| =∣∣∣∣ limk→∞
(1 + |x|+ |x|2
2+ . . .+
|x|k
k!)− 1
∣∣∣∣=
∣∣∣∣ limk→∞
|x|+ |x|2
2+ . . .+
|x|k
k!
∣∣∣∣≤ |x| lim
k→∞(1 + |x|+ |x|2 + . . .+ |x|k)
≤ |x|1− |x|
≤ 2|x|
(wir haben hier ausgenutzt, dass die Betragsfunktion x → |x| uber C stetig ist) Daraus folgt direkt, dass2585
exp stetig in 0 ist. Fur a ∈ C beobachten wir, dass wir jede gegen a konvergente Folge (an)n∈N schreiben2586
konnen als an = a+ hn mit hn eine Nullfolge. Damit ergibt sich (mit der Funktionalgleichung)2587
limx→a
exp(x) = limh→0
exp(a+ h) = limh→0
exp(a) exp(h) = exp(a) limh→0
exp(h) = exp(a) exp(0) = exp(a)
wobei der vorletzte Schritt folgt, da exp stetig in 0 ist.2588
2589
Hausaufgabe 4.1.1. Weisen Sie nach, dass2590
a
a2 + b2− b
a2 + b2i
in der Tat invers zu a+ bi ist.2591
Hausaufgabe 4.1.2. Geben Sie ein geometrisches Verfahren an, um 1a+bi zu bestimmen.2592
Hausaufgabe 4.1.3. Beweisen Sie die Stetigkeit der Betragsfunktion (Hinweis: Drucken Sie den Betrag2593
als Komposition/Addition/Multiplikation anderer Funktionen aus).2594
Hausaufgabe 4.1.4. Schreiben Sie die folgenden komplexen Zahlen in der Form a+ bi, mit a, b ∈ R:
a.1 + i
7− i, b. |4 + 3i|, c.
∣∣∣∣2− 8i
3 + 8i
∣∣∣∣ ,d. (9 + 6i)4, e. i101, f.
1234∑n=1
in.
Hausaufgabe 4.1.5. Untersuchen Sie, ob die folgende komplexe Folge und komplexe Reihe konvergieren:2595
a. an =
(3 + 4i
5
)n, b.
∞∑k=1
ik
k!.
4.2. TRIGONOMETRISCHE FUNKTIONEN 97
4.2 Trigonometrische Funktionen2596
Nach dieser Vorarbeit konnen wir die Sinus- und Kosinusfunktion definieren:2597
Definition 4.9. Fur x ∈ R sei exp(ix) = c+ si mit c, s ∈ R. Wir schreiben2598
cosx := c, sinx := s.
fur den Sinus und Kosinus von x. Ferner ist der Tangens definiert als tan(x) := sin(x)cos(x) und der Kotangens2599
als cot(x) = cos(x)sin(x) .2600
Als Funktion konnen wir schreiben
cos : R→ R, x 7→ Re(exp(ix))
sin : R→ R, x 7→ Im(exp(ix)).
Beides sind stetige Funktionen (als Komposition von stetigen Funktionen). Beachten Sie auch, dass dies2601
reelle Funktionen sind, aber die Definition einen “Umweg” uber die komplexen Zahlen macht. Wir konnen2602
diesen Umweg auch vermeiden, und Sinus und Kosinus mit Hilfe einer Reihenentwicklung angeben:2603
Lemma 4.10. Fur x ∈ R gilt
cos(x) =
∞∑k=0
(−1)kx2k
(2k)!= 1− x2
2+x4
4!− x6
6!+ . . .
sin(x) =
∞∑k=0
(−1)kx2k+1
(2k + 1)!= x− x3
3!+x5
5!− x7
7!+ . . .
Beweis. Es gilt nach Definition
exp(ix) =
∞∑n=0
(ix)n
n!=
∞∑n=0
inxn
n!
=∑
n gerade
inxn
n!+
∑n ungerade
inxn
n!
=
∞∑k=0
i2kx2k
(2k)!+
∞∑k=0
i2k+1 x2k+1
(2k + 1)!
=
∞∑k=0
(i2)kx2k
(2k)!+ i
∞∑k=0
(i2)kx2k+1
(2k + 1)!
=
∞∑k=0
(−1)kx2k
(2k)!︸ ︷︷ ︸Realteil
+i
∞∑k=0
(−1)kx2k+1
(2k + 1)!︸ ︷︷ ︸Imaginarteil
.
2604
Damit ergiben sich sofort einige der wohlbekannten Eigenschaften von Sinus und Kosinus. Zum Beispielist
cos(−x) =
∞∑k=0
(−1)k(−x)2k
(2k)!=
∞∑k=0
(−1)kx2k
(2k)!= cos(x)
sin(−x) =
∞∑k=0
(−1)k(−x)2k+1
(2k + 1)!= −
∞∑k=0
(−1)kx2k+1
(2k + 1)!= − sin(x)
98 KAPITEL 4. ANALYSIS, TEIL II
Es folgt ausserdem, dass2605
exp(−ix) = exp(i(−x)) = cos(−x) + i sin(−x) = cos(x)− i sin(x).
Damit haben wir sofort, dass2606
cos(x)2 + sin(x)2 = (cos(x) + i sin(x))(cos(x)− i sin(x)) = exp(ix) exp(−ix) = exp(ix− ix) = exp(0) = 1.
Wir konnen nun auch die Kreiszahl π definieren. Erst brauchen wir ein Zwischenresultat:2607
Lemma 4.11. Die Funktion cos(x) hat im Intervall [0, 2] eine Nullstelle.2608
Beweis. Es ist cos(0) = 1. Wenn wir die Reihenentwicklung des Kosinus verwenden und x = 2 einsetzen,2609
sehen wir, dass cos 2 ≈ −0.4 < 0. Ferner ist cos eine stetige Funktion. Nach dem Zwischenwertsatz gibt es2610
also (mindestens) eine Nullstelle in [0, 2].2611
Definition 4.12. Wir definieren π ∈ R so, dass π2 die kleinste positive Nullstelle von cos ist. Nach dem2612
vorangehenden Lemma ist 0 < π < 4.2613
Theorem 4.13 (Additionstheoreme). Fur x, y ∈ R gilt
cos(x+ y) = cosx cos y − sinx sin y
sin(x+ y) = cosx sin y + sinx cos y
Beweis. Es gilt, dass
cos(x+ y) + i sin(x+ y) = exp(i(x+ y))
= exp(ix) exp(iy)
= (cosx+ i sinx) + (cos y + i sin y)
= (cosx cos y − sinx sin y) + i(cosx sin y + sinx cos y).
Die Aussagen folgen nun beide durch den Vergleich von Real- und Imaginarteil.2614
Wegen cos2 x+ sin2 x = 1, ist
(cosxsinx
)ein Punkt auf dem Einheitskreis S1 = {p ∈ R2 | ‖p‖ = 1} (fur2615
jedes x). Man kann zeigen, dass die Abbildung2616
C : [0, 2π)→ S1, φ 7→(
cosφsinφ
)bijektiv (und stetig) ist, also den Einheitskreis parametrisiert (dafur nutzt man die Differentialrechnung als2617
Hilfsmittel). Fur einen Punkt p ∈ S1 nennen wir φ = C−1(p) ∈ [0, 2π) den Polarwinkel von p. Allgemeiner2618
kann man jeden Punkt p 6= 0 ∈ R2 eindeutig darstellen als Paar (r, φ) mit r > 0 und φ ∈ [0, 2π), so dass2619
p = r · C(φ) gilt. (r, φ) heißen Polarkoordinaten von p.2620
Fur zwei Vektoren x1 und x2 mit Polarkoordinaten (r1, φ1) und (r2, φ2) konnen wir damit auch den2621
Winkel (im Bogenmass) definieren: Angenommen φ2 ≥ φ1, dann ist2622
^(x1, x2) := min{φ2 − φ1, 2π − (φ2 − φ1)}
(das ist nicht die einzig mogliche Definition, aber eine sinnvolle Variante). Beachten Sie, dass mit dieser2623
Definition ^(x1, x2) ∈ [0, π] gilt.2624
Wir definieren2625
arccos : [−1,+1]→ [0, π], φ 7→ cos−1(φ)
als die Umkehrabbildung des Kosinus im Bereich [0, π]. Dann gilt:2626
Theorem 4.14.
^(x1, x2) = arccos〈x1, x2〉‖x1‖‖x2‖
4.3. DIFFERENZIERBARKEIT 99
Beweis. Wir geben die Beweisskizze geometrisch an: Wir definieren y1 := x1
‖x1‖ , y2 := x2
‖x2‖ . Nun drehen wir2627
y1 und y2 so, dass y2 auf e1 abbildet. Das ist eine Drehung um −φ2. Der Polarwinkel des gedrehten y1,2628
nennen wir es z1, ist also φ1 − φ2. Damit ist2629
z1 =
(cos(φ2 − φ1)sin(φ2 − φ1)
).
Andererseits ist die x-Koordinate von z1 auch gleich 〈z1, e1〉. Da die Drehung eine orthogonale Abbildung2630
ist, ist aber 〈z1, e1〉 = 〈y1, y2〉. Insgesamt gilt also2631
cos(φ2 − φ1) = 〈y1, y2〉 = 〈 x1
‖x1‖,x2
‖x2‖〉 =
〈x1, x2〉‖x1‖‖x2‖
.
Schließlich gilt auch, dass cos(x) = cos(2π − x) (Additionstheorem), also gilt auch2632
cos(2π − (φ2 − φ1)) =〈x1, x2〉‖x1‖‖x2‖
.
Da ^x1, x2 entweder φ2 − φ1 oder 2π − (φ2 − φ1), folgt damit2633
cos(^x1, x2) =〈x1, x2〉‖x1‖‖x2‖
und die Behauptung folgt durch die Anwendung von arccos auf beiden Seiten.2634
2635
Hausaufgabe 4.2.1. Es gilt, dass sin(π2 ) = 1 (das konnen Sie ohne Beweis verwenden). Berechnen Sie2636
daraus nacheinander die Werte cos(π), sin(π), cos(2π), sin(2π). Zeigen Sie dann, dass2637
a. sin(x+ π) = − sin(x),2638
b. cos(π − x) = − cos(π),2639
c. sin(x+ 2π) = sin(x),2640
d. cos(x+ 2π) = cos(x).2641
Hausaufgabe 4.2.2. Folgern Sie aus dem Additionstheorem, dass2642
a. sinx− sin y = 2 · cos x+y2 · sin
x−y2 ,2643
b. cosx− cos y = −2 · sin x+y2 · sin
x−y2 .2644
Hausaufgabe 4.2.3. Zeigen Sie, dass2645
tan(x+ y) =tanx+ tan y
1− tanx tan y.
Hausaufgabe 4.2.4. Zeigen Sie, dass2646
a. sinx
2= ±
√1− cosx
2, b. cos
x
2= ±
√1 + cosx
2.
4.3 Differenzierbarkeit2647
Die Differentialrechnung ist ein weiteres zentrales Thema der Analysis. Die Grundidee ist die folgende:2648
Gegeben eine Funktion f und ein Punkt p = (a, f(a)) wollen wir die Funktion “in der Nahe” von p durch2649
eine Gerade annahern. Welche Gerade soll das sein? Es liegt auf der Hand, dass die Gerade durch p gehen2650
sollte. Außerdem soll sie sich an den Funktionsgraphen bestmoglich “anschmiegen”. Diese Gerade nennt man2651
auch Tangente der Funktion am Punkt p (wir definieren das gleich formal). Beispiele sind in Abbildung 4.12652
angegeben.2653
100 KAPITEL 4. ANALYSIS, TEIL II
Abbildung 4.1: Zwei Funktionsgraphen und Tangenten an jeweils zwei Punkten.
Abbildung 4.2: Zwei Funktionsgraphen, fur die (an einer gewissen Stelle) keine eindeutige Tangente definiertwerden kann.
Allerdings kann man eine solche Gerade nicht fur alle Funktionen finden. Ist zum Beispiel die Funktion2654
nicht stetig in a, fallt es uns schwer, eine sinnvolle Tangente einzuzeichnen. Aber selbst wenn bei stetigen2655
Funktionen ist dies mitunter schwierig, wie die Beispiele in Abbildung 4.2 zeigen. Der Grund ist anschaulich,2656
dass die Funktion an der entsprechende Stelle einen “Knick” hat, also nicht “glatt” ist.2657
Wie definieren wir diese Tangente nun formal? Es reicht, die Steigung der Tangente anzugeben, denn,2658
da die Tangente durch den Punkt p gehen soll, ist sie damit festgelegt. Nun sei h ∈ R beliebig und q =2659
(a+h, f(a+h)) ein weiterer Punkt auf dem Funktionsgraph. Ist h 6= 0, gibt es eine eindeutige Gerade durch2660
p und q, die man als Sekante bezeichnet. Die Steigung dieser Sekante ist gegeben durch2661
f(a+ h)− f(a)
h,
denn wenn x um h wachst, wachst die Gerade um f(a+h)− f(a) (die Formel stimmt auch, wenn h negativ2662
ist). Betrachten wir nun eine Nullfolge (hn)n∈N, dann konnen wir fur jedes hn die Sekantensteigung sn2663
betrachten. Abbildung 4.3 zeigt diesen Prozess. Wir konnen beobachten, dass die Folge sn in der Tat gegen2664
die gewunschte Tangentensteigung konvergiert. Dies motiviert die nachfolgende Definition.2665
Definition 4.15. Sei D ⊂ R und F : D → R. Existiert fur a ∈ D der Grenzwert2666
limh→0
h 6=0,a+h∈D
f(a+ h)− f(a)
h=: f ′(a)
a a+h
p
Abbildung 4.3: Die Sekanten nahern sich immer weiter der Tangente an, wenn wir den zweiten Sekantenpunktnaher an p heranschieben.
4.3. DIFFERENZIERBARKEIT 101
so heißt f differenzierbar in a, und f ′(a) die Ableitung von f an der Stelle a. f heißt differenzierbar, wenn2667
es fur jedes x ∈ D differenzierbar ist. In diesem Fall ist2668
f ′ : D → R, x 7→ f ′(x)
die Ableitung von f .2669
Die Grenzwertdefintion mit h → 0, h 6= 0, a + h ∈ D bedeutet, dass wir alle Nullfolgen betrachten, fur2670
die kein Folgeglied gleich 0 ist, und so, dass a + h im Definitionsbereich liegt. Eine alternative aquivalente2671
Definition ist2672
f ′(a) = limx→a
x 6=a,x∈D
f(x)− f(a)
x− a.
Wir definieren auch die Tangente von f an der Stelle a als Gerade mit der Gleichung2673
y = f ′(a)(x− a) + f(a).
Dies ist die Gerade durch den Punkt (a, f(a)), mit der Steigung f ′(a).2674
Wir besprechen nun einige Beispiele:2675
• Die konstante Funktion f(x) = c ist differenzierbar, denn2676
limh→0
h6=0
f(a+ h)− f(a)
h= lim
h→0
h6=0
c− ch
= limh→0
h6=0
0 = 0
Also ist f ′(x) = 0 fur alle x ∈ R.2677
• Fur f(x) = cx ist2678
limh→0
h6=0
f(a+ h)− f(a)
h= lim
h→0
h6=0
c(a+ h)− cah
= limh→0
h6=0
ch
h= c
Also ist f ′(x) = c fur alle x ∈ R.2679
• Fur f(x) = exp(x) ist
limh→0
h6=0
f(a+ h)− f(a)
h= lim
h→0
h6=0
exp(a+ h)− exp(a)
h
= limh→0
h6=0
exp(a) exp(h)− exp(a)
h= exp(a) lim
h→0
h6=0
exp(h)− 1
h
Es gilt, dass2680
limh→0
exp(h)− 1
h= 1.
Das sieht man nicht sofort, da sowohl Zahler als auch Nenner gegen 0 konvergieren und daher die2681
Grenzwertsatze keine Anwendung finden. Ein plausibles Argument, warum der Grenzwert 1 ist, er-2682
halten wir indem wir die Reihenentwicklung von exp(h) verwenden:2683
exp(h)− 1
h=
(1 + h+ h2
2 + h3
6 + . . .)− 1
h=h+ h2
2 + h3
6 + . . .
h= 1 +
h
2︸︷︷︸→0
+h2
6︸︷︷︸→0
+ . . .→ 1.
Beachten Sie, dass dies kein echter Beweis ist, da wir eine unendliche Summe haben und daher den2684
Grenzwertsatz nicht anwenden konnen. Wir werden spater einen richtigen Beweis nachreichen.2685
Mit dieser Aussage ist dann jedenfalls exp′(a) = exp(a), dass heißt, die Ableitung der Exponential-2686
funktion ist die Exponentialfunktion selbst.2687
102 KAPITEL 4. ANALYSIS, TEIL II
• Wir berechnen die Ableitung von sin(x): Zunachst folgt aus Hausaufgabe 4.2.2, dass2688
sin(a+ h)− sin(a) = 2 cos(a+h
2) sin(
h
2).
Ferner gilt2689
limx→0
sin(x)
x= 1.
Wir geben wiederum nur ein halb-formales Argument mit Hilfe der Reihenentwicklung des Sinus an:2690
sin(x)
x=x− x3
3! + x5
5! − . . .x
= 1− x2
3!︸︷︷︸→0
+x4
5!︸︷︷︸→0
− . . .→ 1
Nun konnen wir nachrechnen2691
limh→0
h6=0
sin(ah)− sin(a)
h= lim
h→0
h6=0
2 cos(a+ h2 ) sin(h2 )
h= lim
h→0
h6=0
cos(a+h
2)
︸ ︷︷ ︸=cos(a), da cos stetig ist
limh→0
h6=0
sin(h2 )h2︸ ︷︷ ︸
=1
= cos(a)
Also ist sin′(a) = cos(a).2692
• Die Betragsfunktion |x| ist fur x = 0 nicht differenzierbar. Denn zum Beispiel ist fur die Folge hn = 1n2693
|x+ hn| − |x|hn
=|0 + 1
n | − |0|1n
= 1n→∞−−−−→ 1
und fur die Folge hn = − 1n2694
|x+ hn| − |x|hn
=|0− 1
n | − |0|− 1n
= −1n→∞−−−−→ −1
Also existiert der Grenzwert2695
limh→0
h 6=0
|a+ h| − |a|h
nicht.2696
Wie wir anfangs gesehen haben, ist es fur nicht-stetige Funktionen problematisch, eine eindeutige Tan-2697
gente zu definieren. Der folgende Satz druckt dies aus, denn seine Kontraposition lautet: Ist eine Funktion2698
nicht stetig in a, dann ist sie auch nicht differenzierbar in a.2699
Theorem 4.16. Ist f : D → R differenzierbar in a, so ist f auch stetig in a.2700
Beweis. Wir definieren2701
φ : D → R, x 7→ f(x)− (f ′(a)(x− a) + f(a))
Anschaulich ist φ die Differenzfunktion von f und der Tangente von f an a. Es gilt nun
limx→a
x 6=aφ(x) = lim
x→a
x6=a(x− a)
(f(x)− f(a)
x− a− f ′(a)
)
= limx→a
x 6=a(x− a)︸ ︷︷ ︸=0
limx→a
x6=a
f(x)− f(a)
x− a︸ ︷︷ ︸=f ′(a)
− limx→a
x6=af ′(a)︸ ︷︷ ︸
=f ′(a)
= 0
4.3. DIFFERENZIERBARKEIT 103
Da φ(a) = 0, ist damit auch limx→a φ(x) = 0. Nun ist nach Definition2702
f(x) = f ′(a)(x− a) + f(a) + φ(x)
und somit2703
limx→a
f(x) = f ′(a) limx→a
(x− a)︸ ︷︷ ︸=0
+f(a) + limx→a
φ(x)︸ ︷︷ ︸=0
= f(a)
und somit ist die Stetigkeit von f in a bewiesen.2704
Ableitungsregeln. Es gibt zahlreiche Regeln, wie man zusammengesetzte Funktionen ableitet.2705
Theorem 4.17 (Ableitungen fur Summen und Produkte). Sind f und g differenzierbare Funktionen in xund λ ∈ R, so sind auch f + g, λg und f · g differenzierbar in x, und es gilt
(f + g)′(x) = f ′(x) + g′(x)
(λf)′(x) = λf ′(x)
(fg)′(x) = f ′(x)g(x) + f(x)g′(x)
Beweis. Wir fuhren nur die Produktregel vor. Die ersten beiden Regeln sind einfacher:
limh→0
f(x+ h)g(x+ h)− f(x)g(x)
h
= limh→0
f(x+ h)g(x+ h)− f(x)g(x+ h) + f(x)g(x+ h)− f(x)g(x)
h
= limh→0
g(x+ h)f(x+ h)− f(x)
h+ limh→0
f(x)g(x+ h)− g(x)
h
= limh→0
g(x+ h) limh→0
f(x+ h)− f(x)
h+ limh→0
f(x) limh→0
g(x+ h)− g(x)
h
=g(x)f ′(x) + f(x)g′(x),
wobei wir im letzten Schritt im ersten Grenzwert die Stetigkeit von g ausgenutzt haben.2706
Als Beispiel konnen wir zeigen, dass fur f(x) = xn mit n ∈ N gilt, dass2707
f ′(x) = nxn−1.
Der Beweis kombiniert vollstandige Induktion und die Produktregel. Es ist eine Ubungsaufgabe. Damit2708
konnen wir sofort alle Polynomfunktionen ableiten. Zum Beispiel ist fur f(x) = 3x5 − 4x2 + 7:2709
f ′(x) = 3 · 5x4 − 4 · 2x+ 0 = 15x4 − 8x.
Von großer Bedeutung ist auch die folgende Regel fur Kompositionen.2710
Theorem 4.18 (Kettenregel). Ist f differenzierbar in x und g differenzierbar in f(x), dann ist auch g ◦ f2711
differenzierbar in x und es gilt2712
(g ◦ f)′(x) = g′(f(x))f ′(x).
Wir lassen den Beweis weg und besprechen stattdessen ein Beispiel: Die Funktion f(x) = sin(x2) ist eine2713
Komposition aus der Quadratsfunktion und der Sinusfunktion, und damit ist2714
f ′(x) = cos(x2) · 2x
Wir erwahnen auch eine Regel, um Umkehrabbildungen abzuleiten:2715
Theorem 4.19 (Umkerhrregel). Sei f bijektiv und differenzierbar an der Stelle x und f ′(x) 6= 0. Dann ist2716
f−1 differenzierbar an der Stelle y = f(x) und es gilt2717
(f−1)′(y) =1
f ′(f−1(y))=
1
f ′(x)
104 KAPITEL 4. ANALYSIS, TEIL II
Auch hier geben wir nur ein Beispiel an: Die Quadratfunktion f(x) = x2 ist auf dem Intervall [0,∞)2718
bijektiv und f ′(x) = 2x > 0 fur x > 0. Also ist die Umkehrabbildung g(y) :=√y differenzierbar auf (0,∞)2719
und es gilt2720
g′(y) =1
2 · √y.
2721
Hausaufgabe 4.3.1. Berechnen Sie cos′(a) und tan′(a).2722
Hausaufgabe 4.3.2. Beweisen Sie, dass nxn−1 die Ableitung von xn fur alle naturlichen Zahlen n ist.2723
Hausaufgabe 4.3.3. Beweisen Sie, dass 12√x
die Ableitung von√x ist ohne Verwendung der Umkehrregel.2724
(Tipp: Dritte binomische Formel)2725
Hausaufgabe 4.3.4. Beweisen Sie, dass die Ableitung der Funktion 1x die Funktion − 1
x2 ist.2726
Hausaufgabe 4.3.5. Verwenden Sie die Umkehrregel, um zu zeigen, dass2727
arccos′(x) = − 1√1− x2
.
Hausaufgabe 4.3.6. Untersuchen Sie die Differenzierbarkeit von 1x .2728
Hausaufgabe 4.3.7. Bestimmen Sie die Ableitung der Funktionen f(x) = cos(ex) und g(x) = x3 sin(x)√x.2729
Fur welche x ∈ R gilt der hergeleitete Ausdruck?2730
Hinweis: Benutzen Sie die vorherigen Aufgaben.2731
Hausaufgabe 4.3.8. Geben Sie eine Ableitungsregel fur den Quotienten fg an und beweisen Sie diese mit2732
Hilfe der Produktregel, Kettenregel und der Hausaufgabe 4.3.4.2733
4.4 Eigenschaften differenzierbarer Funktionen2734
Die Ableitung einer Funktion gibt viele Informationen uber das Verhalten der Funktion. Wir besprechen2735
einige Eigenschaften.2736
Maxima und Minima. Sei D ⊂ R. Wir nennen x ∈ D einen inneren Punkt von D, falls es ein ε > 02737
gibt, so dass (x − ε, x + ε) ⊂ D. Anschaulich bedeutet dies, das x in D ist, aber kein Randpunkt ist. Zum2738
Beispiel sind die inneren Punkte eines abgeschlossenen Intervalls [a, b] alle Punkte in (a, b).2739
Theorem 4.20. Sei f : D → R differenzierbar und a ein innerer Punkt von D. Dann gibt es ein Intervall2740
I = [a− ε, a+ ε] ⊂ D mit ε > 0, so dass gilt:2741
• Ist f ′(a) > 0, dann gilt fur x ∈ I:
x > a⇒ f(x) > f(a)
x < a⇒ f(x) < f(a).
• Ist f ′(a) < 0, dann gilt fur x ∈ I:
x > a⇒ f(x) < f(a)
x < a⇒ f(x) > f(a).
Beweis. Hier ist die Beweisidee: Angenommen, f ′(a) > 0, aber es gibt kein Intervall I wie gefordert. Dann2742
konnen wir fur jedes n ∈ N einen Punkt xn ∈ [a − 1n , a + 1
n ] finden, so dass xn 6= a, f(xn) ≤ f(a) falls2743
4.4. EIGENSCHAFTEN DIFFERENZIERBARER FUNKTIONEN 105
xn > a und f(xn) ≥ f(a) falls xn < a. Die Folge der xn konvergiert klarerweise gegen a, und fur jedes n ist2744
der Quotient f(xn)−f(a)xn−a ≤ 0. Damit ist der Grenzwert dieser Folge auch ≤ 0. Es gilt also2745
f ′(a) = limx→a
x6=a,x∈D
f(x)− f(a)
x− a= limn→∞
f(xn)− f(a)
xn − a≤ 0
was der Voraussetzung f ′(a) > 0 widerspricht. Der Fall f ′(a) < 0 geht analog.2746
Wir sagen, dass ein innerer Punkt x0 ∈ D ein lokales Maximum ist, falls es ein I = [x0 − ε, x0 + ε] gibt,2747
so dass f(x0) ≥ f(x) fur alle x ∈ I. Ein lokales Minimum ist ein Punkt, so dass f(x0) ≤ f(x) fur alle x ∈ I.2748
Nach dem vorherigen Satz folgt sofort:2749
Korollar 4.21. Ist x0 ein lokales Minimum oder lokales Maximum einer differenzierbaren Funktion, dann2750
ist f ′(x0) = 0.2751
Wir wissen, dass eine stetige Funktion auf einem abgeschlossenen Intervall sein Maximum und Minimum2752
annimmt (Satz 2.34). Allerdings gab uns der Beweis kein Verfahren, um das Maximum und Minimum zu2753
bestimmen. Fur differenzierbare Funktionen ist dies jedoch moglich:2754
Theorem 4.22. Sei f : [a, b]→ R differenzierbar und sei x0 ∈ [a, b], so dass f(x0) ein Maximum von f ist.2755
Dann gilt2756
1. f ′(x0) = 0, oder2757
2. x0 = a oder x0 = b.2758
Beweis. Ist x0 6= a und x0 6= b, dann ist x0 ein innerer Punkt. Da f(x0) das (globale) Maximum uber [a, b]2759
ist, muss x0 auch lokales Maximum sein. Wie oben gesehen ist damit f ′(x0) = 0.2760
Die gleiche Aussage gilt auch fur das Minimum von f .2761
Als Beispiel berechnen wir das Maximum der Funktion2762
f(x) = x2 − 3x+ 1 +4
x
auf dem Intervall [1, 4]. f ist differenzierbar und wir berechnen die Ableitung als2763
f ′(x) = 2x− 3− 4
x2.
Um die lokalen Extremstellen zu finden, mussen wir die Gleichung f ′(x) = 0 losen. Da auf dem Definitions-2764
gebiet x2 6= 0, konnen wir mit x2 multiplizieren und erhalten2765
2x3 − 3x2 − 4 = 0.
Wir “raten” hier, dass x = 2 eine Losung ist. Durch Polynomdivision erhalten wir2766
(x− 2)(2x2 + x+ 2) = 0
und durch quadratische Erganzung (oder p-q-Formel) sehen wir, dass 2x2 + x + 2 keine reellen Losungen2767
besitzt. Daraus folgt, dass das Maximum der Funktion an der Stelle x = 1, x = 2, oder x = 4 angenommen2768
wird. Wir rechnen nach2769
f(1) = 1− 3 + 1 + 4 = 3, f(2) = 4− 6 + 1 + 2 = 1, f(4) = 16− 12 + 1 + 1 = 6.
Das Maximum der Funktion ist also 6 und wird an der Stelle x = 4 angenommen.2770
106 KAPITEL 4. ANALYSIS, TEIL II
a b
Abbildung 4.4: Die gestrichtelte Tangente ist parallel zur Sekante durch (a, f(a)) und (b, f(b)).
Mittelwertsatz. Der Mittelwertsatz lasst sich anschaulich so ausdrucken: Fur eine differenzierbare Funk-2771
tion f und eine beliebige Sekante von (a, f(a)) nach (b, f(b)) gibt es zwischen a und b eine Tangente an f ,2772
die parallel zur Sekante verlauft. Abbildung 4.4 illustriert diesen Sachverhalt.2773
Fur den Beweis betrachten wir erstmal den Spezialfall, dass die Sekante horizontal ist.2774
Lemma 4.23 (Satz von Rolle). Sei f : [a, b]→ R differenzierbar und f(a) = f(b). Dann gibt es ein ξ ∈ (a, b)2775
mit f ′(ξ) = 0.2776
Beweis. Ist f die konstante Funktion, dann ist f ′(x) = 0 fur alle x ∈ [a, b], und die Aussage ist klar.2777
Sonst gibt es ein x0 ∈ (a, b) mit f(x0) 6= f(a). Wir nehmen an, dass f(x0) > f(a), der andere Fall geht2778
genauso. Da f stetig auf [a, b] ist, nimmt f sein Maximum an. Dieses Maximum muss aber im Innern von2779
[a, b] liegen (denn f(a) ist kein Maximum wegen f(x0) > f(a)). Nach Theorem 4.22 ist das Maximum also2780
ein lokales Maximum, und daher muss an der Stelle ξ, an der das Maximum angenommen wird, f ′(ξ) = 02781
gelten.2782
Eine Folgerung dieses Lemmas ist, dass zwischen zwei Nullstellen von f immer eine Nullstelle der Ab-2783
leitung liegen muss.2784
Theorem 4.24 (Mittelwertsatz). Ist f : [a, b]→ R differenzierbar, dann gibt es ein ξ ∈ (a, b) mit2785
f ′(ξ) =f(b)− f(a)
b− a.
Das ist in der Tat die Aussage von oben: f ′(ξ) ist die Tangentensteigung an der Stelle ξ, und f(b)−f(a)b−a2786
ist die Sekantensteigung fur die Sekante von a nach b. Das diese Steigungen gleich sind bedeutet, dass die2787
Geraden parallel (oder gleich) sind.2788
Beweis. Definiere die Hilfsfunktion2789
F (x) := f(x)− f(b)− f(a)
b− a(x− a)
Man rechnet nun leicht nach, dass F (a) = f(a) = F (b) gilt. Ferner ist F differenzierbar, weil f differenzierbar2790
ist. Nach dem Satz von Rolle gibt es also ein ξ ∈ (a, b) mit F ′(ξ) = 0. Wir rechnen nach, dass2791
F ′(x) = f ′(x)− f(b)− f(a)
b− a
Also impliziert F ′(ξ) = 0, dass2792
f ′(ξ) =f(b)− f(a)
b− a.
2793
Eine Konsequenz aus dem Mittelwertsatz ist das Monotonieverhalten differenzierbarer Funktionen.2794
4.4. EIGENSCHAFTEN DIFFERENZIERBARER FUNKTIONEN 107
Korollar 4.25. Sei f : [a, b]→ R differenzierbar.2795
1. Ist f ′(x) > 0 fur alle x ∈ [a, b], dann ist f streng monoton wachsend.2796
2. Ist f ′(x) ≥ 0 fur alle x ∈ [a, b], dann ist f monoton wachsend.2797
3. Ist f ′(x) < 0 fur alle [a, b], dann ist f streng monoton fallend.2798
4. Ist f ′(x) ≤ 0 fur alle [a, b], dann ist f monoton fallend.2799
Beweis. Wir fuhren nur den ersten Teil vor (der Rest geht ganz ahnlich). Angenommen, f ′(x) > 0 fur alle2800
x ∈ [a, b], aber f ist nicht streng monoton wachsend. Dann gibt es u < v ∈ [a, b], so dass f(u) ≥ f(v). Das2801
heißt, die Sekante von u nach v hat Steigung ≤ 0, oder formaler, f(v)−f(u)v−u ≤ 0. Nach dem Mittelwertsatz2802
gibt es ein ξ ∈ (u, v) mit f ′(ξ) ≤ 0. Da ξ ∈ [a, b], ist das ein Widerspruch zur Voraussetzung.2803
Wir wissen bereits, dass die Ableitung einer konstanten Funktion die Nullfunktion ist. Wir zeigen nun,2804
dass auch die Umkehrung gilt.2805
Korollar 4.26. Sei f : R → R differenzierbar mit f ′(x) = 0 fur alle x ∈ R. Dann gibt es ein c so dass2806
f(x) = c fur alle x ∈ R (d.h., f ist eine konstante Funktion).2807
Beweis. Wir beweisen die Aussage durch Kontraposition. Sei f nicht konstant. Dann gibt es x, y ∈ R mit2808
f(x) 6= f(y). Damit ist f(x)−f(y)x−y 6= 0. Nach dem Mittelwertsatz gibt es also ein ξ ∈ R mit f ′(ξ) 6= 0. Also2809
ist f ′ nicht die Nullfunktion.2810
Wir konnen nun eine interessante Charakterisierung der Exponentialfunktion herleiten:2811
Theorem 4.27. Sei f : R→ R differenzierbar mit f(0) = 1 und f ′ = f . Dann ist f = exp.2812
Beweis. Gegeben ein f wie oben, definiere2813
F (x) := f(x) exp(−x)
F ist differenzierbar. Wir berechnen die Ableitung mit der Produktregel2814
F ′(x) = f ′(x) exp(−x)− f(x) exp(−x) = f(x) exp(−x)− f(x) exp(−x) = 0
(das Minus in der Ableitung kommt von der inneren Ableitung von exp(−x)!). Es folgt, dass F eine konstante2815
Funktion ist (nach dem vorangehenden Korollar). Es gilt ferner2816
F (0) = f(0) exp(0) = 1 · 1 = 1.
Also ist f(x) exp(−x) = 1 fur alle x, und Multiplikation mit exp(x) auf beiden Seiten ergibt f(x) =2817
exp(x).2818
L’Hopital’sche Regel. Wir besprechen noch kurz einen Satz, mit dem man das Grenzwertverhalten von2819
Quotienten oft sehr leicht untersuchen kann.2820
Theorem 4.28. Sei I ein offenes Intervall und seien f, g : I → R differenzierbar mit x0 ∈ I und seig(x) 6= 0 fur alle x ∈ I \ {x0}. Falls
limx→x0
f(x) = 0 und limx→x0
g(x) = 0
oder limx→x0
f(x) =∞ und limx→x0
g(x) =∞
dann gilt: Falls2821
c := limx→x0
f ′(x)
g′(x)
existiert, so gilt2822
limx→x0
f(x)
g(x)= c.
Der Satz gilt auch fur x0 = ±∞ und c = ±∞.2823
108 KAPITEL 4. ANALYSIS, TEIL II
Auf den Beweis verzichten wir, verwenden den Satz jedoch, um zwei Grenzwerte aus diesem Kapitel2824
auszurechnen:2825
• Betrachte2826
limx→0
sin(x)
x
Da f(x) = sin(x) und g(x) = x beide fur x→ 0 gegen 0 konvergieren (und differenzierbare Funktionen2827
sind), ist die L’Hopital’sche Regel anwendbar. Es ist also2828
limx→0
f(x)
g(x)= limx→0
f ′(x)
g′(x)= limx→0
cos(x)
1= cos 0 = 1.
• Betrachte2829
limx→0
exp(x)− 1
x
Auch hier ist mit f(x) = exp(x)− 1 und g(x) = x die Regel anwendbar:2830
limx→0
f(x)
g(x)= limx→0
f ′(x)
g′(x)= limx→0
exp(x)
1= exp(0) = 1.
2831
Hausaufgabe 4.4.1. Geben Sie fur folgende Funktionen alle Intervalle an, fur die der Mittelwertsatz der2832
Differentialrechnung gilt:2833
a. f(x) =
{1x x 6= 0,
0 sonst,, b. g(x) = |x− 5| .
Geben Sie ein Gegenbeispiel fur ein Intervall, fur das der Mittelwertsatz der Differentialrechnung nicht gilt.2834
Hausaufgabe 4.4.2. Bestimmen Sie alle lokalen Minima und Maxima der Funktion f(x) = c · sin(x) fur2835
c ∈ R.2836
Hausaufgabe 4.4.3. Untersuchen Sie das Vorzeichen der Ableitung von f , die Monotonie von f und die2837
Extremwerte von f fur:2838
a. f(x) = x3 − 3
2x2 + 2, b. f(x) =
1
1 + x2, c. f(x) = e−x
2
.
4.5 Integralrechnung2839
Die Motivation fur die Integralrechnung besteht in der Berechnung eines Flacheninhalts (oder Volumens, in2840
hoheren Dimensionen) eines Objekts, welches durch eine Funktion begrenzt wird. Nehmen wir der Einfach-2841
heit halber an, dass unsere Funktion nicht-negativ ist und uber dem Intervall [a, b] definiert ist. Wir wollen2842
den Flacheninhalt der markierten Flache in Abbildung 4.5 bestimmen.2843
Wie berechnet man diesen Flacheninhalt? Eine Idee ist wie folgt: Wir unterteilen das Intervall [a, b] in2844
kleinere Teilintervalle und approximieren den Flacheninhalt uber dem Teilintervall durch ein Rechteck. Die2845
Hohe des Rechtecks konnen wir zum Beispiel als minimalen Funktionswert uber dem Teilintervall wahlen,2846
so wie in Abbildung 4.6 links, oder als das Maximum so wie in Abbildung 4.6 rechts. Es gibt auch andere2847
Moglichkeiten (zum Beispiel den Mittelpunkt zwischen Minimum und Maximum als Hohe zu wahlen). In2848
jedem Fall ist die Idee, dass sich die Vereinigung aller Rechtecke immer weiter der gesuchten Flache annahert,2849
je kleiner man die Teilintervalle wahlt. Wir konnen also den Flacheninhalt als Grenzwert dieses Prozesses2850
audrucken, wobei die Lange der Teilintervalle gegen 0 konvergiert. Die folgenden Definitionen formalisieren2851
diese Idee weiter und fuhren zum Begriff des Integrals.2852
4.5. INTEGRALRECHNUNG 109
a b
Abbildung 4.5: Der zu bestimmende Flacheninhalt.
a b a b
Abbildung 4.6: Approximation des Flacheninhalts durch Rechtecke.
Definition 4.29. Eine Unterteilung Z von [a, b] mit Stutzstellen a = x0 < x1 . . . < xn = b besteht aus2853
n Teilintervallen [xi−1, xi]. Wir bezeichnen die Lange des großten Teilintervalls maxi=1,...,n(xi − xi−1) als2854
Feinheit der Unterteilung. Wahlen t1, . . . , tn so dass ti ∈ [xi−1, xi]. Wir definieren die Riemannsumme von2855
f bezuglich t1, . . . , tn als2856
SZ(t1, . . . , tn) :=
n∑i=1
(xi − xi−1)f(ti)
Beachten Sie, dass (xi − xi−1)f(ti) der Flacheninhalt des Rechtecks mit Lange [xi−1, xi] und Hohe2857
[0, f(ti)] ist. Die Riemannsumme addiert also den Flacheninhalt dieser Rechtecke. Wir erhalten Abbil-2858
dung 4.6 links, wenn wir ti so wahlen, dass f(ti) minimal in [xi−1, xi] ist, und Abbildung 4.6 rechts, wenn2859
f(ti) maximal gewahlt wird.2860
Definition 4.30. Eine Funktion f ; [a, b] → R heißt integrierbar falls fur jede Folge von Unterteilungen,2861
deren Feinheiten gegen 0 konvergieren, die Riemannsummen gegen den gleichen Grenzwert konvergieren2862
(unabhangig von der Wahl der ti). In diesem Fall schreiben wir den Grenzwert als2863 ∫ b
a
f(x)dx
und nennen diesen Wert das Integral von f uber dem Intervall [a, b]. Falls b < a, definieren wir auch2864 ∫ b
a
f(x)dx := −∫ a
b
f(x)dx.
Auf den Ausdruck “dx” gehen wir nicht weiter ein; er zeigt an, uber welche Variable integriert wird (was2865
meistens ohnehin klar ist).2866
Welche Funktionen sind integrierbar? Recht viele! Wir notieren ohne Beweis:2867
Theorem 4.31. Fur f : [a, b]→ R:2868
• Ist f stetig, dann ist f auch integrierbar.2869
110 KAPITEL 4. ANALYSIS, TEIL II
• Ist f monoton, dann ist f auch integrierbar.2870
Ein Beispiel fur eine nicht-integrierbare Funktion ist2871
f(x) =
1x x > 0
0 x = 0
− 1x x < 0
auf dem Intervall [−1,+1].2872
Es ist anhand der Definition alles andere als klar, wie man ein Integral konkret ausrechnet (man kann2873
es durch eine Summe annahern, aber nicht exakt bestimmen). Das folgende Resultat liefert eine Antwort,2874
die Integrale mit Differentialrechnung in Verbindung setzt.2875
Theorem 4.32 (Hauptsatz der Integralrechnung, Teil 1). Fur f : [a, b]→ R stetig sei2876
F (x) : [a, b]→ R, x 7→∫ x
a
f(t)dt
Dann ist F differenzierbar und es gilt F ′ = f .2877
Obwohl der Beweis nicht schwierig ist, uberspringen wir ihn.2878
Definition 4.33. Wir nennen eine Funktion F : [a, b] → R eine Stammfunktion von f auf [a, b], wenn2879
F ′(x) = f(x) fur alle x ∈ [a, b].2880
Zwei Stammfunktionen F und G von f unterscheiden sich nur durch eine Konstante, denn (F −G)′ =2881
F ′ −G′ = f − f = 0, also ist F −G eine konstante Funktion (nach Korollar 4.26).2882
Theorem 4.34 (Hauptsatz der Integralrechnung, Teil 2). Sei F eine Stammfunktion von f auf [a, b]. Dann2883
gilt2884 ∫ b
a
f(x)dx = F (b)− F (a)
Auch hier lassen wir den Beweis weg. Man schreibt oft auch ein unbestimmtes Integral2885 ∫f(x)dx = F
um auszudrucken, dass F Stammfunktion von f fur jedes Intervall ist. Dabei ist zu beachten, dass die2886
Stammfunktion nur bis auf eine Konstante festgelegt ist.2887
Das Verfahren, um ein Integral zu bestimmen, laßt sich also wie folgt zusammenfassen:2888
1. Bestimme eine Stammfunktion F von f .2889
2. Werte F an den Integralgrenzen aus.2890
Wenig uberraschend ist der erste Schritte der schwierigere. Wahrend eine Ableitung zu berechnen relativ2891
einfach ist, ist die Umkehrung (das Berechnen der Stammfunktion) deutlich schwieriger. In der Tat ist der2892
beste Weg haufig, eine Stammfunktion F fur f zu “raten” — und durch Ableiten nachzuweisen, dass2893
F ′ = f in der Tat gilt. Naturlich muss man geschickt raten, was man nur durch Ubung erreichen kann. Es2894
gibt auch einige allgemeine Techniken, um Stammfunktionen zu berechnen, aber wir besprechen diese nicht2895
und schliessen das Kapitel mit ein paar Beispielen ab.2896
• Wir berechnen2897 ∫ 2π
0
sin(x)dx
Wir wissen, dass cos′ = − sin, also ist − cos′ = sin, und somit ist − cos(x) eine Stammfunktion des2898
Sinus. Also ist2899 ∫ 2π
0
sin(x)dx = − cos(2π)− (− cos(0)) = −1 + 1 = 0
4.5. INTEGRALRECHNUNG 111
Abbildung 4.7: Das Integral der Sinuskurve.
Um das Ergebnis zu verstehen schauen wir uns Abbildung 4.7 an, welches die Sinusfunktion zwischen2900
0 und 2π darstellt. Wir beachten, dass das Integral mit Vorzeichen behaftet ist, d.h. wenn die Funktion2901
unterhalb der x-Achse verlauft, geht der entsprechende Flacheninhalt negativ in das Integral ein. Da2902
sich in diesem Fall die positiven und negativen Flacheninhalte offenbar aufheben, ist der Wert 0 des2903
Integrals zwangslaufig. Rechnen wir nun den linken Teil aus, ergibt sich ein positiver Wert:2904 ∫ π
0
sin(x)dx = − cos(π)− (− cos(0)) = 1 + 1 = 2
• Besteht die Funktion f aus einer Summe, so kann man die Stammfunktion jedes Summanden bestim-2905
men und aufaddieren (das folgt sofort aus der Tatsache, dass die Ableitung einer Summe gleich der2906
Summe der Ableitungen ist). Als Beispiel betrachten wir2907 ∫ 2
1
(x2 − 3x+ 4)dx.
Eine Stammfunktion von x2 ist 13x
3, wie man leicht nachrechnet. Ebenso ist − 32x
2 Stammfunktion2908
von −3x und 4x Stammfunktion von 4. Also ist2909
F (x) :=1
3x3 − 3
2x2 + 4x
Stammfunktion. Da F (2) = 143 und F (1) = 17
6 , gilt2910 ∫ 2
1
(x2 − 3x+ 4)dx =14
3− 17
6=
11
6.
• Die Integralgrenzen konnen auch ±∞ sein. Zum Beispiel ist2911 ∫ ∞1
1
x2dx = lim
y→∞
∫ y
1
1
x2dx.
Anschaulich enspricht dies dem Flacheninhalt des unbegrenzten Gebiets unter dem Funktiongraph 1x22912
uber [1,∞) (siehe Abbildung 4.8).2913
Zur Berechnung brauchen wir wiederum die Stammfunktion von 1x2 . Diese ist − 1
x , wie man leicht2914
nachrechnet. Es ist also2915 ∫ y
1
1
x2dx = −1
y− (−1
1) = 1− 1
y
und daher2916 ∫ ∞1
1
x2dx = lim
y→∞(1− 1
y) = 1.
2917
112 KAPITEL 4. ANALYSIS, TEIL II
Abbildung 4.8: Die Kurve 1x2 .
Hausaufgabe 4.5.1. Berechnen Sie den Flacheninhalt einer halben Kreisscheibe mit Hilfe der Integral-2918
rechnung (Tipp: Hausaufgabe 4.3.5 kann sehr hilfreich sein).2919
Hausaufgabe 4.5.2. Bestimme fur n ∈ N eine Stammfunktion von xn.2920
Hausaufgabe 4.5.3. Sei n ∈ N. Drucken Sie2921 ∫xnexdx
ohne einen Integraloperator aus.2922
Hausaufgabe 4.5.4. Bestimmen Sie alle α ∈ R, fur die der Grenzwert2923
limy→∞
∫ y
1
1
xαdx
existiert.2924
Hinweis: Sie durfen ohne Beweis benutzen, dass lima→∞ a−b genau dann konvergiert, wenn b ≥ 0 ist.2925
Hausaufgabe 4.5.5. Die x-Achse und der Graph der Funktion f(x) = x(x − 1)(x + 2) umschließen zwei2926
beschrankte Bereiche. Bestimme ihren Gesamt-Flacheninhalt (also unbeachtet auf positiver und negativer2927
Flache).2928
Kapitel 52929
Lineare Algebra, Teil II2930
5.1 Determinanten2931
Wir motivieren den Determinantenbegriff zunachst in niedrigen Dimensionen. Betrachten wir x, y ∈ R2.2932
1. Wir wissen bereits, dass α := ^(x, y) der (kleinere) Winkel ist, der durch x und y definiert ist. Wir2933
fragen nun: Erhalten wir y aus x, indem wir x um α im oder gegen den Uhrzeigersinn drehen? Im2934
ersten Fall heißt das Paar (x, y) negativ orientiert, sonst positiv orientiert.2935
2. Wie groß ist der Flacheninhalt des Parallelogramms, welches durch x und y aufgespannt wird?2936
Fur die erste Frage: Erinnern Sie sich, dass2937
^(x, y) = arccos〈x, y〉‖x‖‖y‖
.
Da cos(x) ≥ 0 auf [0, π2 ] und cos(x) ≤ 0 auf [π2 , π] ist, folgt daraus sofort:2938
^(x, y) =
< π
2 wenn 〈x, y〉 > 0
= π2 wenn 〈x, y〉 = 0
> π2 wenn 〈x, y〉 < 0.
Mit anderen Worten: das Vorzeichen des Skalarproduktes 〈x, y〉 gibt an, ob der Winkel zwischen x und y spitz2939
(< π2 ) oder stumpf (> π
2 ) ist. Die folgende Aussage folgt sofort durch einfache geometrische Betrachtungen:2940
Lemma 5.1. Sei x⊥ der Vektor, der aus x durch eine Drehung um π2 hervorgeht (gegen den Uhrzeigersinn).2941
Dann gilt:2942
• Ist 〈x⊥, y〉 > 0, dann ist (x, y) positiv orientiert.2943
• Ist 〈x⊥, y〉 < 0, dann ist (x, y) negativ orientiert.2944
• Ist 〈x⊥, y〉 = 0, dann sind x und y linear abhanging.2945
Der Vektor x⊥ lasst sich aus x einfach durch die entsprechende Drehmatrix berechnen:2946
x⊥ =
(cos π2 − sin π
2sin π
2 cos π2
)(x1
x2
)=
(0 −11 0
)(x1
x2
)=
(−x2
x1
).
Daher ist die Antwort auf die Frage durch das Vorzeichen von2947
〈x⊥, y〉 = x1y2 − x2y1
gegeben.2948
113
114 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Abbildung 5.1: Die sechs Summanden der Determinante.
Zur zweiten Frage (Flacheninhalt des Parallelogramms) bemerken wir, dass dieser Flacheninhalt gegeben2949
ist durch Grundseite mal Hohe. Wahlen wir den Vektor x als Grundseite, ist die Lange naturlich ‖x‖. Fur2950
die Hohe beobachten wir, dass x, x⊥ (wie oben definiert) eine Orthogonalbasis ist. Schreiben wir x, x⊥ fur2951
die normierten Vektoren, ergibt sich eine Orthonormalbasis. Wir konnen dann y schreiben als2952
y = 〈y, x〉x+ 〈y, x⊥〉x⊥
und die Hohe des Parallelogramms entspricht dann genau dem Betrag des zweiten Koeffizient |〈y, x⊥〉|.2953
Beachten Sie auch, dass ‖x⊥‖ = ‖x‖ gilt. Also ist der Flacheninhalt2954
‖x‖|〈y, x⊥〉| = ‖x‖|〈y, x⊥
‖x‖〉| = |〈y, x⊥〉| = |x1y2 − x2y1|,
also gibt der Absolutbetrag des gleichen Ausdrucks wie oben den Flacheninhalt an.2955
Wir nennen die Funktion2956
det : R2 × R2 → R, (x, y) 7→ x1y2 − x2y1
die Determinante in R2.2957
Im R3 definieren wir ebenfalls eine Determinante. Dafur betrachten wir zuerst das Kreuzprodukt2958
x× y :=
x2y3 − x3y2
x3y1 − x1y3
x1y2 − x2y1
und definieren die Determinante im R3 als2959
det(x, y, z) := 〈x× y, z〉
Ausgeschrieben ergibt das2960
det(x, y, z) = x1y2z3 + x2y3z1 + x3y1z2 − x3y2z1 − x2y1z3 − x1y3z2.
Man merkt sich diese Form leichter mit der Regel van Sarrus, die in Abbildung 5.1 dargestellt ist. Mit ein2961
wenig Ubung lasst sich die Determinate so auch recht schnell berechnen.2962
Wir berechnen als Beispiel2963
det(
134
,
2−13
,
013
) = −3 + 8 + 0− 0− 3− 18 = −16
Alternativ konnen wir auch das Kreuzprodukt berechnen:2964 134
× 2−13
=
9 + 48− 3−1− 6
=
135−7
und2965
det = 〈
135−7
,
013
〉 = 5− 21 = −16.
5.1. DETERMINANTEN 115
Die Interpretation der Determinante im R3 ist dem ebenen Fall ganz ahnlich. Der Betrag von det(x, y, z)2966
gibt das Volumen des Spats an, der durch die drei Vektoren aufgespannt wird (der Spat ist eine Art verzerrter2967
Wurfel). Das Volumen ist 0 genau dann, wenn die drei Vektoren linear abhangig sind. Das Vorzeichen gibt2968
an, ob die durch x, y, z aufgespannte Basis positiv oder negative orientiert ist. Was das bedeutet, kann man2969
mit dem folgenden Verfahren erklaren:2970
1. Sind (x, y) positiv orientiert (innerhalb der aufgespannten Ebene), nimm die rechte Hand, sonst die2971
linke Hand.2972
2. Halte Daumen, Zeige- und Mittelfinger der entsprechenden Hand so, dass der Daumen in Richtung2973
von x und der Zeigefinger in Richtung von y zeigt. Halte den Mittelfinger so, dass er senkrecht auf den2974
beiden anderen Fingern steht. Außer fur Leute mit sehr großer Flexibilitat gibt es nur eine Richtung,2975
in der dies moglich ist.2976
3. Die Determinante ist positiv, genau dann wenn der Vektor z in den gleichen Halbraum zeigt wie der2977
Mittelfinger.2978
Dies hat durchaus praktische Anwendungen, zum Beispiel in der Physik und Elektrotechnik (siehe https:2979
//de.wikipedia.org/wiki/Drei-Finger-Regel).2980
Der allgemeine Determinantenbegriff.2981
Definition 5.2. Eine Abbildung2982
det : Kn × . . .×Kn︸ ︷︷ ︸n mal
→ K
heißt Determinante, wenn gilt:2983
(multi-linear) Fur alle i = 1, . . . , n gilt2984
det(x1, . . . , λxi + x′i, . . . , xn) = λ det(x1, . . . , xi, . . . , xn) + det(x1, . . . , x′i, . . . , xn).
(alternierend) Ist xi = xj fur i 6= j, dann gilt2985
det(x1, . . . , xn) = 0
(normiert)det(e1, . . . , en) = 1
Fur eine Matrix A ∈ Kn definieren wir det(A) als die Determinante der Zeilenvektoren von A. Im Folgenden2986
bezeichnen wir mit A1, . . . , An diese Zeilenvektoren.2987
Man kann nachweisen (Hausaufgabe), dass die Determinanten, die wir in R2 und in R3 definiert haben2988
in der Tat diese drei Eigenschaften erfullen.2989
Theorem 5.3. Fur jedes n ≥ 2 existiert eine Determinantenabbildung. Diese ist auch eindeutig definiert.2990
Wir werden die Existenz fur n > 3 nicht im Detail zeigen, geben allerdings eine Formel fur die allgemeine2991
Determinante an (die sogenannte Laplace’sche Entwicklungsformel). Fur j = 1, . . . , n beliebig ist2992
det(A) =
n∑i=1
(−1)i+jaij det(Aij)
wobei aij der (i, j)-Eintrag der Matrix A ist, und Aij die (n1) × (n − 1)-Matrix ist, die aus A entsteht2993
wenn wir die i-te Zeile und die j-te Spalte loschen. Man kann die drei Eigenschaften der Determinante mit2994
vollstandiger Induktion beweisen.2995
Die Eindeutigkeit der Determinante folgt aus den Eigenschaften, die wir im Folgenden studieren werden.2996
Zunachst uberlegen wir uns, was mit der Determinante von A passiert, wenn wir elementare Zeilenopera-2997
tionen anwenden.2998
116 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Lemma 5.4. Es gilt2999
1. Fur λ ∈ K ist3000
det(A1, . . . , λAi, . . . , An) = λ det(A1, . . . , Ai, . . . , An).
2. Fur i < j ist3001
det(A1, . . . , Aj , . . . , Ai, . . . , An) = −det(A1, . . . , Ai, . . . , Aj , . . . , An)
(d.h., Vertauschen von zwei Zeilen andert das Vorzeichen der Determinante).3002
3. Es gilt3003
det(A1, . . . , Ai, . . . , Aj + λAi, . . . , An) = det(A1, . . . , Ai, . . . , Aj , . . . , An)
(d.h. eine Zeilenaddition andert die Determinante nicht).3004
Beweis. Die erste Eigenschaft folgt sofort aus der Linearitat der Determinante. Die dritte Eigenschaft folgt3005
auch einfach:3006
det(A1, . . . , Ai, . . . , Aj+λAi, . . . , An) = det(A1, . . . , Ai, . . . , Aj , . . . , An)+λ det(A1, . . . , Ai, . . . , Ai, . . . , An)︸ ︷︷ ︸= 0, da det alternierend ist
.
Fur die zweite Eigenschaft zeigen wir, dass3007
det(A1, . . . , Ai, . . . , Aj , . . . , An) + det(A1, . . . , Aj , . . . , Ai, . . . , An) = 0,
was offensichtlich die Aussage impliziert. Da det alternierend und linear ist, folgt
det(A1, . . . , Ai, . . . , Aj , . . . , An) + det(A1, . . . , Aj , . . . , Ai, . . . , An)
= det(A1, . . . , Ai, . . . , Aj , . . . , An) + det(A1, . . . , Ai, . . . , Ai, . . . , An)︸ ︷︷ ︸=0
+
det(A1, . . . , Aj , . . . , Ai, . . . , An) + det(A1, . . . , Aj , . . . , Aj , . . . , An)︸ ︷︷ ︸=0
= det(A1, . . . , Ai, . . . , Ai +Aj , . . . , An) + det(A1, . . . , Aj , . . . , Ai +Aj , . . . , An)
=0.
3008
Es folgt eine weitere wichtige Eigenschaft der Determinanten: Ist die Matrix in Dreiecksgestalt (d.h.3009
unter der Diagonalen sind nur Nullen), so lasst sich der Wert einfach berechnen:3010
Lemma 5.5. Ist A eine obere Dreiecksmatrix, d.h3011
A =
λ1 ∗. . .
0 λn
mit λ1, . . . , λn ∈ K (nicht notwendigerweise 6= 0), dann ist3012
detA = λ1 · . . . · λn.
Beweis. Wir skizzieren den Beweis nur: Sind alle λi 6= 0, dann konnen wir durch weitere elementare Zeilen-3013
operationen (vom Typ 3 in Lemma 5.4) A auf die Gestalt3014 λ1 0. . .
0 λn
5.1. DETERMINANTEN 117
bringen (also mit samtlichen Eintragen 0, außer auf der Diagonalen). Diese Operationen andern die Deter-3015
minante nicht. Mit dem ersten Fall von Lemma 5.4 ergibt sich also3016
detA = det
λ1 0. . .
0 λn
= λ1 . . . λn det En = λ1 . . . λn,
wobei wir im letzten Schritt ausgenutzt haben, dass det normiert ist.3017
Es fehlt noch der Fall, dass ein λi = 0 ist. In dem Fall lasst sich durch Zeilenoperationen eine ganze3018
Zeile von A auf 0 bringen. Es ist dann leicht zu sehen, dass die Determinante auch 0 sein muss, denn3019
det(. . . , 0, . . .) = det(. . . , 0 · 0, . . .) = 0 det(. . . , 0, . . .) = 0
Dies beweist die Aussage.3020
Damit haben wir einen Algorithmus, um die Determinante zu berechnen:3021
1. Bringe die Matrix in Zeilenstufenform (mit Operationen vom Typ 2 und 3 in Lemma 5.4). Sei k die3022
Anzahl von durchgeuhrten Zeilenvertauschungen und3023 λ1 ∗. . .
0 λn
die Zeilenstufenform.3024
2. Berechne (−1)kλ1 · . . . · λn.3025
Der Faktor (−1)k ist so zu interpretieren: Ist die Anzahl der Zeilenvertauschungen ungerade, dann muss3026
das Vorzeichen von λ1 · . . . · λn umgedreht werden.3027
Es ist auch moglich, Operationen vom Typ 1 anzuwenden (also eine Zeile mit einem Skalar zu multipli-3028
zieren). In dem Fall muss das Endergebnis durch den gleichen Skalarwert dividiert werden.3029
Als Beispiel berechnen wir
det(
013
,
51520
,
2−13
) = det
0 1 35 15 202 −1 3
= 5 det
0 1 31 3 42 −1 3
=− 5 det
1 3 40 1 32 −1 3
= −5 det
1 3 40 1 30 −7 −5
= −5 det
1 3 40 1 30 0 16
=− 5 · 1 · 1 · 16 = −80.
Naturlich kann man hier auch die Sarrusregel anwenden — allerdings funktioniert diese Methode fur3030
beliebig grosse Matrizen.3031
Wir konnen nun beweisen, dass die Determinantenabbildung eindeutig ist (der zweite Teil von Theo-3032
rem 5.3): der vorgestellte Algorithmus liefert den Wert jeder Determinantenabbildung (wir haben die kon-3033
krete Definition der Determinante nicht verwendet, sondern nur, dass die Abbildung linear, alternierend3034
und normiert ist). Das bedeutet, alle Funktionen mit diesen drei Eigenschaft mussen ubereinstimmen, was3035
bedeutet, dass die Funktion eindeutig ist.3036
Wir besprechen noch einige weitere Eigenschaften der Determinante:3037
Theorem 5.6. Fur eine Matrix A ∈ Kn×n gilt:3038
• det(A) = det(AT )3039
118 KAPITEL 5. LINEARE ALGEBRA, TEIL II
• det(AB) = det(A) det(B)3040
• det(A) = 0⇔ rk(A) < n.3041
Beweis. Wir besprechen nur die letzte Eigenschaft: Sei A′ die Matrix in Zeilenstufenform, die sich aus A3042
durch das Gaussverfahren ergibt. Es gilt dann |detA| = |detA′| (die Betragsstriche sind notig, weil sich das3043
Vorzeichen durch Zeilenvertauschungen umdrehen kann). Jedenfalls ist also detA = 0 genau dann, wenn3044
detA′ = 0. In der Zeilenstufenform einer (n×n)-Matrix gibt es zwei Moglichkeiten: Ist rk(A′) < n, dann ist3045
die letzte Zeile von A′ gleich 0 und damit auch detA′ = 0. Ist rkA′ = n, dann sind die Pivotelemente alle3046
auf der Diagonalen, und diese sind alle 6= 0, also ist auch deren Produkt 6= 0. Dieses Produkt ist jedoch, bis3047
auf Vorzeichen, gleich der Determinante von A′. Also gilt detA′ 6= 0 genau dann, wenn rkA′ < n.3048
Ein Zusammenhang mit dem Losen von linearen Gleichungssystemen ergibt sich durch die folgende3049
Regel:3050
Theorem 5.7 (Cramer’sche Regel). Sei A ∈ Kn×n eine Matrix mit rkA = n. Sei b ∈ Kn und x ∈ Kn die3051
(eindeutige) Losung von3052
Ax = b.
Seien a1, . . . , an die Spalten von A, dann gilt3053
xi =1
detAdet(a1, . . . , ai−1, b, ai+1, . . . , an).
Den Beweis fuhren wir nicht durch. Als Beispiel betrachten wir das Gleichungssystem:3054 1 1 00 1 13 2 1
x =
110
.
Mit Hilfe des Gaussverfahrens konnen wir ausrechnen, dass dieses Gleichungssystem die eindeutige Losung3055 −12−1
besitzt. Wir konnen diese Losung auch mit der Cramer’schen Regel berechnen. Zunachst rechnen wir aus3056
(z.B. mit Sarrusregel):3057
det
1 1 00 1 13 2 1
= 2
Nun berechnen wir
x1 =1
2· det
1 1 01 1 10 2 1
=1
2· (−2) = −1
x2 =1
2· det
1 1 00 1 13 0 1
=1
2· 4 = 2
x3 =1
2· det
1 1 10 1 13 2 0
=1
2· (−2) = −1.
Von einem algorithmischen Standpunkt aus ist dieses Verfahren nicht schneller als die Losung mit Hilfe3058
des Gaussverfahrens. Wir erwahnen jedoch eine wichtige Eigenschaft: Fur ein fixes n konnen wir det als3059
Funktion von Kn2
nach K auffassen. Wenn wir K = R setzen, ist diese Funktion stetig in den Koordinaten3060
(wir haben Stetigkeit fur solche Funktionen nicht formal definiert, aber anschaulich heißt es, dass die Funk-3061
tion nicht springt, also sich nur sehr wenig andert, wenn wir die Eintrage in der Matrix wenig andern). Die3062
5.2. DIE LINEARE GRUPPE 119
Cramer’sche Regel sagt nun, dass die Losung eines (eindeutig losbaren) linearen Gleichungssystems Ax = b3063
ebenfalls stetig von den Eintragen in A und in b abhangt.3064
3065
Hausaufgabe 5.1.1. Weisen Sie nach, dass die Determinanten im R2 und R3 in der Tat multi-linear,3066
alternierend und normiert sind. Weisen Sie auch nach, dass diese Abbildungen mit der Entwicklungsformel,3067
die wir fur allgemeine n angegeben haben, ubereinstimmt.3068
Hausaufgabe 5.1.2. Bestimmen Sie die Determinanten der folgenden reellen Matrizen:3069
a.
1 2 31 2 1−2 0 2
, b.
2 0 2 11 2 0 00 2 1 10 1 2 3
.
Hausaufgabe 5.1.3. Sei n ∈ N. Berechnen Sie die Determinante der (n× n)-Matrix A = (aij), wobei3070
aij =
{0 wenn i = j,
1 sonst.
Hausaufgabe 5.1.4. Losen Sie folgende Gleichungssysteme mit der Cramer’sche Regel:3071
a.
(1 23 −1
)x =
(13
),3072
b.
1 2 01 −1 21 0 0
x =
111
,3073
c.
1 3 43 5 −44 7 −2
x =
50231
.3074
5.2 Die lineare Gruppe3075
Definition 5.8. Wir nennen eine Matrix A ∈ Kn×n regular, wenn rkA = n gilt. Andernfalls heißt die3076
Matrix A singular. Wir schreiben GL(n;K) fur die Menge aller regularen Matrizen in Kn×n.3077
Beachten Sie, dass eine Matrix A regular ist genau dann, wenn detA 6= 0. Daraus folgt sofort:3078
Lemma 5.9. Sind A, B regular, so ist auch A ·B regular.3079
Beweis. det(AB) = det(A) · det(B) 6= 0, da A und B regular sind.3080
Theorem 5.10. Gl(n;K) wird mit Matrizenmultiplikation zu einer (nicht-abelschen) Gruppe. Das neutrale3081
Element ist die Einheitsmatrix3082
En =
1 0. . .
0 1
Das Inverse Element zu A wird mit A−1 bezeichnet.3083
Beweis. Wie wir im vorherigen Lemma gezeigt haben, liefert die Matrizenmultiplikation in der Tat eine3084
Verknupfung3085
Gl(n;K)×Gl(n;K)→ Gl(n;K).
Man uberzeugt sich leicht, dass Matrizenmultiplikation assoziativ ist (das hatten wir bereits an fruherer3086
Stelle erwahnt). Auch ist offenbar AEn = A = EnA, also ist En das neutrale Element.3087
Zur Existenz von A−1 bemerken wir, dass A, aufgefasst als lineare Abbildung f : Kn → Kn, x 7→ Ax3088
bijektiv ist: In der Tat bedeutet rkA = n, dass f surjektiv ist, und wegen n = dimKn = dim ker A +3089
dim ImA, folgt, dass dim ker A = 0, was bedeutet, dass f auch injektiv ist. Also hat die lineare Abbildung3090
f eine Umkehrabbildung f−1, welche ebenfalls linear ist (Lemma 3.30), und daher durch eine Matrix A−13091
dargestellt ist. Es gilt nun offenbar fur jedes x, dass AA−1x = x = A−1Ax, also ist A−1A = En.3092
120 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Korollar 5.11. Ist A regular, so hat das Gleichungssystem Ax = b genau eine Losung fur jedes b ∈ Kn.3093
Beweis. Da A regular ist, gibt es A−1 invers zu A. Nun ist A−1b eine Losung des Systems, denn3094
A(A−1b) = (AA−1)b = Enb = b
Außerdem gilt fur jedes x mit Ax = b, dass3095
x = Enx = (A−1A)x = A−1(Ax) = A−1b,
was die Eindeutigkeit zeigt.3096
Kennen wir zur Matrix A also die inverse Matrix A−1, dann konnen wir Ax = b durch eine Matrixmul-3097
tiplikation A−1b losen (was einfacher ist als ein Gaussverfahren). Allerdings ist die Berechnung von A−13098
im Allgemeinen nicht weniger aufwandig als die Losung des Gleichungssystems. Wir werden im nachsten3099
Abschnitt ein Verfahren kennenlernen.3100
3101
Hausaufgabe 5.2.1. Weisen Sie nach, dass3102 0 −1 112
12 − 1
2− 1
212
12
die inverse Matrix fur3103
A =
1 2 00 1 11 1 1
ist. Losen Sie die Gleichungssysteme3104
a. Ax =
121
, b. Ax =
−203
, c. Ax =
24−1
.
Hausaufgabe 5.2.2. Fur welche t ∈ R ist folgende Matrix At singular? Bestimmen Sie fur alle t ∈ R den3105
Rang von At.3106
At =
5− 9t −4 −2−4 5− 9t −2−2 −2 8− 9t
5.3 Basistransformationen3107
Ein Vektorraum hat viele verschiedene Basen. Es ist von vorherein nicht klar, welche Basis die “angenehms-3108
te” zur Arbeit in einem Vektorraum ist. Naturlich ist im Kn die Standardbasis (e1, . . . , en) naheliegend,3109
Wir schauen uns nun genauer an, wie wir von einer Basis zu einer anderen wechseln konnen. Wie wir sehen3110
werden, lasst sich jede regulare Matrix (also jede bijektive Abbildung im Kn) als Basiswechsel interpretieren.3111
Seien B = (v1, . . . , vn) und B′ = (w1, . . . , wn) zwei Basen des Kn. Wie wir wissen, hat jedes x ∈ Kn
eindeutige Darstellungen:
x = λ1v1 + . . .+ λnvn (bezuglich B),
x = µ1w1 + . . .+ µnwn (bezuglich B′).
Wir betrachten nun die Abbildung, welche
λ1
...λn
nach
µ1
...µn
abbildet. Dies ist eine Abbildung von3112
Kn nach Kn und man rechnet leicht nach, dass sie linear ist. Also lasst sie sich als Matrix schreiben. Wir3113
nennen3114
MB→B′ ∈ Kn×n
5.3. BASISTRANSFORMATIONEN 121
die Matrix des Basiswechsels von B nach B′. Die i-te Spalte
m1i
...mni
von MB→B′ erhalten wir, indem wir3115
vi als Linearkombination der wi ausdrucken, also3116
vi = m1iw1 + . . .+mniwn.
Als Beispiel nehmen wir3117
B = (
100
,
110
,
111
) = (v1, v2, v3), B′ = (
200
,
−111
,
023
) = (w1, w2, w3).
Fur die Matrix MB→B′ mussen wir die vi’s als Linearkombination der wi’s ausdrucken. Im Allgemeinengeschieht dies durch das Losen eines Gleichungssystems. In diesem einfachen Beispiel kann man jedochwenigstens zwei der drei Losungen auch durch “scharfes Hinschauen” losen. Es ergibt sich jedenfalls
v1 =1
2w1
v2 = 2w1 + 3w2 − w3
v3 = w1 + w2
und damit3118
MB→B′ =
12 2 10 3 10 −1 0
Sei nun zum Beispiel x = 5v1 + 3v2 − v3. Wir konnen nachrechnen, dass3119
x =
72−1
in Standardkoordinaten ist. Wenn wir nun x als Linearkombination von B′ ausdrucken wollen, rechnen wir3120
einfach3121
MB→B′
53−1
=
1528−3
und in der Tat ist3122
15
2w1 + 8w2 − 3w3 =
72−1
.
Wir schreiben ab jetzt E = (e1, . . . , en) fur die Standardbasis. Wir sehen dann, dass jede regulare Matrix3123
A ∈ Kn×n die Matrix eines Basiswechsels ist:3124
A = MB→E
wobei B durch die Spalten von A gegeben ist (welche eine Basis bilden, da A regular ist).3125
Als Beispiel nehmen wir3126
A =
2 0 13 1 11 2 1
und3127
x = 2
231
− 5
012
+ 1
111
122 KAPITEL 5. LINEARE ALGEBRA, TEIL II
dargestellt in B, der Spaltenbasis von A. Wir berechnen nun3128
A
2−51
=
52−7
= 5e1 + 2e2 − 7e3
und wir sehen, dass dies in der Tat der Vektor x in Standardkoordinaten ist.3129
Umgekehrt ist jede Basiswechselmatrix auch regular, weil die zugehorige Abbildung Kn → Kn bijektiv3130
ist. Es gibt also eine inverse Matrix, und es gilt3131
M−1B→B′ = MB′→B.
In der Tat ist MB′→B ·MB→B′ die Komposition der Abbildungen, die folgendes tut: Ein Vektor dargestellt3132
in der Basis B wird zunachst in der Basis B′ und dann wieder in der Basis B ausgedruckt. Wegen der3133
Eindeutigkeit der Basisdarstellung ist diese Komposition also die Identitat, dargestellt durch En. Wir lassen3134
einen fomalen Beweis weg.3135
Als Beispiel betrachten wir das Beispiel von oben. Wir drucken nun die wi’s durch die vi’s aus:
w1 = 2v1
w2 = −2v1 + v3
w3 = −2v1 − v2 + 3v3
und damit3136
MB′→B =
2 −2 −20 0 −10 1 3
.
Wir konnen nun nachrechnen3137
MB→B′MB′→B =
12 2 10 3 10 −1 0
· 2 −2 −2
0 0 −10 1 3
=
1 0 00 1 00 0 1
Nun sind wir auch in der Lage, fur eine regulare Matrix A die inverse Matrix A−1 auszurechnen: Wir3138
intepretieren A = MB→E , und wir berechnen ME→B. Das bedeutet, wir mussen e1, . . . , en mit Hilfe der3139
Basis B (also den Spalten von A) ausdrucken.3140
Nehmen wir die Matrix A von oben. Um e1 durch die Spalten von A darzustellen, losen wir das Glei-3141
chungssystem3142 2 0 1 13 1 1 01 2 1 0
→ 1 2 1 0
3 1 1 02 0 1 1
→ 1 2 1 0
0 −5 −2 00 −4 −1 1
→ 1 2 1 0
0 −5 −2 00 0 3
5 1
An dieser Stelle konnten wir bereits auflosen: x3 = 5
3 , x2 = − 23 , x1 = − 1
3 . Wir konnen jedoch auch3143
anders vorgehen: Wir konnen weitere Zeilenoperationen durchfuhren, um auch alle Eintrage oberhalb der3144
Diagonalen auf 0 zu setzen, und auch die Diagonaleintrage auf der linken Seiten zusatzlich alle auf 1 setzen3145
(dies geht deshalb, weil die Matrix regular ist):3146
. . .→
1 2 1 00 1 2
5 00 0 1 5
3
→ 1 2 0 − 5
30 1 0 − 2
30 0 1 5
3
1 0 0 − 13
0 1 0 − 23
0 0 1 53
Das bedeutet also, dass3147
−1
3
231
− 2
3
012
+5
3
111
= e1
5.3. BASISTRANSFORMATIONEN 123
wie man leicht zur Probe nachrechnet. Fur e2 gehen wir ahnlich vor 2 0 1 03 1 1 11 2 1 0
→ 1 2 1 0
3 1 1 12 0 1 0
→ 1 2 1 0
0 −5 −2 10 −4 −1 0
→ 1 2 1 0
0 −5 −2 10 0 3
5 − 45
→
1 2 1 00 1 2
5 − 15
0 0 1 − 43
→ 1 2 0 4
30 1 0 1
30 0 1 − 4
3
→ 1 0 0 2
30 1 0 1
30 0 1 − 4
3
Und fur e3 analog: 2 0 1 0
3 1 1 01 2 1 1
→ 1 2 1 1
3 1 1 02 0 1 0
→ 1 2 1 1
0 −5 −2 −30 −4 −1 −2
→ 1 2 1 1
0 −5 −2 −30 0 3
525
→
1 2 1 10 1 2
535
0 0 1 23
→ 1 2 0 1
30 1 0 1
30 0 1 2
3
→ 1 0 0 − 1
30 1 0 1
30 0 1 2
3
Insgesamt ergibt sich also3148
A−1 =
− 13
23 − 1
3− 2
313
13
53 − 4
323
Wir konnen jedoch folgendes beobachten: In allen drei Rechnungen von oben wurden exakt die gleichenZeilenoperationen durchgefuhrt! Der einzige Unterschied waren die Ergebnisse im Spaltenvektor ganz rechts.Wir hatten also die Rechnung auch simultan auf allen drei Einheitsvektoren durchfuhren konnen wie folgt: 2 0 1 1 0 0
3 1 1 0 1 01 2 1 0 0 1
→ 1 2 1 0 0 1
3 1 1 0 1 02 0 1 1 0 0
→ 1 2 1 0 0 1
0 −5 −2 0 1 −30 −4 −1 1 0 −2
→
1 2 1 0 0 10 −5 −2 0 1 −30 0 3
5 1 − 45
25
→ 1 2 1 0 0 1
0 1 25 0 − 1
535
0 0 1 53 − 4
323
→ 1 2 0 − 5
343
13
0 1 0 − 23
13
13
0 0 1 53 − 4
323
→
1 0 0 − 13
23 − 1
30 1 0 − 2
313
13
0 0 1 53 − 4
323
Dies ist ein allgemeines Verfahren zur Berechnung von A−1:3149
• Wende elementare Zeilenoperationen auf die Matrix (A | En) an bis die linke Seite gleich En ist.3150
• Die rechte Seite ist dann A−1.3151
Darstellung von linearen Abbildungen. Sei f : Kn → Kn eine lineare Abbildung (nicht notwenider-3152
weise bijektiv) und B = (v1, . . . , vn) eine Basis von Kn. Die Matrix3153
MfB ∈ K
n×n
heißt Darstellung von f bezuglich Basis B, falls fur alle x ∈ Kn gilt: Ist3154
x = λ1v1 + . . .+ λnvn
und3155
f(x) = µ1v1 + . . .+ µnvn
124 KAPITEL 5. LINEARE ALGEBRA, TEIL II
dann ist3156
MfB
λ1
...λn
=
µ1
...µn
.
Die i-te Spalte von MfB ist definiert als
m1i
...mni
, wobei3157
f(vi) = m1iv1 + . . .+mnivn,
also, die Koordinaten von f(vi) ausgedruckt in der Basis B.3158
Diese Definition liefert also eine Matrix, wenn wir eine lineare Abbildung und eine Basis fixieren. Erinnern3159
Sie sich (Lemma 3.37), dass wir jeder linearen Abbildung bereits eine Matrix A zugeordnet haben: Dabei3160
haben wir die Spalten von A als die Bilder von e1, . . . , en definiert. Unsere neue Definition ist also eine3161
Verallgemeinerung der alten Definition und es gilt3162
A = MfE .
Als Beispiel betrachten wir die lineare Abbildung f , fur die gilt3163
f(e1) =
123
, f(e2) =
−110
, f(e3) =
02−1
(beachten Sie, dass f durch die Bilder auf einer Basis eindeutig definiert ist) und sei3164
B = (v1, v2, v3) := (
100
,
110
,
111
).
Wir wollen MfB berechnen. Dazu mussen wir f(vi) berechnen und als Linearkombination der vi ausdrucken:
f(v1) =
123
= −v1 − v2 + 3v3
f(v2) = f(e1 + e2) = f(e1) + f(e2) =
033
= −3v1 + 3v3
f(v3) = f(e1) + f(e2) + f(e3) =
052
= −5v1 + 3v2 + 2v3
Also ist3165
MfB =
−1 −3 −5−1 0 33 3 2
Setzen wir nun zum Beispiel3166
x = 4v1 − 3v2 + v3
Dann gilt wegen3167
MfB
4−31
=
0−15
,
5.3. BASISTRANSFORMATIONEN 125
dass3168
f(x) = −v2 + 5v3.
Wir konnen nachrechnen, dass dies stimmt. In Standarkoordinaten ist3169
x = 4
100
− 3
110
+
111
=
2−21
und damit3170
f(x) = f(2e1−2e2+e3) = 2f(e1)−2f(e2)+f(e3) = 2
123
−2
−110
+
02−1
=
445
= −v2+5v3.
Fur eine lineare Abbildung f und zwei Basen B, B′ gilt3171
MfB = MB′→B · Mf
B′ · MB→B′ .
Das ist klar: Um f bezuglich Basis B darzustellen, konnen wir zunachst zur Basis B′ wechseln, dann f3172
bezuglich Basis B′ darstellen, und dann zuruck zur Basis B wechseln.3173
Als Beispiel rechnen wir MfB von oben nochmals aus. Sei B′ = E , wir wissen schon:3174
MB→B′ =
1 1 10 1 10 0 1
.
Da wir die Bilder von f unter e1, e2 und e3 kennen, wissen wir auch3175
MfB′ =
1 −1 02 1 23 0 1
.
Es fehlt noch die Matrix Mbasis′→B. Dies ist die inverse Matrix zu MB→B′ von oben. Wir rechnen nach,3176
dass3177
MB′→B =
1 −1 00 1 −10 0 1
.
Damit ist also3178
MfB =
1 1 10 1 10 0 1
1 −1 02 1 23 0 1
1 −1 00 1 −10 0 1
=
−1 −3 −5−1 0 33 3 2
Definition 5.12. Zwei Matrizen X, Y in Kn×n heißen ahnlich, wenn es eine regulare Matrix M ∈ Kn×n
3179
gibt mit3180
Y = M−1 ·X ·M.
Lemma 5.13. Zwei Matrizen X und Y sind ahnlich genau dann, wenn es eine lineare Abbildung f und3181
zwei Basen B, B′ gibt, so dass3182
X = MfB , Y = Mf
B′
gilt (also X und Y sind Darstellungen der gleichen Abbildungen bezuglich zweier Basen).3183
Beweis. Ist X = MfB und Y = Mf
B′ , dann ist3184
Y = Y = MfB′ = MB→B′M
fBMB′→B = M−1XM
mit M = MB′→B, also sind X und Y ahnlich.3185
126 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Umgekehrt, sind X und Y ahnlich mit Y = M−1XM , dann konnen wir die regulare Matrix M inter-3186
pretieren als M = MB→E und X als lineare Abbildung f durch X = MfE . Dann ist3187
Y = M−1XM = ME→BMfEMB→E = Mf
E
also sind X und Y von der gewunschten Form.3188
Es stellt sich nun die Frage: Gegeben eine lineare Abbildung f : Kn → Kn, gibt es eine Basis, bezuglich3189
der f eine besonders einfache Gestalt hat? Dies ist eine motivierende Frage fur das nachste Kapitel.3190
3191
Hausaufgabe 5.3.1. Bestimmen Sie die Inverse der folgende Matrizen:3192
a.
1 2 32 3 42 4 5
,3193
b.
1 0 02 4 12 −1 0
,3194
c.
0 1 1−1 1 1−1 0 1
,3195
d.
0 2 1−1 1 1−1 0 1
.3196
Hausaufgabe 5.3.2. Gegeben sind die Basen B und B′ im R3:3197
B = (
123
,
234
,
245
), B′ = (
100
,
241
,
2−10
).
a. Bestimmen Sie die Matrizen ME→B und MB→E der Basiswechsel zwischen der kanonischen Basis E3198
im R3 und B.3199
b. Bestimmen Sie die Matrizen MB→B′ und MB′→B.3200
c. Geben Sie die Representation des Vektors x =
123
∈ R3 in B und B′ an.3201
Hausaufgabe 5.3.3. Sei f : R3 → R3, x 7→ Ax die lineare Abbildung definiert durch die Matrix:3202
A =
1 3 20 2 10 0 3
.
Geben Sie die Darstellungsmatrix MfB fur folgenden Basen an:3203
a. B = (
100
,
310
,
522
), b. B = (
112
,
121
,
211
).
Hausaufgabe 5.3.4. Zeigen Sie, dass Ahnlichkeit eine Aquivalenzrelation auf Kn×n ist. Geben Sie auch3204
die Aquivalenzklasse der Matrix En an.3205
Hausaufgabe 5.3.5. Zeigen Sie: Wenn X, Y ahnlich sind, dann ist rkX = rkY .3206
Hausaufgabe 5.3.6. Seien B, B′ Orthonormalbasen von Kn. Zeigen Sie, dass MB→B′ eine orthogonale3207
Matrix ist.3208
5.4. EIGENVEKTOREN UND EIGENWERTE 127
5.4 Eigenvektoren und Eigenwerte3209
Eine lineare Abbildung f : Kn → Kn ordnet jedem Vektoren einen anderen Vektor zu. Setzen wir zum3210
Beispiel K = R und n = 2, dann konnen wir diese Zuordnung wie folgt interpretieren: Wir drehen den3211
Vektor um einen Winkel in [0, π) und skalieren den Vektor um einen gewissen Faktor λ ∈ R (wobei ein3212
negativer Faktor bedeutet, dass der Vektor umgedreht wird). Ein Eigenvektor einer linearen Abbildung3213
ist ein Vektor, der von f nicht gedreht, sondern nur skaliert wird. Der Skalierungsfaktor λ heißt dann der3214
Eigenwert des Vektors. Es folgt die allgemeine Definition, die diese Intuition verallgemeinert.3215
Definition 5.14. Sei f : Kn → Kn eine lineare Abbildung. Ein Vektor x 6= 0 heißt Eigenvektor von f zu3216
einem Eigenwert λ ∈ K, falls gilt3217
f(x) = λx.
Hier folgen einige Beispiele:3218
• Ist x ∈ ker f und x 6= 0, dann ist x Eigenvektor zum Eigenwert 0.3219
• Ist f eine Spiegelung im R2 an der Ursprungsgerade y = sx, dann ist
(1s
)ein Eigenvektor zum3220
Eigenwert 1 (d.h., f(x) = x). Gleiches gilt fur jeden anderen Punkt auf der Gerade y = sx (ausser dem3221
Ursprung). Der Vektor
(s−1
)steht senkrecht auf
(1s
)und seine Spiegelung ist folglich
(−s1
)3222
(man mache sich das durch ein Bild klar). Also ist
(1s
)ein Eigenvektor zum Eigenwert −1.3223
• Sei f die Drehung im R2 um π2 . Dann hat f keinen Eigenvektor.3224
Definition 5.15. Wir nennen eine lineare Abbildung f : Kn → Kn diagonalisierbar wenn es eine Basis3225
B = (v1, . . . , vn) von Kn gibt, die aus Eigenvektoren von f besteht. In diesem Fall gilt3226
MfB =
λ1 0. . .
0 λn
wobei λi der Eigenwert zum Eigenvektor vi ist.3227
Das bedeutet: Bezuglich einer Basis B aus Eigenvektoren hat f eine besonders einfache Gestalt. Wir3228
notieren die direkte Folgerung aus dieser Definition:3229
Korollar 5.16. Eine Matrix A ist ahnlich zu einer Diagonalmatrix (d.h. einer Matrix mit 0-Eintragen3230
außerhalb der Diagonalen) genau dann wenn die Abbildung f : Kn → Kn, x 7→ Ax diagonalisierbar ist.3231
Berechnung von Eigenwerten und Eigenvektoren3232
Lemma 5.17. Sei f : Kn → Kn, x 7→ Ax. Dann ist λ ein Eigenwert von f genau dann, wenn gilt3233
det(A− λEn) = 0.
Beweis. Es gilt
λ ist Eigenwert von f
⇔ ∃v 6= 0 : Av = λ · v⇔ ∃v 6= 0 : Av − λ · v = 0
⇔ ∃v 6= 0 : (A− λEn)v = 0
⇔ ker(A− λEn) 6= {0}⇔ rk(A− λEn) < n
⇔ det(A− λEn) = 0.
3234
128 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Um alle λ mit obiger Eigenschaft zu finden, definieren wir uns ein Polynom, dessen Nullstellen genau3235
die gesuchten Eigenwerte sind:3236
Definition 5.18. Sei t eine Variable. Dann ist fur eine Matrix A ∈ Kn×n,3237
PA(t) := det(A− tEn)
ein Polynom uber K vom Grad n. Wir nennen PA(t) das charakteristische Polynom von A.3238
Fur den Rest des Abschnitts fixieren wir die Beispiele:3239
A =
0 −1 1−3 −2 3−2 −2 3
, B =
(cosα − sinαsinα cosα
).
Wir rechnen nun nach:
PA(t) = det
0− t −1 1−3 −2− t 3−2 −2 3− t
= (0− t)(−2− t)(3− t) + 6 + 6 + 2(−2− t) + 6(0− t)− 3(3− t)
= −t3 + t2 + t− 1 = (t− 1)(−t2 + 1) = (t− 1)2(t+ 1),
PB(t) = det
(cosα− t − sinα
sinα cosα− t
)= (cosα− t)2 + sin2 α = (cosα− t)2 + 1− (cosα)2.
Lemma 5.19. Sind X und Y ahnliche Matrizen, dann ist PX(t) = PY (t).3240
Diese Lemma erlaubt es uns, das charakterische Polynom einer linearen Abbildung f , Pf (t) zu definieren3241
als PM (t) mit M = MfB beuglich einer beliebigen Basis B. Die Definition hangt nicht von der Basis ab, da ein3242
Basiswechsel zu einer ahnlichen Matrix und damit nach Lemma zum gleichen charakteristischen Polynom3243
fuhrt.3244
Beweis. Sei Y = M−1XM mit einer regularen Matrix M . Es gilt dass3245
tEn = tM−1EnM = M−1tEnM
(vergleiche die Rechenregeln fur Matrizen im Abschnitt 3.6). Also ist
PY (t)
= det(Y − tEn)
= det(M−1XM +M−1tEnM)
= det(M−1(X − tEn)M)
= det(M−1) det(X − tEn) detM
= det(M−1) det(M) det(X − tEn)︸ ︷︷ ︸=PX(t)
= det(M−1M︸ ︷︷ ︸=En
)PX(t).
3246
Der nachste Satz liefert ein Rechenverfahren zur Bestimmung von Eigenvektoren.3247
Theorem 5.20. Sei f : Kn → Kn eine lineare Abbildung und A = MfB bezuglich irgendeiner Basis B (zum3248
Beispiel der Standardbasis). Dann gilt3249
1. λ ist ein Eigenwert von f genau dann, wenn PA(λ) = 0.3250
5.4. EIGENVEKTOREN UND EIGENWERTE 129
2. Ist λ ein Eigenwert von f , so ergeben sich alle Eigenvektoren zum Eigenwert λ als nicht-trivale3251
Losungen des Gleichungssystems3252
(A− λEn)x = 0
Beweis. Wir schreiben M := MfE . Beachten Sie, dass PA(t) = PM (t) nach dem vorangehenden Lemma. Mit3253
Hilfe von Lemma 5.17 gilt nun3254
PA(λ) = 0 ⇔ PM (λ) = 0 ⇔ det(M − λEn) = 0 ⇔ λ ist Eigenwert von f
und der erste Teil ist bewiesen. Der zweite Teil ist einfach, denn x ist eine Losung von (A − λEn)x = 03255
genau dann, wenn Ax− λx = 0, d.h. Ax = λx.3256
Wir setzen die Beispiele von eben fort. Wegen3257
PA(t) = −(t− 1)2(t+ 1)
Sind λ = 1 und λ = −1 die Eigenwerte. Fur λ = −1 bringen wir A+ En auf Zeilenstufenform3258 0 + 1 −1 1−3 −2 + 1 3−2 −2 3 + 1
=
1 −1 1−3 −1 3−2 −2 4
⇒ 1 −1 1
0 −4 60 −4 6
⇒ 1 −1 1
0 −4 60 0 0
und der Losungsraum ist gegeben durch3259
{µ
132
| µ ∈ R}.
Damit sind alle diese Vektoren, außer dem Nullvektor, die Eigenvektoren zum Eigenwert −1.3260
Fur λ = 1 ergibt sich3261 0− 1 −1 1−3 −2− 1 3−2 −2 3− 1
=
−1 −1 1−3 −3 3−2 −2 2
⇒ −1 −1 1
0 0 00 0 0
und der Losungsraum ist3262
{λ
101
+ µ
011
| λ, µ ∈ R}.
Also sind alle diese Vektoren, außer dem Nullvektor, Eigenvektoren zum Eigenwert +1.3263
Kommen wir zur Matrix B. Wir haben berechnet3264
PB(t) = (t− cosα)2 + 1− (cosα)2
Wir sehen: Ist | cosα| < 1, dann ist 1− (cosα)2 > 0, und damit PB(λ) > 0 fur alle λ (da der erste Term als3265
Quadrat auch immer ≥ 0 ist). Es gibt also dann keinen Eigenwert, und auch keinen Eigenvektor. Es bleiben3266
nur die Falle α = 0 und α = π:3267
Fur α = 0 ist3268
B =
(1 00 1
)und wir sehen sofort, dass jeder Vektor Eigenvektor zum Eigenwert 1 ist.3269
Fur α = π ist3270
B =
(−1 00 −1
)Also ist B die Spiegelung am Ursprung, und jeder Vektor ist Eigenvektor zum Eigenwert −1.3271
130 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Diagonalisierbarkeit. Nun wissen wir also, wie wir (alle) Eigenvektoren einer Abbildung berechnen.3272
Allerdings war es unser Ziel, eine Basis aus Eigenvektoren zu berechnen.3273
Theorem 5.21. Sind v1, . . . , vk Eigenvektoren bezuglich paarweise verschiedener Eigenwerte von f . Dann3274
sind v1, . . . , vk linear unabhangig.3275
Beweis. Es seien λ1, . . . , λk die Eigenwerte von v1, . . . , vk. Wir beweisen die Aussage mit vollstandiger3276
Induktion uber k. Fur k = 1 ist v1 linear unabhangig, da v1 6= 0.3277
Nun seien v1, . . . , vk−1 als linear unabhangig angenommen. Sei3278
(∗) α1v1 + . . .+ αkvk = 0
mit α1, . . . , αk ∈ K. Wenden wir f auf beiden Seiten an, ergibt sich wegen f(0) = 0 und f(vi) = λivi, dass3279
α1λ1v1 + . . .+ αkλkvk = 0.
Andererseits konnen wir auch die Gleichung (*) mit λk multiplizieren und erhalten3280
α1λkv1 + . . .+ αkλkvk = 0.
Nun ziehen wir die beiden Gleichungen voneinander ab und erhalten3281
α1(λ1 − λk)v1 + . . .+ αk−1(λk−1 − λk)vk−1 = 0
Da v1, . . . , vk−1 linear unabhangig sind, mussen alle αi(λi − λk) = 0 sein. Da die λ-Werte paarweise ver-3282
schieden sind, ist λi − λk 6= 0, also muss αi = 0 gelten fur 1 ≤ i ≤ k − 1. Damit ist dann auch λk = 0.3283
Korollar 5.22. Zerfallt das charakteristische Polynom Pf (t) in n paarweise verschiedene Linearfaktoren,3284
d.h.3285
Pf (t) = ±(t− λ1) · . . . · (t− λn)
mit λi 6= λj fur 1 ≤ i < j ≤ n, dann ist f diagonalisierbar.3286
Beweis. Fur jedes λi gibt es einen Eigenvektor vi, und diese bilden nach dem vorangehenden Theorem eine3287
Basis.3288
Theorem 5.23. Ist f diagonalisierbar, dann zerfallt Pf (t) in Linearfaktoren.3289
Beweis. Sei B = (v1, . . . , vn) eine Basis aus Eigenvektoren von f . Dann ist3290
MfB =
λ1 0. . .
0 λn
und da Pf (t) nicht von der Basis abhangt, ist3291
Pf (t) = (λ1 − t) · . . . · (λn − t).
3292
Beachte, dass f nicht unbedingt diagonalisierbar ist, selbst wenn Pf (t) in Linearfaktoren zerfallt. Der3293
Grund ist, dass ein λ eine mehrfache Nullstelle von Pf (t) sein kann (d.h., die λi sind nicht paarweise3294
verschieden) und es nicht “genugend” Eigenvektoren fur λ gibt. Das einfachste Beispiel ist die Abbildung f3295
gegeben durch3296
A =
(1 10 1
).
Wir erhalten3297
Pf (t) = PA(t) = (1− t)2
5.4. EIGENVEKTOREN UND EIGENWERTE 131
also ist λ = 1 eine doppelte Nullstelle. Allerdings ist3298 (1− 1 1
0 1− 1
)=
(0 10 0
)und wir sehen, dass nur die Vektoren
(a0
)mit a ∈ K\{0} Eigenvektoren sind. Dies ist ein eindimensionaler3299
Unterraum und daher gibt es keine Basis aus Eigenvektoren.3300
Wir notieren das vollstandige Kriterium fur Diagonalisierbarkeit. Der Beweis ist nicht mehr schwierig3301
(es ist eine kleine Erweiterung von Theorem 5.21), aber wir lassen ihn weg.3302
Theorem 5.24. Eine lineare Abbildung f : Kn → Kn ist diagonalisierbar genau dann, wenn die beiden3303
folgenden Aussagen gelten:3304
1. Pf (t) zerfallt in Linearfaktoren,3305
2. es seien λ1, . . . , λk die verschiedenen Eigenwerte von f (mit k ≤ n). Es bezeichne dk die Dimension3306
des Eigenraumes bezuglich des Eigenwerts λk (vergleiche Hausaufgabe 5.4.1). Dann d1 + . . .+ dk = n.3307
In diesem Fall ist die Vereinigung der Basen aller Eigenraume eine Basis von Kn aus Eigenvektoren von f .3308
3309
Hausaufgabe 5.4.1. Sei f : Kn → Kn linear und λ ∈ K beliebig. Definiere3310
Eig(f, λ) := {x ∈ Kn | f(x) = λx}
als die Menge aller Eigenvektoren zum Eigenwert λ zusammen mit dem Nullvektor. Zeige, dass Eig(f, λ)3311
ein Unterraum von Kn ist, der sogenannte Eigenraum zum Eigenwert λ.3312
Hausaufgabe 5.4.2. Finden Sie eine reelle Matrix A ∈ R3×3, wo die dazugehorige lineare Abbildung3313
f : C3 → C3, x 7→ Ax die Eigenvektoren3314 11−1
,
01i
,
01−i
zu Eigenwerten 0, i, bzw. −i hat.3315
Hausaufgabe 5.4.3. Bestimmen Sie die Eigenwerte und Eigenraume der reellen Matrizen:3316
a.
1 1 00 1 10 0 1
, b.
1 0 00 1 10 0 1
Hausaufgabe 5.4.4. Bestimmen Sie die Eigenwerte und Eigenraume der Matrix:3317
t 1 0 · · · 0
0 t 1. . .
......
. . . t. . . 0
.... . .
. . . 10 · · · · · · 0 t
∈ Kn×n.
Hausaufgabe 5.4.5. Sei f : R4 → R4, x 7→ Ax definiert durch:3318
A =
1 −1 2 −20 0 1 −11 −1 1 01 −1 1 0
.
Ist f diagonalisierbar?3319
132 KAPITEL 5. LINEARE ALGEBRA, TEIL II
5.5 Orthogonale Abbildungen im R33320
Erinnerung: Eine lineare Abbildung f : Rn → Rn heißt orthogonal, wenn 〈x, y〉 = 〈Ax,Ay〉 fur alle x, y3321
gilt. Schreiben wir f mit Hilfe der Matrix A, so ist f orthogonal genau dann, wenn ATA = En gilt, also3322
A−1 = AT .3323
Orthogonale Abbildungen/Matrizen haben die folgenden weiteren Eigenschaften:3324
Lemma 5.25. Sei A ∈ Rn×n orthogonal. Dann gilt3325
• |detA| = 13326
• Ist λ ein Eigenwert von A, dann ist |λ| = 1.3327
Die Aussage ist plausibel, wenn wir uns an die Intuition erinnern: betrachte den n-dimensionalen Ein-3328
heitswurfel, der durch e1, . . . , en aufgespannt wird. Der Betrag von detA gibt das Volumen des Bildes dieses3329
Wurfels unter der Abbildung A an. Da eine orthogonale Abbildung Winkel und Langen erhalt, muss sie3330
auch das Volumen des Wurfels erhalten, also kommen nur die Werte +1 und −1 in Frage.3331
Die zweite Aussage ist noch einfacher: Gabe es zum Beispiel den Eigenwert 2, dann ist der Vektor Av3332
doppelt so lang wie v, was der Tatsache widerspricht, dass A Langen erhalten muss.3333
Beweis. Wegen detAT = detA gilt3334
(detA)2 = detAT detA = det(ATA) = detEn = 1,
also detA = ±1.3335
Fur die zweite Aussage: Ist λ ein Eigenwert und v ein Eigenvektor fur λ, so gilt3336
〈v, v〉 = 〈Av,Av〉 = 〈λv, λv〉 = λ2〈v, v〉.
Also λ2 = 1 (wegen 〈v, v〉 6= 0).3337
Fur R2 haben wir alle orthonalen Abbildungen bereits am Ende von Abschnitt 3.12 klassifiziert. Einerseits3338
hatten wir Drehungen von der Form3339 (cosα − sinαsinα cosα
).
Die Determinante der Matrix ist cos2 α + sin2 α = 1 (das ist auch sinnvoll, denn eine Drehung ist orien-3340
tierungserhaltend, also sollte das Vorzeichen der Determinante positiv sein). Wir hatten schon im letzten3341
Abschnitt in einem Beispiel nachgerechnet, dass die Drehung keine Eigenwerte hat (ausser fur α = 0 oder3342
α = π).3343
Andererseits gibt es Spiegelungen von der Form3344 (− cosα sinαsinα cosα
)Hier ist die Determinante − cosα− sin2 α = −1. Das charakteristische Polynom ist3345
(− cosα− t)(cosα− t)− sin2 α = t2 − cos2 α− sin2 α = t2 − 1 = (t− 1)(t+ 1).
Also gibt es Eigenvektoren zu den Eigenwerten 1 und −1.3346
Kommen wir nun zur Klassifikation im R3. Sei F : R3 → R3 eine orthogonale Abbildung. Das charakte-3347
ristische Polynom hat Grad 3, also gibt es eine reelle Nullstelle λ1 nach dem Zwischenwertsatz. Der Wert3348
λ1 ist ein Eigenwert von F , also ist |λ1| = 1 nach Lemma 5.25. Wir wahlen w1 als Eigenvektor zu λ1 mit3349
‖w1‖ = 1.3350
Nun erganzen wir w1 zu einer Orthonormalbasis B = (w1, w2, w3) des R3. Dies ist moglich, indem wir3351
w1 erst zu einer Basis (w1, v2, v3) erweitern (Satz 3.26) und dann mit Gram-Schmidt orthonormalisieren3352
(Satz 3.62). Beachten Sie, dass dieses Verfahren w1 unverandert lasst.3353
5.5. ORTHOGONALE ABBILDUNGEN IM R3 133
Sei W := [w2, w3] die Ebene orthogonal zu w1. Da w1 ⊥ w2 ist auch F (w1) ⊥ F (w2), weil F ortho-3354
gonal ist. Anderseits ist aber F (w1) = ±w1, weil w1 ein Eigenvektor ist, also ist w1 ⊥ F (w2). Genauso3355
ist w1 ⊥ F (w3). Es folgt also, dass F (w2), F (w3) ∈ W . Naturlich gilt auch F (w2) ⊥ F (w3). Das be-3356
deutet, F eingeschrankt auf die Ebene W bildet die Orthonormalbasis (w1, w2) auf die Orthonormalbasis3357
(F (w1), F (w2)) ab und ist daher eingeschrankt auf W ebenfalls eine orthogonale Abbildung. Damit gilt3358
A := MFB =
(λ1 0 00 A′0
),
wobei A′ eine Drehungs- oder Spiegelungsmatrix im R2 ist. Beachten Sie auch, dass detA = λ1 · detA′ gilt3359
(Hausaufgabe).3360
Nun gibt es die folgenden Falle zu unterscheiden:3361
1. detA = +1, λ1 = −1. Dann ist detA′ = −1, also ist A′ eine Spiegelung. Wir konnen w2 und w3 dann3362
als die Eigenvektoren zu den Eigenwerten +1, −1 in W wahlen und erhalten3363
A =
−1 0 00 1 00 0 −1
.
Dies entspricht einer Spiegelung bzw. Drehung um 180 Grad um die Achse, die durch w2 gegeben ist.3364
2. detA = 1, λ1 = 1. Dann ist detA′ = 1, also ist A′ eine Drehmatrix, und wir erhalten3365
A =
1 0 00 cosα − sinα0 sinα cosα
.
Dies entspricht einer Drehung um die Achse w1 um α. Der Fall 1 ist ein Spezialfall mit α = π.3366
3. detA = −1, λ1 = 1. Ahnlich zum ersten Fall erhalten wir3367
A =
1 0 00 1 00 0 −1
.
Dies enspricht einer Spiegelung an der Ebene, die durch w1 und w2 augespannt wird.3368
4. detA = −1, λ1 = −1. Hier ergibt sich ahnlich wie im zweiten Fall3369 −1 0 00 cosα − sinα0 sinα cosα
.
Dies ist eine sogenannte Drehspiegelung, also eine Drehung um α um die Achse w1 kombiniert mit3370
einer Spiegelung an der (w2, w3)-Ebene. Der dritte Fall ist wiederum ein Spezialfall mit α = 0. Fur3371
α = π erhalten wir die Spiegelung am Ursprung.3372
Zusammengefasst ergibt sich:3373
Theorem 5.26. Fur jede orthogonale Abbildung F : R3 → R3 gibt es eine Orthonormalbasis B und ein3374
α ∈ [0, 2π), so dass gilt:3375
• Ist detF = 1, dann ist3376
MFB =
1 0 00 cosα − sinα0 sinα cosα
,
also eine Drehung um eine Achse3377
134 KAPITEL 5. LINEARE ALGEBRA, TEIL II
• Ist detF = −1, dann ist3378
MFB =
−1 0 00 cosα − sinα0 sinα cosα
,
also eine Drehspiegelung um eine Achse.3379
Als Folgerung notieren wir3380
Korollar 5.27 (Satz vom Fußball). Bei einem Fußballspiel liegt der Ball zu Beginn der ersten und der3381
zweiten Halbzeit auf dem Anstoßpunkt. Es gibt mindestens einen Punkt auf der Oberflache des Balles, der3382
zu Beginn von beiden Halbzeiten an der exakt gleichen Position ist.3383
Beweis. Die Transformation T des Balles von 1. zu 2. Halbzeit ist orthogonal und erhalt die Orientierung,3384
also ist detT = 1. Nach dem Theorem gibt es also einen Eigenvektor zum Eigenwert 1.3385
Anschaulich bedeutet der Satz das folgende: Statt einen Ball beliebig oft in verschiedene Richtungen zu3386
drehen, konnen wir die gleiche Rotation auch mit einer einzigen Drehung um eine bestimmte Drehachse3387
erreichen. Das ist intuitiv sicherlich kein vollig offensichtliches Resultat (zumindest nicht fur den Dozenten).3388
3389
Hausaufgabe 5.5.1. Berechnen Sie fur die Spiegelungsmatrix3390 (− cosα sinαsinα cosα
)im R2 Eigenvektoren zu den Eigenwerten 1 und −1. Wie sind diese geometrisch zu interpretieren?3391
Hausaufgabe 5.5.2. Zeigen Sie detA = λ1 detA′ fur die Matrix3392 (λ1 0 00 A′0
).
5.6 Hauptachsentransformation3393
Wir haben bereits gesehen, dass nicht fur jede Matrix eine Basis aus Eigenvektoren existiert. Allerdings gibt3394
es eine recht naturliche Teilmenge von Matrizen, die in der Tat immer diagonalisierbar sind.3395
Man sagt, dass eine Matrix A ∈ Kn×n symmetrisch ist, falls A = AT .3396
Theorem 5.28 (Spektralsatz). Jede symmetrische Matrix ist diagonalisierbar, es gibt also eine Basis des3397
Rn aus Eigenvektoren fur A. Es gilt sogar, dass es eine Orthonormalbasis aus Eigenvektoren (bezuglich des3398
Standardskalarproduktes) gibt.3399
Wir verzichten hier auf den Beweis des (schwierigeren) ersten Teils. Fur den zweiten Teil zeigen wir3400
nur, dass Eigenvektoren zu verschiedenen Eigenwerten in der Tat orthogonal sein mussen. Seien λ1 6= λ23401
Eigenwerte mit Eigenvektoren x1, x2. Es gilt fur jede Matrix M und Vektoren u, v ∈ Rn:3402
〈Mu, v〉 = (Mu)T v = (uTMT )v = uT (MT v) = 〈u,MT v〉.
Also, da A symmetrisch ist, gilt 〈Au, v〉 = 〈u,Av〉. Nun rechnen wir nach, dass3403
λ1〈x1, x2〉 = 〈λ1x1, x2〉 = 〈Ax1, x2〉 = 〈x1, Ax2〉 = 〈x1, λ2x2〉 = λ2〈x1, x2〉.
Da λ1 6= λ2 ist diese Gleichung nur erfullt, wenn 〈x1, x2〉 = 0 ist.3404
Wir notieren das folgende Resultat:3405
5.6. HAUPTACHSENTRANSFORMATION 135
Theorem 5.29. Eine Abbildung3406
s : Rn × Rn → R, (x, y) 7→ xTAy
mit A ∈ Rn×n ist ein Skalarprodukt genau dann, wenn A symmetrisch ist und alle Eigenwerte von A positiv3407
sind.3408
Beweis. s ist bilinear nach Definition. Es ist auch leicht zu sehen, dass s eine symmetrische Abbildung (also3409
s(x, y) = s(y, x)) ist genau dann, wenn A symmetrisch ist.3410
Sei A symmetrisch. Dann ist s also linear and symmetrisch. Sei B = (v1, . . . , vn) eine Orthonormalbasis3411
aus Eigenvektoren von A und seien λ1, . . . , λn die zugehorigen Eigenwerte. Nun schreiben wir x 6= 0 als3412
Linearkombination der vi:3413
x = α1v1 + . . .+ αnvn.
Es folgt nun durch eine leichte Rechnung, dass
s(x, x) = (α1v1 + . . .+ αnvn)TA(α1v1 + . . .+ αnvn)
= (α1v1 + . . .+ αnvn)T (α1Av1 + . . .+ αnAvn)
= (α1v1 + . . .+ αnvn)T (α1λ1v1 + . . .+ αnλnvn)
= α21λ1 + . . . α2
nλn.
Beachten Sie, dass samtliche Mischterme wegfallen, da (v1, . . . , vn) orthogonal sind. Nun ist jeder Term α2iλi3414
nicht-negativ, da die λi’s positiv sind, und mindestens einer der Summanden ist nicht Null, da (mindestens)3415
ein αi 6= 0 (da x 6= 0). Es folgt also positive Definitheit, und damit ist s ein Skalarprodukt.3416
Umgekehrt, nehmen wir an, dass s ein Skalarprodukt ist. Dann ist also s symmetrisch, und damit auch3417
A. Angenommen, A hat einen negativen Eigenwert λ. Sei v ein Eigenvektor zum Eigenwert λ. Dann ist3418
s(v, v) = vTAv = vTλv = λ(vT v) < 0,
was der positiven Definitheit widerspricht. Falls A den Eigenwert 0 hat, dann gibt es ein v 6= 0 mit Av = 0,3419
also auch3420
s(v, v) = vTAv = vT 0 = 0.
Das widerspricht ebenfalls der positiven Definitheit.3421
Nun kommen wir zur Hauptachsentransformation als Anwendung des Spektralsatzes. Eine Quadrik im3422
R2 ist die Losungsmenge einer quadratischen Gleichung:3423
Q := {(xy
)| ax2 + by2 + cxy + dx+ ey + f = 0},
mit a, . . . , f ∈ R und mindestens einem der Koeffizienten a, b, c nicht 0 (sonst ist es ja keine quadratische3424
Gleichung).3425
Hier sind einige Beispiele fur Quadriken, die sogennanten Kegelschnitte. Fur alle Beispiele seien α, β > 0.3426
1. Eine Ellipse, gegeben durch die Gleichung3427
x2
α2+y2
β2− 1 = 0.
Falls α = β ergibt sich der Spezialfall eines Kreises mit Radius α.3428
2. Eine Hyperbel, gegeben durch3429
x2
α2− y2
β2− 1 = 0.
3. Eine Parabel, gegeben durch3430
x2
α2± y = 0.
136 KAPITEL 5. LINEARE ALGEBRA, TEIL II
4. Ein sich-schneidendes Geradenpaar3431
x2
α2− y2
β2= 0.
5. Ein paralleles Geradenpaar3432
x2
α2− 1 = 0.
6. Eine einzelne Gerade3433
x2
α2= 0.
7. Ein Punkt3434
x2
α2+y2
β2= 0.
8. Die leere Menge3435
−x2
α2− y2
β2− 1 = 0.
oder auch3436
−x2
α2− 1 = 0.
Im Wesentlichen enthalt die Liste oben alle Beispiele, wie der folgende Satz aussagt:3437
Theorem 5.30 (Hauptachsentransformation). Sei Q eine beliebige Quadrik. Dann existiert eine Drehung3438
im R2, gefolgt von einer Translation, so dass Q unter dieser Transformation eine der Formen 1–8 von oben3439
annimmt.3440
Der Name des Theorems kommt daher, dass die Eigenvektoren der gewahlten Drehmatrix als Hauptach-3441
sen der Quadrik bezeichnet werden.3442
Der Beweis lasst sich so zusammenfassen: Eine Quadrik3443
ax2 + by2 + cxy + dx+ ey + f = 0
lasst sich schreiben als3444 (x y
)( a c2
c2 b
)︸ ︷︷ ︸
=:A
(xy
)+(d e
)( xy
)+ f = 0.
Nun konnen wir eine Orthonormalbasis B aus Eigenvektoren von A finden. Die Basiswechselmatrix ME→B3445
hat dann Determinante +1, wenn wir die Basisvektoren von B in geeigneter Reihenfolge wahlen. Dieser3446
Basiswechsel entspricht einer Drehung im R2. Nach dieser Drehung hat die Quadrik die Form3447 (x y
)( a′ 00 b′
)(xy
)+(x y
)( d′
e′
)+ f = 0,
bzw.3448
a′x2 + b′y2 + d′x+ e′y + f = 0,
mit anderen Worten: Der Mischterm cxy ist durch die Drehung verschwunden.3449
Sind nun a′ und b′ beide von 0 verschieden, so lasst sich diese Gliechung umschreiben zu3450
α(x− x0)2 + β(y − y0)2 + γ = 0,
mit α, β, γ ∈ R. Durch eine Translation
(x0
y0
)vereinfacht sich dies zu3451
αx2 + βy2 + γ = 0
5.6. HAUPTACHSENTRANSFORMATION 137
und je nach Vorzeichen ergibt sich einer der Falle 1, 2, 4, 7 oder 8 von oben.3452
Ist b′ = 0, so muss a′ 6= 0 sein (sonst liegt keine Quadrik vor). Wir haben dann3453
a′x2 + d′x+ e′y + f = 0.
Ist nun e′ 6= 0, dann lasst sich dies umschreiben zu3454
α(x− x0)2 + (y − β) = 0.
Und nach einer Translation ergibt sich Fall 3 (Parabel).3455
Ist jedoch auch e′ = 0, dann vereinfacht sich die Gleichung zu3456
α(x− x0)2 + γ = 0
und je nach Vorzeichen von α und γ ergibt sich einer der Falle 5, 6 oder 8. Fur a′ = 0 ist der Fall analog,3457
mit den Rollen von x und y vertauscht.3458
Wir rechnen zum Abschluss zwei Beispiele durch. Als erstes betrachten wir3459
5x2 + 5y2 − 2xy − 12x+ 12y + 4 = 0,
bzw.3460 (x y
)( 5 −1−1 5
)︸ ︷︷ ︸
=:A
(xy
)+(−12 12
)( xy
)+ 4 = 0.
Im ersten Schritt mussen wir A diagonalisieren. Dafur berechnen wir die Eigenwerte:3461
det
(5− t −1−1 5− t
)= t2 − 10t+ 24 = (t− 6)(t− 4)
Also sind die Eigenwerte 4 und 6. Fur Eigenwert 4 ergibt sich3462 (1 −1−1 1
)→(
1 −10 0
)
und wir sehen, dass ein (normierter) Eigenvektor 1√2
(11
)ist. Fur Eigenwert 6 ergibt sich3463
(−1 −1−1 −1
)→(
1 10 0
)
und der Eigenwert ist 1√2
(1−1
).3464
Damit ist die Orthonormalbasis aus Eigenvektoren gefunden. Wir mussen die Basisvektoren jedoch in3465
umgekehrter Reihenfolge nehmen, damit die Determinante der Matrix 1 ist. Also3466
B = (1√2
(1−1
),
1√2
(11
))
und3467
MB→E =1√2
(1 1−1 1
).
Es bezeichne der Vektor
(x′
y′
)die Darstellung von
(xy
)bezuglich der Basis B, also3468
(xy
)= MB→E
(x′
y′
)
138 KAPITEL 5. LINEARE ALGEBRA, TEIL II
Bezuglich der Basis B nimmt A die Diagonalform3469 (6 00 4
)an. Also ergibt sich die Gleichung3470
(x′ y′
)( 6 00 4
)(x′
y′
)+(−12 12
)MB→E
(x′
y′
)+ 4 = 0.
Wir rechnen aus und erhalten3471
6x′2 + 4y′2 − 24√2x′ + 4 = 0.
Nun erganzen wir quadratisch, um die x′-Terme zu faktorisieren (das gleiche musste fur y′ geschehen, aberda der lineare Term in y′ verschwindet, haben wir hier weniger Aufwand).
⇔ 6(x′2 − 2√
2x′) + 4y′2 = −4
⇔ 6(x′2 − 2√
2x′ + 2) + 4y′2 = 8
⇔ 6(x′ −√
2)2 + 4y′2 = 8.
Und durch die Translation3472 (x′′
y′′
)=
(x′
y′
)+
(−√
20
)erhalten wir3473
6x′′2 + 4y′′2 = 8,
bzw.3474
x′′2
43
+y′′2
2− 1 = 0,
also die Gleichung einer Ellipse.3475
Als weiteres Beispiel betrachten wir3476
4x2 + y2 + 4xy + 3x− y + 1 = 0 ⇔(x y
)( 4 22 1
)(xy
)+(
3 −1)( x
y
)+ 1 = 0.
Hier ist3477
det
(4− t 2
2 1− t
)= t2 − 5t+ 4− 4 = t(t− 5).
Als Eigenvektor zum Eigenwert 0 ergibt sich
(1−2
)und als Eigenvektor zum Eigenwert 5 ergibt sich3478 (
21
). Somit3479
MB→E =1√5
(1 2−2 1
)(Determinante ist 1, also richtige Reihenfolge), und wir erhalten3480
(x′ y′
)( 0 00 5
)(x′
y′
)+(
3 −1)MB→E
(x′
y′
)+ 1 = 0.
Durch Nachrechnen ergibt sich3481
5y′2 +√
5x′ +√
5y′ + 1 = 0.
5.6. HAUPTACHSENTRANSFORMATION 139
Nun erganzen wir zunachst den y′-Anteil quadratisch, und bringen dann den konstanten Faktor mit Hilfevon x′ zu 0:
⇔ 5(y′2 +
√5
5y′) +
√5x′ = −1
⇔ 5(y′2 +
√5
5y′ +
5
100) +√
5x′ = −1 + 55
100
⇔ 5(y′2 +
√5
10)2 +
√5x′ = −3
4
⇔ 5(y′2 +
√5
10)2 +
√5(x′ +
3√
5
20) = −3
4+
3
4
⇔ 5(y′2 +
√5
10)2 +
√5(x′ +
3√
5
20) = 0
Durch die Translation3482 (x′′
y′′
)=
(x′
y′
)+
(3√
520√
510
)ergibt sich damit3483
5y′′2 +√
5x′′ = 0,
bzw.3484
x′′ = −√
5y′′2,
also eine Parabel.3485
Die gleiche Methodik kann man auch anwenden auf Quadriken im R3, also quadratische Gleichungen der3486
Form3487
ax2 + by2 + cz2 + dxy + exz + fyz + gx+ hy + iz + j = 0,
bzw.3488 (x y z
) a d2
e2
d2 b f
2e2
f2 c
︸ ︷︷ ︸
=:A
xyz
+(g h i
) xyz
+ j = 0.
Wiederum ist A symmetrisch, und es lasst sich eine Drehmatrix konstruieren, so dass alle Mischterme (xy,3489
xz, yz) verschwinden. Durch eine Translation erreicht man dann auch eine Normalform. Es gibt jedoch3490
mehr Falle als im R2. Fur eine Ubersicht sei auf https://de.wikipedia.org/wiki/Quadrik#Quadriken_3491
im_Raum verwiesen.3492
3493
Hausaufgabe 5.6.1. Sei f : x 7→ Mx diejenige lineare Abbildung des R2 in sich selbst, welche Vektoren3494
u =
(12
)und v =
(−21
)mit dem Faktor 2 bzw. 1
2 streckt. Berechnen Sie M .3495
Hinweis: Nach Theorem 5.29 muss M symmetrisch sein.3496
Hausaufgabe 5.6.2. Transformieren Sie die folgenden quadratischen Gleichungen im R2 durch Verschie-3497
bung des Ursprungs und Wechsel zu einer anderen Orthonormalbasis in Normalform und geben Sie jedesmal3498
an, um welchen Typ von Kegelschnitt bzw. Quadrik es sich handelt. Wir verwenden Koordianten u, v im R23499
und u, v, w im R3.3500
a. 9u2 − 24uv − 10u+ 16v2 + 180v + 325 = 0,3501
b. 52u2 + 28uv − 208u+ 73v2 − 56v − 512 = 0,3502
c. 7u2 + 2uv − 14u+ 7v2 − 2v − 9 = 0,3503
140 KAPITEL 5. LINEARE ALGEBRA, TEIL II
d. 5u2 + 4uv + 8uw − 10u+ 8v2 − 4vw − 4v + 5w2 − 8w + 1114 = 0,3504
e. 4u2 − 4uv − 4uw − 5u+ 4v2 − 4vw + 7v + 4w2 + 7w + 1 = 0,3505
f. 13u2 − 10uv + 13v2 + 18w2 − 72 = 0.3506
Hausaufgabe 5.6.3. Bestimmen Sie Eigenwerte und Eigenvektoren der folgenden Matrizen M und stellen3507
Sie diese in der Form M = BDBT mit B orthogonal und D diagonal dar:3508
a. M = 125
(41 −12−12 34
),3509
b. M = 125
(−16 1212 −9
),3510
c. M =
(0 11 −1
),3511
d. M = 15
(4 33 17
2
).3512
Hinweis: Aufgrund des Spektralsatzes findet man eine orthonormale Basis B = (b1, b2) aus Eigenvekto-3513
ren.3514