79
Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister 1 16. Juli 2013 1 Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endgültig korrigiert sind, und daher auch nicht zitierfähig sind (Not for quotation without permission of the author). Hinweise auf Fehler und Verbesserungsvorschläge an [email protected]

Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Aspekte der NichtlinearenFunktionalanalysis

SoSe 2013

J. Baumeister1

16. Juli 2013

1Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endgültig korrigiert sind, unddaher auch nicht zitierfähig sind (Not for quotation without permission of the author). Hinweiseauf Fehler und Verbesserungsvorschläge an [email protected]

Page 2: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Vorwort

Wenn du eine weise Antwort verlangst, muss duvernünftig fragen

J.W. Goethe

Die Lösung von Gleichungen ist eine Grundaufgabe der Mathematik. Unter Lösen haben wirzu verstehen: Nachweis der Existenz und Eindeutigkeit einer Lösung und der stetigen Abhängig-keit einer Lösung von den Daten der Gleichung. Diese Forderungen entsprechen der Definitionvon well-posedness/Gutgestelltheit nach Hadamard (≈ 1900). Sind diese Forderungen beieiner Aufgabe nicht alle erfüllt, spricht man von ill-posedness/Schlechtgestelltheit. Hinzukommt in der angewandten Mathematik die Forderung nach der stabilen approximativen Berech-nung einer Lösung. Mit Stabilität ist gemeint, dass sich Fehler in den Daten der Aufgabe, vonApproximations- und Rundungsfehlern nicht „dramatisch“ auf das Rechenergebnis auswirken;bei ill-posednes stellt diese Forderung eine große Herausforderung dar.

Im endlichdimensionalen Kontext wird dieses Thema im linearen Fall durch Resultate derLinearen Algebra und der Numerischen Linearen Algebra, im nichtlinearen Fall durch Resultateder (Höheren) Analysis und der Numerischen Analysis abgedeckt. Im unendlichdimensionalenKontext sind die Ergebnisse der linearen Funktionalanalysis für eine hinreichende Behandlungvon Gleichungen heranzuziehen. Bei der Betrachtung von nichtlinearen Gleichungen bedient mansich meist der Linearisierungstechnik: Bestimmung der Lösungsstruktur in der Nähe einer Lösung,Berechnung einer Lösung (etwa mit dem Newton-Verfahren). Dazu im Kontrast steht in derglobalen Analysis die Bestimmung der Gesamtheit der Lösungen.

Die Themen der Nichtlinearen Funktionalanalysis sind vielfältig. Sie unterscheiden sichmeist schon im Ansatz: Erweiterungen der Sätze aus der Linearen Funktionalanalysis, lokalebzw. globale Perspektive, geometrische versus analytische Aufbereitung der Probleme, . . . . Ei-ne Kanonisierung des Gebiets Nichtlinearen Funktionalanalysis liegt eigentlich noch nicht vor.Sie könnte etwa so aussehen: Differenzierbarkeit nichtlinearer Abbildungen, Fixpunktmethoden,Iterationsverfahren basierend auf Fixpunktverfahren, Satz für implizite Funktionen, Bifurkati-onstheorie, Notwendige Bedingungen in der unendlichdimensionalen Optimierung, Variationsme-thoden und konvexe Analysis, Monotone Operatoren, Abbildungsgrad, Anwendungen der Me-thoden bei nichtlinearen partiellen Differentialgleichungen. Frühe Versuche einer umfassendenDarstellung der Themen sind etwa [4, 16, 28, 29, 36, 42, 47, 63, 70, 78, 93].

Wir greifen einige Themen heraus, die sich im Anschluss an eine Vorlesung über Linea-re Funktionalanalysis anbieten: Differenzierbareit in normierten Räumen, Fixpunktverfahren,Nichtexpansive Operatoren, Variationsmethoden, Monotone Operatoren. Ein bedeutendes The-ma gehen wir nicht an, den Abbildungsgrad. Er ist ohne viel (Zeit-)Aufwand nicht zu besprechen,„Steilkurse“ werden m. E. dem Thema nicht gerecht. Im Anschluss an allgemeinen Betrachtungenzu nichtlinearen Abbildungen machen wir einige Anmerkungen dazu.

i

Page 3: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Ein Thema zwischen linearer und nichtlinearer Funktionalanalysis ist die konvexe Analysis.Hier kommt man fast ausschlieslich mit den Resultaten der linearen Funktionalanalysis aus.Variationsmethoden und monotone Operatoren hätten hier auch seinen Platz; siehe etwa [10, 15,20, 59, 66, 71].

Einen Mangel könnte man darin erkennen, dass keine wirklich angewandten Beispiele einge-bracht werden. Dies ist der Tatsache geschuldet, dass schon in der linearen Funktionalanalysis(siehe [13]) die dazu benötigten Funktionenenräume nicht einbezogen wurden.

Lehrbücher zur Nichtlinearen Funktionalanalysis sind meist ausgerichtet auf eine spezielleAnwendungsperspektive. Wir listen als Beispiele auf: [5, 8, 26, 73, 76, 79, 80, 77]. SpeziellereLiteratur führen wir an geeigneten Stellen des Skriptums an. Die Übungen am Ende eines Kapitelssind zum Teil auch als Ergänzung zur Thematik gedacht.

Frankfurt, im April 2013 Johann Baumeister

ii

Page 4: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Bezeichnungen

POT(X) Potenzmenge einer Menge XC Abschluss der Menge C (in einem topologischen Raum)A Inneres der Menge C (in einem topologischen RaumX\A Komplement von A in X∂C Rand der Menge C (in einem topologischen Raum)f(A) Bild von A unter der Abbildung f−1f (B) Urbild von B unter der Abbildung f−1f (y) Urbild von y unter der Abbildung ff(A) Bild von A unter der Abbildung fDf(x) Fréchet-Ableitung von f in xd(·, ·) Metrik in einem metrischen Raumdist(x,M) Abstand von x zur Menge M in einem metrischen Raum‖ · ‖ Norm in einem normierten Raumθ Nullvektor in einem VektorrraumBr(x) Offene Kugel in einem normierten Raum mit Radius r und Mittelpunkt xBr(x) Abgeschlossene Kugel in einem normierten Raum mit Radius r und Mittelpunkt xBr Offene Kugel in einem normierten Raum mit Radius r und Mittelpunkt θBr Abgeschlossene Kugel in einem normierten Raum mit Radius r und Mittelpunkt θSn−1 Rand der euklidischen Einheitskugel in Rn .co(M) Konvexe Hülle der Menge MX ′ Raum der linearen Funktionale auf einem normierten Raum〈λ, x〉 Duale Paarung λ(x) für λ ∈ X ′, x ∈ X〈x|y〉 Inneres Produkt von x, y in einem (Prä-)HilbertraumX∗ Raum der stetigen linearen Funktionale auf einem normierten Raumw − limn xn Grenzwert der Folge (xn)n∈N bezüglich der schwachen Konvergenzid oder I IdentitätsabbildungB(X,Y ) Raum der stetigen linearen Abbildungen von X nach Y ; X,Y normierte Räume‖T‖X→Y Norm von T ∈ B(X,Y )T ∗ Duale Abbildung in B(Y ∗, X∗) von T ∈ B(X,Y )T ∗ Adjungierte Abbildung in B(Y,X) von T ∈ B(X,Y ), falls X,Y Hilberträume sindρ(T ) Resolventenmenge von Tσ(T ) Spektrum von Tσp(T ) Punktspektrum von Tr(T ) Spektralradius von T

i

Page 5: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

ran(T ) Bild des linearen Operators Tker(T ) Kern (Nullraum) des linearen Operators Tcoker(T ) Vektorraum Y/ran(T ) eines linearen Operators T : X −→ Ydim(U) (Algebraische) Dimension eines Vektorrraums Ucodim(V ) Dimension des Vektorraums X/V , wobei V ⊂ X,V,X Vektorräumelp Banachraum der skalaren Folgen mit Norm ‖ · ‖p, 1 ≤ p ≤ ∞c0 Banachraum der skalaren Nullfolgen mit Norm ‖ · ‖∞Lip0(X,Y ) Banachraum der lipschitzstetigen Abbildungen f : X −→ Y mit f(θ) = θ‖ · ‖Lip0

Norm in Lip0(X,Y )

ii

Page 6: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Inhaltsverzeichnis

Vorwort i

Bezeichnungen i

1 Nichlinearität und Differenzierbarkeit 11.1 (Nichtlineare) Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Differenzierbarkeit nichtlinearer Abbildungen . . . . . . . . . . . . . . . . . . . . 41.3 Offene Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4 Kompakte nichtlineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . 111.5 Kompakte lineare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.6 Bemerkungen zum Spektrum von Endomorphismen . . . . . . . . . . . . . . . . . 171.7 Fredholm-Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.8 Anhang: (Nichtlineare) Gleichungen: Gutgestelltheit . . . . . . . . . . . . . . . . 251.9 Anhang: Bemerkung zum Abbildungsgrad . . . . . . . . . . . . . . . . . . . . . . 261.10 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2 Gleichungen und Fixpunkte 322.1 Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.2 Der Brouwersche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.3 Der Schaudersche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.4 Nullstellensuche nach Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462.5 Das Newtonverfahren für ein quadratisches Polynom . . . . . . . . . . . . . . . . 512.6 Der Satz von Newton-Kantorovich . . . . . . . . . . . . . . . . . . . . . . . . . . 522.7 Der Satz von Miranda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572.8 Der Fixpunktsatz von Kakutani . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592.9 Anhang: Ein Beweis des Brouwerschen Fixpunktsatzes . . . . . . . . . . . . . . . 622.10 Anhang: Ein Satz zur Kompaktheit der konvexen Hülle . . . . . . . . . . . . . . . 642.11 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

iii

Page 7: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Literaturverzeichnis

[1] R.P. Agarwal, M. Meehan, and D. O’Regan. Fixed point theory and applications. CambridgeUniversity Press, 2004.

[2] G. Ahlefeld, A. Frommer, G. Heindl, and J. Mayer. On the existence theorems ofKantorovich, Miranda and Borsuk. Electronic transactions on numerical analysis, 17:102–111, 2004.

[3] H.W. Alt. Lineare Funktionalanalysis. Springer, 2002.

[4] M. Altman. Contractors and contractor directions. Dekker.

[5] A. Ambrosetti and D. Arcoya. An introduction to nonlinear functional analysis and ellipticproblems. Birkhäuser, 2011.

[6] J. Appell. Ein „merkwürdiges“ Spektrum für nichtlineare Operatoren. Mathematica Bohe-mica, 124:221–229, 1999.

[7] J. Appell, E. de Pascale, and A. Vignoli. Nonlinear spectral theory. de Gruyter, Berlin,2004.

[8] J. Appell and M. Väth. Elemente der Funktionalanalysis. Vieweg, Braunschweig, 2005.

[9] C. Avramescu. A generalization of Mirandas theorem. Seminar on fixed point theorycluj-Napoca, 3:121–128, 2002.

[10] J. Baumeister. Konvexe Analysis, 1986. Skriptum 2006, Goethe–Universität Frankfurt/Main.

[11] J. Baumeister. Stable Solution of Inverse Problems. Vieweg, Braunschweig, 1987.

[12] J. Baumeister. Inverse problems in finance. In Recent Developments in Computational Finance:Foundations, Algorithms and Applications, volume 14 of Interdisciplinary Mathematical Sciences.World Scientific, 2012.

[13] J. Baumeister. Funktionalanalysis. Goethe–Universität Frankfurt/Main, 2013. Skriptum einerVorlesung.

[14] H. H. Bauschke. The approximation of fixed points of compositions of nonexpansive mappings inHilbert space. J. Math. Anal. and Appl., 202:150–159, 1996.

[15] H.H. Bauschke and P.L. Combettes. Convex analysis and monotone operator theory in Hilbert spaces.Canadian Math. Soc., 2010.

[16] M. Berger. Nonlinear functional analysis. Springer, New York, 1977.

[17] M.S. Berger and R.A. Plastock. On the singularities of nonlinear Fredholm operators. Bulletin ofthe American Mathematical Society, 83:1316–1318, 1977.

[18] Yu.G. Borisovich. Theory of Fredholm mappings and some optimal control problems. Journal ofMathematical Sciences, 105:1826–1838, 2001.

iv

Page 8: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

[19] Yu.G. Borisovich, V.G. Zvyagin, and Yu.I. Sapronov. Nonlinear Fredholm maps and the Leray-Schauder theory. Russian Msath. Surveys, 32:1–54, 1977.

[20] J.M. Borwein and A.S. Lewis. Partially-finite convex programming, part i: Quasi-relative interiorsand duality theory. Mathematical Programming, 57:15–48, 1992.

[21] H. Brezis and F. Browder. A general principle on ordered sets in nonlinear functional analysis.Advances in Math., 21:355–364, 1976.

[22] F. Browder and W. Petryshyn. Construction of fixed points of nonlinear mappings in Hilbert space.J. Math. Anal. Appl., 20:197–228, 1967.

[23] A. Calamai, M. Furi, and A. Vignoli. A new spectrum for nonlinear operators in Banach spaces.Nonlinear Functional Analysis and Applications, 14:317–347, 2009.

[24] J. Caristi. Fixed point theorems for mappings satisfying inwardness conditions. Trans. Amer. Math.Soc., 215:241–251, 1976.

[25] C. Chidume. Geometric properties of Banach spaces and nonlinear iterations. Springer, New York,2009.

[26] S.-N. Chow and J.K. Hale. Methods of bifurcation theory. Springer, New York, 1982.

[27] W.J. Cramer and W.O. Ray. Solvability of nonlinear operator equations. Pacific J. of Mathematics,95:37–50, 1981.

[28] J. Cronin. Fixed points an topological degree in nonlinear analysis. Maer. Math. Soc., Providence,1964.

[29] K. Deimling. Nonlinear Functional analysis. Springer, Berlin, 1985.

[30] P. Deuflhard. A short history of Newton’s method. Documenta Mathematica, Extra volumeISMP:25–30, 2012.

[31] P. Deuflhard and G. Heindl. Affine invariant convergence theorems for Newton’s method and ex-tensions to related methods. SIAM J. Numer. Anal., 16:1–10, 1979.

[32] V.T. Dmitrienko and V.G. Zvyagin. Index of solution set for perturbed Fredholm equations andexistence of periodic solutions for delay differential equations. Topological methods in nonlinearanalysis, 21.

[33] A.L. Dontchev. The Graves theorem revisited. J. Convex Analysis, 1:45–53, 1996.

[34] A.L. Dontchev and R.T. Rockafellar. Implicit functions and solution mappings. Springer, 2009.

[35] M. Edelstein. An extension of Banach’s contraction principle. Proc. Amer. Math Soc., 12:7–10,1961.

[36] G. Eisenack and C. Fenske. Fixpunkttheorie. Taschenbuch. Springer, 1978.

[37] O.P. Ferreira and B.F. Svaiter. Kantorovich’s theorem and Newton’s method, 2012. ar-Xiv:1209.5704v1 [math.NA] 25 Sep 2012.

[38] K. Fujimoto. On singular values of nonlinear mappings, 2004.

[39] K. Goebel and W.A. Kirk. Topics in metric fixed point theory. Cambridge University Press, Cam-bridge, 1990.

[40] A. Granas and J. Dugundij. Fixed point theory. Springer, Berlin, 2003.

[41] L.M. Graves. Some mapping theorems. Duke Math. J., 17:111–114, 1950.

v

Page 9: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

[42] H. Gajewski K. Gröger and K. Zacharias. Nichtlineare Operatorgleichungen undOperatordifferentialgleichungen. Akademie-Verlag, Berlin, 1974.

[43] N.M. Gulevich. Fixed points of nonexpansive mappings. Journal of Mathematical Sciences, 79:755–815, 1996.

[44] C. Hund. Fixpunktsatz vor Brouwer, 2010. Bachelorarbeit Universität Bielefeld.

[45] D. Idczak and M. Majewski. A generalization of the Poincaré-Miranda theorem with an applicationto the controllability of nonlinear repetitive processes. Asian Journal of control, 12:168–176, 2010.

[46] V.I.. Istratescu. Fixed point theorems: an introduction. Reidel, Dordrecht, 1988.

[47] H. Jeggle. Nichtlineare Funktionalanalysis. Teubner, Stuttgart, 1979.

[48] W. Kaballo. Grundkurs Funktionalanalysis. Spektrum/Akademischer Verlag, Heidelberg, 2010.

[49] R.I. Kachurovskij. Regular points, spectrum and eigenfunctions of nonlinear operators. Dokl. Akad.Nauk., 188:274–277, 1969.

[50] O. Kada, T. Suzuki, and W. Takahashi. Non convex minimization theorems and fixed point btheo-remsin complete metric spaces. Math. Japon., 44:381–391, 1996.

[51] L.V. Kantorovich. On Newton’s method for functional equations. Akad. Nauk. SSSR, 59:1237–1240,1948.

[52] L.V. Kantorovich and G.P. Akilov. Functional analysis in normed spaces. Pergamon, New York,1964.

[53] E. Karapinar. Edelstein type fixed point theorems. Ann. Funct. Anal., 2:51–58, 2011.

[54] V. Kathskevich and D. Shroiykhet. Differentiable operators and nonlinear equations. Birkhäuser,Basel, 1994.

[55] A. Kirsch. An Introduction to the Mathematical Theory of Inverse Problems. Springer, New York,1996.

[56] R. Kress. Linear Integral Equations. Springer, Berlin, 1999.

[57] W. Kulpa. The Poincaré-Miranda theorem. The American Mathematical Monthly, 104(6):545–550,1997.

[58] J. Lindenstrauss, D. Preiss, and J. Tiser. Frécchet-differentiability of Lipschitz functions and poroussets in Banach spaces. Princeton University Press, Princeton, 2012.

[59] J.T. Marti. Konvexe Analysis. Birhäuser, Basel, 1977.

[60] J. Mayer. A generalized theorem of miranda and the theorem of newton-kantorovich. Computing,23:313–357, 2002.

[61] J. Milnor. Analytic proof of the hairy ball theorem and the brouwer fixed point theorem. Amer.Math. Monthly, 85:521–524, 1978.

[62] C. Miranda. Un osservazione su un teorema di Brouwer. Bol. Un. Mat. Ital., 3:5–7, 1940.

[63] L. Nirenberg. Topics in nonlinera functional analysis. Courant Institute of Math.Sci., New York,1974.

[64] P. Nonnenmann. Simulation of the complex Häussler-von der Malsburg dynamics. Diploma Thesis,Universität Frankfurt/Main, 2008.

[65] J.M. Ortega. The Newton-Kantorovich Theorem. The American Mathematical Monthly, 75:658–660,1968.

vi

Page 10: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

[66] R.R. Phelps. Convex functions, monotone operators and differentiability. Springer, Berlin, 1993.

[67] W.O. Ray and A.W. Walker. Mapping theorems for Gateaux-differentiable and accretive operators.Nonlinear Analysis, 6:423–433, 1982.

[68] W.O. Ray and A.W. Walker. Perturbations of normally solvable nonlinear operators, i. Intern. J.Math. & Math. Sci., 8:241–246, 1985.

[69] A. Rieder. Keine Probleme mit Inversen Problemen. Vieweg, Braunschweig, 2003.

[70] T. Riedrich. Vorlesung über nichtlineare Operatorgleichungen. Teubner, Leipzig, 1976.

[71] R.T. Rockafellar. Convex analysis. Princeton University press, Princeton, 1970.

[72] C.A. Rogers. A less strange version of Milnor’s proof of Brouwers fixed-point theorem. Amer. Math.Monthly, 87:525–527, 1980.

[73] M. Ruzicka. Nichtlineare Funktionalanalysis. Springer, Berlin, 2007.

[74] U. Schäfer. A fixed point theorem in infinite-dimensional spaces. Proc. Appl. Math. Mech., 6:655–656, 2006.

[75] U. Schäfer. A fixed point theorem based on Miranda. Hindawi publishing company: fixed point theoryand applications, page 6 pages, 2007.

[76] R. Schätzle. Nichtlineare Funktionalanalysis, 2011. http://www.math.uni-tuebingen.de.

[77] T. Schuster, B. Kaltenbacher, B. Hofmann, and D. Kazimierski. Regularization methods in Banachspaces. de Gruyter, 2012.

[78] J.T. Schwartz. Nonlinear functional analysis. Gordon & Beach, 1969.

[79] B. Schweizer. Nichtlineare Analysis, 2010.

[80] B. Schweizer. Partielle Differentialgleichungen, 2011.

[81] J. Siegel. A new proof of Caristi’s fixed point theorem. Proc. Amer. Math. Soc., 66:54–56, 1977.

[82] S.L. Singh and S.N. Mishra. Remarks on recent fixed point theorems. Fixed point theory andapplications, pages 1–18, 2010.

[83] P. Spellucci. Numerische Verfahren der nichtlinearen Optimierung. Birhäuser, Basel, 1993.

[84] T. Suzuki and W. Takahashi. Fixed point theorems and characterizations of metric completeness.Topological methods in nonlinear Analysis, 8:371–382, 1996.

[85] Y. Takeuchi and T. Suzuki. An easily verifiable proof of the Brouwer fixed point theorem. Bull.Kyushu Inst. Tech., Pure Appl. Math., 59:1–5, 2012.

[86] R.A. Tapia. The Kantorovich Theorem for Newton’s method. The American Mathematical Monthly,78:389–392, 1971.

[87] A. Tikhonov. Ein Fixpunktsatz. Mathematische Annalen, 111:767–776, 1935.

[88] P. Tkacz and M. Turzanski. The Bolzano-Poincaré type theorems. Int. J. Math. Math. Sci., page 9,2011.

[89] M.N. Vrahatis. A short proof and a generalization of Miranda’s theorem. Proc. Am. Math. Soc.,107:701–703, 1089.

[90] S.C. Welsh. Open mappings and solvability of nonlinear equations in Banach spaces. Proc. of RoyalSoc. of Edinburgh, 126 A:239–246, 1996.

vii

Page 11: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

[91] D. Werner. Funktionalanalysis. Springer, 2002.

[92] A. Widder. Spectral theory for nonlinear operators. Master’s thesis, Technische Universität Wien,2012.

[93] E. Zeitler. Nonlinear functional analysis, Part I-IV. Springer, New York, 1991.

viii

Page 12: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Kapitel 1

Nichlinearität und Differenzierbarkeit

One calls two problems inverse to each other if theformulation of one problem involves the other one

J. B. Keller

1.1 (Nichtlineare) Gleichungen

Mathematischen Modelle (für eine physikalische Fragestellung) haben meist die Form einer Glei-chung/Differentialgleichung, die gewisse Parameter enthält, und in die weitere Größen einzu-bringen sind. Siehe etwa das (Galileische) Fallgesetz: die Differentialgleichung ist v = b (mit derBeschleunigung b) und im Gefolge sind einzubringen der Anfangszeitpunkt t0 und die Anfangs-geschwindigkeit v0 .

Eine beliebte Beschreibung eines Modells ist der Problembeschreibung in der Systemtheorieabgeschaut: es enthält eine

Systemgleichung und die Größen Input, System-Parameter, Output.

Die Analyse eines solchen Modells kann ausgehend von der Systemgleichung dann in drei Typenvon Problemen eingeteilt werden:

(A) Das direkte Problem: Gegeben sind Input und System-Parameter, bestimme den Out-put, der in Übereinstimmung damit ist.

(B) Das Rekonstruktionsproblem: Gegeben sind Output und System-Parameter, bestimmeden Input, der in Übereinstimmung damit ist.

(C) Das Identifikationsproblem: Gegeben sind Input und Output, finde die System-Parameter,die in Übereinstimmung damit sind.

Wir nennen ein Problem vom Typ (A) ein direktes Problem, da aus bekannten Ursachen eineWirkung zu bestimmen ist. Damit in Übereinstimmung ist dann, Probleme vom Typ (B) und (C)inverse Probleme zu nennen: es sind ja aus Wirkungen Ursachen zu bestimmen; siehe Epigraph.

Beispiel 1.1 Wir illustrieren die Begriffe bei einer einfachen Aufgabenstellung. Eine mathema-tische Beschreibung sieht so aus:

Direktes Problem: Mit einer stetigen Funktion x : [0, 1] −→ R und einem Para-meter p > 0 berechne

y(t) :=

∫ t

0e−psx(s)ds , t ∈ [0, 1] .

1

Page 13: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Rekonstruktionsproblem: Gegeben eine differenzierbare Funktion y : [0, 1] −→ Rund ein Parameter p > 0, bestimme x : [0, 1] −→ R so, dass gilt:

y(t) =

∫ t

0e−psx(s)ds , t ∈ [0, 1] .

Identifikationsproblem: Gegeben eine differenzierbare Funktion y : [0, 1] −→ Rund eine stetige Funktion x : [0, 1] −→ R, finde einen Parameter p > 0 so, dass gilt:

y(t) =

∫ t

0e−psx(s)ds , t ∈ [0, 1] .

(Der Term e−pt kann in der Finanzmathematik als ein Diskountfaktor angesehen werden.)Wir wissen aus der Integrationstheorie und der Numerischen Mathematik, dass das Direkte

Problem analytisch und numerisch in einer stabilen Weise gelöst werden kann. Für die inversenProbleme ist y(0) = 0 eine notwendige Bedingung für die Lösbarkeit der Aufgabe. Das Rekon-struktionsproblem ist äquivalent zu

y′(t) = e−ptx(t) für alle t ∈ [0, 1] .

Also erhalten wir die Funktion x durch

x(t) = y′(t)ept , t ∈ [0, 1] .

Beachte, dass wir die Daten y zu differenzieren haben. Das Identifikationsproblem ist äquivalentzu

y′(t) = e−ptx(t) für alle t ∈ [0, 1] .

Offensichtlich, die Bestimmung des Parameters p ist extrem überbestimmt. Wir benötigen nurein t ∈ (0, 1), so dass

p = −1

tln

(y′(t)

x(t)

)„erlaubt“ ist. Beachte erneut, dass wir die Daten y zu differenzieren haben.

Bemerkung 1.2 Die Differentiation von Daten ist keine triviale Aufgabe, denn kleine Fehler(Messfehler, Rundungsfehler,. . . ) können sich dramatisch auf das Ergebnis auswirken. Betrachteetwa die Differentiation von gε : [0, 1] 3 t 7−→ t + ε sin(t/ε) ∈ R für ε > 0 . ε soll als „kleinerFehlerparameter“ angesehen werden. Aus g′(t) = 1 + cos(t/ε) liest man ab, was für kleines εpassiert.

Bei einem mathematischen Modell läuft es meist darauf hinaus, eine Gleichung zu lösen. Da-mit sollte eine umfassende Untersuchung eines solchen mathematischen Modells folgende Fragenklären:

(1) Existenz und einer Lösung,

(2) Eindeutigkeit einer Lösung,

(3) Stabilität,

(4) Berechnung einer Lösung.

2

Page 14: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Die Frage der Existenz und Eindeutigkeit ist von Bedeutung, wenn es darum geht, Modellannah-men zu hinterfragen. Nichteindeutigkeit etwa könnte ein Indiz sein, dass die Modellbeschreibungnicht ausreichend viele Annahmen formuliert, um sicherzustellen, dass nur eine „mathematischeLösung“ existiert. In der Frage der Stabilität soll geklärt werden, wie sich Variationen in denParametern und den Modellannahmen auf die Lösung auswirken. Die Forderung (4) ist selbst-erklärend. Als beispielhaft kann man sich immer eine lineare Gleichung in endlichdimensionalenRäumen vorstellen: hier sind die obigen Fragen im Rahmen der linearen Algebra vollständigdiskutierbar.

Dieses Konzept der „Aufgabenbewertung“ wurde von Hadamard 1902 im Zusammenhangmit dem Studium von Randwertpoblemen der mathematischen Physik eingeführt. Hadamardbezeichnet ein mathematisches Problem schlechtgestellt/ill-posed, wenn es hinsichtlich der Forde-rungen (1),(2),(3) nicht überall eine positive Antwort gegeben werden kann, im entgegegesetztenFall als gutgestellt/well-posed.1 Es ist in der Natur der Problemstellung, dass inverse Problemeim Allgemeinen schlechtgestellt sind (Irreversibilität, Mangel an Kausalität, . . . ).

In der der linearen Funktionalanalysis haben wir eine Vielzahl von Methoden kennengelerntum Ergebnisse aus der endlichdimensionalen linearen Algebra auf den unendlichdimensionalenFall zu verallgemeinern. Ein Hauptaufgabe ist dabei, die Lösbarkeit einer (Operator-)Gleichungder Form

Tx = y

für lineare Operatoren T in unendlichdimensionalen Banachräumen zu zeigen. Damit werdenAufgaben modelliert, die durch lineare Differential- und Integralgleichungen beschrieben werden.Im Zentrum der folgenden Kapitel steht eine nichlineare (Operator-)Gleichung

f(x) = y

mit einer nichtlinearen Abbildung f : U −→ Y, U ⊂ X Definitionsbereich, X,Y normierteRäume. Die Lösungstheorie zu diesen Gleichungen kann auf unterschiedliche Techniken gestütztwerden:

• Linearisierungstechnik

• Fixpunktmethoden

• Diskretisierungsverfahren

• Variationelle Methoden

• Algebraisch/Topologische Methoden

In den folgenden Abschnitten skizzieren wir diese Techniken, später gehen wir genauer daraufein.

Nichtlineare Abbildungen unterscheiden sich in ihren Eigenschaften ziemlich beträchtlich vonlinearen Abbildungen. Als kleinen Hinweis führen wir folgendes Beispiel an.

Beispiel 1.3 Betrachte die Abbildung

f : c0 −→ c0, (x1, x2, x3, . . . ) 7−→ (x1, (x2)2, (x3)3, . . . ) .

Man kann zeigen, dass diese Abbildung stetig ist, aber auf keiner Kugel Br, r > 1, beschränkt ist;siehe Übungsaufgabe. Vergleiche dies mit linearen stetigen Operatoren.

1Hadamard glaubte – viele Mathematiker tun dies heute noch – dass schlechtgestellt Probleme nicht sachgemäßgestellt sind und daher als künstlich zu bezeichnen sind.

3

Page 15: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

1.2 Differenzierbarkeit nichtlinearer Abbildungen

Kurz ein Abstecher in die Differenzierbarkeit nichtlinearer Abbildungen in normierten Räumen;siehe etwa [25, 73, 93]. Vorne weg: Im Allgemeinen unterscheiden wir die Normen in unterschied-lichen Räumen nicht; die Unterscheidung ergibt sich meist unschwer aus dem Kontext.

Definition 1.4 Seien X,Y normierte Räume, U ⊂ X offen und f : U −→ Y eine Abbildung.

(a) f heißt Gâteaux-differenzierbar in x0 ∈ U, falls ein stetiger linearer Operator T : X −→Y existiert mit

limh→0

f(x0 + hv)− f(x0)

h= Tv für alle v ∈ X . (1.1)

T heißt Gateaux-Ableitung in x0 .

(b) f heißt Fréchet-differenzierbar in x0 ∈ U, falls gilt: es gibt einen stetigen linearen Ope-rator T : X −→ Y mit

∀ δ > 0 ∃ offene Umgebung V von x0∀x ∈ V (‖f(x)−f(x0)−T (x−x0)‖ ≤ δ‖x−x0‖) (1.2)

T heißt Fréchet-Ableitung in x0 .

(c) f heißt strikt differenzierbar in x0 ∈ D, falls gilt: es gibt einen stetigen linearen OperatorT : X −→ Y mit

∀ δ > 0∃ offene Umgebung V von x0 ∀x ∈ V ∀x1, x2 ∈ Bε(x0)

(‖f(x1)− f(x2)− T (x1 − x2)‖ ≤ δ‖x1 − x2‖) (1.3)

T heißt strikte Ableitung in x0 .

(d) f heißt Gâteaux- bzw. Fréchet-differenzierbar bzw. strikt differenzierbar in U, fallsf in jedem x0 ∈ U Gâteaux- bzw. Fréchet- bzw. stikt differenzierbar ist.

Bemerkung 1.5 Man kann Fréchet-Differenzierbarkeit auch über die Gateaux-Differenzierbarkeitdefinieren: f heißt Fréchet-differenzierbar in x0 ∈ U, falls die Konvergenz in (1.1) gleichmäßigin v ∈ B1 ist. Wir verzichten auf den Beweis dieser Behauptung.

Gateaux-Differenzierbarkeit nimmt die Richtungsableitung aus der Analysis in Rn auf. Dorthaben wir sie meist kennengelernt als Hilfsmittel bei der Ableitung notwendiger Bedingungenbei Optimierungsaufgaben. Beachte, dass in der Literatur nicht in jedem Falle die Stetigkeit undLinearität der Ableitung gefordert ist.

Die Fréchet-Ableitung reflektiert die Idee der linearen Approximation einer nichtlinearenAbbildung. Die Fréchet-Ableitung ist eindeutig bestimmt (siehe dazu nachfolgendes Lemma 1.6)und hängt im Allgemeinen von x0 ab; wir schreiben Df(x0) statt T und nennen Df(x0) ∈B(X,Y ) Fréchet-Ableitung von f in x0 . Äquivalent mit der definierenden Bedingung (1.2)ist: Es gibt einen stetigen linearen Operator T : X −→ Y mit

f(x0 + u) = f(x0) + Tu+ ‖u‖r(u) (1.4)

mit einer stetigen Abbildung r : Bε −→ Y mit r(θ) = θ (mit einem ε > 0). Manchmal schreibtman den Term ‖u‖r(u) auch als o(u) mit dem Landausymbol „Klein-o“ und meint damit, dasslimu→θ ‖u‖−1o(u) gilt. Bei Abbildungen, die auf dem Skalarkörper R oder C definiert sind, lassenwir das Präfix „Fréchet“ im Allgemeinen weg.

Klar aus strikter Differenzierbarkeit von f in x0 folgt die Fréchet-Differenzierbarkeit von fin x0 .

4

Page 16: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Lemma 1.6 Seien X,Y normierte Räume, U ⊂ X offen und sei f : U −→ Y Fréchet-differenzierbar in x0 ∈ U . Dann gilt für alle u ∈ X

Df(x0)u = limh→0

f(x0 + hu)− f(x0)

h. (1.5)

Beweis:Sei h ∈ R, h > 0 ; für h < 0 können wir analog argumentieren. Gemäß 1.2 haben wird fürhinreichend kleines h

f(x0 + hu) = f(x0) +Df(x0)(hu) + ‖hu‖r(u)

und damit

Df(x0)(u) =f(x0 + hu)− f(x0)

h− ‖u‖r(hu)

Grenzübergang h→ 0 liefert die Behauptung.

Beispiel 1.7 Es trifft nicht zu, dass die Existenz des Grenzwertes (in der Richtungsableitung)

limh→0

f(x0 + hv)− f(x0)

h

für alle v ∈ X die Fréchet-Differenzierbarkeit einer Abbildung f sichert. Ein Gegenbeispiel ist

f : R2 −→ R , (x, y) 7−→

xy√x2 + y2

(x, y) 6= (0, 0)

0 sonst.

f ist stetig und für v = (v1, v2) haben wir

limh0

(0, 0) + f(h(v1, v2))− f(0, 0)

h= f(v1, v2) .

Dies zeigt, dass f nicht differenzierbar sein kann in (0, 0), denn (v1, v2) 7−→ f(v1, v2) is nichtlinear.

Folgerung 1.8 Seien X,Y normierte Räume, U ⊂ X offen und sei f : U −→ Y Fréchet-differenzierbar in x0 ∈ U . Dann ist f stetig in x0 .

Beweis:Folgt aus

limv→θ

f(x0 + v) = limv→θ

(f(x0) +Df(x0)v + ‖v‖r(v)) = f(x0)

Definition 1.9 Seien X,Y normierte Räume, U ⊂ X offen und sei f : U −→ Y Fréchet-differenzierbar für alle x0 ∈ U . Wir sagen, dass f in x0 stetig differenzierbar ist und schreibenf ∈ C1(U, Y ), falls die Abbildung U 3 x0 7−→ Df(x0) ∈ B(X,Y ) stetig ist.

Regel 1.10 Seien X,Y, Z normierte Räume, U ⊂ X,V ⊂ Y, offen und seien f1, f2 : U −→ YFréchet-differenzierbar in x0 ∈ U, sei f : U −→ Y differenzierbar in x0, g : V −→ Zdifferenzierbar in f(x0) ∈ V , T ∈ B(Y, Z) . Dann gilt:

(a) f1 + f2 ist differenzierbar in x0 und es gilt

D(f1 + f2)(x0) = Df1(x

0) +Df2(x0) .

5

Page 17: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

(b) Ist Y = R, dann ist f1f2 differenzierbar in x0 und es gilt

D(f1f2)(x0) = f2(x

0)Df1(x0) + f1(x

0)Df2(x0) .

(c) g f ist differenzierbar in x0 und es gilt

D(g f)((x0) = Dg(f(x0)) Df(x0) .

(d) A f : U 3 x 7−→ Af(x) ∈ Z ist differenzierbar in x0 und es gilt

D(A f)(x0) = A Df(x0) .

Den Beweis dieser Differentiationsregeln überlassen wir dem Leser.

Definition 1.11 Seien X,Y normierte Räume, U ⊂ X offen und sei f : U −→ Y . f heißtLipschitzstetig in C ⊂ U, falls es L ∈ [0,∞) gibt, so dass gilt:

‖f(u)− f(v)‖ ≤ L‖u− v‖ , u, v ∈ C . (1.6)

L wird Lipschitzkonstante (von f in C) genannt.

Satz 1.12 Seien X,Y Banachräume, U ⊂ X offen und sei f : U −→ Y Fréchet-differenzierbarin x0 ∈ U,C ⊂ U konvex. Es gelte: ‖Df(x)‖X→Y ≤ L, x ∈ C . Dann ist f Lipschitstetig in Cmit Lipschitzkonstante L .

Beweis:Seien u, v ∈ C . Auf Grund der Konvexität ist tu + (1 − t)v ∈ C für alle t ∈ [0, 1] . Sei λ ∈ Y ∗

mit ‖λ‖∗ ≤ 1. Dann ist die Abbildung φ : [0, 1] 3 t 7−→ 〈λ, f(tu+ (1− t)v)〉 ∈ R wohldefiniertund stetig. Aus

φ(t+ h)− φ(t)

h=

⟨λ,f(tu+ (1− t)v + h(u− v))− f(tu+ (1− t)v)

h

⟩liest man ab, dass φ in (0, 1) differenzierbar ist und die Ableitung durch

φ′(t) = 〈λ,Df(tu+ (1− t)v)(u− v)〉

gegeben ist. Mit dem Mittelwertsatz im Reellen folgt |φ(1)− φ(0)| ≤ supt∈(0,1) |φ′(t)| und daher

|〈λ, f(u)− f(v)〉| ≤ supt∈[0,1]

|〈λ,Df(tu+ (1− t)v)(u− v)〉|

≤ supt∈[0,1]

‖Df(tu+ (1− t)v)‖X→Y ‖u− v‖‖λ‖∗

≤ L‖u− v‖

Damit ergibt sich die Behauptung auf Grund von Folgerung 5.9 in [13]

‖f(u)− f(v)‖ = supλ∈X∗,‖λ‖∗≤1

|〈λ, f(u)− f(v)〉| .

6

Page 18: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Bemerkung 1.13 Es liegt nahe, den Satz 1.12 dahingehend zu hinterfragen, inwieweit eine ArtUmkehrung gilt: aus Lipschitzstetigkeit folgt eine „Form von Differenzierbarkeit“. Diese Frage-stellung hat ihren Ursprung im Satz von Rademacher (1919): eine Funktion f : Rn −→ R, dieLipschitzstetig ist, ist Fréchet-differenzierbar fast überall (bezüglich des Lebesguemaßes). In derFolge hat dann die Fragestellung, inwieweit der Satz von Rademacher allgemein gilt, in der an-gewandten Mathematik eine große Rolle gespielt. Ein erster Erfolg war der Satz von Alexandrov,der das Resultat auf Abbildungen f : Rn −→ Rm erweiterte. Den Ausgangspunkt für die weitereEntwicklung kann man beim Studium des Subdifferentialkalküls bei konvexen Funktionen durchFenchel, Moreau, Rockafellar u. a. finden. Resultate in der eigentlichen Fragestellung wurden vonRockafellar, F. Clarke, Mordukovich, Penot und vielen anderen entwickelt. Es gibt eine Reihe vontiefen Verbindungen der Fragestellung zur Strukturtheorie der Banachräume (Asplundräume2),der geometrischen Maßtheorie, den mengenwertigen Differentialgleichungen, . . . .

Zum „Stand der Kunst“ zwei Anmerkungen; siehe [58]. Jede Lipschitzstetige Abbildung f :X −→ Y ist Gateaux-differenzierbar fast überall, falls X separabel ist und Y die so genannteRadon-Nikodym-Eigenschaft (Jede Abbildung g : R −→ Y besitzt einen Punkt der Fréchet-Differenzierbarkeit) besitzt; beachte, dass „fast überall“ eine Fortschreibung auf den unendlichdi-mensionalen Fall ist, die geeignet zu definieren ist. Jede Lipschitzstetige Abbildung f : X −→ Rist in mindestens einem Punkt Fréchet-differenzierbar, falls X ein Asplund-Raum ist.

Im Spezialfall eines nichtlinearen Funktionals, also einer Abbildung f : U −→ K mitU ⊂ X,X normierter Raum mit Skalarkörper K, ist bei Gateaux-Differenzierbarkeit in einemPunkt x0 ∈ U der lineare Operator Df(x0) erklärt, also ein stetiges lineare Funktional λ :=Df(x0) ∈ X∗ . Ist (X, 〈·|·〉X) ein Hilbertraum, so lässt sich das stetige lineare Funktional Df(x0)nach dem Satz von Riesz sogar in X interpretieren:

〈Df(x0), x〉 = 〈y|x〉X , x ∈ X ,

mit dem Element y := RX(Df(x0)), wobei RX : X∗ −→ X die sogenannte Riesz-Abbildungist. Das Element y heißt der Gradient von f in x0 und wir schreiben dafür ∇f(x0) . Also

〈Df(x0), x〉 = 〈∇f(x0)|x〉X , x ∈ X .

Für die „Strukturtheorie der Banachräume“ ist insbesondere die Differenzierbarkeit der Normvon Bedeutung; siehe den entsprechenden Abschnitt in [13]. An der Betragsfunktion sehen wirsofort die zu erwartenden Schwierigkeiten: der Nullvektor θ in einem normierten Raum solltediesbezüglich eine Sonderrolle spielen.

Bemerkung 1.14 In differenzierbaren Mannigfaltigkeiten M mit Modellraum E(E = Rn, E =X,X Banachraum) lassen sich die Tangentialvektoren TxM,x ∈ M, in einem Punkt auf ver-schiedene Weisen (algebraisch, geometrisch, physikalisch) definieren. TxM ist ein Vektorraum,der eine differenzierbare Mannigfaltigkeiten M an einem Punkt x ∈M linear approximiert.

Zu Mannigfaltigkeiten M,N mit Punkten x ∈ M,y ∈ N und Tangentialräumen TxM |x ∈M und TxN |x ∈ N gilt: Für f :M −→ N ist Df(x) eine Abbildung von TxM −→ Tf(x)N .Im elementaren Fall von Mannigfaltigkeiten M und N als offene Teilmengen von Banachräumensind alle Tangentialräume identisch zum Banachraum selbst.

Seien X,Y normierte Räume, U ⊂ X und sei f : U −→ Y Fréchet-differenzierbar in U .Eine Fréchet-Ableitung der Ordnung zwei in einem x0 ∈ U liegt vor, wenn die Abbildung

U 3 x 7−→ Df(x) ∈ B(X,Y )

2Ein Banachraum X ist ein Asplundraum, falls gilt: ist Y ⊂ X ein separabler linearer Teilraum, so ist Y ∗

separabel.

7

Page 19: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Fréchet-differenzierbar in x0 ist. Diese Fréchet-Ableitung D2f(x0) liegt dann in B(X,B(X,Y )) .Dieser normierte Raum lässt sich als ein Raum bilinearer Abbildungen darstellen. Ist nämlichT ∈ B(X,B(X,Y ), kann man eine Abbildung

bT : X ×X 3 (x1, x2) 7−→ Tx1(x2) ∈ Y

assoziieren. Diese ist bilinear (also linear in beiden Argumenten) und beschränkt in dem Sinn,dass

‖bT ‖ := supx1,x2∈B1

‖bT (x1, x2)‖ <∞

ist. Auf diese Weise wird der Raum B2(X,Y ) der beschränkten bilinearen Abbildungen vonX × X nach Y zu einem normierten Raum, der zu B(X,B(X,Y ) isometrisch isomorph ist.Denn offensichtlich ist ‖bT ‖ = ‖T, ‖ und eine gegebene beschränkte bilineare Abbildung b kanndurch den gemäs (Tx1)(x2) = b(x1, x2) wohldefinierten Operator T ∈ B(X,B(X,Y )) als b = bTdargestellt werden. Mit dieser Identifikation operiert die zweite Ableitung als

D2f : U −→ B2(X,Y ) .

Induktiv können wir nun höhere Ableitungen als Abbildungen

Dnf : U −→ Bn(X,Y ) ∼= B(X,Bn−1(X,Y )

definiert werden. Dnf(x) ist also eine n-fach multilineare Abbildung. Damit kann man den Satzvon Taylor formulieren, der wie im Endlichdimensionalen auf den reellen Fall zurückgeführtwerden kann; nur die Notation ist etwas komplizierter. Ohne Beweis:

Satz 1.15 (Satz von Taylor) Seien X,Y normierte Räume, sei U ⊂ X offen, sei x0 ∈ U, undsei f : U −→ Y (n+ 1)-Fréchet-differenzierbar. Es liege für u ∈ X der Halbstrahl x ∈ X|x =x0 + tu, t ∈ [0, 1] in U . Dann existiert ein θ ∈ (0, 1) mit

f(x0 + u) = f(x0) +Df(x0)(u) +1

2!D2f(x0)(u, u) + · · ·+ 1

n!Dnf(x0)(u, . . . , u) +

+1

(n+)1!Dn+1f(x0 + θu)(u, . . . , u, u) . (1.7)

1.3 Offene Abbildungen

Offene Abbildungen liefern hinreichende Bedingungen für die Lösbarkeit von Gleichungen. Diesist schon bekannt aus der linearen Funktionalanalysis. Hier ist das Ergebnis in Form einer Äqui-valenz zentral.

Satz 1.16 (Satz von der offenen Abbildung) Seien X,Y Banachräume und sei T : X −→Y linear und stetig. Dann sind äquivalent:

(a) T ist offen.

(b) Es gibt δ > 0 mit Bδ ⊂ T (B1) .

(c) Es gibt m > 0, so dass für alle y ∈ Y ein x ∈ X gibt mit y = Tx und ‖x‖ ≤ m‖y‖ .

(d) T ist surjektiv.

8

Page 20: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Den Beweis findet man in [13], allerdings ohne die Bedingung (c) . Wir geben den Beweis (b) =⇒(c), (c) =⇒ (d) ist trivial. Sei y ∈ Y . Dann ist y′ := 1

2δ‖y‖−1y ∈ Bδ . Nach (b) gibt es x′ ∈ B1

mit Tx′ = y′ . Setze x := 2δ‖y‖x

′ . Dann folgt Tx = y und ‖x‖ ≤ m‖y‖ mit m := 2δ .

Offenbar besagt (b) in Satz 1.16, dass die Gleichung Tx = y für alle y in der δ-Kugel Bδ eineLösung in B1 besitzt. Bemerkenswert ist, dass Lösungen in der Kugel B1 liegen, also in einerbeschränkten Umgebung von θ . Man schließt daraus mit der Linearität folgende Aussage:

Es gibt δ > 0 mit Brδ ⊂ T (Br) , r > 0 . (1.8)

Die Eigenschaft (1.8) fasst man unter der Aussage zusammen, dass eine surjektive lineare stetigeAbbildung offen mit linearer Rate ist.

Folgerung 1.17 Seien X,Y Banachräume und sei T : X −→ Y linear, stetig und surjektiv.Dann gibt es κ > 0 mit

dist(x,−1T (y)) ≤ κ‖y − Tx‖ , x ∈ X, y ∈ Y . (1.9)

Beweis:Betrachte die Abbildung

T : X/ker(T ) 3 [x] 7−→ Tx ∈ Y .

Bekannterweise ist X/ker(T ) ein Banachraum bezüglich der Norm ‖[x]‖ := infu∈ker(T ) ‖x−u‖, x ∈X . T ist offenbar linear, stetig und bijektiv. Also ist T−1 stetig und es gibt κ > 0 mit

‖[x]‖ ≤ κ‖Tx‖ , x ∈ X .

Also haben wir gezeigt

dist(x,−1T (θ)) ≤ κ‖Tx‖ , x ∈ X .

Mit der Linearität und der Tatsache, dass T bijektiv ist, erhalten wir die Behauptung.

Die Aussage von Folgerung 1.17 bezeichnet man als metrische Regularität. Sie spielt inder Optimierungstheorie im Zusammenhang mit mengenwertigen Abbildungen – man stelle sichals Beispiel etwa die zulässige Menge einer Optimierungsaufgabe vor – eine große Rolle; siehez. B. [34].

Wie lassen sich diese Ergebnisse auf nichtlineare Gleichungen übertragen? Hilfreich ist hierdie Linearisierungstechnik, also der Versuch, Offenheit einer nichtlinearen Abbildung aus derOffenheit der Ableitung zu erschließen. Dabei wird eine geringfügige Verschärfung der Fréchet-Differenzierbarkeit verwendet. Für eine umfassende Darstellung der folgenden Resultate siehe[33, 41]. Im Zusammenhang mit der Fixpunkttheorie kommen wir in einer etwas anderen Formauf diese Fragestellung zurück; siehe hierzu [90].

Lemma 1.18 (Graves, 1950) Seien X,Y Banachräume, U ⊂ X offen, sei f : U −→ Y . Esgelte:

(a) Br ⊂ U für ein r > 0 und f(θ) = θ .

(b) Es gibt T ∈ B(X,Y ) und δ > 0 mit ‖f(x1)−f(x2)−T (x1−x2)‖ ≤ δ‖x1−x2‖ , x1, x2 ∈ Br .

(c) Es gibt m > 0, so dass für alle y ∈ Y es ein x ∈ X gibt mit y = Tx und ‖x‖ ≤ m‖y‖ .

(d) Es gilt 0 < mδ < 1 .

9

Page 21: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Dann hat die Gleichungf(x) = y

für alle y ∈ Bρr eine Lösung x ∈ Br ; hierbei ist ρ := m−1 − δ .

Beweis:Wähle y ∈ Bρr . Wir konstruieren eine Folge (xn)n∈N induktiv. Setze x0 := θ. Nach (c) gibt esx1 ∈ X mit

Tx1 = y , ‖x1‖ ≤ m‖y‖ ≤ r .

Haben wir nun x0, x1, . . . , xn−1 konstruiert mit

Txi = y − f(xi−1) + Txi−1 , ‖xi − xi−1‖ ≤ m(mδ)i−1‖y‖ ,

dann gilt

‖xi‖ ≤i∑

j=1

‖xj − xj−1‖ ≤ m‖y‖i∑

j=1

(mδ)j−1 ≤ m‖y‖(1−mδ)−1 = ‖y‖ρ−1 ≤ r .

Wähle nach (c) ein z ∈ X mit Tz = y−f(xn−1) und ‖z‖ ≤ m‖y−f(xn−1)‖ . Setze xn := z+xn−1 .Dann gilt

Txn = y − f(xn−1) + Txn−1 , ‖xn − xn−1‖ ≤ m‖y − f(xn−1)‖ . (1.10)

Wegen y = Txn−1−Txn−2+ f(xn−2) folgt mit (b) ‖xn−xn−1‖ ≤ mδ‖xn−1−xn−2‖ , und daher

‖xn − xn−1‖ ≤ m(mδ)n−1‖y‖ . (1.11)

Damit ist die Folge (xn)n∈N definiert. Offenbar ist diese Folge nun wegen (1.11) und (d) eineCauchyfolge in der Kugel Br, daher konvergent. Sei x := limn x

n . Es gilt x ∈ Br und Grenz-übergang in (1.10) liefert y = f(x) .

Wir wollen uns nun von der Voraussetzung f(θ) = θ befreien.

Satz 1.19 (Graves, 1950) Seien X,Y Banachräume, U ⊂ X offen und sei f : U −→ Ystrikt differenzierbar in x0 ∈ U mit strikter Ableitung Df(x0) ∈ B(X,Y ) , die surjektiv ist. Danngibt es eine Umgebung V von x0 und eine Konstante ρ > 0, so dass gilt:

∀x ∈ V ∀ s > 0 (Bs(x) ⊂ V =⇒ Bρs(f(x)) ⊂ f(Bs(x))) (1.12)

Beweis:Sei f strikt differenzierbar in x0 mit surjektiver Ableitung Df(x0) ∈ B(X,Y ) . Sei dazu m > 0gemäß Satz 1.16 (c) gewählt. Sei δ > 0 mit mδ < 1 . Dann existiert eine offene Umgebung V vonx0, so dass in V (1.3) gilt. Sei x ∈ V und sei s > 0 mit Bs(x) ⊂ V . Wir setzen

f(x) := f(x+ x)− f(x) , x ∈ Bs .

Dann gilt f(θ) = θ und f genügt (b) in Lemma 1.18. Nun können wir Lemma 1.18 auf f anwendenund erhalten Bρs ⊂ f(Bs) , wobei ρ = m−1 − δ ist. Dies bedeutet

Bρs(x) ⊂ f(Bs(x)) .

Bemerkung 1.20 Ist f : U −→ Y Fréchet-differenzierbar mit Fréchet-Ableitung Df(x0), soheißt x0 regulär, falls Df(x0) surjektiv ist, anderenfalls singulär.

10

Page 22: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Die obigen Ergebnisse lassen sich im wesentlichen auf mengenwertige Abbildungen f : U ⇒ Y,also Abbildungen f : U −→ POT(Y ), übertragen. Dazu sind natürlich geeignete Begriffe derStetigkeit und Regularität bereitzustellen; siehe etwa [34].

Für die Stetigkeit der Inversen f−1 einer nichtlinearen Abbildung f kann man den Satz vonder stetigen Inversen nutzen. Die Stetigkeit dieser inversen Abbildung liefert dann die Offenheitder Abbildung f .

Satz 1.21 (Satz von der Inversen Abbildung) Seien X,Y Banachräume, sei U ⊂ X offen,und sei f ∈ C1(U, Y ) . Sei x0 ∈ U und sei V := f(U) . Ist Df(x0) bijektiv, dann gibt es eine offeneUmgebungen U0 ⊂ U, V0 ⊂ V von x0 bzw. f(x0), so dass die Einschränkung f|U0

: U0 −→ V0eine Inverse g : V0 −→ U0 besitzt, die stetig Fréchet-differenzierbar ist mit

Dg(y) = Df(g(y))−1 , y ∈ V0 .

Beweis:Den Beweis erbringen wir im nächsten Kapitel, wenn wir den Banachschen Fixpunktsatz bespro-chen haben.

Beispiel 1.22 Die Voraussetzung der stetigen Differenzierbarkeit kann nicht abgeschwächt wer-den zu einfacher Differenzierbarkeit. Die Funktion f : R −→ R mit

f(x) :=

12x+ x2 sin( 1x) x 6= 0

0 sonstf ′(x) :=

12 + 2x sin( 1x)− cos( 1x) x 6= 012 sonst

ist differenzierbar mit f ′(0) = 12 . Aber f ist in keiner Umgebung von 0 injektiv.

1.4 Kompakte nichtlineare Abbildungen

Definition 1.23 Seien X,Y Banachräume und sei U ⊂ X .

• Eine Abbildung f : U −→ Y heißt von endlichem Rang, falls f(U) Teilmenge in einemendlichdimensionalem Teilraum Y ⊂ Y ist.

• Eine Abbildung f : U −→ Y heißt beschränkt, falls f(B) beschränkt ist für alle be-schränkten Teilmengen B von U .

• Eine Abbildung f : U −→ Y heißt kompakt, falls f(B) kompakt ist für alle beschränktenTeilmengen B von U .

• Eine Abbildung f : U −→ Y heißt vollstetig, falls f kompakt und stetig ist.

• Eine Abbildung f : U −→ Y heißt eigentlich stetig, falls f kompakt und zusätzlich gilt:Konvergiert eine Folge (xn)n∈N in U schwach gegen x ∈ U, so konvergiert (f(xn))n∈N gegenf(x) .

Die Definition „vollstetig“ wird in der Literatur nicht ganz einheitlich verwendet. Wir haben diesaufgelöst durch Hinzunahme der Begriffsbildung „eigentlich stetig“; siehe [54].

Beachte, dass für dimY < ∞ jede beschränkte Abbildung f : U −→ Y, U ⊂ X, kompaktist. Kompakte Abbildungen müssen also nicht stetig sein. Das nachfolgende Theorem besagt,

11

Page 23: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

dass kompakte Abbildungen genau die Abbildungen sind, die sich gut durch endlichdimensionaleAbbildungen approximieren lassen. Wir schicken voraus, dass Kompaktheit immer nur auf be-schränkten Definitionsmengen U Mengen uberprüft werden muss, denn es gilt: Eine Abbildungf : U −→ Y ist kompakt, falls jede Einschränkung f|A : A −→ Y auf eine abgeschlossenebeschränkte Menge A ⊂ U kompakt ist.

Satz 1.24 Seien X,Y Banachräume und sei U ⊂ X offen und sei f : U −→ Y . Sei A ⊂ Ubeschränkt. Dann sind äquivalent:

(a) f : A −→ Y ist vollstetig.

(b) Zu jedem ε > 0 gibt es eine stetige, beschränkte Abbildung fε : A −→ Yε mit einemlinearen endlich-dimensionalen Teilraum Yε von Y, die

supx∈A

‖f(x)− fε(x)‖ ≤ ε

erfüllt.

fε kann so gewählt, dass fε(A) ⊂ co(f(A)) gilt.

Beweis:Zu (a) =⇒ (b)Da f kompakt ist und A beschränkt ist, ist f(A) kompakt, und damit präkompakt, insbesondereauch beschränkt. Sei ε > 0 . Dann gibt es y1, . . . , ym ∈ f(A) mit

f(A) ⊂ ∪mi=1Bε(y

i) .

Wir definieren φj : A −→ [0, 1] durch

φj(x) :=dist(f(x), Y \Bε(y

j))∑m

i=1dist(f(x), Y \Bε(y

i)), x ∈ X .

Es gilt φ1(x) + · · ·+ φm(x) = 1, x ∈ A . Damit definieren wir

fε :=

m∑j=1

φjyj , Yε := span(y1, . . . , ym) ⊂ Y .

Nun giltsupx∈A

‖f(x)− fε(x)‖ ≤ ε , fε(A) ⊂ co(y1, . . . , ym) ⊂ co(f(A)),

und da co(f(A)) beschränkt ist, ist auch fε(A) beschränkt.Da jede Distanzfunktion dist(z,M) in einem metrischen Raum Lipschitstetig ist, ist wegen derStetigkeit von f jedes φj stetig. Also ist auch fε stetig.Zu (b) =⇒ (a)Als gleichmäßiger Grenzwert von stetigen Abbildungen ist f stetig. Da im Banachraum jederPunkt eine abzählbare Umgebungsbasis besitzt, reicht es, zu zeigen, dass f(A) folgenkompaktist. Es reicht also, für eine Folge (f(xk))k∈N in f(A) zu zeigen: Es gibt eine Teilfolge, so dass(f(xkl)l∈N konvergiert und y := liml f(xkl) in f(A) gilt.

Die Folgen (fn(xk))k∈N sind für jedes n ∈ N beschränkte Folgen in einem endlichdimensio-nalen Raum. Also gibt es Teilfolgen von (xk)k∈N und yn ∈ Y mit yn = lim fn(xk), n ∈ N . DieFolge (yn)n∈N bildet eine Cauchyfolge, wie man an

‖yl − ym‖ ≤ ‖yl − fl(xk)‖+ ‖fl(xk)− fm(xk)‖+ ‖fm(xk)− ym‖

12

Page 24: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

abliest; man wähle k = k(l,m) geeignet. Daher konvergiert die Folge (yn)n∈N; y := limn yn . Aus

‖f(xk)− y‖ ≤ ‖f(xk)− fn(xk)‖+ ‖fn(xk)− yn‖+ ‖yn − y‖

schließt man y = limk f(xk) . Dass y ∈ f(A) gilt, ist trivial.

Satz 1.25 Seien X,Y Banachräume, sei U ⊂ X, und sei f : U −→ Y Fréchet-differenzierbarin x0 ∈ U und kompakt auf einer Kugel Br(x

0)(r > 0) ⊂ U . Dann ist Df(x0) ∈ B(X,Y )ebenfalls kompakt.

Beweis:Ohne Einschränkung sei x0 = θ, r = 1, und f(x0) = θ . Wir setzen T := Df(x0) und betrachteneine Folge (xk)k∈N in B1 . Wir wollen zeigen, dass für eine Teilfolge von (xk)k∈N die Bilfdfolge(Txk)k∈N gegen ein y ∈ Y konvergiert.Wegen der Differenzierbarkeit von f gibt es für jedes n ∈ N ein δ ∈ (0, 1) mit

‖f(x)− f(θ)− T (x− θ)‖ ≤ 1

n, x ∈ Bδ .

Für festes n ∈ N können wir wegen der Kompaktheit von f zu einer Teilfolge übergehen, so dass(f(δxk))k∈N konvergiert; also yn := limk f(δxk) . Dann gilt für k, l ∈ N

‖δT (xk − xl)‖ −2

nδ ≤ ‖f(δxk)− f(δxl)‖

und daher ‖T (xk − xl)‖ ≤ 3n für große k, l . Wir gehen nun sukzessiv für jedes n ∈ N zu einer

Teilfolge über und finden insgesamt eine Teilfolge, so dass (Txk)k∈N eine Cauchy-Folge ist, alsoeinen Grenzwert besitzt.

1.5 Kompakte lineare Operatoren

Das obige Lemma besagt, dass die Kompaktheit einer Abbildung sich auf die Fréchet-Ableitungvererbt. Die Eigenschaft „Kompaktheit“ einer linearen Abbildung ist also wert, noch genauerunter die Lupe genommen zu werden.

Seien X,Y Banachräume und sei T : X −→ Y kompakt. Dann ist offenbar T sogarbeschränkt, also stetig, denn T (B1) ist ja dann kompakt, also beschränkt. Ein kompakter linearerOperator T : X −→ Y ist somit stets vollstetig. Also ist es sinnvoll,

K(X,Y ) := T ∈ B(X,Y )|T kompakt

zu betrachten.

Beispiel 1.26 Sei X := C[a, b], versehen mit der Maximumsnorm, und sei κ : [a, b]× [a, b] −→R stetig. Dann ist der Integraloperator

T : C[a, b] 3 x 7−→ Tx ∈ C[a, b] , Tx(t) :=

∫ b

aκ(t, s)x(s)ds , t ∈ [a, b] ,

ein linearer stetiger Operator. Er ist als linearer Operator sogar Lipschitzstetig, genauer

‖Tx− Tz‖∞ ≤ L‖x− z‖∞ mit L := maxt∈[a,b]

∫ b

a|κ(t, s)|ds .

13

Page 25: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Die Kompaktheit dieses Operators folgt aus dem Satz von Arzela-Ascoli (siehe [13]) in folgenderWeise. Der Kern κ ist auf [a, b]× [a, b] gleichmäßig stetig. Also gibt es zu ε > 0 ein δ > 0 mit

|κ(t, s)− κ(t′, s′)| < ε f ür alle t, t′, s, s′ mit |t− t′|+ |s− s′| < δ

Also gilt für x ∈ B1, t, t′ ∈ [a, b] mit |t− t′| < δ

|Tx(t)− Tx(t′)| < ‖x‖∞ε

Also ist die Familie Tx|x ∈ B1 gleichgradig stetig und offenbar beschränkt. Damit ist der Satzvon Arzela-Ascoli anwendbar und T (B1) ist kompakt.

Bemerkung 1.27 Kompakten linearen Abbildungen kann man im Allgemeinen die Eigenschaftder „Glättung“ zuschreiben. Dies kann man am Beispiel 1.26 sehen: aus der Stetigkeit des Kernsκ folgt die Lipschitzstetigkeit der Bilder des Operators. Noch deutlicher wird die Situation, wennder Kern κ unendlich oft differenzierbar ist. Dann sind auch die Bilder des Operators unendlichoft differenzierbar und der Operator „glättet“ stetige Funktionen in unendlich oft differenzierbareFunktionen.

Ohne Beweise führen wir an:

Regel 1.28 Seien X,Y, Z,W Banachräume (mit Skalarkörper K) und sei T ∈ K(X,Y ) . Danngilt:

(a) T + S ∈ K(X,Y ) für alle S ∈ K(X,Y ) .

(b) λT ∈ K(X,Y ) für alle λ ∈ K .

(c) S T ∈ K(X,Z) für alle S ∈ B(Y,Z) .

(d) T S ∈ K(W,Y ) für alle S ∈ B(W,X) .

Die Aussagen (c), (d) in 1.28 belegen, dass K(X) ein zweiseitiges Ideal in B(X) ist.

Lemma 1.29 Seien X,Y Banachräume. Dann ist K(X,Y ) ein linearer, abgeschlossener Teil-raum von B(X,Y ) .

Beweis:Die Aussagen (a), (b) in 1.28 besagen, dass K(X,Y ) ein linearere Teilraum von B(X,Y ) ist.Sei (Tn)n∈N eine konvergente Folge (bezüglich ‖ · ‖X→Y ) in K(X,Y ) und sei T := limn Tn . Klar,T ∈ B(X,Y ) , da B(X,Y ) ein Banachraum ist. Wir haben zu zeigen, dass T (B1) kompakt ist,oder, dass jede Folge in T (B1) eine Teilfolge besitzt, die Cauchyfolge ist.Annahme: Es gibt eine Folge (xk)k∈N in B1 und ε > 0 so, dass ‖Txj − Txk‖ ≥ ε für alle k, jgilt. Da T = limn Tn gilt, existiert ein N ∈ N mit ‖Tn − T‖ ≤ ε/3 für n ≥ N . Dann ist

‖Tnxj − Tnxk‖ ≥ ‖Txj − Txk‖ − ‖Txj − Tnxj‖ − ‖Txk − Tnxk‖ ≥ ε/3

im Widerspruch zur relativen Kompaktheit von Tn(B1) .

Lemma 1.30 Seien X,Y Banachräume. Dann gilt:

(a) Ist T ∈ B(X,Y ) und dimY <∞, so ist T kompakt.

(b) Die Identität id : X −→ X ist kompakt genau dann, wenn dimX <∞ gilt.

(c) Ist T : X −→ Y kompakt, injektiv und ist ran(T ) unendlichdimensional, so ist ran(T )nicht abgeschlossen.

14

Page 26: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis:Zu (a) T (B1) ist beschränkte Menge in einem endlich-dimensionalen Raum. Nach Bolzano-Weiserstraß hat dort jede Folge eine konvergente Teilfolge.Zu (b) Die Einheitskugel ist relativ kompakt genau dann, wenn dimX <∞ gilt.Zu (c) Annahme: Z := ran(T ) ist abgeschlossen. Dann ist R : X 3 x 7−→ Tx ∈ Z linear, stetig,kompakt und bijektiv. Dann ist R−1 : Y −→ X stetig und daher auch id = R−1 R kompaktund B1 ist kompakt. Dies ist nur möglich, wenn dimX <∞ gilt. Dies ist aber im Widerspruchzu dimX = dimZ = ∞ .

Satz 1.31 Seien X,Y Banachräume und sei T ∈ K(X,Y ) . Dann sind äquivalent:

(a) T ist kompakt.

(b) T ∗ ist kompakt.

Beweis:(a) =⇒ (b) Sei M := T (B1) . M ist mit der durch die Norm induzierte Metrik ein vollständigermetrischer Raum. Sei (λn)n∈N eine Folge in Y ∗ mit ‖λn‖∗ ≤ 1, n ∈ N . Damit betrachten wirdie Folge (fn)n∈N der Einschränkungen von λn auf M . Die Folge ist beschränkt in C(M,K) undwegen

|fn(u)− fn(v)| = |〈λn, u〉 − 〈λn, v〉| = |〈λn, u− v〉| ≤ ‖u− v‖ , u, v ∈M

auch gleichgradig stetig. Nach dem Satz von Arzela-Ascoli (siehe [13]) enthält (fn)n∈N eine kon-vergente Teilfolge. O. E. sei die ganze Folge schon konvergent.Die Folge (T ∗λn)n∈N ist dann wegen

‖T ∗λn − T ∗λm‖ = supx∈B1

|〈T ∗λn − T ∗λm, x〉| = supx∈B1

|〈Tx, λn − λm〉|

≤ supu∈M

|〈u, λn − λm, x〉| = supu∈M

|fn(u)− fm(u)|

eine Cauchyfolge.(b) =⇒ (a) Ist T ∗ kompakt, so ist nach dem eben Bewiesenen T ∗∗ ∈ B(X∗∗, Y ∗∗) kompakt. Mitden kanonischen Einbettungen JX , JY haben wir JY T = T ∗∗ JX ∈ K(X,Y ∗∗) und da JY eineIsometrie ist, ist T ∈ K(X,Y ) .

Lemma 1.32 Seien X,Y Banachräume und sei T : X −→ Y linear. Sei (xn)n∈N eine Folgein X . Dann sind äquivalent:

(a) T ist Norm-stetig: x = limn xn =⇒ Tx = limn Tx

n

(b) T ist Norm-zu-schwach-stetig: x = limn xn =⇒ Tx = w − limn Tx

n

(c) T ist schwach-stetig: x = w − limn xn =⇒ Tx = w − limn Tx

n

Beweis:Zu (a) =⇒ (b), (c) =⇒ (b) sind klar, da die Norm-Konvergenz schon schwache Konvergenzimpliziert.Zu (b) =⇒ (c) Sei µ ∈ Y ∗ beliebig. Dann ist µ T sicherlich in X ′ . Wegen (b) und µ ∈ Y ∗

ist µ T sogar in X∗ . Gilt also x = w − limn xn, so folgt µ Tx = limn µ Txn und somit

〈µ, Tx〉 = limn〈µ, Txn〉 . Da µ ∈ Y ∗ beliebig war, ist gezeigt, dass Tx = w − limn Txn gilt.

Zu (b) =⇒ (a) Wir verwenden den Satz vom abgeschlossenen Graphen; siehe Satz 4.15 in[13]. Gilt limn xn = θ, limn Txn = z, so folgt für beliebiges µ ∈ Y ∗ genau wie in (b) =⇒ (c)µ T ∈ X∗ . Also limn µ T (xn) = 0 und andererseits limn µ T (xn) = limn〈µ, Txn〉 = 〈µ, z〉 .Also gilt, da µ ∈ Y ∗ beliebig ist, z = θ .

15

Page 27: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Bemerkung 1.33 Die mögliche Äquivalenz, die das Lemma 1.32 noch übrig lässt, nämlich(d) T ist schwach-zu-Norm-stetig: x = w − limn x

n =⇒ Tx = limn Txn

trifft nicht zu. Um dies einzusehen, wählt, man X = Y = l2, T := id und als Folge die „Einheits-vektoren“ (en)n∈N . Aus der Besselschen Ungleichung folgt (siehe Folgerung 7.20 in [13]), dassθ = w − limn e

n gilt. Da aber ‖en‖ = 1, n ∈ N, gilt, kann (en)n∈N nicht der Norm nach gegen θkonvergieren.

Folgerung 1.34 Seien X,Y Banachräume und sei T : X −→ Y linear. Dann sind äquivalent:

(a) T ist kompakt.

(b) T ist eigentlich stetig.

Beweis:Zu (a) =⇒ (b) Annahme: Es gibt eine Folge (xn)n∈N, die schwach gegen θ konvergiert, für diemit einem ε > 0 gilt: ‖Txn‖ ≥ ε, n ∈ N . Die schwach konvergente Folge (xn)n∈N ist beschränkt,also Txn|n ∈ N relativ kompakt. Daher existiert eine konvergente Teilfolge (Txnj )j∈N . NachLemma 1.32 konvergiert (Txnj )j∈N schwach gegen θ . Also konvergiert (Txnj )j∈N gegen θ . Diesist ein Widerspruch.Zu (b) =⇒ (a) Klar.

Folgerung 1.35 Sei X ein Hilbertraum und sei Y ein Banachraum und sei T : X −→ Ylinear. Dann sind äquivalent:

(a) T ist kompakt.

(b) Es gibt eine Folge (Tn)n∈N in K(X,Y ) mit dim ran(Tn) <∞, n ∈ N, und limnTn = T .

Beweis:Zu (b) =⇒ (a) Klar nach Lemma 1.29.Zu (a) =⇒ (b) Wähle eine abzählbare Orthonormalbasis B := e1, e2, . . . von ker(T )⊥ unddefiniere Pn ∈ B(X), n ∈ N, durch

Pnx :=

n∑j=1

〈x|ej〉ej , x ∈ X .

Nun setze Tn := TPn, n ∈ N . Dann ist dim ran(Tn) < ∞, n ∈ N . Da das Bild von Tn endlicheDimension hat, ist Tn kompakt.Annahme: Es gibt ε > 0 und eine Folge (xn)n∈N in ker(T )⊥ mit ‖xn‖ = 1 und ‖TPnxn−Txn‖ =‖(Tn − T )xn‖ ≥ ε . Nun gilt für beliebiges k ∈ N

〈Pnxn − xn|ek〉 = 〈xn|Pnek − ek〉 = 0 , n ≥ k .

Es folgt, dass (Pnxn−xn)n∈N schwach gegen θ konvergiert. Da T kompakt ist, folgt dass (TPnxn−Txn)n∈N gegen θ konvergiert. Dies ist ein Widerspruch.

Beispiel 1.36 Sei X := l2 und T : X −→ X die lineare Fortsetzung der Zuordnung ek 7−→1/kek, k ∈ N . Dann ist die lineare Abbildung T kompakt. Dies folgt mit Satz 1.24 aus der Beob-achtung, dass T durch die stetigen Abbildungen

Tn : X −→ X , ek 7−→

Tek k ≤ n

0 sonst, n ∈ N ,

mit endlichdimensionalen Bild approximiert wird.

16

Page 28: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

1.6 Bemerkungen zum Spektrum von Endomorphismen

Lineare Operatoren von einem Banachraum X nach X versteht man sehr gut, wenn man dasInstrument des Spektrums zur Hand hat. Bei linearen Operatoren in endlichdimensionalen Kon-text, die sich dann ja durch Matrizen beschreiben lassen, steht uns dieses Instrument in Formder Eigenwerte zur Verfügung: wir können damit Injektivität, Surjektivität, Diagonalisierbar-keit, Kondition, . . . klären. Eine wichtige Rolle spielt dabei die Wahl des Skalarkörpers (R oderC) und die Eigenschaft „Symmetrie“ der Matrix. Diese Situation finden wir mehr oder minderauch bei stetigen linearen Opertoren in unendlichdimensionalen Räumen vor. Eine Sonderrol-le spielen dabei die kompakten linearen Operatoren, da wir sie durch lineare Operatoren mitendlichdimensionalen Bildräumen approximieren können.

Zunächst zum Spektrum linearer stetiger Operatoren. Sei X ein Banachraum mit Skalarkör-per K . Die Identitätsabbildung idX von X nach X bezeichnen wir hier mit IX oder kurz I . Wirsetzen für T ∈ B(X):

ρ(T ) := λ ∈ K|(λI − T )−1 ∈ B(X)σ(T ) := K\ρ(T )

Die Menge ρ(T ) heißt Resolventenmenge, die Menge σ(T ) Spektrum von T . Auf Grund derKenntnis des Satzes von der stetigen Inversen können wir beide Mengen auch so hinschreiben:

ρ(T ) := λ ∈ K|λI − T injektiv und surjektivσ(T ) := λ ∈ K|λI − T nicht injektiv oder nicht surjektiv

Dementsprechend können wir das Spektrum etwas feiner zerlegen:

σp(T ) := λ ∈ K|λI − T nicht injektivσc(T ) := λ ∈ K|λI − T injektiv, nicht surjektiv, ran(λI − T ) dichtσr(T ) := λ ∈ K|λI − T injektiv, ran(λI − T ) nicht dicht

σp(T ) wird das Punktspektrum, σc(T ) das kontinuierliche Spektrum, σr(T ) das residualeSpektrum von T genannt. Damit wird das Spektrum gemäß

σ(T ) = σp(T ) ∪ σc(T ) ∪ σr(T )

disjunkt zerlegt, möglicherweise auch mit leeren Teilen.

Definition 1.37 Sei X ein Banachraum und sei T : X −→ X linear. Ein x ∈ X heißtEigenvektor mit zugehörigem Eigenwert λ ∈ K, falls gilt:

Tx = λx, x 6= θ .

Das Punktspektrum besteht also aus den Eigenwerten von TEin weiterer Teil des Spektrums ist das approximative Spektrum, in dem die „approxi-

mativen Eigenwerte“ liegen:

σapp(T ) := λ ∈ K| Es gibt (xn)n∈N mit ‖xn‖ = 1, n ∈ N, limn(λI − T )xn = θ

Man kann zeigen, dass gilt:

σp(T ) ∪ σc(T ) ⊂ σapp(T ) ⊂ σ(T ) .

17

Page 29: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Auf der Resolventenmenge ρ(T ) von T ist die Schar der Resolventenabbildungen erklärt:

R(λ, T ) := (λI − T )−1 , λ ∈ ρ(T ) . (1.13)

Die Abbildungρ(T ) 3 λ 7−→ R(λ, T ) ∈ B(X)

wird Resolvente von T genannt. Sie ist im Fall K = C eine analytische, also in eine Potenzreiheentwickelbare, Banachraum-wertige Abbildung. Die Potenzreihenentwicklung ist mit λ0 ∈ ρ(T )gegeben durch

R(λ, T ) =

∞∑n=0

(λ0 − λ)nR(λ0, T )n+1 , λ ∈ ρ(T ), |λ− λ0|‖R(λ0, T )‖ < 1 . (1.14)

Den Beweis dazu erbringt man mit der Neumannschen Reihe (siehe hierzu [13], Satz 7.31). Wirskizzieren dies ad hoc. Wir betrachten dazu

S(λ) := R(λ0, T )I +∞∑n=1

(λ0 − λ)nR(λ0, T )n .

Die darin enthaltene Reihe konvergiert, da |λ−λ0|‖R(λ0, T )‖ < 1 vorausgesetzt ist. Man rechnetleicht nach, dass (λI − T )S(λ) = I gilt. Daraus erhält man nun S(λ) = R(λ, T ) .

Aus dieser Ausage folgt nun die Offenheit der Resolventenmenge und damit die Abgeschlos-senheit des Spektums. In ähnlicher Weise erhält man auch, dass das Spektum in λ ∈ K||λ| ≤‖T‖, genauer noch in λ ∈ K||λ| ≤ r(T ) enthalten, also kompakt ist. Hierbei ist

r(T ) := infn∈N

‖Tn‖1n = lim

n‖Tn‖

1n

der Spektralradius von T .3 Ferner kann man für K = C (mit Hilfe des Satzes von Liouville)zeigen, dass σ(T ) stets nichtleer ist.

Beispiel 1.38 Betrachte auf einer Teilmenge X der Abbildungen auf [0, 1] die Zuordnung Q

f 7−→ Tf mit Tf(t) := tf(t), t ∈ [0, 1] .

• X = B[0, 1] := g : [0, 1] −→ R|g beschränkt als Banachraum mit der Norm ‖g‖∞ :=supt∈[0,1] |g(t)| .Dann ist T : X 3 f 7−→ Qf ∈ X ein linearer stetiger Operator. Wir haben

σ(T ) = [0, 1] = σp(T ) .

• X = L2[0, 1] := g : [0, 1] −→ R|g Lebesgue-quadratintegrabel als Banachraum (Hilbert-raum) mit der üblichen Norm.Dann ist T : X 3 f 7−→ Qf ∈ X ein linearer stetiger Operator. Wir haben

σ(T ) = [0, 1] = σc(T ) .

• X = C[0, 1] := g : [0, 1] −→ R|g stetig als Banachraum mit der üblichen Maximum-norm.Dann ist T : X 3 f 7−→ Qf ∈ X ein linearer stetiger Operator. Wir haben

σ(T ) = [0, 1] = σr(T ) .

3Wir erinnern daran, dass wir den Fall 0-dimensionaler Räume ausschließen wollen.

18

Page 30: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beispiel 1.39 Betrachte auf X := l2 den Shift-Operator

T : l2 3 (x1, x2, . . . ) 7−→ (0, x1, x2, . . . ) ∈ l2 .

T ist offensichtlich linear, stetig, nicht surjektiv. Wir haben:

σ(T ) = λ ∈ K||λ| ≤ 1 , σp(T ) = ∅ , σc(T ) = λ ∈ K||λ| = 1 , σr(T ) = λ ∈ K||λ| < 1 .

Ist T ∗ der zu T adjungierte Operator, so haben wir:

σ(T ∗) = σ(T ) , σp(T∗) = σr(T ) , σc(T

∗) = σc(T ) , σr(T∗) = σp(T ) .

Das Spektrum eines kompakten Operators kann qualitativ und quantitiv sehr genau angege-ben werden; siehe etwa [48, 56, 91]. Eine wesentliche Aussage ist

Satz 1.40 Sei X ein unendlichdimensionaler Banachraum und sei T ∈ K(X) . Dann tritt genaueiner der folgenden Fälle ein:

(a) σ(T ) = 0 .

(b) σ(T ) = 0 ∪ λ1, . . . , λm mit λi 6= 0, i = 1, . . . ,m .

(c) σ(T ) = 0∪λi|i ∈ N mit λi 6= 0, i ∈ N und 0 ist der einzige Häufungspunkt von (λi)i∈N .

Zusatz: Jeder Wert λi ist ein Eigenwert von T .

Die Tatsache, dass in unendlichdimensionalen Räumen bei einem linearen kompakten Ope-rator 0 stets zu seinem Spektrum gehört und fast alle Spektralwerte innerhalb eines Intervalls[−ε, ε](ε > 0 beliebig) liegen, rechtfertigt die Aussage, dass ein kompakter Operator nahe zumNulloperator ist.

Wie beim Studium der Diagonalisierbarkeit von quadratischen Matrizen, ist im Fall K = Rund T 6= T ∗ mit Schwierigkeiten zu rechnen, wenn man den Operator T „diagonalisieren“ will.Man hilft sich dabei mit den singulären Werten von T, also den Eigenwerten von T ∗ T . Wirverweisen etwa auf [11, 55].

Kehren wir nun zurück zu nichtlinearen Abbildungen. Wie sollte ein Spektrum erklärt wer-den? Es ist klar, dass, wann immer man ein Spektrum für nichtlineare Operatoren einzuführenversucht, vernünftigerweise einige „Minimalforderungen“ an dieses Spektrum erfüllt sein sollten.So sollte es im linearen Fall mit dem klassischen Spektrum übereinstimmen und möglichst vielevon dessen analytischen Eigenschaften haben, z. B. kompakt und nichtleer sein. Ausserdem sollteein solches Spektrum nichttriviale Anwendungen haben, d. h. zur Lösung nichtlinearer Problemeführen, die bisher mit anderen Methoden nicht lösbar waren. Leider trifft man bei Einführungeines nichtlinearen Spektrums auf verschiedene unangenehme Phänomene. Im Unterschied zumlinearen Fall enthält jedes der bisher bekannten Spektren eines nichtlinearen Operators nur sehrwenig Information über diesen. Ausserdem hat keines der bisher definierten nichtlinearen Spek-tren alle wichtigen Eigenschaften des linearen Spektrum.

Für einen Überblick von Vorschłägen für ein Spektrum nichtlinearer Abbildungen siehe [6,7, 23, 92]. Hier werden die Versuche, Spektren zu definieren, dokumentiert und gegeneinanderabgewogen. Hier wollen wir über einen Vorschlag in [6] berichten.

19

Page 31: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Seien X,Y Banachräume. Mit Lip0(X,Y ) bezeichen wir den linearen Raum aller Lipschitz-stetigen Operatoren f : X −→ Y mit f(θ) = θ . Mit der Norm

‖f‖Lip0:= sup

u,v∈X,u 6=v

‖f(u)− f(v)‖‖u− v‖

, f ∈ Lip0(X,Y ) . (1.15)

Ist Y = X, so schreiben wir kurz Lip0(X) für Lip0(X,Y ) .Damit ist Lip0(X,Y ) ein Banachraum, der den Raum B(X,Y ) als abgeschlossenen Unterraum

enthält. Dabei ist die Voraussetzung f(θ) = θ für die Definitheit der Norm wichtig. Abkürzendschreiben wir Lip0(X) für Lip0(X,X) . Insbesondere können wir X# := Lip0(X,K) definieren.X# enthält den üblichen Dualraum X∗ als abgeschlossenen Teilraum.

Während man die Dualräume X∗ vieler klassischer Banachräume X sehr gut beschreibenkann, scheint dies für die Räume X# nicht möglich zu sein. Wieviel größer der Raum X# alsder Raum X∗ ist, kann man auch an folgendem sehen: Definieren wir die schwach#-Konvergenzeiner Folge (xn)n∈N in X gegen ein x0 ∈ X dadurch, dass limn f(x

n) = f(x0) ist für allef ∈ X# gelten soll, so ist dies – im Gegensatz zur üblichen schwachen Konvergenz – äquivalentzur starken Konvergenz. In der Tat, die spezielle Wahl f(x) := ‖x − x0‖ − ‖x0‖, x ∈ X, ergibtnämlich limn ‖xn − x0‖ = limn(f(x

n)− f(x0)) = 0 .

Unser Interesse gilt dem Spektrum einer Abbildung f ∈ Lip0(X) . In Anlehnung an die lineareTheorie legt nahe, das Spektrum σ(f) so zu definieren:

σ(f) := σK(f) := λ ∈ K|λI − f bijektiv , f−1 ∈ Lip0(X) .

Die Bezeichnung σK(·) berücksichtigt, dass Kachurovskij (siehe [49] und [6]) erstmals diese Spek-trum eingeführt hat. Für ein T ∈ B(X) gilt dann σK(T ) = σ(T ) , sicherlich eine wünschenswerteEigenschaft. Man kann ferener Zeigen, dass σ(f) stets kompakt ist und in der Kugel B‖f‖Lip0(X)

enthalten ist. Allerdings gilt im Allgemeinen nicht σK(T ) 6= ∅ . Diese Tatsache hat (unter ande-rem) weitere Versuche, ein Spektrum für nichtlineare Abbildungen einzuführen, motiviert. AlsVorbereitung:

Definition 1.41 Seien X,Y Banachräume und sei f ∈ Lip0(X,Y ) . Die Abbildung f# : Y # −→X#, definiert durch

f#(g)(x) = (g f)(x) , x ∈ X, g ∈ Y #, (1.16)

heißt Pseudo-Adjungierte von f .

Diese Definition ist natürlich der Definition der üblichen Adjungierten für lineare Operatorennachempfunden, denn für eine lineare Abbildung T ∈ B(X,Y ) haben wir, dass die Einschrän-kung von T# auf Y ∗ die Abbildung T ∗ ist. Hier sind einige Beobachtungen zu dieser Pseudo-Adjungierten.

• ‖g f‖X# ≤ ‖g‖Lip0‖f‖Lip0

, f ∈ Lip0(X,Y ), g ∈ Y # .

• f# ist nun wohldefiniert.

• f# ist linear und stetig.

• ‖f#‖B(Y #,X#) = ‖f‖Lip0(X,Y ) .

Die letzte Gleichheit wollen wir nun beweisen. Sei 0 < ε < 1 . Wähle u, v ∈ X mit

‖f(u)− f(v)‖ ≥ (1− ε)‖f‖Lip0(X,Y )‖u− v‖ .

20

Page 32: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Nach dem Satz von Hahn-Banach gibt es λ ∈ X∗ mit ‖λ‖∗ ≤ 1 und 〈λ, f(u)− f(v)〉 = ‖f(u)−f(v)‖ . Damit folgt nun

‖f#(λ)(u)− f#(λ)(v)‖ = 〈λ, f(u)− f(v)〉 = ‖f(u)− f(v)‖ ≥ (1− ε)‖f‖Lip0(X,Y )‖u− v‖ .

Daraus folgt ‖f#‖B(Y #,X#) ≥ ‖f‖Lip0(X,Y ) . Die Ungleichung ‖f#‖B(Y #,X#) ≤ ‖f‖Lip0(X,Y ) ha-ben wir oben aufgeführt.

Die Eigenschaft, dass f# eine lineare und stetige Abbildung ist, verwendet man nun, um dasSpektrum einer nichtlinearen Abbildung zu erklären.

Definition 1.42 Sei X ein Banachraum und sei f ∈ Lip0(X) . Das Spektrum von f ist erklärtdurch

σ(f) := σA(f) := λ ∈ K|λI − f# ist nicht injektiv oder nicht surjektiv (1.17)

Das Spektrum σ(f) ist stets kompakt und nichtleer, da dies für σ(f#) gilt. Allerdings ist dasSpektrum σA(T ) für eine lineare Abbildung T ∈ Lip0(X) im Allgemeinen nicht identisch mitdem herkömmlichen Spektrum. Man hätte auch erwartet, das Spektrum so zu definieren:

σ(f) := K\ρK(f) mit ρK(f) := λ ∈ K|λI − f ∈ Lip0(X), (λI − f)−1 ∈ Lip0(X) .

Damit wäre aber nichts gewonnen, da dann σ(f) = σK(f) gilt; siehe [6].

Beispiel 1.43 Betrachte auf X := R die Abbildung f : R 3 x 7−→ −x ∈ X . f ist linear undstetig und daher gilt σ(f) = σK(f) = −1, denn λ = −1 ist der einzige Eigenwert von f . Fernergilt −1 ∈ σA(f), denn für g : x 7−→ x haben wir f#(g) = −g und λ = −1 ist ein Eigenwert vonf# . Darüberhinaus gilt auch 1 ∈ σA(f), denn für g : x 7−→ |x| haben wir f#(g) = g, d.h. 1 istEigenwert von f# . Wegen f# f# = I kann es keine weiteren Spektralwerte geben. Also habenwir σ(f) = σK(f) ⊂ σK(f) = ±1 .

Eigenwerte und singuläre Werte kann man auch für nichtlineare Abbildungen einführen; sieheetwa [7, 38, 92].

1.7 Fredholm-Abbildungen

Fredholm-Operatoren sind in gewisser Weise das Gegenstück zu kompakten Operatoren: wäh-rend die kompakten Operatoren bis auf endlich viele Komponenten nahe der Null sind, sinddie Fredholm-Operatoren im Wesentlichen nahe der Identität. Wir betrachten zunächst lineareOperatoren.

Die Beschäftigung mit den Fredholm-Operatoren ist motiviert durch die Frage nach der Lös-barkeit von Gleichungen. Aus der Linearen Algebra wissen wir, dass bei endlichdimensionalenHilberträumen X,Y und einer linearen Abbildung L folgende Darstellungen gelten:

X = ker(L)⊕ ran(L∗) , Y = ker(L∗)⊕ ran(L) . (1.18)

Daraus folgt die Fredholm-Alternative in dieser Situation:

Satz 1.44 (Fredholm-Alternative) Seien X,Y endlichdimensionale Hilberträume und sei L :X −→ Y linear. Dann gilt: Entweder besitzt die Gleichung Lx = y für jedes y ∈ Y eine Lösungx ∈ X oder die homogene adjungierte Gleichung L∗u = θ hat eine nichttriviale Lösung.

21

Page 33: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Die Voraussetzung „X,Y endlichdimensionale Hilberträume“ ist im Wesentlichen nur eineUmschreibung der konkreten Situation X = Kn, Y = Km, versehen mit den üblichen Skalarpro-dukten.

Im unendlichdimensionalen Kontext ist die Sachlage nicht ganz so einfach. Die direkte Über-tragung scheitert maßgeblich schon an der Schwierigkeit, Komplemente von nicht abgeschlossenenTeilräumen (etwa von ran(L), ran(L∗)) zur Hand zu haben.

Definition 1.45 Seien X,Y normierte Räume. Ein Operator T ∈ B(X,Y ) heißt Fredholm-Operator, falls gilt:

(a) ran(T ) ist abgeschlossen.

(b) dim(ker(T )) <∞, codim(T ) := dim(coker(T )) <∞, wobei coker(T ) := Y/ran(T )) .

Die ganze Zahl ind(T ) := dim(ker(T ))−dim(coker(T )) heißt der Index des Fredholm-OperatorsT . Wir fassen die Fredholm-Operatoren von X nach Y zusammen in F(X,Y ) .

Die Bedingung (a) grenzt die Fredholmoperatoren schon von den kompakten Operatoren ab;vergleiche mit 1.30. Die zweite Bedingung in (b) besagt, dass es eine Zerlegung Y = V ⊕ ran(T )gibt mit endlichdimensionalem Teilraum V . Beachte, dass sich die Forderung (a) schon aus derForderung dim(coker(T )) <∞ in (b) ergibt; wir verzichten auf den Beweis.

Satz 1.46 Seien X,Y, Z Banachräume. Dann gilt:

(a) Sind T ∈ B(X,Y ), R ∈ B(Y, Z), und sind zwei der Operatoren T,R,R T Fredholm-Operatoren, dann ist es auch der dritte und es gilt ind(R T ) = ind(T ) + ind(R) .

(b) Ist T ein Fredholm-Operator, so ist es auch T ∗ und es gilt ind(T ∗) = −ind(T ) .

(c) F(X,Y ) ist eine offene Teilmenge von B(X,Y ) und die Abbildung ind : F(X,Y ) −→ Zist lokal konstant.

Beweis:Zu (a) Dies ist ein rein algebraisches Resultat. Wir zeigen den Fall, dass T,R Fredholm-Operatorensind. Also haben wir zu zeigen, dass R T ein Fredholm-Operator ist. Wir schreiben die kurzeexakte Sequenz4

θ −→ ker(T ) −→ ker(R T ) T−→ ran(T ) ∩ ker(R) R−→ θ

und unterstellen dabei die Vertrautheit mit diesem algebraischen Konzept. Daraus liest man ab,dass ker(R T ) endlichdimensional ist und

dim(ker(R T )) = dim(ker(T )) + dim(ker(R))

gilt. Betrachte nun die exakte Sequenz

θ −→ ran(T ) + ker(R)/ran(T ) −→ Y/ran(T ) R−→ Z/ran(R T ) −→ Z/ran(R) −→ θ

Daraus schließen wir, dass codim(R T ) endlich ist und dass

codim(R T ) = codim(R) codim(T )− dim(ker(R)) + dim(ker(R) ∩ ran(T ))4Eine Sequenz X ′ −→ X −→ X ′′ bedeutet: ran(X ′ −→ X) = ker(X −→ X ′′) . Etwa impliziert

θ −→ X ′ −→ X ker(X ′ −→ X) = θ, d.h. dass X ′ −→ X injektiv ist.

22

Page 34: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

gilt. Daraus folgt das Resultat.Zu (b) Dies ist klar.Zu (c) Sei T ∈ F(X,Y ) . Wir wählen ein Komplement U von ker(T ) und V von ran(T ) . Diesist möglich, da ker(T ) endlichdimensional ist und da ran(T ) abgeschlossen ist mit endlicherKodimension. Sei j : U −→ X die kanonische Einbettung und sei π : Y −→ ran(T ) diekanonische Projektion. Da π T j ein Isomorphismus ist, existiert ein ε > 0, so dass für alle Rmit ‖R−T‖ < ε auch πRj ein Isomorphismus ist. Klar, πRj ist dann ein Fredholm-Operatormit Index 0. Wir wissen, dass π ein Fredholm-Operator mit Index −dim(ker(T )) ist. Ferner, jist ein Fredholm-Operator mit Index dim(coker(T )) . Wegen (a) muss R ein Fredholm-Operatorsein und es gilt

0 = ind(R0) = − dim(ker(T )) + ind(R) + dim(coker(T ) .

Also ist jedes R ∈ B mit ‖R− T‖ < ε ein Fredholm-Operator mit Index ind(T ) .

Die nächsten Resulate, welche fundamental sind, geben wir ohne Beweis an; sie gehören zumKernstoff der linearen Funktionalanalysis.

Satz 1.47 Sei X ein Banachraum und sei K ∈ K(X) . Dann ist R := id −K ∈ F(X) und esgilt ind(R) = 0 .

Beweis:Siehe [3].

Satz 1.48 (Fredholmalternative) Sei X ein Banachraum und sei K ∈ K(X) . Dann sindäquvalent:

(a) id −K ist injektiv.

(b) id −K ist surjektiv.

(c) id −K ist bijektiv.

Beweis:Siehe [3].

Vergleiche dieses Resultat mit der Aussage über das Spektrum kompakter Operatoren in 1.40.

Satz 1.49 Seien X,Y Banachräume und sei T ∈ F(X,Y ) und sei K ∈ K(X,Y ) . Dann istR := T +K ∈ F(X,Y ) und es gilt ind(R) = ind(T ) .

Beweis:Siehe [3].

Um einen Eindruck zu vermitteln, wie die Schlussweisen bei den Beweisen sind, sei hier einvorbereitendes Teilresultat bewiesen.

Lemma 1.50 Sei X ein Banachraum, sei K ∈ K(X) und sei R := id−K . Dann ist ran(R) einabgeschlossener Teilraum von X .

Beweis:Sei U := ker(R) . Dann ist U ein abgeschlossener Teilraum von X und Tx = x, x ∈ U . Damit istauf U die Identität kompakt. Also muss dimU <∞ gelten.

23

Page 35: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Da U endlichdimensional ist, gibt es einen abgeschlossenen Teilraum V von X mit U ⊕ V = X .Sei y ∈ ran(R) . Dann gibt es eine Folge (xn)n∈N in V mit

limnxn −Kxn = lim

nRxn = y .

Wir zeigen, dass diese Folge beschränkt ist.Annahme: Diese Folge ist nicht beschränkt. Dann gilt (o. E. nach Umnummerierung) limn ‖xn‖ =∞ . Sei un := ‖xn‖−1xn, n ∈ N . Dann gilt

limnun −Kun = θ .

Da K kompakt ist, gibt es eine Teilfolge von (unk)k∈N, so dass u = limkKunk existiert. Dann

folgt u = limk unk . Somit ist ‖u‖ = 1 und Ku = u, d. h. Ru = θ . Da u ∈ V und ‖u‖ = 1 ist,

haben wir einen Widerspruch zur Zerlegung ker(R)⊕ V = X .Damit ist bewiesen, dass (xn)n∈N beschränkt ist. Da K kompakt ist, existiert eine Teilfolge(xnk)k∈N, so dass (Kxnk)k∈N konvergiert. Da y = limk x

nk−Kxnk gilt, konvergiert auch (xnk)k∈N ;x := limk x

nk . Dann ist Rx = x−Kx = y, also y ∈ ran(R) .

Definition 1.51 Seien X,Y Banachräume, sei U ⊂ X offen und zusammenhängend. Eine Ab-bildung f : U −→ X heißt Fredholm-Abbildung, falls f stetig Fréchet-differenzierbar ist unddie Fréchet-Ableitung Df(x) ein Fredholm-Operator ist. Wir definieren den den Index von fdurch

inf(f) := ind(Df(x)) für ein x ∈ U . (1.19)

Die Definition des Index in (1.19) ist natürlich erklärungsbedürftig: da der Index einer Abbildungganzzahlig ist, muss ind(Df(x)) in der zusammenhängenden Menge U konstant sein.

Satz 1.52 Seien X,Y Banachräume, sei U ⊂ X offen und zusammenhängend und seien f, g :U −→ Y Fréchet-differenzierbar. Ist f eine Fredholm-Abbildung und g kompakt, so ist f − gFredholm-Abbildung.

Beweis:Dies ist eine Konsequenz aus Lemma 1.30 und Satz 1.47.

Beispiel 1.53 Sei X ein Banachraum.Ist f : X −→ X eine Frechet-differenzierbare Abbildung und ist dimX < ∞, so ist f eine

Fredholm-Abbildung.Ist f : X −→ X ein Diffeomorphismus, so ist f eine Fredholm-Abbildung.

Wozu dient das Studium nichtlinearer Fredholm-Operatoren? Natürlich parallel zum linearenFall zur Klärung der Lösungsvielfalt einer nichtlinearen Gleichung

f(x) = y (1.20)

wenn y ∈ Y variiert. Dabei sind X,Y Banachräume und f : X −→ Y . Die Anwendungensind überwiegend bei nichtlinearen Randwertaufgaben gewöhnlicher und partieller Differential-gleichungen angesiedelt; siehe etwa [17]. Drei Ingredienzien sind dabei von Bedeutung:

• Fredholm-Eigenschaft

• Eigentlich-Eigenschaft (properness)

• Singuläre Punkte

24

Page 36: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Definition 1.54 Seien X,Y Banachräume. Eine Abbildung f : X −→ Y heißt eigentlich,

falls−1f (K) kompakt in X ist für alle kompakten Mengen K ⊂ Y .

Definition 1.55 Seien X,Y Banachräume, sei U ⊂ X offen und sei f : U −→ Y Freéchet-differenzierbar in x ∈ U . x heißt singulärer Punkt und f(x) singulärer Wert, falls Df(x)nicht surjektiv ist.

Satz 1.56 (Struktur-Alternative) Seien X,Y Banachräume und sei die Abbildung f : X −→Y Fredholm-Abbildung mit Index p ≥ 0, Fréchet-differenzierbar und eigentlich. Sei S := y ∈Y |y singulärer Wert . Dann ist die Lösungsmenge der Gleichung f(x) = y leer oder homöomorphzu einer p-dimensionalen Mannigfaltigkeit für jede Zusammenhangskomponente von Y \S .

Der Beweis zu diesem Strukturtheorem kann gefunden werden in [17].

Anwendungen für nichtlineare Fredholm-Abbildungen sind zu finden im Bereich der Rand-wertaufgaben für gewöhnliche und partielle Differentialgleichungen. Siehe etwa [18, 19, 32].

1.8 Anhang: (Nichtlineare) Gleichungen: Gutgestelltheit

Betrachte die Gleichungf(x) = y (1.21)

mit einer Abbildung f : U −→ Y wobei U ⊂ X mit Banachräumen X,Y . Was bedeutet dieForderung nach der Gutgestelltheit dieser Gleichung? Offenbar ist dies der Fall, wenn folgendedrei Bedingungen erfüllt sind:

• f ist injektiv

• f ist surjektiv

• f ist offen

Im linearen Fall eines stetigen linearen Operators T := f : X −→ Y,X, Y Banachräume, reichtdafür, wie wir wissen, nach dem Satz von der offenen Abbildung die Bijektivität von T aus. Beieiner nichtlinearen Abbildung ist die Situation nicht ganz so einfach.

Die dritte Bedingung der Offenheit der Abbildung f haben wir schon betrachtet. Als Ste-tigkeitsbedingung für die Umkehrabildung von f haben wir noch einen anderen Zugang dazu,nämlich über den Satz der stetigen Inversen.

Das Hauptaugenmerk liegt auf der stetigen Abhängigkeit der Lösung von (1.21). Es liegtin der Natur der nichtlinearen Gleichungen, dass man im Gegensatz zu linearen Aufgaben imAllgemeinen mit lokalen Aussagen zufrieden sein muss.

Definition 1.57 Seien X,Y Banachräume, sei U ⊂ X offen und sei f : U −→ Y . Dann heißtdie Gleichung (1.21) lokal schlechtgestellt in x ∈ U, falls es zu jedem r > 0 eine Folge (xn)n∈Nin Br(x) ∩ U gibt, so dass limn f(x

n) = f(x) aber nicht limn xn = x gilt. Anderenfalls heißt die

Gleichung (1.21) lokal gutgestellt in x ∈ U.

Im linearen Fall tritt Schlechtgestelltheit bei der Invertierung kompakter Operatoren auf, dadie Inverse eines kompakten Operators mit unendlichdimensionalem Bild nicht stetig sein kannauf Grund der Tatsache, dass das Bild nicht abgeschlossen ist; siehe 1.30. Ein ähnliches Resultatgilt auch hier. Dies ist nicht so überraschend, da Konvergenz einer Bildteilfolge schon eintritt,wenn die Urbildfolge beschränkt ist.

25

Page 37: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Definition 1.58 Seien X,Y Banachräume, sei U ⊂ X offen und sei f : U −→ Y . f heißtschwach folgenabgeschlossen, wenn der Graph schwach abgeschlossen ist, d. h. wenn für jedeFolge (xn)n∈N in U aus x = w − limn x

n, y = w − limn f(xn) folgt: x ∈ U, f(x) = y .

Lemma 1.59 Seien X,Y Banachräume, sei U ⊂ X offen und sei f : U −→ Y vollstetigund schwach folgenabgeschlossen. Ist (xn)n∈N eine Folge in U mit x = limn x

n . Dann gilt: x ∈U, f(x) = limn f(x

n) .

Beweis:Sei (xn)n∈N eine Folge in U mit x = limn x

n . Dann ist diese Folge beschränkt und daher kon-vergiert eine Teilfolge von jeder Teilfolge von (f(xn)n∈N gegen ein y . Da f schwach folgenabge-schlossen ist, ist x ∈ U und y = f(x) . Daraus folgt f(x) = limn f(x

n) .

Satz 1.60 Seien X,Y reflexive Banachräume, sei dimX = ∞, sei U ⊂ X offen und sei f :U −→ Y vollstetig und schwach folgenabgeschlossen. Dann ist (die zugehörige) Gleichung(1.21) lokal schlechtgestellt in jedem x ∈ U .

Beweis:Da X unendlichdimensional ist, existiert ein Orthonormalsystem (en)n∈N in X, . Aus der Bessel-schen Ungleichung folgt die schwache Konvergenz der Folge (en)n∈N . Wähle nun r > 0 so klein,dass xn := x+ ren ∈ U für alle n ∈ N . Dann gilt nach Lemma 1.59

limnf(xn) = f(x) aber lim

n‖xn − x‖ = r 6= 0 .

1.9 Anhang: Bemerkung zum Abbildungsgrad

Ein guter Teil der (Funktional-)Analysis besteht in der Suche von Nullstellen bzw. von Fixpunk-ten, wobei anzumerken ist, dass beide Aufgaben ineinander umgeschrieben werden können. DerFixpunktsuche widmen wir das nächste Kapitel.

Nullstellensätze und Algorithmen zur Berechnung von Nullstellen in der reellen und komple-xen Analysis sind ein zentrales Thema, da viele Fragestellungen damit verzahnt sind. Funktional-analytische Mittel bei der Nullstellensuche oder äquivalent dazu, bei der Lösung von Gleichungen,werden hauptsächlich zur Lösung von gewöhnlichen und partiellen Differentialgleichungen einge-setzt. Insbesondere im Bereich der partiellen Differentialgleichungen sind tiefliegende Hilfsmittelaus der Funktionalanalysis einzubringen: Passende Funktionenräume, a priori-Abschätzungen,Regularitätsuntersuchungen, Approximationstechniken.

Der Abbildungsgrad ist ein ein topologisch motiviertes Hilfsmittel der nichtlinearen Funktio-nalanalysis. Er steht im Kontext der Fixpunktsätze von Brouwer, Kakutani und Schauder undist damit auch hilfreich bei den klassischen Sätzen von Borsuk, vom gekämmten Igel und vomallgemeinen Jordanschen Kurvensatz. Wir verzichten hier auf die Darstellung des Abbildungs-grades. Um eine Orientierung zu gewinnen, eine kurze Einordnung in bekannte Tatsachen derreellen und komplexen Analysis.

In der Analysis der Funktionen einer reellen Veränderlichen hat man als den zentralen Satzden Zwischenwertsatz kennengelernt: Ist f : [a, b] −→ R stetig und gilt f(a)f(b) < 0, so hat fim offenen Intervall (a, b) eine Nullstelle. Trotz seiner Einfachheit ist dieses Resultat in mancherHinsicht für das Folgende typisch: es ist ein Satz über stetige Funktionen und damit aus demtopologischen Kontext, es werden keine Aussagen über Eindeutigkeit oder Anzahlen gemacht,und die Aussage ist gegenüber kleinen Änderungen von f stabil. Zwar können auch Funktionen

26

Page 38: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

mit f(a)f(b) > 0 Nullstellen in (a, b) haben, aber diese können auch bei kleinen Änderungen vonf verschwinden, und ohne dass man dieses an den Randwerten von f in a und b bemerkt.

Einen noch deutlicheren Hinweis gibt die Funktionentheorie. Sei Ω ⊂ C offen, BR(z0) ⊂ Ω

und sei f : Ω −→ C holomorph mit f|∂BR(z0) = 0. Dann ist die Windungszahl oder derAbbildungsgrad von f

deg(f,BR(z0), 0) := N(f) =

1

2πi

∫|z|=R

f ′(z)

f(z)dz

gemäß dem Residuensatz gleich der Gesamtzahl der mit Vielfachheiten gezählten Nullstellen vonf in BR(z

0). Diese Zahl hängt stetig und nur von f|∂BR(z0) ab (Satz von Rouché).Man kann sich nun von der Voraussetzung, dass f holomorph ist, trennen (Abbildungsgrad

für Funktionen f : C −→ C) und dann erkennen, auf welche Weise man diesen auf Abbildungenf : Rn −→ Rn ausdehnen kann. Diese Entwicklung lässt dann einen Beweis des BrouwerschenFixpunktsatzes und im Gefolge den Beweis des Schauderschen Fixpunktsatzes zu. Mit diesenIdeen lässt sich dann der Abbildungsgrad auf unendlichdimensionale Banachräume übertragen.Die zwei fundamentalen Eigenschaften des Abbildungsgrades sind die Invarianz unter einer Ho-motopie und die Ganzzahligkeit.

1.10 Übungen

1.) Sei X der Banachraum c0 der Nullfolgen, versehen mit der Supremumsnorm ‖·‖∞ . Zeige:A ⊂ X ist relativ kompakt, falls die Nullkonvergenz der Elemente in A gleichmäßig ist.

2.) Zeige: f : C[0, 1] 3 x 7−→∫ 10 sin(x(t))dt ist Fréchet-differenzierbar. Berechne Df(x), x ∈

C[0, 1] . (C[0, 1] ist zusammen mit der Maximumnorm ein Banachraum)

3.) Seien X,Y Banachräume, sei H(X,Y ) := T ∈ B(X,Y )|T bijektiv . Zeige:

(a) Ist T ∈ H(X,Y ), dann ist T−1 ∈ H(Y,X) .

(b) H(X,Y ) ist offen in B(X,Y ) .

(c) f : H(X,Y ) 3 T 7−→ T−1 ∈ B(Y,X) ist Fréchet-differenzierbar.

4.) Seien X,Y, Z,W Banachräume, sei U ⊂ X offen, seien f : U −→ Y, g : U −→Z Fréchet-differenzierbar und sei B : Y × Z −→ W eine Abbildung mit folgendenEigenschaften:

B linear in jedem Argument, ∃c > 0∀y ∈ Y, z ∈ Z(‖B(y, z)‖ ≤ c‖y‖‖z‖)

Dann ist h : U 3 x 7−→ B(f(x), g(x)) ∈W Fréchet-differenzierbar und es gilt

Dh(x)v = B(Df(x)v, g(x)) +B(f(x), Dg(x)v) , x ∈ U, v ∈ Y .

5.) Seien X,Y Hilberträume und sei T : X −→ Y linear und kompakt. Zeige: ker⊥, ran(T )sind separabel.

6.) Seien X,Y Banachräume und sei T : X −→ Y linear und stetig. Zeige: ran(T ) istabgeschlossen genau dann, wenn es c > 0 gibt mit dist(x, ker(T )) ≤ c‖Tx‖, x ∈ X .

7.) Seien X,Y Banachräume und sei T : X −→ X linear und stetig. Zeige:

(a) Ist Tn kompakt, so ist id − T ein Fredholmoperator.(b) Ist Tn − id kompakt, so ist T ein Fredholmoperator.

8.) Seien X,Y Banachräume und sei T : X −→ Y linear und kompakt. Zeige: T ∗ istkompakt.

27

Page 39: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

9.) Betrachte die Abbildung

f : c0 −→ c0 , (x1, x2, x3, . . . ) 7−→ (x1, (x2)2, (x3)3, . . . ) .

Zeige: f ist stetig.

10.) Betrachte den Differentialoperator T : Cn[0, 1] −→ C[0, 1], definiert durch

Tx(t) := x(n)(t) +

n−1∑j=0

aj(t)x(j)(t)

mit a0, . . . , an−1 ∈ C[0, 1] . Dabei ist Ck[0, 1] der Raum der k-mal stetig differenzierba-ren Funktionen, versehen mit der Norm ‖x‖k,∞ := (‖x‖∞ + ‖x(k)‖∞) . Zeige, T ist einFredholmoperator, und berechne ind(T ) .

11.) Zeige: Die Abbildung f : R −→ c0, f(t) := ( sin(t)1 , sin(2t)2 , sin(3t)3 , . . . ), t ∈ R, ist nirgendsFréchet-differenzierbar.

12.) Betrachte den Hilbertraum l2 und darin die Orthonormalbasis (en)n∈N (en = (δnj)j∈N).Wir setzen fi(x) := max(14 − ‖x− ei‖, 0), i ∈ N, und f(x) :=

∑∞i=1 ifi(x), x ∈ l2 . Zeige:

(a) f ist stetig.(b) f(B1) ist unbeschränkt.

13.) Sind X,Y endlichdimensionale normierte Räume und ist T ∈ B(X,Y ), so gilt ind(T ) =dimX − dimY .

14.) Betrachte den Operator T : l2 −→ l2, T ((xk)k∈N) := (xk+1)k∈N . Berechne ker(Tn),

codim(Tn), n ∈ N .

15.) Sei X der Banachraum c0 der Nullfolgen, versehen mit der Supremumsnorm ‖ · ‖∞ .Betrachte die Abbildung f : c0 −→ c0, (x

k)k∈N 7−→ (sin(xk)2)k∈N . Zeige:

(a) f ist wohldefiniert und stetig(b) f ist Fréchet-differenzierbar.(c) Df(x) ist kompakt für alle x ∈ c0 .

(d) f(B1) ist nicht relativ kompakt.

16.) SeiX ein reflexiver Banachraum, sei Y ein Banachraum, sei U ⊂ X und sei f : U −→ Y .SeiM ⊂ U beschränkt und schwach folgenabgeschlossen, d. h. aus x = w−limn x

n, x, xn ∈M,n ∈ N, folgt f(x) = w − limn f(x

n) . Dann ist f(M) beschränkt.

17.) Sei X := l2 mit der Schauderbasis (en)n∈N . Setze

fi(x) := max(0,1

4− ‖x− ei‖), i ∈ N , f(x) :=

∞∑i=1

ifi(x) , x ∈ X .

Zeige: f(B1) ist unbeschränkt.

18.) Seien X,Y Banachräume, sei U ⊂ X und sei f : U −→ Y . Ist M ⊂ U beschränkt undist f|M gleichmäßig stetig, dann ist f(M) beschränkt.

19.) Sei X := C[0, 1] versehen mit der Maximumsnorm und sei U := x ∈ C[0, 1]||x(t)| >0 für alle t ∈ [0, 1] . Untersuche die Abbildung f : U 3 x 7−→ 1/x ∈ C[0, 1] aufDifferenzierbarkeit.

20.) Bestimme das Minimum des Funktionals f(x) :=∫ 10 (x(t)

4 + etx(t))dt auf dem RaumC[0, 1], versehen mit der Maximumsnorm.

28

Page 40: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

21.) Seien X,Y Banachräume und sei f : X −→ Y . f heißt quasibeschränkt, falls gilt:es gibt c ≥ 0, R ≥ 0, mit ‖f(x)‖ ≤ c‖x‖, x ∈ X\BR . Ist f quasibeschränkt, dann setzen

wir ‖|f |‖ := lim‖x‖→∞‖f(x)‖‖x‖ .

(a) Sie f ∈ B(X,Y ), dann ist f quasibeschränkt genau dann, wenn f beschränkt ist.(b) Sei X := C[0, 1], versehen mit der Maximumsnorm, und sei f : X −→ X definiert

durch

f(x)(t) :=

∫ 1

0(t− s)2 sin(x(s))ds , t ∈ [0, 1], x ∈ X .

Berechne ‖|f |‖ .

22.) Sei f : [0, 1]×R −→ R . Damit betrachten wir folgende Zuordnung F auf X := C[0, 1],versehen mit der Maximumsnorm:

F (x)(t) := f(t, x(t)), t ∈ [0, 1], x ∈ X .

Zeige:

(a) Ist f stetig, so ist F eine Abbildung von X nach X. (Eine solche Abbildung wirdNemytskij-Operator genannt.)

(b) Ist f stetig, dann ist F stetig und beschränkt.

23.) Seien X,Y Banachräume, sei x0 ∈ X, f : Br(x0) −→ Y, T ∈ B(X,Y ), 0 ≤ ρ < 1 . Es

gelte: T ist bijektiv und

‖T−1f(x2)− T−1f(x1)− (x2 − x1)‖ ≤ ρ‖x2 − x1‖ , x1, x2 ∈ Br(x0) .

Zeige:

(a) (1−ρ)‖T−1‖−1‖x2−x1‖ ≤ ‖f(x2)−f(x1)‖ ≤ ‖T‖(1+ρ)‖x2−x1‖ , x1, x2 ∈ Br(x0) .

(b) f ist injektiv.

24.) Sei X ein Hilbertraum mit Orthonormalbasis (en)n∈N. Betrachte den linearen OperatorS, der auf der Orthonormalbasis folgendermaßen operiert:

ek 7−→ 1

k + 1ek+1 , k ∈ N .

Zeige:

(a) S ist stetig, ‖S‖ = 1, S 6= S∗ .

(b) S ist injektiv, nicht surjektiv(c) 0 ∈ σ(S), 0 /∈ σp(S) .

25.) Betrachte auf dem Banachraum X := l2 den linearen Operator

X 3 x = (xk)k∈N 7−→ Tx ∈ l2, (Tx)1. = 0, (Tx)k+1 :=

1

kxk, k ∈ N .

Zeige:

(a) T ist stetig, ‖T‖ = 1 .

(b) σ(T ) = 0, σp(T ) = ∅ .

26.) Seien X,Y Banachräume und sei T ∈ B(X,Y ) . vollstetig. Zeige:

(a) Ist T kompakt, dann ist T eigentlich stetig.

29

Page 41: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

(b) Ist X reflexiv und ist T eigentlich stetig, dann ist T kompakt.

27.) Betrachte den Banachraum X := l2 und dazu die Abbildung

T : X ×X 3 (u, v) 7−→ (θ, u) ∈ X ×X .

(a) Zeige: T ∈ B(X ×X) .

(b) Bestimme ker(T ) und ker(T T ) .(c) Zeige: T ist nicht kompakt.

28.) Sei (en)n∈ ein Orthonormalsystem im HilbertraumX mit Skalarprodukt 〈·|·〉 . Sei (αn)n∈Neine beschränkte Folge in C und betrachte damit die Zuordnung T mit

x 7−→∞∑j=1

αj〈x|ej〉en , x ∈ X .

Zeige:

(a) T ist linear und stetig mit ‖T‖ = supn |αn| .(b) T ist kompakt, falls limn αn = 0 .

(c) ‖Ten − Tem‖ = |αn|2 + |αn|2 , m, n ∈ N .(d) T ist nicht kompakt, falls limn αn 6= 0 .

29.) Sei X ein Hilbertraum und seit T ∈ B(X) . Zeige: T ∗ T ist kompakt genau dann, wennT kompakt ist.

30.) Sei X ein Hilbertraum mit Skalarprodukt 〈·|·〉 und seit T ∈ K(X) . Zeige: Ist (en)n∈N einOrthonormalsystem, dann gilt limn Te

n = θ . (Hinweis: limn〈en|T ∗z〉 = 0 für alle z ∈ X .)

31.) Sei X ein Hilbertraum mit Skalarprodukt 〈·|·〉 und seit (Tn)n∈ eine beschränkte Folge inB(X) . Es gelte: limn〈Tnu|v〉 = 0 für alle u, v ∈ X . Zeige für jeden Operator S ∈ K(X)gilt

limn

‖S Tn S‖ = 0 .

32.) Betrachte für f ∈ Lip0(X,Y ) die Abbildung f# : Y # −→ X# . Zeige: Ist f# injektiv,so ist ran(f) dicht in Y .

33.) Betrachte für f ∈ Lip0(X,Y ) die Abbildung f# : Y # −→ X# . Zeige: Ist f# surjektiv,so ist f injektiv und die Inverse f−1 : ran(f) −→ X ist lipschitzstetig.

34.) Zeige: f ist in g ∈ Lip0|g bijektiv, g−1 ∈ Lip0(Y,X) genau dann, wenn f# : Y # −→X# bijektiv und stetig ist.Zusatz: Ist f# bijektiv und stetig, dann haben wir (f#)−1 = (f−1)# .Hinweis: Nutze die beiden vorhergehenden Übungsaufgaben.

35.) Betrachte die Abbildung f : C2 3 (z, w) 7−→ (w, iz) ∈ C2 . Zeige σK(f) = ∅ undberechne σA(f) .

36.) Sei X := Kn, Y := Km, L : X −→ Y linear. Zeige: L ist Fredholm-Operator mitind(L) = n−m.

37.) Sei X := C[−1, 1], versehen mit der Maximumsnorm. Betrachte den Operator

T : X −→ X , Tx(t) :=

∫ 1

−1x(s)ds , t ∈ [−1, 1], x ∈ C[−1, 1] .

(a) Ist T (B1) abgeschlossen?

30

Page 42: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

(b) Ist T ein Fredholm-Operator?

38.) Seien X,Y, Z Banachräume mit Normen ‖ · ‖X , ‖ · ‖Y bzw. ‖ · ‖Z . Seien T : X −→ Y, J :Y −→ Z linear und stetig und sei T kompakt und J injektiv. Zeige: Für alle ε > 0 gibtes eine Konstante c ≥ 0 mit

‖Tx‖Y ≤ ε‖x‖X + c‖(J T )(x)‖Z , x ∈ X .

39.) Betrachte die Matrizen

A :=

(1 00 0

), Aε :=

(1 00 ε

)(ε > 0)

als lineare Abbildungen von R2 nach R2 .Berechne die Operatornorm von A − Aε, dim(ker(A)), dim(ker(Aε)), dim(coker(A)),dim(coker(Aε)) und ind(A), ind(Aε) .

40.) Seien X,Y Banachräume und sei T ∈ B(X,Y ),K ∈ K(X,Y ) . Sei c > 0 eine Konstante,so dass gilt:

‖x‖ ≤ c(‖Tx‖+ ‖Kx‖) , x ∈ X .

Zeige: dim ker(T ) <∞, ran(T ) ist abgeschlossen.

31

Page 43: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Kapitel 2

Gleichungen und Fixpunkte

Ich kann die Bewegungen der Himmelskörperberechnen, aber nicht die Verrücktheit der Menschen

Isaac Newton

Fixpunkttheorie liegt an der Grenzlinie zwischen nichtlinearer Funktionalanalysis und geome-trischen Methoden der Topologie. Sie hat als Ecksteine folgende drei Fixpunktsätze: Banachscher,Brouwerscher und Schauderscher Fixpunktsatz. Wir konzentrieren uns auf die analytischen An-sätze, die diesen Sätzen zugrundeliegen, und skizzieren kurz die Ergebnisse um den BrouwerschenFixpunktsatz; im Anhang schreiben wir einen Beweis auf.

Zum Brouwerschen Fixpunkt gibt es einige „verwandte“ Sätze, die bei Anwendungen in end-lichdimensionalen Räumen von Interesse sind. Für die Anwendungen im Bereich der Differenti-algleichungen im unendlichdimensionalen Kontext ist vor allem der Schaudersche Fixpunktsatzrelevant. Detailierte Darstellungen der Fixpunkttheorie stellen etwa [1, 28, 40, 46] dar.

Weitere Themen, die wir aber übergehen (müssen), sind „Abbildungsgrad (siehe etwa [1, 47,73]), normale Auflösbarkeit (siehe etwa [27, 67, 68, 90]), Fixpunktsätze in geordneten Mengen(siehe etwa [21, 24, 81]), Fixpunktsätze für nichtexpansive Operatoren (siehe etwa [22, 14, 39, 43]“.

2.1 Der Banachsche Fixpunktsatz

In Anwendungen, insbesondere in der mathematischen Physik, modellieren überwiegend Glei-chungen die Fragestellungen. Wie in Abschnitt 1.1 erläutert, stellen diese Gleichungen einenBezug her zwischen den Daten der Aufgabenstellung und den gesuchten Lösungen; dementspre-chend kann man unterschiedliche Fragestellungen ableiten. Mathematisch resultiert meist eine(lineare/nichtlineare) Gleichung

Tx = y / f(x) = y (2.1)

wobei T, f das mathematische Modell, y Daten und x die Lösung beschreibt. Formal ist dies eineGleichung 1. Art. Manchmal kommt diese Gleichung in der Form

(id −K)x = y (2.2)

daher. Eine solche Gleichung bezeichnet man meist als Gleichung 2. Art. Man spricht dann vonIntegralgleichungen 1. Art bzw. 2. Art, wenn der Operator T bzw. K ein Integralaloperatorist. In der „einfachsten Form“ sind solche Integraloperatoren B wie folgt definiert:

B : C[a, b] 3 x 7−→ Bx ∈ C[a, b] , Bx(t) :=

∫ b

aκ(t, s)x(s) ds, t ∈ [a, b] . (2.3)

32

Page 44: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Dabei heißt κ Integralkern. In (2.2) ist die Fixpunktgleichung und damit die Fixpunktiterationschon abzulesen:

xk+1 = Kxk + y , x0 gegeben. (2.4)

In vielen Fällen kann man aus der Gleichung (2.1) eine Gleichung der Form (2.2) herstellen.Ein üblicher „Trick “ ist, eine Zerlegungsstrategie zu verfolgen:

A = I −K , mit K := I −A . (2.5)

Damit dies einen Vorteil bringt, müssen im Allgemeinen schon besondere, vorteilhafte Eigenschaf-ten vorliegen. Eine allgemeine Klasse, die hier einzuordnen sind, sind die Regularisierungsver-fahren bei Gleichungen 1. Art; siehe etwa [11, 55, 69].

Das „Zerlegungsverfahren“ findet man auch in der Numerischen Mathematik bei der Lösungvon Gleichungssystemen. Man geht aus von dem Gleichungssystem

Ax = y mit A ∈ Rn,n . (2.6)

Die Matrix wird dann zerlegt in eine obere Dreiecksmatrix U, eine Diagonalmatrix D und eineuntere Dreiecksmatrix L :

A = L+D + U . (2.7)

Dann lassen sich unter geeigneten Voraussetzungen die Iterationsverfahren

xk+1 = −D−1(L+ U)xk +D−1y , x0 gegeben, (2.8)

bzw.xk+1 = −(L+D)−1xk + (L+D)−1y , x0 gegeben, (2.9)

betrachten. Das Verfahren in (2.8) nennt man das Jakobi– bzw. Gesamtschrittverfahren,das Vorgehen in (2.9) das Gauß-Seidel– bzw. Einzelschrittverfahren. In der numerischenRealisierung kann man auf die explizite Invertierung von D bzw. L + D verzichten auf Kostenvon Gleichungslösern.

Eine Fixpunktgleichung hat folgende Form

F (x) = x (2.10)

und gesucht ist eine Lösung dieser Gleichung. Dabei unterstellen wir immer folgenden Kontext:F : U −→ X, U ⊂ X, X Banachraum. Damit eine Lösung existiert, ist notwendig, dass F nachU abbildet.

Oben haben wir gesehen, wie man Gleichungen in Fixpunktgleichungen umschreiben kann.Dies kann im Allgemeinen in vielfältiger Weise geschehen. Eindrucksvoll kann man dies amProblem der Bestimmung des Kerns einer linearen Abbildung T : X −→ X sehen. Das Problemstellt sich so dar:

Bestimme x mit Tx = θ

Umformulierungen in eine Fixpunktgleichung F (x) = x sind etwa:

• F (x) := x± Tx = x

• F (x) := x± ωTx = x (ω ∈ R, 0 6= ω) (Lineare Relaxation)

• F (x) := x − ωG(Tx) = x (ω ∈ R, 0 6= ω,G : X −→ X,G(Tx) = θ ⇐⇒ Tx = θ)(Nichtlineare Relaxation)

33

Page 45: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Im Allgemeinen ist es also so, dass ein Vorgehen zur Lösung einer Gleichung auch eine Mög-lichkeit zur Lösung einer Fixpunktgleichung liefert und umgekehrt. Da Verfahren zur Suche einerNullstelle auch zur Lösung einer Gleichung verwendet werden können, kann man diese auch zurLösung von Fixpunktgleichungen nutzen. Dementsprechend stellen wir auch solche Verfahrenvor.

Hier ist der Banachsche Fixpunktsatz in normierten Räumen in einer konstruktiven Fassung.Wir verzichten auf die Formulierung in metrischen Räumen; siehe [13], Satz 4.28.

Satz 2.1 (Banachscher Fixpunktsatz) Sei X ein Banachraum, sei V eine abgeschlosseneTeilmenge von X und sei F : V −→ V eine Kontraktion, d. h.

∃L ∈ [0, 1)∀x, y ∈ V (‖F (x)− F (y)‖ ≤ L‖x− y‖) . (2.11)

Dann haben wir folgende Aussagen:

a) Es gibt in V genau einen Fixpunkt x von F .

b) Die Iterationx = x0 ∈ V , xn+1 := F (xn) , n ∈ N0 , (2.12)

knvergiert gegen x für alle x ∈ V , und wir haben

c) ‖xn − x‖ ≤ Ln

1− L ‖F (x)− x‖ , n ∈ N .

(d) ‖xn+1 − x‖ ≤ L1− L ‖xn+1 − xn‖ , n ∈ N .

Beispiel 2.2 Sei a < b , F : [a, b] −→ [a, b] stetig und sei F differenzierbar in (a, b) . Es geltemit q ∈ [0, 1):

|F ′(ξ)| ≤ q für alle ξ ∈ (a, b) . (2.13)

Dann besitzt F genau einen Fixpunkt in [a, b] , denn nach dem Mittelwertsatz der Differential-rechnung ist F eine Kontraktion.Beachte: Die Voraussetzung (2.13) ist keine notwendige Voraussetzung für die Existenz einesFixpunktes, denn es reicht ja schon die Stetigkeit von F aus, um einen Fixpunkt zu garantieren(F (a)− a ≥ 0, F (b)− b ≥ 0!).

Beispiel 2.3 X = R , ‖ · ‖ := | · | , M := [0,∞), F :M 3 t 7−→ t+1

1 + t∈M . Wir haben

|F (t)− F (s)| < |t− s| .

F besitzt keinen Fixpunkt! Beachte, dass

|F (t)− F (s)| ≤ q|t− s| , t, s ∈M ,

für kein q ∈ [0, 1) erreichbar ist.

Beispiel 2.4 X := R , ‖ · ‖ := | · | , M := (0,∞) , F : M 3 t 7−→ qt ∈ M mit q ∈ [0, 1) .Offenbar gilt

|F (t)− F (s)| ≤ q|t− s| , t, s ∈M ,

aber F besitzt keinen Fixpunkt. Beachte: M ist nicht abgeschlossen!

34

Page 46: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Folgerung 2.5 Sei X ein Banachraum und sei F : Br −→ X eine Kontraktion, d. h.

∃L ∈ [0, 1) ∀x, y ∈ Br (‖F (x)− F (y)‖ ≤ L‖x− y‖) . (2.14)

Gilt F (∂Br) ⊂ Br, so besitzt F in Br genau einen Fixpunkt.

Beweis:Definiere

G : Br 3 x 7−→ 1

2(x+ F (x)) ∈ X .

Sei x ∈ Br, x 6= θ . Betrachte u := rx‖x‖−1 ∈ ∂Br ⊂ Br . Dann folgt

‖F (x)− F (u)‖ ≤ L‖x− u‖ = L(r − ‖x‖)

und daher‖F (x)‖ ≤ ‖F (u)‖+ ‖F (x)− F (u)‖ ≤ r + L(r − ‖x‖) ≤ 2r − ‖x‖

und‖G(x)‖ =

1

2‖x+ F (x)‖ ≤ 1

2(‖x‖+ ‖F (x)‖) ≤ r .

Auf Grund der Stetigkeit von G folgt daraus auch ‖G(θ)‖ ≤ r .Dies zeigt nun insgesamt G : Br −→ Br . G ist auch eine Kontraktion, wie man an

‖G(x)−G(y)‖ ≤ 1

2(‖x− y‖+ L‖x− y‖) = 1

2(1 + L)‖x− y‖ , x, y ∈ Br

abliest. Nach Satz 2.1 besitzt G einen (eindeutig bestimmten) Fixpunkt x ∈ Br . Daraus folgtx = F (x) . Auf Grund der Kontraktionseigenschaft ist ein Fixpunkt von F eindeutig bestimmt.

Satz 2.6 (Edelstein, 1961) Sei X ein Banachraum, sei V subsetX und sei F : V −→ Vkontraktiv, d. h.

∀x, y ∈ V, x 6= y, (‖F (x)− F (y)‖ < ‖x− y‖) . (2.15)

Dann haben wir folgende Aussagen:

a) F hat höchstens einen Fixpunkt in V .

b) Ist V kompakt, dann besitzt F genau einen Fixpunkt.

Beweis:Zu a) Trivial.Zu b) Man betrachte die Abbildung V 3 v 7−→ ‖v − F (v)‖ ∈ R . Da V kompakt und die Normstetig ist, gibt es x ∈ V mit ‖x − F (x)‖ = infv∈V ‖v − F (v)‖ . Nun muss x = F (x) gelte, dennsonst hätten wir

‖F (x)− F F (x)‖ < ‖x− F (x)‖ .

Beispiel 2.7 Die Abbildung F : R 3 x 7−→ ln(1 + ex) ∈ R ist kontraktiv, hat aber keinenFixpunkt; beachte R ist nicht kompakt.

35

Page 47: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Die Vollständigkeit des zugrundeliegenden Raumes, die bei Sätzen vom Typ „Kontraktions-satz“ gefordert wird, kann als Notwendig für die Existenz von Fixpunkten angesehen werden;siehe dazu [35, 53, 50, 82, 84].

Als klassische Anwendung betrachten wir das Existenzproblem von Anfangswertaufgabenbei gewöhnlichen Differentialgleichungen. Damit meinen wir eine Aufgabe der folgendenArt:

Gegeben: f : [t0, t1]×D −→ Rn , D ⊂ Rn , y0 ∈ D (t0, t1 ∈ R, t0 < t1).

Gesucht: Lösung ϕ der Anfangswertaufgabe(AWA) y′ = f(t, y) , y(t0) = y0 .

In obiger Aufgabenstellung nennt man f rechte Seite und y0 den Anfangswert zum Anfangs-zeitpunkt t0 und y(t0) = y0 die Anfangsbedingung. Mit Lösung ist dabei eine differenzier-bare Funktion ϕ : [t0, t1] −→ D gemeint, für die gilt:

ϕ′(t) = f(t, ϕ(t)) , t ∈ [t0, t1] , ϕ(t0) = y0 . (2.16)

Sei die rechte Seite f stetig. Der Hauptsatz der Differential– und Integralrechnung besagt,dass die Suche nach einer Lösung der Anfangswertaufgabe (AWA) verknüpft werden kann mitder Suche nach einer Lösung der folgenden Integralgleichung:

(IG) ϕ(t) = y0 +

∫ t

t0

f(s, ϕ(s)) ds , t ∈ [t0, t1] .

Denn wird (IG) gelöst durch ϕ, so ist ϕ differenzierbar und löst die Anfangswertaufgabe. Um-gekehrt, ist ϕ eine Lösung der Anfangswertaufgabe, so sieht man durch Integration sofort, dassϕ auch (IG) löst. Die Gleichung (IG) hat gegenüber der Aufgabe (AWA) den Vorzug, dass dieAnfangsbedingung eingearbeitet ist, darin nur ϕ vorkommt und nicht ϕ und ϕ′ . Die Gleichung(IG) kann daher im Raum C([t0.t1];Rn) untersucht werden.

Satz 2.8 (Satz von Picard–Lindelöff) Sei f : [t0, t1]× Rn −→ Rn stetig, y0 ∈ Rn beliebig,und es gebe L ≥ 0 mit

|f(t, u)− f(t, v)| ≤ L|u− v| für alle u, v ∈ Rn , t ∈ [t0, t1] .

Dann gibt es genau eine stetig differenzierbare Funktion ϕ : [t0, t1] −→ Rn mit

ϕ′(t) = f(t, ϕ(t)) , t ∈ [t0, t1] , ϕ(t0) = y0 .

Beweis:Wir haben zu zeigen, dass es genau eine stetige Abbildung ϕ : [t0, t1] −→ Rn gibt, die dieIntegralgleichung (IG) erfüllt. Betrachte

X := C([t0, t1];Rn) , ‖g‖∞ := maxt∈[t0,t1]

e−2Lt|f(g)| , g ∈ X .

(L ist die Lipschitzkonstante aus den Voraussetzungen des Satzes.) Damit ist (X, ‖ · ‖∞) einBanachraum, denn das „Gewicht“ e−2Lt ändert nichts an der Tatsache, dass in ‖ · ‖∞ eine Normvorliegt, bezüglich der X vollständig ist.Wir wollen Satz 2.1 auf die Fixpunktgleichung anwenden, als die sich (IG) interpretieren lässt.Dazu definieren wir:

F : X −→ X , F (ϕ)(t) := y0 +

∫ t

t0

f(s, ϕ(s)) ds , t ∈ [t0, t1] .

36

Page 48: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Offenbar gilt für ϕ,ψ ∈ X, t ∈ [t0.t1] :

|F (ϕ)(t)− F (ψ)(t)| ≤t∫

t0

|f(s, ϕ(s))− f(s, ψ(s))|ds ≤ L

t∫t0

|ϕ(s)− ψ(s)|ds

= L

t∫t0

|ϕ(s)− ψ(s)|e−2Lse2Lsds ≤ L‖ϕ− ψ‖∞

t∫t0

e2Lsds

≤ 1

2e2Lt‖ϕ− ψ‖∞, ,

also‖F (ϕ)− F (ψ)‖ ≤ 1

2‖ϕ− ψ‖∞ .

Damit sind die Voraussetzungen des Satzes 2.1 erfüllt und F besitzt genau einen Fixpunkt.

Folgerung 2.9 Sei f : [t0, t1]×Br(y0) −→ Rn stetig und es gebe L ≥ 0 mit

|f(t, x)− f(t, x′)| ≤ L|x− x′| für alle x, x′ ∈ Br(y0) , t ∈ [t0, t1] .

Dann gibt es genau eine stetig differenzierbare Funktion ϕ : [t0, t0 + a] −→ Rn mit

ϕ′(t) = f(t, ϕ(t)) , t ∈ [t0, t0 + a] , ϕ(t0) = y0 ,

wobei a := min(t1 − t0, rm−1) , m := max

|f(s, x)||s ∈ [t0, t1] , x ∈ Br(y

0).

Beweis:Wir setzen f vom „Rechteck“ R := [t0, t1]×Br(y

0) zu f auf [t0, t1]× Rn fort durch

f(t, x) :=

f(t, x) , falls x ∈ Br(y0)

f(t, y0 + r|x− y0|−1(x− y0)) , sonst.

Nun erfüllt f die Voraussetzungen des Satzes 2.28: die Stetigkeit ist klar, die Lipschitzstetigkeitist erfüllt mit derselben Lipschitzkonstante. Es gibt also ϕ : [t0, t1] −→ Rn mit

ϕ′(t) = f(t, ϕ(t)) , t ∈ [t0, t1] , ϕ(t0) = y0 .

Solange nun ϕ(t) ∈ Br(y0) gilt, ist f(t, ϕ(t)) = f(t, ϕ(t)) . ϕ verläßt das Rechteck R frühestens

zum Zeitpunkt t∗ = t0 + a, da

|ϕ(t)− y0| ≤t∫

t0

|f(s, ϕ(s))|ds ≤ (t− t0)m

gilt. Also ist ϕ|[t0,t0+a] eine Lösung der vorgegebenen Aufgabe. Sie ist eindeutig bestimmt, da dieLösung der zugeordneten Integralgleichung (f = f) auf [t0, t0 + a] eindeutig bestimmt ist.

Beispiel 2.10 Hier ist ein Modell für das Wachstum einer Population.

(AWA) y′ = y(a− by) , y(0) = y0 ; (a, b > 0) .

37

Page 49: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Die rechte Seite – eine explizite Abhängigkeit von der Zeit t liegt nicht vor, man sagt, die Diffe-rentialgleichung sei autonom – heißt logistisches Gesetz des Populationswachstums.Mit f(t, y) := y(a− by) gilt für y ∈ Br(y

0) mit r > 0

|f(t, x)− f(t, x′)| ≤ L|x− x′| , wobei L := max|∂f∂y

(t, ξ)| |t ∈ R, ξ ∈ Br(y0) .

Wir erhalten eine eindeutige Lösung zumindest für ein „kleines Stück“ in die Zukunft (lokaleLösung). Aber die Lösung läßt sich explizit ausrechnen. Wir geben sie an, die Verifikation, dasseine Lösung vorliegt, ist einfach:

ϕ(t) :=ay0

by0 + (a− by0) exp(−at), t ∈ [0,∞) .

Es fällt auf, dass limt→∞ ϕ(t) = ab

gilt: über „lange Zeit“ stellt sich das „Gleichgewicht“ ab

ein(ab

ist eine Nullstelle der rechten Seite!). Erweiterte Modelle sind mit dem Namen Volterra–Lotka–Modelle verbunden.

Beispiel 2.11 Betrachte(AWA) y′ = 1 + y2 , y(0) = 0 .

Die Lösung der Anfangswertaufgabe von (AWA) ist der Tangens (tan′(y) = 1+y2) . Diese Lösungzeigt uns, dass wir nicht immer erwarten dürfen, dass die Lösung für die ganze Zukunft existiert,obwohl die rechte Seite für alle Zeiten definiert ist und hinreichend oft differenzierbar ist. DerGrund für die eingeschränkte Existenz liegt darin begründet, dass hier die rechte Seite „großesWachstum“ aufweist.

Als weitere Anwendung des Banachschen Fixpunktsatzes kann der folgende Satz angesehenwerden.

Satz 2.12 (Satz von der Inversen Abbildung) Seien X,Y Banachräume, sei U ⊂ X offen,und sei f ∈ C1(U, Y ) . Sei x0 ∈ U und sei V := f(U) . Ist Df(x0) bijektiv, dann gibt es eine offeneUmgebungen U0 ⊂ U, V0 ⊂ V von x0 bzw. f(x0), so dass die Einschränkung f|U0

: U0 −→ V0eine Inverse g : V0 −→ U0 besitzt, die stetig Fréchet-differenzierbar ist mit

Dg(y) = Df(g(y))−1 , y ∈ V0 .

Beweis:Sei T := Df(x0)−1 ∈ B(X,Y ) . O.E. können wir

x0 = θ , f(θ) = θ , Df(θ) = I := id, X = Y ,

annehmen, denn beim Übergang von f zu

f(x) := T (f(x+ x0)− f(x0)) , x ∈ U ,

bleiben die Voraussetzungen des Satzes für f erhalten und nach Erhalt von g mit den Eigen-schaften des Satzes für f können wir in g(y) := x0 + g(T (y − f(x0)) die Inverse g zu f erhalten.Nun zum Beweis unter diesen vereinfachenden Annahmen.Wir haben y = f(x) genau dann, wenn x = y+G(x) gilt mit G(x) := x− f(x) . Also haben wirdie Fixpunktgleichung

x = y +G(x) =: F (x)

38

Page 50: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

zu untersuchen. Dazu wollen wir den Kontraktionssatz heranziehen. Es ist mit BR ⊂ U nachSatz 1.12

‖F (x)− F (x′)‖ = ‖G(x)−G(x′)‖ ≤ LR‖x− x′‖

mit LR = supξ∈BR‖Df(ξ)‖ = supξ∈BR

‖I − Df(ξ)‖ . Wähle, die Stetigkeit von ξ 7−→ Dg(ξ)

nutzend, r ∈ (0, R) mit Lr ≤ 12 . Dann ist also F eine Kontraktion auf Br und wir haben (mit

der Wahl x′ := θ)F : Br −→ B r

2⊂ Br ,F : Br −→ B r

2.

Damit erhalten wir mit dem Banachschen Fixpunktsatz die Aussage

∀ y ∈ B r2∃x = xy ∈ Br (f(x) = y) , (2.17)

und die Gleichung f(x) = y ist für y ∈ B r2

sogar eindeutig lösbar. Setze

U0 := Br ∩ x ∈ U | ‖f(x)‖ < r

2 , V0 := f(U0) , g(y) := xy, y ∈ V0 .

Offenbar ist U0 offen, f : U0 −→ V0 bijektiv, und es ist f(g(y)) = y, g(f(x)) = x für y ∈ V0, x ∈U0 . Für u, x ∈ Br gilt

‖x− u‖ = ‖G(x)−G(u) + f(x)− f(u)‖≤ ‖G(x)−G(u)‖+ ‖f(x)− f(u)‖

≤ 1

2‖x− u‖+ ‖f(x)− f(u)‖ .

und daher‖g(y)− g(v)‖ ≤ 2‖y − v‖ , y, v ∈ B r

2.

Insbesondere ist g stetig und es folgt (mit u := θ) aus ‖f(x)‖ < r2 die Aussage ‖x‖ < r, d. h.

x ∈ Br .Nun gilt V0 = f(U0) = B r

2, denn: Ist y ∈ V0, dann ist y = f(x) mit x ∈ U0 und daher ‖f(x)‖ < r

2 ;ist y ∈ B r

2, dann gibt es x ∈ Br mit y = f(x), also y ∈ V0 . Also ist V0 insbesondere offen.

Wegen f(x) = x−G(x) ist Df(x) = I −DG(x) und da ‖DG(x)‖ ≤ 12 ist für x ∈ Br, ist Df(x)

invertierbar für x ∈ U0 ; siehe hierzu [13], Satz 7.31. Für y = f(x), v = f(u) ∈ V0, y 6= v, habenwir x 6= u und

‖g(v)− g(y)−Df(g(y))−1(v − y)‖‖v − y‖−1 = ‖u− x−Df(g(y))−1(f(u)− f(x))‖‖v − y‖−1

≤ ‖Df(g(y))−1‖‖f(u)− f(x)−Df(g(y))(u− x)‖‖u− x‖−1‖v − y‖−1‖g(u)− g(x)‖≤ 2‖Df(g(y))−1‖‖f(u)− f(x)−Df(g(y))(u− x)‖‖u− x‖−1

Daraus folgt, da g schon als stetig erkannt ist,

limv→y

‖g(v)− g(y)−Df(g(y))−1(v − y)‖‖v − y‖−1 = 0 ,

also die Fréchet-Differenzierbarkeit von g in y . FernerDg(y) = Df((g(y))−1 . Da f stetig Fréchet-differenzierbar ist in U und y −→ g(y) stetig ist, ist g ∈ C1(V0, X) .

2.2 Der Brouwersche Fixpunktsatz

Definition 2.13 Ein topologischer Raum X besitzt die Fixpunkteigenschaft, wenn jede stetigeAbbildung F : X −→ X einen Fixpunkt besitzt.

39

Page 51: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Der Satz von Brouwer, den wir nun anführen wollen, stellt ein wesentliches Hilfsmittel dafürbereit, wann topologische Räume die Fixpunkteigenschaft besitzen.

Satz 2.14 (Fixpunktsatz von Brouwer, 1912; Poincaré, 1883) Sei K ⊂ Rn nicht–leer,konvex, abgeschlossen und beschränkt. Sei F : K −→ K stetig. Dann besitzt F einen Fix-punkt, d. h. es gibt x ∈ K mit

F (x) = x .

Wir verzichten hier auf den Beweis. Er kann mit verschiedenen Methoden erbracht werden,z. B. mit kombinatorischen Methoden (Simpliziale Zerlegungen), mit Hilfe des Abbildungsgrades,dem Satz von Stokes, kombinatorischen oder mit elementar-analytischen Ansätzen, er verlangtaber in jeder Beweis-Variante einige Vorbereitungen. Im Anhang 2.9 werden wir einen Beweisdes Brouwerschen Fixpunktsatzes aufschreiben.

Aus dem Brouwerschen Fixpunktsatz schließen wir, dass jede nicht–leere, konvexe, abgeschlos-sene und beschränkte Teilmenge von Rn die Fixpunkteigenschaft besitzt.

Definition 2.15 Zwei topologische Räume sind homöomorph, falls zwischen ihnen eine bijek-tive Abbildung g existiert, so dass g und g−1 stetig sind.

Folgerung 2.16 Besitzt der topologische Raum X die Fixpunkteigenschaft und ist der topologi-sche Raum Y zu X homöomorph, so besitzt auch Y die Fixpunkteigenschaft.

Beweis:Sei F : Y −→ Y stetig. Ist X zu Y homömorph mittels des topologischen Isomorphismus g, soist g−1 F g : X −→ X stetig und hat daher einen Fixpunkt. Dann ist aber g(x) ein Fixpunktvon F .

Im Vergleich zum Banachschen Fixpunktsatz wird beim Brouwerschen Fixpunktsatz auf dieExistenz einer Kontraktion in den Voraussetzungen verzichtet. Dafür geht beim BrouwerschenFixpunktsatz die Eindeutigkeit und das Iterationsverfahren zur Bestimmung des Fixpunktesverloren.

Nun folgen Sätze, die in engen Zusammenhang zum Brouwerschen Fixpunktsatz stehen. ZurErinnerung: 〈·, ·〉2 bezeichnet das euklidische Skalarprodukt in Rn .1

Satz 2.17 (Satz vom gekämmten Igel) Sei Sn−1 := x ∈ Rn|‖x‖ = 1 . Eine stetige Abbil-dung v : Sn−1 −→ Sn−1 mit 〈x, v(x)〉2 = 0 für alle x ∈ Sn−1 existiert genau dann, wenn ngerade ist.

Der Satz kann so interpretiert werden, dass jedes auf der Einheitssphäre nicht verschwindendeTangentialfeld einen Glatzpunkt haben muss.

Satz 2.18 (Brötchensatz) Gegeben seien n abgeschlossene Mengen A1, . . . , An in Rn . Danngibt es eine Hyperebene, so dass jede Menge zu gleichen Teilen (dem Volumen nach) auf beidenSeiten der Hyperebene liegt.

Der Satz kann so interpretiert werden, dass jedes Brot, belegt mit Schinken und Gurke durcheinen Schnitt so geteilt werden kann, dass Brot, Schinken und Gurke in gleich große Hälftenzerlegt werden.

1Die Bezeichnungsweise Sn−1 für den Rand ∂B1 der Einheitskugel B1 in Rn hat den Vorzug, dass die Dimensiondes zugrundeliegenden euklidischen Raumes mitangeführt wird.

40

Page 52: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Satz 2.19 (Satz von Borsuk-Ulam) Sei f : Sn−1 −→ Rn−1 eine stetige Abbildung. Danngibt es ein x ∈ Sn−1 mit f(x) = f(−x) (x ist Antipodalpunkt).

Eine mögliche Interpretation des Satzes ist: zu jedem Zeitpunkt gibt es auf der Erdoberflächegegenüberliegende Punkte, so dass dort gleicher Druck und gleiche Temperatur herrschen.

Bemerkung 2.20 Zum Zusammenhang der Sätze:

Satz von Borsuk-Ulam =⇒ BrötchensatzSatz von Borsuk-Ulam =⇒ Brouwerscher FixpunktsatzSatz vom gekämmten Igel =⇒ Brouwerscher Fixpunktsatz

Als Anwendung des Brouwerschen Fixpunktsatzes skizzieren wir einen Existenzsatz für peri-odische Lösungen gewöhnlicher Differentialgleichungen. Betrachte das Anfangswertproblem

Gegeben: f : R× Rn −→ Rn , f ω − periodisch , y0 ∈ Rn .

Gesucht: ω-periodische Lösung y der Differentialgleichung(DGLp) y′ = f(t, y).

Dabei bedeutet ω-periodisch bei einer Funktion v : R −→ Rn: v(t+ ω) = v(t) für alle t ∈ R .

Die Suche nach einer periodischen Lösung kann sich darauf konzentrieren, ein y0 (Anfangs-wert) zu finden, so dass eine Lösung φ der AWA y′ = f(t, y) existiert mit φ(0, y0) = φ(ω, y0) .Denn dann können wir y : R −→ Rn durch t 7−→ φ(t−kω), t ∈ [kω, (k+1)ω], k ∈ Z, definierenund erhalten so eine ω-periodische Lösung.

Eine solche ω-periodische Lösung existiert genau dann, wenn die Integralgleichung∫ ω

0f(s, y(s))ds = 0 (2.18)

eine Lösung besitzt. Hier sind Voraussetzungen, die hierzu hilfreich sind (r > 0):

f stetig differenzierbar, 〈y, f(t, y)〉2 < 0, t ∈ [0, ω], |y| = r , (2.19)

Denn hiermit können wir die Suche auf den Brouwerschen Fixpunktsatz zurückführen. Betrachte

Pω : Br 3 y0 7−→ y(ω; y0) ∈ Br ;

dabei ist y(·; y0) die eindeutige Lösung der Anfangswertaufgabe y′ = f(t, y), y(0) = y0 . Pω isteine stetige Abbildung. Nun fehlt noch der Nachweis für die Tatsache, dass Pω nach Br abbildet.Dies folgt aus der Beobachtung:

d

dt〈y(t; y0), y(t; y0)〉2 = 2〈y(t; y0), f(t, y(t; y0)〉2 < 0,

falls |y(t; y0)| = r für ein t gilt.

Die Übertragung von Satz 2.14 auf unendlich–dimensionale Räume ist ohne zusätzliche Vor-aussetzungen nicht möglich. Die Verallgemeinerung des Brouwerschen Fixpunktsatzes 2.14 aufunendlich dimensionale Räume gelingt, wenn wir die Voraussetzungen

„M abgeschlossen und beschränkt“ als „M kompakt“

lesen; siehe nächster Abschnitt.

41

Page 53: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beispiel 2.21 Sei X := l2 . Wir setzen:

Fx =: y , yk :=

(1− ‖x‖2)1/2 , falls k = 1

xk−1 , falls k > 1, für x = (xk)k∈N.

Wegen ‖Fx‖2 = (1 − ‖x‖2) +∑∞

k=1 |xk|2 = 1, x ∈ X , gilt F : B1 −→ B1. F ist stetig, denn‖Fx − Fy‖2 = |‖x‖2 − ‖y‖2| + ‖x − y‖2 , x, y ∈ X. Aber F besitzt keinen Fixpunkt, denn ausFx = x, x = (xk)k∈N, folgt:

x1 = (1− ‖x‖2)1/2, x1 = x2 = x3 = . . . .

Wegen ‖x‖2 =∑∞

k=1 |xk|2 < ∞, folgt x1 = x2 = x3 = · · · = 0, d. h. ‖x‖ = 0. Dies ist imWiderspruch zu x1 = (1− ‖x‖2)

12 = 0.

Im Hinblick auf die folgenden Entwicklungen sei festgehalten, dass F nicht kompakt ist.

2.3 Der Schaudersche Fixpunktsatz

Satz 2.22 (Fixpunktsatz von Schauder, 1930/1. Version) Sei X ein Banachraum und seiM ⊂ X nicht-leer, konvex, beschränkt und abgeschlossen. Dann hat jede vollstetige AbbildungF :M −→ M einen Fixpunkt.

Beweis:Seien Fn endlichdimensionale Approximationen aus Satz 1.24. Fn bildet in den endlichdimensio-nalen TeilraumXn ab, ausserdem in die konvexe Hülle von F (M) enthalten inM .Wir betrachtendie Einschränkungen der Abbildungen, Fn

∣∣|M∩Xn

:M∩Xn −→ M∩Xn. Dann hat Fn nach demBrouwerschen Fixpunktsatz einen Fixpunkt xn ∈ M ∩Xn, Fn(xn) = xn . Wegen der Kompakt-heit von F (M) gibt es eine konvergente Teilfolge (wir nummerieren sie 0. E. nicht um) (xn)n∈N;x := limn xn . Es gilt x ∈ F (M) und

‖xn − F (xn)‖ = ‖Fn(xn)− F (xn)‖ ≤ 1

n.

Wegen limn F (xn) = F (x) folgt x = F (x) .

Satz 2.23 (Fixpunktsatz von Schauder, 1930/2. Version) Sei X ein Banachraum und seiM ⊂ X nicht-leer, konvex, kompakt, und sei F : M −→ M stetig. Dann besitzt F einenFixpunkt.

Beweis:F (M) ist eine abgeschlossene Teilmenge der kompakten Menge M und damit kompakt. Sein ∈ N. Offensichtlich gilt F (M) ⊂ ∪y∈F (M)B 1

n(y) . Da F (M) aber kompakt ist, gibt es endlich

viele yn1 , . . . , ynm ∈ F (M) mit

F (M) ⊂ F (M) ⊂ ∪mi=1B 1

n(yni ) .

Also gilt

min1≤i≤m

‖F (x)− yni ‖ <1

nfür alle x ∈M . (2.20)

Sei Mn := co(yn1 , . . . , ynm). Dann ist Mn konvex, abgeschlossen, kompakt, Mn ⊂ co(F (M)) ⊂M =M . Wir definieren:

ani :M 3 x 7−→ max0, 1n− ‖F (x)− yni ‖ ∈ R, 1 ≤ i ≤ m.

42

Page 54: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Jedes ani ist stetig und es gilt wegen (2.20)∑m

i=1 ani (x) 6= 0 für alle x ∈ M . Wir definieren den

so genannten Schauderoperator:

Pn(x) :=

(m∑i=1

ani (x)yni

)(m∑i=1

ani (x)

)−1

, x ∈M.

Wir haben Pn : Mn −→ Mn, da yn1 , . . . , ynm ∈ Mn und jedes Pn(x) eine Konvexkombinationder yn1 , . . . , ynm ist. Pn ist stetig, da an1 , . . . , anm stetig sind. Anwendung des Fixpunktsatzes vonBrouwer 2.14 ergibt die Existenz eines Punktes xn ∈Mn mit Pn(xn) = xn . Dazu ist festzuhalten,dass wir diesen Satz anwenden dürfen, da wir in Yn := span(y1, . . . , ynm) einen zu einem Rk

homömorphen topologischen Raum vorfinden.Da M kompakt ist, gibt es eine Teilfolge (xnk

)k∈N und x ∈M mit x = limk xnk. Wir nehmen

an, dass schon die ganze Folge konvergiere (Umnummerierung!). x ist Fixpunkt von T , denn:

‖xn − F (x)‖ = ‖Pn(xn)− F (x)‖ ≤ ‖Pn(xn)− F (xn)‖+ ‖F (xn)− F (x)‖

= ‖(m∑i=1

ani (x)(yni − F (x)))(

m∑i=1

ani (x))−1‖+ ‖F (xn)− F (x)‖

≤ (m∑i=1

ani (x)‖yni − F (x)‖)(m∑i=1

ani (x))−1‖+ ‖F (xn)− F (x)‖

≤ (m∑i=1

ani (x)1

n)(

m∑i=1

ai(x))−1 + ‖F (xn)− F (x)‖

=1

n+ ‖F (xn)− F (x)‖

Daraus folgt limn ‖xn − F (x)‖ = 0, ‖x− F (x)‖ = 0, d. h. x = F (x) .

Satz 2.24 (Fixpunktsatz von Schauder/3. Version) Sei X ein Banachraum und sei M ⊂X nicht-leer und konvex, sei F :M −→ M stetig, und sei F (M) kompakt. Dann besitzt F einenFixpunkt.

Beweis:Sei N := co(F (M)) . N ist kompakt (siehe Folgerung 2.52) und konvex; N ⊂M . Die Einschrän-kung F |N : N −→ N besitzt einen Fixpunkt nach Satz 2.23. Dieser Fixpunkt ist auch Fixpunktvon F .

Hier ist noch ein Resultat, das bei der Analyse von Evolutionsgleichungen, also Anfangswert-aufgaben für Differentialgleichungen in unendlichdimensionalen Räumen, hilfreich sein kann.

Satz 2.25 Sei H ein Hilbertraum mit innerem Produkt 〈·|·〉 und sei M ein kompakter metrischerRaum. Sei X der Banachraum C(M,H), versehen mit der Supremumsnorm ‖ · ‖∞, und seiG : B1 ⊂ X −→ X eine Abbildung mit folgenden Eigenschaften:

(a) G ist vollstetig

(b) θ /∈ (∂G(B1)\G(B1)

(c) 〈x(t)|(G(x)(t)〉 ≤ 0 für alle x ∈ B1\B1, t ∈M

Dann gibt es x∗ ∈ B1 mit G(x∗) = θ .

43

Page 55: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis:Annahme: G(x) 6= θ für alle x ∈ B1 .

Dann folgt mit der Voraussetzung (b) θ /∈ G(B1) und daher ist die Abbildung

F : B1 3 x 7−→ G(x)‖G(x)‖−1 ∈ B1

kompakt. Nach dem Schauderschen Fixpunktsatz gibt es ein x ∈ B1 mit F (x) = x . Dann giltx ∈ B1\B1 und x‖G(x)‖ = G(x) . Mit der Voraussetzung (c) folgt nun

‖G(x)‖〈x(t)|x(t)〉 = 〈x(t)|G(x)(t)〉 ≤ 0 für alle t ∈M .

Dies impliziert 〈x(t)|x(t)〉 ≤ 0 für alle t ∈M , also x = θ . Dies ist im Widerspruch zu x ∈ B1\B1 .

Bemerkung 2.26 Die Fixpunktsätze von Brouwer und Schauder sagen nichts über die Eindeu-tigkeit eines Fixpunktes; sie ist auch ohne weitere Voraussetzungen und weitere Argumentationnicht zu erwarten. Dementsprechend ist auch zu erwarten, dass das so durchsichtige Berechnungs-verfahren der sukzessiven Approximation durch Iteration im allgemeinen nicht zum Ziel führt. Esgibt aber durchaus auch Iterationsverfahren, die in der Lage sind, Fixpunkte einzuschließen; wasman dazu braucht ist eine Halbordnung auf X und spezielle Voraussetzungen für die Abbildung,deren Fixpunkt man sucht.2

Bemerkung 2.27 Der Fixpunktsatz von Schauder, der ja in Banachräumen „spielt“, hat eineVerallgemeinerung auf lokalkonvexe Räume.3 Dies ist dann der Fixpunktsatz von Tikhonov; siehe[87].

Die Reichweite des Schauderschen Fixpunktsatzes ist außerordentlich groß. Wir skizzierendazu den Existenzsatz von Peano für Anfangswertaufgaben bei gewöhnlichen Differentialglei-chungen und betrachten dazu erneut:

Gegeben: f : [t0, t1]× Rn , y0 ∈ D (t0, t1 ∈ R, t0 < t1).

Gesucht: Lösung ϕ der Anfangswertaufgabe(AWA) y′ = f(t, y) , y(t0) = y0 .

Wie wir wissen, können wir die Lösbarkeit der AWA über die Integralgleichung

(IG) ϕ(t) = y0 +

∫ t

t0

f(s, ϕ(s)) ds , t ∈ [t0, t1] ,

angehen. Wir beweisen nur die schwächere Form (wie beim Existenzsatz mit Hilfe des Banach-schen Fixpunktsatzes im ersten Schritt), die Verallgemeinerung ist dann einfach zu formulierenund zu beweisen; siehe dazu Folgerung 2.9.

Satz 2.28 (Peano) Sei f : [t0, t1] × Rn −→ Rn stetig und beschränkt. Dann besitzt die AWAin [t0, t1] eine Lösung.

2Siehe: Collatz, L. Funktionalanalysis und numerische Mathematik, Springer–Verlag, 19683Lokalkonvexe Räume sind topolgische Vektorräume, die eine Nullumgebungsbasis, bestehend aus konvexen

Mengen beitzen.

44

Page 56: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis:f ist auf Grund der Stetigkeit auf [t0, t1] × Rn beschränkt, etwa durch m ≥ 0 . Definiere diekonvexe, abgeschlossene Menge

M := u ∈ C([t0, t1],Rn)|u(t0) = y0 .

und betrachte den Operator

F :M −→ M , F (u)(t) := y0 +

∫ t

t0

f(s, u(s)) ds ∈ Rn , t ∈ [t0, t1] .

Mit dem Satz von Arzela-Ascoli folgt, dass F (M) relativ kompakt ist. Also ist der SchauderscheFixpunktsatz 2.24 anwendbar und wir erhalten eine Lösung der Integralgleichung und damit derAWA.

Motiviert durch die Notwendigkeit, eine Lösung der Anfangswertaufgabe AWA numerischzu berechnen, kann man etwas anders vorgehen. Man stößt dabei dann auch wieder auf dasKompaktheitsargument via Satz von Arzela-Ascoli. Wir skizzieren das Vorgehen.

Auf dem Intervall [t0, t1] führen wir eine äquidistante Zerlegung ξ0 := t0 < ξ1 := t0+h < ξ2 :=t0+2h < · · · < ξN := t0+Nh = t1 mit h := (t1−t0)/N (N ∈ N) ein. Nun definiert man sukzessiveeinen Polygonzug ΦN auf dieser Zerlegung, ausgehend von der Kenntnis ΦN,0 := ΦN (ξ0) = y0:auf [ξk, ξk+1] setzen wir

ΦN (ξ) := ΦN,k + (ξ − ξk)f(ξk,ΦN,k) .

Diese Vorgehen nennt man das Eulersche Diskretisierungsverfahren. Damit erhält man eineFamilie (ΦN )N∈N von Polygonzügen in C([t0, t1],Rn) . Mit dem Satz von Arzela-Ascoli kann manzeigen, dass unter den Voraussetzungen des Satzes 2.28 diese Familie relativ kompakt ist. EinGrenzübergang N → ∞ (entlang einer Teilfolge) ist dann möglich und wir erhalten eine Lösungder Anfangswertaufgabe AWA.

Hier ist noch eine Ergänzung.

Satz 2.29 (Leray–Schauder Prinzip/Version I) Sei X ein Banachraum, sei F : X −→ Xvollstetig und es gebe r > 0 mit

‖x‖ < r für alle x ∈ X mit x = pF (x) für ein p ∈ [0, 1) . (2.21)

Dann besitzt F einen Fixpunkt.

Beweis:Definiere

S : X −→ X , S(x) :=

F (x) , falls ‖F (x)‖ ≤ r

rF (x)‖F (x)‖ , falls ‖F (x)‖ > r

.

Dann ist S : Br −→ Br . Da F stetig ist, ist auch S stetig, wie eine einfache Fallunterscheidungzeigt. Da F (Br) kompakt ist, ist auch S(Br) kompakt. Nach Satz 2.24 hat S einen Fixpunkt z .Annahme: ‖F (z)‖ > r . Dann ist z = S(z) = pF (z) für p = r‖F (z)‖−1 ∈ [0, 1) . Es folgt ‖z‖ < r,was im Widerspruch zu ‖z‖ = ‖S(z)‖ = r ist. Also ist ‖F (z)‖ ≤ r und folglich z = S(z) = F (z) .

In der Literatur findet man für das in Satz 2.29 formulierte Prinzip auch die BezeichnungLeray-Schauder-Alternative. Die Bedingung (2.21) stellt „eine a priori-Abschätzung“ für dieLösungen von skalierten Fixpunktgleichungen dar, keineswegs eine Existenzaussage.

45

Page 57: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Satz 2.30 (Leray–Schauder Prinzip/Version II) Sei X ein Banachraum, sei r > 0, x0 ∈X, und sei F : Br(x

0) −→ X vollstetig. Es gelte

F (x)− x0 6= ξ(x− x0) für ξ > 0, ‖x− x0‖ = r . (2.22)

Dann besitzt F einen Fixpunkt.

Beweis:Der Beweis ist ähnlich zum Beweis von Satz 2.29. Wir geben nur die Abbildung an, die wiederdas Ergebnis bringt:

S(x) :=

F (x) , falls ‖F (x)− x0‖ ≤ r

x0 +r(F (x)− x0)

‖F (x)− x0‖, falls ‖F (x)− x0‖ > r

.

Example 2.31 Betrachte die Integralgleichung

x(t) = f(t) + α

∫ b

asin(x(s))ds , t ∈ [a, b] ,

im Banachraum C[a, b], versehen mit der Supremumnorm. Hierbei ist α ∈ R, f ∈ C[a, b] .Wir setzen

F : C[a, b] −→ C[a, b] , F (x)(t) := f(t) + α

∫ b

asin(x(s))ds , t ∈ [a, b] .

Sei p ∈ [0, 1). Dann gilt für jede Lösung xp von xp = pF (xp)

‖xp‖ = ‖pF (xp)‖ = supt∈[a,b]

∣∣pf(t) + αp

∫ b

asin(xp(s))ds

∣∣ ≤ p‖f‖∞ + p|α|(b− a) .

Wählt man alsor > ‖f‖∞ + |α|(b− a) ,

so ist die Bedingung (2.21) erfüllt. DieVollstetigkeit von F folgt wieder aus dem Satz von Arzela-Ascoli.

2.4 Nullstellensuche nach Newton

Isaac Newton beschreibt4 ein Rechenverfahren zum Lösen einer polynomialen Gleichung undbegründet damit ein Verfahren, das heutzutage als Newton-Verfahren bezeichnet wird. Er tutdies am Beispiel des Polynoms p(x) := x3 − 2x − 5 = 0 . Eine leicht zu erratende Näherung istx0 = 2, denn p(2) = −1 ist „klein“. Newton machte den Ansatz x = 2 + u mit einem als „klein“angenommenen u und setzte diesen Ansatz in die Gleichung ein. Es gilt:

x3 = (2 + u)3 = 8 + 12u+ 6u2 + u3 , 2x = 2(2 + u) = 4 + 2u .

Also folgtx3 − 2x− 5 = −1 + 10u+ 6u2 + u3

!= 0 .

4Isaac Newton, 1643–1727; „Methodus fluxionum et serierum infinitarum“; siehe [30]

46

Page 58: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Da u als „klein“ angenommen wurde, können die Terme höherer Ordnung gegen den linearenund konstanten Anteil vernachlässigt werden, womit 10u− 1 = 0 bzw. u = 0.1 übrig bleibt. AlsNäherung x1 resultiert x1 = 2.1 .

Wir können nun dieses Vorgehen wiederholen: wir setzen u = 0.1 + v an, betrachten dieGleichung p(2 + 0.1 + v) = 0, berücksichtigen wiederum nur den linearen Anteil und erhalten sov = −0.061/11.23 = −0.0054 . . . . Als Näherung x2 resultiert x2 = 2.0946 .

Raphson5 beschrieb diesen Rechenprozess formal und illustrierte den Formalismus an derallgemeinen Gleichung 3. Grades, die abstrakte Form des Verfahrens mit Benutzung von Ablei-tungen stammt von Thomas Simpson.

Sei f : R −→ R . Eine Nullstelle wird nach folgendem Vorgehen gesucht:

(1) Man rät eine Näherung x0 . O.E. f(x0) 6= 0 .

(2) Man berechnet/zeichnet die Tangente T0 an den Graphen von f im Punkt(x0, f(x0)) .

(3) Man berechnet/konstruiert die Nullstelle x1 der Tangente T0 .

(4) Man setzt x0 := x1 und wiederholt den Vorgang, beginnend bei (1).

Klar, um die Tangente bestimmen zu können, müssen wir voraussetzen, dass diese existiert, wasdie Differenzierbarkeit von f voraussetzt. Dann lautet die Tangentengleichung

T0 : y = f(x0) + f ′(x0)(x− x0) (2.23)

und die Berechnung der Nullstelle von T0 führt zur Formel

x1 = x0 − f ′(x0)−1f(x0) . (2.24)

Hier tritt das Problem auf, dass f ′(x0) 6= 0 gelten muss, d. h. dass f in (x0, f(x0)) keine waagrech-te Tangente besitzt. Von der Anschauung her, keine überraschende Forderung, von der Analysedes Verfahrens her eine Forderung, die sukzessive oder a-priori sichergestellt werden muss.

Schreiben wir das Verfahren nun kompakt auf:

xn+1 := xn − f ′(xn)−1f(xn) , n ∈ N0 . (2.25)

Dabei ist die Startnäherung x0 geeignet zu wählen. Wir nennen dieses Vorgehen nun Newton–Verfahren; siehe Abbildung 2.1.

Das Newton–Verfahren ist ein so genanntes lokal konvergentes Verfahren. Konvergenz derin der Newton–Iteration erzeugten Folge zu einer Nullstelle ist also nur garantiert, wenn derStartwert schon „ausreichend nahe“ an der Nullstelle liegt. Ist der Startwert nicht gut genug, sohaben wir zu rechnen mit:

• Die Folge divergiert, der Abstand zur Nullstelle wächst über alle Grenzen.

• Die Folge divergiert, bleibt aber beschränkt. Sie kann z.B. periodisch werden, d. h. endlichviele Punkte wechseln sich in immer derselben Reihenfolge ab. Man sagt auch, dass dieFolge oszilliert (Bei f(x) := x3 − 2x+ 2 ist dies machbar).

• Die Folge konvergiert, falls die Funktion mehrere Nullstellen hat, gegen eine andere als diegewünschte Nullstelle konvergieren; in der Abbildung 2.1 kann man dies erahnen.

5Joseph Raphson, 1648–1715; Arbeit „Analysis Aequationum universalis“

47

Page 59: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Ist der Startwert x0 so gewählt, dass das Newton–Verfahren konvergiert, so ist die Konvergenzallerdings quadratisch, also mit der Konvergenzordnung 2 (falls die Ableitung an der Nullstellenicht verschwindet).

Bemerkung 2.32 Wie ordnet sich das Newtonsche Vorgehen hier nun ein? Ausgehend von derStartnäherung x0 = 2 wird ein Newtonschritt auf die Nullstellengleichung p(x+2) = 0 mit x = 0als Startnäherung angewendet:

x1 := 0− p(2)

p′(2)=

1

10.

Nun betrachtet man die Nullstellengleichung p(x + 2.1) = 0 mit x = 0 als Startnäherung undwendet wieder einen Newtonschritt mit Ausgangsnäherung x = 0 an:

x2 := 0− p(2.1)

p′(2.1)=

0.061

11.23.

Und so weiter!

t

tf(x)

x0

x1x2

Abbildung 2.1: Newtonverfahren

Viele nichtlineare Gleichungen haben mehre-re Lösungen, so hat ein Polynom n-ten Gradesbis zu n Nullstellen. Will man alle Nullstellenin einem bestimmten Bereich D ⊂ R ermitteln,so muss zu jeder Nullstelle ein passender Start-wert in D gefunden werden, für den das Newton–Verfahren konvergiert. Ein beliebtes Vorgehendazu besteht in Einschachtelungsverfahren: zwi-schen zwei Punkten z1, z2, so dass f(z1), f(z2) un-terschiedliche Vorzeichen besitzen, liegt immer ei-ne Nullstelle von f, da wir ja Differenzierbarkeitvon f (und damit Stetigkeit) voraussetzen.

Beispiel 2.33 Ein Spezialfall des NewtonschenNäherungsverfahrens ist das Babylonische Wur-zelziehen, auch bekannt als Heronverfahren nachHeron von Alexandria: Wendet man das Verfah-ren zur Nullstellenbestimmung auf die Funktionf(x) := x2−a (a > 0) an, so erhält man wegen der Ableitungsfunktion f ′(x) = 2x für die Lösung√a das Näherungsverfahren

xn+1 := xn − (xn)2 − a

2xn=

1

2

(xn +

a

xn

).

Dieses Verfahren konvergiert für jedes a ≥ 0 und für jeden beliebigen Anfangswert x0 > 0 .

Beispiel 2.34 Die Quadratwurzel einer Zahl a > 0 sind die Nullstellen der Funktion f(x) :=1−a/x2 . Diese Funktion hat die Ableitung f ′(x) = 2a/x3, die Newton-Iteration erfolgt also nachder Vorschrift

xn+1 := xn − (xn)3

2a+xn2

=xn2

(3− (xn)

2

a

).

Der Vorteil dieser Vorschrift gegenüber dem Wurzelziehen nach Heron (siehe Beispiel 2.33) ist,dass es divisionsfrei ist, sobald einmal der Kehrwert von a bestimmt wurde. Als Startwert wurde

48

Page 60: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

in der Tabelle x0 := (1 + a)/2 gewählt. Die Iterierten wurden an der ersten ungenauen Stelleabgeschnitten. Es ist zu erkennen, dass nach wenigen Schritten die Anzahl gültiger Stellen schnellwächst.

n xn bei a = 2 xn bei a = 3 xn bei a = 5

0 1, 5 2 31 1, 40 1, 6 1, 82 1, 4141 1, 72 2, 13 1, 41421355 1, 73203 2, 224 1, 41421356237309502 1, 7320508074 2, 236015 1, 414213562373095048801688724209697 1, 73205080756887729351 2, 236067975

Das Newton-Verfahren gilt als ein sehr effizientes Verfahren (in den Naturwissenschaften undanderswo). Worin ist dies begründet, obwohl das Problem der guten Startnäherung und dieTatsache, dass eine Ableitung ausgerechnet werden muss, schwer wiegen? Es liegt an vier Beob-achtungen, die in der Literatur ausreichend diskutiert wurden und immer noch werden:

(1) Das Verfahren hat eine naheliegende Erweiterung auf Aufgaben in mehreren Variablen. Imnächsten Abschnitt werden wir es sogar in unendlichdimensionalen Kontext betrachten.

(2) Das Verfahren konvergiert unter gut zu durchschaubaren Voraussetzung (siehe unten) qua-dratisch.

(3) Das Verfahren kann modifiziert werden, um die Berechnung der Ableitung in jedem Schrittzu vermeiden. Etwa durch:

xn+1 := xn − f ′(x0)−1f(xn) , n = 0, . . . . (2.26)

Allerdings ist dann die Konvergenzgeschwindigkeit schlechter.

(4) Das Verfahren kann globalisiert werden, d. h. man kann Vorkehrungen einbauen, die sicher-stellen, dass das so abgeänderte Verfahren auch bei „schlechten“ Startwerten konvergiert; dasStichwort ist Schrittweitensteuerung:

xn+1 := xn − snf′(xn)

−1f(xn) , n = 0, . . . . (2.27)

Satz 2.35 Sei f : [a, b] −→ R zweimal stetig differenzierbar und es gelte

|f ′(x)| ≥ m, |f ′′(x)| ≤M für alle x ∈ [a, b] (2.28)

mit m > 0,M > 0 . Dann gilt:

(a) f hat in [a, b] höchstens eine Nullstelle.

(b) Ist z eine Nullstelle in (a, b), dann ist die Iteration (2.25) definiert für alle x0 ∈ Ur(z) :=(z − r, z + r) wobei r := min(2mM−1, b− z, z − a) ist.Weiterhin gilt mit q :=M(2m)−1|x0 − z| < 1 für alle n ∈ N :

1. |z − xn| ≤ M2m |z − xn−1|2 (Konvergenzordnung)

2. |z − xn| ≤ 2mM q2

n (a priori Abschätzung)

3. |z − xn| ≤ 1m |f(xn)| ≤ M

2m |xn − xn−1|2 (a posteriori Abschätzung)

49

Page 61: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis:Seien z1, z2 Nullstellen von f in [a, b] . Aus

0 = |f(z1)− f(z2)| = |f ′(η)||z1 − z2|

erhalten wir z1 = z2 und a) ist bewiesen.Mit der Taylorentwicklung folgt

0 = f(z) = f(xn) + f ′(xn)(z − xn) +1

2f ′′(η)(z − xn)

2 ,

0 = f(xn) + f ′(xn)(xn+1 − xn) ,

und wir erhalten mit Subtraktion

0 = (z − xn+1)f′(xn) +

1

2f ′′(η)(z − xn)

2 ;

η ∈ [a, b] . Dies zeigt

|z − xn+1| ≤M

2m|z − xn|2.

Sei x0 ∈ (z − r, z + r). Dann folgt

|z − x1| ≤M

2m|z − x0|2 ≤

M

2m(2m

M)2q2 .

Mittels vollständiger Induktion erhalten wir die a priori Abschätzung.Es gilt

|f(xn+1)| = |f(z)− f(xn+1)| = |f ′(η)||z − xn+1| ≥ m|z − xn+1|und

f(xn+1) = f(xn − f(xn)

f ′(xn)) =

1

2f ′′(ξ)(xn+1 − xn)

2

was die a posteriori Abschätzung impliziert.

Die 1. Abschätzung von (b) in Satz 2.35 besagt, dass die Konvergenzordnung der Folge(xn)n∈N (mindestens) zwei, also quadratisch ist. Man kann dies so formulieren, dass bei jedemIterationsschritt die Anzahl der signifikanten Stellen der Approximation xn sich verdoppelt.

Beispiel 2.36 Betrachte die Funktion f(x) := x2, x ∈ R . Die Nullstelle z := 0 von f ist zwei-fach. Die Newton-Iteration mit Startwert x0 6= 0 ergibt

xn+1 =1

2xn also |xn+1 − z| = 1

2|xn − z| , n ∈ N0 ,

und die Konvergenzrate ist nur linear.Bei einer Nullstelle z mit Vielfachheit p einer Funktion f können wir die Iteration

xk+1 := xk − pf(xk)

f ′(xk)

betrachten und man kann beweisen, dass wieder quadratische Konvergenz gegen z gegeben ist.Aber die Iteration ist von wenig praktischem Wert, denn nur selten kennt man die Vielfachheiteiner Nullstelle im Vorhinein.

Bemerkung 2.37 Newton’s Methode kann als eine Fixpunktiteration betrachtet werden. Setzeg(x) := x+h(x)f(x), x ∈ [a, b], mit einer glatten Funktion h . Eine Nullstelle von f ist sicher einFixpunkt von g . Wir wählen h(x) := −1/f ′(x) . Wegen g′(z) = 0 für jede einfache Nullstelle z vonf ist die Kontraktionskonstante von g in einer Nullstelle z von f Null. Dies hat die quadratischeKonvergenz der Fixpunktiteration zur Konsequenz.

50

Page 62: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

2.5 Das Newtonverfahren für ein quadratisches Polynom

Wir wenden nun die Idee des Newton–Verfahrens auf ein spezielles quadratisches Polynom an.Die Betrachtungen dienen als Vorbereitung auf den Beweis des Satzes von Newton-Kantorovichim nächsten Abschnitt, wo wir wie hier [37] folgen. Der Unterschied zum Vorgehen im letztenAbschnitt ist, dass wir die hier die Existenz einer Nullstelle mit dem Newton-Verfahren mitbe-weisen. Klar, bei einem quadratischen Polynom wissen wir über die Existenz von Nullstellen ohneVerfahren Bescheid, es geht hier eine Reihe von Beobachtungen bei der Newton-Iterationsfolge,die wir im nächsten Abschnitt nutzen wollen.

Sei L, b > 0 . Wir betrachten damit das Polynom

g : R −→ R , t 7−→ 1

2Lt2 − t+ b .

unter der Voraussetzung 0 < 2bL ≤ 1 .

Wir fassen die benötigten Aussagen in einer Liste von Beobachtungen zusammen:

(1) Nullstellen von g: t∗ = 1−√1− 2bLL , t∗∗ =

1−√1− 2bLL .

(2) g(t) = 12L(t− t∗)(t− t∗∗) , g

′(t) = 12L((t− t∗) + (t− t∗∗)), t ∈ R .

(3) g ist positiv in [0, t∗) .

(4) g′(t) ≤ L(t− t∗) < 0 , t ∈ [0, t∗) .

(5) g ist monoton fallend in [0, t∗] .

(6) Der Newton-Operator ng : [0, t∗) 3 t 7−→ t− g′(t)−1g(t) ∈ R zu g ist wohldefiniert.

(7) t∗ − ng(t) = −12Lg

′(t)−1(t∗ − t)2 , t ∈ [0, t∗) .

(8) t < ng(t) < t∗ und g(ng(t)) = 12Lg(t)

2g′(t)−2 , t ∈ [0, t∗) .

(9) ng([0, t∗)) ⊂ [0, t∗) .

(10) Die Newton-Iteration wohldefiniert: t0 := 0 , tk+1 := ng(tk) , k ∈ N0 .

(11) tk ∈ [0, t∗) , k ∈ N0 .

(12) Die Folge (tk)k∈N0 ist strikt monoton wachsend.

(13) t∗ − tk+1 = −12Lg

′(tk)−1(t∗ − tk)

2 ≤ 12(t∗ − tk) , k ∈ N0 .

(14) Ist 2bL < 1, dann gilt θ := t∗/t∗∗ < 1 und wir haben

t∗ − tk+1 =1− θ2

1 + θ2L

2√1− 2bL

(t∗ − tk)2 ≤ L

2√1− 2bL

(t∗ − tk)2 , k ∈ N0 .

(15) tk+1 − t∗tk+1 − t∗∗

=(tk − t∗tk − t∗∗

)2, k ∈ N0 .

(16) Ist 2bL < 1, dann gilt

tk = t∗ −θ2

k

1− θ2k2√1− 2bL

L, k ∈ N0 .

51

Page 63: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Wir geben Hinweise zum Beweis von Aussagen, die nicht ganz offensichtlich sind.Zu (2) Satz von Vietá.Zu (6). Folgt aus g(t∗) = 0, 0 = g(t) + g′(t)(t∗ − t) + 1

2L(t∗ − t) , t ∈ R .Zu (7). Folgt aus g(t) > 0, g′(t) < 0 und der Aussage (5).Zu (8). Folgt aus (7) und einer einfachen Rechnung.Zu (10). Beweist man induktiv.Zu (14). Beweist man induktiv.Zu (15). Folgt aus (14).

2.6 Der Satz von Newton-Kantorovich

Erneut gehen wir der Fragestellung „Nullstellen“ nach, und zwar im unendlichdimensionalenKontext. Dazu betrachten wir die Lösung einer nichtlinearen Gleichung:

G(x) = θ . (2.29)

Dabei sei G : U −→ Y mit X,Y Banachräume, U ⊂ X offen. Es geht hier darum, Existenz undEindeutigkeit einer Lösung nachzuweisen und sie konstruktiv zu berechnen. Dazu wollen wir das(iterative) Newton-Verfahren verwenden. Es unterstellt die (lokale) Fréchet-Differenzierbarkeitder Abbildung G . Dann besteht die Iteration des Newton-Verfahrens in

DG(xk)∆xk = −G(xk) , xk+1 := xk +∆xk , k = 0, 1, 2, . . . (2.30)

Dabei ist der Startwert x0 geeignet zu wählen. Um das Newton-Verfahren anwenden zu können,muss notwendigerweise G(xk)−1 für jedes xk existieren und beschränkt sein.

Diese Iteration leitet sich aus der Taylorentwicklung ab:

G(xk +∆) = G(xk) +DG(xk)∆ + o(∆) . (2.31)

Hier ist das berühmte Theorem von Kantorovich ([51]). Der ursprüngliche Beweis ist ziemlichverwickelt, da die Absicherung, dass die Newtonfolge aus (2.30) eine vorgegebene Kugel nichtverlässt, mehrere ineinandergeschachtelte Argumente verlangt, mehr Klarheit wurde durch dieso genannte Majorantenmethode erreicht; siehe [52]. Es sind eine Reihe von erfolgreichen Ver-suchen unternommen worden, den Beweis zu vereinfachen, und die quantitiven Abschätzungenfür die Konvergenzgeschwindigkeit zu verbessern; siehe [31, 65, 86]. Wir folgen ganz eng derBeweisausarbeitung in [37].

Satz 2.38 (Kantorovich, 1939, 1948) Seien X,Y Banachräume, sei U ⊂ X offen, und seiG stetig Fréchet-differenzierbar in U . Sei x0 ∈ U und seien damit die quantitativen Annahmen

(1) DG(x0) ist stetig invertierbar

(2) ‖DG(x0)−1G(x0)‖ ≤ b

(3) ‖DG(x0)−1(DG(u)−DG(v)‖ ≤ L‖u− v‖ , u, v ∈ U

(4) 2bL ≤ 1

erfüllt. Setzet∗ := (1−

√1− 2bL)/L , t∗∗ := (1 +

√1− 2bL)/L .

Ist dannBt∗(x

0) ⊂ U

erfüllt, dann gilt:

52

Page 64: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

(a) Die Folge (xk)k∈N der Iteration xk+1 := xk −DG(xk)−1G(xk), k ∈ N0, existiert.

(b) xk ∈ Bt∗(x0), k ∈ N .

(c) (xk)k∈N konvergiert gegen ein x∗ ∈ Bt∗(x0) mit G(x∗) = θ .

(d) x∗ ist die einzige Nullstelle von G in Bt∗(x0) .

(e)

‖xk+1 − x∗‖ ≤ 1

2‖xk − x∗‖ , k ∈ N0 . (2.32)

(f) Falls in der Voraussetzung (3) die strikte Ungleichung gilt, also 2bL < 1, dann gilt

‖xk+1 − x∗‖ ≤ 1− θ2k

1 + θ2kL

2√1− 2bL

‖xk − x∗‖2 ≤ L

2√1− 2bL

‖xk − x∗‖2 , k ∈ N0 , (2.33)

wobei θ := t∗/t∗∗ < 1, und x∗ ist die eindeutige Nullstelle von G in Bρ(x0) für alle ρ in

[t∗, t∗∗) mit Bρ(x0) ⊂ U .

Beweis:Die quantitativen Voraussetzung und die Newton-Iteration aus (a) sind invariant unter einerlinearen Transformation, die ein topologischer Isomorphismus ist. Daher ist es ausreichend, denSatz unter der vereinfachenden Annahme

X = Y , DG(x0) = I (2.34)

zu beweisen, denn die Transformation x 7−→ DG(x0)G(x) führt auf diese vereinfachte Situation.Sei nun (2.34) zutreffend. Die Argumentation nutzt nun die skalare Funktion g aus dem Abschnitt2.5 und die dort bereitgestellten Ergebnisse; die Bezeichnungen übernehmen wir.Resultat 1Ist u ∈ Br(x

0) und v ∈ Br(x0) ⊂ U, dann gilt:

‖G(u)− (G(v) +DG(v)(u− v))‖ ≤ 1

2L‖u− v‖2 . (2.35)

Beweis dazu:Der Satz von Hahn-Banach liefert λ ∈ X∗ mit

‖λ‖∗ = 1 , 〈λ,G(u)− (G(v) +DG(v)(u− v))〉 = ‖G(u)− (G(v) +DG(v)(u− v))‖

Setze mit a ∈ [0, 1] xa := v + a(u− v) und h(a) := 〈λ,G(xa)− (G(v) +DG(v)(xa − v))〉 . Eineeinfache Rechnung ergibt h′(a) = 〈λ, (DG(xa)−DG(v))(u− v)〉 und h ist stetig differenzierbar.Mit der Voraussetzung (3) folgt h′(a) ≤ La‖u− v‖2 und Integration ergibt das Resultat.Resultat 2Ist t ∈ [0, t∗) und x ∈ Bt(x

0), dann ist DG(x) stetig invertierbar und es gilt

‖DG(x)−1‖ ≤ |g′(t)|−1 ≤ 1 + Lt∗ . (2.36)

Beweis dazu:Wir wissen t∗ ≤ 1/L und damit t ∈ [0, 1/L) . Damit folgt (unter den vereinfachenden Annahmenaus Voraussetzung (2)

‖DG(x)− I‖ ≤ L‖x− x0‖ ≤ Lt < 1 .

Mit der Neumannschen Reihe (siehe [12], Satz 7.31) folgt

‖DG(x)−1‖ ≤ (1− Lt)−1 = |g′(t)|−1 .

53

Page 65: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Offenbar gilt |g′(t)|−1 ≤ 1 + Lt∗ für t ∈ [0, t∗) .Das Resultat 2 rechtfertigt die Definition des so genannten Newton-Operators:

NG : Bt∗(x0) 3 x 7−→ x−DG(x)−1G(x) ∈ X .

Solange x ∈ Bt∗(x0) gilt, ist der Newton-Operator definiert, aber es ist nicht sichergestellt, dass

das Bild NG(x) in Bt∗(x0) liegt. Dies gilt es nun abzusichern. Setze

K(t) := x ∈ Bt(x)|‖ˇG(x)‖ ≤ g(t), t ∈ [0, t∗) , K := ∪t∈[0,t∗)K(t) .

Resultat 3Für t ∈ [0, t∗) und x ∈ K(t) gilt:

(α) ‖DG(x)−1G(x)‖ ≤ −g′(t)−1g(t)

(β) ‖NG(x)− x0‖ ≤ ng(t)

(γ) ‖G(NG(x))‖ ≤ g(ng(t))

(δ) NG(K(t)) ⊂ K(ng(t))

(η) NG(K) ⊂ K

Beweis dazu:Sei x ∈ K(t), t ∈ [0, t∗) . Wir wissen ‖DG(x)−1‖ ≤ |g(t)|−1 (Resultat 2). Daher folgt

‖DG(x)−1G(x)‖ ≤ ‖DG(x)−1‖‖G(x)‖ ≤ |g′(t)|−1g(t)

und (α) ist gezeigt. (β) folgt aus

‖NG(x)− x0‖ ≤ ‖x− x0‖+ ‖DG(x)−1D(x)‖ ≤ t− g(t)g′(t)−1 = ng(t) .

Daraus folgt nun NG(x) ∈ Bt∗(x0) . Dies ergibt mit Resultat 1

‖G(ND(x))− (G(x) +DG(x)(NG(x)− x))‖ ≤ 1

2L‖DG(x)−1G(x)‖2 .

Da G(x) +DG(x)(NG(x)− x) = θ gilt, folgt mit der Identität g(ng(t)) = 12Lg(t)

2g′(t)−2 (sieheBeobachtung (8) im vorhergehenden Abschnitt) die Aussage (γ) . Da t < ng(t) < t∗ gilt (sieheBeobachtung (8) im vorhergehenden Abschnitt), erhalten wir mit (β), (γ) NG(x) ∈ K(ng(t)) .Damit ist auch (δ) gezeigt. Sei x ∈ K, also x ∈ K(t) für ein t ∈ [0, t∗) . Dann ist NG(x) ∈K(ng(t)) ⊂ K . Also gilt (η) .

Nun wissen wir, dass die Newton-Iteration definiert ist, da x0 ∈ K(0) : die Folge (xk)k∈N liegtin K .Resultat 4Die Folge (xk)k∈N der Newton-Iteration ist wohldefiniert und es gilt:

(α) xk ∈ K(tk) ⊂ Bt∗(x0), k ∈ N .

(β) (xk)k∈N konvergiert gegen ein x∗ ∈ Bt∗(x0) .

(γ) G(x∗) = θ .

(δ) ‖x∗ − xk‖ ≤ t∗ − tk , k ∈ N .

54

Page 66: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis dazu:Die Definiertheit der Folge ist schon klar, ebenso xk ∈ K, k ∈ N . Da K ⊂ Bt∗(x

0) gilt, istxk ∈ Bt∗(x

0), k ∈ N . Wegen t0 = 0 ist x0 ∈ K(t0) nach Voraussetzung (2). Induktiv folgtxk ∈ K(tk), k ∈ N . Damit ist (α) bewiesen. Nun erhalten wir mit Resultat 3 (α)

‖xk+1 − xk‖ ≤ tk+1 − tk , k ∈ N .

Da die Folge (tk)k∈N konvergiert (siehe Beobachtung (12), (13) im vorhergehenden Abschnitt),konvergiert auch

∑k∈N0

(tk+1 − tk) und wir folgern daraus, dass (xk)k∈N eine Cauchyfolge ist.Also konvergiert (xk)k∈N gegen ein x∗ ∈ Bt∗(x

0) . Ferner

‖x∗ − xk‖ ≤∑∞

j=k(tj+1 − tj) = t∗ − tk , k ∈ N .

Wegen G(xk) = DG(xk−1)(xk+1 − xk) und ‖DG(x)‖ ≤ 1 + Lt∗, x ∈ Bt∗(x0), erhalten wir

limkG(xk) = θ . Mit der Stetigkeit von G folgt G(x∗) = θ . Damit sind alle Punkte des Resultats

gezeigt.

Nun haben wir noch die Eindeutigkeits- und Konvergenzaussagen zu beweisen.Resultat 5Seien u, v ∈ X, t, s ≥ 0, r > 0 . Ist

‖u− x0‖ ≤ t < t∗, ‖v − x0‖ ≤ r,G(v) = θ, g(s) ≤ 0, Br(x0) ⊂ U,

dann gilt

s > t und ‖v −NG(u)‖ ≤ (s− ng(t))‖v − u‖(s− t)2

(2.37)

Beweis dazu:Wir haben v −NG(u) = DG(u)−1(G(u) +DG(u)(v − u) und da G(v) = θ ist, erhalten wir

‖DG(u)−1(G(u) +DG(u)(v − u)‖ ≤ 1

2L|g′(t)|−1‖v − u‖2 .

Daraus folgt

‖v −NG(u)‖ ≤ L

2|g′(t)|(s− t)2

‖v − u‖(s− t)2

.

Da g′(t) < 0 und g(s) ≤ 0 ist, folgt

s− ng(t) = −g′(t)−1(−g(t)− g′(t)(s− t))

≥ |g′(t)|−1((g(s)− g(t)− g′(t)(s− t)) =L

2|g′(t)|(s− t)2 .

Nun folgen die behaupteten Aussagen unmittelbar.Resultat 6Ist v ∈ Bt∗ mit G(v) = θ, dann gilt:

‖v − xk+1‖ ≤ t∗ − tk+1

(t∗ − tk)2‖v − xk‖2 , ‖v − xk‖ ≤ t∗ − tk , k ∈ N0 . (2.38)

Insbesondere ist x∗ die eindeutig bestimmte Nullstelle von G in Bt∗(x0) .

Beweis dazu:Sei k ∈ N0 . Aus Resultat 4 folgt ‖xk − x0‖ ≤ tk und mit Resultat 6 mit u = xk, t = tk, s = t∗erhalten wir

‖v −NG(xk)‖ ≤ (t∗ − ng(tk))

‖v − xk‖2

(t∗ − tk)2

55

Page 67: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Damit ist die erste Ungleichung schon klar. Wir beweisen die zweite Ungleichung induktiv. Siegilt für k = 0, da v ∈ Bt∗(x

0) und t0 = 0 . Mit der Induktionsvoraussetzung ‖v − xk‖ ≤ t∗ − tkund der ersten Ungleichung folgt ‖v − xk+1‖ ≤ t∗ − tk+1 .Wir wissen schon x∗ ∈ Bt∗(x

0) und G(x∗) = θ . Aus der Konvergenz der Folgen (xk)k∈N und(tk)k∈N gegen x∗ bzw. t∗, folgt mit der zweiten Ungleichung v = x∗ .Resultat 7Wir haben

‖x∗ − xk+1‖ ≤ t∗ − tk+1

(t∗ − tk)2‖x∗ − xk‖2 , k ∈ N0 , (2.39)

‖x∗ − xk+1‖ ≤ 1

2‖x∗ − xk‖ , k ∈ N0 . (2.40)

Zusatz: Ist 2bL < 1, dann gilt

‖x∗ − xk+1‖ ≤ 1− θ2k

1 + θ2kL

2√1− 2bL

‖x∗ − xk‖2 ≤ L

2√1− 2bL

‖x∗ − xk‖2 , k ∈ N0 . (2.41)

Beweis dazu:Die erste Ungleichung folgt mit v := x∗ aus Resultat 6. Da (t∗ − tk+1)(t∗ − tk)

−1 ≤ 12 , und ‖x∗ −

xk‖(t∗−tk)−1 ≤ 1, folgt die zweite Ungleichung. Die dritte Aussage folgt aus den vorhergehendenResultaten.Resultat 8Ist 2bL < 1, t∗ ≤ ρ < t∗∗, und Bρ(x

0) ⊂ U, dann ist x∗ die einzige Nullstelle von G in Bρ(x0) .

Beweis dazu:Annahme: v∗ ∈ Bρ(x

0) und G(v∗) = θ .Mit Resultat 1 folgt mit v = x0, u = v∗ ‖G(x0)+v∗−x0‖ ≤ 1

2L‖v∗−x0‖2 (beachte DG(x0) = I).

Mit der Dreiecksungleichung und der Voraussetzung folgt

‖G(x0) + v∗ − x0‖ ≥ ‖v∗ − x0‖ − ‖G(x0)‖ ≥ ‖v∗ − x0‖ − b

und daher1

2L‖v∗ − x0‖2 ≥ ‖v∗ − x0‖ − b, d. h. g(‖v∗ − x0‖) ≥ 0 .

Dies ergibt ‖v∗ − x0‖ ≤ t∗ . Damit folgt mit Resultat 6, dass G(v∗) = θ gilt und daher v∗ = x∗

ist.Nun sind alle Aussagen des Satzes von Kantorovich bewiesen.

Die Voraussetzungen des Satzes sind invariant gegenüber einer affinen Transformation derAbbildung G . Daher heißt diese Fassung des Satzes auch der affin-invariante Satz von Kanto-rovich; siehe [31]. Wir fügen noch eine nicht affin-invariante Fassung des Satzes an, die zudemauch nicht die Existenz einer Lösung mitbeinhaltet.

Satz 2.39 (Newton-Verfahren) Seien X,Y Banachräume, sei U ⊂ X offen und sei G : U 3x 7−→ G(x) ∈ Y Fréchet-differenzierbar. Sei z ∈ U eine Lösung der Gleichung G(x) = θ andsei DF (z) stetig invertierbar. Es gelte mit Konstanten r, β, L > 0:

Br(z) ⊂ U , ‖DF (z)−1‖ ≤ β , ‖DF (x)−DF (y)‖ ≤ L|x− y| for all x, y ∈ U .

Dann ist für alle x0 ∈ Bδ(z) mit δ := minr, 12βL

die Iteration xk+1 := xk−DG(xk)−1DG(xk)

definiert und liefert eine Folge (xn)n∈N mit

|xn+1 − z| ≤ βL|xn − z|2 ≤ 1

2|xn − z| , n = 0, 1, . . . . (2.42)

56

Page 68: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis:Wir wollen zeigen:

Falls x ∈ Bδ(z) dann ist DF (x) stetig invertierbar und ‖DF (x)−1‖ ≤ 2β .

Sei x ∈ Bδ(z) . Dann setzen wir

η := ‖DF (z)−1(DF (x)−DF (z))‖ ≤ ‖DF (z)−1‖‖DF (x)−DF (z)‖ ≤ βL|x− z| ≤ βLδ ≤ 1

2.

Nun ist DF (x) invertierbar und

DF (x)−1‖ ≤ (1− η)−1‖DF (z)−1‖ ≤ 2β .

Wir zeigen nun induktivxn ∈ Bδ(z) , n = 0, 1, . . . , .

Die Induktionsvoraussetzung ist auf Grund der Voraussetzungen des Satzes schon klar. Sei xn ∈Bδ(z) . Wir haben

xn+1 = xn −DF (xn)−1F (xn) = xn −DF (xn)−1(F (xn)− F (z))

und daherxn+1 − z = DF (xn)−1(F (z)− F (xn)−DF (xn)(z − xn)) .

Dies hat|xn+1 − z| ≤ 2β

L

2|xn − z|2 ≤ βLδ|xn − z| ≤ 1

2|xn − z|

zur Folge und die Induktion ist abgeschlossen.

Bemerkung 2.40 Beachte, dass die Abschätzung (2.42) quadratische Konvergenz der Folge(xn)n∈N zur Lösung z zur Konsequenz hat.

Bemerkung 2.41 Das Newton-Verfahren kann genutzt werden, einen Kandidaten für ein Mi-nimum einer glatten Zielfunktion f : U −→ R zu berechnen, indem man eine Lösung dernotwendigen Bedingung F (x) := ∇f(x) = θ berechnet. Als Herausforderung kommt hier hinzu,dass man sicherstellen möchte, dass die Zielfunktion entlang der Newton-Iteration monoton nichtwachsend ist. Dazu gibt es eine Reihe von Vorschlägen; siehe etwa [83].

2.7 Der Satz von Miranda

Betrachte In := [0, 1]n ∈ Rn . Dies ist offensichtlich eine verschobene und skalierte Einheitskugelbezüglich der l∞-Norm in Rn . Offenbar hat In die Fixpunkteigenschaft. Hier gehen wir eineranderen Fragestellung nach.

Setze mit k ∈ 1, . . . , n

I−k := x ∈ In| xk = 0, I+k := x ∈ In| xk = 1 .

Miranda veröffentlichte 1940 den unten folgenden Nullstellenssatz. Er zeigte auch, dass dieserSatz äquivalent zum Fixpunktsatz von Brouwer für die Einheitskugel bezüglich der l∞-Norm.ist. Das Result, das Miranda bewies, war im wesentlichen eine Wiederentdeckung eines Resultatsvon Poincaré.

57

Page 69: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Satz 2.42 (Poincaré, 1883/C. Miranda, 1940) Sei G = (G1, . . . , Gn) : In −→ Rn stetig.

Es gelte:Gk(I

−k ) ≤ 0 , Gk(I

+k ) ≥ 0 , k = 1, . . . , n . (2.43)

Dann gibt es x∗ ∈ In mit G(x∗) = θ .

Beweis:Siehe [57, 62, 85, 88].

Für n = 1 reduziert sich Satz 2.42 auf den wohlbekannten Zwischenwertsatz der Analysis,der auf Bolzano zurückgeht. Miranda führte den Beweis von Satz 2.42 mit dem BrouwerschenFixpunktsatz. Ein Beweis mit dem Abbildungsgrad wurde von Vrahatis (siehe [89]) gegeben.Eine interessante Anwendung des Satzes finden wir in [64].

Klar, der Bereich In kann zu einem Quader verallgemeinert werden. Hier ist ein Folgerung,die dies miterfasst.

Folgerung 2.43 Sei x ∈ Rn und L = (l1, . . . , ln) ∈ Rn, li > 0, i = 1, . . . , n .Sei Ω := x ∈ Rn||xi − xi| ≤ li, i = 1, . . . , n und

Ω+k := x ∈ Ω|xk = xk + lk , Ω−

k := x ∈ Ω|xk = xk − lk, k = 1, . . . , n .

Sei G = (G1, . . . , Gn) : Ω −→ Rn stetig. Es gelte:

Gk(u) ·Gk(v) ≤ 0 , u ∈ Ω+k , v ∈ Ω−

k , k = 1, . . . , n . (2.44)

Dann gibt es x∗ ∈ Ω mit G(x∗) = θ .

Beweis:Folgt unmittelbar aus Satz 2.42 mit einfachen Transformationen; siehe unten.

Es gibt weitere Verallgemeinerung im endlichdimensioanlen Kontext (siehe [2, 60, 89]). Aufden unendlichdimensional Fall am Beispiel des Hilbertraumes l2 wurde sowohl Satz 2.42 als auchFolgerung 2.43 verallgemeinert; siehe [9, 45, 74, 75].

Satz 2.44 Sei x = (xk) ∈ l2 und L = (lk)k∈N ∈ l2, li ≥ 0, i ∈ N . SeiΩ := x = (xk)k∈N ∈ l2||xi − xi| ≤ li, i ∈ N, und

Ω+k := x = (xk)k∈N ∈ Ω|xk = xk + lk , Ω−

k := x = (xk)k∈N ∈ Ω|xk = xk − lk, k ∈ N .

Sei G = (G1, G2, . . . ) : Ω −→ l2 stetig. Es gelte:

Gk(u) ·Gk(v) ≤ 0 , u ∈ Ω+k , v ∈ Ω−

k , k ∈ N . (2.45)

Dann gibt es x∗ ∈ Ω mit G(x∗) = θ .

Beweis:Da Ω kompakt und G stetig ist, ist auch G(Ω) kompakt, und damit präkompakt. Also gibt es zuε > 0 Punkte y1, . . . , ym ∈ G(Ω), so dass gilt:

∀x ∈ Ω∃ j ∈ 1, . . . ,m(‖G(x)− yj‖ ≤ ε)

Weiterhin gibt es N ∈ N mit∞∑

i=n+1

y2i ≤ ε2 , y ∈ y1, . . . , ym , n ≥ N .

58

Page 70: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Definiere nun hn : Ω −→ l2, n ∈ N, durch

hnj (x) := Gj(x) für 1 ≤ j ≤ n , hnj (x) := 0 sonst .

Ist nun n ≥ N, so gilt:

∀x ∈ Ω ∃ y ∈ y1, . . . , yp(‖G(x)− hn(x)‖ ≤ ‖G(x)− y‖+ (∑∞

i=n+1y2i )

12 ≤ 2ε) .

Setze nun Ωn := [x1 − l1, x1 + l1]× · · · × [xn − ln, xn + ln] ⊂ Rn und definiere gn : Ωn −→ Rn

durchgnj (x) := Gj(x1, x2, . . . , xn, xn+1, xn+2, . . . ) , j = 1, . . . , n .

Unter der Voraussetzung (2.45) existiert nach Folgerung (2.43) ein xn ∈ Ωn mit gn(xn) = θ . Wirsetzen

zn := (xn, xn+1, xn+2, . . . ) .

Dann giltzn ∈ Ω , hn(zn) = θ .

Für n > N haben wir‖G(zn)‖ = ‖G(zn)− hn(zn)‖+ ε ≤ 3ε,

also limnG(zn) = θ . Da Ω kompakt ist, besitzt (zn)n∈N einen Häufungspunkt z ∈ Ω. Dann ist

auf Grund der Stetigkeit von G in z eine Nullstelle der Gleichung G(x) = θ gefunden.

Satz 2.45 Sei L = (lk)k∈N ∈ l2, li ≥ 0, i ∈ N . Sei Ω := x = (xk)k∈N ∈ l2||xi| ≤ li, i ∈ N, undsei F = (F1, F2, . . . ) : Ω −→ l2 stetig. Es gelte für x = (xk)k∈N ∈ Ω :

Fk(x1, x2, . . . , xk−1,−lk, xk+1, . . . ) ≥ 0 , Fk(x1, x2, . . . , xk−1, lk, xk+1, . . . ) ≤ 0 , k ∈ N . (2.46)

Dann gibt es x∗ ∈ Ω mit F (x∗) = x∗ .

Beweis:Betrachte die Abbildung G : Ω 3 x 7−→ F (x)− x ∈ l2 . Da für alle k ∈ N

F (x1, . . . , xk−1,−lk, xk+1, . . . ) ≥ 0 , F (x1, . . . , xk−1,+lk, xk+1, . . . ) ≤ 0

auf Ω, erhalten wir mit Satz 2.44 eine Nullstelle von G, also einen Fixpunkt von F .

2.8 Der Fixpunktsatz von Kakutani

In diesem Abschnitt wollen wir den Brouwerschen Fixpunktsatz auf mengenwertige Abbildun-gen ausdehnen. Eine mengenwertige Abbildung ist eine Abbildung Γ : X −→ Z ,X Menge,Z Familie von Teilmengen einer Menge Y . Wir schreiben dafür kurz Γ : X ⇒ Z . Eine Fix-punktgleichung für eine solche mengenwertige Abbildung Γ zu lösen heißt, x ∈ X zu findenmit

x ∈ Γ(x) (2.47)

Kurz eine Motivation zur Fragestellung. Wir betrachten zwei Spieler A und B denen dieEntscheidungsmengen A bzw.B zur Verfügung stehen. Eine Entscheidungsregel für den SpielerA ist eine mengenwertige Abbildung

EA : B ⇒ POT(A) .

Analog ist eine Entscheidungsregel für den Spieler B definiert:

EB : A ⇒ POT(B) .

59

Page 71: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Definition 2.46 Ein Paar von Entscheidungen (x, y) ∈ A×B wird konsistent genannt, wenngilt:

x ∈ EA(y) , y ∈ EB(x) .

Definieren wir nun die Abbildung

E : A×B ⇒ POT(A)× POT(B) , (x, y) 7−→ (EA(y), EB(x)) ,

so ist die Konistenz von (x, y) gegeben durch

(x, y) ∈ E(x, y) . (2.48)

In (2.48) finden wir eine mengenwertige Fixpunktgleichung vor.

Satz 2.47 (Kakutani, 1941) Sei K eine nicht-leere, kompakte, konvexe Teilmenge von Rn undsei Kon(K) := C ⊂ K|C 6= ∅, C konvex. Sei Γ : K ⇒ Kon(K) . Ist der Graph

GΓ := (x, y)|y ∈ Γ(x), x ∈ K

abgeschlossen, dann gibt es ein x ∈ K mit x ∈ Γ(x) .

Beweis:Nehmen wir, der Satz wäre für den Fall K := B1 bewiesen. Dann ist er sicher ohne Mühe aufjede Kugel K := Br, r > 0, ausdehnbar. Dann ist er aber auch für jede Menge K, die denVoraussetzungen des Satzes entspricht, beweisbar. Man hat K dann nur in eine genügend großeKugel Br einzuschließen (K ist beschränkt!) und eine stetige Abbildung

R : Br −→ K mit R∣∣K

= id

zu finden. Dies leistetR(x) := y mit ‖x− y‖2 = min

u∈K‖x− u‖2 .

Da K kompakt ist, existiert ein solches y = R(x) und ist eindeutig bestimmt: siehe Beweis desBrouwerschen Fixpunktsatzes im Abschnitt 2.9.

Betrachte also nun den Fall K = B1 . Wir führen einen Widerspruchbeweis.Annahme: x /∈ Γ(x) für alle x ∈ B1 .Nach dem Trennungssatz für konvexe Mengen gibt es zu jedem x ∈ B1K ein z ∈ Rn mit

t(z, x) := inf〈z, y − x〉2|y ∈ Γ(x) > 0 .

Also ist Ω(x) := z|t(z, x) > 0 6= ∅ . Für Ω−1(z) := x|t(z, x) < 0 gilt also

K ⊂ ∪z∈RnΩ−1(z) . (2.49)

Ferner gilt:Ω(z)−1 ist relativ offen in B1 für alle z ∈ Rn . (2.50)

Denn anderenfalls gäbe es ein z ∈ Ω(x), sowie eine Folge (xk)k∈N ⊂ B1\Ω(z)−1 mit x = limk xk .

Dann folgtinf〈z, y − xk〉2|y ∈ Γ(xk) ≤ 0 .

Da Γ(xk) kompakt ist, gibt es ein yk ∈ Γ(xk) mit 〈z, yk − xk〉2 ≤ 0 . Die Folge (yk)k∈N besitzteine konvergente Teilfolge, da B1 kompakt ist. Also gelte o. E. y := limk y

k . Da der Graph von Γ

60

Page 72: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

abgeschlossen ist, ist (x, y) im Graph von Γ . Weil z ∈ Ω(x) ist, ist dies ist aber im Widerspruchzu 〈z, y − x〉2 ≤ 0 .

Da B1 kompakt ist, gibt es z1, . . . , zp ∈ Rn mit

B1 ⊂ ∪pi=1Ω

−1(zi) . (2.51)

Damit gilt:Kp := K\Ω−1(zi) ist abgeschlossen für alle i = 1, . . . , p , (2.52)

und es folgt mit di(x) := dist(x,Ai), i = 1, . . . , p,

p∑i=1

di(x) > 0 für alle x ∈ B1 . (2.53)

Wir definieren

gi(x) : di(x)/d(x), i = 1, . . . , p , z(x) :=

p∑i=1

gi(x)zi

und stellen fest: z(x) ∈ Ω(x), z(x) 6= θ . Damit definieren wir die Abbildung

F : B1 3 x 7−→ z(x)

‖z(x)‖2∈ B1 .

F ist stetig und es gilt F (x) ∈ Ω(x) für alle x ∈ B1 . Nach dem Fixpunktsatz von Brouwer gibtes x∗ ∈ B1 mit x∗ = F (x∗) . Nun gilt ‖x∗‖2 = 1 = 〈x∗, x∗〉2 und 0 < inf〈x∗, y−x∗〉2|y ∈ Γ(x∗),da x∗ ∈ Ω(x∗) . Also ist 〈x∗, y〉2 > 〈x∗, x∗〉2 = 1 für alle y ∈ Γ(x∗) . Daraus folgt Γ(x∗)∩B1 = ∅,was ein Widerspruch zu ∅ 6= Γ(x∗) ⊂ B1 ist.

Damit ist der Widerspruchsbeweis geführt.

Als Anwendung zeigen wir die Existenz von Gleichgewichtspunkten bei n-Personenspielen.Ein n-Personenspiel besteht aus den Strategiemengen Xi ⊂ Rm, i = 1, . . . , Xn, die den Spielernzur Verfügung stehen, und aus Auszahlungsfunktionen fi : X1 × · · ·Xn −→ R, i = 1, . . . , n . Esist keine Kooperation unter den Spielern erlaubt.

Definition 2.48 Der i-te Spieler ist mit der Strategiewahl (x1, . . . , xn) ∈ X1×· · ·Xn zufrieden,wenn gilt:

fi(x1, . . . , xi−1, x′i, xi+1, . . . , xn) ≤ fi(x1, . . . , xi−1, xi, xi+1, . . . , xn) für alle x′i ∈ Xi .

Sind alle Spieler mit der Strategiewahl (x1, . . . , xn) zufrieden, dann heißt (x1, . . . , xn) ein Nash-Gleichgewicht.

Satz 2.49 (Nash, 1950) Seien alle Strategiemengen kompakt und seien alle Auszahlungsfunk-tionen fi stetig und konkav6 in der i-ten Koordinate, dann besitzt das Spiel mindestens einNash-Gleichgewicht.

Beweis:Wir definieren für i ∈ 1, . . . ,m eine möglicherweise mengenwertige Abbildung Fi : K :=X1 × · · · ×Xn −→ R durch

Fi(x1, . . . , xn) := argmaxfi(x1, . . . , xi−1, x′i, xi+1, . . . , xn)|x′i ∈ Xi .

6Eine Abildung g ist konkav, wenn −g konvex ist.

61

Page 73: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Da fi konkav in der i-ten Koordinate ist, ist für jedes x = (x1, . . . , xn) die Menge Fi(x) konvex.Da alle fi stetig sind und alle XI kompakte Teilmengen von Rm sind, ist Fi(x) nicht-leer. Nunsetzen wir die Fi zusammen zu

Γ : K := X1 × · · · ×Xn 3 x 7−→ (F1(x), . . . , Fn(x)) ⊂ Rn,

was eine mengenwertige Abbildung Γ : X ⇒ Kon(K) ergibt. Um den Satz von Kakutanianwenden zu können, zeigen wir noch, dass Γ einen abgeschlossenen Graphen besitzt. Dazubetrachten wir eine Folge (xk)k∈N ⊂ K und dazu uk ∈ Γ(xk), k ∈ N ; xk = (x1, . . . , x

kn), u

k =(uk1, . . . , u

kn) , k ∈ N . Es gelte

limkxk = x , lim

kuk = u .

Es gilt für jedes i = 1, . . . , n

fi(x1, . . . , uki , . . . , x

kn) ≥ fi(x1, . . . , u

′i, . . . , x

kn) für alle u′i ∈ Xi . (2.54)

Wäre ui /∈ Fi(xi) für ein i, gäbe es ein u0i ∈ Xi, so dass gilt:

fi(x1, . . . , ui, . . . , xn) < fi(x1, . . . , u0i , . . . , xn) .

Aus der Stetigkeit der Auszahlungsfunktion folgt

fi(x1, . . . , uki , . . . , x

kn) < fi(x1, . . . , u

0i , . . . , x

kn) .

Dies ist aber ein Widerspruch zu (2.54). Also gilt ui ∈ Fi(xi) für alle i = 1, . . . , n und der Graph

von Γ ist abgeschlossen.Nun wenden wir den Fixpunktsatz von Kakutani an und erhalten ein x ∈ K mit x ∈ Γ(x) .

Ein solches x ist offenbar ein Nash-Gleichgewicht.

2.9 Anhang: Ein Beweis des Brouwerschen Fixpunktsatzes

Wir geben hier einen Beweis des Brouwerschen Fixpunktsatzes wieder, der auf Milnor [61] zu-rückgeht. Darstellungen mit dem Versuch, den Beweis zu „glätten“, sind zu finden in [44, 59, 72].

Für n = 1 ist der Satz trivial, der Zwischenwertsatz, der auf Bolzano zurückgeht, erledigtschon alles. Der allgemeine Beweis gliedert sich in zwei Schritte:

1. Beweis füe K = Br (o. E. r = 1). Dies ist der aufwändigste Beweisteil.

2. Projektionstechnik: ein beliebiges K kann als „Projektionsergebnis“ einer umfassenden Ku-gel angesehen werden.

Zu Schritt 1 soll ein Widerspruchsbeweis geführt werden. Dazu nehmen wir an, F sei stetig aufK, besitze aber keinen Fixpunkt. Wir definieren dann eine geeignete Retraktion auf K, die alleElemente aus K auf den Rand ∂K abbildet. Dabei ist der Begriff Retraktion in diesem Kontextwie folgt definiert:

Definition 2.50 Seien U, V Teilmengen von Rn mit U ⊂ V . Eine Abbildung R : V −→ U Yheißt Retraktion, wenn R eingeschränkt auf U Y die Identität auf U ergibt.

1. Schritt: Beweis des Brouwerschen Fixpunktsatzes für den Fall K := B1 .7

7Beachte: Da im Raum Rn alle Normen äquivalent sind, kommt es auf die Wahl der Norm zur Definition einerKugel, wie man im Verlauf des Beweises sieht, hier nicht an.

62

Page 74: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Annahme: F besitzt keinen Fixpunkt in B1 , es gelte also F (x) 6= x für alle x ∈ B1 .Dann gibt es einen eindeutig bestimmten Strahl, der in F (x) beginnt und durch x verläuft. DieserStrahl schneidet den Rand von B1 in einem eindeutig bestimmten Punkt R(x) . Liegt der Punktx in ∂B1, so gilt R(x) = x . Da F und somit auch der Strahl stetig von x abhängt, ist auchx 7−→ R(x) stetig. Weiter ist R : B1 −→ ∂B1K eine Retraktion. Die Abbildung R kann fürPunkte außerhalb von B1 durch

x 7−→ x

‖x‖

zu einer stetigen Abbildung R : Rn −→ ∂B1 fortgesetzt werden.Nun approximieren wir die Abbildung R auf B2 durch ein Polynom p so, dass

‖R− p‖∞ := supx∈B1

|R(x)− p(x)| < 1

gilt. Dies ist nach dem Approximationssatz von Weierstrass möglich; siehe [13], Satz 2.45. Nunfügen wir die Abbildungen p

∣∣B1

undR∣∣Rn\B2

stetig differenzierbar zu einer AbbildungQ : Rn −→Rn zusammen. Dies gelingt mit einer Abbildung λ in folgender Weise:

Q(x) := λ(‖x‖)R(x) + (1− λ(‖x‖)p(x) , x ∈ Rn .

Dabei ist nun die Abbildung λ : [0,∞ −→ [0, 1] noch anzugeben. Hier ist die Wahl:

λ(s) :=

0 , s < 3

2

q(s) , s ∈ [32 , 2]

1 , s > 2

mit q(s) := −16s3 + 84s2 − 144s+ 81 .

Man rechnet nach, dass nun Q : Rn −→ Rn stetig differenzierbar ist.Wir zeigen nun, dass Q(x) 6= θ gilt.

1. Fall: ‖x‖ ≥ 2. Hier ist

Q(x) = R(x) =x

‖x‖, ‖Q(x)‖ = ‖R(x)‖ = 1 .

2. Fall: ‖x‖ < 2 . Wir haben

‖Q(x)‖ = ‖R(x)− (1− λ(‖x‖))R(x) + (1− λ(‖x‖))p(x)‖≥ ‖R(x)‖ − ‖(1− λ(‖x‖))(R(x)− p(x))‖= 1− (1− λ(‖x‖))‖R(x)− p(x)‖> 1− (1− λ(‖x‖)) = λ(‖x‖),

da für ‖x‖ < 2 gilt: ‖R(x)− p(x)‖ < 1, λ(‖x‖) < 1 . Damit gilt nun stets Q(x) 6= θ .Wir definieren

G = (G1, . . . , Gn) : Rn −→ Rn, x 7−→ Q(2x)

‖Q(2x)‖.

Für x ∈ ∂B1 giltQ(2x) = R(2x) = x , G(x) = x .

Also ist G : B1 −→ B1 und G ist eine Retraktion auf ∂B1 . Ferner ist G : B1 −→ B1

Lipschitzstetig, da stetig differenzierbar. Also

‖G(u)−G(v)‖ ≤ LG‖u− v‖ , u, v ∈ B1 (LG ≥ 0) .

63

Page 75: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Wir definieren nun eine Abbildungsschar (Ht)t≥0 durch

Ht : Rn 3 x 7−→ x+ tG(x) ∈ Rn .

Man rechnet nach:Ht : B1 −→ B1+t , Ht : ∂B1 −→ ∂B1+t .

Ht ist setig differenzierbar und Lipschitstetig auf B1 mit Lipschitzkonstante tLG . Daher ist für0 ≤ t < t0 := L−1

G die Abbildung Ht : B1 −→ Bt+1 injektiv. Ferner besitzt nach dem Satz vonder stetigen Inversen Ht, t ∈ [0, t0), in jedem v ∈ Ht(B1) eine lokale Inverse.

Wir zeigen nun, dass Ht für jedes t ∈ [0, t0) surjektiv ist, d. h. dass Ht(B1) = Bt+1 ist. Dazuführen wir die folgendeAnnahme: Es gibt y ∈ B1+t\Ht(B1)zum Widerspruch. Wegen der lokalen Invertierbarkeit können wir y ∈ ∂Ht(B1)\∂B1+t annehmen.Sei (yk)k∈N eine Folge in Ht(B1) mit limk y

k = y . Dazu gibt es eine Folge (xk)k∈N ∈ B1 mitHt(x

k) = yk, k ∈ N . O.E. können wir wegen der Kompaktheit von B1 annehmen, dass (xk)k∈Nkonvergent ist; also x := limk x

k ∈ B1 . Auf Grund der Stetigkeit folgt y = Ht(x) ∈ B1+t . DaHt lokal stetig invertierbar ist, ist y ein innerer Punkt von Ht(B1), was ein Widerspruch zurAnnahme über y ist.

Wegen der Bijektivität von Ht, t ∈ [0, t0), haben wir nach dem Transformationssatz für Inte-grale

vol(B1+t) = ±∫B1

detDHt(x)dx = ±∫B1

det(I + tDG)(x)dx

= ±tn∫B1

detDG(x)dx+ a1tn−1 + · · ·+ a0 .

Andererseits ist vol(B1+t) = (1 + t)nvol(B1) . Koeffizientenvergleich liefert

vol(B1) = ±∫B1

detDG(x)dx .

Da vol(B1) 6= 0 gilt, haben wir einen Widerspruch erreicht, denn da G eine Retraktion ist muss∫B1

detDG(x)dx = 0 gelten.

2. Schritt: Beweis des Brouwerschen Fixpunktsatzes für den allgemeinen Fall.

Wir betrachten den Projektionsoperator PK , der jedes x ∈ Rn auf die Mege K projiziert:

y = PK(x) genau dann, wenn ‖y − x‖ = infu∈K

‖u− x‖ .

Unter den Voraussetzungen des Satzes existiert dieser Projektionsoperator. Ferner ist PK stetig,wie man leicht zeigt.

Wähle eine Kugel BR mit K ⊂ BR . Dann ist die Abbildung F PK : BR −→ BR stetig.Daher gibt es nach dem ersten Teil einen Fixpunkt x von F PK in BR . Da dann F PK(x) in Kliegt, muss auch x in K liegen. Dann ist aber PK(x) = x und ein Fixpunkt von F ist gefunden.

2.10 Anhang: Ein Satz zur Kompaktheit der konvexen Hülle

Wir ergänzen hier den Sachverhalt, dass die konvexe Hülle einer präkompakten Menge wiederpräkompakt ist.

Satz 2.51 (Mazur) Sei X ein normierter Raum und sei M ⊂ X präkompakt. Dann ist auchco(M) präkompakt.

64

Page 76: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

Beweis:Sei ε > 0 . Da M präkompakt ist, gibt es x1, . . . , xn in M mit

M ⊂ ∪ni=1Bε/2(x

i) .

Ist x ∈ co(M), dann lässt sich X darstellen gemäß

x =

m∑i=1

aiyi , y1, . . . , ym ∈M,a1, . . . , am ≥ 0,

m∑i=1

ai = 1 .

Es gibt nun m Koeffizienten j1, . . . , jm, so dass yi − xji ∈ Bε/2, i = 1, . . . ,m . Also folgt

x−m∑i=1

aixji =

m∑i=1

ai(yi − xji) ∈ Bε/2 .

Wir haben also K := co(M) ⊂ co(x1, . . . , xn) + Bε/2 . Offenbar ist K beschränkt. Da Kkonvexe Teilmwenge eines endlichdimensionalen Raumes ist, ist sie auch dort beschränkt unddamit präkompakt. Also gibt es z1, . . . , zk ∈ K mit K ⊂ ∪k

i=1Bε/2(zi) . Dann folgt

K = co(M) ⊂ ∪ki=1Bε(z

i)

und co(M) ist damit präkompakt.

Folgerung 2.52 Sei X ein Banachraum und sei M ⊂ X präkompakt. Dann ist auch co(M)kompakt.

Beweis:In einem vollständigem Raum ist Kompaktheit äquivalent mit Präkompaktheit; siehe [13], Satz2.28.

2.11 Übungen

1.) Sei (X, d) ein vollständiger metrischer Raum und sei U ein topologischer Raum. SeiF : X × U 3 (x, p) 7−→ F (x, p) ∈ X stetig und eine gleichmäßige Kontraktion, d. h. esgibt L ∈ [0, 1) mit

d(F (x, p), F (y, p)) ≤ Ld(x, y) , x, y ∈ X, p ∈ U .

Zeige: Es gibt zu jedem p ∈ U einen eindeutig bestimmten Fixpunkt xp ∈ X von F (·, p)und die Abbildung U 3 p 7−→ xp ∈ X ist stetig.

2.) Betrachte im euklidischen Raum (Rn, ‖ · ‖) eine stetige Abbildung g : Br −→ Rn mit

〈g(x), x〉 ≥ 0 , x ∈ Rn mit ‖x‖ = r .

Zeige: Die Gleichung g(x) = θ besitzt eine Lösung in Br .Hinweis: vergleiche mit Folgerung 2.5.

3.) Sei X ein Banachraum, sei C ⊂ X offen und konvex, θ ∈ C .Zeige: Für alle x ∈ X\C gibt es genau ein σ(x) ∈ (0, 1] mit σ(x)x ∈ ∂C .

4.) Sei X ein Banachraum und sei A ⊂ X kompakt. Betrachte stetige Abbildungen Fi :A −→ X, i ∈ N, und eine Abbildung F : A −→ X . Es gelte limi supx∈A ‖Fi(x) −F (x)‖ = 0 . Zeige:

65

Page 77: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

(a) F ist stetig.(b) Hat jedes Fi einen Fixpunkt, dann hat auch F einen Fixpunkt.

5.) Sei a : [−1, 1] 3 t 7−→ min(1, c|t|) ∈ R mit c > 1 . Betrachte im Banachraum c0 dieAbbildung

F : B1 −→ B1 , (x1, x2, . . . ) 7−→ (1, a(x1), a(x2), . . . ) .

Zeige: F ist wohldefiniert, stetig und es gilt ‖x− F (x)‖ > 1− c−1, x ∈ B1 .

6.) Welche der Funktionen fi, i = 1, . . . , 4 mit

f1(t) := 2t , f2(t) := sin(t) , f3(t) := t2 − 1

2t+

1

2, f4(t) :=

1

1 + t2, t ∈ R ,

bilden das Intervall [0, 1] in sich ab?

7.) Sei f : [0, 1] −→ [0, 1] stetig und surjektiv. Zeige, dass g := f f mindestens zweiFixpunkte besitzt. Gilt dies auch ohne die Voraussetzung „surjektiv“?

8.) Sei f : R −→ R eine Kontraktion. Zeige, dass ein abgeschlossenes Intervall existiert, dasdurch f in sich abgebildet wird.

9.) Betrachte y ∈ l2, A := (aij)i,j=1,...∞ und damit die Abbildung

G : l2 3 x = (xk)k∈N 7−→ (y1 −∞∑j=1

a1jxj , y2 −∞∑j=1

a2jxj , . . . ) ∈ l2 .

Es gelte: Es gibt l = (lk)k∈N mit

aiili ≥ |yi|+∞∑

j=1,j 6=i

|aij |lj , i = 1, 2, . . . .

Zeige: Es gibt x ∈ l2 mit Ax = y .

10.) Betrachte in C[0, 1], versehen mit der Maximumsnorm, den nichtlinearen Operator

G(x)(t) :=

∫ 1

0κ(t, s)f(s, x(s))ds , t ∈ [0, 1], x ∈ C[0, 1] .

Dabei ist κ ∈ C([0, 1]× [0, 1]), f ∈ C([0, 1]× R) .Zeige: Gilt

|f(s, u)− f(s, v)| ≤ L|u− v| , s ∈ [0, 1], u, v ∈ R, L · maxt∈[0,1]

∫ 1

0|κ(t, s)|ds < 1,

so ist G : C[0, 1] −→ C[0, 1] eine Kontraktion.

11.) Sei X ein Banachraum, sei V eine kompakte Teilmenge von X und sei F : V −→ Vkontraktiv, d. h.

∀x, y ∈ V, x 6= y, (‖F (x)− F (y)‖ < ‖x− y‖) . (2.55)

Zeige:

(a) F besitzt genau einen Fixpunkt x .(b) Für jedes x ∈ X konvergiert die Iteration xn+1 := F (xn), x0 = x, gegen x .

Hinweis zu (b): Man kann zeigen, dass die Funktion x 7−→ ‖x − F (x)‖ entlang derIteration monoton fallend ist.

66

Page 78: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

12.) Betrachte in C[0, 1], versehen mit der Maximumnorm, den nichtlinearen Operator

F (x)(t) := t

∫ 1

0x(s)2ds , t ∈ [0, 1], x ∈ C[0, 1] .

Sei 0 < r < 12 .

(a) Zeige: F : Br −→ Br .

(b) Zeige: F : Br −→ Br ist eine Kontraktion.(c) Welchen eindeutig bestimmten Fixpunkt hat F auf Br ?

(d) Hat F noch weitere Fixpunkte in C[0, 1] ?

13.) Sei X ein Banachraum und sei M ⊂ X nicht-leer, konvex, abgeschlossen und beschränkt.Sei f :M −→ X vollstetig und g :M −→ M eine Kontraktion. Es gelte f(M)+g(M) ⊂M . Zeige: F := f + g hat einen Fixpunkt in M .

14.) Sei X ein Banachraum, U ⊂ X offen mit θ ∈ U . Sei F : U −→ X eine Kontraktionund sei F (U) beschränkt. Es gelte eine folgenden Aussagen:

(a) ‖F (x)‖ ≤ ‖x‖ . x ∈ ∂U .

(b) ‖F (x)‖ ≤ ‖x− F (x)‖ . x ∈ ∂U .

(c) ‖F (x)‖ ≤ (‖x‖2 + ‖x− F (x)‖2)12 . x ∈ ∂U .

(d) ‖F (x)‖ ≤ max(‖x‖, ‖x− F (x)‖) . x ∈ ∂U .

(e) −x ∈ U,F (x) = −F (−x) . x ∈ ∂U .

Zeige: F besitzt genau einen Fixpunkt in U .

15.) Sei X ein topologischer Raum, A ⊂ X und sei R : X −→ A eine Retraktion, d. h. R iststetig, R(x) = x für alle x ∈ A . Zeige: Hat X die Fixpunkteigenschaft, dann hat auch Adie Fixpunkteigenschaft.

16.) Sei f : B1 ⊂ Rn −→ ∂B1 stetig. Dann gibt es x ∈ ∂B1 mit f(x) 6= x .

17.) Sei X ein Banachraum und M ⊂ X nicht-leer, abgeschlossen und konvex und θ ∈ M .Sei F :M −→ M vollstetig. Betrachte

MF := x ∈M |x = tF (x) für ein t ∈ (0, 1) .

Zeige: Entweder ist MF unbeschränkt oder F hat einen Fixpunkt.

18.) Sei X ein Banachraum. Eine Abbildung F : X −→ X heißt quasibeschränkt, wenngilt:

F q = infr>0

sup‖x‖≥r

‖F (x)‖‖x‖

<∞

(F q ist die Quasinorm von F )Sei F : X −→ X vollstetig und quasibeschränkt. Zeige: Für alle t mit |t| F q < 1 hat tFeinen Fixpunkt.

19.) Sei Ω ⊂ Rn offen und beschränkt und sei κ : Ω × Ω −→ (0,∞) stetig mit (c, CKonstanten)

0 < c ≤ κ(t, s) ≤ C , t, s ∈ Ω .

Zeige: Das Eigenwertproblem∫Ωκ(t, s)x(s)ds = λx(t) , t ∈ Ω ,

67

Page 79: Aspekte der Nichtlinearen Funktionalanalysisbaumeist/no-shell.pdf · Aspekte der Nichtlinearen Funktionalanalysis SoSe 2013 J. Baumeister1 16. Juli 2013 1Dies sind Aufzeichnungen,

besitzt eine Lösung mit einem positiven Eigenwert λ > 0 und dazugehöriger positiverEigenfunktion x ∈ X := C(Ω,R) .Hinweis: Betrachte auf M := x ∈ X|x(t) ≥ 0, t ∈ Ω,

∫Ω x(s)ds = 1 die Abbildung

F :M −→ M , F (x)(t) :=

∫Ωκ(t, s)x(s)ds∫

Ω

∫Ωκ(t, s)x(s)dsdt

.

20.) Sei X ein Banachraum, sei M ⊂ X nicht-leer, offen, beschränkt, und sei θ ∈ M . SeiF :M −→ M eine vollstetige Abbildung mit ‖F (x)‖ < ‖x‖, x ∈M .Zeige: F besitzt einen Fixpunkt.Gilt der Satz auch ohne die Voraussetzung θ ∈M?

21.) Sei X ein Banachraum und sei M ⊂ X nicht-leer, offen, beschränkt und konvex. SeiF :M −→ X vollstetig und es gelte F (∂M) ⊂M . Ziege, dass F einen Fixpunkt in Mbesitzt.

68