138
Wojciech Kryszewski Rachunek Różniczkowy i Calkowy 3 Wyklad kursowy Wydzial FTIMS Politechnika Lódzka Lódź 2013

Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Wojciech Kryszewski

Rachunek Różniczkowy i Całkowy 3

Wykład kursowy

Wydział FTIMS Politechnika ŁódzkaŁódź 2013

Page 2: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

ISBN xxxxc© Copyright by Wojciech Kryszewski – 2013Skład komputerowy LATEX w wykonaniu autora

Page 3: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Spis treści

Wstęp 1

Bibliografia 2

1 Przestrzeń Euklidesowa 31.1 Podstawowe definicje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Elementy algebry liniowej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.A Macierze i wektory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.B Przekształcenia liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.2.C Wyznaczniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2.D Układy równań liniowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.2.E Przekształcenia wieloliniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.2.F Formy kwadratowe i ich określoność . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.3 Elementy topologii przestrzeni euklidesowych . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.3.A Zbieżność ciągów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.3.B Zbiory otwarte, domknięte i inne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.4 Funkcje i odwzorowania wielu zmiennych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281.4.A Granica funkcji w punkcie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281.4.B Ciągłość funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321.4.C Ciągłość odwzorowań liniowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352 Rachunek różniczkowy 392.1 Pochodne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.1.A Pochodne funkcji wektorowych jednej zmiennej . . . . . . . . . . . . . . . . . . . . . 392.1.B Pochodne kierunkowe i cząstkowe funkcji wielu zmiennych . . . . . . . . . . . . . 402.1.C Różniczkowalność i pochodna funkcji wielu zmiennych . . . . . . . . . . . . . . . . 432.1.D Pochodne odwzorowań . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.1.E Komentarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.1.F Reguła łańcucha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.1.G Twierdzenia o wartości średniej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522.1.H Różniczkowalność i funkcje klasy C1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532.2 Pochodne wyższych rzędów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542.2.A Pochodne drugiego rzędu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542.2.B Pochodne wyższych rzędów funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602.2.C Pochodne wyższych rzędów odwzorowań . . . . . . . . . . . . . . . . . . . . . . . . . . 642.2.D Funkcje i odwzorowania klasy Cn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652.2.E Wzór Taylora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662.2.F Ekstrema funkcji wielu zmiennych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682.3 Teoria odwzorowań . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.3.A Twierdzenie o funkcji uwikłanej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 702.3.B Twierdzenie o lokalnym odwracaniu odwzorowań . . . . . . . . . . . . . . . . . . . . 732.3.C Odwzorowania regularne, dyfeomorfizmy . . . . . . . . . . . . . . . . . . . . . . . . . 742.3.D Różniczkowanie funkcji na zbiorach nieotwartych . . . . . . . . . . . . . . . . . . . . 763 Całka Riemanna funkcji wielu zmiennych 783.1 Całka na prostokącie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 793.1.A Zbiory nieistotne i kryterium całkowalności . . . . . . . . . . . . . . . . . . . . . . . . 833.2 Miara Jordana i ogólna całka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 863.2.A Całka na zbiorach mierzalnych w sensie Jordana . . . . . . . . . . . . . . . . . . . . 92

Page 4: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

ii SPIS TREŚCI3.3 Metody obliczania całek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 943.3.A Całka iterowana na kostce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 943.3.B Twierdzenie Fubiniego i zasada Cavalieriego . . . . . . . . . . . . . . . . . . . . . . . 983.3.C Zastosowania twierdzenia Fubiniego i zasady Cavalieriego . . . . . . . . . . . . . . . 1023.3.D Twierdzenie o zamianie zmiennych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4 Całkowanie form różniczkowych 1084.1 Pola wektorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1084.1.A Zachowawcze pola wektorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1094.2 Całka krzywoliniowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1104.2.A Całka krzywoliniowa I-go rodzaju . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1104.2.B Całka krzywoliniowa II-go rodzaju . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1134.2.C Całka krzywoliniowa i zachowawczość pól wektorowych . . . . . . . . . . . . . . . . 1164.2.D Całka zorientowana vs. całka podwójna - twierdzenie Greena . . . . . . . . . . . . . 1194.3 Algebra zewnętrzna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1194.4 Formy różniczkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1234.4.A Podstawowe definicje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1234.4.B Pochodna zewnętrzna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1254.4.C Przeciwobraz formy różniczkowej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1274.5 Kostki singularne i łańcuchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1284.6 Całka form różniczkowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1294.6.A Całka na kostkach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1294.6.B Całka na k-łańcuchach i twierdzenie Stokesa . . . . . . . . . . . . . . . . . . . . . . . 1314.6.C k-Bryły i twierdzenie Stokesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

Page 5: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Wstęp

Ten skrypt przeznaczony jest dla studentów II roku studiów matematycznych i dotyczy ra-chunku różniczkowego funkcji i odwzorowań wielu zmiennych, całki Riemanna funkcji wie-lu zmiennych oraz elementów analizy wektorowej w przestrzeniach euklidesowych. Materiałprzewidziany jest na semestr. W tekście, oprócz definicji i twierdzeń dołączono pewne ćwicze-nia, a także – w kilku miejscach – zagadnienia uzupełniające dotyczące, na przykład, algebryliniowej. Szczerze zachęcam Czytelników do uważnej lektury również tego uzupełniającegomateriału.Poniżej podano literaturę do wykładu. Charakter uzupełniający mają pozycje oznaczonegwiazdką (∗), a Czytelnikom chcącym istotnie rozszerzyć wiedzę w zakresie analizy polecampozycje oznaczone (∗∗). W spisie brak zbiorów zadań; Czytelnicy znajdą te pozycje samodziel-nie.

Page 6: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Bibliografia

[1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986.[2] (∗) Ryszard Engelking, Topologia ogólna, PWN Warszawa 1975.[3] Grigorij. M. Fichentholz, Rachunek Rózniczkowy i Całkowy , PWN Warszawa 1976.[4] B. R. Gelbaum, J. M. Olmsted, Counterexamples in Analysis, London 1964.[5] (∗) Stanisław Gładysz, Wstęp do topologii, PWN Warszawa 1981.[6] Lech Górniewicz, Roman Ingarden, Analiza matematyczna dla fizyków, Wydawnictwo UMK 1995.[7] Witold Kołodziej, Analiza Matematyczna, PWN Warszawa 1978.[8] (∗∗) Witold Kołodziej, Wybrane rozdziały analizy matematycznej, PWN Warszawa 1982.[9] Wojciech Kryszewski, Wykłady analizy matematycznej; funkcje jednej zmiennej, WydwnictwoUMK 2009.

[10] Franciszek Leja, Rachunek rózniczkowy i całkowy, Wydawnictwo Naukowe PWN Warszawa 2008.[11] (∗∗) Elliott Lieb, Michael Loss, Analysis, GSM AMS 1997.[12] (∗∗) Stanisław Łojasiewicz, Wstęp do teorii funkcji rzeczywistych, PWN Warszawa 1973.[13] (∗∗) Krzysztof Maurin, Analiza, PWN Warszawa 1976.[14] (∗) Andrzej Mostowski, Marceli Stark, Elementy algebry wyższej, PWN Warszawa 1972.[15] (∗∗) Raghavan Narasimhan, Analysis on real and complex manifolds, Masson et Cie Paris 1968.[16] Roman Sikorski, Rachunek różniczkowy i całkowy. Funkcje wielu zmiennych, PWN Warszawa1977.[17] (∗) Helena Rasiowa, Wstęp do matematyki współczesnej, PWN Warszawa 1979.[18] Walter Rudin, Podstawy analizy matematycznej, PWN Warszawa 1969.[19] (∗∗) Walter Rudin, Analiza rzeczywista i zespolona, PWN Warszawa 1985.[20] Ryszard Rudnicki, Wykłady z analizy matematycznej, PWN Warszawa 2006.[21] (∗∗) E. T. Whittaker, G. N. Watson, A Course in Modern Analysis, Cambridge University Press1927.

Page 7: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Rozdział 1Przestrzeń Euklidesowa

1.1 Podstawowe definicje

Dla dowolnego naturalnego N ∈ N kładziemyRN := x = (x1, ..., xN ) | xi ∈ R, i = 1, ..., N.

Innymi słowy RN jest iloczynem kartezjańskim N egzemplarzy zbioru liczb rzeczywistych:RN = R× ...× R︸ ︷︷ ︸

N

.

Elementy x ∈ RN nazywa się punktami lub wektorami, zaś liczby xi , i = 1, ..., N , sąwspółrzędnymi wektora x = (x1, ..., xN ). To dość subtelne rozróżnienie (punkty – wektory)zależy od tego czy RN traktować jako przestrzeń afiniczną lub wektorową.

RN JAKO PRZESTRZEŃ WEKTOROWA Jeśli x, y ∈ RN , przy czym x = (x1, ..., xN ), y =(y1, ..., yN ), oraz α ∈ R, to kładziemyx + y := (x1 + y1, ..., xN + yN ), αx := (αx1, ..., αxN ).

Oczywiście x + y, αx ∈ RN . Podane działania dodawania i mnożenia zewnętrznego przezskalary rzeczywiste maja własności łączności, przemienności, zaś mnożenie jest rozłącznewzględem dodawania (sprawdzić). W związku z tym zbiór RN wraz z tymi działaniami jestprzestrzenią wektorową (lub liniową) nad ciałem R liczb rzeczywistych. Elementem zerowymjest wektor 0, którego wszystkie współrzędne są równe 0.Przestrzeń RN – jako przestrzeń liniowa – ma bazę, tzn. maksymalny układ wektorówliniowo niezależnych. Najczęściej używaną bazę w RN stanowi zbiór tzw. wersorów osi ejNj=1,gdzie ej = (δkj )Nk=1, tzw. baza kanoniczna (1). Tak więc, dla j = 1, ..., N , ej = (0, ..., 0, 1, 0, ..., 0),gdzie 1 występuje na j-tym miejscu.ĆWICZENIE: Sprawdzić, że zbiór ejNj=1 jest bazą w RN .Oczywiście wymiar RN (jako przestrzeni wektorowej nad R) wynosi N : dimRN = N .

1Przypomnijmy, że tzw. delta Kroneckera δkj := 1 gdy k = j ;0 gdy k 6= j.

Page 8: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4 1. PRZESTRZEŃ EUKLIDESOWAILOCZYN SKALARNY I NORMA Dla wektorów x, y ∈ RN określamy iloczyn skalarny tychwektorów

〈x, y〉 = x · y := N∑i=1 xiyioraz normę wektora x

‖x‖ := (∑i=1 x

2i

)1/2 = √x · x.1.1.1 TWIERDZENIE: Iloczyn skalarny i norma mają następujące własności: dla x, y, z ∈ RN

oraz α ∈ R(i) 〈x, y〉 = 〈y, x〉;(ii) 〈αx, y〉 = α〈x, y〉;(iii)〈x + y, z〉 = 〈x, z〉+ 〈y, z〉;(iv) ‖x‖ ≥ 0, ‖x‖ = 0 wtedy i tylko wtedy, gdy x = 0;(v) ‖αx‖ = |α|‖x‖;(vi) |x · y| ≤ ‖x‖‖y‖ (nierówność Cauchy’ego-Schwarza);(vii) ‖x + y‖ ≤ ‖x‖+ ‖y‖ (nierówność trójkąta lub nierówność Minkowskiego);(viii) ‖x − z‖ ≤ ‖x − y‖+ ‖y − z‖.DOWÓD: Własności (i), (ii), (iii), (iv) oraz (v) są natychmiastowe własność (vi) jest innym zapisemnierówności Cauchy’ego-Schwarza (która mówi, że (∑N

i=1 aibi)2≤(∑N

i=1 a2i

)(∑Ni=1 b2

i

) dladowolnych układów a1, ..., aN , b1, ..., bN liczb rzeczywistych). Własność (vii) wynika z nierów-ności Cauchy’ego-Schwarza oraz własności (ii) – (iii):‖x + y‖2 = (x + y) · (x + y) = x · x + 2x · y + y · y ≤

‖x‖2 + 2‖x‖‖y‖+ ‖y‖2 = (‖x‖+ ‖y‖)2.Wreszcie (viii) wynika z (vii) jeśli zastąpić x przez x − y , zaś y przez y − z. ĆWICZENIE: Sprawdzić, że równość |〈x, y〉| = ‖x‖‖y‖ zachodzi wtedy i tylko wtedy, gdyistnieje stała λ ∈ R taka, że x = λy , zaś równość 〈x, y〉 = ‖x‖‖y‖ zachodzi wtedy i tylko wtedy,gdy istnieje λ ≥ 0 taka, ze x = λy .Własności (i) – (iii) pozwalają nazywać RN przestrzenią z iloczynem skalarnym, zaś wła-sności (iv) – (vii) pozwalają nazywać te przestrzeń przestrzenią unormowaną (skończonegowymiaru), tzn. przestrzenią euklidesową.

RN JAKO PRZESTRZEŃ METRYCZNA Własności normy pozwalają uważać, że RN jest prze-strzenią metryczną wraz z odległością (metryką):

d(x, y) := ‖x − y‖, x, y ∈ RN .

Mamy bowiem:(1) d(x, y) = 0 wtedy i tylko wtedy x = y;(2) d(x, y) = d(y, x);(3) d(x, z) ≤ d(x, y) + d(y, z)dla dowolnych x, y, z ∈ RN .Własność (1) wynika wprost z (iv), (2) wynika z (v), zaś (3) to nic innego niż (viii). Wielkość‖x − y‖ mierzy odległość pomiędzy x i y (wykonać ilustrację).

Page 9: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.1. PODSTAWOWE DEFINICJE 5

Podaną normę (i metrykę) w RN nazywa się euklidesową; Czytelnik (przy pomocy np.internetu) powinien przekonać się, że nie są one jedynymi użytecznymi normami i metrykamiw RN : są inne – niekiedy znacznie wygodniejsze. Jednak jedynie ta norma jest „kompatybilna”ziloczynem skalarnym.ĆWICZENIE: Zinterpretować metrykę euklidesową i na przykład nierówność trójkąta wjęzyku geometrycznym.PROSTOPADŁOŚĆ WEKTORÓW Wektory x, y ∈ RN są prostopadłe (piszemy też x⊥y), jeśli

〈x, y〉 = 0. Dla A ⊂ RN , definiujemyA⊥ := x ∈ RN | x⊥a dla dowolnego a ∈ A.

ĆWICZENIE: Jeśli A ⊂ B ⊂ RN , to A ⊂ A⊥⊥ := (A⊥)⊥ oraz A⊥ ⊃ B⊥.Ma miejsce twierdzenie Pitagorasa: jeśli x, y ∈ RN są prostopadłe, to

‖x + y‖ = ‖x‖2 + ‖y‖2.Dowód jest natychmiastowy:

‖x + y‖2 = 〈x + y, x + y〉 = 〈x, x〉+ 2〈x, y〉+ 〈y, y〉 = ‖x‖2 + ‖y‖2.ĆWICZENIE: Podać interpretację (szkolną) geometryczną twierdzenia Pitagorasa.Nierówność Cauchy’ego-Schwarza pozwala interpretować cosinus kąta pomiędzy wekto-rami x, y ∈ RN , x 6= 0 6= y . Mianowicie kładziemy

cos^x, y := 〈x, y〉‖x‖‖y‖ .Z nierówności Cauchy’ego-Schwarza wynika, że | cos^x, y| ≤ 1 i cos^x, y = 1, wtedy itylko wtedy, gdy istnieje λ > 0 taka, że x = λy , czyli wtedy i tylko wtedy, gdy wektory x i ymają ten sam kierunek i zwrot.Zauważmy, że układ (ej )j=1,...,N tworzy bazę ortonormalną w RN , tzn. ‖ej‖ = 1 i 〈ej , ei〉 = δjidla dowolnych j, i = 1, ..., N . Zauważmy też, że jeśli x = (x1, ..., xN ), to dla j = 1, ..., N

〈x, ei〉 = ⟨ N∑j=1 xjej , ei

⟩ = N∑j=1 xj〈ej , ei〉 = xi,

czyli x = ∑Nj=1〈x, ej〉ej . Jeśli więc x = ∑N

j=1 ajej (tzn. aj , j = 1, ..., N , są współczynnikamirozwinięcia x w postaci kombinacji liniowej wersorów (ej )Nj=1), to aj = 〈x, ej〉 (przypomniećdefinicję bazy w przestrzeni liniowej).Zbiór A ⊂ Rn jest prostą przechodzącą przez punkt a ∈ RN o wektorze kierunkowymv 6= 0, gdy

A = x ∈ Rn | x = a + tv, t ∈ R.W takim razie prosta przechodząca przez dwa punkty a, b ∈ Rn , a 6= b, to zbiórA = x = a + t(b − a) | t ∈ R = x = (1− t)a + tb | t ∈ R.

Zauważmy, że gdy a = 0, toA⊥ = y ∈ RN | y⊥v

Page 10: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

6 1. PRZESTRZEŃ EUKLIDESOWAjest hiperpodprzestrzenią prostopadłą do A.

Odcinkiem domkniętym (odp. odcinkiem otwartym) łączącym punkty a, b ∈ R, a 6= b,nazywa się zbiór [a;b] := x = (1− t)a + tb | t ∈ [0, 1](odp. (a;b) := x = (1−t)a+tb | t ∈ (0, 1)). Gdy N = 1 to odcinki są domkniętymi przedziałami(prostej), zaś odcinki otwarte przedziałami otwartymi.Mówimy, że zbiór A ⊂ RN jest wypukły, gdy dla dowolnych a, b ∈ A, a 6= b, [a;b] ⊂ A(uwaga: zbiory wypukłe w R nazywa się przedziałami).Zbiór A ⊂ RN jest ograniczony, gdy istnieje M ≥ 0 takie, że‖x‖ ≤M dla dowolnego x ∈ A.

W ramach ćwiczeń należy umieć przedstawiać graficznie podzbiory R2, R3 itp.ĆWICZENIE: Zilustrować zbiór A punktów (x, y, z) ∈ R3, których współrzędne spełniająnastępujące warunki:(1) x2 + y2 < z2; |z| > 1;(2) x2 + y2 + z2 < 2x; 2|z| < 1;(3) x2 − y2 − z2 > 1; z > 0.Czy zbiory te są ograniczone? czy są wypukłe?FUNKCJE I ODWZOROWANIA Przedmiotem naszego zainteresowania będą funkcje rzeczy-

wiste lub odwzorowania wektorowe wielu zmiennych. Chodzi o funkcje (odwzorowania) po-staci f : A → RM , gdzie dziedzina A ⊂ RN oraz N,M ≥ 1. Jest to funkcja N-zmiennych,przyjmująca wartości w RM . Gdy M = 1,to mowa jest o funkcjach rzeczywistych, zaś gdyM > 1, o funkcjach wektorowych. Funkcje wektorowe nazywa się też odwzorowaniami, prze-kształceniami lub operatorami (2).Mówiąc poglądowo, są to funkcje które punktom (wektorom) x = (x1, ..., xN ) ∈ A przypo-rządkowują punkty (wektory) y = (y1, ..., yM ) = f (x) ∈ RM .Niech πi : RM → R będzie rzutowaniem na i-tą współrzędną, i = 1, ...,M , tzn. funkcjązadaną wzorem πi(y) = πi(y1, ..., yM ) := yi , które punktowi y ∈ RM przyporządkowuje jegoi-tą współrzędną. Niech fi := πi f : A→ R dla i = 1, ...,M . Zatem, dla dowolnego x ∈ A,

f (x) = (f1(x), ..., fM (x)).Piszemy wtedy f = (f1, ..., fM ). Funkcje fj nazywa się (funkcjami) współrzędnymi funkcji (od-wzorowania lub przekształcenia) f . Na ogół badanie f przeprowadza się w oparciu o funkcjewspółrzędne.

PROBLEM DZIEDZINY NATURALNEJ (LUB INTEGRALNEJ) Często mamy do czynienia z od-wzorowaniem (funkcją) zadaną konkretnym wzorem: np.f (x, y) =√ x

x2 + y2 + 2x − 1.W takiej sytuacji obowiązkiem Czytelnika jest wyznaczenie dziedziny naturalnej Df funkcjif , tzn. maksymalnego zbioru punktów (x, y) ∈ R2, dla których wyrażenie f (x, y) ma sens. W

2Ta terminologia jest niesprecyzowana: w gruncie rzeczy odzwierciedla „geometrię” kryjącą się za danym przy-porządkowaniem.

Page 11: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 7

powyższej sytuacji widzimyDf = (x, y) ∈ R2 | (x + 12

)2 + y2 ≥ 14 , (x + 1)2 + y2 < 1 .

Należy umieć również zilustrować graficznie dziedzinę Df .ĆWICZENIE: Wyznaczyć dziedzinę naturalną funkcji:(1) f (x, y) = arc cos x2x+y ;(2) f (x, y) = 1+ln(x−y)√1−x2−y2 ;(3) f (x, y, z) = arc sin(x2 + y2 + z2 − 2z)√2− x2 − y2 − z2.Wykresem (lub grafem) funkcji f : A→ RM nazywa się zbiórGr (f ) := (x, y) ∈ A× RM | y = f (x).POJĘCIE KRZYWEJ Krzywą w RN nazywamy odwzorowanie γ : [a, b] → Rn , gdzie a ≤ bi γ = (γ1, ..., γN ), którego wszystkie współrzędne γj , j = 1, ..., N , są ciągłe (przypomnieć defi-nicję ciągłości funkcji rzeczywistych jednej zmiennej). Krzywa γ zwana jest łukiem zwykłym,gdy jej obcięcie γ|(a,b) jest odwzorowaniem różnowartościowym. Krzywa jest zamknięta, gdy

γ(a) = γ(b). Krzywa jest regularna, gdy dla każdego j = 1, ..., N , γj ∈ C1 (przypomnieć pojęcieróżniczkowalności funkcji rzeczywistych jednej zmiennej i pojęcie klasy C1 gładkości) oraz‖γ ′(t)‖ := √∑N

j=1[γ ′j (t)]2 6= 0 dla t ∈ [a, b], gdzie pochodna γ ′(t) := (γ ′1(t), ..., γN (t)), t ∈ [a, b](w krańcach a, b mamy na myśli odpowiednie pochodne jednostronne – przypomnieć po-jęcie pochodnych jednostronnych (lewo i prawostronnych) dla funkcji rzeczywistych jednejzmiennej).Nośnikiem krzywej γ : [a, b] → RN nazywa się zbiór Γ = γ(t) | t ∈ [a, b], czyli obrazodwzorowania γ .UWAGA: Niekiedy nośnik Γ utożsamia się z krzywą. Wtedy odwzorowanie γ nazywa się

parametryzacją krzywej Γ.ĆWICZENIE: (1) Podaj dwie różne parametryzacje odcinka [p; q], gdzie p = (p1, ..., pN ), q =(q1, ..., qN ) ∈ RN (pierwsza to np. γ = (γ1, ..., γn) : [0, 1] → RN , gdzie γj (t) = pj + t(qj − pj ),j = 1, ..., N , t ∈ [0, 1] (syntetycznie γ(t) = p + t(q − p), t ∈ [0, 1]). Należy wymyślić jeszczeprzynajmniej dwie inne parametryzacje.(2) Co jest nośnikiem krzywej γ : [0, 2π]→ R2, gdzie γ1(t) = 2 cos t , γ2(t) = 3 sin t , t ∈ [0, 2π]?UWAGA: Byłoby wskazane, by Czytelnik przyzwyczaił się do robienia ilustracji na płasz-czyźnie R2 i w przestrzeni R3!1.2 Elementy algebry liniowej

(do czytania w razie potrzeby)1.2.A Macierze i wektory

Przypomnijmy, że macierzą A o M-wierszach i N-kolumnach (M,N ∈ N) (lub macierzą (M ×N)-wymiarową) o współczynnikach rzeczywistych nazywamy funkcję

A : 1, , ...,M × 1, ..., N → R.

Page 12: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

8 1. PRZESTRZEŃ EUKLIDESOWAJeżeli aij := A(i, j) dla 1 ≤ i ≤M , 1 ≤ j ≤ N , to liczby aij nazywamy współczynnikami macierzyA i piszemy A = [aij ] i=1,...M

j=1,...,N lubA =

a11 a12 ... a1Na21 a22 ... a2N... ... . . . ...aM1 aM2 ... aMN

;wyrażenia a1j...

aMj

i [ai1, ai2, ..., aiN ], i = 1, ...,M, j = 1, ..., N,nazywamy odpowiednio j-tą kolumną i i-tym wierszem macierzy A.Zbiór macierzy (M × N)-wymiarowych oznaczamy symbolem MM×N lub MMN (R), jeślichcemy podkreślić, że mamy do czynienia z macierzami o współczynnikach rzeczywistych(oczywiście MMN (C) oznacza zbiór macierzy (M × N)-wymiarowych o współczynnikach ze-spolonych).Jak dobrze wiadomo zbiór MMN jest (rzeczywistą) przestrzenią liniową: dla macierzyA,B ∈ MMN , A = [aij ] i=1,...,M

j=1,...,N , B = [bij ] i=1,...,Mj=1,...,N oraz λ ∈ R,

A + B := [aij + bij ] ∈ MMN oraz λA := [λaij ] ∈ MMN .

Macierzą transponowaną (lub sprzężoną) do macierzy A = [aij ] i=1,...,Mj=1,...,N ∈ MMN nazywamymacierz AT := [bij ] i=1,...,N

j=1,...,M ∈ MNM , gdzie bij = aji dla wszystkich i = 1, ..., N i j = 1 = 1, ...,M .Tak więcAT =

a11 a21 ... aM1a12 a22 ... aM2... ... . . . ...a1N a2N ... aMN

.ĆWICZENIE: Znaleźć macierz transponowaną do macierzy[3 4 5 −11 0 4 2 ]Macierze można mnożyć: jeśli A = [aij ] i=1,...,M

j=1,...,N i B = [bjk] j=1,...,Nk=1,...,K (tzn. A jest macierzą (M×N)-wymiarową, zaś B – macierzą (N×K)-wymiarową), to iloczyn (tzw. iloczyn Cauchy’ego) C = A·Bjest macierzą (M ×K)-wymiarową, C = [cik] i=1,...,M

k=1,...,K , gdziecik := ai1b1k + ai2b2k + ...+ aiNbNk = N∑

j=1 aijbjk, i = 1, ...,M, k = 1, ..., K.Mnożenie macierzy ilustruje poniższy zapis

a11 a12 ... a1N... ... ...ai1 a12 ... aiN... ... ...aM1 aM2 ... aMN

·b11 ... b1k ... b1Kb21 ... b2k ... b2K... ... ...bN1 ... bNk ... bNK

.

Page 13: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 9

Tak więc, ażeby otrzymać wyraz cik należy pierwszy wyraz ai1 z i-tego wiersza macierzy Apomnożyć przez pierwszy wyraz b1k z k-tej kolumny, drugi wyraz tego wiersza przez drugiwyraz tej kolumny i tak dalej. Wreszcie ostatni wyraz i-tego wiersza mnożymy przez ostatniwyraz k-tej kolumny i uzyskane iloczyny należy dodać.ĆWICZENIE: Pomnożyć macierze A i B, gdzieA = [3 4 5 −11 0 4 2 ] ; B =

1 3 9 −31 0 4 22 3 −1 0−9 3 1 0

.Dość szczególną rolę odgrywają macierze wymiaru (N × 1), czyli macierze o N-wierszachi jednej kolumnie. Od tej pory zawsze będziemy utożsamiać wektory (punkty) x = (x1, ..., xN )z „wektorami”, czyli macierzami, jednokolumnowymi

x :=x1x2...xN

.Zauważmy, że taka macierz (wektor) jest macierzą sprzężoną do macierzy jednowierszowej[x1, ..., xN ], czyli

x :=x1x2...xN

= [x1, ..., xN ]T .Opisane utożsamienie jest izomorfizmem przestrzeni liniowej RN oraz MN1Jeśli A = [aij ] i=1,...,M

j=1,...,N ∈ MMN oraz x = [x1, ..., xN ]T ∈ RN , to iloczyn(1.2.1) A · x = y = [y1, ..., yM ]T ∈ RM ,

gdzie(1.2.2) yi := N∑

j=1 aijxj , i = 1, ...,M.

Łatwo dostrzec, że (A · B)T = BT · AT ; a zatem, w szczególności (A · x)T = xT · AT .Zauważmy wreszcie, że dla x, y ∈ RN ,〈x, y〉 = xT · y.

Symbol · mnożenia macierzy często opuszcza się pisząc AB lub Ax.W świetle przyjętych oznaczeń ma sens następująca (i dość wygodna notacja). Niech A =[aij ] i=1,...,Mj=1,...,N ∈ MMN i niech

aj = a1j...aMj

, j = 1, ..., N,

Page 14: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

10 1. PRZESTRZEŃ EUKLIDESOWAtzn. aj = [a1j , ..., aMj ]T ∈ RM , będzie j-tą kolumną A, j = 1, ..., N . Piszemy wtedy(1.2.3) A = [a1|a2|....|aN ].Tak więc zapis ten uwzględnia wektorowy charakter kolumn: macierz A powstaje poprzez„ułożenie” obok siebie N-kolumn (wektorów) aj , j = 1, ..., N . Ma wobec tego sens następującadefinicja.

Rzędem kolumnowym macierzy A ∈ MMN nazywa się maksymalną liczbę rank A jejliniowo niezależnych kolumn. Podobnie można mówić o rzędzie wierszowym macierzy A.Każdy jej wiersz można traktować jako wektor [ai1, ai2, ..., aiN ]T ∈ RN i, wobec tego, rzędemwierszowym macierzy A nazywa się maksymalną liczbę jej liniowo niezależnych wierszy. Tzw.twierdzenie o rzędzie orzeka, że rząd wierszowy i kolumnowy są równe. Stąd wspólną ichwartość nazywa się rzędem macierzy. Oczywiście rank A ≤ minM,N.ĆWICZENIE: Znaleźć rząd macierzy:

A = 3 4 5 −11 0 4 22 8 0 2

1.2.B Przekształcenia liniowe

Wśród odwzorowań wielu zmiennych określonych na przestrzeni RN i o wartościach w RMszczególną rolę odgrywają przekształcenia liniowe, stanowiące główny przedmiot zaintere-sowania algebry liniowej (a także analizy funkcjonalnej). Przypomnijmy, że przekształcenie(operator, odwzorowanie) A : RN → RM jest liniowe, jeżeli jest jednorodne, tzn. dla dowolnegox ∈ RN i λ ∈ R,

A(λx) = λA(x)oraz addytywne, tzn. dla dowolnych x, y ∈ RN ,A(x + y) = A(x) + A(y).

Łatwo zobaczyć, że przekształcenie A : RN → RM jest liniowe wtedy i tylko wtedy, gdy dladowolnych x, y ∈ RN , λ, µ ∈ R,A(λx + µy) = λA(x) + µA(y).

Zbiór przekształceń liniowych RN → RM oznaczamy symbolem L(RN ,RM ). Zbiór ten jestprzestrzenią liniową nad ciałem R wraz z dodawaniem i mnożeniem przez skalary rzeczywisteokreślonymi następująco: dla A,B ∈ L(RN ,RM ) i λ ∈ R,(A+ B)(x) := A(x) + B(x), (λA)(x) := λA(x), x ∈ RN ;

łatwo zobaczyć, że tak określone przekształcenia A+ B i λA są liniowe.Złożenie B A : RN → RK przekształceń liniowych A : RN → RM , B : RM → RK jestprzekształceniem liniowym.Jeśli A : RN → RM jest przekształceniem liniowym, to jądrem A nazywamy zbiórKerA := x ∈ RN | A(x) = 0

(czasem stosowany jest też symbol N(A)), zaś obrazem lub zakresem nazywa się zbiórImA = y = A(x) | x ∈ RN

Page 15: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 11

(czasem używa się symbolu R(A)). Jest jasne, że KerA i ImA są podprzestrzeniami liniowymiodpowiednio w RN i RM ; stąd dim KerA ≤ N i dim ImA ≤ M . Dobrze znane i bardzo ważnetwierdzenia Kroneckera-Capelliego orzeka, że

dim KerA+ dim ImA = N,

z którego wynika, że przekształcenie A jest injekcją wtedy i tylko wtedy, gdy N ≤ M idim ImA = N (lub równoważnie: KerA = 0) oraz A jest surjekcją wtedy i tylko wtedy,gdy N ≥M i dim ImA = M (lub równoważnie: dim KerA = N −M).Przekształcenia liniowe injektywne nazywa się monomorfizmami, surjektywne – epimor-fizmami, zaś bijektywne – izomorfizmami. Zauważmy, że jeśli przekształcenie liniowe A ∈L(RN ,RM ) jest bijekcją (izomorfizmem), to N = M i przekształcenie odwrotne A−1 : RN → RNjest także liniowe (sprawdzić).Jeśli A : RN → RM jest przekształceniem liniowym, to przekształcenie transponowaneAT : RM → RN zdefiniowane jest następująco: dla y ∈ RM ,

AT (y) := x ∈ RN ⇐Ñ dla dowolnego z ∈ RN , 〈z, x〉 = 〈A(z), y〉.Łatwo zobaczyć, że AT jest poprawnie zdefiniowanym przekształceniem liniowym i

ImAT = (KerA)⊥, KerAT = (ImA)⊥.Pokażemy dla przykładu pierwszą równość. Jeśli x = AT (y), gdzie y ∈ RM , oraz z ∈ KerA,to 〈z, x〉 = 〈A(z), y〉 = 0, czyli x ∈ (KerA)⊥. To dowodzi, że ImAT ⊂ (KerA)⊥. Pokażemyteraz, że (ImAT )⊥ ⊂ KerA; to wystarczy, gdyż wówczas ImAT = (ImAT )⊥⊥ ⊃ (KerA)⊥. Niechz ∈ (ImAT )⊥; zatem dla każdego y ∈ RM , 〈A(z), y〉 = 〈z, AT (y)〉 = 0. Stąd A(z) = 0 i z ∈ KerA.Z podanych wzorów i twierdzenia Kroneckera-Capelliego wynika, że(1.2.4) dim ImAT = dim(KerA)⊥ = N − dim KerA = dim ImA (3).Poza tym widzimy, że A jest monomorfizmem (odp. epimorfizmem) wtedy i tylko wtedy, gdyAT jest epimorfizmem (odp. monomorfizmem).Przypomnijmy, że już powyżej zdefiniowaliśmy rzutowanie πj : RN → R, j = 1, ..., N , naj-tą współrzędną, tzn. πj (x) = xj dla x = (x1, ..., xN ) ∈ RN . Jest to oczywiście przekształcenieliniowe oraz

πj (x) = 〈x, ej〉, x ∈ RN , j = 1, ..., N,gdzie – jak zwykle – ej jest j-tym wektorem z bazy kanonicznej w RN .PRZYKŁAD: Jeśli A = [aij ] i=1,...,Mj=1,...,N ∈ MMN , to przekształcenie A : RN → RM dane, dla x =(x1, ..., xN ) ∈ RN , wzorem A(x) =: y = (y1, ..., yM ), gdzie

y := A · x,

tzn. yi = ∑Nj=1 aijxj , j = 1, ...,M , jest przekształceniem liniowym (byłoby wskazane, by Czytel-nik to dokładnie sprawdził).Powyższy przykład jest uniwersalny w tym sensie, że dla dowolnego przekształcenia A ∈

L(RN ,RM ) istnieje (dokładnie jedna) macierz A = [aij ] i=1,...,Mj=1,...,N ∈ MMN taka, że A(x) = A · x

3W tym miejscu trzeba zauważyć, że RN = KerA⊕ (KerA)⊥ , więc N = dimKerA+ dim(KerA)⊥.

Page 16: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

12 1. PRZESTRZEŃ EUKLIDESOWAdla każdego x ∈ RN (utożsamionego z x = [x1, ..., xn]T ). W tym celu wystarczy przyjąć, że dlai = 1, ...,M i j = 1, ..., N(1.2.5) aij := πi A(ej ),gdzie ej jest j-tym wektorem z bazy kanonicznej w RN , zaś πi : RM → R jest rzutowaniemna i-tą współrzędną. Innymi słowy j-tą kolumnę macierzy A tworzy wektor A(ej ), j = 1, ..., N .Pozostawiamy Czytelnikowi sprawdzenie, że wówczas rzeczywiście

A(x) = A · x

dla każdego x ∈ RN , tzn. A(x) = y , gdzie yi =∑Nj=1 aijxj dla i = 1, ...,M .Warto też zwrócić uwagę na następujący wzór

(1.2.6) πi A(x) = N∑j=1 aijxj , x = (x1, ..., xN ), i = 1, ...,M.

Można również (będąc ostrożnym jeśli chodzi o notację) napisaćaij = 〈ei, A(ej )〉, i = 1, ...,M, j = 1, ..., N,

gdzie „pierwsze” ei oznacza i-ty wektor z bazy kanonicznej w RM , zaś „drugie” ej oznaczaj-ty wektor z bazy kanonicznej w RN (tego typu „błąd” notacyjny, czy raczej nonszalancja,nie powinien jednak prowadzić do nieporozumień dla uważnego Czytelnika; nieraz jeszczebędziemy mieć do czynienia z taką sytuacją).Tak skonstruowaną macierz A nazywamy stowarzyszoną z przekształceniem A i, na od-wrót, przekształcenie liniowe A wyznaczone przez macierz A nazywamy stowarzyszonym zmacierzą.Na przykład przekształcenie identycznościowe I : RN → RN (I(x) := x dla każdego x ∈ RN )jest stowarzyszone z macierzą jednostkowa I := [δij ] i=1,...,n

j=1,...,n (jest to macierz kwadratowa, którama na „przekątnej” jedynki, zaś pozostałe współczynniki są zerami).ĆWICZENIE: Znaleźć macierz przekształcenia: A : R3 → R2 danego wzoremA(x, y, z) = (x − y + z, x + 3z), (x, y, z) ∈ R3.

Pokazaliśmy więc, że istnieje wzajemnie jednoznaczna odpowiedniość pomiędzy zbiorami(a właściwie izomorfizm pomiędzy przestrzeniami liniowymi) L(RN ,RM ) przekształceń linio-wych i MMN macierzy (M × N)-wymiarowych. Odpowiedniość ta jest bijekcją a nawet – jakłatwo zobaczyć – izomorfizmem liniowym, tzn. dla przekształceń A,B ∈ L(RN ,RM ), z którymistowarzyszone są macierze A,B ∈ MMN , sumie A+B odpowiada macierz A+B, zaś iloczynowiλA, gdzie λ ∈ R, odpowiada macierz λA. Izomorfizm ten pozwala utożsamiać przekształcenieA ∈ L(RN ,RM ) z macierzą A ∈ MMN z nim stowarzyszoną. W dalszym ciągu często będzie-my dokonywać tego utożsamienia bez specjalnych komentarzy i nawet niekiedy używać tegosamego symbolu A dla oznaczenia przekształcenia i macierzy z nim stowarzyszonej (należyjednak pamiętać, że formalnie rzecz biorąc, są to różne obiekty).Jest jeszcze jedna miła okoliczność. Otóż, jeżeli B : RK → RN i A : RN → RM są prze-kształceniami liniowymi, z którymi stowarzyszone są macierze B ∈ MNK i A ∈ MMN , to zezłożeniem A B : RK → RM stowarzyszony jest iloczyn macierzowy A · B ∈ MMK .Warto też zauważyć, że jeśli z przekształceniem A ∈ L(RN ,RM ) stowarzyszona jest macierz

Page 17: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 13

A ∈ MMN , to obraz ImA jest podprzestrzenią w RM rozpiętą przez wektory A(ej ), j = 1, ..., N ,czyli kolumny macierzy A. Stąd wynika, że dim ImA = rank A; dlatego też można mówić orzędzie przekształcenia liniowego kładąc rankA = rank A.Niech A ∈ L(RN ,RM ) i niech macierz B ∈ MNM będzie stowarzyszona z przekształceniemtransponowanym AT ∈ L(RM ,RN ). Wtedy, dla dowolnego y ∈ RM i z ∈ RN ,

〈z, AT (y)〉 = zT · (B · y) = (BT · z)T · y.Z drugiej strony, z definicji przekształcenia transponowanego

〈z, AT (y)〉 = 〈A(z), y〉 = (A · z)T · y.Stąd B = AT ; czyli z przekształceniem transponowanym AT stowarzyszona jest macierz trans-ponowana AT . Stąd, między innymi, z równości (1.2.4) wynika, że

rank AT = dim ImAT = dim ImA = rank A,

co stanowi dowód wspomnianego twierdzenia o rzędzie.Przekształcenie liniowe A ∈ L(RN ,RM ) jest monomorfizmem wtedy i tylko wtedy, gdyN ≤M i rząd przekształcenia rankA = rank A jest maksymalny, tzn. równy N ; A jest epimor-fizmem, wtedy i tylko wtedy, gdy N ≥ M i rank A = M . W konsekwencji przekształcenie Ajest izomorfizmem wtedy i tylko wtedy, gdy N = M i rankA = rank A = N . W takiej sytuacjiistnieje przekształcenie odwrotne A−1 : RN → RN (tzn. A−1A = I = AA−1) i jest ono liniowe.Odpowiada mu (stowarzyszona z nim jest) macierz B ∈ MNN taka, że B · A = I = A · B. Tęmacierz nazywamy macierzą odwrotną do A i oznaczamy symbolem A−1. W takim razie ma-cierz A ∈ MMN jest odwracalna (tzn. ma macierz odwrotną) wtedy i tylko wtedy, gdy M = Ni rank A = N (mówimy wtedy też, że macierz A jest nieosobliwa).Wykorzystując powyższą zależność rzędu macierzy i wymiaru obrazu przekształcenia li-niowego z nią stowarzyszonego łatwo pokazać, że jeśli A ∈ MMN , B ∈ MNK , to rank (A ·B) ≤minrank A, rank B; jeżeli rank B = N , to rank (A · B) = rank A, zaś jeśli rank A = N , torank (A · B) = rank B (stąd wynika znane stwierdzenie, mówiące że tzw. operacje elemen-tarne na kolumnach lub wierszach nie zmieniają rzędu macierzy). Jeśli A,B ∈ MMN , torank (A + B) ≤ rank A + rank B, a jeśli M = N , to rank A + rank B−N ≤ rank (A + B).Przekształcenia liniowe φ : RN → R (czyli elementy przestrzeni L(RN ,R) nazywamy funk-cjonałami lub formami liniowymi. Jeżeli φ ∈ L(RN ,R) jest funkcjonałem liniowym, to stowa-rzyszona z nim macierz ma wymiar (1 × N), tzn. jest to macierz jedno wierszowa [a1, ..., aN ],w której (zgodnie ze wzorem (1.2.5))

aj = φ(ej ), j = 1, ..., N.Wobec tego, dla dowolnego x ∈ RN (wykorzystując wzory (1.2.1) i (1.2.2)) mamy

φ(x) = [a1, ..., an] ·x1x2...xN

= N∑j=1 ajxj = 〈a, x〉,

gdzie a = (a1, ..., an).Na odwrót, dla dowolnego a ∈ RN , funkcja φ : RN → R dana wzorem φ(x) := 〈a, x〉, x ∈ RN ,jest funkcjonałem liniowym. Istnieje wobec tego kolejna, już trzecia, wzajemnie jednoznaczna

Page 18: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

14 1. PRZESTRZEŃ EUKLIDESOWAodpowiedniość (izomorfizm): tym razem pomiędzy przestrzenią L(RN ,R) funkcjonałów linio-wych a przestrzenią RN (4).Formalnie rzecz biorąc zdefiniowaliśmy wzajemnie jednoznaczną odpowiedniość U , wktórej każdemu funkcjonałowi φ ∈ L(RN ,R) odpowiada takie wektor U(φ) = a ∈ RN , żeφ(x) = 〈x, a〉 = 〈x,U(φ)〉. Nietrudno zobaczyć, że U jest (wzajemnie jednoznacznym) prze-kształceniem liniowym (tzn. U(φ1 + φ2) = U(φ1) + U(φ2) i U(λφ) = λU(φ) dla dowolnychφ1, φ2, φ ∈ L(RN ,R) oraz λ ∈ R).UWAGA: Zwyczajowo przestrzeń L(RN ,R) funkcjonałów (form) liniowych oznacza się sym-bolem (RN )∗ i nazywa przestrzenią sprzężoną lub dualną do RN . Jest to przestrzeń liniowa. Dlaprzekształcenia A ∈ L(RN ,RM ) można rozważyć przekształcenie A∗ : (RM )∗ → (RN )∗ zadanewzorem: dla dowolnego ψ ∈ (RM )∗,

A∗(ψ) := φ ∈ (RN )∗ gdzie φ(x) = ψ(A(x)), x ∈ RN .

Ponieważ U : (RN )∗ → RN , można więc określić złożenie U A∗ U−1 : RM → RM (ale uwaga:tutaj „pierwsze” z lewej U działa z (RN )∗ do RN , zaś „drugie” – z (RM )∗ do RM ). Sprawdzimy,że AT = U A∗ U−1 : RM → RM . Oznaczmy P := U A∗ U−1. Rzeczywiście, jeśli y ∈ RM ,to U−1(y) := ψ ∈ (RM )∗, gdzie ψ(z) = 〈z, y〉 dla z ∈ RM . Następnie A∗(ψ) := φ ∈ (RN )∗, gdzieφ(x) = ψ(A(x)) dla dowolnego x ∈ RN . Wreszcie U(φ) := a ∈ RN , gdzie dla dowolnego x ∈ RN ,〈x, a〉 = φ(x). Zatem P(y) = a, gdzie 〈x, a〉 = φ(x) = ψ(A(x)) = 〈A(x), y〉 dla każdego x ∈ RN .Tak więc P(y) = AT (y).Uznając, że odpowiedniość U jest „ukryta” w utożsamieniu (RN )∗ z RN , często nie rozróżniasię przekształceń AT i A∗ (nazywając je przekształceniem sprzężonym).

1.2.1 LEMAT (o anulatorze): Załóżmy, że φ ∈ L(RN ,R), A ∈ L(RN ,RM ). Wówczas KerA ⊂ Kerφwtedy i tylko wtedy, gdy istnieje funkcjonał Λ ∈ L(RM ,R) taki, że φ = Λ A.DOWÓD: Dostateczność jest oczywista. Wykażemy konieczność. Przypuśćmy, że φ 6= 0 (jeśliφ = 0, to teza jest oczywista, o ile przyjąć, że Λ = 0). Identyfikujemy φ z niezerowym wektorema ∈ RN taki, że φ(x) = 〈x, a〉 dla dowolnego x ∈ RN .Przypuśćmy, że a 6∈ X := ImAT = AT (RM ), gdzie AT ∈ L(RM ,RN ) jest operatorem sprzę-żonym (transponowanym) do A. Wówczas RN = X ⊕ X⊥ (suma prosta) i a = a1 + a2, gdziea1 ∈ X i a2 ∈ X⊥. Zauważmy, że a2 6= 0, bo gdyby a2 = 0, to a = a1 ∈ X. Skoro a2 ∈ X⊥, to〈a2, x〉 = 0 dla dowolnego x ∈ X; a więc dla każdego z ∈ RM ,

0 = 〈a2, AT (z)〉 = 〈A(a2), z〉.W takim razie A(a2) = 0, czyli a2 ∈ KerA ⊂ Kerφ i

0 = φ(a2) = 〈a2, a〉 = 〈a2, a1 + a2〉 = ‖a2‖2.Wobec tego a2 = 0: sprzeczność.Pokazaliśmy, że a ∈ AT (RM ). Istnieje wobec tego z ∈ RM takie, że a = AT (z). Stąd, dla

4Podczas pierwszej identyfikacji utożsamiamy RN z przestrzenią macierzy MN1 , podczas drugiej: przestrzeńL(RN ,RM ) z MMN , a podczas trzeciej RN z M1N . Istnieje bardzo formalna metoda pozwalająca zrobić porządekw przyjmowanych przez nas utożsamieniach. Otóż biorąc pod uwagę drugą z identyfikacji, utożsamiając RN zMN1 de facto utożsamiamy RN z przestrzenią L(R,RN ), zaś utożsamiając RN z M1N de facto utożsamiamy RN zprzestrzenią L(RN ,R). Ja widać formalne znaczenie obu identyfikacji jest zasadniczo różne. Wyjaśnienie tej istotnejróżnicy będzie zrozumiałe dla wszystkich znających przynajmniej elementy teorii kategorii i funktorów. Ponieważnie mamy zamiaru wchodzić głębiej w tę teorię, powiemy tylko tyle: przyporządkowanie identyfikacyjne, w którymprzestrzeń RN identyfikujemy z MN1 jest funktorem kowariantnym, zaś przyporządkowanie identyfikacyjne, wktórym RN identyfikujemy z M1N jest funktorem kontrawariantnym.

Page 19: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 15

dowolnego x ∈ RN ,φ(x) = 〈x, a〉 = 〈x,AT (z)〉 = 〈A(x), z〉 = Λ A(x)

gdzie Λ(y) = 〈y, z〉 dla y ∈ RM .

1.2.C Wyznaczniki

Przypomnijmy notację (1.2.3). Zgodnie z tą notacją, dla macierzy A = [aij ] i=1,...,Nj=1,...,N ∈ MNN pisze-my

A = [a1|a1|...|aN ],gdzie aj jest j-tą kolumną macierzy A.Wyznacznikiem nazywamy funkcję det :MNN → R spełniającą następujące własności:(i) (Liniowość ze względu na kolumny) Dla dowolnych kolumn (wektorów) a,b ∈ RN oraz

λ ∈ R, det[...|a ± b|...] = det[...|a|...]± det[...|b|...], det[...|λa|...] = λ det[...|a|...];(ii) (Skośna symetryczność) dla dowolnych wektorów a,b ∈ RN ,det[...|a|b|...] = − det[...|b|a|...](5)

(iii) (Normalizacja) det I = 1, gdzie I jest macierzą jednostkową.Z własności (ii) wynika, że jeśli macierz A ma dwie jednakowe kolumny, to det A = 0;ogólniej z własności (i), (ii) oraz (iii) wynika, że det A = 0 wtedy i tylko wtedy, gdy rank A < N(tzn. wtedy i tylko wtedy, gdy macierz jest nieosobliwa).Można wykazać, że istnieje tylko jedna funkcja o podanych własnościach, a wyznacznikmacierzy A = [aij ] można wyliczyć posługując się następującym wzorem rekurencyjnym La-place’a. Niech Mij (A) oznacza macierz wymiaru (N−1)× (N−1) powstałą poprzez wykreśleniei-tego wiersza i j-tej kolumny w macierzy A, tzn.

Mij (A) =

a11 ... a1,j−1 a1,j+1 ... a1N... . . . ... ... . . . ...ai−1,1 ... ai−1,j−1 ai−1,j+1 ... ai−1,Nai+1,1 ... ai+1,j−1 ai+1,j+1 ... ai+1,N... . . . ... ... . . . ...aN1 ... aN,j−1 aN,j+1 ... aNN

.

Wtedy, dla dowolnego j = 1, ..., N , ma miejsce tzw. rozwinięcie Laplace’a względem j-tej ko-lumnydet A = N∑

i=1 (−1)i+jaij det Mij (A)5Równoważnie: dla dowolnej permutacji σ ∈ SN (6) i dowolnych wektorów aj , j = 1, ..., N ,

det[a1|a2|...|aN ] = sgn σ det[aσ (1)|aσ (2)|...|aσ (N)].

Page 20: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

16 1. PRZESTRZEŃ EUKLIDESOWAlub, dla dowolnego i = 1, ..., N , rozwinięcie względem i-tego wiersza

det A = N∑j=1 (−1)i+jaij det Mij (A).

Wyrażenie (−1)i+j det Mij (A) nazywa się dopełnieniem algebraicznym wyrazu aij macierzy A.Warto zauważyć, że jeśli det A 6= 0, to dla dowolnego i = 1, ..., N (odp. dla j = 1, ..., N)istnieje j = 1, ..., N (odp. i = 1, ..., N) takie, że aij det Mij (A) 6= 0.Inny ważny wzór (który często przyjmuje się jako definicję wyznacznika) orzeka, że(1.2.7) det A = ∑

σ∈SN

sgn σ a1σ (1)a2σ (2)...aNσ (N),gdzie SN oznacza zbiór permutacji zbioru 1, ..., N, zaś sgn σ jest znakiem permutacji σ ∈ SN .Wiadomo (i jest to oczywiste w świetle podanych wzorów), że dla każdej macierzy A ∈MNN , det A = det AT

oraz ma miejsce tzw. wzór Cauchy’ego-Bineta (7):det A · B = det A det B,

gdzie B ∈ MNN . Ponadto det(−A) = (−1)N det A.

ĆWICZENIE: Oblicz wyznacznik macierzyA =

8 4 5 −11 0 4 20 1 3 21 0 2 0

Wzór rekurencyjny Laplace’a pozwala na obliczenie współczynników macierzy odwrotnej

A−1 = [bij ] do macierzy nieosobliwej A ∈ MNN . Przypuśćmy, że ta macierz jest odwracalna;wtedy A · A−1 = I i 1 = det(A · A−1) = det A det A−1, czyli det A 6= 0 i det A−1 = 1det A . Ponadtomożna wykazać, że dla dowolnych i, j = 1, ..., N ,bij = (−1)i+j det Mji(A)det A .

ĆWICZENIE: Znajdź macierz X spełniającą równanie:[2 51 3] ·X = [1 −11 2 ]+ 12[6 −102 −2 ] .

Jeśli det A 6= 0, to kolumny macierzy są liniowo niezależne (gdyby tak nie było, to –zgodnie z przyjętą definicją – wyznacznik by znikał); zatem rank A = N . Tym samym widzimy,że macierz A jest nieosobliwa wtedy i tylko wtedy, gdy det A 6= 0.7Jacques Philippe Marie Binet (ur. 2 lutego 1786 w Rennes, zm. 12 maja 1856 w Paryżu) – francuski matematyk,fizyk i astronom. Jacques Philippe Marie Binet był absolwentem École Polytechnique, a następnie wykładowcąna tej uczelni. Zajmował się teorią liczb i algebrą macierzy, jest autorem jawnego wzoru na n-ty wyraz ciąguFibonacciego. Od 1823 roku przez ponad 30 lat zajmował katedrę astronomii w Colle‘ge de France. 1 maja 1821roku został odznaczony Legią Honorową V klasy, w 1843 roku wybrany na członka Francuskiej Akademii Nauk.

Page 21: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 17

Jeśli A ∈ L(RN ,RN ) jest przekształceniem liniowym, to wyznacznikiem A nazwiemy liczbędetA := det A, gdzie A ∈ MNN jest macierzą stowarzyszoną A.Warto też pamiętać, że dla dowolnej macierzy A ∈ MMN , rank A = r wtedy i tylko, gdyistnieje podmacierz kwadratowa B macierzy A wymiaru (r × r) (tzn. macierz powstająca z Apoprzez wykreślenie M − r wierszy i N − r kolumn; przypomnijmy, że rank A ≤ minM,N),której wyznacznik det B 6= 0 i każda podmacierz kwadratowa wymiaru (s× s), gdzie s > r, mawyznacznik równy 0.1.2.D Układy równań liniowych

Rozważmy następujący układ M równań z N niewiadomymia11x1 + a12x2 + ... + a1NxN = b1a21x1 + a22x2 + ... + a2NxN = b2... ...aM1x1 + aM2x2 + ... + aMNxN = bM .w którym liczby aij oraz bi dla i = 1, ...,M , j = 1, ..., N są dane, zaś poszukiwane są liczby xj ,

j = 1, ..., N , zadośćczyniące powyższym równościom.Z układem tym stowarzyszamy tzw. macierz układu, tzn. macierz A = [aij ] i=1,...Mj=1,...,N lub

A =a11 a12 ... a1Na21 a22 ... a2N... ... . . . ...aM1 aM2 ... aMN

.Wówczas rozwiązanie polega na znalezienia takiego wektora x = [x1, ..., xN ]T , że

A · x = b,gdzie b = [b1, ..., bM ]T jest tzw. kolumną wyrazów wolnych (jest to, jak widać, wektor w RM ).Tak więc rozwiązanie danego układu de facto sprowadza się do znalezienia rozwiązania x ∈RN takiego, że A(x) = b, gdzie A jest przekształceniem liniowym odpowiadającym macierzyA. Układ, który nie ma rozwiązań, nazywa się sprzecznym; jeżeli zbiór rozwiązań układujest niepusty, to nazywa się go niesprzecznym. Układ niesprzeczny, który ma dokładnie jednorozwiązanie, nazywa się oznaczonym; układy o więcej niż jednym rozwiązaniu nazywa się nie-oznaczonymi -– w taki przypadku układ ma nieskończenie wiele rozwiązań. Układ niedookre-ślony, w którym jest mniej równań niż niewiadomych, tzn. M < N jest na ogół nieoznaczony;układ nadokreślony mający więcej równań niż niewiadomych (tzn. gdy M > N) zazwyczaj jestsprzeczny; zaś układ, który ma tyle równań co niewiadomych (N = M) jest często oznaczony.Z twierdzenie Kroneckera-Capellego wynika następujący podstawowy fakt.1.2.2 TWIERDZENIE (Kroneckera-Capellego-Rouché (8)): Niech A ∈ MMN . Wówczas:(1) jeśli N > M , to układ Ax = 0 ma rozwiązanie x 6= 0;

8Eugéne Rouché (ur. 18 sierpnia 1832 w Sommiéres, zm. 19 sierpnia 1910 w Lunel) – matematyk francuski. Byłabsolwentem słynnej École Polytechnique w Paryżu, która ukończył w 1852 r. Następnie pracował jako nauczycielmatematyki w (nie mniej słynnym) liceum Karola Wielkiego, profesor w École Centrale. Znane jest jego twier-dzenie z analizy zespolonej (twierdzenie Rouché’go) opublikowane w 1862 r., a także sformułowany to rezultat zalgebry liniowej.

Page 22: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

18 1. PRZESTRZEŃ EUKLIDESOWA(2) układ Ax = b ma rozwiązanie (jest niesprzeczny) wtedy i tylko wtedy, gdy

rank A = rank [a1|a2|...|aN |b],przy czym wówczas zbiór rozwiązań tworzy podprzestrzeń afiniczną wymiaru N − rank A;w szczególności jest to układ oznaczony, gdy rank A = N ;(3) jeśli N = M , to układ Ax = b ma rozwiązanie dla dowolnego b wtedy i tylko wtedy,gdy układ Ax = 0 ma jedynie rozwiązanie zerowe. Macierz Au := [a1|a2|...|aN |b], o której mowa w powyższym twierdzenie nazywa się ma-cierzą dołączoną i powstaje poprzez „dopisanie” po prawej stronie do macierzy A kolumnywyrazów wolnych (patrz też notacja (1.2.3). Oczywiście liczba liniowo niezależnych kolumn wmacierzy dołączonej może być, co najwyżej, większa niż liczba tego rodzaju kolumn w ma-cierzy układu; zatem rank Au ≥ rank A. Warto by Czytelnik przypomniał z wykładu algebryliniowej metody rozwiązywania układów niesprzecznych.W świetle twierdzenia Kroneckera-Capelliego układ kwadratowy Ax = b, tzn. gdy N = M ,jest oznaczony wtedy i tylko wtedy, gdy rank A = N , a więc, gdy det A 6= 0. Wtedy o jegometodzie poszukiwania rozwiązań mówi następujące twierdzenie.1.2.3 TWIERDZENIE (reguła Cramera (9)): Niech A ∈ MNN będzie macierzą kwadratową idet A 6= 0. Wtedy układ Ax = b ma dokładnie jedno rozwiązanie x = [x1, ..., xN ]T , gdzie

xi = det Bidet A , i = 1, ..., N,gdzie Bi := [a1|...|ai−1|b|ai+1|...|aN ] jest macierzą powstałą z A poprzez zastąpienie i-tej ko-lumny przez kolumnę wyrazów wolnych. ĆWICZENIE: (1) Metodą Cramera rozwiązać układ równań: 2x + y − z = −13x + y + z = 0

−x + 2y − 5z = 0.(2) Wykorzystując twierdzenie Kroneckera-Capellego rozwiązać układ równań: 3x − 5y + z − 2t = 0

−x + y − z + 3t = 1.1.2.E Przekształcenia wieloliniowe

Rozważymy jedynie szczególny przypadek. Dla k ∈ N, przekształcenieA : RkN = RN × ...× RN︸ ︷︷ ︸

k

→ RM

nazywamy k-liniowym, jeśli dla każdego i = 1, ..., k przekształcenie A jest liniowe jako funkcjai-tej zmiennej, przy ustalonych pozostałych zmiennych. Tzn. dla dowolnych skalarów α, β ∈ R

9Gabriel Cramer (ur. 31 lipca 1704 w Genewie, zm. 4 stycznia 1752) – szwajcarski matematyk i fizyk. Był uczniemJohanna Bernoulliego (opublikował jego dzieła) i profesorem uniwersytetu w Genewie. Cramer opublikował szeregprac z zakresu teorii wyznaczników (wzory Cramera), analizy matematycznej, teorii krzywych algebraicznych (m.in.badał własności tzw. diabelskiej krzywej) oraz historii matematyki. W 1728 podał propozycję rozwiązania tzw.paradoksu petersburskiego. W 1750 r. podaje (sformułowane poniżej) wzory (ponoć już wcześniej odkryte przezColina Maclaurina w 1729 r.) wyrażające rozwiązanie układu równań za pomocą wyznaczników.

Page 23: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 19

oraz x1, x2, ..., xi−1, x′i, x′′i , xi+1, ..., xk ∈ RN

A(x1, ..., xi−1, αx′i + βx′′i , xi+1, .., xk) =αA(x1, ...xi+1, x′i, xi+1, ..., xk) + βA(x1, ..., xi−1, x′′i , xi+1, ..., xk).

Zbiór przekształceń k-liniowych oznaczamy symbolem Lk(RN ,RM ). Tworzy on przestrzeńliniową z dodawaniem i mnożeniem przez liczby rzeczywiste zdefiniowanymi w oczywisty spo-sób. Zauważmy, że L(RN ,RM ) = L1(RN ,RM ).Przekształcenie k-liniowe A : RkN → RM jest symetryczne, jeżeli dla dowolnej permutacjiσ ∈ Sk oraz x1, ..., xk ∈ RN ,

A(x1, ..., xk) = A(xσ (1), ..., xσ (k));oraz skośnie symetryczne lub alternujące, jeżeliA(x1, ..., xk) = sgn σA(xσ (1), ..., xσ (k)).

Zbiór symetrycznych (odp. alternujących) przekształceń k-liniowych oznaczamy Lks (RN ,RM )(odp. Lk

a(RN ,RM )).ĆWICZENIE: Sprawdzić, że zbiory Lks (RN ,RM ) i Lk

a(RN ,RM ) są podprzestrzeniami liniowymi wLk(RN ,RM ).Podobnie jak w przypadku przekształceń liniowych, z każdym przekształceniem k-liniowymA : RkN → RM można stowarzyszyć macierz wielowskaźnikową (a konkretnie (k+1)-wskaźnikową)A = [aij1j2...jk ] i=1,...,M

js=1,...,N, s=1,...,k , gdzieaij1...jk := 〈ei, A(ej1 , ..., ejk ), i = 1, ...,M, j1, ..., jk ∈ 1, ..., N,

gdzie – jak poprzednio – ei jest i-tym wersorem osi w RM , zaś ejs , s = 1, ..., k, jest js-tym wer-sorem osi w RN . Zatem dla dowolnych x1, ..., xk ∈ RN , gdzie dla s = 1, ..., k, xs = (xs1, ...xsN ),A(x1, ..., xk) = y = (y1, ..., yM ), gdzie(1.2.8) yi = N∑

j1,...jk=1aij1...jkx1j1 · ... · xkjk , i = 1, ...,M.

Jeśli przekształcenie k-liniowe A jest symetryczne, to dla dowolnych i = 1, ...,M , j1, ..., jk ∈1, ...,M i dowolnej permutacji σ ∈ Sk ,(1.2.9) aij1j2...jk = aijσ (1)jσ (2)...jσ (k) ,tzn. liczba aij1...jk nie zależy od porządku wskaźników.Z obserwacją tą wiąże się pewna przydatna konwencja notacyjna, którą teraz pokrótceomówimy.Notacja multiindeksowa

N-wymiarowym multiindeksem nazywamy uporządkowany układ α = (α1, α2, ..., αN ) ∈ ZN+ (10)liczb całkowitych nieujemnych αj (j = 1, ..., N). Dla danych α = (α1, ..., αN ), β = (β1, ..., βN ) ∈ ZN+10Z+ := 0.1, ....

Page 24: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

20 1. PRZESTRZEŃ EUKLIDESOWAwprowadzamy oznaczenia:

α± β := (α1 ± β1, ...αN ± βN ), |α| := N∑j=1 αj , α! := α1!...αN !,

α ≤ β ⇔ ∀ j = 1, ..., N αj ≤ βj

oraz, jeśli α ≤ β, to (βα

) := β!α!(β − α)! .Liczbę |α| nazywa się zwykle długością multiindeksu α. Ponadto, dla danego wektora x =(x1, ..., xN ) ∈ RN , kładziemy

xα = xα11 ...xαNN .

ĆWICZENIE: Aby zrozumieć użyteczność wprowadzonej notacji, polecamy Czytelnikowi wypro-wadzenie wzoru (x1 + ...+ xN )n = ∑α∈ZN+ , |α|=n

n!α!hα.

Przypuśćmy teraz, że A ∈ Lks (RN ,RM ). Niech x = (x1, ..., xN ) ∈ RN . Zgodnie ze wzorem(1.2.8), jeśli y = A(x, x, ..., x) i y = (y1, ..., yM ), to

(1.2.10) yi = N∑j1,...,jk=1aij1...jkxj1 · ... · xjk dla i = 1, ...,M.

We wzorze tym sumowanie odbywa się po wszystkich k-elementowych układach uporządko-wanych (j1, ..., jk), w których js = 1, ..., N dla s = 1, ..., k. Ponieważ A jest odwzorowaniemsymetrycznym, ma zatem miejsce zależność (1.2.9), i iloczyn xj1 ...xjk nie zależy od porządku wwybranym układzie, więc składnik aij1...jkxj1 ...xjk również nie zależy od porządku. Powiemy, żeukłady (j1, ..., jk) oraz (i1, ..., ik) są równoważne, gdy różnią się jedynie porządkiem elementów.Innymi słowy, jeżeli układy (j1, ..., jk) i (i1, ..., ik) są równoważne, toaij1...jkxj1 ...xjk = aii1...ikxi1 ...xik ,tak więc równoważne układy dają ten sam wkład do wzoru (1.2.10). Każdemu układowi postaci(j1, ..., jk) można przyporządkować multiindeks α = (α1, ..., αN ) ∈ ZN+ , gdzie αj , dla j = 1, ..., N ,jest liczbą wystąpień liczby j w układzie (j1, ..., jk). Jest jasne, że wówczas |α| = k orazaij1...jkxj1 · ... · xjk = aiαxα, (∗)

gdzie przyjęliśmy aiα = aij1...jk tzn.aiα = 〈ei, A(ej1 , ..., ejk )〉, i = 1, ...,M, α ∈ ZN+, |α| = k.

Jest jasne, że układom równoważnym odpowiada ten sam multiindeks. Na odwrót, danemumultiindeksowi α ∈ ZN+ o długości |α| = k można przyporządkować układ (j1, ..., jk), w któ-rym 1 występuje α1 razy, 2 występuje α2 razy itd. Opisane przyporządkowania są wzajemniejednoznoznaczne w tym sensie, że układom równoważnym odpowiada ten sam multiindeks,zaś układy odpowiadające multiindeksowi są równoważne. Mówiąc nieco „mądrzej” opisaliśmybijekcję pomiędzy zbiorem klas abstrakcji relacji równoważności układów postaci (j1, ..., jk) azbiorem multiindeksów α ∈ ZN+ o długości k. Należy jeszcze obliczyć liczebność każdej z klas

Page 25: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.2. ELEMENTY ALGEBRY LINIOWEJ 21

abstrakcji tej relacji, tzn. obliczyć ile układów odpowiada danemu multiindeksowi α ∈ ZN+ odługości k.ĆWICZENIE: Stosując indukcję matematyczną nietrudno udowodnić, że liczba ta wynosi k!α!Wobec tego każde wyrażenie (∗) występuje we wzorze k!

α! razy. A zatem zamiast (1.2.10)można napisać(1.2.11) yi = ∑

α∈ZN+ , |α|=kk!α!aiαxα dla i = 1, ...,M.

Czytelnik musi przyznać, że otrzymany wzór (1.2.11) jest znacznie bardziej „ekonomiczny” niżwzór (1.2.10).W szczególności, jeśli φ : R2N → R jest przekształceniem 2-liniowym (mówi się, że φjest funkcjonałem dwuliniowym lub formą dwuliniową), to stowarzyszona jest z nim macierzkwadratowa A = [aij ] i=1,...,N

j=1,...,N ∈ MNN , gdzie aij = φ(ei, ej ) (tutaj ei (odp. ej ) jest i-tym (odp. j-tym)wersorem osi w RN ) oraz dla x = (x1, ...xN ) ∈ RN oraz y = (y1, ..., yN ) ∈ RN ,φ(x, y) = N∑

i,j=1aijxiyj .Łatwo dostrzec, że

φ(x, y) = 〈x,A(y)〉 = xT · A · y,gdzie – jak zwykle – wektory x i y (zapisane w postaci kolumnowej!) odpowiadają x i y ,natomiast A jest przekształceniem liniowym stowarzyszonym z macierzą A.Stąd wynika następująca charakteryzacja form dwuliniowych: przekształcenie φ : RN ×RN → R jest dwuliniowe wtedy i tylko wtedy, gdy istnieje przekształcenie liniowe A : RN → RN

takie, żeφ(x, y) = 〈x,A(y)〉, x, y ∈ RN .Dla dowodu wystarczy zauważyć, że tym istniejącym przekształceniem liniowym jest prze-kształcenie stowarzyszone z macierzą A.Jest jasne, że forma dwuliniowa φ ∈ L2(RN ,R) jest symetryczna wtedy i tylko wtedy, gdymacierz A z nią stowarzyszona jest symetryczna, tzn. A = AT oraz alternująca, gdy A = −AT(w szczególności aii = 0 dla dowolnego i = 1, ..., N .

1.2.F Formy kwadratowe i ich określoność

Niech φ ∈ L2(RN ,R) będzie formą dwulinową. Funkcję F : RN → R daną wzoremF (x) := φ(x, x), x ∈ RN ,

nazywa się funkcjonałem kwadratowym lub formą kwadratową.UWAGA: (i) Funkcja F : RN → R jest formą kwadratową wtedy i tylko wtedy, gdy dla do-wolnych λ ∈ R i x ∈ RN , F (λx) = λ2F (x) oraz przekształcenie ψ : RN ×RN → R, dane wzoremψ(x, y) := 12 (F (x + y) − F (x) − F (y)) dla x, y ∈ RN , jest symetryczną formą dwuliniową (mó-wimy też, że symetryczna forma dwuliniowa ψ odpowiada formie kwadratowej F lub, że jąwyznacza).

Page 26: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

22 1. PRZESTRZEŃ EUKLIDESOWAKonieczność podanego warunku jest oczywista (wystarczy zauważyć, że wtedy ψ(x, y) =12 (φ(x, y)+φ(y, x)), x, y ∈ RN , gdzie φ jest formą dwuliniową z definicji. Dla dowodu dostatecz-ności wystarczy zauważyć, że F (x) = ψ(x, x) dla x ∈ RN .Jeśli F : RN → R jest formą kwadratową, to stowarzyszona z nią jest macierz symetryczna

A = [aij ] i=1,...,Nj=1,...,N ∈ MNN taka, że

F (x) = N∑i,j=1aijxixj , x = (x1, ..., xn) ∈ RN ,

orazaij = 12(F (ei + ej )− F (ei)− F (ej )) = ψ(ei, ej ), i, j = 1, ..., N,lub

F (x) = xT · A · x = 〈x,A(x)〉,gdzie A ∈ L(RN ,RN ) jest przekształceniem stowarzyszonym z macierzą A.1.2.4 DEFINICJA: Mówimy, że forma kwadratowa F : RN → R jest dodatnia (odp. nieujemna,niedodatnia, ujemna), jeżeli dla dowolnego x ∈ RN , x 6= 0, F (x) > 0 (odp. F (x) ≥ 0, F (x) ≤ 0,F (x) < 0).Mówimy, że forma kwadratowa jest dodatnio (odp. ujemnie) określona, jeżeli istnieje stałac > 0 taka, że dla każdego x ∈ RN , x 6= 0, F (x) ≥ c‖x‖2 (odp. F (x) ≤ −c‖x‖2).Jest jasne, że forma kwadratowa F jest ujemnie określona wtedy i tylko wtedy, gdy forma−F jest dodatni określona.1.2.5 FAKT: Forma kwadratowa F : RN → R jest dodatnio (odp. ujemnie) określona wtedy itylko wtedy, gdy jest dodatnia (odp. ujemna).DOWÓD: Oczywiście, jeśli forma F jest dodatnio określona, to jest dodatnia. Na odwrót załóżmy,że forma jest dodatnia. Niech c := infx∈SN−1 F (x) (11). Oczywiście dla każdego x ∈ SN−1,F (x) > 0. Ciągłość F wraz ze zwartością sfery SN−1 implikuje, że c > 0. Jeśli x ∈ RN orazx 6= 0, to ‖x‖1x ∈ SN−1 i c ≤ F (‖x‖−1x) = ‖x‖−2F (x), czyli F (x) ≥ c‖x‖2. To dowodzi dodatniejokreśloności F . Analogicznie pokazujemy, że ujemne formy kwadratowe są ujemnie określone. Następujące twierdzenie stanowi bardzo wygodne kryterium określoności form kwadra-towych.1.2.6 TWIERDZENIE (Sylvestera): Niech F : RN → R będzie formą kwadratową, zaś A =[aij ] i=1,...,N

j=1,...,N macierzą z nią stowarzyszoną. Forma jest dodatnio (odp. ujemnie) określona wtedyi tylko wtedy, gdy dla dowolnego i = 1, ..., N , det Ai > 0 (odp. (−1)i det Ai > 0), gdzie Ai ozna-cza macierz powstałą z macierzy A poprzez odrzucenie ostatnich N − i wierszy i kolumn,tzn.

Ai =a11 a12 ... a1ia21 a22 ... a2i

...... . . . ...

ai1 ai2 ... aii

.Niezbyt przyjemny dowód tego twierdzenia można znaleźć w dobrych podręcznikach al-gebry liniowej.

11Przypomnijmy to, że SN−1 := x ∈ RN | ‖x‖ = 1 jest tzw. (N − 1)-wymiarową sferą.

Page 27: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.3. ELEMENTY TOPOLOGII PRZESTRZENI EUKLIDESOWYCH 23

1.3 Elementy topologii przestrzeni euklidesowych

1.3.A Zbieżność ciągów

Rozważmy ciąg (xn)∞n=1 ⊂ RN (12), gdzie xn = (xn1, ..., xnN ) ∈ RN dla n ∈ N (13). Ciąg tenjest zbieżny do granicy x = (x1, ..., xN ), o ile dla dowolnego ε > 0 istnieje takie n0 ∈ N, że‖xn − x‖ < ε przy n ≥ n0. Piszemy wtedy x = limn→∞ xn lub xn → x przy n→∞UWAGA: Mamy xn → x przy n → ∞ wtedy i tylko wtedy, gdy ciąg liczbowy (‖xn − x‖)∞n=1jest zbieżny do 0 (uzasadnić).Dla uproszczenia notacji często piszemy (xn) zamiast (xn)∞n=1 oraz xn → x zamiast xn → zprzy n→∞ licząc na domyślność Czytelników.Ciąg jest zbieżny, gdy jest zbieżny do jakiejś granicy.ĆWICZENIE: (i) Pokaż, że ciąg zbieżny ma jednoznacznie wyznaczoną granicę.(ii) Udowodnij, że ciąg zbieżny jest ograniczony (tzn. zbiór jego wyrazów jest ograniczony).(iii) Pokazać, że dowolny podciąg ciągu zbieżnego jest również zbieżny do tej samej granicy.(iv) Pokazać, że jeśli każdy właściwy podciąg ciągu (xn) zawiera podciąg zbieżny, to ciąg tenjest zbieżny.1.3.1 FAKT: Ciąg (xn) jest zbieżny do x wtedy i tylko wtedy, gdy dla każdego j = 1, ..., N ,xj = limn→∞ xnj . Tak więc zbieżność ciągu w RN jest równoważna tzw. zbieżności po współ-rzędnych.DOWÓD: Istotnie: jeśli xn → x w RN , to dla dowolnego j = 1, ..., N ,

0 ≤ |xnj − xj | ≤√√√√ N∑

i=1 (xni − xi)2 = ‖xn − x‖ → 0;z twierdzenia o trzech ciągach wnosimy, że xnj → xj , gdy n → ∞. Na odwrót, jeżeli, dladowolnego j = 1, ..., N , xnj → xj , to limn→∞(xnj − xj )2 = 0. Zatem

0 = limn→∞

N∑j=1 (xnj − xj )2.

Ciągłość funkcji √· implikuje, że także limn→∞ ‖xn − x‖ = 0, co jest równoważne zbieżnościciągu (xn) do granicy x. Warto ten fakt zilustrować „graficznie”: jeśli rozpiszemy wyrazy ciągu w postaci nieskoń-czonej tablicy:x1 = (x11, x12, ..., x1N )x2 = (x21, x22, ..., x2N )... ... ... ...xn = (xn1, xn2, ..., xnN )↓ ↓ ↓ ↓x = (x1, x2 , ..., xN ),

12Ten zapis jest niepoprawny; należałoby napisać xn∞n=1 ⊂ RN co znaczy, że zbiór wyrazów ciągu (xn) jestzawarty w RN . Piszemy (xn) ⊂ RN dla skrótu „(xn) jest ciągiem o wyrazach w przestrzeni RN ”13Czytelnik powinien w tym miejscu zrozumieć przyjętą notację: kolejne wyrazy rozważanego ciągu zależą odn ∈ N, poza tym oczywiście – jako elementy przestrzeni RN – posiadają współrzędne. Symbol xnj , n ∈ N, 1 ≤ j ≤ N ,odpowiada j-tej współrzędnej n-tego wyrazu ciągu.

Page 28: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

24 1. PRZESTRZEŃ EUKLIDESOWAw której zbieżność, przy n→∞, ciągu stojącego w lewej kolumnie jest równoważna zbieżnościciągów tworzących kolumny stojące po prawej stronie.UWAGA: W przypadku ciągów o wyrazach w RN nie mówi się o granicach niewłaściwych(przypomnieć to pojęcie w odniesieniu do ciągów liczbowych). Można jednak mówić o takichciągach (xn) ⊂ RN , że ‖xn‖ → ∞. O nich także mówi się niekiedy, że „dążą do nieskończoności”.PRZYKŁADY: Zbadać zbieżność następujących ciągów o wyrazie ogólnym:(1) xn = ( n−12n+1 , 12n , n√n

);(2) xn = (2− 1n , n

2,√n + 1−√n,−1).ĆWICZENIE: Pokaż, że ograniczony ciąg (xn) ⊂ RN ma podciąg zbieżny (tzw. uogólnione

twierdzenie Bolzano-Weierstrassa).To łatwe ćwiczenie ma wiele zastosowań, a poza tym w dowodzie pojawia się dość istotnerozumowanie. Przypuśćmy, że ‖xn‖ ≤M dla wszystkich n ∈ N (ograniczoność zbioru xn∞n=1).Ustalmy j = 1, ..., N . Mamyx2nj ≤

N∑i=1 x

2ni = ‖xn‖2 ≤M2, n ∈ N.

Oznacza to, że ciąg (liczbowy) (xnj )∞n=1 jest ograniczony. Z (klasycznego) twierdzenie Bolzano-Weierstrassa ciąg (xnj ) ma podciąg zbieżny.Problem w tym, że taki podciąg zależy od liczby j . Aby ten problem rozstrzygnąć roz-ważmy szczególny przypadek: N = 2. W pierwszym kroku wybieramy podciąg zbieżny ciągu(xn1). Powiedzmy, że jest to ciąg o numerach n1 < n2 < ..., tzn. wiemy, że ciąg (xnk1)∞k=1 jestzbieżny do granicy x1. W drugim kroku rozważamy ciąg drugich współrzędnych (xnk2)∞k=1. Jestto podciąg ciągu (xn2); niestety nie musi być zbieżny, lecz – jako podciąg ciąg ograniczonego –jest on ograniczony. Ma zatem podciąg zbieżny do granicy x2; jest to podciąg podciągu ciągu(xn2), a zatem jest to też podciąg ciągu (xn2) i ma postać (xnkm2), gdzie nk1 < nk2 < ... jestpodciągiem ciągu (nk)∞k=1. Wreszcie wracamy do zbieżnego do (pod)ciągu (xnk1) zbieżnego dox1. Ciąg (xnkm1)∞m=1 jest jego podciągiem – jest on więc również zbieżny do x1. Tym sposobemuzyskaliśmy podciąg (xnkm1, xnkm2)∞m=1 wyjściowego ciągu (xn = (xn1, xn2)) zbieżny do punktu(x1, x2). Czytelnik powinien uogólnić to rozumowanie na przypadek dowolnego N ≥ 2. Ta-kie „piętrowe” rozumowanie jest obecne w wielu argumentacjach dotyczących funkcji wieluzmiennych i każdy powinien je doskonale zrozumieć i opanować.Przestrzeń metryczna RN jest przestrzenią zupełną, tzn.1.3.2 TWIERDZENIE: Ciąg (xn) ⊂ RN jest zbieżny wtedy i tylko wtedy, gdy spełnia tzw. warunekCauchy’ego (lub jest ciągiem Cauchy’ego), tzn. dla dowolnego ε > 0 znajdzie się taką liczbęn0 ∈ N, że dla n,m ≥ n0, ‖xn − xm‖ < ε.DOWÓD: Zacznijmy od konieczności podanego warunku: zakładamy, że ciąg (xn) jest zbieżny,x = limn→∞ xn , i wybierzmy dowolne ε > 0. Z definicji (zbieżności) wynika, że istnieje liczban0 taka, że ‖xn − x‖ < ε/2, o ile n ≥ n0. Weźmy dowolne n,m ≥ n0. Wtedy ‖xn − x‖ < ε/2oraz ‖x − xm‖ = ‖xm − x‖ < ε/2. Stąd

‖xn − xm‖ = ‖(xn − x) + (x − xm)‖ ≤ ‖xn − x‖+ ‖x − xm‖ < ε/2 + ε/2 = ε.

Dla dowodu dostateczności załóżmy obecnie, że ciąg (xn) spełnia warunek Cauchy’ego. Po-każemy, że ciąg ten jest zbieżny. W tym celu należy skonstruować punkt x = (x1, ..., xN ) i

Page 29: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.3. ELEMENTY TOPOLOGII PRZESTRZENI EUKLIDESOWYCH 25

pokazać, że x = limn→∞ xn . Ustalmy numer współrzędnej j = 1, ..., N . Twierdzę, że ciąg licz-bowy j-tych współrzędnych (xnj ) spełnia warunek Cauchy’ego. W tym celu weźmy ε > 0. Zzałożenia znajdziemy n0 ∈ N takie, że|xnj − xmj | ≤

√√√√ N∑i=1 (xni − xmi)2 = ‖xn − xm‖ < ε.

Wobec tego istnieje xj = limn→∞ xnj ∈ R. Skoro xj jest wyznaczone dla dowolnego j = 1, ..., N ,to uzyskujemy punkt x := (x1, ..., xN ) oraz xn → x przy n → ∞ (bo ma miejsce zbieżność powspółrzędnych). UWAGA: Należy zauważyć, że jeśli ciągi (xn) i (yn) o wyrazach w RN sa zbieżne, to równieżciąg (xn ± yn) jest zbieżny (udowodnić). Co np. będzie granicą ciągu sum?Czy ma sens (w kontekście powyższego) mówić o ciągu iloczynów (xnyn) lub ilorazów(x + n/yn)? Czy ma sens mówić o ciągach „monotonicznych” w RN?ĆWICZENIE: (2) Jeśli ciąg liczbowy (λn) jest zbieżny do 0, zaś ciąg (xn) ⊂ RN jest ograniczony,to λnxn → 0 (dostrzec różnicę: jedno 0 to zero „liczbowe”, drugie zero to wektor w RN – toczęsta okoliczność).(2) Przypuśćmy, że λn ∈ R i λn → λ. Jeśli (xn) ⊂ RN i xn → x, to λnxn → λx.Rzeczywiście‖λnxn − λx‖ ≤ |λn − λ|‖xn‖+ |λ|‖xn − x‖.Pierwszy składnik dąży do 0 z pierwszej części ćwiczenia, drugi też (dlaczego?). Zatem i ichsuma dąży do 0. Reszta wynika z twierdzenia o trzech ciągach.(3) Naśladując powyższy dowód pokazać, że jeżeli xn → x i yn → y , to 〈xn, yn〉 → 〈x, y〉.UWAGA: Do ciągów i manipulacji ciągami należy się dobrze przyzwyczaić: często się ichużywa.

1.3.B Zbiory otwarte, domknięte i inne

Kulą w RN otwartą (odp. domkniętą) o środku w punkcie p ∈ RN i promieniu r > 0 nazywamyzbiórB(p, r) := x ∈ RN | ‖x − p‖ < r (odp. D(p, r) := x ∈ RN | ‖x − p‖ ≤ r).Wygodnie też mówić o tzw. sąsiedztwie

S(p, r) := x ∈ RN | 0 < ‖x − p‖ < r.

ĆWICZENIE: Opisać analitycznie kulę otwartą i domkniętą na płaszczyźnie R2 i w przestrzeniR3. UWAGA: Ciąg (xn) ⊂ RN jest zbieżny do x, tzn. xn → x, o ile każda kula o środku w xzawiera prawie wszystkie wyrazy ciągu (uzasadnić to stwierdzenie przypominając frazę „prawiewszystkie).UWAGA: Kule otwarte o środku w punkcie p nazywa się czasem jego otoczeniami, zaś są-siedztwa otoczeniami „nakłutymi”. Terminologia jest jasna z geometrycznego punktu widzenia.Niech A ⊂ RN . Punkt x ∈ A jest punktem wewnętrznym, gdy istnieje liczba r > 0 taka, żeB(x, r) ⊂ A.

Page 30: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

26 1. PRZESTRZEŃ EUKLIDESOWAZBIORY OTWARTE Zbiór U ⊂ RN jest otwarty, gdy każdy jego punkt jest punktem we-wnętrznym; a zatem: dla dowolnego x ∈ U istnieje taka liczba rx > 0 (zależna od x), że

B(x, rx) ⊂ U .ĆWICZENIE: (1) Pokazać, że kula otwarta B(p, r) jest zbiorem otwartym.(2) Udowodnić, że jeśli w rodzinie Uii∈I (skończonej lub nie) każdy ze zbiorów Ui ⊂ RN ,i ∈ I , jest otwarty, to suma mnogościowa ⋃i∈I Ui jest zbiorem otwartym.(3) Pokazać, że powyższy fakt jest prawdziwy dla iloczynu mnogościowego jedynie dlarodzin skończonych.

ZBIORY DOMKNIĘTE Zbiór K ⊂ RN jest domknięty, gdy jego dopełnienie RN \ K jestotwarte.PRZYKŁAD: Kula domknięta D(p, r) jest zbiorem domkniętym.Rzeczywiście: pokażemy, że dopełnienie RN \ D(p, r) jest otwarte. Weźmy x 6∈ D(p, r),tzn. ‖x − p‖ > r. Niech rx = ‖x − p‖ − r > 0. Pokażemy, że B(x, rx) ⊂ RN \ D(p, r), tzn.B(x, rx) ∩ D(p, r) = ∅. Gdyby tak nie było, to znalazłby się punkt y ∈ B(x, rx) ∩ D(p, r), czyli‖x − y‖ < rx oraz ‖p − y‖ ≤ r; a więc

‖x − p‖ ≤ ‖x − y‖+ ‖y − p‖ < rx + r = ‖x − p‖ :sprzeczność.ĆWICZENIE: Iloczyn mnogościowy dowolnej rodziny zbiorów domkniętych jest domknięty,a suma skończonej rodziny zbiorów domkniętych jest domknięta.ĆWICZENIE: (1) Który ze zbiorów z ćwiczenia ze strony 6 jest otwarty, a który domknięty?(2) Wykaż, że zbiór par (p, q) takich, że trójmian x2 + px + q ma pierwiastki rzeczywistejest zbiorem domkniętym.1.3.3 TWIERDZENIE: (Ciągowa charakteryzacja domkniętości zbioru) Zbiór K ⊂ RN jest do-mknięty wtedy i tylko wtedy, gdy wraz z każdym ciągiem zbieżnym elementów zbioru Knależy doń granica, tzn. jeśli (xn) ⊂ K i xn → x, to x ∈ K.DOWÓD: Konieczność: Niech (xn) ⊂ K i x = limn→∞ xn . Przypuśćmy, że x 6∈ K; czyli x ∈ RN \K.Ten zbiór jest otwarty; zatem istnieje takie r > 0, że B(x, r)∩K = ∅. Z drugiej strony (ze zbież-ności wynika, że) do kuli B(x, r) należą prawie wszystkie wyrazy ciągu: sprzeczność.Dostateczność: Przypuśćmy nie wprost, że zbiór K nie jest domknięty, tzn. jego dopełnie-nie nie jest otwarte, czyli znajdzie się punkt x 6∈ K, który nie jest punktem wewnętrznymdopełnienia. Innymi słowy każda kula wokół x ma punkty wspólne z K (jeszcze inaczej: x jestpunktem skupienia zbioru K). Zatem dla każdego n ∈ N znajdzie się punkt xn ∈ K ∩B(x, 1/n).Oznacza to, w szczególności, że xn → x (rzeczywiście 0 ≤ ‖xn − x‖ < 1/n → 0). Z założeniax ∈ K: sprzeczność.

PUNKTY SKUPIENIA Niech p ∈ RN i A ⊂ RN . Mówimy, że p jest punktem skupienia zbioruA, gdy dla każdego r > 0 przecięcie S(p, r)∩A 6= ∅. Innymi słowy w każdym otoczeniu punktup znajdą się punkty ze zbiory A od niego różne.UWAGA: Punkty skupienia zbioru A nie muszą do A należeć!ĆWICZENIE: (1) Pokazać, że p jest punktem skupienia zbioru A wtedy i tylko wtedy, gdyistnieje ciąg (xn) ⊂ A taki, że xn 6= p dla wszystkich n ∈ N oraz xn → p przy n→∞.(2) Sprawdź, że dowolny punkt p ∈ RN taki, że ‖p‖ = 4 jest punktem skupienia kuli B(0, 4).(3) Pokazać, że zbiór K jest domknięty wtedy i tylko wtedy, gdy w jego dopełnieniu nie mapunktów skupienia zbioru K.

Page 31: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.3. ELEMENTY TOPOLOGII PRZESTRZENI EUKLIDESOWYCH 27

Punkt p ∈ A, który nie jest punktem skupienia nazywa się punktem izolowanym zbioru.BRZEG ZBIORU Brzegiem zbioru A ⊂ RN nazwiemy zbiór punktów p ∈ RN , w którychdowolnym otoczeniu znajdą się punkty zbioru A i jego dopełnienia.ĆWICZENIE: Znaleźć brzegi zbiorów z ćwiczenia ze strony 6.OBSZARY Mówimy, że zbiór U jest obszarem, gdy jest otwarty i jest łukowej spójności: dladowolnych p, q ∈ U znajdzie się taka krzywa γ : [0, 1] → RN , że p = γ(0), q = γ(1) (jest towięc krzywa, której „końcami” są punkty p i q) o nośniku zawartym w U (tzn. γ(t) ∈ T dladowolnego t ∈ [0, 1].ĆWICZENIE: (1) Czy zbiór (x, y) ∈ R2 | 4 < x2 + y2 < 9 jest obszarem?(2) Który ze zbiorów z ćwiczenia ze strony 6 jest obszarem?UWAGA: Czasem mówi się, że obszary to zbiory otwarte i spójne. Zainteresowany Czytelnikmoże sprawdzić w literaturze co oznacza, że zbiór A ⊂ RN jest spójny i sprawdzić, że wprzypadku zbiorów otwartych wspomniana wyżej łukowa spójność i spójność są równoważne.POJĘCIE ZBIORU ZWARTEGO Powiadamy, że zbiór A ⊂ RN jest zwarty, gdy ma następującąwłasność: każdy ciąg (xn) ⊂ A zawiera podciąg zbieżny do granicy należącej do zbioru A.UWAGA: Pojęcie zwartości jest jednym z fundamentalnych pojęć współczesnej matematyki.ĆWICZENIE: Każdy zbiór zwarty jest ograniczony i domknięty.Rzeczywiście, gdyby ten zbiór nie był ograniczony, to dla dowolnego n ∈ N znalazłby się wnim punkt xn o długości ‖xn‖ > n. Ten ciąg nie może zawierać podciągu zbieżnego (dlaczego?).Dowód domkniętości pozostawiam Czytelnikowi.Który ze zbiorów z ćwiczenia ze strony 6 jest zwarty?Jak się okazuje podane wyżej własności są również dostateczne dla zwartości.

1.3.4 TWIERDZENIE: (Charakteryzacja zwartości) Zbiór A ⊂ RN jest zwarty wtedy i tylko wtedy,gdy jest ograniczony i domknięty.DOWÓD: Konieczność była przedmiotem ćwiczenia. Dla dostateczności weźmy ciąg (xn) ⊂ A.Ciąg ten jest ograniczony; zatem – z uogólnionego twierdzenie Bolzano-Weierstrassa, zawie-ra podciąg zbieżny do pewnego x ∈ RN . Z kolei domkniętość A i ciągowa charakteryzacjadomkniętości implikują, że x ∈ A. .Mimo tej charakteryzacji, która – w zasadzie – umożliwia nie stosowanie pojęcia zwartości,często będziemy mówić o zbiorach zwartych (14).

DOMKNIĘCIE ZBIORU Niech A ⊂ RN . Domknięciem zbioru A, oznaczanym symbolem A,nazywamy zbiór powstały poprzez dołączenie do niego wszystkich jego punktów skupienia.ĆWICZENIE: (ciągowa charakteryzacja domknięcia). Punkt p ∈ A wtedy i tylko wtedy, gdyistnieje ciąg (xn) ⊂ A taki, że xn → p.Znaleźć domknięcie zbioru (x, y, z) ∈ R3 | x2 + y2 < z2, |z| < 1OŚRODKOWOŚĆ PRZESTRZENI RN Przestrzeń RN jest ośrodkowa, tzn. istnieje w niej prze-

liczalny podzbiór A taki, że A = RN (mówi się w takiej sytuacji, że zbiór A jest gęsty w RN .Tym zbiorem jest np. zbiórQN := (q1, ..., qn) | qj ∈ Q, j = 1, ..., N(tutaj Q oznacza zbiór wszystkich liczb wymiernych).

14W innych przestrzeniach zwartość zawsze implikuje ograniczoność i domkniętość, lecz nie na odwrót!.

Page 32: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

28 1. PRZESTRZEŃ EUKLIDESOWAĆWICZENIE: Sprawdzić, że jeśli A ⊂ RN , to A jest gęsty wtedy i tylko wtedy, gdy w dowolnejkuli znajdują się punkty ze zbioru A.Wykorzystując tę charakteryzację wykaż, że istotnie zbiór QN jest gęsty w RN . Dlaczegoten zbiór jest przeliczalny?ĆWICZENIE: Pokazać, że dowolny zbiór otwarty U ⊂ RN można przedstawić w postaciprzeliczalnej sumy mnogościowej kul otwartych (a także kul domkniętych)(15).OTWARTE I DOMKNIĘTE PODZBIORY DOWOLNEGO ZBIORU Niech A ⊂ RN . Mówimy, żezbiór G ⊂ A jest otwarty (dodając dla porządku: w A), gdy G = A ∩ U , gdzie U ⊂ RN jestotwarty.ĆWICZENIE: Zbiór G ⊂ A jest otwarty wtedy i tylko wtedy, gdy dla dowolnego x ∈ G istnieje

εx > 0 takie, że B(x, εx) ∩ A ⊂ G .Analogicznie definiuje się domknięte podzbiory zbioru A: zbiór F ⊂ A jest domknięty wA, gdy F = A ∩K, gdzie K ⊂ RN jest domknięty.ĆWICZENIE: Jak przy pomocy ciągów scharakteryzować domkniętość (w A) zbioru F ⊂ A?1.4 Funkcje i odwzorowania wielu zmiennych

Jak wspomniano poprzednio głównym przedmiotem zainteresowania są odwzorowania postacif : A→ RM ,

gdzie A ⊂ RN , N,M ≥ 1, oraz – w szczególności – funkcje f : A→ R.1.4.A Granica funkcji w punkcie

Niech p ∈ RN będzie punktem skupienia zbioru A ⊂ RN i rozważmy funkcję f : A→ R.Granicą (właściwą) funkcji f w punkcie p nazywamy liczbę g ∈ R taką, że dla każdego

ε > 0 istnieje δ > 0 o tej własności, że jeśli x ∈ A oraz 0 < ‖x − p‖ < δ, to |f (x)− g | < ε.Piszemy wtedy g = limx→p f (x) lub f (x)→ g , gdy x → p (czasem pisząc jeszcze x ∈ A, abyzaznaczyć jaka jest dziedzina funkcji f ).Czasem piszemy teżlim(x1,...,xN )→(p1,...,pN ) f (x1, ..., xN ) lub lim

x1→p1,...,xn→pn f (x1, ..., xn).Jest to tzw. definicja Cauchy’ego. Można też sformułować tzw. definicję Heinego. Wedługtej definicji liczba g ∈ R jest granicą f w punkcie p, jeżeli dla dowolnego ciągu (xn) ⊂ Atakiego, że xn 6= p dla wszystkich n ∈ N oraz xn → p, mamy iż f (xn)→ g

1.4.1 TWIERDZENIE: Definicje Cauchy’ego i Heinego granicy funkcji w punkcie są równoważ-ne. Dowód jest bezpośrednim powtórzeniem dowodu w sytuacji gdy f jest funkcją rzeczywistajednej zmiennej.

15Wskazówka: rozważyć zbiór A punktów leżących w U o współrzędnych wymiernych oraz kul o wymiernychpromieniach o środkach ze zbioru A całkowicie zawartych w U .

Page 33: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.4. FUNKCJE I ODWZOROWANIA WIELU ZMIENNYCH 29

ĆWICZENIE: Przytoczyć dowód naśladując wspomniany wyżej.UWAGA: Obie definicje są równoważne: pierwsza z nich odgrywa rolę przede wszystkim„teoretyczną”, druga ma zastosowanie praktyczne, szczególnie podczas dowodzenia, że granicanie istnieje. Należy zaznaczyć, że obliczanie z definicji granic funkcji wielu zmiennych nie jestłatwe.PRZYKŁAD: (1) Obliczyć granicęlim

x→0,y→0√16 + x2 + y2 − 4

x2 + y2 .

W celu obliczenia granicy można postępować następująco:1. Przede wszystkim widać, że funkcja „pod” znakiem granicy określona jest wszędzie pozapunktem (0, 0); zatem punkt ten jest punktem skupienia dziedziny. Zauważmy, że zbieżnośćx → 0, y → 0 oznacza, że (x, y)→ (0, 0), a to – z kolei – że ‖x‖ → 0 (byłoby korzystnie, gdybyCzytelnik precyzyjnie to uzasadnił),a więc też ‖(x, y)‖2 → 0. Wtedy√16 + x2 + y2 − 4

x2 + y2 = √16− ‖(x, y)‖2 − 4‖(x, y)‖2 .

W taki razie lim(x,y)→(0,0)√16 + x2 + y2 − 4

x2 + y2 = limt→0√16 + t − 4

t ,

gdzie podstawiliśmy t := x2 + y2 = ‖(x, y)‖2. Tak więc√16 + t − 4

t = (√16 + t − 4)(√16 + t + 4)(√16 + t + 4)t = 1√16 + t + 4 → 18 .2. Teraz można posłużyć się definicją Cauchy’ego: ustalmy dowolne ε > 0 i postaramy sięwyznaczyć taką liczbę δ > 0, że jeśli |t| < δ (czy znak modułu jest potrzebny?), to∣∣∣∣∣

√16 + t − 4t − 18

∣∣∣∣∣ < ε.

Prosty rachunek pozwoli na wyznaczenie potrzebnej liczby δ (Czytelnik ten rachunek zechceprzeprowadzić).(2) Pokażemy, że funkcja f zadana wzoremf (x, y, z) = xyz

x3 + y3 + z3i określona na zbiorze A := (x, y, z) ∈ R3 | x3 + y3 + z3 6= 0 nie ma granicy w punkciep = (0, 0, 0).Przede wszystkim: punkt p = (0, 0, 0) jest punktem skupienia zbioru A (sprawdzić). W celuwykazania, że granicy brak wystarcza wskazać dwa ciągi zbieżne do p (o wyrazach różnych odp), np. (xn, yn, zn) oraz (x′n, y ′n, z′n) i takie, że ciągi (f (xn, yn, zn)) oraz (f (x′n, y ′n, z′n)) są rozbieżnelub zbieżne do różnych granic. Gdyby granica istniała, to taka sytuacja nie byłaby możliwa.Na przykład: weźmy xn = x′n = yn = y ′n = zn = 1/n lecz z′n = 0. Ciągi te spełniają podanewarunki bo f (xn, yn, zn) = 1/3 i f (x′n, y ′n, z′n) = 0 (są to ciągi stałe) a więc zbieżne do granic 1/3i 0, odpowiednio.

Page 34: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

30 1. PRZESTRZEŃ EUKLIDESOWAĆWICZENIE Obliczyć granice lub wykazać, że granica nie istnieje:(1) lim(x,y)→(0,0) x2+y2√

x2+y2−1 ;(2) lim(x,y)→(0,0) xyx2+y2 ;(3) lim(x,y)→(0,0) x4−y4x2−y2 ;(4) lim(x,y)→(1,−1) 5(x−1)2+(y+1)2 ;(5) lim(x,y)→(0,0) xyx−y ; (6) lim(x,y)→(a,b) xy

GRANICE NIEWŁAŚCIWE I W NIESKOŃCZONOŚCI W podobny sposób można określić granicęniewłaściwą: piszemy limx→p f (x) = +∞ (odp. limx→p f (x) = −∞), gdy dla dowolnej liczbyM ∈ R istnieje δ > 0 o tej własności, że f (x) > M (odp. f (x) < M), o ile 0 < ‖x − p‖ < δ.Piszemy g = lim‖x‖→∞ f (x), gdzie g ∈ R, gdy dla dowolnego ε > 0 znajdzie się liczbaR > 0 taka, że |f (x)− g | < ε, o ile ‖x‖ > R.ĆWICZENIE: Czytelnik poda definicję Heinego granic niewłaściwych i granicy w nieskoń-czoności.Warunkiem koniecznym i dostatecznym istnienia granicy (właściwej, niewłaściwej lub wnieskończoności) jest tzw. warunek Cauchy’ego (rozważymy przypadek granicy właściwej wpunkcie skupienia dziedziny)1.4.2 TWIERDZENIE: Niech f : A→ R, gdzie A ⊂ RN , i niech p ∈ RN będzie punktem skupieniazbioru A. Granica limx→p f (x) istnieje wtedy i tylko wtedy, gdy dla dowolnego ε > 0 istniejetaka liczba δ > 0, że |f (x)−f (x′)| < ε dla dowolnych liczb x, x′ ∈ A, takich że 0 < |x−p|, |x′−p| < δ.DOWÓD polega na powtórzeniu argumentów z dowodu analogicznego faktu dla funkcji jednejzmiennej.

GRANICE ITEROWANE Rozważmy dla prostoty funkcję 2 zmiennych f : A → R, gdzieA = X × Y ⊂ R2, gdzie X, Y ⊂ R. Niech p = (a, b) ∈ R2, gdzie a jest punktem skupieniazbioru X, zaś b – punktem skupienia zbioru Y . Wówczas p jest punktem skupienia zbioru A(sprawdzić). Prawdziwe jest następujące twierdzenie:

Jeśli istnieje granica (podwójna) g = lim(x,y)→(a,b) f (x, y) (w sensie właściwym lub niewła-ściwym) i dla dowolnego x ∈ X istnieje granica limy→b f (x, y), to istnieje granica limx→a limy→b f (x, y)i jest równa g . Analogicznie, jeżeli istnieje granica podwójna oraz dla każdego y ∈ Y istniejelimx→a f (x, y), to istnieje granica limy→b limx→a f (x, y) i jest równa g .

W szczególności, jeśli spełnione są założenia obu części twierdzenia, to

limx→a

limy→b

f (x, y) = limy→b

limx→a

f (x, y).Są to tzw. granice iterowane (w tej sytuacji, dla odróżnienia, granicę lim(x,y)→(a,b) f (x, y)nazywa się granicą podwójną). Tak więc jeśli mamy przekonanie, że spełnione są założeniektórejś z części powyższego faktu, to g możemy obliczyć w następujący sposób: najpierw, usta-liwszy dowolnie x ∈ X, policzymy gx := limy→b f (x, y), a następnie obliczymy limx→a gx =limx→a limy→b f (x, y). Lub, ustaliwszy dowolnie y ∈ Y , policzymy gy := limx→a f (x, y), a następ-nie obliczymy limy→b gy = limy→b limx→a f (x, y).Należy jednak stwierdzić dobitnie, że można to zrobić jedynie gdy spełnione są założeniatwierdzenia.

Page 35: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.4. FUNKCJE I ODWZOROWANIA WIELU ZMIENNYCH 31

PRZYKŁAD: Niechf (x, y) = x − y + x2 + y2

x + ydla (x, y) ∈ (0,+∞)× (0,+∞). Kładąc a = 0 = b mamy dla ustalonego y ∈ (0,+∞)gy = lim

x→0 f (x, y) = y − 1 oraz limy→0 gy = lim

y→0(y − 1) = −1;zaś dla ustalonego x ∈ (0,+∞),

gx = limy→0 f (x, y) = x + 1 oraz lim

x→0 gx = limx→0(x + 1) = 1.

Spełnione są drugie części założeń, lecz – w skutek braku równości wnosimy, że granicapodwójna nie istnieje (można się o tym przekonać nie zależnie biorąc ciągi (1/n, 0) oraz (0, 1/n):sprawdzić).A zatem nie należy obliczać granic poprzez przejście do granic iterowanych, chyba żesą po temu przesłanki w postaci spełnionych założeń twierdzenia.UWAGA: Innym zabiegiem, niekiedy ułatwiającym obliczenie granicy, jest skorzystanie znastępującego faktu: jeśli istnieje granica właściwa g = limx→p f (x), gdzie f : A→ R, A ⊂ RN

i p ∈ RN jest punktem skupienia, oraz h : R→ R jest funkcją ciągłą, to limx→p h f (x) = h(g).PRZYKŁAD: Oblicz granicelim(x,y)→(0,0) e

x4−y4x2−y2 , lim(x,y)→(e,1) ln x

y .

GRANICE FUNKCJI WEKTOROWYCH O granicach (właściwych lub w nieskończoności) moż-na też mówić w odniesieniu do funkcji wektorowych: na przykład jeżeli f : A → RM , gdzieA ⊂ RN oraz M > 1, p jest punktem skupienia zbioru A i g ∈ RM , to piszemy

g = limx→p

f (x)jeśli dla dowolnego ε > 0 istnieje δ > 0 taka, że ‖f (x)− g‖ < ε, o ile 0 < ‖x − p‖ < δ.UWAGA: Po raz pierwszy mamy tu do czynienia z pewną niedogodnością notacyjną: Czy-telnik zauważył, że o ile x ∈ A ⊂ RN i zapis ‖x − p‖ oznacza odległość punktów x i p wprzestrzeni RN , o tyle f (x) ∈ RM i, wobec tego, pisząc ‖f (x)− g‖ mamy na myśli odległość wprzestrzeni RM . Czytelnik każdorazowo powinien rozumieć co dany symbol oznacza i uważniego interpretować.ĆWICZENIE: Sformułować definicję Heinego granicy funkcji wektorowej (we wszystkichprzypadkach).1.4.3 TWIERDZENIE: Przypuśćmy, że A ⊂ RN , p ∈ RN jest punktem skupienia dziedziny Afunkcji f : A → RM , gdzie f = (f1, ..., fM ). Wówczas granica (właściwa) limx→p f (x) istniejewtedy i tylko wtedy, gdy dla dowolnego i = 1, ...,M istnieje granica limx→p fi(x).DOWÓD: Dowód konieczności pozostawiam Czytelnikowi (wystarczy naśladować dowód faktu1.3.1). Dostateczność. Zakładamy, że dla dowolnego i = 1, ...,M istnieje gi := limx→p fi(x).Niech g := (g1, ..., gM ) ∈ RM . Pokażemy, że g = limx→p f (x). W tym celu weźmy dowolny ciąg(xn) ⊂ A taki, że xn 6= p dla n ∈ N i xn → x. Jasne, że wówczas, przy każdym i = 1, ...,M ,fi(xn) → gi . Wobec tego, wykorzystując fakt 1.3.1 otrzymamy, że f (xn) = (f1(xn), ..., fM (xn)) →(g1, ..., gM ) = g , co – w świetle definicji Heinego – dowodzi tezy.

Page 36: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

32 1. PRZESTRZEŃ EUKLIDESOWAĆWICZENIE: Przeprowadzić dowód w oparciu o definicję Cauchy’egoFakt ten wskazuje, że obliczanie granic funkcji wektorowych sprowadza się do obliczaniagranic funkcji skalarnych.Granice funkcji wielu zmiennych mają własności algebraiczne analogiczne do własnościgranic funkcji jednej zmiennej. Przykładowo;

1.4.4 FAKT: Załóżmy, że f , g : A→ R, A ⊂ RN i p ∈ RN jest punktem skupienia zbioru A. Jeśliistnieją granice limx→p f (x) i limx→p g(x), to istnieje granica limx→p(f (x) + g(x)) i jest równasumie granic.DOWÓD przeprowadzi Czytelnik samodzielnie.ĆWICZENIE: Sformułować analogiczny fakt dla różnicy, iloczynu i ilorazu dwóch funkcji.Analogiczne fakty (poza iloczynem i ilorazem (dlaczego?) mają miejsce dla granic odwzorowańwektorowych. Udowodnić.ĆWICZENIE: Pokazać, że lim(x,y)→(0,0) x

3 + y3x2 + y2 = 0.

1.4.B Ciągłość funkcji

Tak jak poprzednio rozważamy funkcję f : A → R. Niech a ∈ A. Mówimy, że funkcja f jestciągła w punkcie a, gdy dla dowolnego ε > 0 istnieje δ > 0 o tej własności, że jeśli x ∈ A oraz‖x − a‖ < δ, to |f (x)− f (a)| < ε.Jest to definicja Cauchy’ego ciągłości funkcji w punkcie. Definicja Heinego orzeka, żefunkcja f jest ciągła w punkcie a, gdy dla dowolnego ciągu (xn) ⊂ A, jeśli xn → a (czylia = limn→∞ xn), to f (xn)→ f (a) (czyli limn→∞ f (xn) = f (a)).Innymi słowy, mówiąc nieco kolokwialnie, funkcje ciągłe w punkcie a przeprowadzająciągi zbieżne do a na ciągi zbieżne do f (a)ĆWICZENIE: Obie definicje ciągłości są równoważne. Udowodnić ten fakt.UWAGA: (1) O ciągłości mowa tylko w punktach dziedziny. Sformułowanie: „funkcja f (x) =1x , x ∈ R \ 0 jest nieciągła w x = 0” jest niepoprawne. Ta funkcja jest ciągła (tzn. ciągła wewszystkich punktach swojej dziedziny).(2) Jeśli a ∈ A jest punktem izolowanym tego zbioru, to każda funkcja f : A → R jest ciągła.Jest to stwierdzenie dość paradoksalne, lecz prawdziwe, a wynika z faktu, iż jedynym ciągiemo wyrazach ze zbioru A, który jest zbieżny do a jest ciąg stały, tzn. ciąg (xn), w którym xn = 1dla wszystkich n ∈ N. Wówczas f (xn) = f (x) przy n ∈ N i, oczywiście f (xn) = f (x)→ f (a).Stąd płynie wniosek, że ciągłość funkcji f : A → R jest interesująca jedynie w punktacha ∈ A, które są punktami skupienia zbioru A (powyżej mieliśmy do czynienia z a ∈ A, którybył punktem izolowanym). W tym kontekście zachodzi:1.4.5 TWIERDZENIE: Niech f : A → R, gdzie A ⊂ RN i niech a ∈ A będzie punktem skupieniadla A. Wówczas f jest ciągła w punkcie a wtedy i tylko wtedy, gdy

limx→a

f (x) = f (a).DOWÓD: Wynika natychmiast z definicji Heinego (przeprowadzić dowód).

Page 37: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.4. FUNKCJE I ODWZOROWANIA WIELU ZMIENNYCH 33

Mówimy, że funkcja f : A → R jest ciągła, gdy jest ona ciągła w każdym punkcie swojejdziedziny.1.4.6 TWIERDZENIE: Zwykłe działania algebraiczne na funkcjach ciągłych są funkcjami cią-głymi. A więc, jeśli f , g : A→ R, gdzie A ⊂ RN , są funkcjami ciągłym w punkcie a ∈ A , to wtym punkcie są ciągłe: suma i różnica f ±g , iloczyn f ·g oraz iloraz f/g (o ile jest poprawnieokreślony, tzn. g(x) 6= 0 dla dowolnego x ∈ A.DOWÓD ponownie jest powtórzeniem analogicznego rezultatu dla funkcji jednej zmiennej. Prze-prowadzę dla przykładu dowód dla iloczynu. Posłużymy się (nieco bardziej w tej sytuacji nie-zręczną) definicją Cauchy’ego. Zakładamy, że funkcje f i g są ciągłe w a ∈ A. Aby dowieśćciągłości w punkcie a funkcji fg załóżmy najpierw, że f (a) 6= 0 i wybierzmy ε > 0 orazliczby δ1, δ2 > 0 takie, by |f (x) − f (a)| < ε2M ,gdzie M := ε + |g(a)|, o ile ‖x − a‖ < δ1 i|g(x) − g(a)| < minε, ε2|f (a)|, o ile ‖x − a‖ < δ2. Niech δ := minδ1, δ2. Jeśli x ∈ A oraz‖x − a‖ < δ, to ‖x − a‖ < δ1 oraz ‖x − a‖ < δ2, czyli jednocześnie

|f (x)− f (a)| < ε2M , |g(x)− g(a)| < ε oraz |g(x)− g(a)| < ε2|f (a)| .W takim razie |g(x)| < ε + |g(a)| = M oraz|(fg)(x)− (fg)(a)| = |f (x)g(x)− f (a)g(a)| ≤ |g(x)||f (x)− f (a)|+ |f (a)||g(x)− g(a)| < ε.

Czytelnik uzupełni rozumowanie w przypadku, gdy f (a) = 0.

CIĄGŁOŚĆ ODWZOROWAŃ Definicja ciągłości dla funkcji wektorowych jest analogiczna:funkcja (odwzorowanie) f : A → RM , gdzie A ⊂ RN i M > 1 jest ciągła w punkcie a ∈ A, gdydla każdego ε > 0 istnieje δ > 0 taka, że ‖f (x)− f (a)‖ < ε, o ile x ∈ A i ‖x − a‖ < δ.1.4.7 FAKT: Funkcja f = (f1, ..., fM ) jest ciągła w a ∈ A wtedy i tylko wtedy, gdy dla każdegoi = 1, ...,M , funkcja współrzędna fi jest tam ciągła.DOWÓD oparty na definicji Heinego i fakcie 1.3.1 jest natychmiastowy.UWAGA: Z tego wynika, że krzywa, z definicji, jest ciągłym odwzorowaniem γ : [0, 1]→ RM .Funkcjom i odwzorowaniom ciągłym przysługuje wiele własności analogicznych do wła-sności ciągłych funkcji jednej zmiennej.1.4.8 FAKT: Złożenie funkcji ciągłych jest funkcją ciągłą.ĆWICZENIE: Sformułować ten fakt z wszystkimi szczegółami i udowodnić.1.4.9 TWIERDZENIE: Niech f : A→ RM będzie odwzorowaniem ciągłym.(1) Jeśli zbiór A ⊂ RN jest spójny (odp. łukowo spójny), to obraz f (A) jest spójny (odp. łukowospójny).(2) Jeśli zbiór A jest zwarty, to f (A) jest zbiorem zwartym (domkniętym i ograniczonym); wszczególności funkcja f jest ograniczona, a więc istnieje M ≥ 0, że ‖f (x)‖ ≤M dla wszystkichx ∈ A. Gdy M = 1 (tzn. f : A→ R), to istnieją takie punkty x1, x2 ∈ A, że f (x1) = minx∈A f (x) if (x2) = maxx∈A f (x).DOWÓD: (1) Zajmiemy się łukową spójnością. W celu pokazania tej własności dla obrazu f (A)obierzmy y0, y1 ∈ f (A), a więc y0 = f (x0), y1 = f (x1), gdzie x0, x1 ∈ A; mamy wskazać krzywąγ : [0, 1]→ f (A) łączącą te punkty. Z założenia istnieje krzywa κ : [0, 1]→ A taka, że κ(0) = x0 iκ(1) = x1. Oczywiście funkcja γ := f κ jest krzywą (przypomnij definicję krzywej i fakt 1.4.8)

Page 38: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

34 1. PRZESTRZEŃ EUKLIDESOWAłączącą punkty y0 i y1.(2) Jeżeli ciąg (yn) ⊂ f (A), to yn = f (xn), gdzie xn ∈ A dla n ∈ N. Dany jest więc ciąg(xn) ⊂ A, który, zgodnie z założeniem zwartości, ma podciąg xnk → x0 ∈ A przy k → ∞. Stądynk = f (xnk )→ f (x0) =: y0. Czy zbiór f (A) jest zwarty.Jeśli M = 1, to wartości α := infx∈A f (x) oraz β := supx∈A f (x) są poprawnie zdefiniowane,bo f jest funkcja ograniczoną. Poza tym zbiór f (A) jest domknięty, a stąd

α ∈ f (A) oraz β ∈ f (A).Wynika z następującego rozumowania: z definicji kresu: dla wszystkich y ∈ f (A), α ≤ y oraz,dla danego ε > 0 istnieje yε ∈ f (A), że yε < α + ε. Biorąc ε = 1/n, gdzie n ∈ N otrzymamywięc yn ∈ f (A), że α ≤ yn < α + 1/n. innymi słowy (yn) jest ciągiem o wyrazach w zbiorzef (A) zbieżnym do α. Z ciągowej charakteryzacji domkniętości zbiorów wynika, że α ∈ f (A) tzn.istnieje taki element x1 ∈ A, że α = f (x1). Jako ćwiczenie zakończyć dowód dla β. ĆWICZENIE: Niech f (x, y) := sin xy1+x2+y2 dla (x, y) ∈ R2. Pokazać, że f jest funkcją ciągłą.Podobnie dla funkcji (pamiętać o dziedzinie):(1) f (x, y) = x2+y

x2+y2−1 ;(2) f (x, y, z) = ln(ex + eyz); (3) f (x, y) = xy

x2+y2 dla (x, y) 6= (0, 0);0 dla x = 0 = y.ĆWICZENIE: Wykazać, że funkcjaf (x, y) = xy2

x3+y3 dla (x, y) 6= (0, 0);0 dla x = 0 = y

nie jest ciągła, lecz jest ciągła względem każdej ze zmiennych z osobna. Przeprowadzić dys-kusję tego zjawiska i wyciągnąć wnioski („ciągłość względem zespołu zmiennych” i ciągłośćwzględem zmiennych i związki).ĆWICZENIE: Przypuśćmy, że funkcja f : (a, b)× (c, d)→ R jest ciągła ze względu na każdąze zmiennych z osobna i, dla dowolnego y ∈ (a, b), funkcja f (·, y) : (a, b)→ R jest niemalejąca.Pokazać, że f jest wówczas funkcją ciągłą.ĆWICZENIE: Niech U będzie obszarem i f : U → R funkcją ciągłą. Pokazać, że jeśli istniejąpunkty x1, x2 ∈ U takie, że f (x1) < 0 < f (x2), to f ma miejsce zerowe, tzn. istnieje x0 ∈ U ,ze f (x0) = 0 (wskazówka mieści się w definicji obszaru). Zauważyć, że w dowodzie istotna jestłukowa spójność zbioru U , a nie jego otwartość. Oczywiście ma miejsce również tzw. własnośćDarboux: jeśli f jest funkcją rzeczywistą ciągłą o łukowo spójnej dziedzinie A, x1, x2 ∈ A, todla dowolnego λ ∈ R leżącego pomiędzy liczbami f (x1) i f (x2) istnieje taki x ∈ A, że f (x) = λ.

TOPOLOGICZNA CHARAKTERYZACJA CIĄGŁOŚCI

1.4.10 TWIERDZENIE Funkcja f : A → RM jest ciągła wtedy i tylko wtedy, gdy przeciwobrazf−1(U) dowolnego zbioru otwartego U ⊂ RM jest otwarty w A. Podobnie f jest ciągła wtedy itylko wtedy, gdy przeciwobraz f−1(F ) dowolnego zbioru domkniętego F ⊂ RM jest domkniętyw A.DOWÓD: Przypuśćmy, że f jest odwzorowaniem ciągłym i U ⊂ RM jest zbiorem otwartym. Niechx ∈ f−1(U) ⊂ A. Oczywiście f (x) ∈ U , więc (z definicji zbioru otwartego) znajdziemy ε > 0 takie,że B(f (x), ε) ⊂ U . Z ciągłości (w punkcie x) istnieje δ > 0 taka, że dla y ∈ A, jeżeli ‖y−x‖ < δ,to ‖f (y)− f (x)‖ < ε: innymi słowy f (y) ∈ B(f (x), ε). Tak więc f (B(x, δ)∩A) ⊂ B(f (x), ε) ⊂ U . Tooznacza, że B(x, δ) ∩ A ⊂ f−1(U) i kończy dowód konieczności podanego warunku.

Page 39: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.4. FUNKCJE I ODWZOROWANIA WIELU ZMIENNYCH 35

Dla dostateczności załóżmy, że podany warunek zachodzi, ustalmy a ∈ A: pokażemy, żef jest ciągłe w a. Ustalmy ε > 0. Zbiór U := B(f (a), ε) jest otwarty, czyli jego przeciw obrazf−1(U) jest też otwarty. Oczywiście a ∈ f−1(U); więc istnieje δ > 0 taka, że B(a, δ)∩A ⊂ f−1(U).Stąd: jeśli x ∈ A oraz ‖x − a‖ < δ, to x ∈ A ∩ B(a, δ) i x ∈ f−1(U). Czyli f (x) ∈ U = B(f (a), ε) i‖f (x)− f (a)‖ < ε. .ĆWICZENIE: Dowód drugiej części pozostawiam Czytelnikowi (wskazówka jeśli zbiór F ⊂RM jest domknięty, to U : RM \ F jest otwarty i f−1(F ) = A \ f−1(U)).

JEDNOSTAJNA CIĄGŁOŚĆ Poza „zwykłą” ciągłością istotną rolę odgrywają funkcje (lub od-wzorowania) jednostajnie ciągłe i spełniające warunek Lipschitza. Mówimy, że odwzorowanief : A→ RM jest jednostajnie ciągłe, gdy dla dowolnego ε > 0 istnieje liczba δ > 0 taka, że dlax, x′ ∈ A, jeśli ‖x − x′‖ < δ, to ‖f (x)− f (x′)‖ < ε.1.4.11 TWIERDZENIE: Jeżeli odwzorowanie f : A→ RM jest ciągłe a zbiór A jest zwarty, to jestono jednostajnie ciągłe.DOWÓD: Przypuśćmy, że odwzorowanie f nie jest jednostajnie ciągłe. Tak więc znajdzie się jakąśliczbę ε0 > 0 o tej własności, że dla wszystkich n ∈ N znajdą się punkty xn, x′n ∈ A dla których‖f (xn) − f (x′n)‖ ≥ ε0 mimo, że ‖xn − x′n‖ < 1/n. Zwartość implikuje, że ciąg (xn) ma podciągzbieżny; dla uproszczenia przyjmijmy (i bez utraty ogólności – zweryfikować to stwierdzenie),że już xn → x ∈ A. Wtedy też x′n → x. Stąd f (xn)→ f (x) i f (x′n)→ f (x): sprzeczność. ĆWICZENIE: Zbadać jednostajną ciągłość funkcji

f (x, y, z) =√x2 + y2 + z2;f (x, y, z) =√|xyz|.

WARUNEK LIPSCHITZA Mówimy, że f : A→ RM spełnia warunek Lipschitza (lub , że jestfunkcją lipschitzowską), gdy istnieje liczba L ≥ 0 taka, że dla dowolnych x, y ∈ A,‖f (x)− f (y)‖ ≤ L‖x − y‖.

Stałą L nazywa się stałą Lipschitza funkcji f .ĆWICZENIE: Uzasadnić dlaczego odwzorowania spełniające warunek Lipschitza są jedno-stajnie ciągłe. Sprawdzić w literaturze co oznacza, że funkcja spełnia lokalnie warunek Lipschit-za. Czy takie funkcje są jednostajnie ciągłe? Znać przykłady funkcji ciągłych lecz nieciągłychjednostajnie.1.4.C Ciągłość odwzorowań liniowych

Niech A : RN → RM będzie przekształceniem liniowym, z którym stowarzyszona jest macierzA = [aij ] i=1,...,M

j=1,...,N ∈ MMN .1.4.12 FAKT: Przekształcenie A jest ciągłe.DOWÓD: Najpierw zauważmy, że rzutowanie πj : RN → R jest ciągłe. Rzeczywiście dla x =(x1, ..., xN ) ∈ RN , y = (y1, ..., yN ) ∈ RN

|πj (x)− πj (y)| = |xj − yj | ≤ ‖x − y‖,co oznacza, że πj spełnia warunek Lipschitza ze stałą 1. Oczywiście iloczyn απj , gdzie j = 1, ..., Ni α ∈ R, jest również odwzorowaniem ciągłym.

Page 40: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

36 1. PRZESTRZEŃ EUKLIDESOWAWystarczy pokazać, że dla dowolnego i = 1, ...,M , odwzorowanie πi A : RN → R (czyli

i-ta współrzędna odwzorowania A) jest ciągłe (tutaj πi : RM → R jest rzutowaniem na i-tąwspółrzędna). Ze wzoru (1.2.5) mamyπi A(x) = N∑

j=1 aijxj , x = (x1, ..., xN ) ∈ RN .

Zatemπi A(x) = N∑

j=1 aijπj (x);zatem πi A, jako suma odwzorowań ciągłych, jest odwzorowaniem ciągłym (nawet więcejspełnia warunek Lipschitza).

NORMA PRZEKSZTAŁCENIE LINIOWEGO Niech A ∈ L(RN ,RM ). Połóżmy(1.4.12) ‖A‖ := sup

x∈RN ,‖x‖=1 ‖A(x)‖(tutaj ponownie mamy do czynienia z „błędem” notacyjnym: po prawej stronie „pierwsza” jestnorma w RN , zaś „druga” to norma w RM ). Odwzorowanie RN 3 x 7Ï ‖A(x)‖ – jako złożenieciągłego odwzorowania A i ciągłej funkcji normy – jest ciągłe. Zbiór x ∈ RN | ‖x‖ = 1 jestdomknięty (jest to przeciwobraz zbioru 1 poprzez ciągłą funkcję normy) i ograniczony, czylizwarty. Z twierdzenia Weierstrassa 0 ≤ ‖A‖ <∞. Liczbę ‖A‖ nazywamy normą przekształce-nia liniowego A.Zauważmy, że ma miejsce ważne oszacowanie(1.4.13) ‖A(x)‖ ≤ ‖A‖‖x‖, x ∈ RN .

Dla x = 0 to jest oczywiste; jeśli zaś x 6= 0, to ‖‖x‖−1x‖ = ‖x‖−1‖x‖ = 1 i‖x‖−1‖A(x)‖ = ‖A(‖x‖−1x)‖ ≤ ‖A‖.

Z oszacowania 1.4.13 wynika również, że‖A‖ = sup

‖x‖≤1 ‖A(x)‖.Rzeczywiście ‖A‖ ≤ sup‖A(x)‖ | ‖x‖ ≤ 1, bo kres górny po większym zbiorze x ∈ RN |‖x‖ ≤ 1 jest niemniejszy niż kres górny po zbiorze mniejszym x | ‖x‖ = 1; z drugiej stronydla dowolnego x ∈ RN , ‖x‖ ≤ 1, ‖A(x)‖ ≤ ‖A‖‖x‖ = ‖A‖, czyli sup‖A(x)‖ | ‖x‖ ≤ 1 ≤ ‖A‖.1.4.13 UWAGA: Zauważmy, że skończoność normy ‖A‖ wynikała z ciągłości. Gdyby wiadomobyło, że ‖A‖ <∞, to oszacowanie (1.4.13) pozwala na inny dowód ciągłości przekształcenia A:dla dowolnych x, y ∈ RN ,

‖A(x)− A(y)‖ = ‖A(x − y)‖ ≤ ‖A‖‖x − y‖;czyli A spełnia warunek Lipschitza ze stałą Lip(A) ≤ ‖A‖. W istocie Lip(A) = ‖A‖. Wynika to znastępującego wzoru(1.4.14) ‖A‖ = infc ≥ 0 | ∀x ∈ RN ‖A(x)‖ ≤ c‖x‖.

Page 41: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

1.4. FUNKCJE I ODWZOROWANIA WIELU ZMIENNYCH 37

Rzeczywiście: nierówność ≥ wynika natychmiast z nierówności (1.4.13). Z drugiej strony niechc0 oznacza prawą stronę równości (1.4.14). Z definicji kresu dolnego, dla dowolnego ε i x ∈ RN ,‖A(x)‖ ≤ (c0 + ε)‖x‖. Wobec tego

‖A‖ = sup‖x‖=1 ‖A(x)‖ ≤ c0 + ε.

Z dowolności ε wynika, że ‖A‖ ≤ c0.Za chwilę zobaczymy jak, nie wykorzystując ciągłości A, można wykazać, że ‖A‖ <∞. Nazwy „norma przekształcenia” używamy nie bez kozery.1.4.14 FAKT: Dla A,B ∈ L(RN ,RM ) i λ ∈ R:‖A‖ = 0 wtedy i tylko wtedy, gdy A = 0 (tzn. A ≡ 0), ‖λA‖ = |λ|‖A‖ oraz ‖A+B‖ ≤ ‖A‖+‖B‖.

Jeżeli A ∈ L(RN ,RM ), B ∈ L(RM ,RK), to B A ∈ L(RN ,RK) i

(1.4.15) ‖B A‖ ≤ ‖B‖‖A‖.

W szczególności, jeżeli A ∈ L(RN ,RN ), n ∈ N i An := A ... A︸ ︷︷ ︸n

, to

(1.4.16) ‖An‖ ≤ ‖A‖n.

Jeżeli przekształcenie A ∈ L(RN ,RN ) jest izomorfizmem, to

‖A‖−1 ≤ ‖A−1‖.DOWÓD: Łatwo dostrzec, że dla A ∈ L(RN ,RM ) mamy ‖A‖ = 0 wtedy i tylko wtedy, gdy A = 0oraz ‖λA‖ = |λ|‖A‖ dla dowolnego λ ∈ R. Podobnie, gdy B ∈ L(RN ,RM ), to oraz

‖A+ B‖ = sup‖x‖=1 ‖A(x) + B(x)‖ ≤ sup

‖x‖=1(‖A(x)‖+ ‖B(x)‖)≤ sup‖x‖=1 ‖A(x)‖+ sup

‖x‖=1 ‖B(x)‖ = ‖A‖+ ‖B‖.W celu dowodu drugiej części zauważmy, że dla dowolnego x ∈ RN ,

‖B A(x)‖ ≤ ‖B‖‖A(x)‖ ≤ ‖B‖‖A‖‖x‖.Ze wzoru (1.4.14) wynika, że

‖B A‖ = infc ≥ 0 | ‖B A‖ ≤ c‖x‖ ≤ ‖B‖‖A‖.

Wreszcie ze wzoru (1.4.15) wynika, że 1 = ‖A−1 A‖ ≤ ‖A−1‖‖A‖, czyli ‖A−1‖ ≥ ‖A‖−1. ĆWICZENIE: Czy jest prawdą, że ‖A−1‖ = ‖A‖−1?NORMA PRZEKSZTAŁCENIA WIELOLINIOWEGO Niech A ∈ Lk(RN ,RM ). Podobnie jak po-przednio połóżmy

(1.4.17) ‖A‖ = supx1,...,xk∈RN , ‖xs‖=1 ‖A(x1, ..., xk)‖.

Wykażemy, że 0 ≤ ‖A‖ < ∞. Pierwsza nierówność jest oczywista. Dla dowodu drugiej nie-równości przyjmijmy (dla uproszczenia rachunków), że k = 2. Niech x = (x1, ..., xN ), y =

Page 42: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

38 1. PRZESTRZEŃ EUKLIDESOWA(y1, ..., yN ) ∈ RN , ‖x‖ = ‖y‖ = 1 i niech z = (z1, ..., zM ) = A(x, y). Ponadto niech [aijk] i=1,...,M

j,k=1,...,Nbędzie macierzą stowarzyszoną z przekształceniem A, tzn.zi = N∑

j,k=1aijkxjyk, i = 1, ...,M.

Zatem‖A(x, y)‖2 = ‖z‖2 = M∑

i=1 z2i = M∑

i=1 N∑j,k=1aijkxjyk

2.

Z nierówności Cauchy’ego-Schwarza N∑j,k=1aijkxjyk

2≤

N∑j,k=1a

2ijk

N∑j,k=1x

2j y2

k

= N∑j,k=1a

2ijk

‖x‖2‖y‖2 = N∑j,k=1a

2ijk

.

Zatem‖A(x, y)‖ ≤

√√√√ M∑i=1

N∑j,k=1a

2ijk, czyli ‖A‖ ≤

√√√√ M∑i=1

N∑j,k=1a

2ijk.

Ogólnie (dla dowolnego k)‖A‖ ≤

√√√√ M∑i=1

N∑j1,...,jk=1a

2ij1...jk <∞,

gdzie [aij1...jk ] jest macierzą stowarzyszoną z przekształceniem A.Analogicznie jak poprzednio można pokazać, że(1.4.18) ‖A(x1, ...., xk)‖ ≤ ‖A‖‖x1‖...‖xk‖, dla x1, ..., xk ∈ RN .

Wynika stąd, że A jest przekształceniem ciągłym, choć – przeciwnie niż w przypadku prze-kształceń liniowych – na ogół nie jest ono jednostajnie ciągłe. Dowód w ogólnej sytuacji jestrachunkowo złożony; dlatego rozważymy tylko sytuację k = 2. Niech xn → x0, yn → y0 w RN .Wtedy‖A(xn, yn)− A(x0, y0)‖ ≤ ‖A(xn, yn)− A(x0, yn)‖+ ‖A(x0, yn)− A(x0, y0)‖ ≤

‖A‖‖xn − x0‖‖yn‖+ ‖A‖‖x0‖‖yn − y0‖ → 0.UWAGA: Czytelnik na pewno dostrzegł w tym miejscu „mnogość” oznaczeń ‖ · ‖. W każdymz przypadków symbol ‖ · ‖ może oznacza inną „normę” (tj. normę w innej przestrzeni). Bez-względnie należy zachować dużą ostrożność i za każdym razem używając tego symbolu miećpełną kontrolę czego on dotyczy.

Page 43: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Rozdział 2Rachunek różniczkowy

2.1 Pochodne

2.1.A Pochodne funkcji wektorowych jednej zmiennej

Niech f : (a, b) → RM , gdzie −∞ ≤ a < b ≤ +∞ i M ≥ 1. Wtedy f = (f1, ..., fM ), gdziefi : (a, b)→ R. Niech t ∈ (a, b). Powiadamy, że odwzorowanie f jest różniczkowalne w punkciet , gdy istnieje granica lim

s→0 f (t + s)− f (t)s .

Granicę tę nazywa się pochodną odwzorowania f w punkcie t i oznacza symbolem f ′(t).Oczywiście pochodna jest w tym przypadku wektorem (elementem przestrzeni RM ); zatemf ′(t) = (a1, ..., aM ), gdzie ai ∈ R, dla i = 1, ...,M ; lub w zapisie macierzowym

f ′(t) = [a1, ..., aM ]T =a1a2...aM

.Jaką postać mają współczynniki ai przy i = 1, ...,M? Łatwo pokazać, że2.1.1 TWIERDZENIE: Odwzorowanie f jest różniczkowalne w punkcie t ∈ (a, b) wtedy i tylkowtedy, gdy każda z funkcji fi , i = 1, ...,M , jest różniczkowalna w punkcie t i wówczas f ′(t) =(f ′1(t), ..., f ′M (t)), tzn. ai = f ′i (t) dla wszystkich i = 1, ...,M . Wynika stąd, że w zasadzie wszystkie fakty dotyczące pochodnych funkcji (rzeczywistychjednej zmiennej) przenoszą się na przypadek funkcji wektorowych jednej zmiennnej choć,oczywiście, trzeba zachować ostrożność.Na przykład: funkcje różniczkowalne są ciągłe; jeżeli odwzorowania f , g : (a, b) → RMsą różniczkowalne w punkcie t , to ich suma, różnica są odwzorowaniami różniczkowalnymi i(f ± g)′(t) = f ′(t)± g ′(t)UWAGA: (1) Twierdzenie o pochodnej iloczynu (lub ilorazu) nie ma sensu, chyba, że mowao iloczynie skalarnym tych funkcji. Mianowicie można określić funkcję

F (t) := 〈f (t), g(t)〉 = M∑i=1 fi(t)gi(t), t ∈ (a, b).

Page 44: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

40 2. RACHUNEK RÓŻNICZKOWYJeśli odwzorowania f i g są różniczkowalne w punkcie t , to funkcja F jest też tam różniczko-walna i

F ′(t) = 〈f ′(t), g(t)〉+ 〈f (t), g ′(t)〉.RzeczywiścieF ′(t) = ( M∑

i=1 figi)′ (t) = M∑

i=1 (figi)′(t) = M∑i=1 (f ′i (t)gi(t) + fi(t)g ′i (t)) = 〈f ′(t), gt)〉+ 〈f (t), g ′(t)〉.

(2) Niestety, dla odwzorowań f : (a, b)→ RM , gdzie M > 1, nie zachodzi odpowiednik twierdze-nia Lagrange’a. Przypomnijmy to twierdzenie: jeśli funkcja f : [a, b]→ R jest różniczkowalna(lub ciągła, zaś pochodna f ′(t) istnieje dla t ∈ (a, b))(1) , to istnieje θ ∈ (0, 1) taka, że

f (b)− f (a) = f ′(a + θ(b − a))(b − a).Innymi słowy znajdzie się punkt pośredni t ∈ (a, b) taki, że f (b)− f (a) = f ′(t)(b − a).Dla kontrprzykładu rozważmy odwzorowanie f : R→ R2 dane wzorem f (t) := (cos t, sin t),t ∈ R. Wówczas f (0) = f (2π) = (1, 0). Jednak dla dowolnego t ∈ (0, 2π), f ′(t) = (− sin t, cos t)i, wobec tego ‖f ′(t)‖ = √sin2(t) + cos2 t = 1. Zatem równość 0 = f (2π) − f (0) = 2πf ′(t) jestwykluczona dla każdego punktu pośredniego t ∈ (0, 2π).UWAGA: W sytuacji funkcji f : (a, b)→ R2 lub f : (a, b)→ R3 współrzędne odwzorowania fzwykle oznacza się symbolami x, y, z itp. tzn. pisze się f (t) = (x(t), y(t)) lub f (t) = (x(t), y(t), z(t))dla t ∈ (a, b). Ponadto (szczególnie w omawianych sytuacjach) odwzorowania takie nazywa siękrzywymi (co ma sens szczególnie z geometrycznego punktu widzenia). Takiej terminologiibędziemy używać „bez ostrzeżenia”.2.1.B Pochodne kierunkowe i cząstkowe funkcji wielu zmiennych

Niech f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, i x = (x1, ..., xN ) ∈ U . Niech wektorh ∈ RN , h 6= 0. Dla małego (co do wartości bezwzględnej) t ∈ R, wyrażenie f (x + th) jestokreślone (uzasadnienie: zbiór U jest otwarty, więc B(x, ε) ⊂ U dla pewnego ε > 0; jeśli więc|t| < ε/‖h‖, to x + th ∈ B(x, ε), bo ‖(x + th) − x‖ = |t|‖h‖ < ε). Można więc dla takich trozważać wyrażenie

f (x + th)− f (x)t ∈ R

oraz jego granicę przy t → 0, o ile – oczywiście – istnieje.Jeśli istnieje (w sensie właściwym) granicalimt→0 f (x + th)− f (x)

t ,

to jej wartość nazywa się pochodną kierunkową funkcji f w punkcie x w kierunku wektorah i oznacza symbolem f ′(x;h).

POCHODNE CZĄSTKOWE Niech j = 1, ..., N. W szczególności pochodną kierunkową wpunkcie x w kierunku wektora ej (wersora z bazy kanonicznej) nazywa się pochodną cząst-kową względem j-tej zmiennej i oznacza symbolem fxj (x) lub f ′j (x) lub ∂∂xj f (x), a także f|j (x) (to

1Gdy mowa o różniczkowalności funkcji określonych na przedziale domkniętym to w punktach a lub b mowajest o pochodnych jednostronnych.

Page 45: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 41

ostatnie oznaczenie jest najlepsze, lecz najrzadziej stosowane).Jeśli mamy do czynienia z funkcją dwóch lub trzech zmiennych, które – jak zwykle oznaczasię symbolami x, y, z, to pisząc fx(x, y, z) lub f ′x(x, y, z), f ′y (x, y, z) itp. mamy na myśli pochod-ną cząstkową względem pierwszej, drugiej zmiennej. Oznaczenia są różne, ale wszystkie sączytelne.W każdym razie (w wyjściowej sytuacji)f|j (x) := f ′(x; ej ).

W praktyce pochodna cząstkowa jest pochodną w punkcie t = xj funkcji jednej zmiennejt 7Ï f (x1, x2, ..., xj−1, t, xj+1, ..., xN ),

tzn. funkcji, w której ustalamy (jako parametry) wszystkie, poza j-tą, współrzędne punktu x i„uzmiennieniu” podlega tylko j-ta zmienna.PRZYKŁAD: Zilustrujemy to na przykładzie. Niechf (x, y, z) = x2z − (x + y)z

określonej w całej przestrzeni. Obliczymy fx(x, y, z). Ma się rozumieć, że ustalamy zmienney, z (traktujemy je chwilowo jako parametry) i różniczkujemy względem x, tzn.

fx(x, y, z) = limt→0 f (x + t, y, z)− f (x, y, z)

t = (f (·, y, z))′(x) = 2xz − z.Zauważmy, że f (x + t, y, z) = f ((x, y, z) + t(1, 0, 0)) = f ((x, y, z) + te1).Mamy następujące reguły algebraiczne obliczania pochodnych kierunkowych:2.1.2 FAKT: Przypuśćmy, że f , g : U → R, x ∈ U , h ∈ RN i pochodne kierunkowe f ′(x;h),g ′(x;h) istnieją. Wtedy:(1) pochodna (f ± g)′(x;h) istnieje i

(f ± g)′(x;h) = f ′(x;h)± g ′(x;h);(2) pochodna (fg)′(x;h) istnieje i

(fg)′(x;h) = f ′(x;h)g(x) + f (x)g ′(x;h);(3) jeśli g(x) 6= 0 dla x ∈ U , to istnieje (f/g)′(x;h) i mamy

(f/g)′(x;h) = 1[g(x)]2 (f ′(x;h)g(x)− f (x)g ′(x;h)).DOWÓD: jest to właściwie powtórzenie dowodu odpowiedniego twierdzenia o różniczkowaniusum, iloczynów i ilorazów funkcji jednej zmiennej. Nie mniej warto, by Czytelnik poćwiczył.Dla przykładu uzasadnimy drugi wzór. Niech φ(t) := f (x + th). Z definicji

f ′(x;h) = limt→0 f (x + th)− f (x)

t = limt→0 φ(t)− φ(0)

t = φ′(0).Analogicznie – kładąc ψ(t) := g(x + th) – dostaniemy

g ′(x;h) = ψ′(0).

Page 46: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

42 2. RACHUNEK RÓŻNICZKOWYPonadto

limt→0 (fg)(x + th)− (fg)(x)

t = limt→0 φ(t)ψ(t)− φ(0)ψ(0)

t = (φψ)′(0) = φ′(0)ψ(0) + φ(0)ψ′(0).Otrzymany wzór kończy dowód. UWAGA: Jeśli istnieje f ′(x;h) i α ∈ R, to istnieje f ′(x;αh) i

f ′(x;αh) = αf ′(x;h).Czyli pochodna kierunkowa jest jednorodna ze względu na kierunek (wektor) h.Niestety pochodna kierunkowa nie jest addytywna ze względu na kierunki. Innymi słowy:jeśli nawet istnieją pochodne f ′(x;h1) i f ′(x;h2) w kierunku dwóch wektorów h1, h2 ∈ RN , tobynajmniej nie musi istnieć pochodna f ′(x;h1+h2) ani (nawet jeżeli istnieje) nie musi zachodzićrówność f ′(x;h1 + h2) = f ′(x;h1) + f ′(x : h2).PRZYKŁAD: Ma to miejsce dla funkcji

f (x, y) = xyx3+y3 gdy (x, y) 6= (0, 0);0 gdy x = 0 = y.

Wtedy fx(0, 0) = f ′((0, 0); e1) = 0 = f ′((0, 0); e2) = fy (0, 0) leczf ′((0, 0); (1, 1)) = f ′((0, 0); e1 + e2) = lim

t→0 t22t3nie istnieje.Kolejny przykład wskazuje, że funkcja może posiadać pochodne we wszystkich kierunkachw zadanym punkcie, lecz może tam nie być ciągła.PRZYKŁAD: Rozważmy funkcjęf (x, y) = xy2

x2+y4 gdy (x, y) 6= (0, 0);0 gdy x = 0 = y.

Wtedy, dla dowolnego h = (a, b)f ′((0, 0); (a, b)) = lim

t→0 ab2a2 + t2b4 = 0 gdy a = 0

b2a gdy a 6= 0.

Oczywiście wartość f ′((0, 0);h) nie zależy w sposób addytywny od h (sprawdzić) i – ponadtofunkcja f nie jest ciągła (w punkcie (0, 0)): sprawdzić.Jest jeszcze gorzej.PRZYKŁAD: Niechf (x, y) = x4y2

x8+y4 gdy (x, y) 6= (0, 0);0 gdy x = 0 = y.Ta funkcja ma pochodną f ′((0, 0;h) = 0 dla dowolnego h (więc, w szczególności, wyrażenief ′((0, 0;h) zależy liniowo od h), lecz również nie jest ciągła.UWAGA: Jeśli mamy do czynienia z funkcją f : U → R, x ∈ U oraz: dla dowolnego h ∈ RNistnieje f ′(x;h) przy czym wyrażenie f ′(x;h) zależy liniowo od h, to mówi się, że f jest słaboróżniczkowalna w punkcie x.

Page 47: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 43

Jak widzieliśmy w poprzednim przykładzie: f jest słabo różniczkowalna w punkcie (0, 0),lecz nie jest tam ciągła.KONKLUZJA: Zatem: pojęcie pochodnej kierunkowej jest zbyt słabe z punktu widzenia ele-mentarnych intuicji.2.1.3 TWIERDZENIE (I-sze o wartości średniej) Niech f : U → R, gdzie U jest zbiorem otwartym.Załóżmy, że x0, x1 ∈ U i odcinek [x0;x1] łączący te punkty zawiera się w zbiorze U . Niechh := x1 − x0. Jeśli dla dowolnego x ∈ [x0, x1] istnieje pochodna f ′(x;h), to istnieje θ ∈ (0, 1)taka, że

f (x1)− f (x0) = f ′(x0 + θh;h).Rozważmy funkcję pomocniczą g : [0, 1]→ R daną wzorem

g(t) := f (x0 + th), t ∈ [0, 1].Zauważmy, że dla każdego t ∈ [0, 1].

g ′(t) = lims→0 g(t + s)− g(t)

s = lims→0 f ((x0 + th) + sh)− f (x0 + th)

s = f ′(x0 + th;h)(dla t = 0 lub t = 1 mowa o odpowiednich pochodnych jednostronnych). Zatem g jest funkcją(jednej zmiennej) różniczkowalną i, wykorzystując twierdzenie Lagrange’a, znajdziemy θ ∈(0, 1) takie, że

f (x1)− f (x0) = g(1)− g(0) = g ′(θ) = f ′(x0 + θh;h).

2.1.C Różniczkowalność i pochodna funkcji wielu zmiennych

Niech f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, i x ∈ U . Mówimy, że funkcja fjest różniczkowalna w punkcie x, gdy istnieje przekształcenie liniowe A ∈ L(RN ,R) (czylifunkcjonał liniowy) taki, że

limh→0 f (x + h)− f (x)− A(h)

‖h‖ = 0.Powyższy warunek równoważny jest stwierdzeniu, że przyrost funkcji tzn. wyrażenie f (x +h)− f (x), przy przyroście argumentu h ∈ RN wyraża się wzorem

f (x + h)− f (x) = A(h) + ‖h‖ε(h), (∗)gdzie wyraz A(h) zależy w sposób liniowy od przyrostu h, zaś reszta ‖h‖ε(h) jest rzędu mniej-szego niż przyrost, tzn. wyrażenie ε(h)→ 0, gdy h→ 0 i ε(0) = 0 (2).

UWAGA: Warto, by Czytelnik zapoznał się w tym miejscu tzw. notacją Landau’a lub notacją„o” małe. Otóż zamiast opisywać jakąś wielkość skalarną (lub wektorową) jako np. ε(h)‖h‖,gdzie ε(h)→ 0, przy h → 0, pisze się o(‖h‖) i czyta: wielkość ta jest o małe od h, przy h → 0.Np.:f (x) = o(|x|)

2Tu wytłuszczyliśmy słowo równoważny – dlaczego: to stanie się czytelne po lekturze podrozdziału dotyczącegodwukrotnej różniczkowalności.

Page 48: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

44 2. RACHUNEK RÓŻNICZKOWYprzy x → 0 oznacza, że lim

x→0 f (x)|x| = 0.

Jest to wygodna i krótka notacja, która pozwala napisać: funkcja f : U → R jest różniczkowalnaw punkcie x ∈ U wtedy i tylko wtedy, gdyf (x + h) = f (x) + A(h) + o(‖h‖), h→ 0.

Mówimy, że funkcja f jest różniczkowalna, jeśli jest różniczkowalna w każdym punkcieswej dziedziny.UWAGA: Podaną definicję i podany wzór interpretacyjny należy dobrze zrozumieć (w szcze-gólności z formalnego punktu widzenia): we wzorach tych h oznacza przyrost argumentu, awięc element w przestrzeni RN , tymczasem „reszta” ε(h) (pomnożona przez długość przyrostu‖h‖) jest miarą „odstępstwa” przyrostu funkcji od „kawałka” A(h) liniowo zależnego od h. Takwięc, mówiąc nieco kolokwialnie, funkcja jest różniczkowalna w punkcie x, jeśli dla dosta-tecznie małych przyrostów h argumentu, przyrost funkcji f (x + h)− f (x) jest, w przybliżeniu,funkcją liniową przyrostu.PRZYKŁAD: Funkcja stała f : U → R (tzn. f (x) ≡ c = const. dla x ∈ U) jest różniczkowalna.Rzeczywiście przekształcenie zerowe zadośćczyni definicji.2.1.4 TWIERDZENIE: Jeśli funkcja f jest różniczkowalna w punkcie x, to dla dowolnego wektorah ∈ RN istnieje pochodna kierunkowa f ′(x;h) i

f ′(x;h) = A(h),gdzie A ∈ L(RN ,R) jest przekształceniem liniowym z definicji różniczkowalności. Wynikastąd, że przekształcenie to jest wyznaczone jednoznacznie: nazywa się je pochodną funkcjif w punkcie x i oznacza symbolem f ′(x) (tak więc f ′(x) = A). Macierz stowarzyszoną zpochodną f ′(x) nazywa się macierzą Jacobiego funkcji f w punkcie x i oznacza symbolemJf (x). Macierz ta ma jeden wiersz i N kolumn, przy czym w j-tej (j = 1, ..., N) kolumnie stoipochodna cząstkowa funkcji f względem j-tej zmiennej, a więc

Jf (x) = [f|1(x), f|2(x), ..., f|N (x)].W związku z tym mamy dla małego przyrostu

f (x + h)− f (x) = f ′(x)(h) + ‖h‖ε(h) = N∑j=1 hjf|j (x) + ‖h‖ε(h)

gdzie ε(h)→ 0 przy h→ 0.DOWÓD: Ustalmy wektor h ∈ RN , dla małych t ∈ R, t 6= 0, x + th ∈ U (pamiętajmy, że zbiór Ujest otwarty) if (x + th)− f (x)

t = 1t (A(th) + ε(th)‖th‖) = A(h) + |t|t ‖h‖ε(th)→ 0,

gdy t → 0. Tak więc f ′(x;h) = A(h). Gdyby inne przekształcenie liniowe B ∈ L(RN ,R) realizo-wało definicję różniczkowalności, to dla każdego h ∈ RN mielibyśmyA(h) = f ′(x;h) = B(h),

Page 49: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 45

co dowodzi, że A ≡ B. A więc kolejne stwierdzenie (i pojawiająca się tam definicja pochodnej)ma sens. W szczególności, dla h = ej , j = 1, ..., N mamyf|j (x) = f ′(x; ej ) = A(ej ).

Jak pamiętamy: jeśli macierz [a1, ..., aN ] jest stowarzyszona z przekształceniem liniowym f ′(x),to jej elementy wyznaczamy ze wzoruaj = A(ej ) = f|j (x).

Jeżeli więc funkcja f jest różniczkowalna w x, to dla małych przyrostów h

f (x + h)− f (x) = f ′(x)(h) + ε(h)‖h‖ = N∑j=1 hjf|j (x) + ‖h‖ε(h), (∗)

gdzie limh→0 ε(h) = 0.PRZYKŁAD: Niech A : RN → R będzie funkcjonałem liniowym o macierzy A ∈ M1×Ni niech f (x) := A(x) dla x ∈ RN . Wówczas funkcja f jest różniczkowalna i dla dowolnegox ∈ RN , f ′(x) = A oraz Jf (x) = A.UWAGA: (1) W świetle twierdzenia różniczkowalność i istnienie pochodnej to do pewnegostopnia synonimy; należy jednak pamiętać, że zanim zdefiniuje się pochodną należy zdefinio-wać pojęcie różniczkowalności.(2) Zgodnie z ogólną umową będziemy często utożsamiać pochodną (która jest przekształce-niem liniowym) z macierzą Jacobiego i będziemy pisać

f ′(x) = [f|1(x), ..., f|N (x)].(2) Praktyczna wartość powyższego twierdzenia polega na następującej metodzie weryfikacji(z definicji) różniczkowalności funkcji f : U → R w punkcie x ∈ U :a. Zanim sprawdzimy różniczkowalność musimy sprawdzić czy istnieją pochodne cząst-kowe (istnienie pochodnych kierunkowych, a w szczególności pochodnych cząstkowych jestwarunkiem koniecznym różniczkowalności).b. Zgodnie z twierdzeniem, jeśli f jest różniczkowalna w x, to jej macierz Jacobiego musimieć postać [f|1(x), ..., f|N (x)]. Tak więc, żeby sprawdzić, że funkcja jest różniczkowalna nale-ży sprawdzić, czy przekształcenie liniowe, którego macierzą jest [f|1(x), ..., f|N (x)] zadośćczyniwarunkom z definicji.PRZYKŁAD: Sprawdzić czy funkcja f : R2 → R zadana wzorem

f (x, y) = xy + x, (x, y) ∈ R2,jest różniczkowalna w punkcie (x, y) ∈ R2.Widzimy, że fx(x, y) = y+1 i fy (x, y) = x. Rozważamy przekształcenie liniowe A : R2 → R,którego macierzą jest [y+1, x] (pamiętajmy, że tu punkt (x, y) jest ustalony). Jak wiadomo, dladowolnego h = (h1, h2) ∈ R2, mamy

A(h) = (y + 1)h1 + xh2.Obliczymy teraz przyrostf ((x, y)+h)−f ((x, y)) = f (x+h1, y+h2)−f (x, y) = (x+h1)(y+h2)+(x+h1)−xy−x = A(h)+h1h2.

Page 50: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

46 2. RACHUNEK RÓŻNICZKOWYNależy teraz sprawdzić czy reszta h1h2 jest postaci ε(h)‖h‖, gdzie ε(h)→ 0 przy h→ 0. Mamy

ε(h) = h1h2‖h‖ = h1h2√

h21 + h22 ≤h1|h2|h2 → 0.

Ponieważ punkt (x, y) był wybrany dowolnie, to możemy skonkludować, że f jest funkcjąróżniczkowalną.Widać, że przedstawiona procedura może być uciążliwa. Dysponujemy jednak warunkiemdostatecznym różniczkowalności, który towarzysząc opisanej procedurze daje dobre narzędziedo badania różniczkowalności.2.1.5 TWIERDZENIE: Przypuśćmy, że dana jest funkcja f : U → R, gdzie zbiór U ⊂ RN jestotwarty. Niech x ∈ U i załóżmy, że w pewnym otoczeniu punktu x (tzn. w pewne kuli B(x, r)o środku w x i promieniu r > 0) istnieją wszystkie pochodne cząstkowe funkcji f , tzn. dladowolnego y z tego otoczenia istnieją pochodne f|j (y), j = 1, ..., N . Co więcej zakładamy, żedla dowolnego j = 1, ..., N funkcje

B(x, r) 3 y 7Ï f|j (y)są ciągłe w punkcie x. Wówczas funkcja f jest różniczkowalna w x.W tym miejscu nie podamy dowodu (opiera się on na I-szym twierdzeniu o wartościśredniej).UWAGA: W świetle podanego warunku można dowód różniczkowalności można przepro-wadzać następująco:1. Sprawdzić istnienie pochodnych cząstkowych w otoczeniu interesującego nas punktu z dzie-dziny i ich ciągłość w tym punkcie;2. Wykorzystać poprzednie twierdzenie, by napisać postać pochodnej w tym punkcie (lub jejmacierzy Jacobiego).PRZYKŁAD: Wróćmy do poprzedniego przykładu (f (x, y) = xy + x. Dla dowolnego punktu(x, y) ∈ R2,

fx(x, y) = y + 1, fy (x, y) = x.Jak widać pochodne cząstkowe istnieją wszędzie i (jako funkcje fx , fy : R2 → R są ciągłe(sprawdzić). Zatem funkcja f jest różniczkowalna if ′(x, y) = [y + 1, x].

UWAGA: Warto też wspomnieć o metodzie „wydzielania części liniowej”. Zgodnie z definicją(i uwagą po niej występującej), żeby stwierdzić różniczkowalność w punkcie x ∈ U funkcjif : U → R (gdzie U jest – jak zwykle – zbiorem otwartym) wystarczy przedstawić przyrostf (x + h) − f (x) w postaci sumy składnika zależnego od h w sposób liniowy i reszty rzędumniejszego niż ‖h‖.

ĆWICZENIE: Na przykład: niech f : RN → R będzie formą kwadratową wyznaczoną przezformę dwuliniową φ : RN × RN → R. Czy f jest funkcją różniczkowalną?Można rozumować tak:f (x + h)− f (x) = φ(x + h, x + h)− φ(x, x) = φ(x, h) + φ(h, x) + φ(h, h).

Page 51: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 47

Składnik φ(h, h) jest rzędu mniejszego niż ‖h‖ (dlaczego), zaś reszta jest liniowa zależna od h.Czytelnik zechce przypomnieć podrozdział o formie ψ (dwuliniowej symetrycznej) odpowia-dającej f i zechce dostrzec, że f (x + h)− f (x) = 2ψ(x, h) + φ(h, h), czyli odwzorowanie linioweh 7Ï 2ψ(x, h) jest pochodną f w punkcie x.Przypomnijmy, że istnienie pochodnych kierunkowych w danym punkcie w kierunku do-wolnego wektora a także ich liniowa zależność od kierunku nie implikowało ciągłości funkcjiw tym punkcie.2.1.6 TWIERDZENIE: Jeśli funkcja f : U → R jest różniczkowalna w punkcie x, to jest tamciągła.DOWÓD: Niech (xn) ⊂ U i xn → x. Mamy udowodnić, że f (xn) → f (x), czyli f (xn) − f (x) → 0,gdy n→∞. Kładąc hn := xn − x, n ∈ N, możemy napisać

f (xn)− f (x) = f (x + hn)− f (x) = f ′(x)(hn) + ε(hn)‖hn‖(lub od razu f (xn)− f (x) = f ′(x)(xn−x)+ε(xn−x)‖xn−x‖). Jak wiemy przekształcenie liniowef ′(x) jest ciągłe, a zatem f ′(x)(hn)→ 0, bo – oczywiście hn → 0). Ponadto ε(hn)→ 0 i ‖hn‖ → 0.W taki razie f (xn)− f (x)→ 0. .2.1.7 TWIERDZENIE: Załóżmy, że funkcje f , g : U → R, gdzie U ⊂ RN jest zbiorem otwartym,są różniczkowalne w punkcie x ∈ U . Wówczas funkcje f ± g , fg oraz f/g (o ile iloraz jestpoprawnie zdefiniowany) są różniczkowalne w x i

(f ± g)′(x) = f ′(x)± g ′(x), (fg)′(x) = g(x)f ′(x) + f (x)g ′(x),(f/g)′(x) = 1[g(x)]2 (g(x)f ′(x)− f (x)g ′(x)).UWAGA: Zanim przystąpimy do dowodu należy dobrze zrozumieć tezę (również pod wzglę-dem formalnym. Otóż pochodna jest (z definicji) przekształceniem liniowym. Zatem w lewychstronach podanych wzorów znajdują się przekształcenia liniowe, po prawej stronie również:w pierwszym ze wzorów mamy sumę dwóch przekształceń f ′(x) i g ′(x); w drugim wzorze poprawej stronie mamy sumę przekształcenia g(x)f ′(x) (tzn. iloczyn przekształcenia f ′(x) przezskalar g(x)) oraz przekształcenia f (x)g ′(x) (tzn. iloczyn przekształcenia g ′(x) przez skalar f (x))– kolejność mnożenia ma znaczenie, gdyż w przestrzeniach wektorowych (a taką przestrzeniąjest zbiór przekształceń liniowych L(RN ,R) elementami której sa rozważane pochodne) mno-żymy wektory przez skalary z lewej strony. Analogicznie interpretujemy ostatni z podanychwzorów, z tym że mamy tam do czynienia z różnicą przekształceń.DOWÓD: Dla przykładu podamy dowód ostatniej równości (polecając Czytelnikowi dowodypozostałych wzorów). Dla uproszczenia notacji i bez zmniejszenia ogólności można założyć, że

f ≡ 1 : niech B := g ′(x). Chcemy dowieść, że przekształcenie C : RN → R zadane wzoremC(h) = − 1

g2(x)B(h), h ∈ RN ,

jest pochodną funkcji F := 1/g (oczywiście milcząco pojawia się założenie o poprawności tejfunkcji, czyli zakładamy, że g nie ma miejsc zerowych w dziedzinie U). Przede wszystkim łatwowidać, że C jest przekształceniem liniowym. Należy więc sprawdzić, żelimh→0 F (x + h)− F (x)− C(h)

‖h‖ = 0.

Page 52: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

48 2. RACHUNEK RÓŻNICZKOWYWstawiając otrzymamy

F (x + h)− F (x)− C(h)‖h‖ = − 1

g(x + h)g(x) g(x + h)− g(x)− B(h)‖h‖ +( 1

g2(x) − 1g(x + h)g(x)

) 1‖h‖B(h).

Pierwszy składnik dąży do 0 przy h → 0, bo – z definicji różniczkowalności g w punkcie xmamy limh→0 g(x + h)− g(x)− B(h)

‖h‖ = 0;drugi składnik jest tez zbieżny do 0, bo wyrażenie 1

‖h‖B(h) ograniczone jest przez normę ‖B‖,zaś wyrażenie ( 1g2(x) − 1

g(x+h)g(x)) dąży do zera (a wynika to z ciągłości g w punkcie x (czylig(x + h)→ g(x), gdy h→ 0).

POJĘCIE GRADIENTU Jeśli f : V → R, gdzie V ⊂ RN jest zbiorem otwartym, jest funkcjaróżniczkowalną w punkcie x ∈ V , to pochodna f ′(x) jest przekształceniem (funkcjonałem)liniowym (elementem przestrzeniL(RN ,R), tzn. przestrzeni sprzężonej (RN )∗). Jak wspomnianow rozdziale dotyczącym algebry liniowej przestrzeń sprzężoną (RN )∗ można utożsamiać z RN(w tym utożsamieniu funkcjonałowi φ ∈ (RN )∗ odpowiada wektor U(φ) o tej własności, żeφ(x) = 〈x,U(φ)〉).Wektor U(f ′(x)) nazywa się gradientem funkcji f w punkcie x i oznacza symbolem ∇f (x).Zatem

∇f (x) =f|1(x)f|2(x)...f|N (x)

. Podamy teraz ważną interpretację wektora gradientu funkcji. Przypomnijmy, ze dla wek-torów x, y ∈ RN , x, y 6= 0, wielkość cos^x, y = 〈x,y〉

‖x‖‖y‖ nazywa się cosinusem kąta pomiędzywektorami x i y . Używając tego zapisu mamy: dla dowolnego wektora h ∈ RN ,f ′(x;h) = 〈h,∇f (x)〉 = ‖∇f (x)‖‖h‖ cos^h,∇f (x).

Jeśli ‖h‖ = 1, tof ′(x;h) = ‖∇f (x)‖ cos^h,∇f (x) ≤ ‖∇f (x)‖i f ′(x;h) = ‖∇f (x)‖ wtedy i tylko wtedy, gdy wektory h i ∇f (x) wyznaczają ten sam kieruneki mają ten sam zwrot.Wykazaliśmy więc, że

2.1.8 TWIERDZENIE: Gradient∇f (x) wyznacza kierunek, w którym wartość pochodnej kierun-kowej jest możliwie największa. Jest to jednocześnie kierunek największego wzrostu funkcjif .

2.1.D Pochodne odwzorowań

Rozważmy odwzorowanie f : U → RM , gdzie U ⊂ RN jest zbiorem otwartym i niech f =(f1, ..., fM ). Tak więc fi : U → R dla dowolnego i = 1, ...,M .

Page 53: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 49

Mówimy, że odwzorowanie f jest różniczkowalne w punkcie x ∈ U , jeżeli istnieje prze-kształcenie liniowe A ∈ L(RN ,RM ) takie, żelimh→0 f (x + h)− f (x)− A(h)

‖h‖ = 0,czyli przyrost funkcji f (x + h) − f (x) można przedstawić w postaci części liniowo zależnej odprzyrostu argumentu h i reszty rzędu mniejszego niż h, tzn.

f (x + h)− f (x) = A(h) + ‖h‖ε(h),gdzie ε(h) ∈ RM i ε(h)→ 0, przy h→ 0.Widzimy więc, że w przypadku odwzorowań (funkcji wektorowych wielu zmiennych) ma-my do czynienia z sytuacją podobną do funkcji wielu zmiennych.2.1.9 TWIERDZENIE: Jeśli odwzorowanie f : U → RM jest różniczkowalne w punkcie x ∈U , to przekształcenie liniowe A z definicji jest wyznaczone jednoznacznie. nazywa się jepochodną odwzorowania f w punkcie x i oznacza symbolem f ′(x). Macierz A = [aij ] ∈MM×N stowarzyszoną z pochodną nazywa się macierzą Jacobiego i oznacza Jf (x) (3). Jejwspółczynniki wyrażają się następującymi wzorami

aij = fi|j (x),a więc w i-tym wierszu i w j-tej kolumnie stoi pochodna cząstkowa i-tej funkcji współrzędnejwzględem j-tej zmiennej.DOWÓD: Przypuśćmy, że przekształcenia liniowe A i B zadośćczynią warunkom z definicji.Wtedy

limh→0 B(h)− A(h)

‖h‖ = limh→0 f (x + h)− f (x)− A(h)

‖h‖ − limh→0 f (x + h)− f (x)− B(h)

‖h‖ = 0.Ustalmy wektor h ∈ RN . Jeśli t ∈ R i t → 0+, to

B(h)− A(h)‖h‖ = lim

t→0 B(th)− A(th)t‖h‖ = 0.

Stąd A(h) = B(h). Z dowolności ustalonego h wynika, że A ≡ B.Niech i = 1, ...,M i j = 1, ..., N . Wówczas (wykorzystując liniowość i ciągłość rzutowaniaπi : RM → R) mamy

fi|j (x) = limt→0 fi(x + tej )− fi(x)

t = limt→0 1

t πi(f (x + tej )− f (x)) =πi(limt→0 1

t (tA(ej ) + ε(tej )|t|) = πi(A(ej )) = aij .

Związki różniczkowalności odwzorowania i jego funkcji współrzędnych opisuje następu-jący fakt.2.1.10 TWIERDZENIE: Odwzorowanie f jest różniczkowalne w punkcie x ∈ U wtedy i tylkowtedy, gdy dla dowolnego i = 1, ...,M , funkcja współrzędna fi jest różniczkowalna w tympunkcie. Wtedy też

f ′i (x) = πi f ′(x).3Gdy N = M , to macierz Jacobiego Jf (x) jest kwadratowa; jej wyznacznik det Jf (x) nazywa się jakobianemodwzorowania f w punkcie x.

Page 54: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

50 2. RACHUNEK RÓŻNICZKOWYDOWÓD: Konieczność: ustalmy i = 1, ...,M . Dla dowolnego (dostatecznie małego) h ∈ RN ,

fi(x + h)− fi(x) = πi(f (x + h)− f (x)) = πi(f ′(x)(h) + ‖h‖ε(h)) = πi f ′(x) + ‖h‖εi(h),gdzie εi(h) := πi(ε(h)), zaś ε(h)→ 0 przy h → 0; oczywiście εi(h)→ 0 dla h → 0. Pokazaliśmywięc, że funkcja fi jest różniczkowalna o pochodnej f ′i (x) = πi f ′(x).Dostateczność: wystarczy sprawdzić, że przekształcenie liniowe A : RN → RM zadanewzorem

A(h) := (f ′1(x)(h), ..., f ′M (x)(h)), h ∈ RN ,zadośćczyni definicji. Jest to natychmiastowe. Z podanej charakteryzacji wynikają wszystkie własności pochodnej odwzorowań, analo-giczne do sformułowanych powyżej w odniesieniu do funkcji. W szczególności odwzorowaniaróżniczkowalne są ciągłe, różniczkowalność zachowuje się przy wykonalnych działaniach al-gebraicznych.Oczywiście w przypadku odwzorowań można mówić też o pochodnych kierunkowych.Mianowicie, jeżeli h ∈ RN jest ustalonym wektorem, to dla x ∈ U granica (o ile istnieje)f ′(x;h) := lim

t→0 f (x + th)− f (x)t ∈ RM

nazywana jest pochodną kierunkową odwzorowania f w punkcie x w kierunku wektora h.Jeśli h = ej , j = 1, ..., N , to pochodną kierunkową f ′(x; ej ) nazywa się pochodną cząstkowąodwzorowania i oznacza – jak zwykle symbolem f|j (x) (ważne by dostrzec, że f|j (x) ∈ RM ).Nie będziemy tego pojęcia szczegółowo omawiać. Ograniczymy się tylko do stwierdzenia,że jeżeli odwzorowanie f : U → RM jest różniczkowalne w punkcie x, to dla dowolnego h ∈ RNistnieje pochodna kierunkowa f ′(x;h) if ′(x;h) = f ′(x)(h).

Dowód przebiega analogicznie do dowodu analogicznego faktu dla funkcji.2.1.E Komentarz

Poczynimy teraz ważne spostrzeżenie.UWAGA: (1) Jeżeli na funkcję f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, patrzećjako na odwzorowanie f : U → RM , gdzie M = 1, to widzimy, że dwie podane wyżej definicjenie różnią się między sobą: w obu przypadkach pochodna jest przekształceniem liniowym zL(RN ,RM ).(2) Jeśli na „krzywą” f : (a, b) → RM patrzyć jako na odwzorowanie f : (a, b) ⊂ RN → RM ,gdzie N = 1, to (zgodnie z przyjętą wyżej definicją) jej pochodną f ′(t) w punkcie t ∈ (a, b) jestprzekształcenie liniowe w L(R,RM ) o macierzy w MM×1; a więc – zgodnie z utożsamieniamiz rozdziału o macierzach – wektor w RM . To ponownie zgadza się z rozważaniami z początkutego rozdziału.(3) Spójrzmy wreszcie na „zwykłą” funkcję f : (a, b)→ R, gdzie −∞ ≤ a < b ≤ +∞, jak naodwzorowanie f : U → RM , gdzie U = (a, b) ⊂ RN , N = 1 jest zbiorem otwartym, zaś M = 1.Z jednej strony, zakładając, że jest ona różniczkowalna w sensie funkcji rzeczywistych

Page 55: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 51

jednej zmiennej w punkcie x ∈ (a, b), to pochodna (zgodnie z rachunkiem różniczkowymfunkcji jednej zmiennej) jest liczbą

f ′(x) = limt→0 f (x + t)− f (x)

t .

Z drugiej jednak strony, przyjmując podany punkt widzenia i zakładając, że jest ona róż-niczkowalna w x w podanym wyżej sensie, to pochodna funkcji f w punkcie x jest przekształ-ceniem liniowym A ∈ L(R,R). Skąd bierze się ta (formalna) różnica?Przede wszystkim zauważmy, że jeśli f jest różniczkowalna (w zwykłym sensie), to prze-kształcenie liniowe o macierzy [a], gdzie a = f ′(x), zadośćczyni powyższej definicji; zatemmamy do czynienia z różniczkowalnością w sensie powyższym. Jeżeli zaś f jest funkcją róż-niczkowalną w tym „nowym” sensie, tzn. mamy pewne odwzorowanie liniowe A ∈ L(R,R) i[a] jest jego macierzą, to liczba a jest pochodną naszej funkcji w zwykłym sensie, bowiem ajest wartością jaką A przyjmuje na „wektorze” jednostkowym e = 1 (w R baza jest jednoele-mentowa i tworzy ją singleton 1). Jest to więc pochodna kierunkowa funkcji f w kierunkuwektora e = a, a więc a = f ′(x; e) = limt→0 f (x+te)−f (x)t = limt→0 f (x+t)−f (x)

t = f ′(x). A zatem róż-nica polega tylko na formalnym spojrzeniu. Z jednej strony pochodna jest liczbą, z drugiej zaśprzekształceniem liniowym o jednoelementowej macierzy, której jedynym współczynnikiemjest właśnie ta liczba f ′(x). Biorąc pod uwagę konieczność tego typu identyfikacji sporo miej-sca poświęciliśmy tej kwestii w podrozdziale dotyczącym elementów algebry liniowej. Gorącopolecamy Czytelnikowi namysł na tymi sprawami: jest to niezbędne dla dobrego rozumienia2.1.F Reguła łańcucha

Pochodna zachowuje się dobrze przy złożeniach funkcji2.1.11 TWIERDZENIE: Rozważmy funkcje f : U → RK , gdzie U ⊂ RN jest zbiorem otwartymoraz g : V → RM , gdzie V ⊂ RK jest też zbiorem otwartym oraz f (U) ⊂ V (określone jest więcpoprawnie złożenie g f : U → RM ). Załóżmy, że funkcja f jest różniczkowalna w punkciex ∈ U , zaś funkcja g jest różniczkowalna w punkcie y := f (x). Wówczas funkcja g f jestróżniczkowalna w punkcie x i jej pochodna wyraża się wzorem

(g f )′(x) = g ′(y) f ′(x) = g ′(f (x)) f ′(x). (∗)Dowód tego twierdzenie (bez pewnych upraszczających życie założeń) jest dość technicznieskomplikowany. Należy jednak dokładnie rozumieć ten wzór (również pod względem formal-nym). Po lewej stronie mamy pochodną funkcji gf , a zatem przekształcenie liniowe RN → RM .Po prawej stronie znajduje się złożenie przekształcenia liniowego A := f ′(x) : RN → RK zprzekształceniem g ′(y) = g ′(f (x)) : RK → RM . Pamiętając, że złożeniu przekształceń linio-wych odpowiada macierz będącą iloczynem Cauchy’ego macierz odpowiadających składanymprzekształceniom możemy odtworzyć macierz Jacobiego odwzorowania g f . Z jednej stronywiemy, że jest to macierz postaci [(gi f )|j (x)] i=1,...,M

j=1,...,N (Czytelnik bez wątpienia dostrzega, że i-tąfunkcja współrzędną odwzorowania g f jest funkcja gi f ), z drugiej macierz ta jest iloczynemmacierzy Jacobiego odwzorowania g w punkcie y , czyli macierzy [gi|k(y)] i=1,...,Mk=1,...,K przez macierzJacobiego odwzorowania f w punkcie x, czyli macierz [fk|j (x)] k=1,...,K

j=1,...,N . Tak więc[(gi f )|j (x)] i=1,...,M

j=1,...,N = [gi|k(y)] i=1,...,Mk=1,...,K · [fk|j (x)] k=1,...,K

j=1,...,N .

Page 56: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

52 2. RACHUNEK RÓŻNICZKOWYBiorąc pod uwagę definicję iloczynu Cauchy’ego macierzy otrzymujemy wzór: dla dowolnychi = 1, ...,M i j = 1, ..., N ,

(gi f )|j (x) = K∑k=1 gi|k(y)fk|j (x) = K∑

k=1(gi|k f )(x)fk|j (x). (∗∗)UWAGA: Czytelnik powinien zapamiętać wzór (∗∗) (albo zapamiętać, znacznie łatwiejszy dozapamiętania wzór (∗) i umieć wyprowadzić wzór (∗∗)). Szczególnie jest to ważne w prak-tycznych zastosowaniach i przy różnych konfiguracjach liczb N,K i M . Na przykład gdy

N = 1 = M , K dowolne, N,M dowolne i K = 1 (jest to najczęstsza sytuacja, w której te-go wzoru się używa).2.1.G Twierdzenia o wartości średniej

Omówiliśmy już I-sze twierdzenie o wartości średniej dla funkcji (i poddaliśmy krytyce takietwierdzenie w przypadku odwzorowań wektorowych jednej zmiennej).Pojawią się teraz dwa twierdzenia.2.1.12 TWIERDZENIE (II-gie o wartości średniej) Przypuśćmy, że f : U → R, gdzie U ⊂ RN jestzbiorem otwartym, x0, x1 ∈ U i odcinek [x0;x1] ⊂ U . Jeżeli funkcja f jest różniczkowalna wkażdym punkcie x ∈ [x0;x1], to istnieje θ ∈ (0, 1) taka, że

f (x1)− f (x0) = f ′(x0 + θ(x1 − x0))(x1 − x0).Zanim przystąpimy do dowodu należy podany wzór dobrze interpretować. Po lewej stroniemamy różnicę dwóch liczb, zaś po prawej wartość f ′(x)(h) jaką pochodna w punkcie pośrednim

x := x0 + θ(x1−x0) odcinka [x0;x1] przyjmuje na wektorze h := x1−x0. Jest to dość oczywiste,lecz Czytelnik powinien (choćby w tym przypadku) umiejętnie „odczytywać” wzory.DOWÓD: Założona różniczkowalność implikuje, że w każdym punkcie x ∈ [x0;x1] istnieje po-chodna kierunkowa f ′(x;x1 − x0), Z I-szego twierdzenia o wartości średniej, dla pewnegoθ ∈ (0, 1)

f (x1)− f (x0) = f ′(x0 + θ(x1 − x0);x1 − x0) = f ′(x0 + θ(x1 − x0))(x1 − x0).

2.1.13 TWIERDZENIE (o przyrostach) Niech f : U → RM , gdzie U ⊂ RN jest zbiorem otwartym,x0, x1 ∈ U i odcinek [x0;x1] ⊂ U . Jeśli odwzorowanie f jest różniczkowalne w każdym punkciex odcinka [x0;x1], to istnieje θ ∈ (0, 1) takie, że

‖f (x1)− f (x0)‖ ≤ ‖f ′(x0 + θ(x1 − x0))‖‖x1 − x0‖.UWAGA: Po lewej stronie jest długość (norma) przyrostu f (x1) − f (x0). Po prawej stroniemamy do czynienia z iloczynem normy ‖f ′(x)‖ przekształcenia liniowego f ′(x) (gdzie x =

x0 + θ(x1 − x0) jest pewnym punktem pośrednim z odcinka [x0;x1]) oraz długości (normy)przyrostu x1−x0 argumentu. Stąd nazwa twierdzenia. Wskazane byłoby, aby Czytelnik dostrzegłróżnicę twierdzenia o przyrostach i twierdzenia o wartości średniej i znał przykład kiedy totwierdzenie nie zachodzi (a w twierdzeniu o przyrostach występuje ostra nierówność).

Page 57: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.1. POCHODNE 53

DOWÓD: Niech z = f (x1) − f (x0) ∈ RM i zdefiniujmy funkcję pomocniczą φ : [0, 1] → R danawzoremφ(t) = 〈z, f ((1− t)x0 + tx1)〉.Korzystając z twierdzenia o różniczkowaniu funkcji złożonej i reguły łańcucha, funkcja φ jestciągła i różniczkowalna w dowolnym punkcie t ∈ (0, 1);

φ′(t) = 〈z, f ′((1− t)x0 + tx1)(x1 − x0)〉.Z twierdzenia Lagrange’a, istnieje θ ∈ (0, 1) takie, że

‖f (x1)− f (x0)‖2 = 〈z, f (x1)− f (x0)〉 = φ(1)− φ(0) = φ′(θ).Zatem‖f (x1)− f (x0)‖2 = 〈z, f ′(x0 + θ(x1 − x0))(x1 − x0)〉 ≤ ‖z‖‖f ′(x0 + θ(x1 − x0))‖‖x1 − x0‖ == ‖f (x1)− f (x0)‖‖f ′(x0 + θ(x1 − x0)x)‖‖x1 − x0‖.

2.1.H Różniczkowalność i funkcje klasy C1Niech f : U → RM , gdzie U ⊂ RN . Do tej pory mówiliśmy o różniczkowalności f w punkciex ∈ U .Jeżeli odwzorowanie f jest różniczkowalne w dowolnym punkcie zbioru U , to mówimy, żef jest odwzorowaniem różniczkowalnym.Jeśli funkcja f jest różniczkowalna, to jest ona ciągła.Jeśli f jest odwzorowaniem różniczkowalnym, to określone jest odwzorowanie

f ′ : U →L(RN ,RM ), ; U 3 x 7Ï f ′(x) ∈ L(RN ,RM ),które nazywa się pochodną funkcji f .W szczególności jeśli f jest funkcją, tzn. M = 1, to pochodna

f ′ : U →L(RN ,R)przyporządkowuje punktom x ∈ U funkcjonał liniowy f ′(x) ∈ (RN )∗. W tej sytuacji można teżrozważać odwzorowanie gradientu

∇f : U → RN ,które każdemu punktowi x ∈ U przyporządkowuje gradient ∇f (x).Jest jasne, że jeśli funkcja f jest różniczkowalna, to dla każdego x ∈ U i j = 1, ..., N , istniejepochodna cząstkowa f|j (x). Określona jest więc funkcja f|j : U → R, która każdemu punktowix ∈ U przyporządkowuje liczbę f|j (x).Mówimy, że funkcja różniczkowalna f jest klasy C1, jeżeli dla dowolnego j = 1, ..., N ,pochodna f|j : U → R jest funkcją ciągłą.

Page 58: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

54 2. RACHUNEK RÓŻNICZKOWY2.2 Pochodne wyższych rzędów

2.2.A Pochodne drugiego rzędu

Rozważmy funkcję f : U → R, gdzie U ⊂ RN jest zbiorem otwartym. Niech i, j = 1, ..., N izałóżmy, że w otoczeniu B(x, r) punktu x ∈ U , istnieje pochodna cząstkowa f|i(y), y ∈ B(x, r).Innymi słowy określona jest funkcja RN ⊃ B(x, r) 3 y 7Ï f|i(y) ∈ R, która punktowi y przypo-rządkowuje pochodną cząstkową f|i(y). Przypuśćmy, że funkcja ta ma w punkcie x pochodnącząstkową względem j-tej zmiennej, tzn. istnieje pochodna cząstkowa(f|i)|j (x) = lim

t→0 f|i(x + tej )− f|i(x)t .

Pochodną tę nazywa się pochodną cząstkową drugiego rzędu w punkcie x względem i-tej ij-tej zmiennej i oznacza symbolem f|ij (x).UWAGA: (1) Gdy mamy do czynienia z dwoma lub trzema zmiennymi x, y, z.. stosuje sięteż zapis fxx , f ′′xy , itp. Tutaj oczywiście

f ′′xy = fxy = f|12.(2) Na ogół kolejność różniczkowania ma znaczenie, tzn. f|ij (x) 6= f|ji(x).PRZYKŁAD: Rozważmy funkcjęf (x, y) := xy(x2−y2)

x2+y2 dla (x, y) 6= (0, 0);0 dla x = 0 = y.

Wtedy, dla dowolnego (x, y) ∈ R2 mamy fx(0, y) = −y, fy (x, 0) = x skądfxy (0, 0) = −1 i fyx(0, 0) = 1.

Ma miejsce jednak następujący rezultat.2.2.1 TWIERDZENIE (Schwarza): Jeśli dla danych i, j = 1, ..., N w pewnym otoczeniu punktu xistnieją pochodne f|ij oraz f|ji oraz są funkcjami ciągłymi w punkcie x, to f|jk(x) = f|kj (x).Za chwilę udowodnimy twierdzenie nieco ogólniejsze.Przyjmujemy teraz następującą definicję. Mówimy, że funkcja f : U → R jest dwukrotnieróżniczkowalna w punkcie x ∈ U , jeżeli jest różniczkowalna w otoczeniu punktu x i dladowolnego i = 1, ..., N , pochodna cząstkowa f|i jest (jako funkcja określona w tym otoczeniu)funkcją różniczkowalną w punkcie x.UWAGA: Podana definicja jest bez wątpienia dość trudna i wymaga uwagi. Przede wszystkimżądamy, by istniała taka liczba r > 0, że w otoczeniu B(x, r) istnieje pochodna f ′, tzn. dladowolnego y ∈ B(x, r) istnieje f ′(y). W szczególności, dla każdego i = 1, ..., N , istnieje pochodnacząstkowa f|i(y), y ∈ B(x, r). W taki razie określona jest funkcja f|i : B(x, r) → R, którakażdemu punktowi y ∈ B(x, r) przyporządkowuje pochodną cząstkową f|i(y) w punkcie y . Wdefinicji dwukrotnej różniczkowalności żądamy, aby każda z tych funkcji f|i : B(x, r) → R,i = 1, ..., N , była różniczkowalna w punkcie x. Oznacza to, że dla dowolnego i = 1, ..., N ,istnieje przekształcenia liniowe Ai ∈ L(RN ,R) takie, że

limh→0 f|i(x + h)− f|i(x)− Ai(h)

‖h‖ = 0.

Page 59: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 55

Biorąc pod uwagę powyższą notację zdefiniujmy przekształcenie A : RN×RN → R wzorem:dla h = (h1, ..., hN ), k ∈ RN

A(h, k) = N∑i=1 hiAi(k).

2.2.2 TWIERDZENIE: Przy założeniu, że f jest funkcją dwukrotnie różniczkowalną w punkciex mamy:(i) odwzorowanie A jest przekształceniem dwuliniowym i symetrycznym, tzn.

A(h, k) = A(k, h), h, k ∈ RN ;(ii) dla dowolnych i, j = 1, ..., N , istnieje pochodna cząstkowa f|ij (x) oraz

f|ij (x) = A(ei, ej ) = A(ej , ei) = f|ji(x).DOWÓD: Ustalmy i = 1, ..., N . Różniczkowalność w punkcie x funkcji f|i (zadanej na otoczeniuB(x, r)) implikuje istnienie pochodnej cząstkowej f|ij (x) = (f|i)|j (x).Sprawdzimy dwuliniowość odwzorowania A: Niech h = (h1, ..., hN ), k, k1, k2 ∈ RN i α ∈ R.Wtedy

A(h, k1 + k2) = N∑i=1 hiAi(k1 + k2) = N∑

i=1 hi(Ai(k1) + Ai(k2)) = A(h, k1) + A(h, k2).Analogicznie weryfikujemy jednorodność względem drugiej zmiennej: A(h, αk) = αA(h, k).Niech teraz h, h1, h2, k ∈ RN . Sprawdzimy, że A(αh, k) = αA(h, k) oraz A(h1+h2, k) = A(h1, k)+A(h2, k). Jeśli h = (h1, ..., hN ), to αh = (αh1, ..., αhN ) i

A(αh, k) = N∑i=1 αhiAi(k) = α

N∑i=1 hiAi(K) = αA(h, k).

Podobnie jeśli h1 = (h11, ..., h1N ) oraz h2 = (h21, ..., h2

N ), to h1 + h2 = (h11 + h21, ..., h1N + h2

N ) iwobec tegoA(h1 + h2, k) = N∑

i=1 (h1i + h2

i )Ai(k) = N∑i=1 h

1iAi(k) + N∑

i=1 h2iAi(k) = A(h1, k) + A(h2, k).

Dowód symetryczności formy liniowej A (już możemy używać tej nazwy) jest znacznietrudniejszy i przewidziany jest dla nieco ambitniejszego Czytelnika. Wystarczy pokazać, żeA(ei, ej ) = A(ej , ei) dla dowolnych i, j = 1, ..., N , tzn. że f|ij (x) = f|ji(x) (Czytelnik powiniensprawdzić. ze rzeczywiście wystarczy tyle dowieść). W tym celu rozważ funkcję pomocniczą

φ(t, s) := f (x + tei + sej )zdefiniowaną w otoczeniu punktu (0, 0) ∈ R2. Tak zdefiniowana funkcja jest różniczkowalna,bowiem jej pochodne cząstkowe (z reguły łańcucha)φt (t, s) = f ′(x+tei+sej )(ei) = f|i(x+tei+sej ) oraz φs(t, s) = f ′(x+tei+sej )(ej ) = f|j (x+tei+sej ).Jest ona także dwukrotnie różniczkowalna w punkcie (0, 0), gdyż, jak widać, jej pochodnecząstkowe φt i φs są różniczkowalne w (0, 0). Co więcej

φts(0, 0) = f|ij (x) i φst (0, 0) = f|ji(x).

Page 60: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

56 2. RACHUNEK RÓŻNICZKOWYOczywiście pochodne φtt (0, 0) oraz φss(0, 0) również istnieją.Tak więc mamy pokazać, że

φts(0, 0) = φst (0, 0).W tym celu pokażemy, żeφts(0, 0) = lim

t→0 1t2 [φ(t, t)− φ(0, t)− φ(t, 0)− φ(0, 0)] = φst (0, 0). (∗)

Zajmiemy się najpierw pierwszą równością. Dla uproszczenia rachunków wprowadzimy jesz-cze inną funkcję:ψ(t, s) := φ(t, s)− 12 t2φtt (0, 0)− tsφts(0, 0).

Widzimy (poprze bezpośredni rachunek), że ψtt (0, 0) = 0 = ψts(0, 0). Ponadto ψ ma te samewłasności co φ: jest dwukrotnie różniczkowalna w punkcie (0, 0).Jeśli udowodnimy, że0 = lim

t→0 1t2 [ψ(t, t)− ψ(0, t)− ψ(t, 0)− ψ(0, 0)],

o (biorąc pod uwagę, że ψ(t, t) = φ(t, t) − 12 t2φtt (0, 0) − t2φts(0, 0), ψ(0, t) = φ(0, t), ψ(t, 0) =φ(t, 0)− 12 t2φtt (0, 0) i ψ(0, 0) = φ(0, 0)) udowodnimy de facto, że rzeczywiście

limt→0 1

t2 [φ(t, t)− φ(0, t)− φ(t, 0)− φ(0, 0)] = φts(0, 0).Tak więc naszym celem jest pokazać, że

limt→0 1

t2 [ψ(t, t)− ψ(0, t)− ψ(t, 0)− ψ(0, 0)] = 0 (∗∗)pamiętając, że ψtt (0, 0) = 0 = ψts(0, 0). Funkcja ψt jest różniczkowalna w (0, 0). Możemy więcnapisać

ψt (t, s)− ψt (0, 0) = tψtt (0, 0) + sψts(0, 0) + η(t, s)√t2 + s2,gdzie η(t, s)→ 0 o ile t, s→ 0. Tak więcψt (t, s)− ψt (0, 0) = η(t, s)√t2 + s2

lub, inaczej zapisując,ψ|1(t, s)− ψ|1(0, 0) = η(t, s)√t2 + s2.Weźmy ε > 0; istnieje wówczas δ > 0 taka, że |η(t, s)| < ε, o ile |t|, |s| < δ. Ustalmy |t| < δ. Dla

s ∈ [−|t|, |t|] połóżmyξ(s) := ψ(s, t)− ψ(s, 0).Wtedy

ξ(t)− ξ(0) = ψ(t, t)− ψ(t, 0)− ψ(0, t)− ψ(0, 0).I dalej, dla s ∈ (−|t|, |t|)ξ′(s) = ψ|1(s, t)− ψ|1(s, 0) = ψ|1(s, t)− ψ|1(0, 0)− ψ|1(s, 0) + ψ|1(0, 0) = η(s, t)√s2 + t2 + η(s, 0)|s|.Tak więc, dla s ∈ (−|t|, |t|),

|ξ′(s)| ≤ η(s, t)√s2 + t2 + η(s, 0)|s| < √2|t|ε + ε|t| = |t|(1 +√2)ε.

Page 61: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 57

Z twierdzenia Lagrange’a (odnośnie funkcji ξ)|ψ(t, t)− ψ(t, 0)− ψ(0, t)− ψ(0, 0)| = |ξ(t)− ξ(0)| ≤ |t|2(1 +√2)ε.Dowodzi to, że lim

t→0 1t2 [ψ(t, t)− ψ(t, 0)− ψ(0, t)− ψ(0, 0)] = 0tak jak żądaliśmy.W celu dowodu drugiej z potrzebnych równości w (∗) wprowadzamy nową funkcje po-mocniczą ψ(t, s) = φ(t, s)− 12s2φss(0, 0)− tsφst (0, 0) i, analogicznie jak wyżej dowodzimy, ze

limt→0 1

t2 [ψ(t, t)− ψ(0.t)− ψ(t, 0)− ψ(0.0)] = 0co oznacza, że zachodzi druga z równości (∗). Udowodnione twierdzenie jest ważne również z tego powodu, że i teraz, obok dwukrot-nej różniczkowalności, można mówić o drugiej pochodnej. Mianowicie jeżeli f : U → R jestfunkcją dwukrotnie różniczkowalną w punkcie x ∈ U , to formę dwuliniową symetrycznąA ∈ L2

s (RN ,R) taką, że dla i, j = 1, ..., N , A(ei, ej ) = f|ij (x) nazywamy drugą pochodną lubpochodną drugiego rzędu funkcji f w punkcie x i oznaczamy symbolem f ′′(x). Macierz sto-warzyszoną z drugą pochodną f ′′(x) nazywa się macierzą Hessa funkcji f w punkcie x ioznacza Hf (x). Oczywiście

Hf (x) = [f|ij (x)]i,j=1,...,N .Jeśli więc h = (h1, ..., hN ), k = (k1, ..., kN ) ∈ RN , tof ′′(x)(h, k) = N∑

i,j=1hikjf|ij (x)lub

f ′′(x)(h, k) = [h1, ..., kN ]Hf (x)[k1, ..., kN ]T = N∑i,j=1hikjf|ij (x).

Jeszcze inaczej zapisując: jeśli Hf (x) ∈ L(RN ,RN ) oznacza przekształcenie liniowe, z którymstowarzyszona jest macierz Hessa, tof ′′(x)(h, k) = 〈h,Hf (x)(k)〉.

UWAGA: (1) W podanej definicji drugiej pochodnej kryje się pewne niebezpieczeństwo: nieorzeka ona, że jeżeli funkcja f ma pochodne cząstkowe drugiego rzędu w punkcie x, aninawet, że jest różniczkowalna i ma pochodne cząstkowe drugiego rzędu, to forma dwuliniowaA ∈ L2

s (RN ,R) taka, że A(ei, ej ) = f|ij (x), gdzie i, j = 1, ..., N , jest jej pochodną drugiegorzędu. Definicja ta mówi, że jeśli funkcja f jest dwukrotnie różniczkowalna, to taka formadwuliniowa jest pochodną drugiego rzędu. Zatem zanim będziemy mówić o drugiej pochodnej,przekonajmy się, że jest ona dwukrotnie różniczkowalna.Udowodnimy teraz następujące ważne twierdzenie:

2.2.3 TWIERDZENIE: Załóżmy, że funkcja f : U → R, gdzie U jest zbiorem otwartym w RN , jestfunkcją dwukrotnie różniczkowalną w punkcie x. Wówczas, dla dostatecznie małych h ∈ RN

ma miejsce zależność

f (x + h)− f (x) = f ′(x)(h) + 12 f ′′(x)(h, h) + ε(h)‖h‖2,

Page 62: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

58 2. RACHUNEK RÓŻNICZKOWYgdzie ε(h)→ 0, gdy h→ 0.Niekiedy mówi się, że treścią twierdzenia jest wzór Taylora do rzędu drugiego z resztą wpostaci Peano.DOWÓD (dla chętnych): Niech ε > 0 takie, że B(x, ε) ⊂ U i niech h ∈ RN , 0 < ‖h‖ < ε. Wtedy,dla t ∈ [0, ‖h‖], x + th ∈ U . Rozważmy funkcję g : [0, ‖h‖]→ R daną wzorem

g(t) := f (x + t‖h‖−1h), t ∈ [0, ‖h‖].Wtedy g(‖h‖) = f (x + h) i g(0) = f (x). Funkcja pomocnicza g jest różniczkowalna (patrz np.lemat 2.2.13) i wykorzystując regułę łańcucha

g ′(t) = ‖h‖−1f ′(x + t‖h‖−1h)(h)(sprawdzić), czyli g ′(0) = ‖h‖−1f ′(x)(h) oraz

g ′′(0) = ‖h‖−2f ′′(x)(h, h)(przeliczyć). Ze wzoru Taylora (dla funkcji rzeczywistych jednej zmiennej)g(t) = g(0) + g ′(0)t + 12g ′′(0)t2 + ε(t)t2 = f (x) + t‖h‖−1f ′(x)(h) + 12 t2‖h‖−1f ′′(x)(h, h) + ε(t)t2,gdzie ε(t)→ 0 przy t → 0. W szczególności dla t = ‖h‖ mamy

f (x + h) = g(‖h‖) = f (x) + f ′(x)(h) + 12 f ′′(x)(h, h) + ε(‖h‖)‖h‖2.

FRAGMENT DODATKOWY

Przyjrzyjmy się jeszcze raz powyższemu twierdzeniu.(1) Biorąc pod postać drugiej pochodnej i jej związek z pochodnymi cząstkowymi drugiegorzędu, dla h = (h1, ..., hN ),f ′′(x)(h, h) = N∑

i,j=1hihjf|ij (x).Ponadto odwzorowanie RN 3 h 7Ï f ′′(x)(h, h) jest formą kwadratową, którą wyznacza formadwuliniowa f ′′(x) (por. definicję formy kwadratowej).(2) Czytelnik powinien porównać wzór z twierdzenia Taylora ze wzorem (∗) i stwierdzeniemze strony 45. Mamy do czynienia z sytuacją bardzo podobną: dwukrotna różniczkowalnośćimplikuje, że przyrost funkcji dwukrotnie różniczkowalnej jest równy sumie składnika liniowozależnego od przyrostu h (jest nim składnik f ′(x)(h)), składnika zależnego kwadratowo od h(jest nim składnik 12 f ′′(x)(h, h)) oraz składnika rzędu mniejszego niż kwadrat ‖h‖2 przyrostu,tzn. składnika postaci ‖h‖2ε(h), w którym ε(h)→ 0 przy h→ 0.(3) O ile jednak warunek (∗) ze strony 43 (istnienie funkcjonału A ∈ L(RN ,R) zadość-czyniącego zależności (∗) ze strony 43) był równoważny różniczkowalności f punkcie x, towarunek analogiczny w przypadku dwukrotnej różniczkowalności nie jest niestety prawdziwy.Załóżmy mianowicie, że f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, jest funkcją

Page 63: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 59

różniczkowalną, x ∈ U oraz istnieje forma dwuliniowa symetryczna B ∈ L2s (RN ,R) taka, żedla dostatecznie małych przyrostów h ∈ RN

f (x + h)− f (x) = f ′(x)(h) + 12B(h, h) + ‖h‖2ε(h),gdzie ε(h) → 0, gdy h → 0. Pytanie brzmi: czy funkcja f jest dwukrotnie różniczkowalna?Odpowiedź brzmi: nie.PRZYKŁAD: Rozważmy funkcję f (x) = x3 sin 1

x3 dla x 6= 0 i f (0) = 0. Czytelnik zechcepokazać, że funkcja ta jest różniczkowalna: w istocie f ′(0) = 0 i f ′(x) = 3x2 sin 1x3 − 3

x cos 1x3 dla

x 6= 0. Zatem pochodna f ′ nie jest ciągła w 0, czyli f nie może być różniczkowalna w punkciex = 0. Z drugiej jednak strony kładąc B ≡ 0 mamy

f (h) = f (0 + h)− f (0) = f ′(0)h + B(h, h) + ε(h)|h|,gdzie ε(h) = |h|−1f (h)→ 0, gdy h→ 0.(4) Konkluzja: dwukrotnej różniczkowalności w punkcie nie można zdefiniować „na wzóri podobieństwo” różniczkowalności w punkcie zastępując odwzorowanie liniowe odwzorowa-niem dwuliniowym.Cierpliwy czytelnik jednak doczeka się za chwilę definicji dwukrotnej różniczkowalnościpozostającej w pełnej analogii z definicją różniczkowalności.(5) Ciekawe jest, że jeśli funkcja dwukrotnie różniczkowalna f : U → R w punkcie x ∈ Udopuszcza dla małych h przedstawienie w postaci:

f (x + h) = f (x) + A(h) + 12B(h) + ‖h‖2ε(h),gdzie A ∈ L(RN ,R) i B jest formą kwadratową na RN , to f ′(x) = A oraz f ′′(x) = φ, gdzie φjest symetryczną forma dwuliniową wyznaczającą formę kwadratową B.ĆWICZENIE: Udowodnić to stwierdzenie.Powyższy przykład mówi, że przyjętego założenia o dwukrotnej różniczkowalności niemożna opuścić (dlaczego?).

Załóżmy teraz, że funkcja f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, będzieróżniczkowalna. W związku z tym poprawnie zdefiniowane jest odwzorowanie gradientu

∇f : U → RN , U 3 x 7Ï ∇f (x) oraz ∇f = (f|1, ..., f|N ).Niech x ∈ U . Możemy rozważać różniczkowalność ∇f w punkcie x i pochodną (∇f )′(x). Jakpamiętamy (twierdzenie 2.1.10) różniczkowalność w punkcie x ma miejsce wtedy i tylko wtedy,gdy każda z funkcji współrzędnych odwzorowania ∇f , czyli każda z pochodnych cząstkowychf|j jest różniczkowalna w punkcie x, a więc wtedy i tylko, gdy f jest różniczkowalna w sensieprzyjętej przez nas definicji.Otrzymaliśmy więc twierdzenie:2.2.4 TWIERDZENIE: Funkcja różniczkowalna f : U → R jest dwukrotnie różniczkowalna wpunkcie x ∈ U wtedy i tylko wtedy, gdy odwzorowanie gradientu ∇f : U → RN jest różnicz-kowalne w punkcie x.

Page 64: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

60 2. RACHUNEK RÓŻNICZKOWYZgodnie z definicją, macierzą Jacobiego odwzorowania ∇f w punkcie x jest macierz, wktórej w i-tym wierszu i w j-tej kolumnie stoi j-ta pochodna cząstkowa i-tej funkcji współrzędnejodwzorowania ∇f , czyli jest to macierz [(f|i)|j (x)]i,j=1,...,N = [f|ij (x)]i,j=1,...,N . Innymi słowy

Hf (x) = J∇f (x),i – wobec tego – odwzorowanie liniowe Hf (x) stowarzyszone z macierzą Hessa jest pochodnągradientu ∇f , tzn. Hf (x) = (∇f )′(x) i dla dowolnych h, k ∈ RN

f ′′(x)(h, k) = 〈h,Hf (x)(k)〉 = 〈h, (∇f )′(x)(k)〉.Kolejnym krokiem jest, podobnie jak w przypadku różniczkowalności w punkcie, pytanieo prosty warunek dostateczny dwukrotnej różniczkowalności w punkcie.

2.2.5 TWIERDZENIE: Niech funkcja f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, będziefunkcją różniczkowalną i niech x ∈ U . Funkcja f jest dwukrotnie różniczkowalna w punkciex, jeśli w otoczeniu punktu x istnieją wszystkie pochodne cząstkowe drugiego rzędu i są onefunkcjami ciągłymi w x.DOWÓD: Ustalmy i = 1, ..., N . Z założenia w pewnej kuli B(x, r) istnieją pochodne cząstkowef|ij , tzn. dla dowolnego y ∈ B(x, r) oraz j = 1, ..., N istnieje

f|ij (y) = (f|i)|j (y),i, dodatkowo, funkcja B(x, r) 3 y 7Ï f|ij (y) = (f|i)|j (y) jest ciągła w x. Wykorzystując warunekdostateczny różniczkowalności stwierdzamy, że funkcja f|i jest różniczkowalna. To dzieje siędla wszystkich i = 1, ..., N . Tak więc – w świetle naszej definicji – funkcja f jest dwukrotnieróżniczkowalna w punkcie x. A więc w celu weryfikacji dwukrotnej różniczkowalności w punkcie x ∈ U należy: obliczyćpochodne cząstkowe (pierwszego rzędu), zobaczyć czy są one ciągłe (to będzie gwarantować,że f jest funkcją różniczkowalną), obliczyć pochodne cząstkowe drugiego rzędu i sprawdzić,czy są one ciągłe w punkcie x.2.2.B Pochodne wyższych rzędów funkcji

Przypuśćmy, że f : U → R, gdzie U ⊂ RN , jest funkcją dwukrotnie różniczkowalną, tzn. jestona dwukrotnie różniczkowalna w każdym punkcie x ∈ U . Wówczas, dla dowolnego x ∈ U idla wszystkich i, j = 1, ..., N , istnieje pochodna cząstkowa (drugiego rzędu) f|ij (x). Mam więcpoprawnie określoną funkcję drugiej pochodnej cząstkowej

f|ij : U → R.

Ustalmy punkt x ∈ U . Jeśli, dla dowolnych i, j = 1, ..., N , funkcja pochodnej cząstkowej f|ijjest różniczkowalna w punkcie x, to mówimy, że funkcja f jest trzykrotnie różniczkowalna wpunkcie x.Załóżmy, że funkcja f jest trzykrotnie różniczkowalna w punkcie x. Ustalmy i, j = 1, ..., N .Różniczkowalność pochodnej f|ij w punkcie x implikuje istnienie pochodnej cząstkowej (f|ij )|k(x)dla wszystkich k = 1, ..., N . Pochodną tę nazywamy pochodną cząstkową trzeciego rzęduwzględem zmiennych o numerach i, j i k i oznaczamy symbolem f|ijk(x).

Page 65: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 61

Rozumując analogicznie (wykorzystując de facto rozumowanie z twierdzenia 2.2.2) łatwopokazać, że2.2.6 TWIERDZENIE: Jeśli funkcja f : U → R, gdzie U ⊂ RN , jest trzykrotnie różniczkowal-na w punkcie x, to przekształcenie trójliniowe A ∈ L3(RN ,R) wyznaczone przez macierztrójwskaźnikową [f|ijk(x)]i,j,k=1,...,N jest symetryczne i

f|ijk(x) = A(ei, ej , ek)dla dowolnych i, j, k = 1, ..., N . Przekształcenie A nazywa się pochodną trzeciego rzędu funk-cji f w punkcie x i oznacza symbolem f ′′′(x). ĆWICZENIE: Udowodnić to twierdzenie w oparciu o twierdzenie 2.2.2 i następującą obser-wację: funkcja f : U → R jest trzykrotnie różniczkowalna wtedy i tylko wtedy, gdy każdapochodna cząstkowa f|j : U → R, j = 1, ..., N , jest dwukrotnie różniczkowalna w punkcie x.Podobnie definiujemy różniczkowalność dowolnego rzędu n ≥ 1 w punkcie funkcji f :U → R. Zakładamy, że funkcja f jest (n−1)-krotnie różniczkowalna. Wobec tego, dla dowolnegoukłady liczb i1, ..., in−1 = 1, ..., N i x ∈ U istnieje pochodna cząstkowa (n− 1)-szego rzędu, tzn.f|i1i2...in−1 (x), czyli funkcja

f|i1...in−1 : U → R.

Ustalmy x ∈ U . Mówimy, że funkcja f jest n-krotnie różniczkowalna w punkcie x, jeślikażda z pochodnych cząstkowych f|i1...in−1 jest funkcją różniczkowalną w punkcie x.Jeśli funkcja f jest n-krotnie różniczkowalna w punkcie x ∈ U , to dla dowolnych i1, ..., in−1 =1, ..., N oraz dla dowolnego in = 1, ..., N istnieje pochodna cząstkowa (f|i1...in−1 )|in (x), którąoznaczamy symbolem f|i1...in−1in (x) i nazywamy pochodną cząstkową n-tego rzędu funkcji f wpunkcie x względem zmiennych o numerach i1, ..., in .Wprost z definicji wynika następujący warunek konieczny i dostateczny n-krotnej różnicz-kowalności funkcji w punkcie.2.2.7 FAKT: Funkcja f : U → R jest n-krotnie różniczkowalna w punkcie x, gdzie n ≥ 2, wtedyi tylko wtedy, gdy dla dowolnego j = 1, ..., N , pochodna cząstkowa f|j : U → R jest funkcją(n − 1)-krotnie różniczkowalną w x. Podobnie jak poprzednio (używając np. indukcji matematycznej) można udowodnić, żeprzekształcenie n-liniowe wyznaczone przez macierz n-wskaźnikową postaci [f|i1...in (x)]i1,...in=1,...,Njest symetryczne. Nazywamy je pochodną n-tego rzędu funkcji f w punkcie x i oznaczamysymbolem f (n)(x).KONKLUZJA: Mówiąc ogólnie: przypuśćmy, że f : U → R, gdzie U ⊂ RN jest zbioremotwartym. Niech n ∈ N. Jeżeli funkcja f jest n-krotnie różniczkowalna w punkcie x (co – wprzypadku, gdy n ≥ 2 – oznacza, że istnieją pochodne cząstkowe (n−1)-szego rzędu określonena U i są różniczkowalne w x), to pochodną jest odwzorowanie n-liniowe symetryczne f (n)(x) ∈Lns (RN ,R), którego macierzą jest macierz n-wskaźnikowa [f |i1...in(x)]i1,...,in=1,...,N .Tak więc, jeśli h1, ..., hn ∈ RN , hi = (hi1, ..., hiN ), to

f (n)(x)(h1, ..., hn) = N∑i1,....in=1h1i1 ..hninf|i1...in (x). (∗)

ĆWICZENIE: Czytelnik powinien w miarą swobodnie kontrolować podaną (niestety dośćzłożoną) notację.

Page 66: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

62 2. RACHUNEK RÓŻNICZKOWYRozumując indukcyjnie otrzymujemy następujący warunek dostateczny n-krotnej różnicz-kowalności w punkcie x.

2.2.8 TWIERDZENIE: Jeśli wszystkie pochodne cząstkowe n-tego rzędu funkcji (n − 1)-krotnieróżniczkowalnej f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, istnieją w pewnym oto-czeniu punktu x ∈ U i są w tym punkcie ciągłe, to funkcja f jest n-krotnie różniczkowalna. PRZYKŁAD: Niech funkcja f : R2 → R zadana będzie wzorem f (x, y) = x3y2 − y sinx.Zbadaj trójkrotną różniczkowalność i oblicz pochodną 3-ego rzędu a także oblicz wartośćf ′′′(x, y)(h1, h2, h3), gdzie h1 = (2, 0), h2 = (1, 2), h3 = (1, 1).Rozpoczynamy od pochodnych pierwszego rzędu:

fx(x, y) = 3x2y2 − y cos x, fy = 2x3y − sinx;pochodne cząstkowe fx , fy określone są na całej płaszczyźnie i są ciągłe. Zatem f jest funkcjąróżniczkowalną i, dla dowolnego (x, y) ∈ R2

f ′(x, y) = [3x2y2 − y cos x, 2x3y − sinx],tzn. macierz Jacobiego Jf (x, y) ma postać j.w.Obliczamy pochodne cząstkowe drugiego rzędu

fxx = 6xy2 + y sinx, fxy = 6x2y − cos x = fyx , fyy = 2x3.Pochodne cząstkowe drugiego rzędu określone są na całej płaszczyźnie i są ciągłe. Wobectego funkcja f jest dwukrotnie różniczkowalna i, dla dowolnego (x, y) ∈ R2,

f ′′(x, y) = [6xy2 + y sinx 6x2y − cos x6x2y − cos x 2x3],

tzn. macierzą Hessa Hf (x, y) ma postać j.w.Obliczamy pochodne cząstkowe trzeciego rzędu:fxxx = 6y2 + y cos x, fxxy = 12xy + sinx = fxyx = fyxx , fyyy = 0, fyyx = 6x2 = fyxy = fxyy .

Pochodne cząstkowe trzeciego rzędu są określone na całej płaszczyźnie i są ciągłe. Wobectego f jest funkcją różniczkowalną. Dla dowolnego (x, y) ∈ R2 macierzą trzeciej pochodnejjest macierz trójwskaźnikowa o współczynnikach, którymi są pochodne cząstkowe trzeciegorzędu.Aby obliczyć wartość f ′′′(x, y)(h1, h2, h3) zgodnie ze wzorem (∗) należy policzyćfxxxh11h21h31 = (6y2 + y cos x)2 · 1 · 1 = 12y2 + 2y cos x;fxxyh11h21h32 = (12xy + sinx)2 · 1 · 1 = 24xy + 2 sinx;fxyxh11h22h31 = (12xy + sinx)2 · 2 · 1 = 48xy + 4 sinx;

fyxxh12h21h31 = (12xy + sinx)0 · 1 · 1 = 0;fyyyh12h22h32 = 0;fyxyh12h21h32 = 0;

fxyyh11h22h32 = (6x2)2 · 2 · 1 = 24x2;

Page 67: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 63

fyyxh12h22h31 = 0i wszystkie wyniki dodać. Otrzymujemy więc:f ′′′(x, y)(h1, h2, h3) = 24x2 + 12y2 + 2y cos x + 6 sinx + 72xy.

NOTACJA MULTIINDEKSOWA Rozważmy multiindeks α = (α1, ..., αN ) ∈ ZN+ długości n =|α| = ∑N

j=1 αj i funkcję f : U → R, która jest n-krotnie różniczkowalna w punkcie x ∈U . Wówczas pochodne cząstkowe n-tego rzędu są symetryczne. Symbolem ∂αf (x) lub f|α(x)oznaczamy pochodną cząstkowa funkcji f w punkcie x, w której różniczkowanie względempierwszej zmiennej odbywa się α1 razy, różniczkowanie względem drugiej zmiennej odbywasię α2 razy, itp. tzn różniczkowanie względem zmiennej o numerze j (j = 1, ..., N) odbywa sięαj razy (czyli ogółem różniczkowanie odbywa się |α| = n razy. Ta notacja jest poprawna, gdyżwartość f|α(x)∂αf (x) nie zależy od porządku różniczkowania.2.2.9 FAKT: Przypuśćmy, że dla dowolnego β ∈ ZN+ , |β| ≤ n − 1, pochodne cząstkowe ∂βfistnieją w U i są ciągłe, zaś pochodne ∂αf rzędu |α| = n istnieją w otoczeniu punktu x ∈ Ui są w tym punkcie ciągłe. Wtedy funkcja f jest n-krotnie różniczkowalna w punkcie x. Jest to po prostu inne sformułowanie twierdzenia 2.2.8Jest też jeszcze inna korzyść ze stosowania notacji multiindeksowej. Wykorzystując mia-nowicie rozumowanie z fragmentu dotyczącego algebry liniowej, można pokazać, że wartośćf (n)(x) na zespole (h, ..., h), w którym wektor h ∈ RN wzięto n razy wynosi

f (n)(x)(h, ..., h) = ∑α∈ZN+ , |α|=n

n!α!hα∂αf (x). (∗)

Podany wzór jest dość syntetyczny w porównaniu do (∗) zastosowanego w sytuacji, w którejh1 = h2 = ... = hn = h = (h1, ..., hN ), a mianowicie

f (n)(x)(h, ..., h) = N∑i1,...,in=1hi1hi2 ...hinf|i1...in (x).

RACHUNEK POCHODNYCH WYŻSZEGO RZĘDU Dla pochodnych n-tego rzędu obowiązuję podob-ne wzory jak w przypadku pochodnych rzędy pierwszego.2.2.10 TWIERDZENIE: Jeśli f , g : U → R, gdzie U ⊂ RN jest zbiorem otwartym, są funkcjamin-krotnie różniczkowalnymi w punkcie x ∈ U , to funkcja f ±g jest n-krotnie różniczkowalnaw punkcie x i (f ± g)(n)(x) = f (n)(x)± g (n)(x)oraz, dla dowolnego multiindeksu α ∈ ZN+ długości |α| = n mamy

∂α(f ± g)(x) = ∂αf (x)± ∂αg(x).Również funkcja fg jest n-krotnie różniczkowalna w punkcie x. Wtedy też, dla dowolnegomultiindeksu α ∈ ZN+ , |α| = n mamy

∂α(fg)(x) = ∑β∈ZN+ , β≤α

∂βf (x)∂α−βg(x).Jest to tzw. wzór Leibniza.

Page 68: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

64 2. RACHUNEK RÓŻNICZKOWYDOWÓD: Pokażemy część pierwszą (dowód drugiej części można znaleźć w literaturze). Tezatwierdzenie jest prawdziwa dla n = 1. Niech n ≥ 2 i załóżmy, ze teza jest słuszna dla n − 1.Funkcje f i g są n-krotnie różniczkowalne; są więc również (n − 1)-krotnie różniczkowalne i,dla każdego multiindeksu β ∈ ZN+ , |β| = n−1 mamy, z założenia indukcyjnego, że ∂β(f+g)(x) =∂βf (x) + ∂βg(x). Pochodne cząstkowe ∂fβ i ∂βg są funkcjami różniczkowalnymi w punkcie x,co implikuje, że funkcja ∂βf + ∂gβ jest tam różniczkowalna i dla dowolnego i = 1, ..., N(∂βf + ∂gβ)|i(x) = (∂βf )|i(x) + (∂gβ)|i(x).Jeśli α ∈ ZN+ i |α| = n, to istnieje β ∈ ZN+ , |β| = n−1, że α = (β1, ..., βi +1, ..., βN ). W takim razie∂α(f + g)(x) = (∂β(f + g))|i(x) = (∂βf + ∂gβ)|i(x) = (∂βf )|i(x) + (∂gβ)|i(x) = ∂αf (x) + ∂gαf (x).Z przeprowadzonego rachunku wynika też, ze dla dowolnych i1, ..., in = 1, ..., N(f + g)|i1...in (x) = f|i1...in (x) + g|i1...in (x),co natychmiast implikuje, że (f + g)(n) = f (n)(x) + g (n)(x) i kończy dowód.

2.2.C Pochodne wyższych rzędów odwzorowań

Przypuśćmy, że dane jest odwzorowanie f = (f1, ..., fM ) : U → RM , gdzie U ⊂ RN jest zbioremotwartym. Niech x ∈ U i n ∈ N.Mówimy, że odwzorowanie f jest n-krotnie różniczkowalne w punkcie x, jeżeli każda zfunkcji współrzędnych fi , i = 1, ...,M , jest w tym punkcie n-krotnie różniczkowalna.UWAGA: Rozważymy nieco bardziej szczegółowo przypadek n = 2. Dwukrotna różniczko-walność odwzorowania f w punkcie x oznacza, że:(1) odwzorowanie f jest różniczkowalne; stąd, dla dowolnego j = 1, ..., N , określone jestodwzorowanie pochodnej cząstkowej f|j : U → RM , które x ∈ U przyporządkowuje pochodnącząstkową f|j (x) (por. str. 50);(2) dla dowolnego j = 1, ..., N , odwzorowanie f|j jest różniczkowalne w x.

Pochodną n-tego rzędu lub n-tą pochodną w punkcie x ∈ U odwzorowania n-krotnie róż-niczkowalnego w punkcie x jest przekształcenie n-liniowe symetryczne f (n)(x) ∈ Lns (RN ,RM )takie, że dla każdego i = 1, ...,M ,

πi f (n)(x) = f (n)i (x).Tak więc dla h1, ..., hn ∈ RN , jeżeli y = (y1, ..., yM ) = f (n)(x)(h1, ..., hn), to

yi = N∑i1,...,in=1h1i1...hninfi|i1...in (x)

oraz, gdy h1 = ... = hn = h, toyi = ∑

α∈ZN+ , |α|=nn!α!hα∂fαi (x).

Dla pochodnych wyższych rzędów odwzorowań obowiązują te same praktycznie własnościjak w przypadku funkcji.2.2.11 TWIERDZENIE: Przypuśćmy, ze odwzorowanie f : U → RM , gdzie U ⊂ RN , jest n-krotnieróżniczkowalne w punkcie x ∈ U , zaś odwzorowanie g : V → RK , gdzie V ⊂ RM jest zbiorem

Page 69: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 65

otwartym i f (U) ⊂ V , jest n-krotnie różniczkowalne w punkcie y := f (x). Wówczas złożenieg f : U → RK jest poprawnie określone i n-krotnie różniczkowalne w punkcie x.DOWÓD: Dowód przeprowadzimy przy pomocy indukcji matematycznej. Teza jest słuszna, gdyn = 1. Weźmy n ≥ 2 i załóżmy, że odwzorowania f i g są (n-krotnie różniczkowalne wpunktach x i y , odpowiednio. Są więc one różniczkowalne i, zgodnie z regułą łańcucha, i-tafunkcja współrzędna złożenia g f (tzn. funkcja gi f ) ma pochodne cząstkowe postaci

(gi f )|j = K∑k=1(gi|k f )fk|j , j = 1, ..., N.

Wyrażenie po prawej stronie jest sumą iloczynów funkcji postaci gi|kf i fk|j , gdzie k = 1, ..., K.Dla dowolnego k = 1, ..., K, funkcja gi|k : V → R jest (n− 1)-krotnie różniczkowalna, odwzoro-wanie f jest też (n−1)-krotnie różniczkowalne. Zatem z założenia indukcyjnego złożenie gi|kfjest (n− 1)-różniczkowalne. Ponieważ funkcja fk|j jest również (n− 1)-krotnie różniczkowalna,to iloczyn (gi|k f )fk|j i ich suma są funkcjami (n− 1)-krotnie różniczkowalnymi. Pokazaliśmywięc, że każda funkcja współrzędna odwzorowania g f ma (n − 1)-krotnie różniczkowalnewszystkie pochodne cząstkowe pierwszego rzędu. Oznacza to, że funkcje współrzędne odwzo-rowania g f są n-krotnie różniczkowalne, a więc że samo odwzorowanie g f jest n-krotnieróżniczkowalne. Niestety „reguła łańcucha” dla pochodnych wyższych rzędów jest znacznie bardziej skom-plikowana. Ograniczę się tylko do wzoru na drugą pochodną złożenia odwzorowań dwukrotnieróżniczkowalnych. Przyjmijmy założenia powyższego twierdzenie przy n = 2. Wtedy, dla do-wolnych u, v ∈ RN ,(g f )′′(x)(u, v) = g ′′(f (x))(f ′(x)(u), f ′(x)(v)) + g ′(f (x))(f ′′(x)(u, v)).

Wzór ten trzeba bardzo starannie odczytywać!Wzoru dla pochodnych trzeciego i wyższych rzędów są znacznie bardziej skomplikowane.2.2.D Funkcje i odwzorowania klasy Cn

Mówimy, że funkcja f : U → R, gdzie U ⊂ RN jest zbiorem otwartym, jest klasy Cn ,n ∈ N, jeżelijest n-krotnie różniczkowalna (tzn. jest n-krotnie różniczkowalna w każdym punkcie zbioruU) i każda jej pochodna cząstkowa n-tego rzędu jest funkcją ciągłą.2.2.12 FAKT: Na to by funkcja f : U → R była klasy Cn potrzeba i wystarcza, aby dla dowol-nego α ∈ ZN+ , |α| ≤ n, pochodna ∂αf istniała i była funkcją ciągłą (4)DOWÓD: Konieczność podanego warunku jest natychmiastowa. Dla dowodu dostateczności za-uważmy, że z istnienia i ciągłości pochodnych cząstkowych pierwszego rzędu implikuje róż-niczkowalność funkcji f . Analogicznie, z istnienia i ciągłości pochodnych cząstkowych dru-giego rzędu wynika dwukrotna różniczkowalność. Rozumując podobnie otrzymamy n-krotnąróżniczkowalność i ciągłość pochodnych cząstkowych n-tego rzędu. ĆWICZENIE: (1) Znaleźć przykład funkcji klasy Cn , która nie jest klasy Cn+1 (dla dowolnegon ∈ N).(2) Czasem mówi się, że funkcja f : U → R jest klasy C0, jeżeli jest ciągła. Udowodnić, że dladowolnego n ∈ N, Cn ⊂ Cn−1 ⊂ ... ⊂ C1 ⊂ C0.

4Równoważnie: istnieją i są ciągłe wszystkie pochodne cząstkowe rzędu k 6= n.

Page 70: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

66 2. RACHUNEK RÓŻNICZKOWYPodobnie mówimy, że odwzorowanie f : U → RM jest klasy Cn , n ≥ 0, jeśli każda funkcjawspółrzędna fi , i = 1, ...,M , odwzorowania f jest klasy Cn oraz, że jest ono klasy C∞, gdy jestklasy Cn dla dowolnego n ≥ 1.ĆWICZENIE: (1) Podać przykład odwzorowania klasy C∞.(2) Złożenie odwzorowań klasy Cn jest odwzorowaniem klasy Cn .

2.2.E Wzór Taylora

Podobnie jak w przypadku funkcji rzeczywistych jednej zmiennej, ważną rolę w rachunku róż-niczkowym funkcji wielu zmiennych pełni twierdzenie Taylora. Czytelnik zechce przypomniećudowodniony wcześniej wzór Taylora do drugiego rzędu, który przedyskutowaliśmy wcześniejRozważmy funkcję f : U → R, gdzie U ⊂ RN jest zbiorem otwartym.Zaczniemy od następującego lematu.2.2.13 LEMAT: Jeśli funkcja f jest n-krotnie różniczkowalna, to funkcja g : [0, T] → R, gdzieT > 0 jest tak dobrane aby x + th ∈ U przy t ∈ [0, T], dana wzorem

g(t) := f (x + th), t ∈ [0, T],jest również n-krotnie różniczkowalna i, dla każdego 0 ≤ k ≤ n,

g (k)(t) = f (k)(x + th)(h, ..., h︸ ︷︷ ︸k

).Jeśli f jest (n + 1)-krotnie różniczkowalna w punkcie x, to funkcja g jest (n + 1)-krotnie

różniczkowalna w punkcie t = 0 oraz

g (n+1)(0) = f (n+1)(x)(h, ..., h︸ ︷︷ ︸n+1

).Dla uproszczenia notacji będziemy pisać:

hk := (h, ..., h︸ ︷︷ ︸k

), k ∈ N.

DOWÓD: Dla k = 1 lemat jest prawdziwy (wynika to z reguły łańcucha). Przypuśćmy, żepodany fakt zachodzi dla pewnego k < n i udowodnimy go dla k. Zgodnie z założeniemindukcyjnym, dla t ∈ [0, T],g (k−1)(t) = f (k−1)(x + th)(hk−1).Funkcja y 7Ï φ(y) = f (k−1)(y)(hk−1) jest różniczkowalna; ponadto g (k−1)(t) = φ(x + th). Znowu,korzystając z reguły łańcucha, mamy

g(k)(t) = (g (k−1))′(t) = φ′(x + th)(h).Lecz jednocześnie

φ′(y)(h) = f (k)(y)(hk).Analogicznie‖g (n+1)(0)− f (n+1)(x)(hn+1)‖ = lim

t→0 ‖h‖‖g(k)(t)− g (k)(0)− f (n+1)(hn, th)‖

‖th‖ = 0.

Page 71: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 67

Jako pierwszy udowodnimy wzór Taylora z reszta w postaci Peano.2.2.14 TWIERDZENIE: Załóżmy, że funkcja f jest (n − 1)-krotnie różniczkowalna w zbiorze Uoraz n-krotnie różniczkowalna w punkcie x. Wtedy, dla dowolnego h ∈ RN takiego, że x+th |t ∈ [0, 1] ⊂ U , ma miejsce następujący wzór:

f (x + h) = f (x) + 11! f ′(x)(h) + ...+ 1n! f (n)(x)(hn) + ε(h)‖h‖n

gdzie ε(h)→ 0 gdy h→ 0 w RN .DOWÓD: Dowód jest w zasadzie analogiczny do dowodu wzoru Taylora wcześniej rozwa-żanego. Dla ustalonego h ∈ RN o podanej własności rozważmy funkcję g : [0, ‖h‖] → R danąwzoremg(t) = f

(x + t h

‖h‖

), t ∈ [0, ‖h‖].

Zgodnie z lematem, funkcja g jest n−1 krotnie różniczkowalna i g (n)(0) istnieje. Z twierdzeniaTaylora z resztą w postaci Peano istnieje funkcja ε : [0, 1] → R taka, że ε(t) → 0 gdy t → 0orazg(t) = n∑

k=01k!g (k)(0)tk + εi(t)tn.

Z drugiej strony, zgodnie z lematem, dla 0 ≤ k ≤ n, g (k)(0) = ‖h‖−kf (k)(x)(hk). W takim razie,kładąc t = ‖h‖, mamyf (x + h) = n∑

k=01

‖h‖kk! f (k)(x)(hk)‖h‖k + ε(‖h‖)‖h‖n.Stąd

f (x + h) = n∑k=0

1k! f (k)(x)(hk) + ε(h)‖h‖n.

UWAGA: Używając notacji multiindeksowej można wzór Taylora zapisać następująco:f (x + h) = ∑

α∈ZN+ , |α|6=n1α!∂fα(x)hα + ε(h)‖h‖n.

ĆWICZENIE: Wyprowadzić ten wzór (wykorzystując formułę (∗) ze strony 63).2.2.15 WNIOSEK Jeśli f : U → R jest funkcją (n−1)-krotnie różniczkowalną i n-krotnie różnicz-kowalną w punkcie x0 ∈ U , to dla pewnego δ > 0 takiego, że B(x0, δ) ⊂ U oraz x ∈ B(x0, δ),

f (x) = n∑k=0

1k! f (k)(x0)((x − x0)k) + η(x)‖x − x0‖n,

gdzie η(x)→ 0 gdy x → x0 lub, wykorzystując notację multiindeksową

f (x) = ∑|α|≤n

1α!∂αf (x0)(x − x0)α + η(x)‖x − x0‖n.

Page 72: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

68 2. RACHUNEK RÓŻNICZKOWYDOWÓD: Pierwszy ze wzorów wynika natychmiast z poprzedniego jeśli przyjąć, że h = x − x0oraz η(x) = ε(x − x0). Przy nieco silniejszych założeniach można podać inne postacie reszty we wzorze Taylora.2.2.16 TWIERDZENIE: Załóżmy, że f : U → R jest funkcją (n+1)-krotnie różniczkowalną. Niechx0 ∈ U oraz x ∈ U jest takim punktem, że odcinek x0 + t(x − x0) | t ∈ [0, 1] jest zawarty wU . Wówczas

f (x) = n∑k=0

1k! f (k)(x0)((x − x0)k) + Rn(x)

gdzieRn(x) = 1(n + 1)! f (n+1)(x0 + θ(x − x0))‖x − x0‖n+1

dla pewnego θ ∈ (0, 1).DOWÓD jest analogiczny z wykorzystaniem reszty w postaci Lagrange’a we wzorze Taylora dlafunkcji pomocniczej g : [0, 1]→ R danej wzoremg(t) = f (x0 + t(x − x0)), t ∈ [0, 1].

Wtedy g jest funkcją (n + 1) różniczkowalną i (wykorzystując lemat 2.2.13) dla 1 ≤ k ≤ n + 1,g (k)(t) = f (k)(x0 + t(x − x0))((x − x0)k).

Istnieje θ ∈ (0, 1) takie, żeg(1) = g(0) + n∑

k=11k!g (k)(0)tk + 1(n + 1)!g (n+1)(θ).

Stąd już mamy tezę. Używając notacji multiindeksowej możemy napisaćf (x) = ∑

|α|≤n

1α!∂αf (x0)(x − x0)α + ∑

|α|=n+11α!∂αf (x0 + θ(x − x0))(x − x0)α.

ĆWICZENIE: Podać dwie wersje twierdzenia o wzorze Taylora dla odwzorowań f : U → RM .Szczególna uwaga jest wskazana w przypadku wzoru Taylora z resztą w postaci Lagrange’a!(Czytelnik powinien przyjrzeć się twierdzeniu 2.1.13 o przyrostach).2.2.F Ekstrema funkcji wielu zmiennych

Podobnie jak w przypadku funkcji rzeczywistych jednej zmiennej, rachunek różniczkowy możebyć użyteczny podczas badania ekstremów funkcji wielu zmiennych.2.2.17 DEFINICJA: Rozważmy funkcję f : U → R. Mówimy, że funkcja f osiąga lokalne mini-mum (odp. maksimum) w punkcie x0 ∈ U jeżeli istnieje δ > 0 takie, że B(x0, δ) ⊂ U orazf (x) ≥ f (x0) (odp. f (x) ≤ f (x0)) dla dowolnego x ∈ B(x0, δ). Mówimy o minimum (lub maksi-mum) globalnym gdy powyższe nierówności zachodzą dla dowolnego x ∈ U . O minimach (lubmaksimach) lokalnych (lub globalnych) mówimy, że są ścisłe, jeśli dla x ∈ B(x0, δ) (lub x ∈ U)mamy f (x) > f (x0) (lub f (x) < f (x0)) o ile x 6= x0.

Page 73: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.2. POCHODNE WYŻSZYCH RZĘDÓW 69

Interesować nas będą przede wszystkim warunki konieczne i dostateczne istnienia ekstre-mów. Zaczniemy od prostego kryterium Fermata; jest to warunek konieczny.2.2.18 TWIERDZENIE: Jeżeli funkcja f : U → R osiąga ekstremum lokalne w punkcie x0 ∈ U ijest w tym punkcie różniczkowalna, to f ′(x0) = 0 (tzn. dla dowolnego h ∈ RN , f ′(x0)(h) = 0).Dowód: Przypuśćmy dla ustalenia uwagi, że w punkcie x0 funkcja f osiąga minimum. Niechh ∈ RN . Jak wiadomo pochodna kierunkowa funkcji f w punkcie x0

f ′(x0;h) = f ′(x0)(h).Z drugiej strony

f ′(x0;h) = limt→0 f (x0 + th)− f (x0)

t = limt→0− f (x0 + th)− f (x0)

t = limt→0+

f (x0 + th)− f (x0)t .

Zauważmy, że licznik w powyższych wyrażeniach jest liczbą nieujemną, zaś mianownik liczbaujemną (odp. dodatnią). Wobec tego f ′(x0;h) ≤ 0 (odp. f ′(x0;h) ≥ 0). Zatem f ′(x0;h) = 0.

2.2.19 TWIERDZENIE: Jeśli f osiąga minimum (odp. maksimum) w punkcie x0 ∈ U oraz f jestdwukrotnie różniczkowalna w x0, to forma kwadratowa wyznaczona przez drugą pochodnąf ′′(x0) jest nieujemna (odp. niedodatnia).DOWÓD: Załóżmy, że w x0 funkcja f przyjmuje minimum. Znajdziemy więc takie otoczenieB(x0, δ), że dla x ∈ B(x0, δ), f (x) ≥ f (x0). Niech h ∈ RN , dla t ∈ (− δ

‖h‖ ,δ‖h‖

), x0 + th ∈ B(x0, δ);zatem f (x0 + th) ≥ f (x0). Z kolei ze wzoru Taylora (z reszta w postaci Peano), dla takich tmamy0 ≤ f (x0+th)−f (x0) = tf ′(x0)(h)(h)+12 t2f ′′(x0)(h, h)+ε(th)‖th‖2 = t2(12 f ′′(x0)(h, h) + ε(th)‖h‖)gdzie ε(th)→ 0 o ile t → 0. W takim razie

0 ≤ limt→0

[12 f ′′(x0)(h, h) + ε(th)‖h‖2] = 12 f ′′(x0(h, h).W przypadku maksimum postępując podobnie uzyskując, że f ′′(x0)(h, h) ≤ 0. Powyższy warunek konieczny jest już znacznie bliższy warunkowi dostatecznemu. Zacho-dzi mianowicie następujący fakt.2.2.20 TWIERDZENIE: Załóżmy, że funkcja f : U → R jest dwukrotnie różniczkowalna w punk-cie x0. Jeśli f ′(x0) = 0 oraz druga pochodna f ′′(x0) jest dodatnio (odp. ujemnie) określona, tow x0 funkcja f przyjmuje ścisłe lokalne minimum (odp. maksimum).DOWÓD: Przypuśćmy, że druga pochodna jest dodatnio określona. Zgodnie z wzorem Taylora(z resztą w postaci Peano), dla pewnego δ > 0 i x ∈ B(x0, δ),

f (x)− f (x0) = 12 f ′′(x0)(x − x0, x − x0) + η(x)‖x − x0‖2gdzie η(x) → 0 przy x → x0. Jednocześnie, z założenia istnieje c > 0 takie, że f ′′(x0)(h, h) ≥c‖h‖2. Istnieje więc ε ∈ (0, δ) takie, że |η(x)| < c2 , o ile ‖x − x0‖ < ε. Niech x ∈ B(x0, ε).Wówczas

f (x)− f (x0) = 12 f ′′(x0)(x − x0, x − x0) + η(x)‖x − x0‖2 ≥ ‖x − x0‖2[12c + ε(x)] > 0.

Page 74: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

70 2. RACHUNEK RÓŻNICZKOWYPrzypadek ujemnej określoności prowadzi do nierówności f (x)− f (x0 < 0 przy x ∈ B(x0, ε).W celu stwierdzenie dodatniości (dodatniej określoności) lub ujemnej określoności formykwadratowej wyznaczonej przez drugą pochodną f ′′(x0) wykorzystujemy twierdzenie Sylveste-ra do macierzy Hessa Hf (x0).2.3 Teoria odwzorowań

2.3.A Twierdzenie o funkcji uwikłanej

Załóżmy obecnie, że f : U → RM , gdzie U ⊂ RN+K jest zbiorem otwartym. Przestrzeń RN+Ktraktujemy jako iloczyn kartezjański RN × RK , zaś punkt z ∈ RN+K – jako parę (x, y), gdziex ∈ RN , y ∈ RK . Nieco dokładniej: jeśli z = (z1, ..., zN , zN+1, ..., zN+K) oraz x = (x1, ..., xN ) iy = (y1, ..., yK), to x1 = z1, ..., xN = zN oraz y1 = zN+1, ..., yK = zN+K .Niech z0 = (x0, y0) ∈ U . Powiemy, że odwzorowanie f jest różniczkowalne w punkciez0 względem (zespołu zmiennych) y , jeśli odwzorowanie pomocnicze y 7Ï g(y) := f (x0, y)określona na zbiorze otwartym V := y ∈ RK | (x0, y) ∈ U jest różniczkowalna w punkcie y0.ĆWICZENIE: Sprawdzić, że zbiór V jest rzeczywiście otwarty.Pochodną g ′(y0) funkcji g w punkcie y0 nazywamy pochodną odwzorowania f w punkciez0 = (x0, y0) względem (zespołu zmiennych) y i oznaczamy symbolem f ′y (z0).UWAGA: (1) Oznaczenie to nie powinno prowadzić do żadnych nieporozumień (5). Jeślibowiem M = 1, to różniczkowalność względem y (rozumiana w powyższym sensie) oznaczapo prostu istnienie pochodnej cząstkowej ∂f

∂y (z0) względem ostatniej zmiennej.(2) Wróćmy jeszcze przez chwilę do odwzorowania pomocniczego g : V → RM wyżejwprowadzonego.; przypomnijmy, że V ⊂ RK jest zbiorem otwartym Oczywiście można mówićo pochodnych cząstkowych odwzorowania g w punkcie y0. Na przykład: dla j = 1, ..., K możnarozważać gi|j (y0), gdzie gi jest i-tą funkcja współrzędną odwzorowania g . Jest chyba jasne, żegi(y) = fi(x0, y) dla y ∈ V , gdzie fi jest i-tą funkcją współrzędną odwzorowania f oraz

gi|j (y0) = fi|N+j (z0).W związku z tym macierzą stowarzyszoną z pochodną f ′y (z0) ∈ L(RK,RM ) jest macierz[fi|N+j (z0)] i=1,...,Mj=1,...,K .W analogiczny sposób można mówić o różniczkowalności i o pochodnej odwzorowania fw punkcie z0 względem (zespołu zmiennych) x oznaczanej symbolem f ′x(z0).ĆWICZENIE: Podać precyzyjną definicję różniczkowalności względem x i omówić postaćmacierzy stowarzyszonej z f ′x(z0).Czytelnik bez trudu udowodni, że

2.3.1 TWIERDZENIE: Jeżeli odwzorowanie f jest różniczkowalne w punkcie z0, to jest różnicz-kowalne w tym punkcie względem obu (zespołów) zmiennych. Dodatkowo, dla dowolnegoh ∈ RN+M postaci h = (u, v), gdzie u ∈ RN , v ∈ RM , mamy

f ′(z0)(h) = f ′x(z0)(u) + f ′y (z0)(v).

5Przypomnijmy, że do tej pory pisaliśmy f ′y lub fy dla oznaczania pochodnych cząstkowych funkcji dwóch lubtrzech zmiennych x, y, z.

Page 75: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.3. TEORIA ODWZOROWAŃ 71

W zasadzie wszystkie fakty dotyczące pochodnych mają miejsce dla pochodnych względemzespołu zmiennych. Na przykład Czytelnik bez trudu wykaże następującą wersję twierdzeniao przyrostach.2.3.2 LEMAT: Jeśli punkty (x0, y1), (x0, y2) należą do zbioru U i odcinek je łączący zawiera sięw U , funkcja f : U → RM , gdzie U ⊂ RK = RN × RL , jest różniczkowalna we wszystkichpunktach tego odcinka względem (zespołu zmiennych) y , to istnieje punkt c należący doodcinka łączącego te punkty taki, że

‖f (x0, y1)− f (x0, y2)‖ ≤ ‖f ′y (c)‖‖y1 − y2‖.

Podamy teraz jedno z fundamentalnych twierdzeń teorii odwzorowań wielu zmiennych,tzw. twierdzenie o funkcji uwikłanej. W tym sformułowaniu K = M i obowiązuje przyjętanotacja i terminologia.2.3.3 TWIERDZENIE: Niech f : U → RM , gdzie U ⊂ RN ×RM jest zbiorem otwartym. Załóżmy,że:

(i) f jest odwzorowaniem ciągłym;(ii) dla pewnego z0 = (x0, y0) ∈ U , f (z0) = 0;(iii) odwzorowanie f jest różniczkowalne względem y w dowolnym punkcie z ∈ U ;(iv) pochodne cząstkowe odwzorowania f względem zmiennych wchodzących w skład

zespołu zmiennych y są odwzorowaniami ciągłymi w punkcie z0;(v) przekształcenie liniowe f ′y (z0) ∈ L(RM ,RM ) jest izomorfizmem.Wówczas istnieją liczby ε, δ > 0 takie, że B(x0, ε) × B(y0, δ) ⊂ U , oraz dokładnie jedna

funkcja ciągła g : B(x0, ε)→ B(y0, δ) taka, że:(I) dla każdego x ∈ B(x0, ε), f (x, g(x)) = 0;(II) dla dowolnych x ∈ B(x0, ε) oraz y ∈ B(y0, δ), jeśli f (x, y) = 0, to y = g(x); w szczegól-

ności g(x0) = y0.Jeżeli dodatkowo odwzorowanie f jest różniczkowalne w punkcie z0, to funkcja g jest

różniczkowalna w punkcie x0 i

g ′(x0) = −[f ′y (x0, y0)]−1 f ′x(x0, y0)).Jeśli funkcja f jest klasy C1, to funkcja g jest klasy C1 i, dla dowolnego x ∈ B(x0, ε),

g ′(x) = −[f ′y (x, g(x))]−1 f ′x(x, g(x)).Jeśli f jest klasy Cn , to g jest także klasy Cn .DOWÓD tego twierdzenie nie jest specjalnie trudny; jest jednak dość technicznie złożony. Po-damy go w przypadku, gdy N = M = 1. Jednocześnie dowód będzie tak skonstruowany, żeuważny Czytelnik będzie umieć go przenieść do przypadku ogólnego bez kłopotów.Kładziemy N = M = 1. Założenia oznaczają, że U ⊂ R2 jest zbiorem otwartym, funk-cja f : U → R jest ciągła, f (x0, y0) = 0, dla dowolnego (x, y) ∈ U istnieje pochodna cząstkowa

fy (x, y), funkcja U 3 (x, y) 7Ï fy (x, u) jest ciągła w punkcie (x0, y0) i wreszcie A := fy (x0, y0) 6= 0(zweryfikować, że to są rzeczywiście założenia, przy których pracujemy).Zdefiniujmy pomocniczą funkcję T : U → R wzoremT(x, y) := y − A−1 · f (x, y), (x, y) ∈ U.

Funkcja T jest ciągła, a więc w szczególności,T(x, y)→ T(x0, y0) = y0,

Page 76: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

72 2. RACHUNEK RÓŻNICZKOWYgdy (x, y) → (x0, y0). Ponadto, dla dowolnego (x, y), funkcja T jest różniczkowalna w punkcie(x, y) względem y , tzn. istnieje pochodna cząstkowa Ty (x, y) i

Ty (x, y) = 1− A · fy (x, y).Ciągłość pochodnej cząstkowej fy w (x0, y0) implikuje, że również pochodna cząstkowa Ty jesttam ciągła, czyli

Ty (x, y)→ Ty (x0, y0) = 1− A−1 · A = 0,gdy (x, y)→ (x0, y0).Biorąc te dwie okoliczności pod uwagę (i pamiętając, ze zbiór U jest otwarty) znajdziemyliczby ε > 0 i δ > 0 takie, że:(x0 − ε, x0 + ε)× [y0 − δ, y0 + δ] ⊂ U ;

|Ty (x, y)| < 12 oraz |T(x, y0)− T(x0, y0)| = |T(x, y0)− y0| < 12δ(tu kolejność doboru jest następująca: korzystając z ciągłości najpierw wybieramy ε, δ > 0 tak,aby |Ty (x, y)| < 1/2 dla x, y takich, że |x−x0| < ε i |y−y0| ≤ δ i jednocześnie (x0−ε, x0 +ε)×[y0 − δ, y0 + δ] ⊂ U ; następnie, wykorzystując ciągłość odwzorowania x 7Ï T(x, y0) możemyewentualnie zmniejszyć ε, tak aby |T(x, y0)− T(x0, y0)| < δ/2).Zauważmy, że wówczasT : (x0 − ε, x0 + ε)× [y0 − δ, y0 + δ]→ (y0 − δ, y0 + δ).

Istotnie: niech |x − x0| ≤ ε, |y − y0| ≤ δ. Z lematu 2.3.2 (a w naszej sytuacji, tzn. gdy M = 1, zezwykłego twierdzenia Lagrange’a) istnieje θ ∈ (0, 1) , że|T(x, y)− y0| ≤ |T(x, y)− T(x, y0)|+ |T(x, y0)− y0| ≤ |Ty (x, y0 + θ(y − y0)||y − y0|+ 12δ < δ.

Na tej samej zasadzie, dla ustalonego x ∈ (x0−ε, x0 +ε) oraz dowolnych y, y ′ ∈ [y0−δ, y0 +δ]znajdziemy taką θ ∈ (0, 1), że|T(x, y)− T(x, y ′)| ≤ |Ty (x, y ′ + θ(y − y ′))||y − y ′| ≤ 12 |y − y ′|.

W dalszym ciągu wykorzystamy bardzo ważne twierdzenie, zwane twierdzeniem Banachao punkcie stałym, które jest znacznie ogólniejsze, lecz w naszej sytuacji brzmi następująco:

Jeśli F : (α, β)× [a, b]→ (a, b) jest odwzorowaniem ciągłym i istnieje stała k ∈ [0, 1) taka,że dla dowolnych x ∈ (α, β) oraz y, y ′ ∈ [a, b], |T(x, y) − T(x, y ′)| ≤ k|y − y ′|, to istnieje dlakażdego x ∈ (α, β) istnieje dokładnie jeden punkt stały funkcji T(x, ·), tzn. element g(x) ∈ (a, b),że g(x) = T(x, g(x)). Ponadto funkcja (α, β) 3 x 7Ï g(x) ∈ (a, b) jest ciągła.W naszej sytuacji α = x0 − ε, β = x0 + ε, a = y0 − δ, b = y0 + δ i k = 12 . Widzimy więc,że istnieje dokładnie jedna funkcja ciągła g : (x0 − ε, x0 + ε) → (y0 − δ, y0 + δ) taka, że dlax ∈ (x0 − ε, x0 + ε),

g(x) = T(x, g(x)) = g(x)− A−1 · f (x, g(x)) ⇐Ñ f (x, g(x)) = 0.Jeśli x ∈ (x0 − ε, x0 + ε), y ∈ (y0 − δ, y0 + δ) i f (x, y) = 0, to T(x, y) = y , a stąd y = g(x). Tokończy dowód pierwszej części twierdzenia.Dowód różniczkowalności funkcji g jest dość złożony i go tu pominiemy. Wiemy, że 0 =

Page 77: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.3. TEORIA ODWZOROWAŃ 73

f (x, g(x)) dla x ∈ (x0 − ε, x0 + ε). Funkcja (x0 − ε, x0 + ε) 3 x 7Ï h(x) := f (x, g(x)) jest więcstała i jest złożeniem funkcji x 7Ï (x, g(x)) i funkcji f . Wobec tego, z reguły łańcucha0 = h′(x0) = fx(x0, g(x0)) + fy (x0, g(x0))g ′(x0) = fx(x0, y0) + fy (x0, y0)g ′(x0),

czylig ′(x0) = −[f ′y (x0, y0)]−1fx(x0, y0).Dowód przedostatniej części twierdzenia pozostawiam czytelnikom. Pokażemy część ostatniąrozumując indukcyjnie. Dla n = 1 jest to prawda w świetle części przedostatniej. Przypuśćmy,że teza jest słuszna dla n − 1. A więc ponieważ Cn ⊂ Cn−1, wnosimy, że g jest funkcją klasy

cn−1. W taki razie skoro g ′(x) = −[fx(x, g(x))]−1fx(x, g(x)). Po prawej stronie mamy iloczynzłożeń funkcji klasy Cn−1; zatem g ′ jest klasy Cn−1, czyli g jest klasy Cn .

2.3.B Twierdzenie o lokalnym odwracaniu odwzorowań

Jedną z najważniejszych konsekwencji twierdzenia o funkcji uwikłanej (a w zasadzie faktemrównoważnym) jest następujące twierdzenie o lokalnym odwracaniu odwzorowań. Byłobywskazane, aby Czytelnik przypomniał różne wersje twierdzenia o odwracalności funkcji rze-czywistych jednej zmiennej. Dla przykładu: jeśli f : (a, b) → R jest funkcją różniczkowalnąo nieznikającej pochodnej (tzn. f ′(x) 6= 0 dla x ∈ (a, b)), to f jest funkcją ciągłą, różnowar-tościową, obrazem przedziału (a, b) jest przedział otwarty (A,B), istnieje funkcja odwrotnaf−1 : (A,B) → R. Funkcja odwrotna jest różniczkowalna (a więc też ciągła) i dla dowolnegoy ∈ (A,B), (f−1)′(y) = 1

f ′(x) , gdzie y = f (x), x ∈ (a, b); jeśli f jest klasy C1, to także f−1 jest klasyC1. .W przypadku odwzorowań wielu zmiennych sprawa jest znacznie bardziej skomplikowana.Mówi o tym następujące twierdzenie (a także następny podrozdział).2.3.4 TWIERDZENIA: Niech f : U → RM , gdzie U ⊂ RM jest zbiorem otwartym, oraz x0 ∈ U .Jeżeli f jest różniczkowalna w otoczeniu punktu x0, pochodna f ′ jest ciągła w punkcie x0 ∈ Uoraz f ′(x0) jest izomorfizmem (tzn. rank f ′(x0) = M lub, równoważnie, jakobian det Jf (x0) 6= 0),to istnieje ε > 0 oraz otoczenie W punktu x0, W ⊂ U , takie, że f (W ) = B(f (x0), ε) orazfunkcja ciągła g : B(f (x0), ε) → W taka, że dla dowolnego y ∈ B(f (x0), ε), f (g(y)) = y oraz,dla dowolnego x ∈ W , g(f (x)) = x (tzn. f |W jest funkcją odwracalną i gt = f−1 jest funkcjado niej odwrotną). Ponadto funkcja g jest różniczkowalna w punkcie y0 = f (x0) oraz g ′(y0) =[f ′(x0)]−1.

Jeśli f jest funkcja klasy C1, to g też jest klasy C1 i, dla x ∈ W , g ′(f (x)) = [f ′(x)]−1.Ogólniej, jeśli f jest klasy Cn , to g jest klasy Cn .DOWÓD: Bez zmniejszenia ogólności można założyć, że f ′(x) istnieje dla dowolnego x ∈ U .Rozważmy odwzorowanie F : U × RM → RM dane wzorem

F (x, y) = y − f (x), x ∈ U, y ∈ RM .

Wówczas F (x0, y0) = 0, F jest odwzorowaniem różniczkowalnym i, dla dowolnego (x, y) ∈U × RM ,

F ′x(x, y) = −f ′(x), F ′y (y) = I.Ponadto pochodne F ′x , F ′y są ciągłe w punkcie (x0, y0) oraz pochodna F ′x(x0, y0) jest izo-morfizmem. Z twierdzenia o funkcji uwikłanej istnieją liczby ε, δ > 0 oraz funkcja ciągła

Page 78: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

74 2. RACHUNEK RÓŻNICZKOWYg : B(y0, ε) → B(x0, δ) taka, że B(x0, δ) × B(y0, ε) ⊂ U oraz F (g(y), y) = 0 dla dowolnegoy ∈ B(y0, ε); dodatkowo, jeśli (x, y) ∈ B(x0, δ)× B(y0, ε) i F (x, y) = 0, to x = g(y).Dla każdego y ∈ B(y0, ε), 0 = F (g(y), y) = y − f (g(y)), tzn. y = f (g(y)). Niech

W := f−1(B(y0, ε)) ∩ B(x0, δ).Oczywiście zbiór W jest otwarty i x0 ∈W . Niech x ∈W . Wtedy y = f (x) ∈ B(y0, ε) i F (x, y) =y − f (x) =; czyli x = g(y), tzn. x = g(f (x)).Spełnione są także założenia drugiej części twierdzenia o funkcji uwikłanej; zatem funkcjag jest różniczkowalna w punkcie y0 i

g ′(y0) = −[F ′x(x0, y0)]−1 F ′y (x0, y0) = [f ′(x0)]−1.Jeśli f jest klasy C1, to i funkcja F jest klasy C1. Zatem z trzeciej części twierdzenia o funkcjiuwikłanej wynika, że (przy odpowiednim doborze ε i δ; konkretnie takim, by pochodna f ′(x)była odwracalna dla x ∈ B(x0, δ)) funkcja g jest klasy C1 oraz

g ′(f (x)) = [f ′(x)]−1dla x ∈W .Jeżeli f jest klasy Cn , to F też jest klasy Cn; co, na mocy ostatniej części twierdzenia ofunkcji uwikłanej, dowodzi, że g jest klasy Cn .

2.3.5 UWAGA Nie należy sądzić, że – tak jak w przypadku funkcji rzeczywistych jednej zmiennej– jeśli f : U → RN , gdzie U ⊂ RN , N > 1, jest zbiorem otwartym, jest funkcją różniczkowalną ipochodna f ′(x) jest izomorfizmem dla dowolnego x ∈ U , to f jest funkcją różnowartościową.Poniższy przykład może nas o tym przekonać.2.3.6 PRZYKŁAD: Rozważmy funkcję f : U → R2, gdzie U := (x, y) ∈ R2 | x 6= 0, zadanąwzorem

f (x, y) := (x cos y, x sin y),dla (x, y) ∈ U . Wtedy, dla każdego (x, y) ∈ U ,J(x,y)f = [cos y −x sin ysin y x cos y ] ,

więc det J(x,y)f = x 6= 0. Niestety funkcja f nie jest różnowartościowa, bo f (x, y) = f (x, y + 2π)dla dowolnych (x, y) ∈ U .2.3.C Odwzorowania regularne, dyfeomorfizmy

Niech f : U → RM , gdzie U ⊂ RN jest zbiorem otwartym. Mówimy, że odwzorowanie f jestregularne, gdy jest klasy C1 i, dla dowolnego x ∈ U , rząd rank Jf (x) macierzy Jacobiegoodwzorowania f w punkcie x jest maksymalny (a zatem wynosi N , gdy N ≤ M oraz M , gdyN > M).PRZYKŁAD: Przypuśćmy, że g : U → R jest funkcją klasy C1 i rozważmy odwzorowanief : U → RM , gdzie M = N + 1, dane wzorem

f (x) = (x, g(x)), x ∈ U.

Page 79: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.3. TEORIA ODWZOROWAŃ 75

Wówczas f jest odwzorowaniem klasy C1 (jego funkcje współrzędne mają postać f1(x) =x1, ..., fN (x) = xN i fM = fN+1(x) = g(x) i są funkcjami klasy C1). Oczywiście, dla każdegox ∈ U ,

Jf (x) =

1 0 ... 00 1 ... 0... ... . . . ...0 0 ... 1g|1(x) g|2(x) ... g|N (x)

.Zatem rank Jf (x) = N .

DYFEOMORFIZMY Mówimy, że odwzorowanie f : U → RM jest dyfeomorfizmem, gdy jestono regularne, różnowartościowe i odwzorowanie odwrotne f−1 : f (U)→ U jest ciągłe (6).PRZYKŁAD: Odwzorowanie f z poprzedniego przykładu jest dyfeomorfizmem, gdyż f jestróżnowartościowe, f (U) = Gr (g) jest wykresem odwzorowania g i odwzorowanie odwrotnef−1 : Gr (g)→ U , dane wzorem f−1(x, g(x)) = x, x ∈ U , jest oczywiście ciągłe.Można udowodnić, że każde odwzorowanie regularne f : U → RM , gdzie M ≥ N , jest,z dokładnością do pewnego dyfeomorfizmu, odwzorowaniem na wykres, czyli takim jak wprzykładzie. Natomiast, wykorzystując twierdzenie o funkcji uwikłanej dowodzi się, że:2.3.7 TWIERDZENIE: Jeżeli f : U → RM jest dyfeomorfizmem, to M ≥ N . W zasadzie dowodzi się, że odwzorowania regularne w przestrzeń niższego wymiaru niemogą być różnowartościowe.UWAGA: Z definicji odwzorowania regularne i dyfeomorfizmy są klasy C1. Czasem jednakżąda się więcej mówiąc o odwzorowaniach regularnych lub dyfeomorfizmach klasy Ck , gdziek > 1.Zasadniczym faktem dotyczącym dyfeomorfizmów jest następujące twierdzenie.2.3.8 TWIERDZENIE: Jeśli odwzorowanie f : U → RN , gdzie U ⊂ RN jest zbiorem otwartym, jestregularne (klasy Ck z k > 1) i różnowartościowe, to:(i) f (U) jest zbiorem otwartym (jest to tzw. niezmienniczość obszaru (7);(ii) f jest dyfeomorfizmem;(iii) odwzorowanie odwrotne f−1 : f (U)→ RN jest również dyfeomorfizmem;(iv) dla dowolnego x ∈ U , pochodna f ′(x) jest izomorfizmem przestrzeni RN , zaś dla dowol-nego y ∈ f (U), (f−1)′(y) = [f ′(x)]−1, gdzie y = f (x).DOWÓD: To, że f ′(x) jest izomorfizmem jest oczywiste: dla wszystkich x ∈ U , rank Jf (x) = N ,więc macierz Jacobiego odwzorowania f w każdym punkcie jest nieosobliwa. Pokażemy, żezbiór f (U) jest otwarty: w tym celu bierzemy y0 ∈ f (U) i x0 ∈ U takie, że y0 = f (x0). Ponieważf ′(x0) jest izomorfizmem i f jest klasy C1, z twierdzenia o lokalnym odwracaniu odwzorowań,istnieje ε > 0 oraz otoczenie W punktu x0 oraz funkcja g : B(y0, ε) → W klasy C1 (a takżeklasy Ck , gdy f jest klasy Ck) taka, że y = f (g(y)) dla y ∈ B(y0, ε) i g(f (x)) = x dla x ∈ W ,oraz g ′(y0) = [f ′(x0)]−1. Stąd wynika, że B(y0, ε) ⊂ f (U), czyli f (U) jest zbiorem otwartym.Jednocześnie zauważmy, że odwzorowanie odwrotne f−1 : f (U) → U istnieje (patrz przypis) ig = f−1|B(y0,ε). Tak więc odwzorowanie f−1 jest ciągłe, tej klasy gładkości co g . Reszta została

6Przypomnijmy, że jeśli odwzorowanie h : X → Y , gdzie X i Y są dowolnymi zbiorami, to h jest różnowartościowewtedy i tylko wtedy, gdy istnieje odwzorowanie odwrotne h−1 : h(X)→ X.7Pamiętamy, że obraz zbioru łukowo spójnego jest łukowo spójny: tak więc ta nazwa jest adekwatna do treścitwierdzenia.

Page 80: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

76 2. RACHUNEK RÓŻNICZKOWYjuż udowodniona. W tym miejscu warto przypomnieć przykład 2.3.6: odwzorowanie tam określone jest re-gularne, lecz nie jest dyfeomorfizmem, gdyż nie jest różnowartościowe.Z udowodnionego twierdzenia wynika też użyteczny wniosek (niekiedy przyjmowany jakodefinicja dyfeomorfizmu).2.3.9 WNIOSEK: Odwzorowanie f : U → RN , gdzie U ⊂ RN jest zbiorem otwartym, jest dyfe-omorfizmem wtedy i tylko wtedy, gdy f jest bijekcją na swój obraz, obraz f (U) jest otwarty iodwzorowania f i f−1 : f (U)→ RN są klasy C1.ĆWICZENIE: Udowodnić, ze złożenie dyfeomorfizmów jest dyfeomorfizmem.Warto jeszcze wprowadzić następującą terminologię: niech, jak zwykle f : U → RM , gdzieU ⊂ RN jest zbiorem otwartym, będzie odwzorowaniem różniczkowalnym Mówimy, że punktx ∈ U jest punktem regularnym odwzorowania f , jeśli rank Jf (x) jest maksymalny. Punktx ∈ U jest punktem krytyczny odwzorowania f , jeśli nie jest punktem regularnym dla f . Punkty ∈ RM jest wartością regularną odwzorowania f , jeżeli zbiór f−1(y) nie zawiera punktówkrytycznych; w przeciwnym razie mówimy, że y jest wartością krytyczną.UWAGA: Z punktu widzenia tej terminologii, twierdzenie Fermata (o warunkach koniecz-nych istnienia ekstremów lokalnych) można wypowiedzieć następująco. Jeśli funkcja f : U → Rjest różniczkowalna w punkcie x, w którym przyjmuje ekstremum lokalne, to x jest jej punk-tem krytycznym.Ma też miejsce ważne twierdzenie.2.3.10 TWIERDZENIE (Sarda): Jeśli odwzorowanie f : U → RM , gdzie U ⊂ RN jest zbioremotwartym, jest klasy C1 ∩CN−M+1, to zbiór jej wartości krytycznych jest zbiorem brzegowym(tzn. zbiór wartości krytycznych nie ma punktów wewnętrznych). Pewne uzupełnienie tego twierdzenie podamy poniżej.2.3.D Różniczkowanie funkcji na zbiorach nieotwartych

Do tej pory rozważaliśmy tylko różniczkowalność funkcji lub odwzorowań zdefiniowanychna zbiorach otwartych. Niekiedy jednak istnieje potrzeba mówić o różniczkowalności funkcjiokreślonych na zbiorach, które otwarte nie są. Poniżej omówimy dwie z takich sytuacji.Przypuśćmy, że V ⊂ RN . Mówimy, że odwzorowanie f = (f1, ..., fM ) : V → RM , gdzie M ≥ 1,jest n-krotnie różniczkowalne n ≥ 1 (odp. klasy Cr , r ≥ 1), jeżeli istnieje zbiór otwarty U ⊂ RN ,V ⊂ U , oraz odwzorowanie n-krotnie różniczkowalne (klasy Cr) F = (F1, ..., fM ) : U → Rmtakie, że F |V = f (zauważmy, że Fi|V = fi dla i = 1, ...,M). Wówczas też przez n-tą pochodnąodwzorowania f w punkcie x ∈ V , oznaczaną f ′(x), rozumiemy pochodną F ′(x). Podobna ter-minologia dotyczy pochodnych cząstkowych: np. dla x ∈ V , fi|j (x) := Fi|j (x) itp.Mówimy, że odwzorowanie f jest regularne, jeśli jest różniczkowalne i (istniejące) odwzo-rowanie F : U → RM jest regularne (tzn. klasy C1 i rankF ′(y) = minN,M dla wszystkichy ∈ U . Analogicznie f jest dyfeomorfizmem, jeżeli dyfeomorfizmem jest F : U → RM .UWAGA: (1) Na to by f było regularne (odp. dyfeomorfizmem) klasy Cr , r ≥ 1, potrzeba iwystarcza, aby było klasy Cr i rank f ′(x) = minN,M dla dowolnego x ∈ V (odp. f jest klasyC1 i jest homeomorfizmem na swój obraz); to nie jest natychmiastowe w dowodzie.(2) Dla dowolnego zbioru domkniętego K ⊂ RN istnieje funkcja g : RN → R klasy C∞

Page 81: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

2.3. TEORIA ODWZOROWAŃ 77

takie, że x ∈ RN | g(x) = 0 = K. Stąd wynika, że f : V → RM jest klasy Cr wtedy i tylko wtedy,gdy istnieje odwzorowanie F : RN → RM klasy Cr takie, że F |V = f . (3) Jeśli f : V → RMjest odwzorowaniem klasy Cr , to przedłużenie F : U → RM , o którym mowa w definicji niejest jednoznacznie wyznaczone przez f . Nie mniej jednak, jeżeli V jest zawarty w domknięciuswego wnętrza, to dla x ∈ V pochodna f (k)(x) ∈ Lk(RN ,RM ), gdzie 1 ≤ k ≤ r, jest wyznaczonajednoznacznie.Niekiedy wystarcza inne podejście: przypuśćmy, że zbiór U ⊂ RN jest otwarty oraz U ⊂V ⊂ U i niech f : V → RM . Mówimy wówczas, że odwzorowanie f jest klasy C1, jeśli obcięcieg := f |U : U → RM jest odwzorowaniem klasy C1 i dla dowolnych i = 1, ...,M oraz j = 1, ...., Nistnieje funkcja ciągła hij : U → R taka, że hij |U = gi|j .W takiej sytuacji, gdy x ∈ V , to za pochodną cząstkową fi|j (x), i = 1, ...,M , j = 1, ..., N ,uznajemy wartość hij (x). Należy zauważyć, że dla x ∈ V

hij (x) = limy→x, y∈U

fi|j (y),a więc wartość fi|j (x) jest wyznaczona jednoznacznie.UWAGA: (1) Jest jasne, że odwzorowanie f : V → RM (gdzie U ⊂ V ⊂ U , gdzie U ⊂ RN jestzbiorem otwartym) klasy C1 w sensie poprzedniej definicji jest klasy C1 w sensie powyższej.(2) Obie podane definicje (orzekające kiedy odwzorowanie f : V → RM jest klasy C1 sąrównoważne w wielu sytuacjach, na przykład gdy V jest kostką w RN , tzn. zbiorem postaciV = [a1, b1]× [a2, b2]× ...× [aN , bN ], a ogólniej mówiąc gdy V = Ω, gdzie Ω ⊂ RN jest zbioremotwartym, zaś brzeg ∂Ω jest tzw. N − 1-wymiarową rozmaitością z kantami.

Page 82: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Rozdział 3Całka Riemanna funkcji wielu zmiennych

Czytelnik powinien przypomnieć definicję całki Riemanna dla funkcji ograniczonych f : [a, b]→R. Oto krótkie przypomnienie: niech f : [a, b]→ R, gdzie −∞ < a ≤ b < +∞, będzie funkcjąograniczoną, tzn. istnieją liczby m,M ∈ R takie, że m ≤ f (x) ≤M dla wszystkich x ∈ [a, b].Jeśli P jest podziałem przedziału [a, b] (tzn. P = x0, x1, ..., xn, gdzie a = x1 < x2 < ... <xn = b), to

L(f , P) := n∑i=1 inf

x∈[xi−1,xi] f (x)(xi − xi−1)jest tzw. dolną sumą całkową Darboux dla funkcji f odpowiadającą podziałowi P, zaś

U(f , P) := n∑i=1 sup

x∈[xi,xi−1] f (x)(xi − xi−1)jest górną sumą całkową Darboux dla f względem P.Niech P będzie podziałem [a, b]. Jeżeli Q jest podziałem [a, b] drobniejszym niż P (inaczej:jest zagęszczeniem lub podpodziałem podziału P), a więc gdy P ⊂ Q, to

m(b − a) ≤ L(f , P) ≤ L(f ,Q) ≤ U(f ,Q) ≤ U(f , P) ≤M(b − a),a jeśli Q jest dowolnym podziałem [a, b], to L(f , P) ≤ U(f ,Q).Symbolem P[a, b] oznaczamy rodzinę wszystkich podziałów odcinka [a, b]. Powyższe nie-równości implikują, że zbiory L(f , P) | P ∈ P[a, b] i U(f , P) | P ∈ P[a, b] są ograniczone,a wyrażenia∫ b

af (x)dx := supL(f , P) | P ∈ P[a, b], ∫ b

af (x)dx := infU(f , P) | P ∈ P[a, b],

zwane całką dolną i całką górną, odpowiednio, są poprawnie określone. Oczywiście ∫ ba f (x)dx ≤∫ ba f (x)dx.Mówi się, że funkcja f jest całkowalna w sensie Riemanna na [a, b] i pisze f ∈ R[a, b], gdycałka dolna jest równa całce górniej i ich wspólną wartość oznacza się symbolem ∫ b

a f (x)dx inazywa całką Riemanna funkcji f na przedziale [a, b]. Czasem pisze się po prostu ∫ ba f .

Page 83: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.1. CAŁKA NA PROSTOKĄCIE 79

3.1 Całka na prostokącie

N-wymiarową kostką (domkniętą) nazywamy zbiór C będący produktem N przedziałów, tzn.C = [a1, b1]× [a2, b2]× ...× [aN , bN ],

gdzie aj , bj ∈ R i aj ≤ bj dla wszystkich j = 1, ..., N . Będą nas interesować przede wszystkimkostki niezdegenerowane, tzn. takie że aj < bj , j = 1, ..., N .

Objętością kostki C nazwiemy liczbęvol(C) := (b1 − a1)(b2 − a2)...(bN − aN ).

Podziałem kostki C nazwiemy układ P := (P1, ..., PN ), gdzie Pj jest podziałem odcinka[aj , bj ]; piszemy też P ∈ P(C). Jest jasne, że jeżeli Pj := xj0, xj1, ..., xjnj, gdzie j = 1, ..., N ,xj0 = aj oraz xjnj = bj , to podział Pj dzieli odcinek [aj , bj ] na nj mniejszych odcinków [xjk−1, xjk],k = 1, ..., nj , natomiast P dzieli kostkę C na n := n1 · ... · nN „mniejszych” kostek. W dalszymciągu (z pełną świadomością, że nie jest to doskonała notacja) piszemy S ∈ P, mając na myślijedną z tych „małych” kostek powstałych w wyniku tego rozbicia podziału P.Podział Q = (Q1, ..., QN ) ∈ P(C) jest zagęszczeniem podziału P (lub podziałem drob-niejszym niż P, lub też podpodziałem podziału P), gdy dla dowolnego 1 ≤ j ≤ N , Pj ⊂ Qj ,tzn. podział Qj jest zagęszczeniem podziału Pj . Jeśli P = (P1, ..., PN ) oraz Q = (Q1, ..., QN ), topodział (P1 ∪Q1, ..., PN ∪QN ) jest ich wspólnym zagęszczeniem.W przyszłości przyda się nam następujący prosty fakt.3.1.1 FAKT: Jeżeli Uii∈I jest dowolnym pokryciem otwartym kostki domkniętej C, to istniejepodział P ∈ P(C) o tej własności, że dla dowolnego S ∈ P istnieje takie i ∈ I , że S ⊂ Ui . Załóżmy, że C jest niezdegenerowaną kostką domkniętą, f : C → R jest funkcją ograni-czoną, P ∈ P(C) oraz S ∈ P. Wtedy definiujemy

mS(f , P) = infx∈S

f (x), MS(f , P) := supx∈S

f (x).Oczywiście, jeżeli m ≤ f (x) ≤M , x ∈ C , to

m ≤ mS(f , P) ≤MS(f , P) ≤M

dla każdej kostki S ∈ P.Dolną, odp. górną sumą całkową funkcji f odpowiadającą podziałowi P nazywamy liczbę

L(f , P) =∑S∈P

mS(f , P)vol(S) U(f , P) :=∑S∈P

MS(f , P)vol(S).Analogicznie jak w przypadku funkcji jednej zmiennej dowodzimy, że mają miejsce nastę-pujące własności:

3.1.2 FAKT: Jeśli P, P′, Q,Q′ ∈ P(C), P′ jest zagęszczeniem P, zaś Q′ zagęszczeniem Q, to

m vol(C) ≤ L(f ,Q) ≤ L(f ,Q′) ≤ U(f , P′) ≤ U(f , P) ≤Mvol(C).Wobec tego zbiory L(f , P)P∈P(C), U(f , P)P∈P(C) są ograniczone. Pozwala to, podobniejak poprzednio, przyjąć następującą definicję.

Page 84: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

80 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHMówimy, że funkcja f jest całkowalna (w sensie Riemanna) na kostce C jeśli dolna całka∫

Cf (x)dx := sup

P∈P(C)L(f , P)jest równa całce górnej ∫

Cf (x)dx := inf

P∈P(C)U(f , P).Jeśli funkcja (ograniczona) f : C → R jest całkowalna, to piszemy też f ∈ R(C), zaś wspólnąwartość całek górnej i dolnej oznacza się symbolami∫

Cf = ∫

Cf (x)dx = ∫

Cf (x1, ..., xN )dx1...dxN

i nazywa wielokrotną (dokładniej N-krotną) całką Riemanna.Oczywiście dla dowolnej funkcji ograniczonej f : C → R i P ∈ P(C),L(f , P) ≤ ∫

Cf ≤

∫Cf ≤ U(f , P).

Jeśli zaś f ∈ R(C), to dla dowolnego podziału P ∈ P(C) mamyL(f , P) ≤ ∫

Cf ≤

∫Cf (x)dx ≤ ∫

Cf ≤ U(f , P).

Zauważmy w tym miejscu też, że jeżeli C = [a, b] jest przedziałem domkniętym, a więc1-wymiarową kostką, to funkcja ograniczona f : [a, b]→ R jest całkowalna w sensie Riemanna(zdefiniowanym w pierwszej części skryptu) wtedy i tylko wtedy, gdy jest całkowalna w wyżejpodanym sensie i ∫[a,b] f (x)dx = ∫ b

af (x)dx.

Analogicznie, dla dowolnej funkcji ograniczonej f : [a, b]→ R mamy∫[a,b]f (x)dx = ∫ b

af (x)dx, ∫[a,b]f (x)dx = ∫ b

af (x)dx.

PRZYKŁAD: (a) Funkcja stała f (x) = c dla x ∈ C jest całkowalna i ∫C c dx = cvol(C).(b) Funkcja f : C → R, która przyjmuje wartość 1 gdy x ∈ QN ∩ C oraz 0 w przeciwnymrazie, nie jest całkowalna (sprawdzić).UWAGA: (1) Definiując całkę założyliśmy, że kostka C jest niezdegenerowana. Dla kostekzdegenerowanych uznajemy, że każda funkcja jest tam całkowalne i jej całka jest zerem.(2) Jeśli f : X → R, gdzie X ⊂ RN i kostka C ⊂ X, to powiada się, że funkcja f jestcałkowalna na C, jeżeli jest ona ograniczona na C i jej obcięcie f |C ∈ R(C); piszemy wtedyteż, że f ∈ R(C). Jak widać, fakt że funkcja określona jest na jakimś nadzbiorze kostki C, niema żadnego znaczenia z punktu widzenia całkowalności na C.Podobnie, jak w przypadku funkcji jednej zmiennej, można bez trudu udowodnić następu-jący warunek konieczny i dostateczny całkowalności:3.1.3 TWIERDZENIE: Funkcja ograniczona f : C → R jest całkowalna w sensie Riemanna nakostce C ⊂ RN wtedy i tylko wtedy, gdy dla dowolnego ε > 0 istnieje taki podział P ∈ P(C)kostki C, że

U(f , P)− L(f , P) < ε.

Page 85: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.1. CAŁKA NA PROSTOKĄCIE 81

DOWÓD: Konieczność: Ustalmy ε > 0; skoro ∫C f = ∫Cf , to (przypominając definicję kresugórnego) istnieje taki podział P1 ∈ P(C), że∫

Cf − ε/2 < L(f , P1) ≤ ∫

Cf ;

skoro zaś ∫C f = ∫Cf , to znajdzie się taki podział P2 ∈ P(C), że∫Cf ≤ U(f , P2) < ∫

Cf + ε/2.

Niech P = P1 ∪ P2 będzie wspólnym zagęszczeniem podziałów P1 i P2. Wtedy∫Cf − ε/2 < L(f , P1) ≤ L(f , P) ≤ U(f , P) ≤ U(f , P2) < ∫

Cf + ε/2.

Stąd U(f , P)− L(f , P) < ε.Dla dowodu dostateczności podanego warunku weźmy dowolne ε > 0 i dobierzmy podziałP ∈ P(C) tak, by U(f , P)− L(f , P) < ε. Wówczas

L(f , P) ≤ ∫Cf ≤

∫Cf .

Z dowolności ε wynika, że całki dolna i górna są równe, a więc, że f ∈ R(C). Czytelnik zechce też udowodnić (naśladując odpowiednie twierdzenie dotyczące całki Rie-manna funkcji jednej zmiennej) następujący odpowiednik twierdzenia Darboux-Riemanna.3.1.4 TWIERDZENIE: Niech C będzie kostką domkniętą i f : C → R funkcją ograniczoną. Wów-czas f ∈ R(C) wtedy i tylko wtedy, gdy istnieje granica sum całkowych Riemanna przy śred-nicach podziałów dążących do 0, tzn. istnieje liczba s ∈ R taka, że dla dowolnego ε > 0 istnie-je taka liczba δ, że dla dowolnego podziału P ∈ P(C) o średnicy µ(P) := maxS∈P diam (S) < δ(1) i dla dowolnego naboru Ξ = ξSS∈P , gdzie ξS ∈ S, mamy

∣∣s −∑S∈P f (ξS)vol(S)∣∣ < ε.Wówczas też

∫C f (x)dx = s. Całce wielokrotnej przysługuje wiele własności analogicznych jak w przypadku zwykłejcałki. I tak mamy następujące twierdzenie:

3.1.5 TWIERDZENIE: Załóżmy, że funkcje f , g : C → R są całkowalne. Wtedy:(i) dla dowolnego λ ∈ R, funkcje λf oraz f ± g są całkowalne i∫Cλf = λ

∫Cf ,

∫C(f ± g) = ∫

Cf ±

∫Cg ;

(ii) Jeśli f ≤ g na kostce C, to∫C f ≤

∫C g ;(iii) Jeśli C = C1∪C2∪...∪Cn , gdzie Ci jest kostką domkniętą (i = 1, ..., n) i pokrycie Cini=1

kostkami kostki C jest regularne (2), to f ∈ R(C) wtedy i tylko wtedy, gdy fi := f|Ci ∈ R(Ci)dla wszystkich i = 1, ..., n i wtedy ∫

Cf = n∑

i=1∫Ci

fi.

1Średnicą zbioru A ⊂ RN jest liczba diam (A) := sup‖x − y‖ | x, y ∈ A.2Mianowicie powiemy, że rodzina kostek niezdegenerowanych Cini∈1 jest regularnym rozbiciem kostki C , gdydla dowolnych i, j = 1, ..., n, przecięcie Ci ∩ Cj jest podzbiorem (być może pustym) ich wspólnej ściany, a więcgdy kostki tego pokrycia nie zachodzą na siebie oraz ⋃ni=1 Ci = C. Zauważmy, że jeżeli Cii∈I jest regularnymrozbiciem kostki C , to wnętrza kostek Ci , i = 1, ..., n, są rozłączne.

Page 86: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

82 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCH

DOWÓD: nie jest trudny. Przeprowadzenie odpowiedniego rozumowania w odniesieniu do czę-ści (ii) pozostawiamy czytelnikowi (dowód jest w istocie analogiczny do dowodu dotyczącegozwykłej (jednokrotnej) całki Riemanna). Dla przykładu pokażemy szkice dowodów pierwszejrówności z części (i) oraz części (iii).Niech ε > 0. Z twierdzenie 3.1.3 istnieją podziały P1, P2 ∈ P(C) takie, żeU(f , P1)− L(f , P1) < ε/2, U(g, P2)− L(g, P2) < ε/2.

Jeśli Q := P1∪P2 jest wspólnym zagęszczeniem podziałów P1, P2, to – wykorzystując fakt 3.1.2– otrzymamy, żeU(f ,Q)− L(f ,Q) < ε/2 i U(g,Q)− L(g,Q) < ε/2.Zauważmy teraz, że dla dowolnej kostki S ∈ Q,MS(f + g,Q) = sup

x∈S(f + g)(x) ≤MS(f ,Q) +MS(g,Q).

Analogicznie mS(f + g,Q) ≥ mS(f ,Q) +mS(g,Q). StądU(f + g,Q) = ∑

S∈QMS(f + g,Q)vol(S) ≤ U(f ,Q) + U(g,Q), L(f + g,Q) ≥ L(f ,Q) + L(g,Q),

czyliU(f + g,Q)− L(f + g,Q) ≤ U(f )− L(f ,Q) + U(g,Q)− L(g,Q) < ε.Dowodzi to, że f + g ∈ R(C). Ponadto

L(f ,Q) + L(g,Q) ≤ L(f + g,Q) ≤ ∫C(f + g)(x)dx ≤ U(f + g,Q) ≤ U(f ,Q) + U(g,Q),

L(f ,Q) + L(g,Q) ≤ ∫Cf (x)dx + ∫

Cg(x)dx ≤ U(f ,Q) + U(g,Q).

Stąd ∣∣∣∣∫C(f + g)(x)dx − (∫

Cf (x)dx + ∫

Cg(x)dx)∣∣∣∣ < ε.

Biorąc pod uwagę dowolność ε, kończymy dowód pierwszej równości z części (i).(iii) Przypuśćmy, że f ∈ R(C) i wybierzmy 1 ≤ i ≤ n oraz ε > 0. Istnieje wówczaspodział P ∈ P(C), dla którego U(f , P) − L(f , P) < ε. Bez zmniejszenia ogólności (biorąc wrazie potrzeby odpowiednie zagęszczenie), można założyć, że P zawiera wszystkie wierzchołkikostki Ci , i = 1, ...n. Wobec tego Pi := Ci ∩ P jest podziałem kostki Ci orazU(fi, Pi)− L(fi, Pi) ≤ U(f , P)− L(f , P) < ε.

Dowodzi to, że fi ∈ R(Ci).Na odwrót załóżmy, że dla dowolnego i = 1, ..., n, funkcja fi jest całkowalna na Ci . Wobectego, istnieją podziały Pi ∈ P(Ci) takie, że U(fi, Pi) − L(fi, Pi) < n−1ε. Niech P będzie takimpodziałem kostki C , że P1 ∪P2 ∪ ...∪Pn ⊂ P. Jest jasne, że wówczas P ∩Ci jest zagęszczeniempodziału Pi dla dowolnego i = 1, ..., n. Zatem U(fi, P ∩ Ci)− L(fi, P ∩ Ci) < ε/n. StądU(f , P)− L(f , P) = n∑

i=1 [U(fi, P ∩ Ci)− L(fi, P ∩ Ci)] < ε.

Page 87: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.1. CAŁKA NA PROSTOKĄCIE 83

Tak więc f ∈ R(C). Oczywiście z powyższej nierówności wynika, że∣∣∣∣∣∫C f (x)dx − n∑i=1∫Ci

fi(x)dx∣∣∣∣∣ < ε,

co dowodzi równości z części (iii). Analogicznie jak w przypadku zwykłej całki Riemanna dowodzimy, że:3.1.6 TWIERDZENIE: Jeśli f : C → R jest funkcją ciągłą, to jest całkowalna. Ogólniej: jeślifunkcja f : C → R jest całkowalna, φ : [a, b]→ R jest ciągła (gdzie przedział [a, b] ⊃ f (C)), tofunkcja φ f jest również całkowalna. Byłoby wskazane, by Czytelnik podał pełny dowód tego twierdzenia, a także następnego(wystarczy w odpowiedni sposób zmodyfikować dowody analogicznych twierdzeń z pierwszejczęści skryptu).Dzięki temu twierdzeniu można istotnie rozszerzyć klasę funkcji całkowalnych.3.1.7 PRZYKŁAD: (a) Jeśli f , g ∈ R(C), to fg,maxf , g,minf , g ∈ R(C).(b) Jeśli f ∈ R(C), to |f | ∈ R(C) oraz∣∣∣∣∫

Cf∣∣∣∣ ≤ ∫

C|f |.

Dla dowodu tych własności wystarczy powołać się na drugą część poprzedniego twierdzenia:na przykład |f | =√f2; tak więc |f | jest złożeniem f i funkcji ciągłej y 7Ï√y2.ĆWICZENIE: Jak dowieść, że maxf , g jest funkcją całkowalną?Wspomnijmy jeszcze twierdzenie o wartości średniej:

3.1.8 TWIERDZENIE: Jeśli f : C → R jest funkcją ciągłą, to istnieje taki punkt ξ ∈ C, że∫Cf = f (ξ)vol(C).

DOWÓD: Niech m = infC f , M = supC f . Z twierdzenia Weierstrassa wartości m,M są przyj-mowane, a więc – biorąc pod uwagę łukową spójność (wypukłość) kostki C i ciągłość wno-simy, że f (C) = [m,M]. Ponieważ mvol(C) ≤ ∫C f ≤ Mvol(C), to wartość pośrednia m ≤∫

C f [vol(C)]−1 ≤ M jest przyjmowana w pewnym punkcie ξ ∈ C na mocy własności Darbouxprzysługującej funkcjom ciągłym.

3.1.A Zbiory nieistotne i kryterium całkowalności

Aby, w pełni scharakteryzować klasę funkcji całkowalnych w sensie Riemanna (przypomnij-my, że nie zostało to zrobione poprzednio: podaliśmy tylko kilka warunków dostatecznychcałkowalności) potrzebować będziemy potrzebować pojęcia zbioru nieistotnego.Mówimy, że rodzina (przeliczalna) kostek N-wymiarowych Ci∞i=1 jest pokryciem zbioruA ⊂ RN , jeżeli

A ⊂∞⋃i=1Ci.

Page 88: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

84 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHPodzbiór A ⊂ RN jest nieistotny w sensie Jordana, jeśli dla dowolnego ε > 0 istnieje je-go co najwyżej przeliczalne pokrycie Ci∞i=1, gdzie Ci , i ∈ N, jest domkniętą kostką, oraz∑∞

i=1 vol(Ci) < ε (3).UWAGA: (1) Niektórzy autorzy nazywają zbiory nieistotne zbiorami miary zero (w sensieJordana). Jak się później okaże, nie jest to szczęśliwe określenie.(2) Oczywiście dowolny zbiór skończony lub przeliczalny jest nieistotny; w szczególnościzbiór liczb wymiernych jest nieistotny.(3) Kostka domknięta (niezdegenerowana) nie jest zbiorem nieistotnym. Można pokazać,że: kostka domknięta C jest zbiorem nieistotnym wtedy i tylko wtedy, gdy jest zdegenerowanai wówczas vol(C) = 0.ĆWICZENIE: (1) Wykazać, że dowolna kostka zdegenerowana jest zbiorem nieistotnym.(2) Wykazać, że wykres dowolnej funkcji ciągłej f : A → R, gdzie A ⊂ RN jest zbioremnieistotnym.(3) Czy nośnik każdej krzywej jest nieistotny? (Nie: sprawdzić w internecie (lub w literatu-rze) czym jest krzywa Peano). A co można powiedzieć o krzywych regularnych?3.1.9 FAKT: (1) Jeśli zbiór A ⊂ RN jest nieistotny oraz B ⊂ A, to również zbiór B jest nieistotny.

(2) Jeśli, dla dowolnego j ∈ N, zbiór Aj jest nieistotny, to także suma⋃∞j=1 Aj jest zbiorem

nieistotnym.DOWÓD: Pierwsza część jest oczywista. Dla dowodu drugiej części ustalmy ε > 0; dla dowol-nego j ≥ 1 istnieje pokrycie C ji∞i=1 zbioru Aj składające się z kostek domkniętych takie,że ∑∞i=1 vol(C j

i ) < ε2j . Rodzina kostek C ji∞i,j=1 jest przeliczalna i po ustawieniu jej w ciąg (wdowolny sposób) uzyskamy, że∞∑

i,j=1 vol(C ji ) < ε.

ĆWICZENIE: Wykazać, że zbiór nieistotny jest zbiorem brzegowym (tzn. nie ma punktówwewnętrznych).UWAGA: Należy być ostrożnym posługując się pojęciem zbioru nieistotnego. Rozważmydla przykładu N-wymiarową kostkę niezdegenerowaną C. Wówczas vol(C) > 0 i nie jest tozbiór nieistotny. Jeśli jednak rozważyć tę kostkę jako podzbiór przestrzeni RN+1 (czyli de factoutożsamić ją ze zbiorem C × 0), to staje się ona kostką zdegenerowaną, a tym samym,zbiorem nieistotnym. Wobec tego nieistotność jest pojęciem ściśle związanym z położeniemzbioru w konkretnej przestrzeni.Przejdziemy obecnie do zapowiedzianej charakteryzacji funkcji całkowalnych.3.1.10 TWIERDZENIE: Niech C ⊂ RN będzie kostką domkniętą i f : C → R funkcją ograni-czoną. Funkcja f jest całkowalna w sensie Riemanna wtedy i tylko wtedy, gdy zbiór D jejnieciągłości jest zbiorem nieistotnym.Przypomnijmy, że x ∈ D (tzn. x jest punktem nieciągłości funkcji f ) jeśli f nie jest ciągław tym punkcie, czyli istnieje ε > 0 o tej własności, że dla każdego δ > 0 znajdziemy y ∈ Ctaki, że ‖x − y‖ < δ, lecz |f (x)− f (y)| ≥ ε.

3Tzn. szereg ∑ vol(Ci) jest zbieżny i jego suma jest mniejsza niż ε. Przypomnijmy jeszcze, że zbieżność tegoszeregu jest równoważna ograniczoności ponieważ jego wyrazu są nieujemne.

Page 89: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.1. CAŁKA NA PROSTOKĄCIE 85

Zbiór D można też opisać nieco inaczej. Mianowicie, dla dowolnego x ∈ C niechW (x) := maxf (x), lim sup

y→xf (y); w(x) := minf (x), lim inf

y→xf (y)

(liczby te są poprawnie określone i skończone, bo funkcja f jest ograniczona) oraz niechoscylacja f w punkcie x

o(f , x) := W (x)−w(x).Jest jasne, że f jest ciągła w punkcie x wtedy i tylko wtedy, gdy o(f , x) = 0. Rzeczywiście, jeślif jest ciągła w punkcie x ∈ C, to f (x) = limy→x f (y) (każdy punkt kostki jest jej punktemskupienia). Istnienie granicy oznacza, że granice górna i dolna funkcji f w punkcie c są równei równe f (x), czyli W (x) = w(x) i o(f , x) = 0. Na odwrót równość W (x) = w(x) oznacza, że

lim supy→x

f (y) = f (x) = lim infy→x

f (y),co oznacza, że istnieje limy→x f (y) = f (x), czyli że f jest ciągła w x.Wobec tego,

D = ∞⋃n=1Dn,

gdzie Dn := x ∈ C | o(f , x) ≥ 1/n. Rzeczywiście, gdy x ∈ D, to o(f , x) > 0, czyli znajdzie siętakie n ∈ N, że o(f , x) ≥ 1/n, tj. x ∈ Dn . Na odwrót, gdy x ∈⋃∞n=1, to x ∈ Dn dla pewnego

n ∈ N, a więc o(f , x) ≥ 1/n > 0, tzn. x ∈ D.UWAGA: Można pokazać, że funkcja C 3 x 7Ï W (x) jest półciągła z góry, zaś C 3 x 7Ïw(x) jest półciągła z dołu. Udowodnimy ten drugi fakt. Niech λ < m(x), tzn. λ < f (x) i λ <lim infy→x f (y) = supη>0 inf0<‖x−y‖<η, y∈C f (y). Zatem, z definicji kresu górnego, istnieje takaη > 0, że inf0<‖x−y‖<η, y∈C f (y) > λ. To z kolei oznacza, dla dowolnego y ∈ C, jeśli 0 <‖y − x‖ < η, to f (y) > λ. Lecz również f (x) > η. W takim razie, f (y) > λ dla dowolnego y ∈ C ,o ile ‖y − x‖ < η. Analogicznie można wykazać górną półciągłość funkcji W (·).Ponieważ funkcja −w(·) jest półciągła z góry, więc funkcja C 3 x 7Ï o(f , x) jest półciągłaz góry. Oznacza to, że zbiór Dn jest domknięty co, wraz z jego ograniczonością, implikuje, żejest to zbiór zwarty. W konsekwencji zbiór D jest również zwarty.Nieobowiązkowy DOWÓD (twierdzenia 3.1.10): Załóżmy, że |f (x)| ≤ M dla dowolnego x ∈ C.Zaczniemy od dowodu dostateczności podanego warunku dla całkowalności. Niech ε > 0.Skoro D jest zbiorem nieistotnym, to istnieje rodzina Ui∞i=1 kostek otwartych (4) taka, D ⊂⋃∞i=1Ui oraz ∑∞i=1 vol(Ui) < ε. Z kolei, dla dowolnego x ∈ C \ D znajdziemy otwartą kostkę

Ux taką, że supy∈Ux

f (y)− infy∈Ux

f (y) < ε (∗)(Czytelnik zechce to sprawdzić). Rodzina U := Ui ∪ Uxx∈C\D tworzy pokrycie otwartekostki C. Z warunku Heinego-Borela wynika, że istnieje skończone podpokrycie V1, ..., Vnpokrycia U (oznacza to, że Vj ∈ U dla dowolnego j = 1, ..., n). Korzystając z faktu 3.1.1,znajdziemy podział taki P ∈ P(C), że dowolna kostka S ∈ P zawiera się w jednym z elementówpodpokrycia Vini=1.Dla dowolnej kostki S ∈ P możliwe są więc dwa przypadki:

4W definicji zbioru nieistotnego można zastąpić kostki domknięte otwartymi i na odwrót. Dowód tego możebyć niezłym ćwiczeniem.

Page 90: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

86 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCH(1) istnieje taki punkt x ∈ C \D, że S ⊂ Ux lub(2) istnieje takie i ≥ 1, że S ⊂ Ui .Rodzinę kostek S ∈ P spełniających pierwszy warunek oznaczmy P(1), a rodzinę kostek

S ∈ P spełniających drugi warunek oznaczmy P(2) (5). Gdy S ∈ P(1), to MS(f , P)−mS(f , P) < εna mocy warunku (∗), a gdy S ∈ P(2), to na pewno MS(f , P)−mS(f , P) < 2M . Wobec tegoU(f , P)− L(f , P) < ∑

s∈P1[MS(f )−mS(f )]vol(S) + ∑

S∈P2[MS(f )−mS(f )]vol(S) <

εvol(C) + 2M m∑i=1 vol(Ui) < εvol(C) + 2Mε

co, na mocy dowolności ε, dowodzi całkowalności funkcji f .Na odwrót załóżmy, że f ∈ R(C). Wystarczy pokazać, że dla dowolnego n ∈ N, zbiór Dn jestnieistotny. Ustalmy ε > 0 i rozważmy podział P ∈ P(C) taki, że U(f , P)−L(f , P) < ε/n (istnienietakiego podziału wynika z twierdzenia 3.1.3). Symbolem Q oznaczmy rodzinę tych kostek S ∈ P,dla których intS ∩Dn 6= ∅. Wtedy, dla S ∈ Q, MS(f , P)−mS(f , P) ≥ 1n . Istotnie, skoro S ∈ Q, toistnieje punkt x ∈ intS, z o(f , x) ≥ 1

n . Zatem istnieje takie η > 0, że B(x, η) ⊂ C i dla dowolnegoy ∈ B(x, η), ms(f , P) ≤ f (y) ≤ MS(f , P). Wobec tego mS(f , P) ≤ w(x) < W (x) ≤ MS(f , P), czylio(f , x) = W (x)−w(x) ≤MS(f , P)−mS(f , P).Stąd 1

n∑S∈Q

vol(S) ≤∑S∈Q

[MS(f )−mS(f )]vol(S) ≤ U(f , P)− L(f , P) < ε/n.

Tak więc ∑S∈Q vol(S) < ε. Rodzina SS∈Q pokrywa te punkty ze zbioru Dn , które leżą wewnętrzu którejś z kostek S ∈ P. Pozostałe punktu zbioru Dn należą do ścian kostek z podziałuP. Oczywiście ściany te (traktowane jako zdegenerowane kostki N-wymiarowe) mają objętość0. W konsekwencji pokryliśmy zbiór Dn (skończoną) rodziną kostek domkniętych o łącznejobjętości mniejszej niż ε. To kończy dowód.

3.2 Miara Jordana i ogólna całka

W dotychczasowych rozważaniach zajmowaliśmy się całkowalnością funkcji zdefiniowanychna kostkach. Za chwilę zajmiemy się całkowaniem funkcji o ogólniejszych dziedzinach. Naj-pierw jednak zbadamy dokładniej klasę zbiorów, na których będzie można zdefiniować całkęRiemanna funkcji ograniczonych.Niech A ⊂ RN będzie zbiorem ograniczonym. Funkcją charakterystyczną tego zbiorunazywamy funkcję χA : RN → R daną wzoremχA(x) = 0 gdy x 6∈ A1 gdy x ∈ A.

Ponieważ A jest zbiorem ograniczonym, to istnieje kostka (domknięta) taka, że A ⊂ C. NiechA ⊂ RN będzie zbiorem ograniczonym i niech C będzie kostką taką, że A ⊂ C.

MIERZALNOŚĆ W SENSIE JORDANA Powiadamy, że zbiór ograniczony A ⊂ RN jest mie-rzalny w sensie Jordana (piszemy A ∈ J lub A ∈ JN dla podkreślenia, że chodzi o podzbiory

5Teoretycznie może się zdarzyć, że kostka S ∈ P(1) ∩ P(2).

Page 91: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.2. MIARA JORDANA I OGÓLNA CAŁKA 87

przestrzeni RN (6)), jeśli jest całkowalna na kostce C takiej, że A ⊂ C jego funkcja charakte-rystyczna χA : C → R, a w zasadzie jej obcięcie do kostki C.UWAGA: Powyższa definicja jest poprawna, tzn. nie zależy od wyboru kostki C. Istotnie:jeśli C′ jest inną kostką taką, że A ⊂ C′, to A ⊂ C ∩ C′. Całkowalność na C implikujecałkowalność na C ∩ C′ (Czytelnik zechce to sprawdzić, stosując rozumowanie podobne doużytego w dowodzie twierdzenia 3.1.5 (iii)). To z kolei (zważywszy, że χA przyjmuje wartość 0poza C ∩ C′) implikuje całkowalność na C′.PRZYKŁAD: Najprostszymi przykładami zbiorów mierzalnych w sensie Jordana są: zbiór pustyi dowolna kostka domknięta. Wynika to wprost z definicji. Inne przykłady pojawią się później.UWAGA: Warto bardzo starannie przeanalizować definicję mierzalności w sensie Jordana.Załóżmy, że zbiór A jest ograniczony, C jest taką kostką domkniętą, że A ⊂ C i niech P będziedowolnym podziałem kostki C.Dla dowolnej kostki S ∈ P możliwe są trzy przypadki:(1) S ∩ A = ∅;(2) S ∩ A 6= ∅ i S ∩ (RN \ A) 6= ∅;(3) S ⊂ A.Jeśli S spełnia pierwszy warunek, to mS(χA, P) = MS(χA, P) = 0; jeśli S spełnia drugiwarunek, to mS(χA, P) = 0 i MS(χA, P) = 1; zaś, jeśli S spełnia trzeci warunek, to mS(χA, P) =MS(χA, P) = 1.Symbolem P(i) oznaczymy rodzinę tych kostek S ∈ P, które spełniają warunek (i), i =1, 2, 3; oczywiście rodziny te są rozłączne i

U(χA, P) = ∑S∈P(2)

vol(S) + ∑S∈P(3)

vol(S) = ∑S∈P(2)∪P(3)

vol(S)(7), L(χA, P) = ∑S∈P(3)

vol(S)oraz

U(χA, P)− L(χA, P) = ∑S∈P(2)

vol(S).Ponadto ∫

CχA(x)dx = sup

P∈P(C)L(χA, P) = supP∈P(C)

∑S∈P(3)

vol(S),∫CχA(x)dx = inf

P∈P(C)U(χA, P) = infP∈P(C)

∑S∈P(2)∪P(3)

vol(S).MIARA ZEWNĘTRZNA I WEWNĘTRZNA JORDANA Jeśli A ⊂ RN jest zbiorem ograniczonym,to liczbę

m∗(A) := ∫CχA(x)dx

nazywamy wewnętrzną miarą Jordana zbioru A, zaś liczbęm∗(A) := ∫

CχA(x)dx

6Przyjęło się, że rodziny zbiorów mierzalnych (w sensie Jordana, Lebesgue’a i innych), oznacza się literamigotyckimi J,L, itp.7Do rodziny P(2) ∪ P(3) należą kostki S ∈ P, które przecinają się za zbiorem A.

Page 92: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

88 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHnazywamy zewnętrzną miarą Jordana zbioru A, gdzie C jest dowolną kostką domkniętą za-wierającą zbiór A.UWAGA: (1)Definicje te są ponownie poprawne, gdyż nie zależą od wyboru kostki domknię-tej C zawierającej zbiór C. Istotnie, jeśli C′ jest inną taką kostką, to C′′ := C ∩C′ jest równieżkostką domkniętą zawierającą A i, oczywiście C′′ ⊂ C, C′′ ⊂ C′. Stąd wynika, że chcąc udo-wodnić niezależność miar wewnętrznej i zewnętrznej zbioru A od wyboru kostki, wystarczyograniczyć się do przypadku, w którym C′ ⊂ C.Dla dowolnego podziału P′ ∈ P(C′) bez trudu znajdziemy podział P ∈ P(C) tak, by P′ ⊂ P(wystarczy dokonać, odpowiednio rozumianego, „podziału” zbioru C \ C′). Jeśli S ∈ P′(3) (tzn.S ⊂ A), to S ∈ P(3). Na odwrót, jeśli S ∈ P(3), to S ∈ P′(3). Innymi słowy, P(3) = P′(3). Stąd

L(χA, P′) = ∑S∈P′(3)

vol(S) = ∑S∈P(3)

vol(S) = L(χA, P).Zatem, po przejściu do kresów, otrzymamy, że∫

C′χA(x)dx ≤ ∫

CχA(x)dx.

Z drugiej strony, dla dowolnego podziału P ∈ P(C), rozważmy takie jego zagęszczenie Q, którazawiera wszystkie wierzchołki kostki C′. Jest jasne, że Q′ := C′ ∩Q jest podziałem kostki C′ i,analogicznie jak wyżej pokazujemy, że Q′(3) = Q(3), tzn.L(χA, Q′) = L(χA, Q).

Wobec tego, po przejściu do kresów górnych,∫CχA(x)dx ≤ ∫

C′χA(x)dx.

W konsekwencji ∫CχA(x)dx = ∫

C′χA(x)dx.

Analogicznie można udowodnić, że∫CχA(x)dx = ∫

C′χA(x)dx.

To kończy dowód niezależności miar wewnętrznej i zewnętrznej od wyboru kostki zawierającejzbiór A.(2) Z uwagi na powyższe rozważania, przyjęta terminologia jest całkowicie jasna. Miarąwewnętrzną zbioru A jest kres górny łącznej objętości „małych” kostek wyznaczonych przezpodziały P dowolnie wybranej kostki C zawierającej zbiór A, które są zawarte w zbiorzeA. Miarą zewnętrzną jest kres dolny łącznej objętości „małych” kostek wyznaczonych przezpodziały P dowolnie wybranej kostki C zawierającej zbiór A, które przecinają się ze zbioremA. (3) Zauważmy jeszcze, że(3.2.1) m∗(A) ≤ m∗(A)dla dowolnego zbioru ograniczonego A ⊂ RN .

Page 93: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.2. MIARA JORDANA I OGÓLNA CAŁKA 89

w świetle przeprowadzonego rozumowania, otrzymujemy następującą charakteryzację.3.2.1 TWIERDZENIE: Zbiór ograniczony A ⊂ RN jest mierzalny w sensie Jordana (A ∈ JN )wtedy i tylko wtedy, gdy

m∗(A) = m∗(A).DOWÓD: Zbiór A jest mierzalny wtedy i tylko wtedy, gdy, dla dowolnej kostki domkniętej

C zawierającej A, χA ∈ R(C) wtedy i tylko wtedy, gdym∗(A) = ∫

CχA(x)dx = ∫

CχA(x)dx = m∗(A).

3.2.2 LEMAT: Niech A będzie zbiorem ograniczonym. Jeśli A jest zbiorem nieistotnym, tom∗(A) = 0. Jeśli m∗(A) = 0, to A jest zbiorem nieistotnym.DOWÓD: Załóżmy, że A jest zbiorem nieistotnym i wybierzmy domkniętą kostkę C ⊃ A iniech P będzie jej dowolnym podziałem. Jeśli S ∈ P(3), tzn. S ∈ P i S ⊂ A, to S jest zbioremnieistotnym. Wtedy vol(S) = 0. W taki razie m∗(A) = supP∈P(C)∑S∈P(3) vol(S) = 0.Załóżmy teraz, że m∗(A) = 0 i ponownie rozważmy kostkę C ⊃ A. Z określenia miaryzewnętrznej wynika, że dla dowolnego ε > 0 istnieje taki podział P ∈ P(C), że U(χA, P) < ε.To oznacza, że rodzina P(2) ∪ P(3) kostek ma łączna objętość mniejszą niż ε i, oczywiście,pokrywa zbiór A. Twierdzenia odwrotne do podanych powyżej nie zachodzą. Zobaczymy to za chwilę.

MIARA JORDANA Przypuśćmy, że zbiór ograniczony A ⊂ RN jest mierzalny w sensieJordana. Wspólną wartość

m(A) := m∗(A) = m∗(A)nazywamy (N-wymiarową) miarą Jordana zbioru A. Niekiedy, aby podkreślić, że chodzi o N-wymiarową miarę Jordana, będziemy pisać mN zamiast m.Tak więc m : JN → R jest funkcją, która każdemu zbiorowi mierzalnemu w sensie JordanaA ∈ JN przyporządkowuje jego N-wymiarową miarę Jordana m(A).Z definicji miar wewnętrznej i zewnętrznej wynika, że(3.2.2) m(A) = ∫

CχA(x)dx

gdzie C jest dowolna kostką domkniętą zawierającą zbiór A.PRZYKŁAD: Jak wiemy ∅, C ∈ J, gdzie C jest domkniętą kostką. Z definicji wynika natychmiast,że m(∅) = 0 i m(C) = vol(C). Wobec tego każda ze ścian S kostki C, będąc kostką domkniętą,jest zbiorem mierzalnym o mierze 0 i m(S) = vol(S) = 0.3.2.3 WNIOSEK: Jeśli A jest nieistotnym zbiorem mierzalnym, to m(A) = 0. I na odwrót: jeślizbiór A jest zbiorem mierzalnym i m(A) = 0, to A jest zbiorem nieistotnym.DOWÓD: Z lematu 3.2.2, m∗(A) = 0. Mierzalność implikuje, że m(A) = m∗(A) = 0. Podobniejeżeli A jest mierzalny i m(A) = 0, to m∗(A) = 0 i, ponownie z lematu 3.2.2, A jest nieistotny. Podamy teraz nieco inną charakteryzację mierzalności w sensie Jordana.3.2.4 TWIERDZENIE: Zbiór ograniczony A ⊂ RN jest mierzalny w sensie Jordana wtedy i tylkowtedy, gdy jego brzeg ∂A jest zbiorem nieistotnym.

Page 94: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

90 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHDOWÓD: Niech C będzie taką kostką, że A ⊂ C. Funkcja charakterystyczna χA jest całkowalna(to znaczy zbiór A jest mierzalny) wtedy i tylko wtedy, gdy zbiór D jej punktów nieciągłości jestnieistotny. Zauważmy jednak, że w tym przypadku D = ∂A, tzn. x jest punktem nieciągłościfunkcji χA wtedy i tylko wtedy, gdy x ∈ ∂A. Istotnie, przypomnijmy, że ∂A := clA\intA. Tak więcx ∈ ∂A wtedy i tylko wtedy, gdy dla dowolnego δ > 0, B(x, δ)∩A 6= ∅ oraz B(x, δ)∩ (RN \A) 6= ∅.Implikuje to, że o(χA, x) = 1; stąd χA nie jest ciągła w x. Z drugiej strony, jeżeli funkcjacharakterystyczna χA nie jest ciągła w x, to istnieje ε > 0 o tej własności, że dla każdegoδ > 0 istnieje taki punkt y ∈ B(x, δ), że |χA(x)− χA(y)| ≥ ε. Warunek ten może mieć miejscetylko gdy χA(x) = 1 oraz χA(y) = 0 (lub na odwrót). W każdym razie B(x, δ) ∩ A 6= ∅ orazB(x, δ) ∩ (RN \ A) 6= ∅, co dowodzi, że x ∈ ∂A.

WŁASNOŚCI MIARY JORDANA Zbadamy teraz pokrótce podstawowe własności zbiorów mie-rzalnych w sensie Jordana i miary Jordana. Zaczniemy od kilku ogólnych stwierdzeń.3.2.5 TWIERDZENIE: Niech A,B ⊂ RN będą zbiorami ograniczonymi. Wówczas:(1) Jeżeli A ∈ J, to m(A) ≥ 0.(2) Jeśli A,B ∈ J, to A ∪ B,A ∩ B,A \ B ∈ J.(3) Miara Jordana jest: addytywna, tzn., jeżeli A,B ∈ J i A ∩ B = ∅, to m(A ∪ B) =m(A) + m(B); subaddytywna, tzn., jeśli A,B ∈ J, to m(A ∪ B) ≤ m(A) + m(B); monotoniczna,tzn., gdy A,B ∈ J i A ⊂ B, to m(A) ≤ m(B) (ponadto m(B \ A) = m(B)−m(A)).DOWÓD: (1) Skoro A ∈ J, to funkcja χA ∈ R(C), gdzie C jest kostką domkniętą zawierającą A.Oczywiście χA ≥ 0. Zatem

m(A) = ∫CχA(x)dx ≥ 0.

Funkcja charakterystyczna zbioru pustego jest stale równa zero, więc m(∅) = 0.(2), (3) Zauważmy, żeχA∪B = maxχA, χB, χA∩B = minχA, χB.

Stąd, przy założeniu mierzalności zbiorów A i B (tj. całkowalności funkcji charakterystycznychχA i χB na kostce C, która zawiera oba zbiory A, B), wynika całkowalność na C obu funkcjiχA∪B i χA∩B , a więc i mierzalność zbiorów A ∪ B i A ∩ B. Ponadto

χA + χB = maxχA, χB+ minχA, χB = χA∪B + χA∩B.

Zatemm(A) +m(B) = ∫

CχA(x)dx + ∫

CχB(x)dx = ∫

C(χA(x) + χB(x))dx =

= ∫CχA∪B(x)dx + ∫

CχA∩B(x)dx = m(A ∪ B) +m(A ∩ B).

Zatemm(A ∪ B) = m(A) +m(B)−m(A ∩ B) ≤ m(A) +m(B)oraz, gdy A ∩ B = ∅, to

m(A ∪ B) = m(A) +m(B).Niech ponownie C będzie kostką domkniętą, A,B ⊂ C. Wówczas, dla dowolnego x ∈ C ,χC\A(x) = 1 − χA(x). Wobec całkowalności funkcji stałej na C wnosimy, że χC\A jest funkcjacałkowalną na C; tzn. zbiór C \A jest mierzalny. Zatem także B \A = B ∩ (C \A) jest zbiorem

Page 95: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.2. MIARA JORDANA I OGÓLNA CAŁKA 91

mierzalnym.Monotoniczność jest natychmiastową konsekwencją tego, że χA ≤ χB . Ponadto:m(B) = m((B \ A) ∪ A) = m(B \ A) +m(A).

Własność (2) udowodnionego twierdzenia oznacza, że rodzina J jest tzw. pierścieniem zbio-rów. Dokładniej mówiąc dowolną rodzinę A zbiorów (niekoniecznie podzbiorów przestrzeniRN ) nazywamy pierścieniem zbiorów, jeżeli dla dowolnych A,B ∈ A, A ∩ B,A ∪ B,A \ B ∈ A.Zauważmy, że jeśli rodzina A jest pierścieniem i A1, ..., An ⊂ A, to ⋃n

i=1 Ai ∈ A. Wszczególności więc zachodzi:3.2.6 WNIOSEK: Suma skończona zbiorów mierzalnych w sensie Jordana jest zbiorem mie-rzalnym. Co więcej, jeśli Aini=1 jest rodziną zbiorów mierzalnych, to

m( n⋃i=1Ai

)≤

n∑i=1 m(Ai),

a gdy rodzina ta jest parami rozłączna (tzn. Ai ∩Aj = ∅ dla dowolnych i, j = 1, ..., n, i 6= j), to

m( n⋃i=1Ai

) = n∑i=1 m(Ai).

Oba wzory można łatwo wykazać posługując się indukcją matematyczną względem n.PRZYKŁAD: (1) Dowolna kostka U jest mierzalna w sensie Jordana i m(U) = vol(U). Istotnie,brzeg ∂U jest (skończoną) sumą mnogościową wszystkich ścian domknięcia C kostki U , zaśkażda z tych ścian jest zbiorem mierzalnym nieistotnym; zatem m(∂U) = 0.(2) Dowolny nieistotny zbiór zwarty (czyli domknięty i ograniczony) A jest mierzalny wsensie Jordana. W szczególności każdy zbiór skończony jest mierzalny. Istotnie, skoro zbiór Ajest nieistotny, to ∂A ⊂ A jest też nieistotny; stąd A jest mierzalny i m(A) = 0.Niestety rodzina J ma też kilka niedobrych własności.

3.2.7 UWAGA: Przede wszystkim należy zwrócić uwagę, że jeśli zbiór jest nieistotny, to nie musibyć zbiorem mierzalnym (nawet jeśli jest ograniczony). Zgodnie z lematem 3.2.2, jego miarawewnętrzna m∗(A) = 0, lecz może się zdarzyć, że m∗(A) > 0. Dla przykładu rozważmy zbiórA = Q∩ [0, 1]. Jako zbiór przeliczalny, ma on miarę 0, lecz m∗(A) = ∫ 10 χA(x)dx = 1. Zauważmyjeszcze, że brzegiem zbioru A jest cały odcinek [0, 1], który nie jest zbiorem nieistotnym.Jest to bardzo niepokojąca okoliczność. W konsekwencji nie jest zbyt dogodne mówićo zbiorach nieistotnych jako o zbiorach miary 0: mogłoby to bowiem oznaczać, że zbiorynieistotne „mają miarę równą 0”.Niestety również nie wszystkie zbiory otwarte i ograniczone są mierzalne. Dla przykładu:ustawmy liczby wymierne z przedziału (0, 1) w ciąg (qi)∞i=1 oraz, dla dowolnego i ∈ N rozważmyodcinek Ui := (qi − δi, qi + δi) ⊂ (0, 1), gdzie 0 < δi < 12i+3 ; wtedy vol(Ui) < 12i+2 . ZbiórA := ⋃∞

i=1Ui ⊂ (0, 1) jest otwarty i ∂A = [0, 1] \ A. Przypuśćmy, że zbiór A jest mierzalny.Wtedy ∂A – jako brzeg zbioru mierzalnego – byłby zbiorem nieistotnym. A zatem istniałobyjego pokrycie odcinkami otwartymi Vi∞i=1 o łącznej długości ∑∞i=1 vol(Vi) < 14 . Jest jasne, żesuma rodzin Ui∞i=1 ∪ Vi∞i=1 pokrywa odcinek [0, 1]. Zwartość odcinka implikuje, że istniejązbiory Ui1 , ..., Uin i Vi1 , ..., Vim , które w sumie pokrywają odcinek [0, 1]. Każdy ze zbiorów Ui ,

Page 96: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

92 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHVi jest mierzalny, zatem również B := Ui1 ∪ ... ∪ Uin ∪ Vi1 ∪ ... ∪ Vim jest mierzalny i, na mocysubaddytywności miary

m(B) ≤ n∑k=1m(Uik ) + m∑

k=1(Vik ) = n∑k=1 vol(Uik ) + m∑

k=1 vol(Vik ) < 14 + ∞∑i=1

122+i = 12 .Zatem, z monotoniczności miary m(A) ≤ m(B) < 12 .Z drugiej strony mierzalność A i odcinka [0, 1] implikuje, że ∂A jest mierzalny. Stądm(∂A) = 0. Zatem 1 = m([0, 1]) = m(A) + m(∂A) = m(A) < 12 , co jest oczywiście sprzecz-ne. W konsekwencji również nie każdy zwarty (domknięty i ograniczony) zbiór jest mierzalny(przykładem jest choćby brzeg ∂A zbioru skonstruowanego wyżej). W dalszym ciągu potrzebować będziemy następującej własności zbiorów mierzalnych.3.2.8 LEMAT: Mierzalność i miara Jordana są niezmiennicze ze względu na translacje. Toznaczy, jeśli A ⊂ RN jest zbiorem mierzalnym oraz z ∈ RN , to zbiór B := a+ z | a ∈ A jestmierzalny i m(B) = m(A).DOWÓD: Rozważmy kostkę domkniętą C zawierającą A. Łatwo zobaczyć, że D := C + z jestkostką zawierającą B. Niech Q będzie dowolnym podziałem kostki D. Jest jasne, że P := Q− zjest podziałem kostki C. Ponadto, jeśli T ∈ Q, to S = T − z ∈ P, vol(S) = vol(T) oraz, jeśliT ∈ Q(3) (przypomnijmy: oznacza to, że T ⊂ B), to S = T − z ⊂ A, czyli S ∈ P(3) . W takim razie

L(χB, Q) = ∑T∈Q(3)

vol(T) = ∑S∈P(3)

vol(S) = L(χA, P).Ponieważ pomiędzy podziałami kostek C i D ma miejsce wzajemnie jednoznaczna odpowied-niość, to

m∗(B) = supQ∈P(D)L(χB, Q) = sup

P∈P(C)L(χA, P) = m∗(A).Analogicznie pokazujemy, że

m∗(B) = m∗(A).Stąd m∗(B) = m∗(B) = m(A). Dowodzi to, że zbiór B jest mierzalny i m(B) = m(A).

3.2.A Całka na zbiorach mierzalnych w sensie Jordana

Rozważmy teraz funkcję ograniczoną f : A → R określoną na zbiorze mierzalnym A ⊂ RN .Niech C będzie niezdegenerowaną kostką domkniętą zawierającą A.3.2.9 DEFINICJA: Mówimy, że f jest całkowalna na A (i piszemy f ∈ R(A)), jeśli funkcja fA :C → R dana wzorem

fA(x) := 0 gdy x 6∈ Af (x) gdy x ∈ A.jest całkowalna (na C). Jeśli f ∈ R(A), to∫

Af (x)dx := ∫

CfA(x)dx.

Page 97: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.2. MIARA JORDANA I OGÓLNA CAŁKA 93

Definicja ta jest poprawna, tzn. nie zależy od wyboru C (prosty dowód pozostawiamy Czy-telnikowi).3.2.10 UWAGA: Z podanej definicji i wzoru (3.2.2) wynika następująca (najbardziej elementarna)interpretacja geometryczna miary: jeśli zbiór A ⊂ RN jest mierzalny w sensie Jordana, to

m(A) = ∫Adx,

tzn. miara zbioru A ⊂ RN mierzalnego w sensie Jordana jest równa całce Riemanna z funkcjif : A→ R tożsamościowo równej 1.Podobnie jak wyżej mamy następujący warunek konieczny i dostateczny całkowalności.3.2.11 TWIERDZENIE: Jeżeli zbiór A ⊂ RN jest mierzalny w sensie Jordana, to funkcja ogra-niczona f : A → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy, gdy zbiór jejnieciągłości jest zbiorem nieistotnym.DOWÓD: Załóżmy, że f ∈ R(A). Oznacza to, że całkowalna na C, gdzie C jest kostką domkniętązawierającą A, jest funkcja fA. W taki razie zbiór punktów nieciągłości funkcji fA jest zbioremnieistotnym. Jeśli x ∈ A jest punktem nieciągłości f , to również fA nie jest ciągła w x. Aby todostrzec, zauważmy, że istnieje ε > 0 takie, że dla dowolnego δ > 0 w zbiorze A znajdziemypunkt y , ‖y − x‖ < δ, dla którego |f (y) − f (x)| ≥ ε. Jest jasne, że fA(y) = f (y) i fA(x) = f (x);tak więc także fA(y) − fA(x)| ≥ ε.. Innymi słowy, zbiór punktów nieciągłości f zawiera się wzbiorze nieciągłości fA; stąd musi to być zbiór nieistotny.Na odwrót, przypuśćmy, że zbiór punktów nieciągłości funkcji f jest nieistotny i rozważmydowolny punkt x, w którym funkcja fA nie jest ciągła. Oczywiście x ∈ A (bo w przeciwnymrazie fA ≡ 0 w otoczeniu x, czyli fA jest ciągła w x). Jeśli x 6∈ ∂A, to x ∈ intA i w pewnym jegootoczeniu fA = f . Zatem w x nieciągła jest funkcja f . Widzimy więc, że x ∈ ∂A lub x należydo zbioru punktów nieciągłości f . Zbiór ∂A – jako brzeg zbioru mierzalnego – jest nieistotny.Widać więc, że zbiór punktów nieciągłości funkcji fA zawarty jest w sumie dwóch zbiorównieistotnych i dlatego sam musi być nieistotny. Funkcjom całkowalnym na zbiorze mierzalnym przysługują własności podobne do wy-mienionych w poprzednim podrozdziale.3.2.12 TWIERDZENIE: Załóżmy, że A ⊂ RN jest zbiorem mierzalnym w sensie Jordana orazf , g : A→ R funkcjami ograniczonymi.(i) Jeżeli f , g ∈ R(A), to f ± g ∈ R(A) oraz∫

A(f ± g)(x)dx = ∫

Af (x)dx ± ∫

Ag(x)dx.

(ii) Jeśli f ∈ R(A), λ ∈ R, to λf ∈ R(A) oraz∫Aλf (x)dx = λ

∫Af (x)dx.

(iii) Jeśli f , g ∈ R(A) oraz f ≤ g , to∫A f (x)dx ≤ ∫A g(x)dx. W szczególności: jeśli α ≤

f (x) ≤ β dla dowolnego x ∈ A, to αm(A) ≤ ∫A f (x)dx ≤ βm(A). Ponadto, gdy m(A) = 0, to∫A f (x)dx = 0.(iv) Załóżmy, że A = A1∪A2, gdzie A1, A2 są zbiorami mierzalnymi rozłącznymi. Wówczasf ∈ R(A) wtedy i tylko wtedy, gdy f1 := f |A1 ∈ R(A1) oraz f2 := f |A2 ∈ R(A2); ponadto∫

Af = ∫

A1 f1(x) + ∫

A2 f2(x)dx.

Page 98: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

94 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHDOWÓD: Dowody trzech pierwszych części wynikają natychmiast z definicji całki i z odnośnychwłasności całki funkcji określonych na kostce (Czytelnik zechce te dowody przeprowadzić).Podamy dowód ostatniej własności. Niech mianowicie C będzie taką kostką, że A ⊂ C. Roz-łączność zbiorów A1, A2 implikuje, że fA = f1

A1 + f2A2 . Przy założeniu, że f i ∈ R(Ai), tzn. że

f iAi ∈ R(C), i = 1, 2, widać – na mocy części (i) – że fA ∈ R(C). Na odwrót załóżmy, że f ∈ R(A).Niech x ∈ A1 będzie punktem nieciągłości funkcji f1. Łatwo zobaczyć, że musi to być równieżpunkt nieciągłości funkcji f . A zatem zbiór punktów nieciągłości f1 zawarty jest w zbiorzepunktów nieciągłości f ; stąd wynika, że jest to zbiór nieistotny (bo taki jest zbiór punktównieciągłości f ) i, z twierdzenia 3.2.11, f1 jest całkowalna na A1. Analogicznie dowodzimy, żef2 ∈ R(A2).W takim razie∫

Af (x)dx = ∫

CfA(x)dx = ∫

C(f1A1 (x) + f2

A2 (x))dx = ∫A1 f

1(x)dx + ∫A2 f

2(x)dx.

3.2.13 TWIERDZENIE: Przypuśćmy, że φ : R→ R jest funkcją ciągłą. Jeśli A ⊂ RN jest zbioremmierzalnym, f : A→ R funkcja całkowalna, to φ f jest funkcją całkowalną.DOWÓD: Jak zwykle rozważmy kostkę C ⊃ A. Całkowalność (poprawnie określonej) funkcjiφ f jest równoważna całkowalności na kostce C funkcji g , która przyjmuje wartość g(x) = 0dla x ∈ C \ A oraz g(x) = φ f (x) dla x ∈ A. Rozważmy funkcję h = φ fA. PonieważfA ∈ R(C), to także h ∈ R(C). Zauważmy, że dla x ∈ A, h(x) = φ f (x) = g(x), zaś dla x ∈ C \A,h(x) = λ := φ(0). Mierzalność zbioru A implikuje, że funkcja k := λ(1 − χA) jest całkowalna.Zatem g = h − k ∈ R(C).

3.2.14 WNIOSEK: Niech A ⊂ RN będzie zbiorem mierzalnym. Jeżeli f ∈ R(A), to |f | ∈ R(A)oraz ∣∣∣∣∫

Af∣∣∣∣ ≤ ∫

A|f |.

(ii) Jeśli f , g ∈ R(A), to fg,maxf , g,minf , g ∈ R(A).Dowód tych faktów przebiega analogicznie jak w przypadku funkcji określonych na kostce.3.3 Metody obliczania całek

3.3.A Całka iterowana na kostce

Omówimy teraz ważne twierdzenie, które umożliwia efektywne obliczanie całek.Niech X ⊂ Rn oraz Y ⊂ Rm będą niezdegenerowanymi domkniętymi kostkami (odpo-wiednio n i m-wymiarowymi) i niech C := X × Y . Wtedy C ⊂ RN , gdzie N = n + m, jestniezdegenerowaną kostką domkniętą. Dowolny punkt z ∈ C ma przedstawienie z = (x, y),gdzie x ∈ X oraz y ∈ Y .Jeśli f : C → R, to dla dowolnego, lecz ustalonego x ∈ X zdefiniowana jest funkcjafx : Y → R wzorem fx(y) := f (x, y), y ∈ Y ; podobnie, dla dowolnego, lecz ustalonego y ∈ Yzdefiniowana jest funkcja fy : X → R wzorem fy (x) := f (x, y), x ∈ X. Oczywiście funkcjefx , fy są ograniczone (odp. na Y i X), o ile ograniczona jest funkcja f . A więc, przy założeniuograniczoności f , określone są funkcje

X 3 x 7Ï u(x) := ∫Yfx(y)dy oraz X 3 x 7Ï l(x) := ∫

Yfx(y)dy.

Page 99: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 95

Analogicznie zdefiniowane są funkcjeY 3 y 7Ï u1(y) := ∫

Xfy (x)dx, Y 3 y 7Ï l1(y) := ∫

Xfy (x)dx.

3.3.1 TWIERDZENIE (Fubiniego (8)): Załóżmy, że f : C → R jest funkcją całkowalną. Wówczaspowyżej zdefiniowane funkcje u, l są całkowalne na X oraz zachodzą wzory:∫

Cf (z)dz = ∫

Xu(x)dx = ∫

X

(∫Yfx(y)dy)dx = ∫

X

(∫Yf (x, y)dy)dx,

∫Cf (z)dz = ∫

Xl(x)dx = ∫

X

(∫Yfx(y)dy)dx = ∫

X

(∫Yf (x, y)dy)dx.

Podobnie, całkowalne na Y są funkcje u1 i l1 i mają miejsce wzory:∫Cf (z)dz = ∫

Yu1(y)dy = ∫

Y

(∫Xfy (x)dx)dy = ∫

Y

(∫Xf (x, y)dx)dy,

∫Cf (z)dz = ∫

Yl1(y)dy = ∫

Y

(∫Xfy (x)dx)dy = ∫

Y

(∫Xf (x, y)dx)dy.

UWAGA: Zanim przystąpimy do dowodu zauważmy, że:(1) Twierdzenie nie orzeka o całkowalności na kostce X funkcji fy (gdzie y ∈ Y ), anicałkowalności na Y funkcji fx (gdzie x ∈ X). Wprawdzie wiadomo, że f jest funkcja całkowalną,a więc jej zbiór nieciągłości funkcji f jest zbiorem nieistotnym, lecz nietrudno sobie wyobrazić,że dla ustalonego x ∈ X, nieciągłości funkcji fx (lub fy przy ustalonym y ∈ Y ) położone wkostce Y (odp. w X) nie będą tworzyć zbioru nieistotnego w Rm (odp. w Rn) – Czytelnikzechce przedstawić odpowiedni przykład. Stąd w powyższych wzorach mamy do czynienia zodpowiednio całkami górnymi i dolnymi, które są zawsze zdefiniowane, o ile f jest funkcjaograniczoną.(2) Jeżeli jednak f jest funkcją ciągłą (a w praktyce najczęściej mamy do czynienia właśniez taką sytuacją), to również ciągłe (a wiec i całkowalne) są funkcje fx i fy (dla dowolnych x ∈ Xoraz y ∈ Y ). Wtedyu(x) = ∫

Yfx(y)dy = ∫

Yfx(y)dy = ∫

Yfx(y)dy = l(x), u1(y) = ∫

Xfy (x)dx = l1(y)

i są to – jak za chwilę udowodnimy (patrz poniżej lemat 3.3.3) – funkcje ciągłe; zatem są onecałkowalne i ∫Cf (z)dz = ∫

Xu(x)dx = ∫

X

(∫Yfx(y)dy)dx,∫

Cf (z)dz = ∫

Yu1(y)dy = ∫

Y

(∫Xfy (x)dx)dy.

Oczywiście powyższe wzory (których prawe strony nazywa się całkami iterowanymi) za-chodzą również, gdy dla dowolnych x ∈ X (lub y ∈ Y ) całkowalne są funkcje fx (lub fy ).3.3.2 UWAGA: Wzory te należy rozumieć następująco: w celu obliczenia całki

∫C f (z), gdzie f

jest funkcją ciągłą, trzeba:8Fubini

Page 100: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

96 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCH(1) Ustalić zmienną x i obliczyć całkę l(x) = u(x) = ∫

Y f (x, y)dy . Otrzymany wynik jestfunkcją zmiennej x.

(2) Otrzymaną funkcję całkowalną u = l należy scałkować na kostce X.

3.3.3 LEMAT: Jeśli funkcja f : C → R jest ciągła, to funkcja u : X → R jest również ciągła.Podobnie ciągła jest funkcja u1 : Y → R.DOWÓD: Niech ε > 0. Jednostajna ciągłość f na (zwartej) kostce C oznacza, że istnieje takaδ > 0, że |f (z)− f (z′)| < εvol(Y ) o ile z, z′ ∈ C i ‖z − z′‖ < δ.Niech x, x′ ∈ X i ‖x−x′‖ < δ. Wówczas dla dowolnego y ∈ Y , ‖z−z′‖ < δ, gdzie z = (x, y)i z′ = (x′, y). Zatem

|u(x)− u(x′)| = ∣∣∣∣∫Yf (x, y)dy − ∫

Yf (x′, y)dy∣∣∣∣ ≤

≤∫Y|f (x, y)− f (x′, y)|dy ≤ εvol(Y )vol(Y ) = ε.

W takim razie funkcja u jest jednostajnie ciągła. Dowód dla u1 przebiega analogicznie.

Nieobowiązkowy DOWÓD (twierdzenia 3.3.1): Przeprowadzimy dowód tylko dwóch pierwszychwzorów (pozostałe dowodzi się analogicznie). Dowolny podział P ∈ P(C) wyznacza podziałyPX ∈ P(X), PY ∈ P(Y ) takie, że każda kostka S ∈ P jest iloczynem kartezjańskim S = SX × SYpewnych kostek SX ∈ PX , SY ∈ PY . Wobec tego

L(f , P) =∑S∈P

mS(f , P)vol(S) = ∑SX∈PX , SY∈PY

mSX×SY (f , P)vol(SX × SY ) == ∑

SX∈PX

∑SY∈PY

mSX×SY (f , P)vol(SY ) vol(SX).Jeśli x ∈ SX , to oczywiście mSX×SY (f , P) ≤ mSY (fx , PY ). Stąd dla x ∈ SX ,∑

SY∈PY

mSX×SY (f , P)vol(SY ) ≤ ∑SY∈PY

mSY (fx , PY )vol(SY ) = L(fx , PY ) ≤ ∫Yfx(y)dy = l(x).

Z dowolności x ∈ SX otrzymujemy, że∑SY∈PY

mSX×SY (f , P)vol(SY ) ≤ mSX (l, PX)oraz

L(f , P) ≤ ∑SX∈PX

mSX (l, PX)vol(SX) = L(l, PX).Rozumując analogicznie otrzymamy, że U(u, PX) ≤ U(f , P).W takim razie, biorąc pod uwagę, że l(x) ≤ u(x) dla x ∈ X,

L(f , P) ≤ L(l, PX) ≤ U(l, PX) ≤ U(u, PX) ≤ U(f , P),L(f , P) ≤ L(l, PX) ≤ L(u, PX) ≤ U(u, PX) ≤ U(f , P).Skoro funkcja f jest całkowalna, to dla dowolnego ε > 0 istnieje taki podział P ∈ P(C), że

U(f , P)− L(f , P) < ε. StądU(l, PX)− L(l, PX) < ε oraz U(u, PX)− L(u, PX) < ε.

Page 101: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 97

Dowodzi to, że u, l ∈ R(X). Dodatkowo liczby ∫C f (z)dz, ∫X u(x)dx i ∫X l(x)dx leżą pomiędzyL(f , P) i U(f , P). Zatem∣∣∣∣∫

Cf (z)dz − ∫

Xu(x)dx∣∣∣∣ < ε,

∣∣∣∣∫Cf (z)dz − ∫

Xl(x)dx∣∣∣∣ < ε,

co – wobec dowolności ε – dowodzi prawdziwości wzorów z twierdzenia Fubiniego.

Rozważymy teraz sytuację szczególną. Niech C = [a1, b1]× ...× [aN , bN ] będzie domkniętąi niezdegenerowaną kostką. Dla dowolnego k = 1, ..., N , niechCk := [a1, b1]× ...× [ak−1, bk−1]× [ak+1, bk+1]× ...× [aN , bN ].

Oczywiście Ck jest niezdegenerowaną (N − 1)-wymiarową kostką domkniętą. Ewentualnie do-konując odpowiedniego przenumerowania można napisać, żeC = [ak, bk]× Ck

i, podobnie jak wyżej – zamiast z ∈ C – napisać z = (x, y), gdzie x ∈ [ak, bk] i y ∈ Ck .Przy założeniu, że f : C → R jest funkcją ciągłą, mamy wówczas, że∫

Cf (z)dz = ∫ bk

ak

(∫Ck

f (x, y)dy)dx = ∫Ck

(∫ bk

akf (x, y)dx)dy.

Rozumując indukcyjnie otrzymujemy następujący wniosek.3.3.4 WNIOSEK: Jeżeli funkcja f : C → R jest ciągła, to∫

Cf (z)dz = ∫ bN

aN

(∫ bN−1aN−1

(· · ·(∫ b1

a1 f (x1, ..., xN )dx1)dx2 · · ·

)dxN−1

)dxN .

Uzyskany wzór jest bardzo cenny. Pozwala on obliczać całkę wielokrotną ∫C f (z)dz poprzeztzw. iterację, tzn. N-krotne obliczanie zwykłych (jednokrotnych) całek Riemanna.PRZYKŁAD: Obliczymy całkę ∫C(x2y − sinx cos y)dx dy,

gdzie C = [0, π/2]× [0, π/2].Zgodnie z powyższym wnioskiem∫C(x2y − sinx cos y)dx dy = ∫ π/2

0(∫ π/2

0 (x2y − sinx cos y)dx) dy == ∫ π/2

0(x33 y − cos x cos y∣∣∣∣π/20 dy = ∫ π/2

0(π324y − cos y) dy = (π348y2 − sin y∣∣∣∣π/20 = π5192 − 1.

ZADANIA: (1) Wykorzystując twierdzenie Fubiniego pokazać, że dla danej funkcji f : U → R,gdzie U ⊂ RN jest zbiorem otwartym, jeśli pochodne cząstkowe II-go rzędu f|ij istnieją i sąciągłe, to są równe.

Page 102: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

98 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCH3.3.B Twierdzenie Fubiniego i zasada Cavalieriego

Wrócimy w tym miejscu do twierdzenia Fubiniego dla funkcji określonych na zbiorze A ⊂RN = Rn × Rm mierzalnym w sensie Jordana. Sam zapis sugeruje, że ponownie zmiennejz ∈ A nadamy postać z = (x, y), gdzie x ∈ Rn i y ∈ Rm . Rozważmy kostkę domkniętą C ⊃ A.Rozkład RN = Rn × Rm wyznacza kostki domknięte X ⊂ Rn i Y ⊂ Rm takie, że C = X × Y .Załóżmy, że funkcja f : A→ R jest całkowalna w sensie Riemanna. Wtedy całkowalna naC jest funkcja fA : C → R i ∫A f (z)dz = ∫

C fA(z)dz. Zgodnie z twierdzeniem Fubiniego 3.3.1całkowalne na X są funkcjeX 3 x 7Ï

∫YfA(x, y)dy, X 3 x 7Ï

∫YfA(x, y)dy

oraz ∫Af (z)dz = ∫

CfA(z)dz = ∫

X

(∫YfA(x, y)dy)dx = ∫

X

(∫YfA(x, y)dy)dx. (∗)

Jeśli, dla dowolnego x ∈ X, całkowalna na Y jest funkcja fA(x, ·), to oczywiście ∫Y fA(x, y)dy =∫Y fA(x, y)dy = ∫Y fA(x, y)dy i całkowalna funkcja X 3 x 7Ï

∫Y fA(x, y)dy .Warto zastanowić się co oznacza wzór (∗). Zacznijmy od następującej obserwacji. Dla usta-lonego x ∈ X niech

Ax := y ∈ Rm | (x, y) ∈ A;innymi słowy, Ax jest rzutem na „oś” zmiennych y zbioru A ∩ [x ×Rm]. Oczywiście Ax ⊂ Y .Przypuśćmy przez chwilę, że Ax 6= ∅ i niech g := fx : Ax → R, tzn.g(y) := fx(y) = f (x, y), y ∈ Ax .

Widzimy, że funkcja g jest poprawnie określona i ograniczona. Co więcej, jeśli – jak wyżej –określić gAx : Y → R wzoremgAx (y) := 0, gdy y 6∈ Ax ;

g(y), gdy y ∈ Ax .

Jeżeli Ax = ∅, to nie ma sensu określać funkcji g , lecz można przyjąć, że – w tej sytuacji –gAx (y) = 0 dla dowolnego y ∈ Y .Zauważmy dalej, że po takich określeniach, mamy

gAx (y) = fA(x, y) dla dowolnego y ∈ Y.

Zatem (dla ustalonego zawczasu x ∈ X),∫YfA(x, y)dy = ∫

YgAx (y)dy, ∫

YfA(x, y)dy = ∫

YgAx (y)dy.

Załóżmy teraz, że zbiór Ax jest mierzalny (oczywiście to założenie jest interesujące dla tychx ∈ X, dla których Ax 6= ∅; w przeciwnym razie Ax , jako zbiór pusty, jest mierzalny), zaś g jestfunkcją całkowalną na Ax (tzn., wedle definicji, całkowalna na Y jest funkcja gAx ). Wtedy∫

YgAx (y)dy = ∫

YgAx (y)dy = ∫

YgAx (y)dy = ∫

Axg(y)dy.

Page 103: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 99

Zatem wzór (∗) przyjmuje postać∫Af (z)dz = ∫

X

(∫Axg(y)dy)dx = ∫

X

(∫Axf (x, y)dy)dx, (∗∗)

o ile dla dowolnego x ∈ X zbiór Ax jest mierzalny, a funkcja f (x, ·) całkowalna na tym zbiorze.Pójdźmy nieco dalej. Załóżmy ponownie, że dla dowolnego x ∈ X zbiór Ax jest mierzalnyi funkcja f (x, ·) jest całkowalna na Ax . NiechA1 := x ∈ Rn | Ax 6= ∅.

Innymi słowy, A1 jest rzutem zbioru A na „oś” zmiennych x. Zdefiniujmy funkcje u : A1 → Rwzoremu(x) := ∫

Axf (x, y)dy, x ∈ A1.

Funkcja ta jest poprawnie określona. Zdefiniujmy też funkcję uA1 : X → R zadaną – jak zwykle– wzoremuA1 (x) := 0, gdy x 6∈ A1;

u(x), gdy y ∈ A1.Zauważmy, że jeśli x 6∈ A1, to Ax = ∅. W takim razieuA1 (x) = ∫

Axf (x, y)dy, x ∈ X,

bo ∫Ax f (x, y)dy = 0, gdy x 6∈ A1 (wtedy bowiem mamy całkę na zbiorze pustym, która równajest 0).Załóżmy, że zbiór A1 jest mierzalny (jako podzbiór Rn). Całkowalność funkcji X 3 ∫Ax f (x, y)dyimplikuje, że całkowalna na A1 jest funkcja u i∫A1(∫

Axf (x, y)dy)dx = ∫

A1 u(x)dx = ∫X

(∫Axf (x, y)dy)dx = ∫

Cf (z)dz. (∗ ∗ ∗)

Analogiczne rozumowanie prowadzi do następującego stwierdzenia. Załóżmy, że dla do-wolnego y ∈ Y , zbiórAy := x ∈ Rn | (x, y) ∈ Ajest mierzalny (jako podzbiór Rn) i całkowalna na Ay jest funkcja f (·, y). Wtedy∫

Cf (z)dz = ∫

Y

(∫Ayf (x, y)dx)dy.

Jeśli zbiórA2 := y | Ayjest mierzalny (jako podzbiór Rm), to∫

Cf (z)dz = ∫

A2(∫

Ayf (x, y)dx)dy.

Jest chyba oczywiste, że powyższe wzory (∗∗), (∗ ∗ ∗) nie zależą od wybory kostek C (orazX i Y ).

Page 104: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

100 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHOtrzymane wzory są treścią twierdzenia Fubiniego dla funkcji określonych na mierzal-nych podzbiorach RN . Sformułujemy to twierdzenie w następującej (nieco uproszczonej po-staci).

3.3.5 TWIERDZENIE: Załóżmy, że A ⊂ RN jest zbiorem mierzalnym w sensie Jordana, a f :A→ R jest funkcją ciągłą.(1) Jeśli, dla dowolnego x ∈ Rn , zbiór Ax jest mierzalny, to∫

Af (z)dz = ∫

X

(∫Axf (x, y)dy)dx,

gdzie X jest dowolną kostką domkniętą zawierającą zbiór A1. Jeżeli zbiór A1 jest mierzalny,to ∫

Af (z)dz = ∫

A1(∫

Axf (x, y)dy)dx.

(2) Jeśli, dla dowolnego y ∈ Y , zbiór Ay jest mierzalny, to∫Af (z)dz = ∫

Y

(∫Ayf (x, y)dx)dy,

gdzie Y jest dowolną kostką domkniętą zawierającą A2. Jeśli zbiór A2 jest mierzalny, to∫Af (z)dz = ∫

A2(∫

Ayf (x, y)dx)dy.

Dowód jest natychmiastowy jeśli zauważymy, że ciągłość f implikuje, że dla dowolnegox ∈ Rn ciągła, a więc całkowalna na Ax , jest funkcja f (x, ·) (odp. dla każdego y całkowalna naAy jest funkcja f (·, y)).Zgodnie z tym twierdzeniem, poszukując całki ∫A f (z)dz z funkcji ciągłej f określonej nazbiorze mierzalnym A ⊂ RN = Rn×Rm można również przejść do całek iterowanych. Jedynymzmartwieniem jest mierzalność zbiorów Ax , x ∈ Rn (odp. zbiorów Ay , y ∈ Rm); oczywiście, abyuczynić całkowanie bardziej „ekonomicznym” warto także sprawdzić mierzalność zbiorów A1(odp. A2).Niestety teoria miary Jordana nie dostarcza dobrych narzędzi umożliwiających sformuło-wanie ogólnych stwierdzeń na ten temat. Na szczęście w wielu konkretnych sytuacjach problemten nie jest trudny.ĆWICZENIE: (1) Niech f : [a, b]× [a, b]→ R będzie funkcją ciągłą. Pokazać, że∫ b

a

∫ y

af (x, y)dx dy = ∫ b

a

∫ b

xf (x, y)dy dx.

(2) Niech f : [a, b] × [a, b] → R będzie funkcją ciągłą o ciągłej pochodnej cząstkowej f|2;niechF (x, y) := ∫ x

af (t, y)dt, (x, y) ∈ [a, b]× [a, b].

Obliczyć pochodne cząstkowe f|1 i f|2 (druga z pochodnych jest trudniejsza).Nim przejdziemy do przykładów, warto jeszcze przedyskutować twierdzenie Fubiniegow bardzo szczególnej sytuacji. Mianowicie załóżmy, że A ⊂ RN = Rn × Rm jest zbioremmierzalnym sensie Jordana. Pytanie brzmi: jak obliczyć jego miarę mN (A) ?Zgodnie z definicjąmN (A) = ∫

CχA(z)dz,

Page 105: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 101

gdzie C jest dowolną kostką domkniętą zawierającą zbiór A. Zgodnie zatem z przyjętymidefinicjami,mN (A) = ∫

Adx,

tzn. mN (A) jest całką na A funkcji stale równej 1 (która oczywiście jest ciągła). Jak wyżejnapiszmy C = X× Y , gdzie X, Y są domkniętymi kostkami odpowiedni w przestrzeniach Rn iRm . Ze wzoru (∗), mamy

mN (a) = ∫X

(∫YχA(x, y)dy)dx = ∫

X

(∫YχA(x, y)dy)dx.

Rozumując jak poprzednio, bez trudy zobaczymy, że dla każdego x ∈ Rn ,∫YχA(x, y)dy = m∗(Ax)

jest m-wymiarową miara wewnętrzną zbioru Ax , zaś∫YχA(x, y)dy = m∗(Ax)

jest m-wymiarową miarą zewnętrzną tego zbioru. Wobec tego, widzimy, że funkcjeX 3 x 7Ï m∗(Ax), X 3 x 7Ï m∗(Ax)są funkcjami całkowalnymi na X i

mN (A) = ∫Xm∗(Ax)dx = ∫

Xm∗(Ax)dx.

Jeżeli dla każdego x ∈ Rn zbiór Ax jest mierzalny, to m∗(Ax) = m∗(Ax) = m(Ax) jest m-wymiarową miarą Ax , funkcja X 3 x 7Ï m(Ax) jest całkowalna na X i(3.3.3) mN (A) = ∫

Xm(Ax)dx.

Jest jasne, że uzyskany wzór nie zależy od wyboru kostki C (a więc, w konsekwencji, od kostekX i Y ); poza tym – przy założeniu, że zbiór A1 jest mierzalny

mN (A) = ∫A1 m(Ax)dx.

Analogicznie otrzymujemy, żemN (A) = ∫

Ym∗(Ay )dy = ∫

Ym∗(Ay )dy,

gdzie, w tym miejscu, m∗(Ay ) (odp. m∗(Ay )) oznacza n-wymiarową miarę wewnętrzną (odp.zewnętrzną) zbioru Ay , y ∈ Rm . Tak więc, jeżeli dla dowolnego y ∈ Rm zbiór Ay jest mierzalny(jako podzbiór Rn) i m(Ay ) oznacza jego n-wymiarową miarę Jordana, to(3.3.4) mN (A) = ∫

Ym(Ay )dy = ∫

A2 m(Ay )dy(ostatnia równość zachodzi przy założeniu, że zbiór A2 jest mierzalny w sensie Jordana).Otrzymane zależności nazywa się zasadą Cavalieriego.ĆWICZENIE: Wykorzystując zasadę Cavalieriego wyprowadzić wzór na objętość bryły po-wstałej wskutek obrotu wokół osi Ox wykresu funkcji ciągłej f : [a, b]→ R.Przejdziemy teraz do zastosowań twierdzenie Fubiniego i zasady Cavalieriego.

Page 106: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

102 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCH3.3.C Zastosowania twierdzenia Fubiniego i zasady Cavalieriego

ZBIORY CYLINDRYCZNE Nasze rozważania zaczniemy od tzw. zbiorów cylindrycznych. Otóżzałóżmy, że dany jest mierzalny w sensie Jordana zbiór B ⊂ RN−1 oraz funkcje całkowalne f , g :B → R. Zbiorem cylindrycznym o podstawie B wyznaczonym przez funkcje f i g nazwiemyzbiór postaci

A := (x, y) ∈ B × R | minf (x), g(x) ≤ y ≤ maxf (x), g(x).Mówiąc prościej zbiór A składa się z punktów leżących pomiędzy wykresami funkcji f i g . Wszczególności, gdy g ≡ 0, to A jest zbiorem leżącym między wykresem funkcji f i osią Ox.UWAGA: Zbiory zwane przez nas zbiorami cylindrycznymi nazywane są także zbiorami wpostaci normalnej.3.3.6 TWIERDZENIE: Zbiór cylindryczny A (postaci takiej jak wyżej) jest mierzalny w sensieJordana (jako podzbiór przestrzeni RN ) i jego miara wynosi∫

B|f (x)− g(x)|dx.

DOWÓD: Wystarczy udowodnić następującą uproszczoną wersję twierdzenia: jeśli f ∈ R(B),B ⊂ RN−1 jest mierzalny f ≥ 0, to zbiór (x, y) ∈ B × R | 0 ≤ y ≤ f (x) jest mierzalny i jegomiara jest równa

∫B f (x)dx.Wówczas, jeśli g ∈ R(B) i 0 ≤ g ≤ f , to zbiór (x, y) ∈ B × R | g(x) ≤ y ≤ f (x) jest teżmierzalny i jego miara wynosi ∫B(f (x)− g(x))dx.Istotnie: widać, że

(x, y) | g(x) ≤ y ≤ f (x) = (x, y) | 0 ≤ y ≤ f (x) \ (x, y) | 0 ≤ y ≤ g(x).Mierzalność zbiorów po prawej stronie implikuje mierzalność zbioru po lewej stronie. Po-nadto jego miara jest różnicą miar zbiorów po prawej stronie; jest więc równa ∫B φ(x)dx −∫B ψ(x)dx = ∫B(φ(x)− ψ(x))dx.Jeżeli f , g ∈ R(B) oraz g ≤ f , to zbiór (x, y) ∈ B × R | ψ(x) ≤ y ≤ φ(x) jest mierzalnyo mierze równej ∫B(f (x) − g(x))dx. Istotnie: funkcje f , g są ograniczone z dołu. Istnieje więcstała m ≤ g(x) ≤ f (x) dla wszystkich x ∈ B. Wówczas funkcje

f −m,g(x)−m ≥ 0 dla x ∈ B. Wobec tego zbiór A′ := (x, y) | g(x)−m ≤ y ≤ f (x)−mjest mierzalny i jego miara wynosi ∫B(f −m − g(x) + m)dx = ∫B(f (x) − g(x))dx. Łatwo terazdostrzec, że A = A′ + (0,m). Jak już pokazaliśmy w lemacie 3.2.8, mierzalność zbiorów i ichmiara są niezmiennicze ze względu na translacje. To dowodzi, że zbiór A jest mierzalny.Rozważymy teraz sytuację ogólną i niech φ(x) = maxf (x), g(x) i ψ(x) = minf (x), g(x)dla x ∈ B. Wówczas ψ ≤ φ. Zgodnie z powyższym nasz zbiór jest mierzalny i jego miara wynosi∫

B(φ(x)− ψ(x))dx = ∫

B|f (x)− g(x)|dx.

Tak więc zajmiemy się sytuacją, w której f : B → R jest funkcją nieujemną, B ⊂ RN−1jest zbiorem mierzalnym i A := (x, y) ∈ RN | x ∈ B, 0 ≤ y ≤ f (x). Aby udowodnić, że Ajest zbiorem mierzalnym pokażemy, że brzeg zbioru A jest zbiorem nieistotnym. W tym celu,zauważmy, że istnieje M > 0 takie, że A ⊂ B × [0,M], bowiem funkcja f jest ograniczona i

Page 107: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 103

nieujemna.Niech (x0, y0) ∈ ∂A. Wtedy x0 6∈ B1 := intB \ D, gdzie D ⊂ B jest zbiorem punktównieciągłości funkcji f , lub y0 = 0 lub y0 = f (x0). Jeśli bowiem x0 ∈ intB\D oraz 0 < y0 < f (x0),to – jak łatwo sprawdzić – (x0, y0) ∈ intA.Jeśli y0 = 0, to (x0, y0) ∈ A0 := (x, y) | x ∈ B, y = 0 = B × 0; jeśli y0 = f (x0),to (x0, y0) należy do wykresu A1 := (x, y) | x ∈ B, y = f (x) funkcji f . Wreszcie jeślix0 6∈ B1, to x0 ∈ ∂B lub x0 ∈ D, tzn. (x0, y0) ∈ A2 := (x, y) | x ∈ ∂B ⊂ ∂B × [0,M] lub(x0, y0) ∈ A3 := (x, y) | x ∈ D ⊂ D × [0,m]. Pokazaliśmy już, że ∂A ⊂ A0 ∪ A1 ∪ A2 ∪ A3.Ponieważ m(A0) = m(A2) = m(A3) = 0, to wystarczy udowodnić, że m(A1) = 0.Niech C będzie kostką w RN−1 taką, że B ⊂ C. Z definicji funkcja fB : C → R (danawzorem fB(x) = f (x) dla x ∈ B oraz fB(x) = 0 dla x ∈ C \ B) jest całkowalna. Dla ε > 0,istnieje więc podział P ∈ P(C) taki,że U(fB, P) − L(fB, P) < ε. Rozważmy rodzinę CSS∈Pgdzie CS = S × [mS(fB),MS(fB)]. Oczywiście, dla dowolnego x ∈ C, istnieje taka kostka S ∈ P,że x ∈ S; zatem (x, fB(x)) ∈ CS . W takim razie wykres funkcji fB (a więc i jego podzbiór A1)pokryliśmy rodziną CSS∈P domkniętych kostek. Zauważmy, że∑

S∈Pvol(CS) =∑

S∈P[MS(fB)−mS(fB)]vol(S) = U(fB, P)− L(fB, P) < ε.

Dowodzi to, że m(A1) = 0 i kończy dowód mierzalności zbioru A.Zauważmy teraz, że rzut na RN−1 zbioru A jest równy B i jest to zbiór mierzalny; ponadtodla dowolnego x ∈ B, Ax = [0, f (x)]; zatem miara (1-wymiarowa) zbioru Ax wynosi m1(Ax) =f (x). Zatem, zgodnie z zasadą Cavalieriego,

m(A) = ∫Bm1(Ax)dx = ∫

Bf (x)dx.

3.3.7 UWAGA: Udowodnione twierdzenie potwierdza poprawność intuicji, która towarzyszyłanam od samego początku i nakazywała interpretować całkę funkcji f : [a, b]→ R całkowalnejw sensie Riemanna jako pole powierzchni obszaru ograniczonego wykresem f , osią odciętychi prostymi x = a i x = b.Twierdzenie Fubiniego pozwala również na efektywne całkowanie funkcji na zbiorachcylindrycznych.3.3.8 FAKT: Jeśli A = (x, y) ∈ RN | x ∈ B, f (x) ≤ y ≤ g(x), gdzie B ⊂ RN−1 jest zbioremmierzalnym w sensie Jordana, f , g : B → R są funkcjami całkowalnymi i f ≤ g , F : A → Rjest funkcją ciągłą, to ∫

AF (z)dz = ∫

B

∫ g(x)f (x) F (x, y)dy dx.

Dowód jest natychmiastowy: rzut A1 zbioru na przestrzeń Rn−1 jest równy podstawie B;dla dowolnego x ∈ B, Ax = [f (x), g(x)].3.3.D Twierdzenie o zamianie zmiennych

Obecnie sformułujemy twierdzenie o zamianie zmiennych w całce Riemanna. Przypomnijmybrzmienie tego twierdzenia w przypadku funkcji jednej zmiennej: Załóżmy, że funkcja f : I →R (gdzie I jest przedziałem) jest ciągła, funkcja u : [a, b] → I różniczkowalna oraz u′ jest

Page 108: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

104 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHcałkowalna. Wówczas funkcja (f u)u′ jest całkowalna na [a, b] oraz∫ b

a(f u)u′ = ∫ u(b)

u(a) f .

Jest jasne, że gdy dodatkowo u jest funkcją różnowartościową, to można napisać, ze∫ b

a(f u)u′ = ∫[u(a),u(b)] f .Ma miejsce następujące uogólnienie na przypadek funkcji wielu zmiennych. Przyjmiemybez dowodu

3.3.9 TWIERDZENIE: Niech A ⊂ RN będzie zbiorem mierzalnym w sensie Jordana oraz niechg : U → RN , gdzie A ⊂ U ⊂ RN jest zbiorem otwartym, będzie różnowartościowym od-wzorowaniem regularnym (tzn. klasy C1 i det g ′(x) 6= 0 dla każdego x ∈ A), czyli g jestdyfeomorfizmem. Wówczas g(A) jest zbiorem mierzalnym. Jeśli B ⊂ g(U) jest mierzalny, tozbiór g−1(B) jest tez mierzalny.

Jeśli funkcja f : g(A)→ R jest całkowalna, to funkcja (f g)| det g ′| : A→ R jest całkowalnana A i zachodzi wzór ∫

g(A) f = ∫A(f g)| det g ′|.

Jeśli funkcja f : B→ R jest całkowalna, to∫Bf = ∫

g−1(B)(f g)| det g ′|.

ZADANIE: Jeśli A ⊂ RN jest zbiorem nieistotnym, f : A→ RN jest odwzorowaniem spełnia-jącym warunek Lipschitza, to zbiór f (A) jest również nieistotny. Pokazać – na podstawie tegofaktu, że w twierdzeniu 3.3.9 zbiór g(A) jest mierzalny w sensie Jordana.ZADANIE: Niech L ∈ L(RN ,RN ) będzie nieosobliwym odwzorowaniem liniowym. Pokazać,że jeśli A ⊂ RN jest zbiorem mierzalnym w sensie Jordana, to L(A) jest również zbioremmierzalnym im(L(A)) = | detL|m(A).

W twierdzeniu 3.3.9 można pozbyć się założenia, że det g ′(x) 6= 0 dla x ∈ U . Wynika to znastępującej wersji wspomnianego już twierdzenia Sarda;3.3.10 TWIERDZENIE: Jeśli odwzorowanie g : U → RN , gdzie U ⊂ RN jest zbiorem otwartym,jest klasy C1 i zbiór punktów krytycznych K := x ∈ U | det g ′(x) = 0, to zbiór g(A) wartościkrytycznych odwzorowania g jest zbiorem nieistotnym. UWAGA: Dostrzec, że zbiór nieistotny ma puste wnętrze.Jeśli w twierdzeniu 3.3.9 odstąpić od wspomnianego założenia, to można postępować na-stępująco: załóżmy, że A ⊂ RN jest mierzalny, zaś funkcja f : g(A)→ R jest całkowalna. Wtedy,jeśli zbiór K punktów krytycznych jest mierzalny w sensie Jordana (ten zbiór jest zawszedomknięty), to∫

g(A) f = ∫g(A\K) f + ∫

g(K) f = ∫g(A\K) f = ∫

A\K(f g)| det g ′| = ∫

A(f g)| det g ′|.

Page 109: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 105

WSPÓŁRZĘDNE BIEGUNOWE Określmy odwzorowanieg : U → R2,

gdzie U := (0,+∞)× (0, 2π), wzoremg(r, α) = (r cosα, r sinα), r > 0, 0 < α < 2π.

Wtedy g jest dyfeomorfizmem zbioru U na zbiór V := R2 \ L, gdzie L := (x, y) ∈ R2 |x ≥ 0, y = 0; dla (r, α) ∈ U , det g ′(r, α) = r > 0. Wobec tego, dla dowolnego zbioru B ⊂V mierzalnego, zbiór g−1(B) jest mierzalny. Jeśli f : B → R jest całkowalna, to zgodnie ztwierdzeniem 3.3.9 mamy ∫

Bf dx dy = ∫

g−1(B)(f g)| det g ′|dr dα.Jeśli A ⊂ R2 jest zbiorem mierzalnym, to zbiory B := A \ L,A ∩ L sa też mierzalne, A ∩ L jestnieistotny, czyli m(A ∩ L) = 0 i∫

Af dx dy = ∫

Bf dx dy + ∫

A∩Lf dx dy = ∫

Bf = ∫

g−1(B)(f g)| det g ′|dr dα.Rozważmy teraz przekształcenie P : R2 → [0,+∞)× [0, 2π] zadane wzorem: dla (x, y) ∈ R2

P(x, y) := (r(x, y), α(x, y)),gdzie r(x, y) =√x2 + y2 = ‖(x, y)‖ oraz

α(x, y) :=

arctg yx gdy x > 0, y > 0arctg yx + π gdy x < 02π − arctg y

x gdy x > 0, y < 012π gdy x = 0, y > 032π gdy x ≥ 0, y = 00 gdy x = 0 = y.

Zauważmy, że P|V = g−1. Zatem∫Af (x, y)dx dy = ∫

P(B)(f g)| det g ′|dr dα =∫P(A) f (r cosα, r sinα)r dr dα = ∫

P(A) f (r cosα, r sinα)r dr dα,gdyż zbiór P(A) \ P(B) jest nieistotny.Uzyskany wzór nazywa się wzorem na całkowanie poprzez zamianę zmiennych kartezjań-skich na zmienne biegunowe, zaś przekształcenie P nazywa się współrzędnymi biegunowymi:jest to przyporządkowanie, które punktowi płaszczyzny o „starych” zmiennych kartezjańskich(x, y) z mierzalnego zbioru A ⊂ R2 przyporządkowuje „nowe” zmienne biegunowe lub kołower(x, y) i α(x, y).Analogicznie: wprowadzając przekształcenie G : [0,+∞)× [0, 2π]→ R2 dane przez

G(r, α) = (r cosα, r sinα), r ≥ 0, 0 ≤ α ≤ 2π,dla dowolnego mierzalnego A ⊂ R2 mamy∫

Af (x, y)dx dy = ∫

G−1(A) f (r cosα, r sinα)r dr dα.

Page 110: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

106 3. CAŁKA RIEMANNA FUNKCJI WIELU ZMIENNYCHWSPÓŁRZĘDNE SFERYCZNE Rozważmy przekształcenie G : [0,+∞)× [0, 2π]× [−12π, 12π]→

R3 zadane wzoremg(r, α, θ) := (r cosα cos θ, r sinα cos θ, r sin θ), r > 0, 0 < α < 2π, −12π < θ < 12π.Wówczas g := G|U , gdzie U = (0,+∞) × (0, 2π) × (−12π, 12π) jest dyfeomorfizmem, gdyż dladowolnego (r, α, θ) ∈ U , det g ′(r, α, θ) = r2 cos θ > 0. Ponadto g(U) = R3 \ (x, y, z) ∈ R3 | x ≥0, y = 0 i dla każdego mierzalnego A ⊂ R3 i funkcji całkowalnej f : A→ R∫Af (x, y, z)dx dy dz = ∫

G−1(A) f (r cosα cos θ, r sinα cos θ, r sin θ)r2 cos θ dr dα dθ.Przyporządkowanie punktowi przestrzeni R3 o współrzędnych kartezjańskich (x, y, z) punktuo współrzędnych (r, α, θ) ∈ [0,+∞)× [0, 2π]× [−12π, 12π] takiego, że (x, y, z) = G(r, α, θ) nazywasię współrzędnymi sferycznymi.

WSPÓŁRZĘDNE WALCOWE Podobnie jak poprzednio rozważamy G : [0,+∞)× [0, 2π]× Rzadane wzoremG(r, α, z) = (r cosα, r sinα, z), r ≥ 0, 0 ≤ α < 2π, z ∈ R.

Wówczas g := G|U , gdzie U := (0,+∞)× (0, 2π)× R, jest dyfeomorfizmem, gdyż dla (r, α, θ) ∈U , det g ′(r, α, θ) = r > 0. Zatem rozumując jak wyżej, dla mierzalnego A ⊂ R3 i funkcjicałkowalnej f : A→ R mamy∫

Af (x, y, z)dx dy dz = ∫

G−1(A) f (r cosα, r sinα, z)r dr dα dz.Przyporządkowanie, które punktowi przestrzeni R3 o współrzędnych kartezjańskich (x, y, z)przyporządkowuje współrzędne (r, α, z) ∈ [0,+∞) × [0, 2π) × R nazywa się współrzędnymiwalcowymi.PRZYKŁAD: Znajdź objętość bryły W ograniczonej walcem x2 +y2 = 4 oraz płaszczyznamiz = 0 i z = x + y + 10.Bryła ta jest zbiorem cylindrycznym o podstawie A := (x, y) ∈ R2 | x2 + y2 ≤ 4 ifunkcjami ψ(x, y) = 0, φ(x, y) = x + y + 10. Zbiór A jest mierzalny w sensie Jordana, bo jestograniczony i jego brzeg jest zbiorem nieistotnym. Podobnie całkowalna jest funkcja φ, bojest ciągła. Wobec tego poszukiwana objętość jest równa∫

Aφ(x, y)dx dy.

We współrzędnych biegunowych G−1(A) = [0, 2] × [0, 2π]. A więc, wykorzystując twierdzenieFubiniego, ∫Aφ(x, y)dx dy = ∫

G−1(A) φ(r cosα, r sinα)r dr dα =∫[0,2]×[0,2π](r2 cosα+ r2 sinα+ 10)dr dα =∫ 2

0[∫ 2π

0 (r2 cosα+ r2 sinα+ 10)dα] dr = 40π.

Page 111: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

3.3. METODY OBLICZANIA CAŁEK 107

PRZYKŁAD: Obliczyć całkę ∫A(x2 + y2)dx dy dz, gdzie A := (x, y, z) ∈ R3 | √x2 + y2 ≤z ≤ 1.Zbiór A jest zbiorem cylindrycznym

A = (x, y, z) ∈ R3 | (x, y) ∈ B, φ(x, y) ≤ z ≤ 1,gdzie B := (x, y) ∈ R2 | x2 + y2 ≤ 1 i φ(x, y) =√x2 + y2. Wobec tego∫A(x2 + y2)dx dy dz = ∫

B

[∫ 1φ(x,y)(x2 + y2)dz] dx dy = ∫

B(x2 + y2)(1−√x2 + y2)dx dy.

We współrzędnych biegunowych G−1(B) = (r, α) | 0 ≤ r ≤ 1, 0 ≤ α ≤ 2π. Zatem∫A(x2 + y2)dx dy dz = ∫ 1

0[∫ 2π

0 r3(1− r)dα] dr =2π ∫ 1

0 (r3 − r4)dr = 2π [r44 − r55]1

0 = π10 .ĆWICZENIE: Rozwiązać to samo zadanie stosując współrzędne walcowe.WSPÓŁRZĘDNE ELIPTYCZNE Niekiedy wygodnie jest rozważać, w miejsce współrzędnychbiegunowych, tzw. współrzędne eliptyczne (r, α) ∈ [0,+∞)×[0, 2π]. Wówczas punktowi (x, y) ∈

R2 odpowiada punkt (r, α) taki, że x = ar cosα, y = br sinα, gdzie a, b > 0 są ustalonymiparametrami.PRZYKŁAD: Znaleźć pole powierzchni figury A ograniczonej elipsą A := (x, y) ∈ R2 |x2a2 + y2

b2 = 1, a, b > 0.Poszukiwane pole wyraża się wzorem∫Adx dy = ∫

Brab dr dα,

gdzie B = (r, α) | 0 ≤ r ≤ 1, 0 ≤ α ≤ 2π, G(r, α) = (ar cosα, br sinα); dla (r, α ∈(0,+∞)× (0, 2π), detG′(r, α) = abr > 0. Zatem∫Adx dy = ab

∫ 10[∫ 2π

0 r dα]dr = πab.

Page 112: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

Rozdział 4Całkowanie form różniczkowych

4.1 Pola wektorowe

Odwzorowania postaci F : U → RN , gdzie U ⊂ RN jest zbiorem otwartym, nazywa się czasemN-wymiarowymi polami wektorowymi. Zwykle wyobraża się, że każdemu punktowi x ∈ Uprzyporządkowany jest wektor F (x) zaczepiony w punkcie x. Oczywiście terminologia doty-cząca pól wektorowych pozostaje bez zmian. Pole F jest ciągłe, różniczkowalne itp. wtedy itylko wtedy, gdy funkcje skalarne (rzeczywiste) Fi , i = 1, ..., N , będące funkcjami współrzęd-nymi F sa ciągłe, różniczkowalne itp.Z polami wektorowymi mamy często do czynienia w zastosowaniach: pole grawitacyjnejest funkcją, która punktowi x ∈ R3 przyporządkowuje wektor siły z jaką na masą jednostkowąumieszczoną w punkcie x oddziaływuje przyciąganie jakiegoś ustalonego obiektu (np. słońca,ziemi itd); jeśli f : U → R jest funkcją różniczkowalną, to gradient ∇f (x) w punkcie x ∈ Ujest wektorem zaczepionym w punkcie x, który wyznacza kierunek i wielkość największegowzrostu funkcji f w punkcie x.4.1.1 PRZYKŁAD: Rozważmy ciało o masie m umieszczone w punkcie x0 ∈ R3. Wówczas siłagrawitacji (przyciągania) wytworzona przez to ciało działająca na masę jednostkową w punkciex ∈ U := R3 \ x0 dana jest jako

F (x) = − km‖x − x0‖3 (x − x0),

gdzie k jest pewną stałą (stałą grawitacji); jest to wektor zaczepiony w punkcie x skierowanyku punktowi x0, o długości ‖F (x)‖ = km‖x−x0‖ .Często pola wektorowe interpretuje się właśnie jako pola siłowe: mając pole wektorowe

F : U → RN , gdzie U ⊂ RN jest zbiorem otwartym, uznajemy, że w każdym punkcie x ∈ Udziała siła F (x). Tak więc: jeśli w tym punkcie x0 ∈ U znajdzie się punkt materialny o masiem, to – zgodnie z zasadą Newtona – punkt ten zacznie się poruszać w czasie od t = t0 do t = t1po pewnej trajektorii, tzn. krzywej [t0, t1] 3 t 7Ï x(t) ∈ U oraz mx(t) = F (x(t)) (1).Można również interpretować pola wektorowe jako pole prędkości: otóż jeżeli zadane jestpole wektorowe F : U → RN , U jest jak wyżej, to uznajemy, że F (x) jest prędkością z jakąbędzie poruszać się punkt materialny, który znalazł się w punkcie x ∈ U (wartość prędkości

1Symbol x(t) oznacza drugą pochodną funkcji x w punkcie t ∈ [t0, t1] – jest to notacja pochodząca od Newtonai bardzo popularna wśród fizyków i w teorii równań różniczkowych.

Page 113: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.1. POLA WEKTOROWE 109

jest stała i nie zależy od czasu). A zatem jeśli ten punkt materialny o czasie t0 znalazł się wpunkcie x0 ∈ U , to będzie się poruszać z prędkością x′(t) = F (x(t)) w czasie t ∈ [t0, t1). Krzywą[t0, t1) 3 t 7Ï x(t) ∈ U i taką, że x(t0) = x0, nazywa się krzywą całkową pola F przechodzącąprzez punkt x0. Jeśli pole F spełnia (przynajmniej lokalnie) warunek Lipschitza, to taką krzywązawsze można jednoznacznie wyznaczyć (jest to przedmiot teorii równań różniczkowych).ĆWICZENIE: Pokazać, że nośnik tej krzywej zależy tylko od kierunków przyjmowanychprzez pole F , nie zależy zaś od długości tego pola.4.1.A Zachowawcze pola wektorowe

Mówimy, że pole wektorowe F = (F1, ..., FN ) : U → RN , gdzie U ⊂ RN jest zbiorem otwartym,jest zachowawcze lub potencjalne lub także gradientowe, jeżeli istnieje funkcja różniczkowalnaf : U → R taka, że F (x) = ∇f (x), a więc Fi(x) = f|i(x) dla każdego x ∈ U . Funkcja skalarna fnazywana jest potencjałem pola F .4.1.2 PRZYKŁAD: Pole grawitacyjne F (x) = − km

‖x−x0‖3 (x − x0) dla x ∈ R3 \ x0 jest polemzachowawczym o potencjalef (x) = km

‖x − x0‖ , x ∈ R3, x 6= x0.Poniższy fakt dostarcza natychmiastowego warunku koniecznego zachowawczości pola F .

4.1.3 TWIERDZENIE: Jeśli pole F = (F1, ..., FN ) : U → RN , gdzie U ⊂ RN jest zbiorem otwar-tym, jest różniczkowalne i zachowawcze, to dla dowolnych i, j = 1, ..., N , Fi|j (x) = Fj|i(x) dladowolnego x ∈ U . Innymi słowy macierz Jacobiego JF (x) jest symetryczna.DOWÓD: Niech f : U → R będzie potencjałem pola F . Dla każdego i = 1, ..., N , pochodnacząstkowa f|i(x) = Fi(x) jest funkcją różniczkowalną; zatem funkcja f jest dwukrotnie róż-niczkowalna. W takim razie dla dowolnych i, j = 1, ..., N , mieszane pochodne cząstkowe II-gorzędu f|ij i f|ji są równe, tzn. dla x ∈ U ,

Fi|j (x) = f|ij (x) = f|ji(x) = Fj|i(x).

4.1.4 PRZYKŁAD: Sprawdzimy, że pole F (x, y) = (x,−y), (x, y) ∈ U := R2, jest zachowawcze.Warunek konieczny jest spełniony, bo F1|2 = 0 = F2|1. Przypuśćmy, że f : R2 → R jestpotencjałem dla F . Wówczas jest to funkcja różniczkowalna ifx(x, y) = f|1(x, y) = F1(x, y) = x oraz fy (x, y) = −y.

Wobec tego, przy ustalonym y , funkcja f (·, y) (tj. funkcja zmiennej x) jest funkcją pierwotnąfunkcji F1. A zatemf (x, y) = ∫ x dx = 12x2 + C1(y),

gdzie stała całkowania C1(y) zależy do y . W takim razie−y = fy (x, y) = (12x2 + C1(y))

y= C′1(y) czyli C1(y) = −12y2 + C2.

A zatemf (x, y) = x2 − y22 + C2,

Page 114: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

110 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHgdzie C2 jest dowolną stałą.Niestety podany warunek konieczny nie jest na ogół warunkiem dostatecznym.4.1.5 PRZYKŁAD: Niech U = R2 \ (0, 0), U1 := (x, y) ∈ R2 | x ≤ 0 i niech

F (x, y) := (− yx2 + y2 , x

x2 + y2) dla (x, y) ∈ U,

g(x, y) = arctg yx , (x, y) ∈ U1(innymi słowy g(x, y) jest kątową współrzędną biegunową z przedziału (−π, π) punktu (x, y) ∈

U1). Dla dowolnego (x, y) ∈ U mamyF1|2(x, y) = y2 − x2(x2 + y2)2 = F2|1(x, y).

A więc warunek konieczny zachowawczości jest spełniony. Podobnie sprawdzamy, że dla(x, y) ∈ U1,∇g(x, y) = F (x, y).Wobec tego, w obszarze U1 pole F jest zachowawcze i jej potencjałem jest funkcja g . Niestetypole F nie jest zachowawcze w obszarze U . Gdyby tak było, to istniałaby różniczkowalnafunkcja f : U → R taka, że ∇f (x, y) = F (x, y) dla (x, y) ∈ U . Stąd dla (x, y) ∈ U1 ⊂ U ,

∇f (x, y) = ∇g(x, y). W takim razie g − f ≡ const. na zbiorze U1, tzn. istnieje stała C ∈ Rtaka, że g(x, y) = f (x, y) + C. Zauważmy teraz, że , gdy x < 0, tolimy→0+ g(x, y) = π, lim

y→0− g(x, y) = −π.Z drugiej strony lim

y→0± g(x, y) = limy→0± f (x, y) + C = f (x, 0) + C.

Uzyskaliśmy więc sprzeczność.Powyższy przykład jest ważny: zbiór U ma tam bowiem „dziurę” (U = R2 \ (0, 0)). Towłaśnie ta dziura jest przyczyną braku zachowawczości.4.2 Całka krzywoliniowa

4.2.A Całka krzywoliniowa I-go rodzaju

Przypuśćmy, że σ : [a, b] → RN jest krzywą ciągłą i prostowalną (2). Niech C := σ ([a, b])będzie nośnikiem krzywej σ i f : C → R funkcja ograniczoną. Podobnie jak w konstrukcjizwykłej całki Riemanna, z dowolnym podziałem P = t0, ..., tn odcinka [a, b] można związaćnastępującą górną i dolną sumę całkową:U(f , P, σ ) := n∑

i=1 V (σ|[ti−1,ti]) supt∈[ti−1,ti] f (σ (t)), L(f , P, σ ) := n∑

i=1 V (σ|[ti−1,ti]) inft∈[ti−1,ti] f (σ (t)).

2Krzywa σ jest prostowalna, gdy np. jest gładka (tzn. C1) i wówczas jej długość wyraża się wzorem V (σ ) =∫ ba ‖σ

′(t)‖dt . Krzywa σ jest również prostowalna, gdy jest kawałkami gładka, tzn. kawałkami klasy C1 , a więcistnieje podział P0 := t0, x1, ..., tn odcinka [a, b], przy którym, dla dowolnego i = 1, ..., n, obcięcie σ|[ti−1,ti ] jestklasy C1 na odcinku [ti−1, ti].

Page 115: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.2. CAŁKA KRZYWOLINIOWA 111

gdzie V (σ|[ti−1,ti]) oznacza długość krzywej σ|[ti−1,ti] (ta „obcięta” krzywa jest również prostowalna).Zauważmy, że dla dowolnych podziałów P,Q ∈ P([a, b]),infx∈C

f (x)V (σ ) ≤ L(f , P, σ ) ≤ U(f ,Q, σ ) ≤ supx∈C

f (x)V (σ ),a jeżeli Q jest zagęszczeniem P, to

L(f , P, σ ) ≤ L(f ,Q, σ ) ≤ U(f ,Q, σ ) ≤ U(f , P, σ ).Wobec tego, postępując podobnie jak w definicji całki Riemanna, przyjmujemy, że funkcja fjest całkowalna (w sensie Riemanna) na krzywej σ , jeżeli

infU(P, f, σ ) | P ∈ P([a, b]), P ⊃ P0 = supL(f , P, σ ) | P ∈ P([a, b]), P ⊃ P0,gdzie P0 jest podziałem, o którym mowa w stopce redakcyjnej na poprzedniej stronie. Wspólnąwartość nazywamy całką krzywoliniową funkcji f wzdłuż krzywej σ i oznaczamy symbolem∫σf ds.

4.2.1 UWAGA: Całkę krzywoliniową I-go rodzaju można interpretować następująco. Przypuść-my, że krzywa σ jest parametryzacji zbioru C wykonanego z pewnego niejednorodnego stopu.Dla x ∈ C, wielkość f (x) ∈ R oznacza gęstość masy w punkcie x. Wówczas całka ∫σ f dsokreśla masę całkowitą zbioru C.Analogicznie jak w przypadku zwykłej całki Riemanna mamy następującą charakteryzację,której prosty dowód pozostawiam Czytelnikowi.4.2.2 TWIERDZENIE: Funkcja ograniczona f : C → R, zdefiniowane na nośniku krzywej prosto-walnej σ : [a, b]→ RN jest całkowalna wtedy i tylko wtedy, gdy dla dowolnego ε > 0 istniejepodział P ∈ P([a, b]) taki, że

U(f , P, σ )− L(f , P, σ ) < ε.

Ponadto łatwo uzyskać następujące własności całki:4.2.3 TWIERDZENIE: Niech σ : [a, b]→ RN będzie krzywą prostowalną o nośniku C. Przypuść-my, że funkcje f , g : C → R są całkowalne i α ∈ R. Wówczas funkcje αf , f ± g są całkowalnei ∫

σαf ds = α

∫σf ds,

∫σ(f ± g)ds = ∫

σf ds ±

∫σg ds.

Jeśli f ≤ g , to∫σ f ds ≤

∫σ g ds. Jeżeli zaś krzywa σ jest połączeniem dwóch krzywych

prostowalnych σ1 i σ2, to funkcja f jest całkowalna na obu tych krzywych i ma miejsce wzór∫σf ds = ∫

σ1 f ds + ∫σ2 f ds.

Przypomnijmy w tym miejscu, że dla krzywych σ1 : [a1, b1]→ RN i σ2 : [a2, b2]→ RN takichże σ1(b1) = σ2(a2) (tzn. koniec pierwszej z nich jest początkiem drugiej) (3), to ich połączeniemnazywamy krzywą σ : [a1, b2]→ RN daną wzoremσ (t) := σ1(t) gdy t ∈ [a1, b1],

σ2(t) gdy t ∈ [a2, b2].3Bez zmniejszenia ogólności można założyć, że b1 = a2.

Page 116: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

112 4. CAŁKOWANIE FORM RÓŻNICZKOWYCH

4.2.4 TWIERDZENIE: Jeśli f : C → R jest funkcją ciągłą, σ jest gładka (klasy C1), to f jestcałkowalna na krzywej σ i ∫

σf ds = ∫ b

af (σ (t))‖σ ′(t)‖dt.

DOWÓD: Zauważmy przede wszystkim, że funkcja [a, b] 3 t 7Ï F (t) := f (σ (t))‖σ ′(t)‖ jest całko-walna w sensie Riemanna, bo jest ciągła, zaś σ jest prostowalna. Ustalmy ε > 0; wykorzystującjednostajną ciągłość złożenia f σ , znajdziemy δ > 0 takie, że |f (σ (t ′)) − f (σ (t ′′))| < ε/V (σ ), oile t ′, t ′′ ∈ [a, b] oraz |t ′ − t ′′| < δ. Niech P0 = t0, ..., tn będzie podziałem odcinka [a, b] ośrednicy < δ. Wtedy,U(f , P0, σ )− L(f , P0, σ ) = n∑

i=1 V (σ|[ti−1,ti])( supt∈[ti−1,ti] f (σ (t))− inf

t∈[ti−1,ti] f (σ (t)))< ε[V (σ )]−1 n∑

i=1 V (σ|[ti−1,ti]) = ε.

Oznacza to, że funkcja f jest całkowalna wzdłuż σ i, oczywiście,L(f , P, σ ) ≤ ∫

σf ds ≤ U(f , P, σ ) oraz U(f , P, σ )− L(f , P, σ ) < ε

dla dowolnego podziału zagęszczającego podział P0.Wybierzmy teraz podział P = s0, ...sm ⊃ P0 o średnicy µ, gdzie µ > 0 jest taką liczbą, żejeśli s, ξ ∈ [a, b] i |s − ξ| < µ, to|f (σ (s))− f (σ (ξ))| < ε[V (σ )]−12Mσ

,

gdzie Mσ := supt∈[a,b] ‖σ ′(t)‖, oraz∣∣‖σ ′(s)‖ − ‖σ ′(ξ)‖∣∣ < ε[V (σ )]−12Mf,

gdzie Mf := supt∈[a,b] |f (σ (t))|.Dla dowolnego i = 1, ...,m, z twierdzenie o wartości średniej dla całkiV (σ|[si−1,si]) = (si − si−1)‖σ ′(ξi)‖,gdzie ξi ∈ [si−1, si] oraz, jak łatwo sprawdzić,( sup

s∈[si−1,si]F (s)− sups∈[si−1,si] f (σ (s))‖σ ′(ξi)‖) (si − si−1) < ε(si − si−1).

Stąd|U(F, P)− U(f , P, σ )| < ε.Analogicznie rozumując otrzymamy, że|L(F, P)− L(f , P, σ )| < ε.

Biorąc pod uwagę, że L(F, P) ≤ ∫ ba F ≤ U(F, P) widzimy, że∣∣∣∣∣∫σ f ds −∫ b

aF

∣∣∣∣∣ < 2ε.

Page 117: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.2. CAŁKA KRZYWOLINIOWA 113

Z dowolności ε wynika teza.

4.2.5 UWAGA: Jeśli krzywa σ jest kawałkami gładka (patrz str. 110), to wzór z powyższegotwierdzenia jest również prawdziwy. Mianowicie dla dowolnego i = 1, ..., n, obcięcie σi :=σ|[ti−1,ti] : [ti−1, ti]→ RN jest gładka i, wówczas, mamy∫

σf ds = n∑

i=1∫σif ds = n∑

i=1∫ ti

ti−1 f (σ (t))‖σ ′(t)‖dt.Warto zastanowić się do jakiego stopnia całka krzywoliniowa ∫σ f ds zależy od parametry-zacji nośnika.

4.2.6 TWIERDZENIE: Przypuśćmy, że dane są dwie krzywe σ : [a, b]→ RN oraz τ : [c, d]→ RN

oraz ciągła i monotoniczna bijekcja u : [a, b] → [c, d] taka, że σ = τ u. Jeśli jedna z tychkrzywych jest prostowalna, to druga też jest prostowalna, krzywe τ i σ mają te same nośniki.Jeśli funkcja f : C → R, gdzie C = σ ([a, b]) = τ([c, d]) jest ograniczona i całkowalna na jednejz tych krzywych, to jest całkowalna na drugiej i

∫σ f ds = ∫τ f ds.DOWÓD: Przede wszystkim zauważmy, że założenia odnośnie u implikują, że funkcja odwrotna

v := u−1 : [c, d] → [a, b] jest ciągłą i monotoniczną bijekcją oraz τ = σ v . Można zatemzałożyć, że krzywa σ jest prostowalna i dowieść, że prostowalna jest krzywa τ , a następnie,założywszy całkowalność f na σ , pokazać całkowalność f na τ i równość całek.Równość nośników krzywych σ i τ jest oczywista, zaś prostowalność krzywej τ (przyzałożeniu prostowalności σ ) została pokazana w uwadze 11.2.6 (3) książki ?? (tam też pokazano,że długości krzywych σ i τ są równe).Zakładam, że f jest całkowalna na σ . Ustalmy ε > 0. Zatem istnieje podział P = t0, ..., tnodcinka [a, b] taki, że U(f , P, σ ) − L(f , P, σ ) < ε. Niech Q = u(P), tj. Q = s0, ..., sn, gdziesi = u(ti), i = 0, ..., n. Jeśli u jest funkcją rosnącą, to Q jest podziałem odcinka [c, d], zaśjeśli u jest funkcją malejącą, to podziałem jest Q = sn, sn−1, ..., s0. W obu przypadkach, dladowolnego i = 1, ..., n, długość V (τ|[si−1,si]) = V (σ|[ti−1,ti]) (lub V (τ|[si,si−1]) = V (σ|[ti−1,ti]), o ile ujest malejąca). Ponadto

supt∈[ti−1,ti] f (σ (t)) = sup

s∈[si−1,si] f (τ(s)) (lub sups∈[si,si−1] f (τ(s))),

inft∈[ti−1,ti] f (σ (t)) = inf

s∈[si−1,si] f (τ(s)) (lub infs∈[si,si−1] f (τ(s))).

Tak więcL(f , P, σ ) = L(f ,Q, τ), U(f , P, σ ) = U(f ,Q, τ),co dowodzi całkowalności f na krzywej τ i równość całek, bo

L(f ,Q, τ) ≤ ∫τf ds ≤ U(f ,Q, τ) oraz L(f , P, σ ) ≤ ∫

σf ds ≤ U(f , P, σ ).

ĆWICZENIE: Pokazać na przykładzie, że można znaleźć dwie krzywe o wspólnym nośniku,dla których całki krzywoliniowe są różne.4.2.B Całka krzywoliniowa II-go rodzaju

Przypuśćmy, że σ = (σ1, ..., σN ) : [a, b]→ U ⊂ RN , gdzie U jest zbiorem otwartym, jest krzywąklasy C1 i pole wektorowe F : U → RN jest ciągłe. Całką krzywoliniową II-rodzaju nazywamy

Page 118: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

114 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHwyrażenie ∫

σF := ∫ b

a〈F (σ (t)), σ ′(t)〉dt = N∑

i=1∫ b

aFi(σ (t))σ ′i (t)dt.

Całka po prawej stronie jest poprawnie określona, gdyż funkcja podcałkowa jest ciągła, czylicałkowalna.4.2.7 UWAGA: (1) Aby właściwie zinterpretować całkę krzywoliniową pola F , odwołamy się dopojęcia pracy z fizyki. Przypomnijmy, że praca wykonana przez stałą siłę F = (F1, F2, F3) pod-czas przesunięcia ciała w przestrzeni R3 z punktu a do punktu b o odległość d = ‖b − a‖w kierunku działania siły wynosi W = ‖F‖d. Jeśli zaś ruch odbywa się wzdłuż od punktu ado punktu b wzdłuż odcinka [a;b] łączącego te punkty, lecz nierównoległego do kierunkudziałania siły F , to w celu obliczenia pracy siły F należy rozważyć iloczyn długości składowejsiły F w kierunku wyznaczonym przez punkty a i b i odległości pomiędzy tymi punktami: awięc W = 〈F, b − a〉.Na przykład praca wykonana przez siłę grawitacji podczas zsuwania się (bez tarcia) ciała omasie 10 kg po równi pochyłej o nachyleniu 45 na odległość 5 m wynosi 5[m] ·10[kg ] ·g[m/s2]/√2,gdzie g = 9, 81[m/s2] jest wielkością przyśpieszenia ziemskiego.(2) Zamiast „gotowej” formuły definiującej całkę ∫σ można przedstawić podejście ogólniej-sze, które jednak przy podanych założeniach (ciągłość pola F i gładkość krzywej) prowadzi dowyżej przyjętej definicji. Mianowicie, dla podziału P = t0, t1, ..., tn odcinka [a, b] definiujemy„górną sumę całkową” postaci

n∑i=1

N∑j=1 sup

t∈[ti−1,ti]Fj (σ (t))(σj (ti)− σj (ti−1)),oraz „dolną sumę całkową” postaci

n∑i=1

N∑j=1 inf

t∈[ti−1,ti]Fj (σ (t))(σj (ti)− σj (ti−1)),po czym – w celu zdefiniowania „całkowalności” i całki ∫σ F postępuje się analogicznie jakpowyżej lub w przypadku całki Riemanna.(3) Często, zamiast używanego wyżej stosuje się oznaczenie∫

σF = ∫

σF1(x)dx1 + F2(x)dx2 + ...+ FN (x)dxN = ∫

σ

N∑i=1 Fi(x)dxi.

Pochodzenie tego oznaczenia wyjaśni się niebawem.W zastosowaniach mamy najczęściej do czynienia z przypadkiem N = 2 lub N = 3;wówczas najbardziej tradycyjne oznaczenia wyglądają następująco: F = (P,Q) (tzn. F1 = Poraz F2 = Q) oraz ∫σF = ∫

σP(x, y)dx +Q(x, y)dy,

lub F = (P,Q,R) oraz∫σF = ∫

σP(x, y, z)dx +Q(x, y, z)dy + R(x, y, z)dz.

4.2.8 TWIERDZENIE: Przypuśćmy, że dane są dwie krzywe klasy C1 σ : [a, b] → U ⊂ RN orazτ : [c, d] → RN oraz rosnąca bijekcja u : [a, b] → [c, d] klasy C1 taka, że σ = τ u. Jeśli polewektorowe F : U → RN jest ciągłe,całkowalna na jednej z tych krzywych, to

∫σ F = ∫τ F .

Page 119: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.2. CAŁKA KRZYWOLINIOWA 115

DOWÓD: Oczywiście u(a) = c i u(b) = d. Niech G(s) := 〈f (τ(s), τ ′(s)〉 dla s ∈ [c, d]. WówczasGu(t) = 〈F (σ (t), σ ′(t)〉. Z twierdzenia o zamianie zmiennych w całce Riemanna (funkcji jednejzmiennej) ∫

τF = ∫ d

c〈f (τ(s)), τ ′(s)〉ds = ∫ u(b)

u(a) G(s)ds == ∫ b

aG(u(t))u′(t)dt = ∫ b

a〈F (σ (t)), σ ′(t)〉dt = ∫

σF.

4.2.9 UWAGA: (1) Przypuśćmy, że σ : [a, b]→ RN jest kawałkami klasy C1 (patrz przypis na str.110 oraz uwaga 4.2.5). Wówczas definiujemy∫σF = n∑

i=1∫σiF = n∑

i=1∫ ti

ti−1〈F (σ (t)), σ ′(t)〉dt,gdzie σi = σ|[ti−1,ti] jest już krzywą gładką.

W dalszym ciągu zakładamy zazwyczaj, że rozważane krzywe są kawałkami gładkie.(2) W samym pojęciu krzywej σ : [a, b] → RN tkwi jej „orientacja”: określony jest jejpoczątek σ (a) oraz koniec σ (b), a więc wraz ze wzrostem parametru t od a do b, punktσ (t) wędruje od początku ku końcowi. Jeśli krzywe σ i τ spełniają założenia poprzedniegotwierdzenia, krzywe te mają wspólny nośnik i mają tę samą orientację.(3) Powiemy, że krzywe σ : [a, b]→ U ⊂ RN i τ : [c, d]→ RN są zorientowane przeciwnie,tzn. dana jest malejąca bijekcja u : [a, b]→ [c, d] klasy C1 tak, że σ = τ u. Czytelnik dostrzeże,że krzywe zorientowane przeciwnie mają taki sam nośnik, lecz początek krzywej σ jest końcemkrzywej τ i na odwrót: początek τ jest końcem krzywej σ .Najprostszym przykładem krzywej zorientowanej przeciwnie do σ jest krzywa τ : [a, b]→RN zadana wzorem τ(t) = σ (b + a − t), t ∈ [a, b]; tutaj u : [a, b]→ [a, b] i u(t) = b + a − t dlat ∈ [a, b]. tak zdefiniowaną krzywą oznacza się symbolem −σ .ĆWICZENIE: Pokazać, że jeśli krzywa τ jest zorientowana przeciwnie do krzywej σ , to dlaciągłego pola wektorowego F : U → RN∫

σF = −∫

τF.

W szczególności ∫−σ

F = −∫σF.

W związku z tą własnością (patrz też twierdzenie 4.2.6) całkę I-go rodzaju nazywa się całkąkrzywoliniową niezorientowaną, zaś całkę II-go rodzaju – całką zorientowaną.Podstawowe własności całki zorientowanej są następujące (dowód dla Czytelnika).4.2.10 TWIERDZENIE: Przypuśćmy, że krzywa σ : [a, b] → U ⊂ RN jest kawałkami gładka,zbiór U jest otwarty, a pola wektorowe F,G : U → RN są ciągłe. Wówczas, dla każdychα, β ∈ R, ∫

σ(αF ± βG) = α

∫σF ± β

∫σG.

Jeśli krzywa σ jest połączeniem krzywych σ1, σ2, to wówczas są to krzywe kawałkami gładkie(4) oraz ∫

σF = ∫

σ1 F + ∫σ2 F.

4Oczywiście połączenie krzywych kawałkami gładkich jest krzywą kawałkami gładką.

Page 120: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

116 4. CAŁKOWANIE FORM RÓŻNICZKOWYCH4.2.C Całka krzywoliniowa i zachowawczość pól wektorowych

4.2.11 TWIERDZENIE: (1) Jeśli σ : [a, b]→ U , gdzie U ⊂ RN jest zbiorem otwartym, jest krzywąkawałkami gładką , zaś pole wektorowe ciągłe F : U → RN jest zachowawcze o potencjale f ,to ∫

σF = f (σ (b))− f (σ (a)).

Jeśli więc krzywa σ jest zamknięta (tzn. σ (a) = σ (b)), to∫σF = 0.

(2) Jeśli spełniona jest porzednia teza, tzn. ciągłe pole wektorowe F : U → RN ma tęwłasność, że dla dowolnej zamkniętej krzywej σ : [a, b] → U całka

∫σ F = 0, to F jest polem

zachowawczym.

4.2.12 UWAGA: Założenie przyjęte w części (2) jest równoważne następującemu założeniu: dladowolnych punktów x, y ∈ U jeśli krzywe kawałkami gładkie σ : [a, b] → U i τ : [c, d] → Umają początek w x, zaś koniec w y (tzn. σ (a) = τ(c) = x oraz σ (b) = τ(d) = y), to ∫σ F = ∫τ F :a więc całka z pola F zależy jedynie od początku i końca krzywej.Istotnie: przypuśćmy, że całka wzdłuż dowolnej krzywej zamkniętej znika i niech c będziepołączeniem krzywych σ i −τ . Jest to krzywa zamknięta: zatem 0 = ∫c F = ∫

σ F + ∫−τ F =∫σ F −

∫τ F .Na odwrót, przy założeniu, że całka zależy tylko od początku i końca widzimy, że całkapo krzywej zamkniętej z pola F znika. Istotnie: niech σ : [a, b] → RN będzie dowolną krzywązamkniętą. Wówczas jest ona połączeniem krzywych σ1 := σ|[a,c] : [a, c] → RN , σ2 := σ|[c,b] :[c, b] → RN , gdzie a < c < b. Oczywiście wówczas krzywe σ1 i −σ2 mają wspólny początek ikoniec. A więc, zgodnie z założeniem, ∫σ1 F = ∫−σ2 F = − ∫σ2 F . Stąd∫

σF = ∫

σ1 F + ∫σ2 F = 0.

DOWÓD TWIERDZENIE 4.2.11: (1) Załóżmy, że f : U → R jest potencjałem dla F ; wówczas fjest funkcją klasy C1 (bo ∇f = F jest odwzorowaniem ciągłym) i dla dowolnego t ∈ [a, b] (adokładniej dla tych t , dla których istnieje pochodna σ ′(t) – patrz też przypis na str. 110),(f σ )′(t) = 〈∇f (σ (t)), σ ′(t)〉 = 〈F (σ (t)), σ ′(t)〉.

Innymi słowy funkcja [a, b] 3 t 7Ï 〈F (σ (t)), σ ′(t)〉 ma pierwotną g := f σ . W takim razie∫σF = ∫ b

ag ′(t)dt = g(b)− g(a) = f (σ (b))− f (σ (a)).

(2) Bez zmniejszenia ogólności można zakładać, że zbiór U jest obszarem (w przeciwnymrazie osobno rozważa się każdą składową (łukowej) spójności). Będziemy konstruować poten-cjał f dla F (konstrukcja ta jest interesująca i ma dość „ogólny” charakter).Ustalmy dowolnie punkt x0 ∈ U . Dla x ∈ U wybierzmy krzywą σx , która łączy punkty x0i x (x0 jest jej początkiem, zaś x – końcem); taka krzywa istnieje w świetle założonej powyżejłukowej spójności zbioru U . Następnie zdefiniujmyf (x) := ∫

σxF.

Page 121: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.2. CAŁKA KRZYWOLINIOWA 117

Ta definicja jest poprawna, tzn. nie zależy od wyboru krzywej σx , gdyż (patrz powyższa uwaga),jeśli τx jest inną krzywą, która łączy punkty x0 i x, to ∫σx F = ∫τx F .Zdefiniowaliśmy tym sposobem funkcje f : U → R. Pokażemy, że f jest funkcją klasyC1 i ∇f (x) = F (x) dla każdego x ∈ U . W tym celu wystarczy pokazać, że f|i(x) = Fi(x) dlai = 1, ..., N i x ∈ U . Rzeczywiście, wtedy funkcja f będzie mieć ciągłe pochodne cząstkowe, coimplikuje, że jest ona różniczkowalna i ∇f = F na U .Ustalmy i = 1, ..., N oraz x ∈ U ; zauważmy, że Fi(y) = 〈F (y), ei〉 dla dowolnego y ∈ U . Gdys > 0 jest dostatecznie małe, to

f (x + sei)− f (x) = ∫[x;x+sei] F,gdzie [x;x+sei] jest odcinkiem łączącym x z x+sei (a więc s musi być na tyle małe, aby odcinek[x;x + sei] ⊂ U), a z naszego punktu widzenia krzywą o parametryzacji τ(t) = x + tei , dlat ∈ [0, s]. Rzeczywiście: jako krzywą σx+sei (za pomocą której określona jest wartość f (x+sei))można wziąć połączenie krzywych σx i odcinka [x;x + sei]. W takim razie

f (x + sei)− f (x) = ∫ s

0 〈F (τ(t)), τ ′(t)〉dt = ∫ s

0 〈F (x + tei), ei〉dt = ∫ s

0 Fi(x + tei)dt.Stąd∣∣∣∣ f (x + sei)− f (x)

s − Fi(x)∣∣∣∣ = ∣∣∣∣ f (x + sei)− f (x)− sFi(x)s

∣∣∣∣ = 1s

∣∣∣∣∫ s

0 (Fi(x + tei)− Fi(x))dt∣∣∣∣→ 0,gdy s→ 0, ponieważ∣∣∣∣∫ s

0 (Fi(x + tei)− Fi(x))dt∣∣∣∣ ≤ ∫ s

0 |Fi(x + tei)− Fi(x)|dt ≤ s supt∈[0,s] |Fi(x + tei)− Fi(x)|

oraz, wykorzystując ciągłości składowej Fi , supt∈[0,s] |Fi(x + tei) − Fi(x)| → 0, gdy s → 0.Analogiczne rozumowanie przeprowadzimy (uczyni to Czytelnik) dla małego s < 0.Pokazaliśmy więc, żef|i(x) = lim

s→0 f (x + sei)− f (x)s = Fi(x).

W powyższym twierdzeniu uzyskaliśmy więc warunek dostateczny zachowawczości cią-głych pół wektorowych.4.2.13 UWAGA: Analizując dowód podanego twierdzenia łatwo dostrzec, że na to by ciągłe polewektorowe F : U → RN było lokalnie zachowawcze (tzn. każdy punkt x0 ∈ U ma otoczenie V ,w którym istnieje potencjał, a więc różniczkowalna funkcja f : V → R taka, że∇f (x) = F (x) dlax ∈ V ) potrzeba i wystarcza, aby znikała całka krzywoliniowa tego pola wzdłuż zorientowanegobrzegu dowolnego trójkąta zawartego w U , tzn. dla dowolnych punktów a, b, c ∈ U takich, żeuwypuklenie conva, b, c := x = λ1a + λ2b + λ3c | λ1 + λ2 + λ3 = 1, λ1, λ2, λ3 ≥ 0 ⊂ U ,∫σ F = 0, gdzie σ jest krzywą zamkniętą będąca połączeniem krzywych parametryzującychodcinki [a;b], [b; c] oraz [c;a].Z kolei lokalna zachowawczość implikuje, że jeśli pole F jest różniczkowalne, to Fi|j (x) =Fj|i(x) dla dowolnego x ∈ U (ten sam dowód co wyżej, bo przecież pochodna jest ex definitionepojęciem lokalnym).

Page 122: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

118 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHMa także miejsce piękny (i dość trudny w dowodzie) lemat Goursata:

4.2.14 LEMAT (Goursat) Przypuśćmy, że pole F : U → RN , gdzie U ⊂ RN jest zbiorem otwar-tym, jest różniczkowalne i macierz Jacobiego JF (x) jest symetryczna (tzn. Fi|j (x) = Fj|i(x) dladowolnego x ∈ U (5)). Wówczas dla dowolnych a, b, c ∈ U takich, że trójkąt conva, b, c ⊂ Ucałka pola wzdłuż zorientowanego brzegu tego znika.

4.2.15 WNIOSEK: Przy założeniach lematu Goursata, jeśli zbiór U jest wypukły lub gwiaździsty,to pole F jest zachowawcze.DOWÓD: Ustalmy a ∈ U taki, że dla każdego x ∈ U odcinek [a;x] ⊂ U (gdy U jest zbioremwypukłym, to a można wziąć dowolnie, zaś gdy U jest zbiorem gwiaździstym, to a może byćjego środkiem) i dla dowolnego x ∈ U zdefiniujmy

f (x) = ∫[a,x] F.Funkcja f jest poprawnie określona; twierdzę, że jest ona potencjałem dla F . Dla dowoduustalmy i = 1, ..., N , x ∈ U i zauważmy, że jeśli x ∈ U i jeśli tylko s ∈ R jest dostatecznie małe,to trójkąt conva, x, x + sei ⊂ U , czyli po wykorzystaniu lematu Goursata∫σF = 0,

gdzie σ jest brzegiem tego trójkąta. Stądf (x + sei)− f (x) = ∫[x,x+sei] F.Dowód równości f|i(x) = Fi(x) przebiega jak w dowodzie twierdzenia 4.2.11 (2). Widzimy więc, że jeśli tylko zbiór jest wypukły (lub gwiaździsty), to dla różniczkowalnegopola następujące warunki są równoważne:

• znikanie całki wzdłuż dowolnej (kawałkami gładkiej) krzywej zamkniętej;• zachowawczość pola;• symetryczność macierzy Jacobiego JF (x) w każdym punkcie x ∈ U .ĆWICZENIE: Podać dowód tego twierdzenia zakładając, że pole jest klasy C1, lecz bez wy-korzystania lematu Goursata.Okazuje się, że to twierdzenie można uogólnić zakładając mniej o zbiorze U .Mówimy, że zbiór A ⊂ RN jest jednospójny, jeżeli jest łukowo spójny oraz dowolne dwieciągłe krzywe σi : [a, b] → RN , i = 0, 1, zamknięte (tzn. σ0(a) = σ1(a) = σ0(b) = σ1(b)) sąhomotopijne, a więc istnieje ciągłe odwzorowanie σ : [a, b]× [0, 1]→ U takie, że σ (t, i) = σi(t)dla t ∈ [a, b], σ (a, s) = σ (b, s) dla dowolnego s ∈ [0, 1].Jednospójność oznacza, że mając dwie krzywe o wspólnych końcach i początkach, możnajedną z nich zdeformować w sposób ciągły do drugiej.ĆWICZENIE: Udowodnij, że dowolny zbiór gwiaździsty, a więc w szczególności również zbiórwypukły, jest jednospójny.4.2.16 TWIERDZENIE: Przypuśćmy, że zbiór U jest jednospójny, F : U → RN jest różniczko-walnym polem wektorowym. Wówczas pole F jest zachowawcze wtedy i tylko wtedy, gdy dladowolnego x ∈ U , macierz Jacobiego JF (x) jest symetryczna, czyli Fi|j (x) = Fj|i(x).

5A więc ma miejsce warunek konieczny zachowawczości.

Page 123: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.3. ALGEBRA ZEWNĘTRZNA 119

DOWÓD: Oczywiście należy pokazać, że symetria macierz Jacobiego implikuje zachowawczość.W tym celu wystarczy pokazać, że całka pola F wzdłuż dowolnej krzywej kawałkami gładkiejzamkniętej znika. W tym celu wystarczy udowodnić następujący lemat:4.2.17 LEMAT: Jeśli pętle (czyli krzywe zamknięte) σ0 i σ1 są kawałkami gładkie i homotopijne,to ∫

σ0 F = ∫σ1 F.Przypuśćmy, że tak jest. Weźmy dowolną pętlę γ : [a, b]→ RN ; z założenia jednospójnościjest ona homotopijna z pętlą stałą τ (tzn. τ(t) = c ∈ U dla t ∈ [a, b]. Wtedy∫

γF = ∫

τF = 0.

Dowód lematu nie jest trudny; wiąże się jednak z pewnymi dodatkowymi rezultatami niezawartymi w tym skrypcie.

4.2.D Całka zorientowana vs. całka podwójna - twierdzenie Greena

Sformułujemy teraz twierdzenie, które mówi o związku całki krzywoliniowej z całką podwój-ną. Jednak najpierw musimy się do tego twierdzenia przygotować.Przypuśćmy, że γ : [a, b] → R2 jest krzywą kawałkami gładką, zamkniętą, bez samo-przecięć (tzn. funkcja γ|[a,b) jest różnowartościowa (6)) o nośniku K; zatem γ(t) = (x(t), y(t)),t ∈ [a, b], gdzie x, y : [a, b] → R są funkcjami (kawałkami) klasy C1. Z bardzo niebanalne-go twierdzenia Jordana-Schönfliesa wynika, że zbiór R2 \ K jest sumą dwóch obszarów (tzn.zbiorów otwartych łukowo spójnych) z których jeden, oznaczony symbolem D jest zbioremograniczonym, zaś drugi nie.Załóżmy teraz, że krzywa γ ma tę własność, że poruszając się wzdłuż nośnika wraz zrosnącym parametrem t ∈ [a, b] zbiór D znajduje się po lewej stronie.4.2.18 TWIERDZENIE: Zbiór D jest mierzalny w sensie Jordana. Jeśli pole wektorowe F = (P,Q)określone na pewnym otoczeniu otwartym zbioru D jest klasy C1, to∫

γF = ∫

D(qx − Py )dxdy.

Dowód tego twierdzenia (w pełnej ogólności) wykracza poza ramy dotychczasowego ma-teriału. Przeprowadzimy go w następnej części (poniżej).4.3 Algebra zewnętrzna

Jak poprzednio Lk(RN ,R), gdzie k ≥ 1, oznacza przestrzeń liniową form k-liniowych nad RN ,czyli k-liniowych przekształceń T : RN × ...× RN︸ ︷︷ ︸k

→ R.FORMY ALTERNUJĄCE Mówimy, że forma k-liniowa T ∈ Lk(RN ,R) jest alternująca lub

skośnie symetryczna, jeśli dla dowolnych wektorów v1, ..., vk ∈ RN oraz permutacji σ ∈ SkT(vσ (1), ..., vσ (k)) = sgn (σ )T(v1, ..., vk),

6Takie krzywe nazywa się łukami Jordana, lub krzywymi zwykłymi (i zamkniętymi).

Page 124: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

120 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHgdzie, jak zwykle, Sk oznacza grupę symetryczną zbiory k-elementowego, zaś sgn (σ ) oznaczaznak permutacji σ ∈ Sk .Zbiór wszystkich form k-liniowych alternujących oznaczamy symbolem Ak(RN ). Oczywi-ście A1(RN ) = L1(RN ,R) = L(RN ,R) jest zbiorem wszystkich funkcjonałów (form) liniowych.UWAGA: Dodatkowo przyjmuje się, że A0(RN ) = R.ĆWICZENIE: Pokazać, że:(1) forma k-liniowa T ∈ Lk(Rn,R) jest alternująca wtedy i tylko wtedy, gdy T(v1, .., vk) = 0 dladowolnego układu v1, ..., vk ∈ Rk , w którym vi = vj dla pewnych 1 ≤ i, j ≤ k, i 6= j ;(2) zbiór Ak(RN ) jest podprzestrzenią liniową przestrzeni Lk(RN ,R).

ALTERNACJA FORM k-LINIOWYCH Definiujemy operację Alt : Lk(RN ,R) → Ak(RN ), któraformom k-liniowym przyporządkowuje k-liniowe formy alternujące w następujący sposób:Alt(T)(v1, ..., vk) := 1

k! ∑σ∈Sk

sgn (σ )T(vσ (1), ..., vσ (k)), T ∈ Lk(RN ,R), v1, ..., vk ∈ RN .

ĆWICZENIE: Sprawdzić, że jeśli T ∈ Ak(RN ), to Alt(T) = T . Podobnie dla dowolnego T ∈Lk(RN ,R), Alt(Alt(T)) = Alt(T).

MNOŻENIE ZEWNĘTRZNE Definiujemy działanie ∧ :Ak(RN )×Am(RN )→Ak+m(RN ) wzo-rem(T ∧ S)(v1, ..., vk, vk+1, ..., vk+m) := 1

k!m! ∑σ∈Sk+m

sgn (σ )T(vσ (1), ..., vσ (k))S(vσ (k+1), ..., vσ (k+m)),dla T ∈ Ak, S ∈ Am(RN ) i v1, ..., vk+m ∈ RN .ĆWICZENIE: Pokazać, że mają miejsce następujące własności:(1) ∧ jest działaniem dwuliniowym: dla T, T ′ ∈ Ak(RN ) i S ∈ Am(RN ), (T+T ′)∧S = T∧S+T ′∧S,dla S′ ∈ Am(RN ), T ∧ (S + S′) = T ∧ S + T ∧ S′ i dla λ ∈ R, T ∧ (λS) = (λT) ∧ S = λ(T ∧ S);(2) Dla T ∈ Ak(RN ), S ∈ Am(RN ),

T ∧ S = (−1)kmS ∧ T ;(3) Dla T ∈ Ak(RN ), S ∈ Am(RN ) i U ∈ An(RN ),

(T ∧ S) ∧ U = T ∧ (S ∧ U) ∈ Ak+m+n(RN ).(4) Jeśli pi ∈ L(RN ,R) =A1(RN ), i = 1, ..., k, to dla dowolnych v1, ..., vk ∈ RN ,

(p1 ∧ p2 ∧ ... ∧ pk)(v1, ..., vk) = det[pi(vj )]i,j=1,...,k.(5) Dla dowolnego p ∈ L(RN ,R), p ∧ p = 0; ogólniej: jeśli formy liniowe pi , i = 1, ..., k sąliniowo zależne, to p1 ∧ ... ∧ pk = 0.

BAZA PRZESTRZENIAk(RN ) Niech (e1, ..., eN ) będzie bazą kanoniczną w RN , zaś (π1, ..., πN )bazą dualną w L(RN ,R), tzn. πi(ej ) = δij dla dowolnych 1 ≤ i, j ≤ N .Jeśli k > N i T ∈ Ak(RN ), to T = 0. Istotnie: niech v1, ..., vk ∈ RN . Wtedyvj = N∑

i=1 πi(vj )ei, i = 1, ..., k.

Page 125: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.3. ALGEBRA ZEWNĘTRZNA 121

ZatemT(v1, ..., vk) = N∑

j1,...,jk=1πj1 (v1)...πjk (vk)T(ej1 , ..., ejk ) = 0,bowiem w układzie ej1 , ..., ejk przynajmniej dwa wektory są równe.Jeśli k ≤ N , to

T(v1, ..., vk) = ∑1≤j1<j2<...<jk≤N

∑σ∈Sk

sgn (σ )πjσ (1) (v1)...πjσ (k) (vk)T(ej1 , ..., ejk ) =∑

1≤j1<j2<...<jk≤N det[πjs (vr)]s,r=1,...,kT(ej1 , ..., ejk ) =∑1≤j1<j2<...<jk≤N αj1...jk (πj1 ∧ πj2 ∧ ... ∧ πjk )(v1, ..., vk),

gdzie αj1...jk := T(ej1 , ..., ejk ). Tak więcT = ∑

1≤j1<j2<...<jk≤N αj1...jk (πj1 ∧ πj2 ∧ ... ∧ πjk ).Dowodzi to, że k-formy πj1 ∧ ... ∧ πjk1≤j1<...<jk≤N rozpina przestrzeń Ak(RN ).ĆWICZENIE: Wykazać, że powyższy zbiór jest liniowo niezależny.Stąd wynika, że układ πj1 ∧ πj2 ∧ ... ∧ πjk1≤j1<j2<...<jk≤N tworzy bazę przestrzeni Ak(RN ).W taki razie również dimAk(RN ) = (Nk).KONKLUZJA: Dla każdego T ∈ Ak(RN ) jednoznacznie istnieją liczby (aj1...jk )1≤j1<...<jk≤N takie,że

T = ∑1≤j1<...<jk≤N aj1...jk πj1 ∧ ... ∧ πjkoraz, dla dowolnych wektorów v1, ..., vk ,

T(v1, ..., vk) = ∑1≤j1<...<jk≤N aj1...jk det[πjs (vr)]s,r=1,...,k.

Warto dostrzec czym jest wyznacznik det[πjs (vr)]s,r=1,...,k . Otóż jest to wyznacznik macierzypostaci vj11 vj12 ... vj1kvj21 vj22 ... vj2k... ... . . . ...vjk1 vjk2 ... vjkk

= [vjsr ]s,r=1,...,k,

gdzie vr = (v1r, ..., vNr) dla r = 1, ..., k, a więc z macierzy (prostokątnej) [v1|v2|...|vk] nale-ży stworzyć macierz kwadratową poprzez wybór wierszy o numerach j1, ..., jk i odrzuceniepozostałych.ORIENTACJA PRZESTRZENI RN Dwie (uporządkowane) bazy (v1, ..., vN ) i (w1, ..., wN ) sąrelacji, gdy dla pewnej N-formy T ∈ AN (RN ), T 6= 0, znaki wyrażeń T(v1, ..., vN ) i T(w1, ..., wN )są takie same.Wykażemy, że relacja ta nie zależy od wyboru formy T , zaś podana definicja orientacji jestrównoważna ze starą definicją orientacji.

Page 126: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

122 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHNiech [akj ]k,j=1,...,N będzie macierzą przejścia od bazy (v1, ..., vN ) do bazy (w1, ..., wN ), tzn.

vj =∑k=1 akjwk.

Wówczas [v1, ..., vN ] = [w1, ..., wN ] wtedy i tylko wtedy, gdy det[akj ] > 0.Rzeczywiście: przypuśćmy, że det[akj ] > 0; niech (dowolna, niezerowa N-forma) T = α(π1∧... ∧ πN ) ∈ AN (RN ), gdzie α 6= 0. Wtedy

T(v1, ..., vN ) = α det[πi(vj )] = det[( N∑k=1 akjπi(wk)] =

α det[akj ] det[πi(wk)] = det[akj ]α(π1 ∧ ... ∧ πN )(w1, ..., wN ) = det[akj ]T(w1, ..., wN ).Tak więc znaki wartości T(v1, ..., vN ) i T(w1, ..., wN ) są tego samego znaku.Na odwrót: z powyższego wynika, że jeśli dla pewnej niezerowej N-formy T ∈ AN (RN )wyrażenia T(v1, ..., vN ) i T(w1, ..., wN ) są tego samego znaku, to wyznacznik det[akj ] macierzyprzejścia jest dodatni.Łatwo więc dostrzec, że podana relacja jest relacją równoważności. Tak więc rodzinawszystkich (uporządkowanych) baz przestrzeni RN została podzielona na dwie klasy abstrak-cji. Każdą z klas nazywamy orientacją przestrzeni RN i orientację zawierającą bazę (v1, ..., vN )oznaczamy symbolem [v1, ..., vN ].Orientację [e1, ..., eN ], wyznaczoną przez uporządkowaną bazę kanoniczną (e1, ..., eN ) na-zywa się orientacją kanoniczną.

ILOCZYN WEKTOROWY Niech N ≥ 3. Definiujemy skośnie symetryczne odwzorowanie(N − 1)-liniowe T ∈ LN−1(RN ,RN ) w następujący sposób: dla v1, ..., vN−1 ∈ RN odwzorowanieRN 3 w 7Ï φ(w) := det[v1|v2|...|vN−1|w]

(wektory v1,...,wN−1 i w zapisane jako kolumny) jest funkcjonałem liniowym. Istnieje wobectego dokładnie jeden wektor a = T(v1, ..., vN−1) ∈ RN taki, żeφ(w) = 〈w, a〉.

Wektor a = T(v1, ..., vN−1) nazywa się iloczynem wektorowym wektorów v1, ..., vN−1 i oznaczasymbolem v1 × v2 × ...× vN−1.UWAGA: Bez trudu można podać jawną postać wektora w = v1×v2× ...×vN−1. Mianowiciejeśli w = (w1, ..., wN ), towi = (−1)N+iAi,gdzie Ai oznacza wyznacznik macierzy powstałej poprzez wykreślenie i-tego wiersza w macie-rzy [v1|...|vN−1] ∈ MN×(N−1). Uważny Czytelnik spostrzeże, że współrzędna wi , i = 1, ..., N , jestdopełnieniem algebraicznym wyrazu xi w macierzy

[v1|...|vN−1|x] =v11 v12 ... v1(N−1) x1v21 v22 ... v2(N−1) x2... ... . . . ... ...vN1 vN2 ... vN(N−1) xN

,gdzie – oczywiście vi = (v1i, v2i, ..., vNi) dla i = 1, ..., N − 1.

Page 127: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.4. FORMY RÓŻNICZKOWE 123

Przykładowo dla N = 3, vi = (v1i, v2i, v3i), i = 1, 2, macierz ta ma postać[v1|v2|x] = v11 v12 x1

v21 v22 x2v31 v32 x3

;zatem: dopełnienie algebraiczne wyrazu x1 w tej macierzy wynosi v21v32− v31v22, dopełnieniealgebraiczne wyrazu x2 wynosi v31v12− v11v32, zaś wyrazu x3 wynosi v11v22− v12v21. Tak więc

v1 × v2 = (v21v32 − v31v22, v31v12 − v11v32, v11v22 − v12v21).ĆWICZENIE: Mają miejsce własności:(1) Iloczyn wektorowy jest, jako funkcja czynników, odwzorowaniem (N − 1)-liniowym ialternującym;(2) Norma ‖v1×...×vN−1‖ jest objętością graniastosłupa rozpiętego przez wektory v1, ..., vN−1;(3) iloczyn wektorowy v1× ...× vN−1 jest prostopadły do podprzestrzeni spanv1, ..., vN−1rozpiętej przez te wektory;(4) Jeśli wektory v1, ..., vN−1 sa liniowo niezależne, to wraz z iloczynem wektorowym

v1 × ...× vN−1 tworzą bazę w przestrzeni RN należącą do orientacji kanonicznej.UWAGA: Czasem wygodnie jest wprowadzić „iloczyn wektorowy” w przestrzeni R2. Powta-rzając powyższą konstrukcję naturalnie jest przyjąć: dla v = (v1, v2) ∈ R2, v× := a, gdzie〈a,w〉 = det[v|w]. Tak więc a1w1 + a2w2 = v1w2 − v2w1, czyli a1 = −v2, a2 = v1 i

v× = (−v2, v1).4.4 Formy różniczkowe

4.4.A Podstawowe definicje

Niech U ⊂ RN będzie zbiorem otwartym i niech k ≥ 0. Dowolną funkcję ω : U → A(RN )nazywa się formą różniczkową rzędu k lub k-formą różniczkową. Zbiór k-form oznaczamyΛk(U).UWAGA: Dla k = 0, A0(RN ) = R, więc 0-formą jest funkcja ω : U → R; tak więc Λ0(U) jestzbiorem funkcji U → R.Niech k ≥ 1 i ω ∈ Λk(U). Dla dowolnego x ∈ U , ω(x) ∈ Ak(RN ) a więcω(x) = ∑

1≤j1<...<jk≤N aj1...jk (x)πj1 ∧ ... ∧ πjk .gdzie liczby

aj1...jk (x) = ω(x)(ej1 , ..., ejk )są wyznaczone jednoznacznie. Tym samym zadane są funkcje aj1...jk : U → R. Piszemy wówczas:ω = ∑

1≤j1<...<jk≤N aj1...jk πj1 ∧ ... ∧ πjk .Mówimy, ze k-forma różniczkowa ω jest ciągła (odp. różniczkowalna, klasy Cr , gdzie

r ≥ 1), jeżeli dla każdego układu 1 ≤ j1 < ... < jk ≤ N , funkcja aj1...jk : U → R jest ciągła (odp.różniczkowalna, klasy Cr).

Page 128: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

124 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHKWESTIA NOTACJI: Przypomnijmy, że πj : RN → R, j = 1, ..., N , jest przekształceniemrzutowania. Jest to przekształcenie liniowe, a zatem dla dowolnego x ∈ RN pochodna π ′j (x) = πj .Ze względów tradycji odwzorowanie πj oznacza się dxj , j = 1, ..., N . Stąd ogólnie przyjętanotacja

ω = ∑1≤j1<...<jk≤N aj1...jk dxj1 ∧ ... ∧ dxjk .

Zauważmy, że dla dowolnego x ∈ U oraz v1, ..., vk ∈ RN ,ω(x)(v1, ..., vk) = ∑

1≤j1<...<jk≤N aj1...jk (x)(dxj1 ∧ ... ∧ dxjk )(v1, ..., vk) =∑1≤j1<...<jk≤N aj1...jk (x) det[πjs (vr)]s,r=1,...,k = ∑

1≤j1<...<jk≤N aj1...jk (x) det[vjsr ]s,r=1,...,k.

4.4.1 UWAGA: Dwa przypadki zasługują na szczególną uwagę: k = 1 i k = N − 1.(1) Niech k = 1 i ω ∈ Λ1(U). Wtedyω = N∑

j=1 ajdxj ,gdzie aj : U → R, j = 1, ..., N , są zadanymi funkcjami. Niech a = (a1, ..., aN ) : U → RN będzieodwzorowaniem, którego funkcjami współrzędnymi są funkcje aj , j = 1, ..., N . Dla dowolnegox ∈ U oraz v = (v1, ..., vN ) ∈ RN ,

ω(x)(v) =∑j=1 aj (x)dxj (v) = N∑

j=1 aj (x)vj = 〈a(x), v〉.(2) Niech teraz k = N − 1 i ω ∈ ΛN−1(U). Wtedy

ω = N∑j=1 (−1)N+jajdx1 ∧ ... ∧ dxj ∧ ... ∧ dxN , (7)

gdzie symbol dxj oznacza, że ten czynnik został opuszczony, zaś aj : U → R, j = 1, ..., N , sązadanymi funkcjami. Dla x ∈ U oraz v1, ..., vN−1 ∈ RN mamyω(x)(v1, ..., vN−1) = 〈a(x), v1 × ....× vN−1〉,

gdzie a(x) = (a1(x), .., aN (x)).4.4.2 PRZYKŁAD Dla przykładu: jeśli N = 3 i zmienne – jak zwykle – oznaczamy przez x, y, z,to

ω = a1dy ∧ dz − a2dx ∧ dz + a3dx ∧ dy ∈ Λ2(U).Dla dowolnego (x, y, z) ∈ U i v1, v2 ∈ R3 mamy więcω(x, y, z)(v1, v2) = 〈a(x, y, z), v1 × v2〉,

gdzie a(x, y, z) = (a1(x, y, z), a2(x, y, z), a3(x, y, z)).7Powód pojawienia się tu „dziwnych” mnożników (−1)N+j wyjaśni się za chwilę.

Page 129: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.4. FORMY RÓŻNICZKOWE 125

MNOŻENIE ZEWNĘTRZNE FORM RÓŻNICZKOWYCH Działanie mnożenia zewnętrznego formk-liniowych alternujących przenosi się natychmiastowo na k-formy różniczkowe: jeśli ω ∈Λk(U), η ∈ Λm(U), to (ω ∧ η)(x) := ω(x) ∧ η(x), x ∈ U.

PRZYKŁAD: Jeśli ω, η ∈ Λ1(U), to dla x ∈ U , oraz v1, v2 ∈ RN ,(ω ∧ η)(x)(v1, v2) = ω(x)(v1)η(x)(v2)− ω(x)(v2)η(x)(v1).

Oczywiście ω ∧ η ∈ Λk+m(U); regularność form przy mnożeniu zewnętrznym zachowujesię: jeśli ω i η są formami ciągłymi (odp. różniczkowalnymi, klasy Cr), to ω ∧ η jest formąciągłą (odp. różniczkowalną, klasy Cr).4.4.B Pochodna zewnętrzna

Zacznijmy określenie dla różniczkowalnej 0-formy, tzn. dla różniczkowalnej funkcji f : U → R.Z definicji pochodną zewnętrzną f jest jej pochodna, tzn. odwzorowanie, które punktowi x ∈ Uprzyporządkowuje pochodną f ′(x) ∈ L(RN ,R) = L1(RN ) =A1(RN ). Zauważmy, że dla v ∈ RN

df (x)(v) = f ′(x)(v) = N∑i=1 f|i(x)vi,

czylidf = N∑

i=1 f|idxi.A więc operator d przeprowadza funkcje różniczkowalne, czyli różniczkowalne 0-formy w 1-formy.Ogólnej mówiąc niech k-forma ω ∈ Λk(U) postaciω = ∑

1≤j1<...<jk≤N aj1...jk dxj1 ∧ ... ∧ dxjkbędzie różniczkowalna, tzn. dla dowolnego układu 1 ≤ j1 < ... < jk ≤ N funkcja aj1...jk : U → Rjest różniczkowalna. Pochodną zewnętrzną nazwiemy (k + 1)-formę postacidω = ∑

1≤j1<...<jk≤N daj1...jk ∧ dxj1 ∧ ... ∧ dxjk = ∑1≤j1<...<jk≤N

N∑i=1 aj1...jk|idxi ∧ dxj1 ∧ ... ∧ dxjk .

PRZYKŁAD: Jeśli ω ∈ Λ1(U) iω = N∑

j=1 ajdxj ,gdzie aj : U → R są funkcjami różniczkowalnymi, todω =∑

j=1 daj ∧ dxj = N∑j=1

N∑i=1 aj|idxi ∧ dxj =∑

1≤i 6=j≤N aj|idxi ∧ dxj = ∑1≤i≤j≤N(aj|i − ai|j )dxi ∧ dxj .

Page 130: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

126 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHJeśli ω ∈ ΛN−1(U) jest postaci

ω = N∑j=1 (−1)j−1ajdx1 ∧ ... ∧ dxj ∧ ... ∧ dxN ,

todω = N∑

j=1N∑i=1 (−1)j−1aj|idxi ∧ dx1 ∧ ... ∧ dxj ∧ ... ∧ dxN =N∑j=1 (−1)j−1aj|jdxj ∧ dx1 ∧ ... ∧ dxj ∧ ... ∧ dxN =

N∑i=1 aj|jdx1 ∧ dx2 ∧ ... ∧ dxN = diva dx1 ∧ .. ∧ dxN ,

gdzie a = (a1, ..., aN ) : U → RN , zaśdiva := N∑

j=1 aj|jjest tzw. dywergencją odwzorowania a.4.4.3 TWIERDZENIE: (1) Dla dowolnych k-form różniczkowalnych i λ ∈ R ω, η ∈ Λk(U), d(ω ±η) = dω ± dη, d(λω) = λdω;(2) Jeśli forma ω jest dwukrotnie różniczkowalna, to d(dω) = 0;(3) Jeśli formy ω ∈ Λk(U) i η ∈ λm(U) są różniczkowalne, to forma ω ∧ η ∈ Λk+m(U) jestróżniczkowalna i

d(ω ∧ η) = dω ∧ η + (−1)kω ∧ dη.DOWÓD: Dowód własności (1) jest natychmiastowy. W celu dowodu (3) zauważmy, że jeśli ω =dxj1 ∧ ... ∧ dxjk i η = dxi1 ∧ ... ∧ dxim , gdzie 1 ≤ j1 < ... < jk ≤ N oraz 1 ≤ i1 < ... < im ≤ N , toten wzór jest oczywiście prawdziwy, bo dω = dη = d(ω ∧ η) = 0. Jeśli k = 0, tzn. ω : U → R jestfunkcją różniczkowalną, zaś

η = ∑1≤i1<...<im≤N ηi1...imdxi1 ∧ ... ∧ dxim ,to

ω ∧ η = ∑1≤i1<...<im≤N ωηi1...imdxi1 ∧ .. ∧ dximoraz

d(ω ∧ η) = ∑1≤i1<...<im≤N d(ω · ηi1...im ) ∧ dxi1 ∧ ... ∧ dxim = dω ∧ η + ω ∧ dη,

bo d(ω · ηi1...im ) = ω · dηi1...im + ηi1...imdω. W ogólnej sytuacji posługujemy się własnością (1) ipodanymi faktami.Dla dowodu (2) przypuśćmy, żeω = ∑

1≤j1<...<jk≤N ωj1...jk dxj1 ∧ ... ∧ dxjk .

Page 131: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.4. FORMY RÓŻNICZKOWE 127

Wówczasdω = ∑

1≤j1<...<jk≤NN∑i=1 ωj1...jk|idxi ∧ dxj1 ∧ ... ∧ dxjkoraz

d(dω) = ∑1≤j1<...<jk≤N

N∑i=1 d(ωj1....jk|idxi ∧ dxj1 ∧ ... ∧ dxjk ) =

∑1≤j1<...<jk≤N

N∑i,j=1aj1...jk|ijdxj ∧ dxi ∧ dxj1 ∧ ... ∧ dxjk .W tej sumie składniki postaci

aj1...jk|ijdxj ∧ dxi ∧ dxj1 ∧ ... ∧ dxjk , aj1...jk|jidxi ∧ dxj ∧ dxj1 ∧ ... ∧ dxjkznoszą się parami.

4.4.C Przeciwobraz formy różniczkowej

Niech f : V → U , gdzie V ⊂ RM jest zbiorem otwartym, będzie odwzorowaniem różniczkowal-nym. Definiujemy przeciwobraz formy ω ∈ Λk(U) poprzez f jako k-formę f#ω ∈ Λk(V ) w Vzadaną wzoremf#ω(y)(w1, ..., wk) = ω(f (y))(f ′(y)(w1), ...f ′(y)(wk)),dla y ∈ V oraz w1, ..., wk ∈ RM .Wobec tego jeżeli

ω = ∑1≤j1<...,jk≤N ωj1....jkdxj1 ∧ ... ∧ dxjkoraz kładąc η = f#ω mamy reprezentację

η = ∑1≤i1<...<ik≤M ηi1....ikdyi1 ∧ ... ∧ dyik ,

gdzie ηi1...in : V → R są funkcjami zadanymi wzoramiηi1....ik (y) = η(y)(eik , ..., eik ) = f#ω(y)(ei1 , ..., eik ), y ∈ V,

gdzie – tym razem – (e1, ..., em) oznacza bazę kanoniczną w RM . Zatemηi1...ik (y) = ω(f (y))(f|i1 (y), ..., f|ik (y)) =∑

1≤j1<...<jk≤N ωj1...jk (f (y)) det[fjs|ir (y)]s,r=1,...,k.Tak więc ostatecznie

f#ω = ∑1≤i1<...<ik≤M

∑1≤j1<...<jk≤N(ωj1...jk f ) det[fjs|ir (y)]s,r=1,...,k

dyi1 ∧ ... ∧ dyik .

Czytelnik bez trudu udowodni następujące4.4.4 TWIERDZENIE: Jeśli f : V → U , ω, ω1, ωs ∈ λk(U), η ∈ Λm(U) oraz g : U → R, to:

(1) f#(dxi) =∑Nj=1 fi|j dxj dla dowolnego i = 1, ..., N ;

Page 132: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

128 4. CAŁKOWANIE FORM RÓŻNICZKOWYCH(2) f#(ω1 + ω2) = f#ω1 + f#ω2;(3) f#(gω) = (g f )f#ω;(4) f#(ω ∧ η) = f#ω ∧ f#η;(5) f#(dω) = df#ω.

4.5 Kostki singularne i łańcuchy

Niech k ≥ 0, kostką singularną k-wymiarową lub k-kostką singularną w zbiorze U ⊂ RNnazwiemy dowolne ciągłe odwzorowanie σ : [0, 1]k → U , gdzie [0, 1]k := [0, 1] × ... × [0, 1]jest k-kostką standardową dla k ≥ 1 (tj. produktem kartezjańskim k egzemplarzy odcinkajednostkowego [0, 1]) oraz [0, 1]0 = 0. Punkty z k- kostki standardowej oznaczać będziemyt = (t1, ..., tk), ti ∈ [0, 1] dla i = 1, ..., k.Oczywiście 0-kostką jest odwzorowanie σ : 0 → U , czyli po prostu punkt w U .UWAGA: Symbolem Ik : [0, 1] → Rk oznaczamy odwzorowanie identycznościowe: Ik(t) = tdla t ∈ [0, 1]k .Mówimy, że k-kostka singularna σ : [0, 1]k → U jest klasy Cr , r ≥ 1, gdy odwzorowanieσ : K → U jest klasy Cr (przypomnijmy: oznacza to, że znajdzie się zbiór otwarty G ⊃ [0, 1]k iodwzorowanie φ : G → RN klasy Cr takie, że φ|[0,1]k = σ ).Uważa się, że 0-kostki są dowolnej klasy gładkości.

Nośnikiem k-kostki singularnej σ : [0, 1]k → U , k ≥ 1, nazywamy zbiór |σ | := σ ([0, 1]k)(gdy k = 0, to |σ | = σ (0)).Mówimy, że k-kostki singularne σ1, σ2 są równoważne, jeżeli istnieje dyfeomorfizm φ :Ik → Rk taki, że φ([0, 1]k) = [0, 1]k , detφ′(t) > 0 dla wszystkich t ∈ [0, 1]k oraz σ2 φ = σ1.

FAKT: Relacja równoważności kostek jest relacją równoważności i kostki równoważnemają ten sam nośnik.

Łańcuchem singularnym k-wymiarowym w zbiorze otwartym U ⊂ RN nazywamy skoń-czoną formalną kombinację liniową postacic = a1σ1 + ...+ anσn = n∑

s=1 asσs,gdzie as ∈ Z, zaś σs jest k-kostką singularną dla s = 1, ..., n.Jest to więc pewne formalne wyrażenie. Na przykład 0 łańcuchem jest formalna kombi-nacja liniowa (o współczynnikach całkowitych) punktów w U .k-łańcuchem zerowym nazywamy k-łańcuch singularny, którego wszystkie współczynnikisą równe 0.Nośnikiem łańcucha c =∑n

s=1 asσs jest zbiór ⋃ns=1 |σs| = |σ1| ∪ .. ∪ |σn|.

BRZEG KOSTKI I ŁAŃCUCHA Niech σ : Ik → U będzie k-kostką singularną, k ≥ 1. Dlai = 1, ..., k zdefiniujemy (k − 1)-kostki singularne

Piσ, Tiσ : Ik−1 → U

w następujący sposób:

Page 133: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.6. CAŁKA FORM RÓŻNICZKOWYCH 129

(a) gdy k = 1, to P1σ = σ (0), T1σ = σ (1) (P1σ i T1σ są 0-kostkami, czyli punktami w U);(b) gdy k ≥ 2, to dla dowolnego t = (t1, ..., tk−1) ∈ Ik−1,Piσ (t) = σ (t1, ..., ti−1, 0, ti, ..., tk−1), Tiσ (t) = σ (t1, ..., ti−1, 1, ti, ..., tk−1).

Te (k− 1)-kostki singularne Piσ , Tiσ nazywa się odpowiednio i-tą przednią i i-tą tylną ścianąkostki σ , i = 1, ..., k. Przyjęta terminologia jest dość jasna z intuicyjnego punktu widzenia.4.5.1 FAKT: Niech σ będzie k-kostka singularną, k ≥ 2. Mają miejsce łatwe do sprawdzeniawłasności: jeżeli 1 ≤ i < j ≤ k, to

Pi(Pjσ ) = Pj−1(Piσ ), Ti(Tjσ ) = Tj−1(Tiσ ), Pi(Tjσ ) = Tj−1(Piσ ), Ti(Pjσ ) = Pj−1(Tiσ ).

Brzegiem k-kostki singularnej, k ≥ 1 nazwiemy (k − 1)-łańcuch singularny∂σ := k∑

i=1 (−1)i(Piσ − Tiσ ).Oczywiście |∂σ | = ⋃k

i=1(|Piσ | ∪ |Tiσ |). Jest więc suma mnogościowa nośników wszystkichścian kostki σ .UWAGA: Nie należy mylić tego „algebraicznego” brzegu kostki sigma z brzegiem w sensietopologicznej jej nośnika |σ |.Jeśli c =∑ns=1 asσs jest k-łańcuchem singularnym, k ≥ 1, to brzegiem łańcucha c nazwie-my (k − 1)-łańcuch singularny postaci

∂c := n∑s=1 as∂σs.

4.5.2 FAKT: Jeśli c jest k-łańcuchem singularnym, k ≥ 2, to ∂(∂c) = 0, tzn. brzeg brzeguk-łańcucha singularnego jest zerowym (k − 2)-łańcuchem singularnym.

4.6 Całka form różniczkowych

4.6.A Całka na kostkach

Załóżmy, że ω ∈ Λk(U), k ≥ 1, jest ciągłą k-formą różniczkową w zbiorze otwartym U ⊂ RN iσ : [0, 1]k → U jest k-kostką singularną klasy C1 w U .Definiujemy całkę z formy ω na kostce σ wzorem∫

σω := ∫[0,1]k ω(σ (t))(σ|1(t), ..., σ|k(t))dt,

gdzie po prawej stronie znalazła się całka Riemanna funkcji ciągłej na (zwykłej, standardowej)kostce k-wymiarowej [0, 1]k .Istotnie: przypuśćmy, żeω = ∑

1≤j1<...<jk≤N aj1...jk dxj1 ∧ ... ∧ dxjk ,

Page 134: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

130 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHgdzie funkcje aj1...jk : U → R są ciągłe. Dla dowolnego t , połóżmy vi = σ|i(t), i = 1, ..., k. Zatemω(σ (t))(σ|1(t), ..., σ|k(t)) = ω(σ (t))(v1, ..., vk) = ∑

1≤j1<...<jk≤N aj1...,jk (σ (t)) det[πjs (vr)]s,r=1,...,k =∑1≤j1<...<jk≤N aj1...,jk (σ (t)) det[πjs (σ|r(t))]s,r=1,...,k = ∑

1≤j1<...<jk≤N aj1...,jk (σ (t)) det[σjs|r(t)]s,r=1,...,k,gdzie oczywiście σ1, ..., σN są funkcjami współrzędnymi kostki σ , tzn.σ = (σ1, ..., σN ). W świetlezałożeń o formie ω i kostce σ , funkcje [0, 1]k 3 t 7Ï aj1...jk (σ (t)) oraz [0, 1]k 3 t 7Ï det[σjs|r(t)] sąciągłe, czyli ciągła (a więc całkowalna w sensie Riemanna) jest funkcja podcałkowa.

Jeśli ω ∈ Λ0(U) i σ jest 0-kostką, to kładziemy∫σω := ω(σ (0))

(pamiętajmy, że ω : U → R jest funkcją, zaś σ punktem w U).PRZYKŁAD: Jeśli σ = ∑i=1 aidxi jest 1-formą, a σ : [0, 1] → U jest 1-kostką klasy C1 w U ,to – kładąc – a = (a1, ..., aN ), otrzymamy∫

σω = ∫[0,1]〈a(σ (t)), σ ′(t)〉dt = N∑

i=1 ai(t)σ ′i (t)dt.Jeśli ω ∈ ΛN−1(U) i

ω =∑j=1 (−1)N+jajdx1 ∧ ... ∧ dxj ∧ ... ∧ dxN ,

oraz σ : [0, 1]N−1 → U jest (N − 1)-kostką singularną klasy C1, to∫σω = ∫[0,1]N−1〈a(σ (t)), σ|1(t)× ...× σ|N−1(t)〉dt.

4.6.1 TWIERDZENIE: (1) Całka jest operacją liniową, tzn. dla danej k-kostki singularnej σ klasyC1, ciągłych form ω, η ∈ Λk(U) i liczby λ ∈ R mamy∫

σ(ω ± η) = ∫

σω ±

∫ση,∫σ(λω) = λ

∫σω.

(2) Jeśli k-kostki σ i τ są równoważne, to dla dowolnej ciągłej k-formy ω ∈ λk(U) mamy∫σω = ∫

τω.

(3) Niech forma ω ∈ ΛK(U) będzie ciągła. Jeśli dla dowolnej k-kostki singularnej σ klasyC1 w U całka

∫σ ω = 0, to ω = 0.DOWÓD: Pierwsza własność wynika natychmiast z definicji. Dla dowodu drugiej własności przy-puśćmy, że φ : [0, 1]k → [0, 1]k jest dyfeomorfizmem takim, że σ φ = τ . Wówczas, jeżeli

Page 135: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.6. CAŁKA FORM RÓŻNICZKOWYCH 131

ω =∑1≤j1<...<jk≤N aj1...jk dxj1 ∧ ... ∧ dxjk , gdzie aj1...jk : U → R są funkcjami ciągłymi, to∫τω = ∑

1≤j1<...<jk≤N aj1...jk (τ(t)) det[τjs|r(t)] =∑1≤j1<...<jk≤N aj1...jk (σ φ(t)) det[(σjs φ)|r(t)]dt =∑

1≤j1<...<jk≤N(aj1...jk σ )(φ(t)) det[σjs|r(φ(t))] detφ′(t)dt =∑

1≤j1<...<jk≤N(aj1...jk σ )(t) det[σjs|r(t)]dt = ∫σω,

poprzez wykorzystanie reguły łańcucha i twierdzenia o zamianie zmiennych w całce Rieman-na. Aby udowodnić (3) przypuśćmy, że ω 6= 0 (ω jest formą jak wyżej), tzn. znajdziemy takiukład 1 ≤ i1 < ... < ik ≤ N oraz x0 ∈ U , że ai1...ik (x0) 6= 0. Ciągłość funkcji a = ai1...ik implikuje,że a(x) 6= 0 dla x ∈ B(x0, ε), gdzie ε > 0. Zdefiniujmy teraz σ0 : [0, 1]k → Rn wzoremσ (t) := x0 + α

k∑s=1 tiejs , t = (t1, ..., tk) ∈ [0, 1]k,

gdzie, oczywiście, ej1 , ..., ejk są wektorami z bazy kanonicznej w RN , zaś liczba α > 0 jest takdobrana, aby nośnik |σ0| ⊂ B(x0, ε). Wówczas łatwo sprawdzić, że ∫σ0 ω0 6= 0, gdzie ω0 :=ai1...ikdxi1 ∧ ... ∧ dxik , lecz dla każdego układu 1 ≤ j1 < ... < jk ≤ N różnego od układui1 < ... < ik , mamy ∫σ0 aj1...jk dxj1 ∧ ...∧ dxjk = 0. W taki razie ∫σ0 ω = ∫σ0 ω0 6= 0: sprzeczność.UWAGA: Założenie, że σ : [0, 1]k → U jest klasy C1 oznacza, że σ jest odwzorowaniemokreślonym na pewnym zbiorze otwartym V ⊂ RK . Niech ω ∈ Λk(U) będzie ciągłą formą.Zauważmy, że ∫

σω = ∫[0,1]k ω(σ (t))(σ|1(t), ..., σ|k(t)) = ∫

Ikσ#ω,

gdzie, przypomnijmy, Ik : [0, 1]k → Rk oznacza odwzorowanie identycznościowe, a więc pewną(bardzo specjalną) k-kostką singularną w Rk klasy C1. Jeżeli η ∈ Λk(V ), gdzie V ⊂ Rk , to∫Ikη = ∫[0,1]k η(t1, ..., tk)(e1, ..., ek)dt1...dtk.

4.6.B Całka na k-łańcuchach i twierdzenie Stokesa

Niech c = ∑ni=1 aiσi będzie k-łańcuchem singularnym klasy C1 w zbiorze otwartym U ⊂ RN .Dla ciągłej k-formy ω ∈ Λk(U) kładziemy∫

cω = n∑

i=1∫σiω.

4.6.2 TWIERDZENIE (Stokesa): Załóżmy, że forma ω ∈ Λk−1(U) jest klasy C1 i k-łańcuchc =∑n

i=1 aiσi jest klasy C1. Wówczas ∫∂cω = ∫

cdω.

Page 136: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

132 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHDOWÓD: Pokażemy najpierw, że jeśli η ∈ Λk−1(V ), gdzie V ⊂ Rk , to∫

Ikdη = ∫

∂Ikη.

Niech najpierw, że dla pewnego i = 1, ..., kη = a dx1 ∧ ...∧dxi ∧ ... ∧ dxk,

gdzie a : V → R jest funkcją klasy c1. Wówczasdη = k∑

j=1 a|j dxj ∧ dx1 ∧ ... ∧ dxi ∧ ... ∧ dxk = (−1)i−1η|i dx1 ∧ ... ∧ dxk.Zatem ∫

Ikdη = (−1)i−1 ∫[0,1]k a|i(t1, ..., tk)dt1...dtk.Można zastosować twierdzenie Fubiniego:(−1)i−1 ∫[0,1]k−1

(∫ 10 a|i(t1, ..., tk)dti) dt1...dti...dtk =∫

[0,1]k−1 (a(t1, ..., ti−1, 1, ti+1, ..., tk)− a(t1, ..., ti−1, 0, ti+1, ..., tk)) dt1...dti...dtk.Czyli∫Ikdη = (−1)i (∫[0,1]k−1 a(t1, ..., 0, ..., tk)dt1...dti...dtk − ∫[0,1]k−1 a(t1, ..., 1, ..., tk)dt1...dti...dtk) .

Z drugiej strony ∫[0,1]k−1 a(t1, ..., 0, ..., tk)dt1...dti...dtk = ∫

PiIkη

oraz ∫[0,1]k−1 a(t1, ..., 1, ..., tk)dt1...dti...dtk = ∫

TiIkη.

Zatem ∫Ikdη = (−1)i (∫

PiIkη −

∫TiIk

η)

Ponadto ∫∂Ik

η = k∑j=1 (−1)j (∫

Pj Ikη −

∫Tj Ik

η).

Zauważmy, że dla j = 1, ..., k, jeśli j 6= i, to∫Pj Ik

η = 0 = ∫Tj Ik(starannie sprawdzić). Tak więc∫

∂Ikη = (−1)i (∫

PiIkη −

∫TiIk

η) = ∫

Ikdη.

Page 137: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

4.6. CAŁKA FORM RÓŻNICZKOWYCH 133

Jeśli terazη = k∑

i=1 ai dxi ∧ ... ∧ dxi ∧ ... ∧ dxk,to∫∂Ik

η = k∑i=1∫∂Ik

ai dxi ∧ ... ∧ dxi ∧ ... ∧ dxk = k∑i=1∫Ikd(ai dxi ∧ ... ∧ dxi ∧ ... ∧ dxk) = ∫

Ikdη.

Obecnie niech ω ∈ Λk(U) (jak w sformułowaniu twierdzenia) i niech σ : Ik → U będziedowolną k-kostką singularną klasy C1, to∫σdω = ∫

Ikσ#dω = ∫

Ikd(σ#ω) = ∫

∂Ikσ#ω = ∫

∂σω

(ostatnią równość należy sprawdzić starannie). I wreszcie∫∂cω = n∑

i=1 ai∫∂σiω = n∑

i=1 ai∫σidω = ∫

cdω.

4.6.C k-Bryły i twierdzenie Stokesa

Mówimy, że k-kostki singularne σ, τ : [0, 1]k → RN , gdzie k ≥ 1, są zgodnie położone jeśli:(1) Część wspólna |σ |∩|τ| = ∅ albo |σ |∩|τ| = |σ ′| = |τ ′|, gdzie σ ′ jest l-wymiarową, 0 ≤ l ≤ k−1,ścianą kostki σ , a τ ′ jest l-wymiarową ścianą kostki τ;(2) jeśli |σ | ∩ |τ| = |σ ′| = |τ ′| gdzie σ ′ i τ ′ są (k − 1)-wymiarowymi ścianami kostek σ i τ ,odpowiednio, to kostki σ ′ i τ ′ sa równoważne i(a) jeśli σ ′ = Piσ . τ ′ = Pjτ dla pewnych 1 ≤ i, j ≤ k, to suma i + j jest nieparzysta;(b) jeśli σ ′ = Tiσ . τ ′ = Tjτ dla pewnych 1 ≤ i, j ≤ k, to suma i + j jest nieparzysta;(c) jeśli σ ′ = Piσ , τ ′ = Tjτ dla pewnych 1 ≤ i, j ≤ k, to suma i + j jest parzysta;(d) jeśli σ ′ = Tiσ , τ ′ = Pjτ dla pewnych 1 ≤ i, j ≤ k, to suma i + j jest parzysta.Zbiór B ⊂ RN jest k-wymiarową bryłą singularną, jeśli istnieją k-kostki singularne σi :[0, 1]k → RN , i = 1, ..., n, klasy C1 takie, że B = ⋃ni=1 |σi| oraz dla dowolnych i, j = 1, ..., n, i 6= j ,kostki σi oraz σj są zgodnie położone.

Brzegiem bryły B wyznaczonej przez kostki σi , i = 1, ..., n, nazywamy sumę ∂B mnogo-ściową nośników tych (k−1)-wymiarowych ścian kostek σi , których nośniki nie są nośnikami(k− 1)-wymiarowych ścian innych kostek. Oczywiście brzeg bryły B jest nośnikiem pewnego(k − 1)-wymiarowego łańcucha singularnego d.PYTANIE: Czy ∂B jest bryłą?Jeśli B jest k-bryłą singularną wyznaczonym przez k-kostki singularne σi , i = 1, ..., n, to Bjest nośnikiem łańcucha c := σ1 + ...σn .Zatem można przyjąć, że dla ciągłej formy ω ∈ Λk(B) (8)∫Bω := ∫

cω.

8tzn.ω = ∑

1≤j1<...<jk≤Nωj1...jkdxj1 ∧ ... ∧ dxjk ,

gdzie ωj1...jk : B→ R jest funkcją ciągłą dla dowolnego układu 1 ≤ 1 < ... < jk ≤ N .

Page 138: Wojciech Kryszewskiwkrysz/attachments/RRC3.pdfBibliografia [1] Andrzej Birkholc, Analiza matematyczna. Funkcje wielu zmiennych, PWN Warszawa 1986. [2] (∗) Ryszard Engelking, Topologia

134 4. CAŁKOWANIE FORM RÓŻNICZKOWYCHKładziemy również ∫

∂Bη := ∫

dη,

dla dowolnej ciągłej formy η ∈ Λk−1(∂B),4.6.3 TWIERDZENIE (Twierdzenie Stokesa): Niech B będzie k-wymiarową bryłą singularną iniech ω ∈ Λk−1(B) będzie formą różniczkową klasy C1. Wtedy∫

∂Bω = ∫

Bdω.

DOWÓD: Z twierdzenie Stokesa 4.6.2 mamy∫Bdω = n∑

r=1∫σrdω = n∑

r=1∫∂σr

ω = n∑r=1

k∑j=1((−1)j ∫

Pjσrω + (−1)j+1 ∫

Tjσrω).

Przypuśćmy, że dla pewnych 1 ≤ r, s ≤ n, |Piσr| = |Pjσs|, gdzie 1 ≤ i, j ≤ k. Wtedy składnik wpowyższej sumie po prawej, w świetle założeń,(−1)i ∫

Piσrω + (−1)j ∫

Pjσsω = (−1)i(∫

Piσrω −

∫Pjσs

ω) = 0.

Analogicznie jeśli dla pewnych 1 ≤ r, s ≤ n, |Tiσr| = |Tjσs|, to(−1)i+1 ∫

Tiσrω + (−1)j+1 ∫

Tjσ+s ω = 0,lub, gdy dla pewnych 1 ≤ r, s ≤ n, |Piσr| = |Tjσs|, to

(−1)i ∫Piσr

ω + (−1)j+1 ∫Tjσs

ω = 0.A więc, w tej sumie pozostaną tylko składniki odpowiadające tym spośród (k−1)-wymiarowychścian kostek σr , których nośniki nie są jednocześnie są nośnikami innych kostek.