30
Frustra fit per plura quod potest fieri per pauciora. (17) Summa Logicae I.12 GUILLELMUS DE OCKHAM (1285 – 1350) CAPITOLO VI Calcolo differenziale per funzioni di più variabili Questo capitolo contiene un’introduzione al calco- lo differenziale in più variabili ad uso dei lettori più interessati alle applicazioni che allo sviluppo della teoria. Un approccio più formale e sistema- tico, necessario sia quando si vogliano approfon- dire alcuni aspetti teorici, sia quando si vogliano estendere i concetti al caso generale di funzioni fra spazi euclidei, verrà invece adottato nel prossimo capitolo. In questo capitolo tratteremo le funzio- ni di due variabili, con qualche accenno al caso di tre. Affronteremo la nozione di derivabilità, intro- ducendo i concetti di derivata parziale e direzio- nale. Approfondiremo poi il concetto chiave della differenziabilità e chiariremo le differenze fra que- ste nozioni. Una gran parte del capitolo è dedicata all’applicazione della differenziazione al problema della ricerca dei massimi e minimi liberi e vincola- ti di funzioni di due variabili. Per comprendere il contenuto di questo capitolo è necessario aver fa- miliarizzato con le curve e le superfici nello spazio, che sono state trattate nel Capitolo V. C ome per le funzioni di una variabile, il calcolo differenziale in più variabili permette di formulare e risolvere, in modo unita- rio, molti problemi diversi. Uno di questi è stato posto alla fine dello scorso capitolo e riguarda la definizione di piano tangente ad una superficie. Nel risolvere questo problema scopriremo, con un po’ di sor- presa, una differenza sostanziale rispetto all’analogo problema della ret- ta tangente che abbiamo trattato nel primo volume e ripreso nel capitolo precedente. § 1. Derivate parziali Come abbiamo imparato nel primo volume, la derivata di una funzione di una variabile misura il suo tasso di variazione istantaneo, definito come ©Apogeo 2008 – Corso prof. Capietto

Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

Embed Size (px)

Citation preview

Page 1: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

Frustra fit per plura quod potest fieri perpauciora.(17)

Summa Logicae I.12GUILLELMUS DE OCKHAM (∼1285 – ∼1350)

CAPITOLO VI

Calcolo differenziale

per funzioni di più variabili

Questo capitolo contiene un’introduzione al calco-lo differenziale in più variabili ad uso dei lettoripiù interessati alle applicazioni che allo sviluppodella teoria. Un approccio più formale e sistema-tico, necessario sia quando si vogliano approfon-dire alcuni aspetti teorici, sia quando si voglianoestendere i concetti al caso generale di funzioni fraspazi euclidei, verrà invece adottato nel prossimocapitolo. In questo capitolo tratteremo le funzio-ni di due variabili, con qualche accenno al caso ditre. Affronteremo la nozione di derivabilità, intro-

ducendo i concetti di derivata parziale e direzio-nale. Approfondiremo poi il concetto chiave delladifferenziabilità e chiariremo le differenze fra que-ste nozioni. Una gran parte del capitolo è dedicataall’applicazione della differenziazione al problemadella ricerca dei massimi e minimi liberi e vincola-ti di funzioni di due variabili. Per comprendere ilcontenuto di questo capitolo è necessario aver fa-miliarizzato con le curve e le superfici nello spazio,che sono state trattate nel Capitolo V.

Come per le funzioni di una variabile, il calcolo differenziale inpiù variabili permette di formulare e risolvere, in modo unita-rio, molti problemi diversi. Uno di questi è stato posto alla fine

dello scorso capitolo e riguarda la definizione di piano tangente ad unasuperficie. Nel risolvere questo problema scopriremo, con un po’ di sor-presa, una differenza sostanziale rispetto all’analogo problema della ret-ta tangente che abbiamo trattato nel primo volume e ripreso nel capitoloprecedente.

§ 1. Derivate parziali

Come abbiamo imparato nel primo volume, la derivata di una funzionedi una variabile misura il suo tasso di variazione istantaneo, definito come

©Apogeo 2008 – Corso prof. Capietto

Page 2: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

276 Calcolo differenziale per funzioni di più variabili

limite del rapporto incrementale � Quando si passa a funzioni di piùvariabili la situazione si complica, inquanto ci si può spostare da un pun-to in molte direzioni diverse ed è in-tuitivamente chiaro che la variazionedi f dipenderà non solo dalla distan-za tra il punto finale e quello iniziale,ma anche dalla direzione. Sceglierela direzione di uno degli assi coor-dinati porta al concetto di derivataparziale.

limh→0

f (x0 + h) − f (x0)

h.

Le possibili derivate parziali di una funzione sono tante quante sono lesue variabili e misurano i tassi di variazione della funzione relativi allavariazione di ciascuna di esse.

(VI.1) Esempio (Funzioni lineari). Consideriamo una funzione linearef (x, y) = ax + by + c: il suo tasso di crescita rispetto alla variabile x è �Per essere precisi f è una funzio-

ne lineare affine (si veda il commentoa pagina 135). La parola «affine» èperò un po’ in disuso, e ci uniformia-mo volentieri, qui e nel seguito, allacondizione contemporanea di pover-tà nel linguaggio scritto, cercando diusarla il meno possibile. Evitiamo co-sì di scrivere termini che potrebberoessere scomodi per i non pochi chefaticano a tenere a mente nello stes-so mese più di un migliaio di vocabolidiversi.

costantemente a, mentre il suo tasso di crescita rispetto alla variabile y ècostantemente b. Anche la funzione f (x, y) = xy è lineare, separatamentein ciascuna delle sue variabili. Il suo tasso di crescita rispetto alla varia-bile x dipende ora dal punto (x0, y0) in considerazione. Esso vale infattiy0, mentre quello di variazione rispetto ad y sarà x0. �

Data una funzione f : A ⊂ R2 → R, con A aperto, e un punto(x0, y0) ∈ A, diamo la seguente definizione.

(VI.2) Definizione. Le derivate parziali di f nel punto P0 = (x0, y0) ∈A sono

fx(x0, y0) = limh→0

f (x0 + h, y0) − f (x0, y0)

he

fy(x0, y0) = limh→0

f (x0, y0 + h) − f (x0, y0)

h,

purché i limiti esistano finiti. � Se f è una funzione delle tre va-riabili x, y, z in un punto (x0 , y0, z0) sipossono definire tre derivate parzia-li: fx, fy, fz. Ad esempio la prima èdefinita come

fx(x0, y0 , z0) =

limh→0

f (x0 + h, y0, z0) − f (x0, y0 , z0)

h.

Ci sono molte notazioni per indicare le derivate parziali di f , ad esempio

fx(x0, y0), ∂x f (x0, y0),∂ f

∂x(x0, y0),

∂xf (x0, y0), Dx f (x0, y0)

sono simboli fra loro equivalenti per la derivata parziale di f rispetto a xnel punto (x0, y0).

Osserviamo che le derivate parziali di f non sono altro che le derivate(rispetto alle variabili x e y rispettivamente) delle due tracce di f cony = y0 e x = x0. Infatti, la traccia sul piano y = y0 è una funzione dellasola variabile x

11(x) = f (x, y0)

e se 11 è derivabile in x = x0, cioè, se esiste finito il limite del rapportoincrementale troviamo

1′1(x0) = limh→0

11(x0 + h) − 11(x0)

h= fx(x0, y0).

©Apogeo 2008 – Corso prof. Capietto

Page 3: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 1. Derivate parziali 277

In modo del tutto simmetrico avremo fy(x0, y0) = 1′2(y0), avendo definitola traccia 12(y) = f (x0, y).

Pertanto, per calcolare le derivate parziali possiamo ricorrere alleusuali regole di derivazione per le funzioni di una variabile reale.

(VI.3) Esempio. Calcoliamo le derivate parziali in (2, 1) della funzionef (x, y) = x sin(xy2) + x4y3

+ 2y. Definiamo

11(x) = f (x, 1) = x sin x+x4+2, 12(y) = f (2, y) = 2 sin(2y2)+16y3

+2y.

Si tratta di due funzioni derivabili e �Ovviamente deriviamo 11 rispettoad x e 12 rispetto ad y.

1′1(x) = sin x + x cos x + 4x3, 1′2(y) = 8y cos(2y2) + 48y2+ 2,

dunque 1′1(2) = sin 2 + 2 cos 2 + 32, 1′2(1) = 8 cos 2 + 50, e in definitiva

otteniamo

fx(2, 1) = sin 2 + 2 cos 2 + 32, fy(2, 1) = 8 cos 2 + 50.

Proseguiamo calcolando le derivate parziali nel generico punto di coor-dinate (x, y). Mantenendo y costante e derivando rispetto a x si ottiene �Nella derivazione rispetto a x

trattiamo y come un parametro.fx(x, y) = 1 · sin(xy2) + x cos(xy2) · y2

+ 4x3y3,

mentre, tenendo x costante e derivando rispetto a y, si ottiene �Nella derivazione rispetto a y, x èun parametro.

fy(x, y) = x cos(xy2) · 2xy + 3y2x4+ 2.

Ovviamente, sostituendo x = 2 e y = 1 otteniamo le derivate parzialicalcolate poco sopra. �

�⊚ ATTENZIONE! Nell’ultimopassggio, per calcolare le derivateparziali in un punto abbiamocalcolato dapprima l’espressionedelle derivate parziali nel genericopunto (x, y) e poi sostituito i valorix = x0,y = y0. Questo procedimento,utilizzabile in molte circostanze,ha lo svantaggio di presupporrel’esistenza delle derivate parziali intutti i punti vicini e pertanto nonè sempre è applicabile. Invitiamo ilLettore a provare a seguire questastrada per la funzione del prossimoesempio, per scoprire che nonfunziona.

(VI.4) Esempio. Calcolare, se esistono, le derivate parziali nell’originedella funzione dell’Esempio (V.41)

f (x, y) =

xy2

x2 + y4(x, y) , (0, 0)

0 (x, y) = (0, 0).

Osserviamo che le tracce 11(x) = f (x, 0) e 12(y) = f (0, y) sono identica-mente nulle. Si tratta dunque di funzioni derivabili, le cui derivate sononulle a loro volta. Applicando la Definizione (VI.2) risulta così

fx(0, 0) = 0 , fy(0, 0) = 0 .

Osserviamo infine che la funzione f non è continua nell’origine.� Infatti �Tuttavia essa ammette entram-be le derivate parziali! Quindi perfunzioni di più variabili

derivabile 6 =⇒ continua.

(Esempio (V.41) a pagina 254) il lim(x,y)→(0,0) f (x, y) non esiste. �

(VI.5) Definizione. Se in un punto (x, y) esistono entrambe le derivateparziali si dice che f è derivabile in (x, y). Inoltre, se f è derivabile inogni punto (x, y) ∈ A, si dice che f è derivabile in A.Il vettore le cui componenti sono le derivate parziali di f in un punto(x, y) si chiama gradiente di f : �Analogamente per funzioni di tre

variabili si ha

∇ f =(

fx, fy , fz)=∂ f

∂xi+∂ f

∂yj+∂ f

∂zk.∇ f (x, y) =

(fx(x, y), fy(x, y)

)=∂ f

∂x(x, y)i+

∂ f

∂y(x, y) j.

©Apogeo 2008 – Corso prof. Capietto

Page 4: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

278 Calcolo differenziale per funzioni di più variabili

Significato geometrico delle derivate parziali.

Com’è noto per le funzioni di una unica variabile, la derivata è la penden-za (o coefficiente angolare) della retta tangente al grafico della funzionenel punto assegnato. Le derivate parziali di una funzione di due variabi-li sono anch’esse legate alle pendenze di rette tangenti al grafico, ma diqueste rette, ora, ce n’è più d’una. Per dare una interpretazione geometri-ca alle derivate parziali, seguiamo la costruzione indicata in Figura VI.1.Il grafico della funzione z = f (x, y) è una superficie S in R3, ed il punto

F VI.1

P di coordinate (x0, y0, z0) con z0 = f (x0, y0) si trova su di essa. Fissarey = y0 significa restringere l’attenzione alla curva C1 data dall’intersezio-ne di S col piano verticale di equazione y = y0 (la traccia di S nel pianoy = y0): questa curva è in effetti il grafico della funzione di una variabilez = 11(x) = f (x, y0), visualizzato in un piano verticale. La curva C1 passaper il punto P e la sua retta tangente in P ha coefficiente angolare pari a

1′1(x0) = limh→0

f (x0 + h, y0) − f (x0, y0)

h;

ricordando la Definizione (VI.2), questo è proprio fx(x0, y0). La derivataparziale di f rispetto a x in (x0, y0) è dunque il coefficiente angolare dellaretta T1 tangente in P alla traccia di S nel piano verticale y = y0. Analoga-mente fy(x0, y0) è il coefficiente angolare della retta T2 tangente in P allacurva C2, traccia di S nel piano verticale x = x0.

La curva C1 può essere parametrizzata come (x, y0, f (x, y0)), al variaredi x; pertanto essa ha, in P, vettore tangente u = (1, 0, fx(x0, y0)). Analoga-mente, C2 può essere parametrizzata come (x0, y, f (x0, y)) con parametroy e il suo vettore tangente in P è v = (0, 1, fy(x0, y0)). Osserviamo che ledue rette T1 e T2 hanno il punto P in comune e dunque esiste un unicopiano (passante per P) che le contiene (Figura VI.2). Il vettore

F VI.2: piano passante per Pe contenente le rette tangenti alletracce di S, T1 e T2.

N = u × v = (− fx(x0, y0),− fy(x0, y0), 1)

è normale a tale piano, che ha pertanto equazione

(1) z = f (x0, y0) + fx(x0, y0)(x − x0) + fy(x0, y0)(y − y0).

(VI.6) Esempio. Consideriamo il paraboloide di equazione z = x2+ y2.

Le sue derivate parziali in un generico punto (x, y) sono fx(x, y) = 2xe fy(x, y) = 2y. In particolare se scegliamo (x0, y0) = (0, 0), otteniamofx(0, 0) = 0 e fy(0, 0) = 0 l’equazione del piano (1) diventa z = 0. Sevogliamo invece calcolarlo nel punto (1, 2, f (1, 2)) abbiamo

f (1, 2) = 5, fx(1, 2) = 2, fy(1, 2) = 4

e risulta z = 5 + 2(x − 1) + 4(y − 2). �

Quando una funzione è derivabile, potremmo sentirci tentati di defi-nire tangente il piano di equazione (1), giacché contiene le due rette tan-genti alle sezioni trasversali. Tuttavia, alla luce dell’Esempio (VI.4) che

©Apogeo 2008 – Corso prof. Capietto

Page 5: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 2. Derivate direzionali 279

mostra una funzione discontinua ma derivabile, siamo invitati a riflette-re più approfonditamente se tale piano corrisponda veramente all’ideaintuitiva di piano tangente.

(VI.7) Esempio. La funzione

f (x, y) =

xy

x2 + y2se (x, y) , (0, 0)

0 se (x, y) = (0, 0)

non è continua in (0, 0): infatti abbiamo visto nell’Esempio (V.40) chelim(x,y)→(0,0) f (x, y) non esiste. Però

F VI.3: il piano che contie-ne le rette T1 e T2 passante perl’origine è z = 0, ma la funzio-ne assume tutti i valori compresitra − 1

2e 1

2in punti arbitrariamen-

te vicino all’origine: questo pianonon assomiglia affatto al graficodella funzione.

f (0 + h, 0)− f (0, 0)

h=

1

h

h · 0h2 + 02

= 0 =⇒ limh→0

f (0 + h, 0)− f (0, 0)

h= 0,

quindi la derivata parziale rispetto a x in (0, 0) esiste e vale 0. Analoga-mente si dimostra che fy(0, 0) = 0. In particolare il piano di equazione (1)passante per l’origine è z = 0: la Figura VI.3 mostra bene che tale pianoè ben lontano dall’essere tangente al grafico di f . �

Per le funzioni di una sola variabile, l’esistenza della derivata implicasia la continuità che l’esistenza della retta tangente al grafico, nel sensodel limite delle rette secanti. Alla luce degli esempi appena dati, com-prendiamo che la derivabilità parziale non è la naturale estensione allefunzioni di più variabili della nozione di derivabilità in una variabile solae non permette di definire un piano tangente. Come vedremo nel § 3 que-sto problema può essere superato introducendo la più forte condizionedi differenziabilità.

§ 2. Derivate direzionali

Supponiamo di voler calcolare la velocità di crescita della funzione f (x, y)nel punto (x0, y0) quando ci si muova nella direzione del vettore unitariov = (a, b). I punti di coordinate �Una direzione nel piano è deter-

minata da un vettore non nullo v =(a, b). Possiamo normalizzare v inmodo che a2

+b2= 1, (ricordiamo che

i vettori di norma unitaria si chiama-no versori). Si può individuare il ver-sore attraverso l’angolo ϑ che formacon l’asse x: v = (cosϑ, sinϑ).

(x0 + ha, y0 + hb)

descrivono, al variare di h in R, la retta nel piano xy passante per (x0, y0)e parallela a v.

(VI.8) Definizione. La derivata direzionale di f in (x0, y0) nella di- � In particolare le derivate parzia-li si ottengono da questa definizio-ne scegliendo v = i = (1, 0) per fx ev = j = (0, 1) per fy.

rezione individuata dal versore v = (a, b) si indica con Dv f (x0, y0) evale

Dv f (x0, y0) = limh→0

f (x0 + ha, y0 + hb) − f (x0, y0)

h

se il limite esiste.

©Apogeo 2008 – Corso prof. Capietto

Page 6: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

280 Calcolo differenziale per funzioni di più variabili

F VI.4: il grafico della funzione z = f (x, y) rap-presenta una superficie S in R3, e il punto P di coor-dinate (x0, y0, z0), con z0 = f (x0, y0) si trova su S.Fissato v, consideriamo il piano verticale che passaper P nella direzione di v: la sua intersezione con Sè una curva C, grafico della funzione di una variabilez = 1(h) = f (x0 + ah, y0 + bh), visualizzato in un pianoverticale. La curva C passa per il punto P e la sua ret-ta tangente in P ha coefficiente angolare pari a 1′(0),ovvero Dv f (x0, y0).

In altre parole, si considera la funzione di una variabile ottenuta � La derivata direzionale di f (x, y, z)in P0 = (x0, y0 , z0) nella direzione delversore v = (a, b, c) è

limh→0

f (x0 + ha, y0 + hb, z0 + hc) − f (x0 , y0 , z0)

h,

se il limite esiste. In notazione vetto-riale si ottiene una scrittura più com-patta, adatta sia al caso n = 2 che alcaso n = 3:

Dv f (P0) = limh→0

f (P0 + hv) − f (P0)

h,

dove P0 = (x0, y0, z0) per n = 3,mentre P0 = (x0, y0) se n = 2.

componendo f con la retta parametrizzata P(h) = (x0 + ha, y0 + hb):

1(h) = f (x0 + ha, y0 + hb).

Se 1 è derivabile in h = 0, si ottiene subito Dv f (x0, y0) = 1′(0). Il signifi-cato geometrico di Dv f (x0, y0) è rappresentato in Figura VI.4.

(VI.9) Esempio. Calcoliamo la derivata della funzione f (x, y) = sin x +xexy nell’origine, lungo la direzione formante un angolo ϑ = π/6 conl’asse x. Abbiamo v = (cos(π/6), sin(π/6)) =

(√3/2, 1/2

). La retta paral-

lela a v passante per (0, 0) è descritta dai punti (h√

3/2, h/2), con h ∈ R.Abbiamo

limh→0

1

h

[f

( √3h

2,

h

2

)− f (0, 0)

]= lim

h→0

1

h

[sin

( √3h

2

)+

√3

2heh2

√3/4

]=

√3,

da cui Dv f (0, 0) =√

3. �

§ 3. Differenziabilità e approssimazioni lineari.

Per una funzione f della sola variabile x la derivabilità nel punto x0 puòvenire espressa, oltre che dalla convergenza del rapporto incrementale,anche mediante la decomposizione in un’approssimazione lineare più unresto, infinitesimo di ordine superiore al primo: � Infatti possiamo scrivere la se-

guente catena di equivalenze:

f (x) = f (x0) + f ′(x0)(x − x0) + R(x)

⇐⇒ f (x) − f (x0)

x − x0= f ′(x0) +

R(x)

x − x0

⇐⇒ limx→x0

f (x) − f (x0)

x − x0= f ′(x0).

f (x) = f (x0) + f ′(x0)(x − x0) + R(x) , con limx→x0

R(x)

x − x0= 0.

Questa scrittura significa che la funzione lineare y = f (x0)+ f ′(x0)(x−x0),che condivide con la funzione data tanto il valore nel punto quanto la

©Apogeo 2008 – Corso prof. Capietto

Page 7: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 3. Differenziabilità e approssimazioni lineari. 281

derivata f ′(x0), approssima la funzione f con un errore che tende a zeropiù rapidamente di quanto x si avvicini a x0.

È questa la formulazione del concetto di derivabilità che meglio sipresta ad essere estesa alle funzioni di più variabili e che conduce al-la nozione di approssimazione lineare e di piano tangente. Proviamo acapirla sull’Esempio (VI.6), dove abbiamo calcolato, nel caso del parabo-loide f (x, y) = x2

+ y2, l’equazione del piano di equazione (1) passanteper P = (1, 2, 5) e contenente le rette tangenti alle tracce. Tale piano haequazione z = 5 + 2(x − 1) + 4(y − 2) . Consideriamo quindi la funzionelineare

L(x, y) = 5 + 2(x − 1) + 4(y − 2) ,

che condivide con la nostra funzione sia il valore nel punto che le de-rivate parziali. Per capire se L è o meno una buona approssimazione di

F VI.5

f , valutiamo l’errore che commettiamo quando sostituiamo ad f (x, y) ilvalore L(x, y). A tale fine, è conveniente porre x = 1 + h evidenziandol’incremento h nella prima variabile e y = 2+ k dove k è l’incremento nel-la seconda variabile (Figura VI.5). L’errore, in funzione dell’incrementototale (h, k), è

f (x, y) − L(x, y) = f (1 + h, 2 + k) − L(1 + h, 2 + k)

= (1 + h)2+ (2 + k)2 − [5 + 2h + 4k] = h2

+ k2 .

Osserviamo che, scegliendo incrementi sempre più piccoli, cioè per (h, k)→ (0, 0), non solo l’errore è infinitesimo ma tende a zero più rapidamente� � Infatti è esattamente il modulo

dell’incremento al quadrato: h2+ k2.

Si dice in questo caso che R è un infi-nitesimo di ordine superiore all’incre-mento (h, k), ossia che è un “o picco-lo” di

√h2 + k2 per (h, k) → (0, 0), e

si scrive

R(h, k) = o(√

h2 + k2).

del modulo dell’incremento, cioè della distanza tra (x, y) e (1, 2): in altreparole l’errore

R(h, k) = f (1 + h, 2 + k) − (5 + 2h + 4k)

soddisfa la proprietà

lim(h,k)→(0,0)

R(h, k)√h2 + k2

= 0.

Abbiamo dunque decomposto la funzione nella somma di una parte li- �Dal punto di vista grafico, que-sta proprietà si traduce nel fattoche, riducendo il fattore di scala inugual modo sui tre assi, i grafici del-le funzioni f ed L diventano via viaindistinguibili, come illustrato dallaFigura VI.6.

neare ed un infinitesimo di ordine superiore al modulo dell’incremento.Tale decomposizione è alla base della definizione di differenziabilità.

(VI.10) Definizione. Supponiamo che la funzione f sia derivabile nelpunto (x0, y0). Diciamo che f è differenziabile in (x0, y0) se, ponendo

(2) f (x0 + h, y0 + k) = f (x0, y0) + fx(x0, y0)h + fy(x0, y0)k + R(h, k),

l’errore R(h, k) soddisfa

(3) lim(h,k)→(0,0)

R(h, k)√h2 + k2

= 0.

©Apogeo 2008 – Corso prof. Capietto

Page 8: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

282 Calcolo differenziale per funzioni di più variabili

F VI.6: tre ingrandimenti del grafico della funzione z = x2+ y2 e del suo piano tangente z = 5+ 2(x − 1) + 4(y− 2)

intorno al punto (1, 2, 5). All’aumentare del fattori di ingrandimento, poiché l’errore R tende a zero più rapidamentedell’incremento, essi diventano indistinguibili.

Per denotare la proprietà (3) utilizzeremo il simbolo di o piccolo, il cuisignificato è stato ricordato nel commento poco sopra, riformulando ladefinizione come

(4) f (x0 + h, y0 + k) = f (x0, y0) + fx(x0, y0)h + fy(x0, y0)k + o(√

h2 + k2).

Tornando alle variabili x = x0 + h e y = y0 + k, l’equazione precedentediventa

f (x, y) = f (x0, y0) + fx(x0, y0)(x − x0) + fy(x0, y0)(y − y0)

+ o(√

(x − x0)2 + (y − y0)2

).

Per le funzioni differenziabili, dunque, il piano di l’equazione �È il piano già definito nell’equa-zione (1) a pagina 278.

z = f (x0, y0) + fx(x0, y0)(x − x0) + fy(x0, y0)(y − y0)

dista dal grafico di f per una quantità che va a zero più rapidamente diquanto ci si avvicini al punto. È quindi ragionevole attribuire al piano diequazione (1) il nome di piano tangente al grafico della funzione f . � La funzione lineare L(x, y) il cui

grafico è il piano tangente si chia-ma linearizzazione di f in (x0 , y0) el’approssimazione di f mediante ta-le piano viene detta approssimazionelineare di f in (x0, y0).

(VI.11) Definizione. Se f è differenziabile in (x0, y0) allora il piano diequazione

z = f (x0, y0) + fx(x0, y0)(x − x0) + fy(x0, y0)(y − y0)

si chiama piano tangente al grafico di f nel punto P =(x0, y0, f (x0, y0)

).

Il vettore

N = (− fx(x0, y0),− fy(x0, y0), 1)

risulta essere ortogonale� al piano tangente. Per questa ragione N � Basta ricordare la Proposizio-ne (III.47) a pagina 134). Ovvia-mente anche il vettore −N di com-ponenti ( fx(x0, y0), fy(x0 , y0),−1) èortogonale al piano tangente.

viene chiamato vettore normale al grafico di f in P.

©Apogeo 2008 – Corso prof. Capietto

Page 9: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 3. Differenziabilità e approssimazioni lineari. 283

(VI.12) Esempio. Mostriamo che la funzione

f (x, y) = xy − 2x + 3y

è differenziabile nell’origine. f è derivabile e risulta fx(x, y) = y − 2,fy(x, y) = x + 3 da cui fx(0, 0) = −2 e fy(0, 0) = 3. Impostiamo ora illimite nella formula (3): il resto in questo caso è

R(h, k) = hk − 2h + 3k︸ ︷︷ ︸f (0+h,0+k)

−[ 0︸︷︷︸f (0,0)

+ (−2)︸︷︷︸fx(0,0)

h + (3)︸︷︷︸fy(0,0)

k] = hk.

Dobbiamo quindi mostrare che

lim(h,k)→(0,0)

hk√h2 + k2

= 0,

cosa che abbiamo già fatto nell’Esempio (V.40) a pagina 254, dunque lafunzione data è differenziabile in (0, 0). L’equazione del piano tangente � La funzione è differenziabile in

ogni punto di R2, invitiamo il Lettorea verificarlo.

al grafico di f nell’origine quindi è z = −2x + 3y, con vettore normale(2,−3, 1). �

I concetti di differenziabilità, piano tangente e approssimazione li-neare si definiscono analogamente per funzioni di tre, o più, variabili.Per dire che una funzione è differenziabile in (x0, y0, z0) si definisce unlimite analogo a quello in (3), dove la linearizzazione è

L(x, y, z) = f (x0, y0, z0)

+ fx(x0, y0, z0)(x − x0) + fy(x0, y0, z0)(y − y0) + fz(x0, y0, z0)(z − z0).

Se per le funzioni di una variabile abbiamo usato indifferentemente gliaggettivi “derivabile” e “differenziabile”, avremo cura, d’ora in poi, didistinguere accuratamente i due termini, riservando al primo il signifi-cato di “derivabile parzialmente”. Il fatto notevole è che per funzioni diuna variabile la differenziabilità è equivalente alla derivabilità, mentre taleequivalenza è falsa per funzioni di più variabili: la funzione dell’Esem-pio (VI.7) ha derivate parziali (nulle) nell’origine ma non è differenzia-bile come vedremo nel prossimo esempio. Addirittura, vi sono funzioniche posseggono tutte le derivate direzionali ma non sono differenziabili. � Si veda l’Esercizio (VI.1) a

pagina 311.(VI.13) Esempio. La funzione dell’Esempio (VI.7) è derivabile con de-rivate parziali nulle nell’origine, tuttavia non è differenziabile. Infatti ilresto della formula (3) è

R(h, k) = f (0 + h, 0 + k) − f (0, 0) − fx(0, 0)h− fy(0, 0)k =hk

h2 + k2.

Perché la funzione sia differenziabile dev’essere

lim(h,k)→(0,0)

hk

(h2 + k2)3/2= 0,

mentre il limite non esiste. � � Lungo la bisettrice h = k il limiteè infinito!

©Apogeo 2008 – Corso prof. Capietto

Page 10: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

284 Calcolo differenziale per funzioni di più variabili

In generale, quindi, l’esistenza delle derivate parziali di f in (x0, y0)non implica la sua differenziabilità. D’altra parte, vale un importante teo-rema, che stiamo per enunciare, secondo cui se le derivate parziali esi-stono anche in tutti i punti vicini a (x0, y0), e sono delle funzioni continueallora f è differenziabile in (x0, y0). Questo importante fatto giustifica l’in-troduzione di una notazione dedicata alle funzioni con derivate parzialicontinue.

(VI.14) Definizione. Data f : A ⊂ R2 → R, con A aperto, supponiamoche

➔ f sia derivabile in A;

➔ fx(x, y), fy(x, y) siano continue in A.

Allora diciamo che f è di classe C1 in A, e scriviamo

C1(A) ={

f : A→ R : fx, fy sono continue in A}.

(VI.15) Teorema. Se f ∈ C1(A) allora f è differenziabile in ogni puntodi A. � La dimostrazione di questo ri-

sultato è rimandata al prossimocapitolo, Teorema (VII.43).

(VI.16) Esempio. Applicando il risultato precedente si deduce immedia-tamente che la funzione

f (x, y) = sin(xy2)

è differenziabile in ogni punto del piano. Si tratta infatti di una funzioneelementare (ottenuta componendo il polinomio di due variabili (x, y) →xy2 con la funzione sin), dunque in particolare è continua e derivabile.Le derivate di f hanno un aspetto simile a quello di f

fx(x, y) = y2 cos(xy2), fy(x, y) = 2xy cos(xy2),

e sono a loro volta funzioni continue. Dunque f è di classe C1 e il Teore-ma (VI.15) garantisce la differenziabilità di f in ogni punto di R2. �

Conseguenze della differenziabilità

Abbiamo già osservato nell’Esempio (VI.7) che una funzione può esserederivabile in un punto senza essere necessariamente continua. Se invecela funzione è differenziabile in (x, y), allora è continua.

(VI.17) Teorema. Se f è differenziabile in (x, y) allora f è continua in(x, y).

©Apogeo 2008 – Corso prof. Capietto

Page 11: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 3. Differenziabilità e approssimazioni lineari. 285

La migliore approssimazione lineare

Abbiamo visto che se f : A ⊂ R2 → R è differenziabilein (x0, y0) ∈ A allora la funzione lineare il cui grafico èil piano tangente:

z = f (x0, y0)+ fx(x0, y0)(x− x0)+ fy(x0, y0)(y− y0),

è una “buona” approssimazione del grafico di f vicinoa (x0, y0). Non solo, è il piano che meglio approssima fvicino a (x0, y0), nel senso seguente. Se prendiamo ungenerico polinomio di primo grado in x e y

p1(x, y) = a + b(x − x0) + c(y − y0)

e valutiamo il limite del modulo della differenza| f (x, y) − p1(x, y)| per (x, y) che tende a (x0, y0), otter-remo il valore minimo (cioè zero) soltanto quandoa = f (x0, y0). Ora proviamo a vedere quale scelta di(b, c) porta al valore minimo il limite del quoziente

lim(x,y)→(x0,y0 )

∣∣∣∣∣∣∣f (x, y) − f (x0, y0) − b(x − x0) − c(y − y0)

√(x − x0)2 + (y − y0)2

∣∣∣∣∣∣∣,

di nuovo il valore minimo (cioè zero) si ottiene perb = fx(x0, y0) e c = fy(x0, y0), come si evince dalla defi-nizione di differenziabilità. Infatti, la scelta x = x0 + h

e y = y0 porta

limh→0

f (x0 + h, y0) − f (x0, y0) − bh

h= 0

⇔ b = limh→0

f (x0 + h, y0) − f (x0, y0)

h

⇔ b = fx(x0, y0).

Analogamente la scelta x = x0 e y = y0 + k porta diconseguenza c = fy(x0, y0): dunque tra tutti i polinomidi primo grado in x e y, quello che meglio approssima,relativamente al modulo dell’incremento, la funzionevicino a (x0, y0) è proprio quello che ha come grafico ilpiano tangente. Possiamo generalizzare queste consi-derazioni a polinomi di grado superiore, e cercare tratutti i polinomi di secondo grado della forma

p2(x, y) = p1(x, y)+d(x−x0)2+e(y−y0)(x−x0)+1(y−y0)2

con d, e, 1 ∈ R, quello che meglio approssima f vicinoa (x0, y0), relativamente al quadrato del modulo del-l’incremento. Come vedremo nell’approfondimento apagine 295 la migliore approssimazione con polinomidi secondo grado coinvolge le derivate seconde del-la funzione e porta alla formula di Taylor di secondogrado.

Dimostrazione. Basta passare al limite nella relazione (2): la linearità del limitepermette di scrivere

lim(h,k)→(0,0)

f (x+h, y+k) = f (x, y)+ fx(x, y) lim(h,k)→(0,0)

h+ fy(x, y) lim(h,k)→(0,0)

k+ lim(h,k)→(0,0)

R(h, k).

Dalla definizione di differenziabilità si ha lim(h,k)→(0,0) R(h, k) = 0, inoltre h e ktendono a 0, quindi

lim(h,k)→(0,0)

f (x + h, y + k) = f (x, y)

ovvero f è continua in (x, y). �

(VI.18) Teorema. Se f è differenziabile in (x, y) allora f ammette de- �Questo Teorema afferma, in par-ticolare, che il piano tangente con-tiene tutte le rette tangenti al grafi-co della funzione, come si vede nellaFigura VI.4 a pagina 280.

rivate direzionali in (x, y) in ogni direzione. Inoltre, per ogni versorev = (a, b) si ha

(5)

Dv f (x, y) = ∇ f (x, y)·v = fx(x, y)a+ fy(x, y)b (formula del gradiente).

Dimostrazione. Scriviamo la formula di differenziabilità (2) per h = a∆t e k =

�Questo risultato può essere usa-to anche al contrario: considerandola funzione f dell’Esercizio (VI.1),vedremo che fx(0, 0) = fy(0, 0) =

0, mentre Dv f (0, 0) = a2b, laddovev = (a, b). Di conseguenza f non puòessere differenziabile nell’origine.

b∆t, osservando che h2+ k2

= (∆t)2(a2+ b2) = (∆t)2:

f (x + a∆t, y + b∆t) = f (x, y) + fx(x, y)a∆t + fy(x, y)b∆t + o(|∆t|).

©Apogeo 2008 – Corso prof. Capietto

Page 12: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

286 Calcolo differenziale per funzioni di più variabili

F VI.8: la figura è stata ottenuta sovrapponendo auna mappa di livello di f (x, y) = x2− y2, il grafico dei vet-tori gradiente calcolati in un reticolo di punti del piano:si vede bene che i gradienti puntano in salita. Lungo unalinea di livello non vi è variazione della funzione; dunqueil gradiente di f in un punto risulta ortogonale alla curva

di livello a cui il punto appartiene. Questa affermazio-ne verrà giustificata nell’Esempio (VI.26) a pagina 291.Nella direzione opposta al gradiente si realizza la mini-ma pendenza possibile, cioè la massima discesa, mentrela direzione di pendenza nulla (corrispondente a nessu-na variazione di quota) si realizza quando cosϑ = 0,cioè ϑ = ±π/2 che corrisponde a muoversi in direzioneortogonale a ∇ f (x, y).

Dividendo per ∆t , 0 e passando al limite per ∆t→ 0 si ottiene la tesi. �

La formula del gradiente (5) permette di individuare le direzioni di mas-sima crescita e di minima crescita (o di massima discesa) di una funzionedifferenziabile. Infatti si ha �Assumiamo ∇ f (x, y) , 0, altri-

menti tutte le derivate direzionalisono nulle.

Dv f (x, y) = ∇ f (x, y) · v = ‖∇ f (x, y)‖ cosϑ,

dove ϑ è l’angolo formato dai vettori v e ∇ f (x, y). Si ricava allora chela derivata direzionale è massima quando cosϑ = 1, cioè ϑ = 0: questosignifica che v è la direzione del gradiente stesso, ovvero il vettore dinorma unitaria nella direzione del gradiente

vmax =∇ f (x, y)

‖∇ f (x, y)‖ .

Abbiamo così dimostrato la seguente proprietà:

F VI.7: mappa topografica.In essa sono disegnate alcune li-nee di livello ed una curva dimassima crescita.

(VI.19) Proprietà. Se non è nullo, il gradiente di una funzione differen-ziabile in un punto indica la direzione e il verso di massima pendenza delgrafico della funzione nel punto.

Valutando la derivata direzionale nella direzione del gradiente si trova ilvalore della massima pendenza, pari a

∇ f (x, y) · vmax = ‖∇ f (x, y)‖.

©Apogeo 2008 – Corso prof. Capietto

Page 13: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 4. Piano tangente ad una superficie parametrica 287

Il differenziale primo

Secondo la definizione, una funzione f è differen-ziabile in un punto (x, y) se differisce dalla sua li-nearizzazione per un infinitesimo di ordine superioreall’incremento (h, k) = (∆x,∆y):

f (x+h, y+k)− f (x, y) = fx(x, y)h+ fy(x, y)k+o(√

h2 + k2),

per (h, k)→ (0, 0). Vale a dire che, se f è differenziabilenel punto (x, y), il suo incremento

∆ f = f (x + h, y + k) − f (x, y)

si può scrivere come somma di due addendi, una par-te lineare negli incrementi h e k, e un infinitesimo diordine superiore. La parte lineare dell’incremento sichiama differenziale di f e si indica con d f :

d f : (h, k)→ fx(x, y)h + fy(x, y)k.

Il differenziale rappresenta quindi la variazione dellaquota sul piano tangente al variare del punto secon-do l’incremento (h, k). In particolare i differenziali dxe dy sono definiti come i differenziali delle funzioni

f1(x, y) = x e f2(x, y) = y, rispettivamente; cioè

dx : (h, k)→ h, dy : (h, k)→ k.

Quindi il differenziale d f di una funzione può esserescritto come

d f = fx(x, y) dx + fy(x, y) dy.

(VI.20) Esempio. Cerchiamo la direzione di massima crescita di f (x, y) =xey nel punto P = (2, 0). Dalla discussione precedente sappiamo che ladirezione giusta è quella parallela al gradiente di f in P; calcoliamo

fx(x, y) = ey, fy(x, y) = xey=⇒ fx(2, 0) = 1, fy(2, 0) = 2

e il gradiente è ∇ f (2, 0) = (1, 2). Osserviamo che ‖∇ f (2, 0)‖ =√

5. Ilvettore di norma unitaria nella direzione del gradiente è dunque

F VI.9: alcune curve di livellodi f ed il vettore ∇ f (2, 0).

v =(1, 2)√

5=

(1√5,

2√5

).

Verifichiamo che la derivata direzionale in questa direzione ha il valoremassimo possibile, pari alla norma del gradiente: dalla formula (5) si ha

Dv f (2, 0) = ∇ f (2, 0) · v = (1, 2) ·(

1√5,

2√5

)=

1√5+

4√5=

√5. �

§ 4. Piano tangente ad una superficie parametrica

Ora che disponiamo del concetto di differenziabilità per le funzioni didue variabili possiamo procedere a definire correttamente il piano tan-gente ad una superficie parametrizzata, analogo a quello di retta tangen- �Abbiamo introdotto le superfici

parametriche nel Capitolo V, § 9.te ad una curva parametrizzata, da cui prendiamo spunto. Ricordiamo

©Apogeo 2008 – Corso prof. Capietto

Page 14: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

288 Calcolo differenziale per funzioni di più variabili

F VI.10: le derivate parziali dellaparametrizzazione della superficie so-no i vettori tangenti delle curve dellagriglia.

che uno dei punti salienti della teoria delle curve è la definizione di cur-va regolare; solo per tali curve, infatti, abbiamo definito la retta tangentein un punto. La ragione consiste nel fatto che, per individuare la direzio-ne della retta tangente, non è sufficiente che la parametrizzazione r siadifferenziabile: il vettore tangente corrispondente potrebbe essere nul-lo. Almeno nel caso delle superfici cartesiane, abbiamo già imparato ariconoscere le superfici che ammettono un piano tangente. Tentiamo diripercorrere quei ragionamenti (si veda la discussione a pagina 278). Siadunque Σ una superficie di parametrizzazione r : D ⊂ R2 → R3. Co-me prima misura precauzionale, supponiamo che la parametrizzazioner(u, v) sia di classe C1 nei punti interni di D. �Ricordiamo che abbiamo defini-

to la differenziabilità per funzioni dipiù variabili solo su domini aperti(Definizione (VI.14) a pagina 284).Se vogliamo mantenere questa sem-plificazione, al momento non riusci-remo a definire un piano tangentenegli eventuali punti della superficiecorrispondenti ad r(∂D).

Fissiamo un punto P0 = r(u0, v0) della superficie; come abbiamo giàosservato, se manteniamo u = u0 e facciamo variare v, l’espressione

r̃(v) = r(u0, v) = x(u0, v) i + y(u0, v) j + z(u0, v) k

parametrizza una curva γ1 contenuta in Σ e passante per P0. Il vettoretangente a tale curva in P0 è dato da

r̃′(v0) = xv(u0, v0) i + yv(u0, v0) j + zv(u0, v0) k = rv(u0, v0).

Analogamente, il vettore

ru(u0, v0) = xu(u0, v0) i + yu(u0, v0) j + zu(u0, v0) k

è tangente alla curva γ2 che otteniamo fissando v = v0 e facendo varia-re u (si veda la Figura VI.10). È chiaro che il piano tangente a Σ in P0,qualunque definizione sensata se ne voglia dare, dovrà contenere le rettetangenti alle curve della griglia, perciò viene naturale definire come pia-no tangente quello generato dai vettori ru e rv. Affinché i due vettori inquestione generino un piano, però, essi non soltanto non devono esserenulli, ma occorre che siano linearmente indipendenti. Delle varie condi-

�Per la Definizione (IV.63) a pagi-na 193, una condizione equivalentealla lineare indipendenza di ru e rv èche la matrice che ha per righe ru erv abbia rango 2. Come vedremo nel-l’Esercizio 40 a pagina 386, questoimplica che, localmente, è possibileesprimere u e v in funzione di duevariabili tra x, y e z. Se ad esem-pio possiamo esplicitare u = u(x, y)e v = v(x, y), allora sostituendo inz abbiamo z = z(u(x, y), v(x, y)) =f (x, y). Quindi localmente una super-ficie regolare è sempre una superficiecartesiana.

zioni equivalenti per la lineare indipendenza, la più espressiva, per la suainterpretazione geometrica, è quella di dire che il loro prodotto vettorialedeve essere non nullo (si veda il Corollario (III.32) a pagina 126). Infattise ru e rv generano il piano tangente allora ru × rv , 0 è perpendicolarea tale piano, cioè è un vettore normale a Σ. Formalizziamo la precedentediscussione nella seguente definizione.

©Apogeo 2008 – Corso prof. Capietto

Page 15: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 4. Piano tangente ad una superficie parametrica 289

(VI.21) Definizione. Una superficie Σ si dice regolare (o liscia) seammette una parametrizzazione r tale che

➔ r è di classe C1 e

➔ ‖ru(u, v) × rv(u, v)‖ , 0 per ogni (u, v). �Ricordiamo che tali condizioni pernoi non hanno significato su ∂D(stiamo comunque supponendo cher sia continua su tutto D), perciòil punto (u0, v0) è un punto internodi D (prenderemo in considerazionei punti di ∂D nel Capitolo X, § 5).

Il piano tangente a Σ in un suo generico punto r(u0, v0) è quellopassante per tale punto e perpendicolare a ru(u0, v0) × rv(u0, v0):

�Quindi il piano tangente puòessere scritto mediante la formu-la del prodotto triplo vista nellaProposizione (III.31), pagina 126.

x − x(u0, v0)y − y(u0, v0)z − z(u0, v0)

· ru(u0, v0) × rv(u0, v0) = 0.

Il versore

N(u0, v0) =ru(u0, v0) × rv(u0, v0)

‖ru(u0, v0) × rv(u0, v0)‖

è il versore normale a Σ (indotto da r) nel punto in questione.

�Ovviamente anche

−N(u0 , v0)

è un versore normale a Σ, quin-di una differente parametrizzazionepotrebbe indurre il versore normaleopposto.(VI.22) Esempio. Consideriamo la superficie cartesiana grafico della

funzione z = f (x, y), e supponiamo f di classe C1. Scelta la parame-trizzazione r(u, v) = u i + v j + f (u, v) k otteniamo

ru(u, v) = i + fu(u, v) k, rv(u, v) = j + fv(u, v) k

e quindi un vettore normale al piano tangente è dato da

det

i j k1 0 fu(u, v)0 1 fv(u, v)

=

− fu(u, v)− fv(u, v)

1

.

Ne segue che una superficie cartesiana è sempre regolare. Il piano tan- �Visto che la terza componente delvettore calcolato vale 1, esso nonpuò mai annullarsi.

gente nel punto (x0, y0, f (x0, y0)), corrispondente ai valori dei parametri(u0, v0), è quindi

x − x0

y − y0

z − f (x0, y0)

·

− fu(u0, v0)− fv(u0, v0)

1

= 0

ovvero − fx(x0, y0)(x−x0)− fy(x0, y0)(y− y0)+ (z− f (x0, y0)) = 0, in perfettoaccordo con quanto visto nel § 3. Infine, il versore normale indotto dallaparametrizzazione scelta è dato da

(6)

N(x0, y0) =− fx(x0, y0) i − fy(x0, y0) j + k√

1 + f 2x (x0, y0) + f 2

y (x0, y0)

=− fx(x0, y0) i − fy(x0, y0) j + k

√1 + ‖∇ f (x0, y0)‖2

. �

©Apogeo 2008 – Corso prof. Capietto

Page 16: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

290 Calcolo differenziale per funzioni di più variabili

§ 5. Funzioni composte

Se f è una funzione definita in un aperto A ⊂ R2 e r : [a, b] → A unacurva parametrizzata di componenti

x = x(t), y = y(t), t ∈ [a, b],

è definita la funzione composta � Facciamo attenzione che r(t) ∈ Aper ogni t ∈ [a, b].

F(t) = ( f ◦ r)(t) = f (x(t), y(t)), t ∈ [a, b].

Ci poniamo ora il problema di derivare la funzione F così ottenuta, sup- � Se immaginiamo che la superficiedi equazione z = f (x, y) rappresentiil profilo delle montagne di una re-gione, e (x(t), y(t)) descrivano la po-sizione (in termini di latitudine e lon-gitudine) di un alpinista al tempo t,allora il punto (x(t), y(t), F(t)) descri-ve, al variare di t, il sentiero percor-so dall’alpinista e F(t) rappresenta laquota raggiunta al tempo t.

ponendo che siano differenziabili tanto la curva quanto la funzione. Sele componenti x e y di r sono derivabili abbiamo, per t fissato e ∆t→ 0,

x(t + ∆t) = x(t) + x′(t)∆t + o(∆t) ≈ x(t) + x′(t)∆t, e

y(t + ∆t) = y(t) + y′(t)∆t + o(∆t) ≈ y(t) + y′(t)∆t.

Con questa approssimazione, possiamo ragionare come nella dimostra-zione del Teorema (VI.18),

f (x(t + ∆t), y(t+ ∆t)) ≈ f (x(t) + x′(t)∆t︸ ︷︷ ︸=h

, y(t) + y′(t)∆t︸ ︷︷ ︸=k

),

e utilizzando la differenziabilità di f otteniamo

f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t)) ≈fx(x(t), y(t))h+ fy(x(t), y(t))k+ o(

√h2 + k2) =

fx(x(t), y(t)) · x′(t)∆t + fy(x(t), y(t)) · y′(t)∆t + o(∆t). � Infatti o(√

(x′(t)∆t)2 + (y′(t)∆t)2)= o(∆t).

Dividendo per ∆t e passando al limite troviamo

F′(t) = lim∆t→0

f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t))

∆t

= fx(x(t), y(t)) · x′(t) + fy(x(t), y(t)) · y′(t).

(VI.23) Esempio. Se f (x, y) = xey e x(t) = cos t, y(t) = sin 2t la funzionecomposta è

F(t) = cos t esin 2t, da cui F′(t) = − sin t esin 2t+ cos t · (2 cos 2t)esin 2t.

D’altra parte abbiamo fx(x, y) = ey e fy(x, y) = xey. Quindi

fx(x(t), y(t))x′(t)+ fy(x(t), y(t))y′(t) = esin 2t(− sin t)+ cos t esin 2t(2 cos t).

A conferma del risultato, le due espressioni sono uguali. �

Questo ragionamento può essere reso rigoroso e porta a dimostrarela formula di derivazione della funzione composta.

©Apogeo 2008 – Corso prof. Capietto

Page 17: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 5. Funzioni composte 291

(VI.24) Teorema. Se r : (a, b) → A è derivabile ed f : A ⊂ R2 → R è � La dimostrazione di questo ri-sultato verrà esposta nel prossimocapitolo, in un contesto più ge-nerale di composizione di funzionedi più variabili che comprende an-che il Teorema (VI.27) (si veda ilTeorema (VII.45) a pagina 353).

differenziabile allora la funzione composta F(t) = f (r(t)) è derivabile in(a, b) e risulta

F′(t) = fx(x(t), y(t))x′(t) + fy(x(t), y(t))y′(t) = ∇ f (r(t)) · r′(t)

per ogni t ∈ (a, b). �Con notazione più espressiva,

dF

dt=∂ f

∂x

dx

dt+∂ f

∂y

dy

dt.

(VI.25) Esempio (Derivazione implicita). Consideriamo una funzionef definita in un aperto A ⊂ R2, e supponiamo che in A sia contenuto ilgrafico di una funzione y = y(x). Possiamo definire la funzione composta �Rispetto alla notazione del Teore-

ma (VI.24) si tratta del caso in cuix = t e y = y(t).F(x) = f (x, y(x)).

Se valgono le ipotesi del Teorema (VI.24), la sua derivata è

F′(x) = fx(x, y(x))+ fy(x, y(x))y′(x) = ∇ f (x, y(x)) · (1, y′(x)).

Osserviamo che il vettore (1, y′(x)) è tangente al grafico della funzioney = y(x) nel punto (x, y(x)). �

� Si osservi che questa formula per-mette di ricavare la derivata y′(x),in funzione di y(x) non appenafy(x, y(x)) è non nullo:

y′(x) =F′(x) − fx(x, y(x))

fy(x, y(x)).

(VI.26) Esempio (Il gradiente è ortogonale alle curve di livello).Supponiamo ora che C sia l’insieme di livello k della funzione f (x, y)e che esso sia il sostegno di una curva r regolare. La funzione compostaF(t) = f ◦ r(t) è allora costantemente uguale a k e la sua derivata è nullaper ogni t, e dunque

F′(t) = ∇ f (r(t)) · r′(t) = 0.

In altre parole, il gradiente di f è in ogni punto perpendicolare al vettoretangente all’insieme di livello f (x, y) = k, quando questo è il sostegno di unacurva regolare. �

F VI.11

Una ulteriore situazione può capitare quando x e y siano a loro voltafunzioni di due variabili, diciamo r e s

x = x(r, s), y = y(r, s), (r, s) ∈ B.

Se (x(r, s), y(r, s)) appartiene ad A, l’insieme di definizione di f , per ogni(r, s) in B, è possibile definire la funzione composta di due variabili

F(r, s) = f (x(r, s), y(r, s)), (r, s) ∈ B.

Il teorema seguente insegna a calcolare le derivate parziali di F note lederivate delle funzioni f (x, y), x(r, s) e y(r, s).

(VI.27) Teorema. Se x(r, s), y(r, s) e f (x, y) sono differenziabili, allora � Le funzioni x e y sono differenzia-bili in B; f in A.la funzione composta F(r, s) = f (x(r, s), y(r, s)) è differenziabile e

� Le derivate di x e y sono calcolatenel punto (r, s) e le derivate di f siintendono calcolate in (x(r, s), y(r, s)).

∂F

∂r=∂ f

∂x

∂x

∂r+∂ f

∂y

∂y

∂re

∂F

∂s=∂ f

∂x

∂x

∂s+∂ f

∂y

∂y

∂s.

©Apogeo 2008 – Corso prof. Capietto

Page 18: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

292 Calcolo differenziale per funzioni di più variabili

Queste formule di derivazione sono note come regola della catena e si �Chain rule: facili da generalizza-re nel caso di composizioni con fun-zioni di più variabili, grazie a dia-grammi ad albero come quello inFigura VI.12.

ricordano facilmente usando il diagramma ad albero in Figura VI.12. Daz (si intende z = f (x, y)) partono due rami, uno in corrispondenza dellavariabile x e uno in corrispondenza di y. Da x partono due rami, corri-spondenti a s e t, e allo stesso modo due rami partono da y. Il significato

F VI.12

di un ramo è quello di indicare la derivazione del nodo superiore rispettoalla variabile inferiore: per calcolare ad esempio la derivata della funzio-ne composta rispetto a r, si seguono tutti i cammini che partono da z earrivano a r, si eseguono le derivate parziali indicate su ogni ramo, simoltiplicano tra loro e il risultato si somma a quello ottenuto lungo ognialtro cammino.

(VI.28) Esempio. Le formule di derivazione appena viste sono moltoutili nel caso di cambiamento di variabili. Sappiamo ad esempio che leespressioni

x = r cosϑ, y = r sinϑ

determinano il passaggio dalle coordinate cartesiane x, y alle coordinatepolari r, ϑ. Se z = f (x, y) = f (r cosϑ, r sinϑ), si ha

∂z

∂r=∂ f

∂xcosϑ +

∂ f

∂ysinϑ

∂z

∂ϑ= −∂ f

∂xr sinϑ +

∂ f

∂yr cosϑ �

§ 6. Derivate successive. Il Teorema di Schwarz

Se f (x, y) è una funzione derivabile in un aperto A ⊂ R2, le sue derivateparziali fx(x, y) e fy(x, y) sono funzioni di due variabili e possono esserea loro volta derivabili. Ad esempio, se fx(x, y) è derivabile, è possibile �Analogamente se fy(x, y) è deri-

vabile possiamo calcolare le derivateseconde

fyx(x, y),∂2 f

∂x∂y(x, y),

∂x

∂ f

∂y(x, y)

fyy(x, y),∂2 f

∂y2(x, y),

∂y

∂ f

∂y(x, y).

Ad esempio per calcolare le deriva-te seconde di f (x, y) = ex sin y abbia-mo bisogno delle sue derivate parzialifx(x, y) = ex sin y e fy(x, y) = ex cos y.Otteniamo quindi

fxx(x, y) =∂

∂x(ex sin y) = ex sin y,

fxy(x, y) =∂

∂y(ex sin y) = ex cos y,

fyx(x, y) =∂

∂x(ex cos y) = ex cos y,

fyy(x, y) =∂

∂y(ex cos y) = −ex sin y.

calcolarne le derivate parziali rispetto ad x e ad y, che verranno indicaterispettivamente con i simboli equivalenti

fxx(x, y),∂2 f

∂x2(x, y),

∂x

∂ f

∂x(x, y)

fxy(x, y),∂2 f

∂y∂x(x, y),

∂y

∂ f

∂x(x, y).

Tali derivate sono dette derivate parziali seconde di f rispetto alle variabilicorrispondenti. Le 4 derivate seconde di f vengono disposte, per motiviche esporremo fra poco, sotto forma di matrice 2 × 2 nel modo seguente

H f (x, y) =

fxx(x, y) fxy(x, y)

fyx(x, y) fyy(x, y)

Questa matrice è detta matrice hessiana di f in (x, y).

©Apogeo 2008 – Corso prof. Capietto

Page 19: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 6. Derivate successive. Il Teorema di Schwarz 293

Equazioni differenziali alle derivate

parziali.

Le equazioni differenziali a derivate parziali servo-no a descrivere numerosissime leggi fisiche, dalleequazioni del campo elettromagnetico alle equazio-ni della termodinamica a quelle dell’idrodinamica. Peresempio l’equazione delle onde unidimensionali

utt = c2uxx

descrive il moto di un’onda elettromagnetica, diun’onda sonora, o di un’onda viaggiante in una cor-da vibrante (u = u(x, t) dipende dal tempo t e dallaposizione x). Di tale equazione possiamo calcolare inmodo abbastanza semplice le soluzioni definite su R2,utilizzando il metodo di d’Alembert, esposto nell’Eser-cizio 24 . Svolgendo l’Esercizio scopriamo che c ha unsignificato fisico ben preciso: è la velocità con cui sipropagano le onde.Un’altra celebre equazione è la seguente:

uxx + uyy + uzz = 0,

con u = u(x, y, z), soddisfatta dal potenziale del campoelettrico in una regione priva di cariche (si veda il ri-quadro di approfondimento a pagina 549). Tale equa-zione è detta equazione di Laplace e le sue soluzioni,che prendono il nome di funzioni armoniche, entranoin gioco anche nei problemi della propagazione delcalore e delle onde. Esse rivestono una importanzatale da aver dato il nome all’operatore di Laplace, o

laplaciano, che associa ad una funzione la somma del-le sue derivate parziali seconde rispetto alle diversevariabili:

∆u = uxx + uyy + uzz.

Fra le soluzioni troviamo alcune fra le funzioni diBessel, già incontrate nel Capitolo II. L’equazione delcalore, o della diffusione,

ut = κ∆u,

dove u = u(x, y, z, t), si può studiare utilizzando ilmetodo della separazione delle variabili (che, nono-stante il nome, non è parente stretto di quello vistoper le equazioni ordinarie nel Capitolo I). Imponia-mo che u(x, y, z, t) = ϕ(t)v(x, y, z) risolva l’equazione:e dividiamo l’equazione per u. Otteniamo

ϕ′

ϕ= κ∆v

v= −λ ∈ R.

Questa decomposizione è di grande utilità se siamoin grado di risolvere l’equazione agli autovalori −∆v =λv. Infatti

−∆v = λv ⇔ u = e−λtv(x, y, z).

Nella risoluzione dell’equazione agli autovalori, anco-ra una volta, giocano un ruolo fondamentale le funzio-ni di Bessel, come si vede nell’Esercizio 30 . Analoghiartifici sono di utilità nel trattare l’equazione delle ondepiane e quella delle onde tridimensionali:

utt = c2(uxx + uyy + uzz) .

(VI.29) Definizione. Se esistono le quattro derivate seconde di f nelpunto (x, y) si dice che f è derivabile due volte in (x, y).� Se tali derivate �Ovviamente si deve presupporre la

derivabilità parziale di f in tutto undisco aperto intorno a (x, y).

esistono in ogni punto di un aperto A ⊂ R2, si dice che f è derivabi-le due volte in A. Se tutte le derivate parziali seconde sono funzionicontinue in A diremo che f è di classe C2 e useremo la notazionef ∈ C2(A).

(VI.30) Esempio. Se f (x, y, z) = cos(xy2 − 3z) possiamo calcolare fzx

derivando f prima rispetto a z e poi rispetto a x � Si osservi che, poiché f ha 3 va-riabili, in totale si hanno 9 possibiliderivate seconde: fxx, fxy, fxz, fyx,fyy , fyz, fzx, fzy, fzz. Il Lettore puòfacilmente dimostrare che le derivatek-esime di una funzione di n variabilisono nk.

fz =(− sin(xy2 − 3z)

)·(−3), fzx =

∂x(3 sin(xy2−3z)) = 3y2 cos(xy2−3z).

Calcoliamo per curiosità anche fxz:

fxz =∂

∂z

(fx)=∂

∂z(−y2 sin(xy2 − 3z)) = 3y2 cos(xy2 − 3z). �

©Apogeo 2008 – Corso prof. Capietto

Page 20: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

294 Calcolo differenziale per funzioni di più variabili

Osserviamo che, negli esempi precedenti, le derivate seconde miste,cioè effettuate rispetto a due variabili diverse, non dipendono dall’ordinein cui si eseguono le derivazioni. Questo è un fatto generale ammesso che � Se le derivate miste non sono con-

tinue questo fatto non è sempre vero,si veda ad esempio l’Esercizio 17 apagina 327.

tali derivate miste di f siano continue, come recita il seguente Teoremadi Schwarz.

(VI.31) Teorema di Schwarz. Se f ∈ C2(A) allora si ha � La dimostrazione è rimandata alprossimo capitolo, a pagina 359. IlTeorema di Schwarz vale anche perfunzioni di tre o più variabili; garan-tisce l’uguaglianza delle 6 derivatemiste a due a due, cioè fxy = fyx,fxz = fzx e fyz = fzy.

fxy(x, y) = fyx(x, y) ∀(x, y) ∈ A

e quindi la matrice hessiana è simmetrica: tH f (x, y) = H f (x, y).

Analogamente si possono definire anche le derivate di ordine più alto: sef è derivabile due volte e le funzioni fxx, fxy, fyx e fyy sono a loro voltaderivabili, si ottengono 8 derivate terze:

fxxx, fxxy, fxyx, fxyy, fyxx, fyxy, fyyx, fyyy.

Se queste funzioni sono derivabili si ottengono 16 derivate quarte e cosìvia. Fortunatamente, applicando iterativamente il Teorema di Schwarz

� Se f è derivabile 3 volte con de-rivate terze continue, avremo cosìche

fxxy = fxyx = fyxx ,

dove si deriva 2 volte rispetto a x euna rispetto a y; analogamente deri-vando 2 volte rispetto a y e una solavolta rispetto a x si avrà la stessafunzione

fxyy = fyxy = fyyx .

si scopre che, quando sono continue, le derivate diverse tra loro sonoin numero inferiore (si veda l’Esercizio 15 a pagina 327): il teoremagarantisce infatti che l’ordine in cui si effettua le derivazione non con-ta. In generale possiamo enunciare il seguente risultato, la cui semplicedimostrazione è lasciata all’Esercizio 14 .

(VI.32) Corollario. Se f e di classe Ck allora l’ordine di derivazione non �Ovvero se f è derivabile k vol-te con derivate tutte continue finoall’ordine k.

conta nelle derivate parziali di ogni ordine fino a k.

§ 7. Valori di massimo e di minimo

L’ottimizzazione, cioè la ricerca del valore massimo (o minimo) di unafunzione di più variabili, è un problema centrale delle applicazioni delcalcolo differenziale in diversi ambiti: dai campi più teorici, la geome-tria e la fisica, a quelli più strettamente applicativi come l’economia, lafinanza, i sistemi industriali, e così via.

(VI.33) Esempio. Consideriamo il problema di determinare il punto delpiano z = x+ y−1 che ha minima distanza dal punto Q = (2, 1,−1). Come �Nel Capitolo III abbiamo visto

che, dati un punto dello spazio Q =(x, y, z) ed un piano p di equazioneax + by + cz = d, la proiezione delpunto Q sul piano p rende minima,fra tutti i punti del piano, la distanzada Q.

abbiamo imparato nel Capitolo III, tale distanza minima è quella di Q dalpiano e, in base alla formula (38) a pagina 138, vale

distanza(Q, p) =|axQ + byQ + czQ − d|√

a2 + b2 + c2=

√3;

inoltre il minimo è realizzato dal punto P0 = (1, 0, 0), per cui il vettore# »

PQ è ortogonale al piano. Vogliamo ora capire quali sono le conseguenze

[In dubio abstine]

©Apogeo 2008 – Corso prof. Capietto

Page 21: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 7. Valori di massimo e di minimo 295

Formula di Taylor

Per una funzione f di classe C2 in un aperto A e(x0, y0) ∈ A vale la formula di Taylor di ordine 2 conresto di Peano

f (x0 + h, y0 + k) = f (x0, y0) + fx(x0, y0)h + fy(x0, y0)k

+1

2

[fxx(x0, y0)h2

+ 2 fxy(x0, y0)hk + fyy(x0, y0)k2]

+ o(h2+ k2).

La dimostrazione di questo risultato verrà svolta nel-l’Esercizio 20 a pagina 327. Segue immediatamenteda questa formula la risposta alla domanda formula-ta nel riquadro a pagina 285: il polinomio di ordine 2che meglio approssima f vicino a (x0, y0) è

p2(x, y) = f (x0, y0) + fx(x0, y0)(x − x0) + fy(x0, y0)(y − y0)

+1

2

[fxx(x0, y0)(x − x0)2

+ 2 fxy(x0, y0)(x − x0)(y − y0)

+ fyy(x0, y0)(y − y0)2],

nel senso che p2 è l’unico polinomio di grado due percui la differenza f (x, y)−p2(x, y) tende a zero più rapi-damente della distanza tra (x, y) e (x0, y0) al quadrato.

Esso prende il nome di polinomio di Taylor di ordine2 di f centrato in (x0, y0).È possibile scrivere la formula di Taylor col resto diPeano in modo più compatto ed elegante utilizzan-do le notazioni vettoriali e la matrice hessiana di f .Se x = (x0, y0) e h = (h, k) (o anche x = (x0, y0, z0) eh = (h, k, l)) la formula di Taylor diviene

f (x+ h) = f (x) +∇ f (x) · h+ 1

2H f (x)h · h+ o(‖h‖2).

La notazione vettoriale verrà usata in modo sistemati-co nel prossimo capitolo, per funzioni di un qualunquenumero di variabili.Se f è una funzione differenziabile due volte in (x, y),si chiama differenziale secondo di f in (x0, y0) la formabilineare

d2 f : (h, k) 7→ fxx(x0, y0)h2+2 fxy(x0, y0)hk+ fyy(x0, y0)k2

ovvero

d2 f h = H f (x0, y0)h · h, h = (h, k).

Si tratta di una forma quadratica (si veda il Capito-lo IV a pagina 197) in h e k che ha per coefficienti lederivate seconde di f nel punto (x0, y0).

della proprietà di minimalità di tale punto in relazione alle derivate dellafunzione che viene minimizzata. Se P = (x, y, z) e Q = (2, 1,−1), allora � In questo esempio sappiamo già

che il minimo esiste ed è unico. Difronte ad un problema di minimiz-zazione è bene porsi la domanda seil minimo abbia ragione di esistere:com’è noto non tutte le funzioni neposseggono uno.

distanza(P,Q) =

√(x − 2)2 + (y − 1)2 + (z + 1)2.

Vogliamo minimizzare tale distanza al variare di P nel piano assegnato.Ciò significa che P avrà coordinate (x, y, x+ y− 1), con (x, y) ∈ R2. Osser-viamo che, per trovare la distanza minima, possiamo cercare il minimodella distanza al quadrato, cioè cercare il punto di minimo della funzionedi due variabili: � Infatti l’elevamento al quadrato è

una operazione monotona crescente.

f (x, y) = (x − 2)2+ (y − 1)2

+ (x + y)2 ,

al variare di (x, y) in tutto il piano xy. Supponiamo che il minimo siaraggiunto nel punto (x0, y0): possiamo asserire che x0 è punto di minimoanche per la traccia 11(x) = f (x, y0), la cui derivata dovrà perciò annullar-si in x0, in base al Teorema di Fermat. Analogamente, la derivata (rispetto �Osserviamo che le tracce sono

funzioni derivabili.ad y) della traccia 12(y) = f (x0, y) dovrà annullarsi in y0. Otteniamo dun-que non più una, come nel caso delle funzioni di una variabile, ma duecondizioni di estremalità:

fx(x0, y0) = 2(x0−2)+2(x0+y0) = 0, fy(x0, y0) = 2(y0−1)+2(x0+y0) = 0.

Poiché l’unica soluzione è (x0, y0) = (1, 0), possiamo dire con certezza �Tale soluzione si trova (ad esem-pio) ricavando y0 = 2 − 2x0 dallaprima equazione e sostituendo nellaseconda.

che il minimo è assunto nel punto (1, 0). Possiamo quindi concludere che

©Apogeo 2008 – Corso prof. Capietto

Page 22: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

296 Calcolo differenziale per funzioni di più variabili

F VI.13: estremi locali eglobali di una funzione di duevariabili.

il valore minimo di f è f (1, 0) = 3. Abbiamo riottenuto quindi che ladistanza tra Q e il piano è

√3, realizzata dal punto (1, 0, 0): tuttavia,

il metodo seguito ha una grande generalità e può essere utilizzato pertrovare i massimi e minimi per una vasta classe di problemi. �

Osserviamo che, tolti gli aspetti notazionali, le nozioni di massimo eminimo (locale e assoluto) di una funzione non risentono del numero divariabili.

(VI.34) Definizione. P0 = (x0, y0) ∈ D è un punto di massimo localeper f se il suo valore f (P0) è massimo fra tutti quelli assunti in un discoaperto centrato in P0.� P0 è invece un punto di minimo locale per f se �Ovvero se esiste un raggio δ > 0

per cui f (x0 , y0) ≥ f (x, y) per ogni(x, y) ∈ (

D ∩ Bδ(x0 , y0)). Se inve-

ce vale f (x0 , y0) ≤ f (x, y) per ogni(x, y) ∈ (

D ∩ Bδ(x0 , y0))

il punto è unminimo locale.

il suo valore f (P0) è minimo fra tutti quelli assunti in un disco apertocentrato in P0. Il corrispondente valore f (P0) è detto rispettivamentemassimo o minimo (locale).

I punti di massimo e minimo locale si dicono punti di estremo locale, oestremali, e analogamente le loro immagini si dicono valori estremi. Iltermine locale (a volte sostituito da relativo) è contrapposto a globale (oassoluto), che si riferisce ad estremi che sono tali su tutto il dominio.Gli estremi, locali o globali, sono stretti nel caso in cui valgano le disu-guaglianze strette (ovviamente per (x, y) , (x0, y0)). Come abbiamo vistonell’Esempio (VI.33), le condizioni di estremalità per le funzioni di duevariabili consistono nell’annullarsi delle due derivate parziali. Questo ri-sultato estende al caso multidimensionale il noto Teorema di Fermat perle funzioni di una variabile.

(VI.35) Teorema. Sia f : A ⊂ R2 con A aperto. Se (x0, y0) ∈ A è dimassimo o di minimo locale per f e se f è derivabile in (x0, y0), allora

�Analogamente, nelle stesse condi-zioni, la condizione di estremalità perle funzioni di tre o più variabili con-siste nell’annullarsi del gradiente nelpunto di massimo o minimo.

fx(x0, y0) = fy(x0, y0) = 0, ossia ∇ f (x0, y0) = (0, 0).

Dimostrazione. Sia 11(x) = f (x, y0). Poiché (x0, y0) ∈ A e A è aperto esiste un discocentrato in (x0, y0) e di raggio δ > 0 completamente contenuto in D: la funzione11 risulta così definita nell’intervallo (x0 − δ, x0 + δ) ed è derivabile in x0. Poichéf ha un punto di massimo in (x0, y0) anche 11 ha un massimo in x0, dunque inbase al Teorema di Fermat 1′

1(x0) = 0. Ma, per definizione, 1′

1(x0) = fx(x0, y0) e

dunque fx(x0, y0) = 0. Analogamente, definendo 12(y) = f (x0, y), si mostra che1′2(y0) = fy(x0, y0) = 0. �

©Apogeo 2008 – Corso prof. Capietto

Page 23: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 7. Valori di massimo e di minimo 297

(VI.36) Definizione. Un punto in cui entrambe le derivate parziali di �Per la definizione data, i punti cri-tici sono punti in cui la funzione èderivabile. Nel caso in cui sia anchedifferenziabile (come nella gran par-te dei casi che studieremo) in talipunti il piano tangente è orizzonta-le. Osserviamo inoltre che gli estremidi una funzione possono trovarsi inpunti in cui la funzione non è deriva-bile: tali punti vanno analizzati sepa-ratamente; a tal proposito rimandia-mo all’Esercizio (VI.11), svolto allafine del capitolo.

f si annullano si dice punto critico (o punto stazionario) di f .

(VI.37) Esempio. La funzione f (x, y) = 2x2 − 2xy + y2 ha l’origine comeunico punto critico. Difatti∇ f (x, y) = (4x−2y,−2x+2y) e l’unica soluzionedel sistema

{4x − 2y = 0

−2x + 2y = 0

è (0, 0). Per capire se è un massimo o un minimo, osserviamo che la fun-zione si può decomporre nella somma di due quadrati: f (x, y) = x2

+ (x+y)2. Perciò f (x, y) > f (0, 0) = 0 per ogni (x, y) , (0, 0) e l’origine è unpunto di minimo globale stretto. La funzione f (x, y) = x2 − y2 ha anch’es-sa l’origine come unico punto critico, come si vede immediatamente dalcalcolo del gradiente ∇ f (x, y) = (2x,−2y). Tuttavia, non è né massimo néminimo locale: infatti f (0, 0) = 0 e vi sono punti a quota positiva (peresempio (x, 0)) e negativa ((0, y)) arbitrariamente vicini all’origine. �

(VI.38) Esempio. Estendiamo� ora le considerazioni svolte nell’Esem- � Il sistema

2ax + by = 0

bx + 2cy = 0

ha la sola soluzione nulla se e solo se

det

[2a bb 2c

]= D , 0

(Teorema (III.23) a pagina 115).

pio precedente al caso generale di una forma quadratica, cioè un polino-mio omogeneo di grado due nelle variabili x e y:

q(x, y) = ax2+ bxy + cy2 .

Osserviamo che, se D = 4ac − b2 , 0, q ha la sola origine come puntocritico. Dimostriamo che

① se D > 0 e a > 0 allora (0, 0) è un punto di minimo stretto;� �Per esempio q(x, y) = x2+ y2.

② se D > 0 e a < 0 allora (0, 0) è un punto di massimo stretto;� �Per esempio q(x, y) = −x2 − y2.

③ se D < 0 allora (0, 0) non è di massimo né di minimo.� �Per esempio q(x, y) = x2 − y2.

Osserviamo preliminarmente che, se 4ac − b2 > 0, il trinomio q(x, y) = � Si tratta in effetti di un caso par-ticolare del Criterio di Sylvester, apagina 203.

ax2+ bxy + cy2 si annulla mai, a meno che (x, y) = (0, 0). Avremo quindi

q(x, y) > 0 se a > 0 e (x, y) , (0, 0) e l’origine è un punto di minimoassoluto stretto, mentre avremo q(x, y) < 0 se a < 0 e (x, y) , (0, 0) el’origine è un punto di massimo assoluto stretto. Se invece 4ac − b2 < 0

F VI.14: il grafico della fun-zione f (x, y) = x2− y2 ha la formadi una sella vicino all’origine.

il trinomio cambia segno: esistono pertanto due valori distinti (x−, y−) e(x+, y+) per cui q(x−, y−) < 0 < q(x+, y+). Avremo dunque, per ogni t > 0,

q(tx−, ty−) = t2q(x−, y−) < 0 = q(0, 0) < t2q(x+, y+) = q(tx+, ty+) ,

e dunque, in ogni disco aperto centrato nell’origine si trovano, per t ab-bastanza piccolo, sia punti a quota positiva cha punti a quota negativa.L’origine non è né minimo né massimo relativo. �

(VI.39) Definizione. Un punto critico che non è di massimo né diminimo è detto punto di sella.

©Apogeo 2008 – Corso prof. Capietto

Page 24: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

298 Calcolo differenziale per funzioni di più variabili

Il grafico della funzione vicino ad un punto di sella può differire assai da

F VI.15: i punti (0, y, 0) sonodei punti di sella per la funzionef (x, y) = x3.

quello raffigurato in Figura VI.14 come mostrato nella Figura VI.15): ilfatto caratteristico è che, diversamente dai punti di estremo, il grafico dif attraversa, se esiste, il piano tangente in (x0, y0), analogamente ai puntidi flesso per le funzioni in una sola variabile.

Classificazione dei punti critici: il test dell’hessiana

Dato un punto critico, ci poniamo il problema di stabilirne la natura loca-le, cioè se sia un massimo, un minimo, oppure un punto di sella. Sappia-mo che, per le funzioni di una variabile, è il segno della derivata secondaa determinare la natura locale del punto critico: se essa è positiva sia-mo in presenza di un minimo locale mentre se è negativa si tratta di unmassimo locale. Ci aspettiamo che valga un criterio analogo anche perle funzioni di due variabili. Per cercare di risalire alla natura del pun- �Nel caso di funzioni di due varia-

bili di classe C2, di derivate secondenon ce n’è più una sola, bensì tree questo permette ben otto diver-se combinazioni possibili dei segni,mentre vi sono solo tre tipi di punticritici, massimo, minimo e punto disella.

to critico, a partire dalla conoscenza delle derivate parziali prime (chesappiamo essere nulle) e di quelle seconde nel punto critico, prendiamoispirazione dall’Esempio (VI.38). In quel caso abbiamo studiato il segnodel determinante della matrice

det

[2a bb 2c

]= 4ac − b2

e quello del coefficiente a. Teniamo ora presente che, per la funzionef (x, y) = ax2

+ bxy+ cy2 valgono delle precise relazioni fra i coefficienti a,b e c e le derivate seconde della funzione: infatti si ha 2a = fxx(0, 0), b =fxy(0, 0) e 2c = fyy(0, 0). Possiamo quindi aspettarci un criterio che tengaconto del segno del determinante della matrice hessiana della funzionee del suo primo elemento. Vale infatti il seguente

(VI.40) Test dell’hessiana. Sia f : A ⊂ R2 → R con A aperto, e f di � La dimostrazione di questo risul-tato è basata sull’approssimazione alsecond’ordine data dalla formula diTaylor (riquadro a pagina 295) e sul-lo studio del segno delle forma qua-dratica associata alla matrice hessia-na (si veda il Capitolo IV a pagi-na 197). Il lettore può provare a risol-vere l’Esercizio 21 . Come vedremonel prossimo capitolo (quando pren-deremo in considerazione anche fun-zioni di 3 o più variabili), si tratta diun caso particolare del più generaleTeorema (VII.62).

classe C2(A). Sia (x0, y0) ∈ A un punto critico di f in cui il determinantedella matrice hessiana è non nullo, cioè

D(x0, y0) = det

fxx(x0, y0) fxy(x0, y0)

fyx(x0, y0) fyy(x0, y0)

, 0.

Allora

① D(x0, y0) > 0 e fxx(x0, y0) > 0 =⇒ (x0, y0) di minimo locale;

② D(x0, y0) > 0 e fxx(x0, y0) < 0 =⇒ (x0, y0) di massimo locale;

③ D(x0, y0) < 0 =⇒ (x0, y0) è un punto di sella.�Potrebbe accadere che D(x0, y0) >0 e fxx(x0 , y0) = 0?

⊚ ATTENZIONE! Se D = 0 il test non fornisce informazioni: f potrebbeavere un minimo, come ad esempio f (x, y) = x4

+y4 in (0, 0), un massimo,come succede a f (x, y) = −x4− y4 in (0, 0), o nessuno dei due come per la

©Apogeo 2008 – Corso prof. Capietto

Page 25: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 7. Valori di massimo e di minimo 299

F VI.16: da sinistra a destra sono rappresentate le funzioni y4+x4, −y4 −x4, −y4

+x4: il determinante dell’hessiananell’origine è nullo e la natura del punto varia da funzione a funzione.

funzione f (x, y) = x4 − y4 in (0, 0): si confrontino i grafici di queste fun-zioni in Figura VI.16. Per stabilire la natura del punto occorre procederea un esame diretto della funzione per studiare il segno dell’incrementovicino al punto, come vedremo nell’Esempio (VI.42).

(VI.41) Esempio. Classifichiamo i punti critici della funzione

f (x, y) = 2x3 − 6xy + 3y2.

Dobbiamo risolvere il sistema{

fx(x, y) = 6x2 − 6y = 0fy(x, y) = −6x + 6y = 0

Dalla seconda equazione si ricava y = x: sostituendo questa nella primasi ha 6x2 − 6x = 0 da cui i valori x = 0 e x = 1. I punti critici sono quindidue: (0, 0) e (1, 1). Calcoliamo ora le derivate seconde di f

fxx(x, y) = 12x, fxy(x, y) = fyx(x, y) = −6, fyy(x, y) = 6.

Per poter applicare il Test dell’hessiana nel punto (0, 0) dobbiamo con-trollare che risulti diverso da 0 il determinante di

H f (0, 0) =

0 −6

−6 6

Essendo D(0, 0) = −36 < 0 grazie al Test concludiamo che il punto (0, 0)è una sella. Nel punto (1, 1) si ha

H f (1, 1) =

12 −6

−6 6

e D(1, 1) = 36 > 0: essendo poi fxx(1, 1) > 0, il Test assicura che (1, 1) è unminimo locale. �

©Apogeo 2008 – Corso prof. Capietto

Page 26: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

300 Calcolo differenziale per funzioni di più variabili

Funzioni convesse

Una funzione di due variabili si dice strettamente con-vessa se, per ogni coppia di punti distinti P1 = (x1, y1),P2 = (x2, y2) e ogni λ ∈ (0, 1) si ha

f (λx1 + (1 − λ)x2, λy1 + (1 − λ)y2)

< λ f (x1, y1) + (1 − λ) f (x2, y2) .

Questa richiesta equivale ad imporre che la restrizionedella funzione ad ogni retta sia strettamente convessacome funzione di una sola variabile. Se supponiamoche la funzione f sia di classe C2 e prendiamo la rettapassante per P1 e P2: posto h = x2 − x1, k = x2 − x1 ext = x1 + th yt = y1 + tk, definiamo

1(t) = f (x1 + th, y1 + tk) .

La derivata seconda di 1 (si veda anche l’Eserci-zio 18 ) dovrà dunque essere sempre positiva:

1′′(t) = t2( fxx(xt, yt)h2+2 fxy(xt, yt)hk+ fyy(xt, yt)k

2 > 0 .

Si tratta di una forma quadratica, cioè di un polino-mio omogeneo di secondo grado del tipo q(h, k) =ah2+ bhk + ck2, da noi già incontrate nel Capitolo IV.

Come visto, una forma quadratica si dice definita po-sitiva se q(h, k) > 0 se (h, k) , 0. Discutendo il se-gno del trinomio, come abbiamo già fatto nell’Esem-pio (VI.38), ci si convince facilmente del fatto che laforma sia definita positiva quando a > 0 e b2−4ac < 0.Arriviamo dunque alle condizioni:

fxx(xt, yt) > 0

fxx(xt, yt) fyy(xt, yt) − ( fxy(xt, yt))2 > 0 .

Tali disuguaglianze devono essere verificate in ognipunto. Si può facilmente dimostrare che una funzio-ne strettamente convessa su R2 ha al più un puntocritico, di minimo assoluto.

(VI.42) Esempio. Consideriamo ora il caso della funzione

f (x, y) = x3+ (x − y)2.

I punti critici si trovano risolvendo il sistema

fx(x, y) = 3x2+ 2(x − y) = 0

fy(x, y) = −2(x − y) = 0.

La seconda equazione è risolta per y = x; sostituendo nella prima si troval’unica soluzione x = 0, dunque l’unico punto critico è l’origine. Abbiamo

fxx(x, y) = 6x + 2, fxy(x, y) = −2, fyy(x, y) = 2,

da cui il determinante della matrice hessiana

D(x, y) = fxx(x, y) fyy(x, y) − ( fxy(x, y))2= 2(6x + 2) − 4.

Valutato in (0, 0) si ha D(0, 0) = 0: il Test dell’hessiana non permette diconcludere nulla sulla natura del punto critico. Occorre a questo pun-to procedere a un esame diretto della funzione, per valutare il segnodell’incremento ∆ f (x, y) = f (x, y) − f (0, 0) vicino all’origine. Poiché si ha

∆ f (x, y) = x3+ (x − y)2 − 0

è facile escludere che la funzione abbia nell’origine un punto di massimoo di minimo: infatti, valutando l’incremento lungo la retta y = x risulta

∆ f (x, x) = x3

che ha segno positivo nei punti con ascissa positiva, mentre è negativose x < 0. L’origine è quindi un punto di sella. �

©Apogeo 2008 – Corso prof. Capietto

Page 27: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 8. Massimi e minimi su domini chiusi 301

§ 8. Massimi e minimi su domini chiusi

I risultati principali della teoria dell’ottimizzazione che abbiamo studianonel paragrafo precedente, il Teorema (VI.35) di Fermat in due variabili eil Test dell’hessiana, si applicano esclusivamente ai punti estremi di unafunzione definita su un dominio aperto�. Essi valgono anche quando il � Si vedano le definizioni a pagi-

na 252.dominio non è un aperto, ma il punto in questione è comunque un puntointerno al dominio, in quanto si possono applicare alla restrizione della

funzione all’insieme A =◦D dei soli punti interni al dominio. In mol-

te applicazioni interessanti, invece, siamo condotti alla ricerca di valoriestremi di una funzione definita su un insieme chiuso, come negli esempiseguenti:

➔ Quale è il punto del disco x2+ y2 ≤ 1 che si trova a minima distanza

dalla retta y = 4 −√

3x?

➔ Quale è il rettangolo di area massima tra quelli che hanno perime-tro assegnato p?

➔ Avendo a disposizione 12 m2 di cartone, quale è il volume mas-simo di una scatola rettangolare (priva di coperchio) che si puòcostruire?

Rispetto a quella sui domini aperti, l’ottimizzazione sui domini chiusipresenta qualche difficoltà supplementare: occorre infatti una trattazio-ne separata dei punti interni e di quelli di frontiera. Dall’altra parte vi èun indubbio vantaggio: è molto più probabile che il minimo (o massimo)esista. Il primo passo, nel processo di ottimizzazione, infatti, deve consi-stere nel provare che il valore estremo è assunto. A questo fine possiamo � Finora abbiamo sempre evitato di

affrontare il problema dell’esistenzadi punti di estremo e di punti critici.

contare, per le funzioni di più variabili, su un risultato del tutto analo-go a quello già visto per le funzioni continue su un intervallo chiuso elimitato. �Come è noto, un insieme di R2

è chiuso se contiene tutti i puntidi frontiera, si veda a pagina 252.Un insieme si dice limitato se ècontenuto in un disco di raggiofinito.

(VI.43) Teorema di Weierstrass. Ogni funzione continua su un do-minio D ⊂ R2 chiuso e limitato è limitata ed assume i valori massimoe minimo, ovvero esistono (xm, ym) ∈ D e (xM, yM) ∈ D tali che

f (xm, ym) ≤ f (x, y) ≤ f (xM, yM) , ∀(x, y) ∈ D.

La dimostrazione di questo Teorema richiede l’approfondimento di unaproprietà fondamentale degli spazi euclidei Rn, la completezza, e verràrimandata al prossimo capitolo, mentre il resto di questo capitolo saràdedicato all’esposizione di diverse metodologie finalizzate alla ricerca deipunti estremi ed alla discussione di applicazioni significative.

Per determinare i valori di massimo e di minimo assoluti di una fun-zione continua f su un insieme chiuso e limitato D ⊂ R2 è necessarioconsiderare separatamente l’insieme aperto composto dai punti interni

a D, A =◦D, e la frontiera di D, ∂D. Non solo, per poter applicare il

©Apogeo 2008 – Corso prof. Capietto

Page 28: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

302 Calcolo differenziale per funzioni di più variabili

Teorema (VI.35) è necessario che f sia derivabile. Supponiamo quindiche (x0, y0) sia un estremo locale per f . Allora se (x0, y0) ∈ A e se f èderivabile in (x0, y0) certamente esso è un punto critico, grazie al Teo-rema (VI.35). Se invece (x0, y0) ∈ ∂D oppure se f non è derivabile in(x0, y0), il Teorema (VI.35) non fornisce informazioni e si deve ragionarein altro modo, come vedremo nel prossimo esempio.

(VI.44) Esempio. Risolviamo il problema posto all’inizio del paragrafo:quale è il punto del disco x2

+ y2 ≤ 1 che si trova a minima distanza dallaretta y = 4 −

√3x?

F VI.17: il punto P della cir-conferenza che ha la minima di-stanza dalla retta si trova sul-la retta ortogonale y =

√3

3 xpassante per l’origine.

Ricordando la formula per la distanza punto–retta (Esercizio (III.15) apagina 152) siamo ricondotti a trovare il minimo assoluto della funzione

f (x, y) =1

2

∣∣∣∣√

3x + y − 4∣∣∣∣

sul dominio D = {(x, y) : x2+ y2 ≤ 1}. Osserviamo che, essendo l’argo-

mento del modulo sempre negativo su D, si può scrivere che

f (x, y) =1

2

(4 −√

3x − y).

Si tratta di una funzione ovunque differenziabile, priva di punti critici(infatti è una funzione lineare e ∇ f (x, y) = −(

√3, 1)), quindi il minimo di

f è da cercare sulla frontiera di D, come si poteva facilmente immaginareinterpretando geometricamente il problema. Per studiare la funzione f su∂D ci avvaliamo di una parametrizzazione della circonferenza:

x = cos t, y = sin t, t ∈ [0, 2π].

Studiare f ristretta a D significa quindi studiare la funzione della solavariabile t definita da �Per mezzo di questa parametriz-

zazione, la restrizione di f alla fron-tiera ∂D è una funzione della solavariabile t.1(t) = f (cos t, sin t) =

1

2

(4 −√

3 cos t − sin t), t ∈ [0, 2π].

Abbiamo quindi un problema di ottimizzazione di una funzione di unasola variabile, derivabile ovunque, sull’intervallo [0, 2π]. Come primacosa cerchiamo i punti interni a (0, 2π) che annullano la derivata di 1:

1′(t) =1

2

(√3 sin t − cos t

)= sin

(t − π

6

).

Si ha 1′(t) = 0 in corrispondenza a t = π/6 e t = 7π/6. Per trovare il�Per il Teorema (VI.24) di de-rivazione della funzione compostaabbiamo

1′(t) = ∇ f (x(t), y(t)) ·(− sin t, cos t).

L’annullarsi di tale derivata corri-sponde alla condizione di perpendi-colarità fra il gradiente ∇ f (x(t), y(t))ed il vettore (− sin t, cos t) tangen-te alla circonferenza. Ne deduciamoche, nel punto di minimo, il gradientedi f è ortogonale a ∂D. È questo unfatto generale, che approfondiremonel prossimo paragrafo.

minimo assoluto di 1 su [0, 2π] dobbiamo confrontare il suo valore agliestremi dell’intervallo [0, 2π] con quello in π/6 e 7π/6. Abbiamo

1(0) = 1(2π) =4 −√

3

2, 1

6

)= 1, 1

(7π

6

)= 3.

Si trova così che il minimo valore di 1 è 1(π/6) = 1. In conclusione ilpunto P del disco unitario x2

+ y2 ≤ 1 di minima distanza dalla rettay = 4 −

√3x è il punto di coordinate (

√3/2, 1/2). �

©Apogeo 2008 – Corso prof. Capietto

Page 29: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

§ 8. Massimi e minimi su domini chiusi 303

Impareremo nel prossimo paragrafo un metodo generale per cercaregli estremi di f sulla frontiera di un insieme D valido anche quando nonsi riesce ad eliminare da f una variabile, come nell’esempio precedente: ilmetodo dei moltiplicatori di Lagrange. Prima però osserviamo che a volte,nelle applicazioni, si incontra la necessità di trovare il minimo di unafunzione su tutto lo spazio. In questi casi possiamo contare sulla seguentevariante del Teorema di Weierstrass.

�Con la scrittura

lim(x,y)→+∞

f (x, y) = +∞,

si intende che corrispondentementead un qualunque M ∈ R esiste unraggio R > 0 tale che

√x2 + y2 > R =⇒ f (x, y) > M.

Una notazione equivalente, più pre-cisa (ma più tediosa) è la

lim√x2+y2→+∞

f (x, y) = +∞.

(VI.45) Una funzione continua f : R2 → R e tale che

lim(x,y)→+∞

f (x, y) = +∞,

assume il suo minimo. Analogamente, se il limite è −∞ allora la funzioneassume il suo massimo.

Dimostrazione. Fissiamo un raggio R sufficientemente grande perché si abbia√

x2 + y2 > R =⇒ f (x, y) > f (0, 0).

e minimizziamo la funzione nel disco chiuso centrato nell’origine e di raggio R.Il Teorema di Weierstrass assicura l’esistenza di un punto di minimo (xm, ym): siavrà quindi f (xm, ym) ≤ f (x, y) per tutti i punti del disco e quindi, in particolare,nel centro dello stesso: f (xm, ym) ≤ f (0, 0). D’altra parte, al di fuori del disco diraggio R abbiamo f (x, y) > f (0, 0) ≥ f (xm, ym). Concludiamo che il valore minimodi f su tutto R2 è f (xm, ym). �

Tali risultati si estendono senza difficoltà al caso di tre o più variabili.

(VI.46) Esempio (Punti estremi del potenziale di una forza conserva-tiva). Alcuni campi di forze di fondamentale importanza in Fisica, comela forza di attrazione elastica e quella gravitazionale, hanno la proprietàdi essere, in ogni punto dello spazio, il gradiente di una funzione (dettapotenziale della forza). Per esempio, la forza di attrazione elastica eser-citata da una molla di costante k1 > 0 su di un corpo nella posizioneP = (x, y, z) è, com’è noto,� proporzionale e opposta al vettore

# »

PP1, dove � Si tratta della legge di Hooke, cheil Lettore fidelizzato associerà im-mediatamente al grazioso ritratto diuna pulce.

P1 = (x1, y1, z1) è la posizione di equilibrio della molla:

F1(x, y, z) = −k1(x − x1, y − y1, z − z1) = −k1# »

PP1 .

Il potenziale della forza è la funzione

U1(x, y, z) = −k1

2

((x − x1)2

+ (y − y1)2+ (z − z1)2

)= −k1

2‖ # »

PP1‖2 ,

infatti abbiamo

∇U1(x, y, z, ) = F1(x, y, z) = −k1−−→PP1 .

Su un corpo soggetto alla somma di due forze elastiche si avrà una forzacomplessiva

F(x, y, z) = −k1(x−x1, y−y1, z−z1)−k2(x−x2, y−y2, z−z2) = −k1# »

PP1−k2# »

PP2,

©Apogeo 2008 – Corso prof. Capietto

Page 30: Calcolo differenziale per funzioni di più variabili · 278 Calcolo differenziale per funzioni di più variabili Significato geometrico delle derivate parziali. Com’ènotoperle

304 Calcolo differenziale per funzioni di più variabili

corrispondente ad un potenziale

U(x, y, z) = −k1

2‖ # »

PP1‖2 −k2

2‖ # »

PP2‖2 .

La funzione potenziale non ha minimi: essa tende infatti a −∞ al tendereall’infinito della norma di (x, y, z). In base alla Proposizione (VI.45), Uassume il suo valore massimo in R3: per trovarlo andiamo a determinaregli eventuali punti critici del potenziale, che corrispondono ai punti in cuila forza totale si annulla. Imponendo la condizione ∇U(x, y, z) = (0, 0, 0)troviamo, utilizzando la notazione vettoriale,

0 = ∇U(x, y, z) = −k1−−→PP1 − k2

−−→PP2 .

C’è un unico punto con questa proprietà che si trova sul segmento con-giungente P1 a P2. Abbiamo così che il punto di equilibrio (in cui le due �Tale punto, P, verifica

‖−−→PP2‖‖−−→PP1‖

= − k1

k2.

forze si compensano) ha la proprietà di rendere massimo, fra tutti i puntidello spazio, il potenziale U. Queste considerazioni si estendono a casiassai più complicati di reticoli di oscillatori, o a sistemi di forze anche nonlineari. Abbiamo così scoperto che, per una vasta classe di potenziali, ilmassimo è assunto e nei punti di massimo del potenziale, la corrispondenteforza conservativa è nulla. Scopriremo più avanti, nell’Esempio (VIII.76)del Capitolo VIII, che l’essere punto di massimo del potenziale ha delleripercussioni significative sulla stabilità del punto di equilibrio. �

§ 9. Il metodo dei moltiplicatori di Lagrange

Come abbiamo visto, capita spesso di voler determinare gli estremi di una � In questo paragrafo supporremosempre che f e 1 siano di classeC1(A) con A aperto.

funzione f (x, y) quando il punto (x, y) verifica una condizione aggiuntiva,della forma 1(x, y) = k. Si parla allora di massimi e minimi vincolati, el’insieme di livello 1(x, y) = k prende il nome di vincolo. Ad esempio in

F VI.18

Figura VI.18 cerchiamo il massimo di f (x, y) = xy quando (x, y) si muovein Z = {(x, y) ∈ R2 : x2

+ y2= 1, x ≥ 0, y ≥ 0}. Disegniamo il vincolo e

qualche insieme di livello di f , cioè

Ec = {(x, y) ∈ R2 : f (x, y) = c}per diversi valori di c: massimizzare f con il vincolo Z significa trovareil più grande valore di c tale che l’insieme Ec interseca Z. Come è evi-dente dalla Figura VI.18, quando questo avviene in un punto (x0, y0),Ec e Z hanno la stessa retta tangente in (x0, y0). Nel caso raffigurato,la curva di livello f (x, y) = 1/2 è tangente al vincolo nel punto P =

(√

2/2,√

2/2). Ricordiamo che il gradiente di f in (x0, y0) è ortogonale aEc

� e che ∇1(x0, y0) è ortogonale all’insieme 1(x, y) = k: questo significa �Come visto nell’Esempio (VI.26).

che i vettori gradiente ∇ f (x0, y0) e ∇1(x0, y0) sono paralleli, cioè

∇ f (x0, y0) = λ∇1(x0, y0) per qualche λ ∈ R.Questo argomento intuitivo può essere reso rigoroso e porta a dimo-

strare il seguente teorema.

©Apogeo 2008 – Corso prof. Capietto