Upload
hanhi
View
219
Download
1
Embed Size (px)
Citation preview
Parte 8. Prodotto scalare, teorema spettrale
A. Savo − Appunti del Corso di Geometria 2013-14
Indice delle sezioni
1 Prodotto scalare in Rn, 12 Basi ortonormali, 43 Algoritmo di Gram-Schmidt, 74 Matrici ortogonali, 125 Complemento ortogonale di un sottospazio, 136 Endomorfismi simmetrici, 177 Teorema spettrale, 20
1 Prodotto scalare in Rn
1.1 Definizione
Dati i vettori u =
x1...xn
e v =
y1...yn
di Rn , definiamo prodotto scalare di u e v il numero
reale:〈u, v〉 = x1y1 + · · ·+ xnyn.
Il risultato del prodotto scalare e dunque un numero.
Esempio Se u =
123
e v =
2−11
allora 〈u, v〉 = 3.
Notiamo che il prodotto scalare di due vettori puo risultare nullo anche se nessuno dei duefattori e il vettore nullo.
Esempio Se u =
123
e v =
−1−11
allora 〈u, v〉 = 0.
1
• I vettori u e v si dicono ortogonali se il loro prodotto scalare e nullo: 〈u, v〉 = 0.Notazione:
u ⊥ v.
Dunque i vettori dell’esempio precedente sono ortogonali. E evidente che, se O e il vettorenullo, si ha 〈v,O〉 = 0 per ogni v ∈ Rn: dunque il vettore nullo e ortogonale a tutti ivettori.La denominazione di vettori ortogonali legata alla condizione 〈u, v〉 = 0 (che e puramentealgebrica) sara giustificata quando studieremo la geometria analitica, e introdurremo ivettori geometrici del piano e dello spazio. Infatti, l’introduzione del prodotto scalare per-mette di definire, in modo puramente algebrico, la norma di un vettore (che va intepretatacome la distanza del vettore stesso dal vettore nullo) e l’angolo fra due vettori non nulli.Per il momento, ci proponiamo di studiare le proprieta algebriche dell’operazione diprodotto scalare.
Proposizione Siano u, v, w vettori arbitrari di Rn e sia k ∈ R un qualunque scalare.Allora si hanno le seguenti proprieta.1) 〈u, v〉 = 〈v, u〉.2) 〈u+ v, w〉 = 〈u,w〉+ 〈v, w〉.3) 〈ku, v〉 = k〈u, v〉.4) 〈u, u〉 ≥ 0.5) 〈u, u〉 = 0 se e solo se u = O.
La 1) dice che il prodotto scalare e commutativo. Le proprieta 2), 3) esprimono lacosiddetta proprieta di bilinearita. Le proprieta 4) e 5) esprimono il fatto che il prodottoscalare e definito positivo.
Dimostrazione. La dimostrazione di 1),2),3) si riduce a una semplice verifica. Osserviamo
che, se u =
x1...xn
allora
〈u, u〉 = x21 + · · ·+ x2
n,
che e un numero sempre positivo o nullo: questo dimostra la 4). Se 〈u, u〉 = 0 evidente-mente x1 = · · · = xn = 0, e quindi u = O. �
Dalle proprieta di bilinearita osserviamo che il prodotto scalare si comporta in modonaturale rispetto alle combinazioni lineari. Per ogni scelta dei vettori v1, . . . , vk, u, w ∈ Rn
e degli scalari a1, . . . , ak ∈ R si ha:
〈a1v1 + · · ·+ akvk, w〉 = a1〈v1, w〉+ · · ·+ ak〈vk, w〉.
2
Di conseguenza, poiche il prodotto scalare e commutativo, si ha anche
〈u, a1v1 + · · ·+ akvk〉 = a1〈u, v1〉+ · · ·+ ak〈u, vk〉
1.2 Norma e disuguaglianza di Schwarz
Per definizione, la norma di un vettore u ∈ Rn e il numero positivo o nullo
‖u‖ =√〈u, u〉.
Esplicitamente ‖u‖ =√x2
1 + · · ·+ x2n ovvero
‖u‖2 = x21 + · · ·+ x2
n.
In particolare, ‖u‖ ≥ 0 e si ha l’uguaglianza solo quando u = O: la norma di un vettorenon nullo e sempre positiva.
Esempio Se u =
13−2
allora ‖u‖ =√
1 + 9 + 4 =√
14.
Teorema (Disuguaglianza di Schwarz). Dati u, v ∈ Rn si ha sempre:
|〈u, v〉| ≤ ‖u‖‖v‖.
Inoltre, vale l’uguaglianza se e solo se u e v sono linearmente dipendenti.
Dimostrazione. Omessa. �
Esempio Dati n numeri reali a1, . . . , an si ha sempre:
(a1 + · · ·+ an)2 ≤ n(a21 + · · ·+ a2
n).
Infatti, basta applicare la disuguaglianza di Schwarz ai vettori u =
a1...an
e v =
1...1
.
Notiamo che si ha l’uguaglianza solo quando a1, . . . , an sono tutti uguali tra loro.
3
1.3 Angolo tra due vettori
Supponiamo che u e v siano due vettori non nulli. Per la disuguaglianza di Schwarz, si ha
|〈u, v〉|‖u‖‖v‖
≤ 1,
dunque esiste un unico valore di θ ∈ [0, π] tale che
cos θ =〈u, v〉‖u‖‖v‖
.
Per definizione, θ e detto l’angolo tra u e v.
Esempio Dati u =
1210
, v =
1021
si ha:
‖u‖ =√
6, ‖v‖ =√
6, 〈u, v〉 = 3.
Dunque cos θ = 12 cioe θ = π
3 .
2 Basi ortonormali
2.1 Ortogonalita e indipendenza lineare
Proposizione Siano v1, . . . , vk vettori non nulli di Rn, a due a due ortogonali. Allorav1, . . . , vk sono linearmente indipendenti. In particolare, k ≤ n.
Dimostrazione. Supponiamo che
a1v1 + · · ·+ akvk = O. (1)
Prendendo il prodotto scalare dei due membri della (1) per v1 otteniamo
0 = 〈a1v1 + a2v2 + · · ·+ akvk, v1〉= a1〈v1, v1〉+ a2〈v2, v1〉+ · · ·+ ak〈vk, v1〉= a1‖v1‖2
perche per ipotesi 〈vj , v1〉 = 0 per ogni j = 2, . . . , k. Per ipotesi, v1 e non nullo, dunque‖v1‖2 > 0 e ne segue che a1 = 0. Prendendo successivamente il prodotto scalare dei due
4
membri della (1), ordinatamente per v2, . . . , vk, si dimostra in modo analogo che aj = 0per ogni j. �
• n vettori non nulli, a due a due ortogonali formano una base di Rn (che sara chiamatabase ortogonale).
Esempio I vettori v1 =(
1−2
), v2 =
(21
)formano una base ortogonale di R2 perche
〈v1, v2〉 = 0.
I vettori w1 =
111
, w2 =
1−10
, w3 =
11−2
sono non nulli e a due a due ortogonali:
〈w1, w2〉 = 〈w1, w3〉 = 〈w2, w3〉 = 0.
Dunque (w1, w2, w3) e una base ortogonale di R3.
Esempio La matrice
A =
1 1 1 −11 1 −1 11 −1 1 11 −1 −1 −1
ha rango 4. Infatti i suoi vettori colonna sono a due a due ortogonali, e quindi sonolinearmente indipendenti.• Il numero massimo di vettori di Rn, non nulli e ortogonali a due a due, e n.
In modo analogo, possiamo definire la nozione di base ortogonale di un qualunque sot-tospazio E di Rn: se dimE = k allora i vettori v1, . . . , vk formano una base ortogonale diE se sono non nulli e 〈vi, vj〉 = 0 per ogni i 6= j.
Esempio Il sottospazio E : x + y + z = 0 di R3 ha dimensione 2. I due vettori v1 = 1−10
, v2 =
11−2
appartengono a E e sono ortogonali tra loro, dunque formano una
base ortogonale di E.
2.2 Basi ortonormali
Diremo che una base (v1, . . . , vk) di un sottospazio E di Rn e una base ortonormale di Ese:
〈vi, vj〉 =
{0 se i 6= j,
1 se i = j.
5
Dunque una base ortonormale e formata da vettori a due a due ortogonali, tutti di normaunitaria. Una base ortonormale e, in particolare, anche ortogonale.
Esempio La base canonica di Rn e una base ortonormale.
Fare i conti con le basi ortonormali e piu semplice. Ad esempio, trovare le coordinate diun vettore rispetto a una base implica, normalmente, la risoluzione di un certo numero disistemi lineari. Se la base e ortonormale, e sufficiente calcolare un certo numero di prodottiscalari.
Proposizione Sia B = (v1, . . . , vk) una base ortonormale di un sottospazio E di Rn.Allora le coordinate del vettore v ∈ E rispetto a B sono date da〈v, v1〉...
〈v, vk〉
,
e sono dette coefficienti di Fourier di v.
Dimostrazione. Se v ∈ E possiamo scrivere
v = a1v1 + · · ·+ akvk
e per definizione le coordinate di v sono a1, . . . , ak. Ora, prendendo il prodotto scalare deidue membri successivamente per v1, . . . , vk, otteniamo facilmente
aj = 〈v, vj〉
per ogni j = 1, . . . , k. �
Esempio I vettori:
v1 =12
1111
, v2 =12
11−1−1
, v3 =12
1−11−1
, v4 =12
−111−1
,
sono a due a due ortogonali e hanno tutti norma 1. Dunque tali vettori formano una
base ortonormale B di R4. Calcoliamo le coordinate del vettore v =
1234
rispetto a B. I
coefficienti di Fourier sono
〈v, v1〉 = 5, 〈v, v2〉 = −2, 〈v, v3〉 = −1, 〈v, v4〉 = 0.
6
Dunque v ha coordinate 5−2−10
,
rispetto a B. In altre parole v = 5v1 − 2v2 − v3. �
3 Algoritmo di Gram-Schmidt
Lo scopo di questa sezione e quello di dimostrare che ogni sottospazio di Rn ammettealmeno una base ortonormale.
3.1 Vettore normalizzato
Proposizione 1) Dato un vettore v e uno scalare a ∈ R si ha: ‖av‖ = |a|‖v‖.
2) Se v 6= O il vettore
u =1‖v‖
v
ha norma 1.
Dimostrazione. Si ha, dalle proprieta del prodotto scalare:
‖av‖2 = 〈av, av〉 = a2〈v, v〉 = a2‖v‖2,
e la 1) segue prendendo la radice quadrata ad ambo i membri. La 2) segue immediatamente
dalla 1) prendendo a =1‖v‖
. �
Il vettore u =1‖v‖
v si dice normalizzato di v. Normalizzare un vettore significa semplice-
mente dividere il vettore per la propria norma.
Esempio Il vettore v =
123
ha norma√
14. Il suo normalizzato e dunque
u =1‖v‖
v =1√14
123
7
e ha norma 1.
Corollario Se (v1, . . . , vk) e una base ortogonale del sottospazio E, allora i vettori nor-malizzati
u1 =1‖v1‖
v1, . . . , uk =1‖vk‖
vk
formano una base ortonormale di E.
Dimostrazione. I vettori u1, . . . , uk hanno tutti norma 1, ed evidentemente appartengonoa E. Essi sono a due a due ortogonali, poiche
〈ui, uj〉 =1‖vi‖
1‖vj‖〈vi, vj〉 = 0
per ogni i 6= j. �
Esempio Il sottospazio di R3 definito dall’equazione E : x+ y+ z = 0 ha dimensione 2 eha una base ortogonale formata dai vettori
v1 =
1−10
, v2 =
11−2
.
Per ottenere una base ortonormale di E e sufficiente normalizzare i vettori v1, v2. Si ottienela base ortonormale
u1 =1√2
1−10
, u2 =1√6
11−2
.
3.2 Procedimento di ortonormalizzazione
L’algoritmo di Gram-Schmidt e un procedimento che, applicato ad una base di un sot-tospazio di Rn, permette di ottenere una base ortogonale del sottospazio stesso; normal-izzando i vettori di tale base, otterremo una base ortonormale. Descriviamo l’algoritmoin dettaglio.Sia E un sottospazio di Rn e sia (v1, . . . , vk) una sua base. Dunque dimE = k.Notiamo che se k = 1 la base e formata dal solo vettore v1. E sufficiente dunque normal-izzare v1 per ottenere la base ortonormale cercata.1) Supponiamo che la dimensione di E sia 2, e sia (v1, v2) una base di E. Introduciamonuovi vettori (w1, w2) nel modo seguente:{
w1 = v1
w2 = v2 − aw1
8
con a ∈ R da determinare in modo opportuno. Notiamo che i vettori w1, w2 appartengonoa E; inoltre w2 non e nullo (altrimenti v1 e v2 sarebbero linearmente dipendenti ). Orascegliamo il coefficiente a in modo tale che w2 risulti ortogonale a w1. E facile vedere checio’ accade se solo se:
a =〈v2, w1〉〈w1, w1〉
.
Dunque, con tale scelta, otteniamo la base ortogonale (w1, w2) di E.
2) Supponiamo ora che dimE = 3, con base (v1, v2, v3) e poniamo:w1 = v1
w2 = v2 − aw1
w3 = v3 − bw1 − cw2
dove a =〈v2, w1〉〈w1, w1〉
e stato gia determinato, cosicche 〈w1, w2〉 = 0. Imponendo le condizioni
〈w3, w1〉 = 〈w3, w2〉 = 0,
otteniamo:b =〈v3, w1〉〈w1, w1〉
, c =〈v3, w2〉〈w2, w2〉
.
Con tali scelte di a, b, c otteniamo quindi la base ortogonale (w1, w2, w3) di E e quindi,normalizzando, una base ortonormale (notiamo che w3 non e nullo, altrimenti v1, v2, v3sarebbero linearmente dipendenti ).Procedendo per induzione, possiamo enunciare il seguente teorema.
Teorema (Algoritmo di Gram-Schmidt) Sia (v1, . . . , vk) una base del sottospazio E diRn. Si introducano i vettori:
w1 = v1
w2 = v2 − a21w1
w3 = v3 − a31w1 − a32w2
. . .
wk = vk − ak1w1 − ak2w2 − · · · − ak,k−1wk−1
dove si e posto:
aij =〈vi, wj〉〈wj , wj〉
.
9
Allora (w1, . . . , wk) e una base ortogonale di E, e quindi i vettori normalizzati:
u1 =1‖w1‖
w1, . . . , uk =1‖wk‖
wk,
formano una base ortonormale di E.
Esempio Trovare una base ortonormale del sottospazio E di R3 di equazione:
E : x− y − 2z = 0.
Soluzione. Determiniamo una base di E, e poi applichiamo l’algoritmo di Gram-Schmidtper ottenere una base ortonormale. Base di E:
v1 =
110
, v2 =
201
.
L’algoritmo consiste di due passi: {w1 = v1
w2 = v2 − a21w1.
Si ha w1 =
110
, dunque:
a21 =〈v2, w1〉〈w1, w1〉
=22
= 1.
Allora:
w1 =
110
w2 =
201
−1
10
=
1−11
.
Si verifica che in effetti 〈w1, w2〉 = 0. Una base ortonormale di E e dunque:
u1 =1√2
110
, u2 =1√3
1−11
.
10
• Ovviamente la base ortonormale ottenuta dipende dalla base di partenza. Per eser-cizio, vedere quale base ortonormale si ottiene scambiando i vettori della base di partenza.
Esempio Trovare una base ortonormale del sottospazio di R4 generato dai vettori:
v1 =
1100
, v2 =
2010
, v3 =
13−12
.
Soluzione. I tre vettori formano una base di E. Applichiamo l’algoritmo di Gram-Schmidtalla terna v1, v2, v3:
w1 = v1
w2 = v2 − a21w1
w3 = v3 − a31w2 − a32w2
Abbiamo w1 =
1100
, e quindi a21 = 1. Dunque
w2 =
2010
−
1100
=
1−110
.
Ora: a31 =
〈v3, w1〉〈w1, w1〉
=42
= 2
a32 =〈v3, w2〉〈w2, w2〉
=−33
= −1
dunque:
w3 =
13−12
− 2
1100
+
1−110
=
0002
.
Otteniamo la base ortogonale:
w1 =
1100
, w2 =
1−110
, w3 =
0002
,
11
e, normalizzando, la base ortonormale:
u1 =1√2
1100
, u2 =1√3
1−110
, u3 =
0001
.
4 Matrici ortogonali
Abbiamo visto che la matrice M di passaggio fra due basi B,B′ di uno spazio vettoriale einvertibile. Se le basi B,B′ sono ortonormali, la matrice di passaggio avra delle proprietaparticolari.
Definizione Una matrice quadrata M si dice ortogonale se verifica MM t = I. Quindiuna matrice ortogonale M e invertibile e
M−1 = M t,
cioe l’inversa coincide con la trasposta.
Esempio La matrice M =1√5
(1 −22 1
)=
1√5−2√
52√5
1√5
e ortogonale.
Esempio La matrice M =
1/√
2 1/√
3 1/√
6−1/√
2 1/√
3 1/√
60 1/
√3 −2/
√6
e ortogonale.
In entrambi i casi si verifica infatti che MM t = I.
Osserviamo che, se MM t = I allora, prendendo il determinante di ambo i membri eapplicando il teorema di Binet, si ha (detM)2 = 1. Dunque• se M e una matrice ortogonale allora detM = 1 oppure detM = −1.
Il teorema seguente fornisce le proprieta importanti di una matrice ortogonale.
Teorema a) La matrice di passaggio fra due basi ortonormali di Rn (o di un suo sot-tospazio) e ortogonale.b) Una matrice A ∈Mat(n × n) e ortogonale se e solo se le colonne di A formano unabase ortonormale di Rn.
Dimostrazione. La dimostrazione si riduce a una verifica, che omettiamo. �
12
Osserviamo che le colonne delle matrici ortogonali dei due esempi precedenti formano,effettivamente, una base ortonormale di R2 (primo esempio), e di R3 (secondo esempio).Dalla parte b) del teorema abbiamo anche• Incolonnando i vettori di una base ortonormale di Rn otteniamo una matrice ortog-
onale n× n.
Infine, si puo dimostrare che le matrici ortogonali di R2 sono di due tipi:(cos θ − sin θsin θ cos θ
)con θ ∈ R, oppure (
cosα sinαsinα − cosα
),
con α ∈ R. Le matrici del primo tipo hanno determinante 1, mentre quelle del secondotipo hanno determinante −1.
5 Complemento ortogonale di un sottospazio
Sia u1 un vettore fissato di Rn e si consideri il sottoinsieme
E = {v ∈ Rn : 〈v, u1〉 = 0},
formato da tutti i vettori ortogonali a u1. Per le proprieta di bilinearita del prodottoscalare, E risulta allora un sottospazio di Rn. Piu in generale, fissati k vettori di Rn,diciamo u1, . . . , uk, l’insieme:
E = {v ∈ Rn : 〈v, u1〉 = · · · = 〈v, uk〉 = 0},
formato dai vettori di Rn ortogonali a u1, . . . , uk e un sottospazio di Rn.
Esempio Sia u1 =
11−1
. Trovare una base di E = {v ∈ R3 : 〈v, u1〉 = 0}.
Soluzione. Sia v =
xyz
il vettore generico di R3. Imponendo l’ortogonalita al vettore u1
otteniamo l’unica condizionex+ y − z = 0.
13
Dunque E e il sottospazio delle soluzioni dell’equazione, e una sua base e, ad esempio, 1−10
,
011
. E ha dimensione 2. �
Esempio Dati i vettori u1 =
11−1
, u2 =
01−2
si consideri il sottospazio
F = {v ∈ R3 : 〈v, u1〉 = 〈v, u2〉 = 0}.
a) Trovare una base di F e calcolare la sua dimensione.
b) Trovare un vettore di F avente norma 1.
Soluzione. a) Imponendo al vettore generico v =
xyz
l’ortogonalita a u1 e u2 vediamo
che F e descritto dalle equazioni
F :
{x+ y − z = 0y − 2z = 0
.
La matrice dei coefficienti del sistema che definisce F e A =(
1 1 −10 1 −2
). Notiamo che
le righe di A sono proprio i vettori u1, u2 (piu precisamente, ut1, ut2): siccome u1, u2 sono
linearmente indipendenti il rango vale 2 e l’insieme delle soluzioni F ha dimensione:
dimF = 3− rkA = 1.
Una base si ottiene risolvendo il sistema. Si ottiene ad esempio la base
−121
.
b) Un vettore di E di norma 1 si ottiene normalizzando il vettore della base trovata,
dunque w =1√6
−121
. Un altro vettore possibile e −w =1√6
1−2−1
. Verificare che
non ce ne sono altri. �
Generalizzando, otteniamo il seguente risultato.
Proposizione Se i vettori u1, . . . , uk ∈ Rn sono linearmente indipendenti, allora
E = {v ∈ Rn : 〈v, u1〉 = · · · = 〈v, uk〉 = 0},
14
e un sottospazio di Rn di dimensione n− k.
Dimostrazione. Abbiamo gia osservato che E e un sottospazio. Sia v = (x1, . . . , xn)t ilvettore generico di Rn. Imponendo l’ortogonalita di v a ciascuno dei vettori u1, . . . , ukotteniamo un sistema lineare omogeneo di k equazioni nelle n incognite x1, . . . , xn. DunqueE ha dimensione n− rkA, dove A e la matrice dei coefficienti. Ora, si verifica che le righedi A sono i vettori trasposti di u1, . . . , uk. Poiche per ipotesi u1, . . . , uk sono linearmenteindipendenti il rango di A vale k e dunque
dimE = n− k.
�
5.1 Complemento ortogonale di un sottospazio
Sia E un sottospazio di Rn. Definiamo complemento ortogonale di E l’insieme E⊥ costi-tuito dai vettori di Rn ortogonali a tutti i vettori di E:
E⊥ = {v ∈ Rn : 〈v, w〉 = 0 per ogni w ∈ E}.
Dalle proprieta del prodotto scalare risulta che E⊥ e chiuso rispetto alla somma e alprodotto per uno scalare, dunque e un sottospazio di Rn.
Risulta che v ∈ E⊥ se e solo se v e ortogonale a tutti i vettori di una base di E. Infatti:
Proposizione Sia (v1, . . . , vk) una base di E. Allora v ∈ E⊥ se e solo se 〈v, vi〉 = 0 perogni i = 1, . . . , k.
Dimostrazione. Supponiamo che 〈v, vi〉 = 0 per ogni i = 1, . . . , k. Se w e un qualunquevettore di E, allora w e combinazione lineare dei vettori della base: w = a1v1 + · · ·+akvk.Quindi
〈v, w〉 = a1〈v, v1〉+ · · ·+ ah〈v, vk〉 = 0,
che dimostra che v e ortogonale a w. Siccome w ∈ E e arbitrario, v ∈ E⊥. Il viceversa eimmediato. �
Esempio Determinare una base di E⊥, complemento ortogonale del sottospazio E di R4
generato dai vettori v1 =
1111
, v2 =
1010
.
15
Soluzione. Imponiamo al vettore generico v = (x, y, z, w)t ∈ R4 l’ortogonalita ai vettoridella base (v1, v2) di E, ottenendo il sistema omogeneo:{
x+ y + z + w = 0x+ z = 0
.
Risolvendo il sistema, otteniamo la base di E⊥:
10−10
,
010−1
. �
Le proprieta importanti del complemento ortogonale sono espresse nel seguente teorema.
Teorema Sia E un sottospazio di Rn e E⊥ il suo complemento ortogonale. Alloraa) E ∩ E⊥ = {O}.b) dimE⊥ = n− dimE.c) Rn = E ⊕ E⊥.
Dimostrazione. a) Se v ∈ E∩E⊥ allora v e ortogonale a tutti i vettori di E; in particolarev e ortogonale a se stesso, e dunque 〈v, v〉 = 0. Ma l’unico vettore con tale proprieta e ilvettore nullo.b) Sia dimE = k e sia (u1, . . . , uk) una base di E. Sappiamo che v ∈ E⊥ se e solo se v eortogonale ai vettori di una base di E: dunque
E⊥ = {v ∈ Rn : 〈v, u1〉 = · · · = 〈v, uk〉 = 0}.
Siccome u1, . . . , uk sono linearmente indipendenti, dalla proposizione del paragrafo prece-dente otteniamo che dimE⊥ = n− k = n− dimE.c) Applichiamo la formula di Grassmann ai sottospazi E,E⊥:
dim(E + E⊥) + dim(E ∩ E⊥) = dimE + dimE⊥.
Da a) e b) concludiamo che dim(E+E⊥) = n. Dunque E+E⊥ = Rn. Poiche E∩E⊥ = {O}la somma e diretta: Rn = E ⊕ E⊥. �
5.2 Proiezione ortogonale su un sottospazio
Dal teorema precedente abbiamo che un vettore v ∈ Rn si spezza, in modo unico, comesomma di un vettore w ∈ E e di un vettore w⊥ ∈ E⊥:
v = w + w⊥.
16
In particolare, w e w⊥ sono ortogonali.• Il vettore w e detto la proiezione ortogonale di v sul sottospazio E. Denoteremo w
con il simbolo PE(v).
Esempio E dato il sottospazio di R3 descritto dall’equazione x + y − 2z = 0. Il vettore
v =
120
∈ R3 si spezza 120
=
1/23/21
+
1/21/2−1
,
dove il primo vettore appartiene a E e il secondo a E⊥. Quindi PE(v) =
1/23/21
.
In generale, se (u1 . . . , uk) e una base ortonormale di E allora la proiezione ortogonale sicalcola con la formula
PE(v) = 〈v, u1〉u1 + · · ·+ 〈v, uk〉uk.
6 Endomorfismi simmetrici
In questa sezione studieremo una classe importante di endomorfismi di Rn: gli endomor-fismi detti simmetrici. Tali endomorfismi sono caratterizzati dalla proprieta di ammettereuna base ortonormale di autovettori, e sono legati in modo naturale alle matrici simmet-riche. In particolare, risultera che ogni matrice simmetrica e diagonalizzabile.
Definizione Un endomorfismo di Rn si dice simmetrico se la sua matrice associatarispetto alla base canonica e simmetrica.
Esempio Sia f : R2 → R2 definito da f(xy
)=(−3x+ 3y3x+ 5y
). La matrice canonica di f
e:
A =(−3 33 5
).
Siccome A e simmetrica, f e simmetrico.
Esempio L’endomorfismo f(xy
)=(x+ 2y
3y
)ha matrice canonica
(1 20 3
)dunque non
e simmetrico.
17
Teorema Le seguenti condizioni sono equivalenti.a) f e un endomorfismo simmetrico di Rn.b) La matrice associata a f rispetto ad una qualunque base ortonormale di Rn e simmet-rica.c) Per ogni coppia di vettori u, v ∈ Rn si ha
〈f(u), v〉 = 〈u, f(v)〉.
Dimostrazione. a) =⇒ b) Supponiamo che f sia simmetrico, e sia A la sua matrice
canonica. Per definizione, A e simmetrica. Se B e una base ortonormale di Rn, e A′ e lamatrice associata a f rispetto a tale base, allora sappiamo che
A′ = M−1AM,
dove M e la matrice di passaggio dalla base canonica BC alla base B. Poiche tali basi sonoentrambe ortonormali, si ha che M e ortogonale, quindi M−1 = M t. Dunque A′ = M tAM ,ed e sufficiente dimostrare che M tAM e simmetrica. Ma questo e immediato:
(M tAM)t = M tA(M t)t = M tAM.
b) =⇒ c) Si ha la seguente identita, valida per ogni matrice A e per ogni scelta di u, v,
vettori colonna di Rn:〈Au, v〉 = 〈u,Atv〉.
L’identita si verifica con un calcolo diretto, e fornisce un legame tra il prodotto scalare ela trasposta di una matrice. Supponiamo che la matrice A, associata ad f rispetto allabase canonica, sia simmetrica. Ora sappiamo che f si scrive
f(v) = Av.
Poiche A e simmetrica, si ha A = At e dall’identita precedente:
〈f(u), v〉 = 〈Au, v〉 = 〈u,Av〉 = 〈u, f(v)〉.
c) =⇒ a) Premettiamo che, se A e una matrice n × n e e1, . . . , en sono i vettori della
base canonica di Rn, un calcolo mostra che
〈Aei, ej〉 = aji,
dove aji e l’elemento di posto (j, i) della matrice A.
18
Per ipotesi, si ha la proprieta c). Dunque, se A e la matrice canonica di f , l’identita
〈Au, v〉 = 〈u,Av〉
risulta vera per ogni scelta dei vettori colonna u, v. Prendendo u = ei e v = ej otteniamo
aji = aij
per ogni i, j, dunque la matrice canonica di f e simmetrica e f risulta simmetrico. �
Isoliamo la seguente proprieta degli autospazi di un endomorfismo simmetrico.
Proposizione Gli autospazi di un endomorfismo simmetrico sono ortogonali fra loro. Inaltre parole, se λ1 e λ2 sono autovalori distinti di f , e se u ∈ E(λ1) e v ∈ E(λ2) allora:
〈u, v〉 = 0.
Dimostrazione. Per ipotesi f(u) = λ1u; dunque
〈f(u), v〉 = λ1〈u, v〉.
D’altra parte, per la c) del teorema, poiche f(v) = λ2v:
〈f(u), v〉 = 〈u, f(v)〉 = λ2〈u, v〉.
Uguagliando otteniamo λ1〈u, v〉 = λ2〈u, v〉 cioe
(λ1 − λ2)〈u, v〉 = 0,
e poiche λ1 − λ2 6= 0 si ha necessariamente 〈u, v〉 = 0. �
Esempio Sia f : R2 → R2 definito da f
(xy
)=(−3x+ 3y3x+ 5y
). Verifichiamo che gli au-
tospazi di f sono ortogonali. Matrice canonica A =(−3 33 5
)con polinomio caratteristico
x2 − 2x − 24. e abbiamo due autovalori distinti: λ1 = −4 e λ2 = 6 e due autospaziE(−4), E(6), entrambi di dimensione 1. Si trova che E(−4) ha equazione x+ 3y = 0 con
base(
3−1
), e E(6) ha equazione 3x− y = 0 con base
(13
).
Effettivamente, gli autospazi sono ortogonali tra loro, la coppia(
3−1
),
(13
)e una base
ortogonale di autovettori, e la coppia
1√10
(3−1
),
1√10
(13
)19
e una base ortonormale di R2 formata da autovettori di f . �
Esempio L’endomorfismo f(xy
)=(x+ 2y
3y
)ha matrice canonica
(1 20 3
)dunque non
e simmetrico. Si osserva che f ha autovalori λ1 = 1, λ2 = 3 e autospazi:
E(1) : y = 0, E(3) : x− y = 0.
Si vede subito che gli autospazi non sono ortogonali. Risulta che f e diagonalizzabile,
con base di autovettori(
10
),
(11
)ma non e possibile trovare una base ortonormale di
autovettori (se ortonormalizziamo la base, non otteniamo piu autovettori).
Esempio Sia E un sottospazio di Rn. L’endomorfismo PE che associa al vettore v ∈ Rn
la sua proiezione ortogonale sul sottospazio E e simmetrico.Infatti, se fissiamo una base ortonormale (u1 . . . , uk) di E allora la proiezione ortogonalee data da
PE(v) = 〈v, u1〉u1 + · · ·+ 〈v, uk〉uk.
Se w e un secondo vettore di Rn si ha
〈PE(v), w〉 = 〈v, u1〉〈u1, w〉+ · · ·+ 〈v, uk〉〈uk, w〉.
Poiche il secondo membro rimane uguale scambiando v con w, si ha 〈PE(v), w〉 = 〈PE(w), v〉 =〈v, PE(w)〉 e PE e simmetrico.
7 Teorema spettrale
Veniamo al seguente importante teorema, di cui omettiamo la dimostrazione.
Teorema spettrale. Sia f un endomorfismo simmetrico di Rn. Allora f e diagonaliz-zabile; inoltre esiste una base ortonormale di Rn costituita da autovettori di f .
Anche il viceversa e vero, ed e facile da dimostrare:
Teorema Sia f un endomorfismo di Rn, e supponiamo che esista una base ortonormaledi Rn formata da autovettori di f . Allora f e simmetrico.
Dimostrazione. La matrice associata alla base di autovettori (che e ortonormale per ipotesi)e diagonale, dunque simmetrica, e quindi f e simmetrico per il teorema della sezione prece-dente. �
20
Dunque, la classe degli endomorfismi di Rn che ammettono una base ortonormale diautovettori coincide con la classe degli endomorfismi simmetrici.Notiamo anche il fatto seguente.
Corollario Ogni matrice simmetrica e diagonalizzabile, ed e ortogonalmente simile aduna matrice diagonale. Cioe, possiamo trovare una matrice diagonale D e una matriceortogonale M tali che:
D = M−1AM = M tAM.
Dimostrazione. Sia f l’endomorfismo di Rn rappresentato daA rispetto alla base canonica.Poiche’ A e simmetrica, anche f e simmetrico. Per il teorema spettrale, possiamo trovareuna base ortonormale B formata da autovettori di f . In questa base, f si rappresenta conuna matrice diagonale D; inoltre si ha
D = M−1AM,
dove M e la matrice di passaggio dalla base canonica alla base B. Poiche’ tali basi sonoentrambe ortonormali, la matrice M e ortogonale, quindi M−1 = M t. �
Diamo ora il procedimento per determinare una base ortonormale di autovettori di unendomorfismo simmetrico.
1. Calcoliamo il polinomio caratteristico e quindi troviamo gli autovalori di f , diciamoλ1, . . . , λk.
2. Con l’algoritmo di Gram-Schmidt, troviamo una base ortonormale di ciascun au-tospazio, diciamo B1, . . . ,Bk.3. Uniamo le basi ortonormali cosi’ trovate per ottenere la base B = B1 ∪ · · · ∪ Bk di Rn.L’insieme di vettori cosi’ ottenuto formera’ una base ortonormale di autovettori.
Infatti, ogni vettore di B ha chiaramente norma 1. Inoltre, se prendiamo due vettoriappartenenti alla stessa base Bi questi sono ortogonali per costruzione; se prendiamo duevettori appartenenti a basi diverse, questi appartengono ad autospazi diversi e quindi sonoortogonali grazie alla proposizione della sezione precedente. I vettori di B sono a due adue ortogonali e di norma 1, dunque B e una base ortonormale.
Infine, per diagonalizzare una matrice simmetrica A, procediamo cosi’:
1. Troviamo una base ortonormale B formata da autovettori dell’endomorfismo di Rn
rappresentato da A rispetto alla base canonica.
2. Incolonniamo la base B per ottenere una matrice ortogonale M .
3. Scriviamo la matrice diagonale D, i cui elementi diagonali sono gli autovalori di f ,presi nello stesso ordine dei corrispondenti autovettori di B.
4. Risultera’ allora D = M tAM .
21
7.1 Esempio
Sia f l’operatore di R2 rappresentato da(−3 33 5
)rispetto alla base canonica. Abbiamo
gia trovato una base ortonormale di autovettori:
1√10
(3−1
),
1√10
(13
),
associati rispettivamente a −4 e 6. Quindi se prendiamo
M =1√10
(3 1−1 3
), D =
(−4 00 6
).
si avra D = M tAM .
7.2 Esempio
Sia f l’operatore di R3 rappresentato da
1 1 11 1 11 1 1
rispetto alla base canonica. f e
simmetrico. Il polinomio caratteristico e −x3 + 3x2 e gli autovalori sono 0, 3. E(0) e
il nucleo, di equazione x + y + z = 0 e base
1−10
,
10−1
. Applicando l’algoritmo di
Gram-Schmidt, otteniamo la base ortonormale di E(0):
w1 =1√2
1−10
, w2 =1√6
11−2
.
E(3) ha base
111
; si osserva che E(3) e ortogonale a E(0). Otteniamo la base ortonormale
di E(3):
w3 =1√3
111
.
Ne segue che una base ortonormale di autovettori e (w1, w2, w3) cioe:
1√2
1−10
,1√6
11−2
,1√3
111
.
22
Ponendo
M =
1√2
1√6
1√3
− 1√2
1√6
1√3
0 − 2√6
1√3
, D =
0 0 00 0 00 0 3
,
si ha D = M tAM .
7.3 Esempio
Sia f l’endomorfismo di R4 rappresentato, rispetto alla base canonica, dalla matrice
A =
2 0 1 00 2 0 −11 0 2 00 −1 0 2
.
Poiche A e simmetrica, f e un endomorfismo simmetrico. Un calcolo mostra che pA(x) =(x − 1)2(x − 3)2, dunque f ammette due autovalori distinti: λ1 = 1 e λ2 = 3, entrambidi molteplicita algebrica 2. Gia sappiamo che f e diagonalizzabile, dunque la molteplicitageometrica di entrambi gli autovalori sara 2.
Descriviamo gli autospazi. A− I =
1 0 1 00 1 0 −11 0 1 00 −1 0 1
dunque E(1) ha equazioni:
{x1 + x3 = 0x2 − x4 = 0
e quindi
E(1) = {
ts−ts
∈ R4 : t, s ∈ R}.
Procedendo in modo analogo, si ha:
E(3) = {
t′
s′
t′
−s′
∈ R4 : t′, s′ ∈ R}.
23
Osserviamo che i due autospazi sono fra loro ortogonali, nel senso che:
〈
ts−ts
,
t′
s′
t′
−s′
〉 = tt′ + ss′ − tt′ − ss′ = 0
per ogni t, s, t′, s′ ∈ R.Passiamo ora a costruire una base ortonormale di autovettori di f . Una base di E(1)e data dalla coppia ((1, 0,−1, 0)t, (0, 1, 0, 1)t): i due vettori sono ortogonali, dunque unabase ortonormale di V (1) e:
w1 =1√2
10−10
, w2 =1√2
0101
,
In modo analogo, dalla base ((1, 0, 1, 0)t, (0, 1, 0,−1)t) di E(3) otteniamo la base ortonor-male di E(3):
w3 =1√2
1010
, w4 =1√2
010−1
Dunque
B = B1 ∪ B2 = (w1, w2, w3, w4)
e una base ortonormale di R4, costituita da autovettori di f .La matrice A e diagonalizzabile; se M e la matrice ottenuta incolonnando la base ortonor-male di autovettori descritta in precedenza, cioe
M =1√2
1 0 1 00 1 0 1−1 0 1 00 1 0 −1
allora M e una matrice ortogonale che diagonalizza A, nel senso che
M tAM =
1 0 0 00 1 0 00 0 3 00 0 0 3
.
24