24
Parte 8. Prodotto scalare, teorema spettrale A. Savo - Appunti del Corso di Geometria 2013-14 Indice delle sezioni 1 Prodotto scalare in R n , 1 2 Basi ortonormali, 4 3 Algoritmo di Gram-Schmidt, 7 4 Matrici ortogonali, 12 5 Complemento ortogonale di un sottospazio, 13 6 Endomorfismi simmetrici, 17 7 Teorema spettrale, 20 1 Prodotto scalare in R n 1.1 Definizione Dati i vettori u = x 1 . . . x n e v = y 1 . . . y n di R n , definiamo prodotto scalare di u e v il numero reale: hu, vi = x 1 y 1 + ··· + x n y n . Il risultato del prodotto scalare ` e dunque un numero. Esempio Se u = 1 2 3 e v = 2 -1 1 allora hu, vi = 3. Notiamo che il prodotto scalare di due vettori pu` o risultare nullo anche se nessuno dei due fattori ` e il vettore nullo. Esempio Se u = 1 2 3 e v = -1 -1 1 allora hu, vi = 0. 1

Parte 8. Prodotto scalare, teorema spettralealessandro.savo/Parte8.pdf · 1 Prodotto scalare in Rn, 1 2 Basi ortonormali, 4 3 Algoritmo di Gram-Schmidt, 7 ... In particolare, kuk

  • Upload
    hanhi

  • View
    219

  • Download
    1

Embed Size (px)

Citation preview

Parte 8. Prodotto scalare, teorema spettrale

A. Savo − Appunti del Corso di Geometria 2013-14

Indice delle sezioni

1 Prodotto scalare in Rn, 12 Basi ortonormali, 43 Algoritmo di Gram-Schmidt, 74 Matrici ortogonali, 125 Complemento ortogonale di un sottospazio, 136 Endomorfismi simmetrici, 177 Teorema spettrale, 20

1 Prodotto scalare in Rn

1.1 Definizione

Dati i vettori u =

x1...xn

e v =

y1...yn

di Rn , definiamo prodotto scalare di u e v il numero

reale:〈u, v〉 = x1y1 + · · ·+ xnyn.

Il risultato del prodotto scalare e dunque un numero.

Esempio Se u =

123

e v =

2−11

allora 〈u, v〉 = 3.

Notiamo che il prodotto scalare di due vettori puo risultare nullo anche se nessuno dei duefattori e il vettore nullo.

Esempio Se u =

123

e v =

−1−11

allora 〈u, v〉 = 0.

1

• I vettori u e v si dicono ortogonali se il loro prodotto scalare e nullo: 〈u, v〉 = 0.Notazione:

u ⊥ v.

Dunque i vettori dell’esempio precedente sono ortogonali. E evidente che, se O e il vettorenullo, si ha 〈v,O〉 = 0 per ogni v ∈ Rn: dunque il vettore nullo e ortogonale a tutti ivettori.La denominazione di vettori ortogonali legata alla condizione 〈u, v〉 = 0 (che e puramentealgebrica) sara giustificata quando studieremo la geometria analitica, e introdurremo ivettori geometrici del piano e dello spazio. Infatti, l’introduzione del prodotto scalare per-mette di definire, in modo puramente algebrico, la norma di un vettore (che va intepretatacome la distanza del vettore stesso dal vettore nullo) e l’angolo fra due vettori non nulli.Per il momento, ci proponiamo di studiare le proprieta algebriche dell’operazione diprodotto scalare.

Proposizione Siano u, v, w vettori arbitrari di Rn e sia k ∈ R un qualunque scalare.Allora si hanno le seguenti proprieta.1) 〈u, v〉 = 〈v, u〉.2) 〈u+ v, w〉 = 〈u,w〉+ 〈v, w〉.3) 〈ku, v〉 = k〈u, v〉.4) 〈u, u〉 ≥ 0.5) 〈u, u〉 = 0 se e solo se u = O.

La 1) dice che il prodotto scalare e commutativo. Le proprieta 2), 3) esprimono lacosiddetta proprieta di bilinearita. Le proprieta 4) e 5) esprimono il fatto che il prodottoscalare e definito positivo.

Dimostrazione. La dimostrazione di 1),2),3) si riduce a una semplice verifica. Osserviamo

che, se u =

x1...xn

allora

〈u, u〉 = x21 + · · ·+ x2

n,

che e un numero sempre positivo o nullo: questo dimostra la 4). Se 〈u, u〉 = 0 evidente-mente x1 = · · · = xn = 0, e quindi u = O. �

Dalle proprieta di bilinearita osserviamo che il prodotto scalare si comporta in modonaturale rispetto alle combinazioni lineari. Per ogni scelta dei vettori v1, . . . , vk, u, w ∈ Rn

e degli scalari a1, . . . , ak ∈ R si ha:

〈a1v1 + · · ·+ akvk, w〉 = a1〈v1, w〉+ · · ·+ ak〈vk, w〉.

2

Di conseguenza, poiche il prodotto scalare e commutativo, si ha anche

〈u, a1v1 + · · ·+ akvk〉 = a1〈u, v1〉+ · · ·+ ak〈u, vk〉

1.2 Norma e disuguaglianza di Schwarz

Per definizione, la norma di un vettore u ∈ Rn e il numero positivo o nullo

‖u‖ =√〈u, u〉.

Esplicitamente ‖u‖ =√x2

1 + · · ·+ x2n ovvero

‖u‖2 = x21 + · · ·+ x2

n.

In particolare, ‖u‖ ≥ 0 e si ha l’uguaglianza solo quando u = O: la norma di un vettorenon nullo e sempre positiva.

Esempio Se u =

13−2

allora ‖u‖ =√

1 + 9 + 4 =√

14.

Teorema (Disuguaglianza di Schwarz). Dati u, v ∈ Rn si ha sempre:

|〈u, v〉| ≤ ‖u‖‖v‖.

Inoltre, vale l’uguaglianza se e solo se u e v sono linearmente dipendenti.

Dimostrazione. Omessa. �

Esempio Dati n numeri reali a1, . . . , an si ha sempre:

(a1 + · · ·+ an)2 ≤ n(a21 + · · ·+ a2

n).

Infatti, basta applicare la disuguaglianza di Schwarz ai vettori u =

a1...an

e v =

1...1

.

Notiamo che si ha l’uguaglianza solo quando a1, . . . , an sono tutti uguali tra loro.

3

1.3 Angolo tra due vettori

Supponiamo che u e v siano due vettori non nulli. Per la disuguaglianza di Schwarz, si ha

|〈u, v〉|‖u‖‖v‖

≤ 1,

dunque esiste un unico valore di θ ∈ [0, π] tale che

cos θ =〈u, v〉‖u‖‖v‖

.

Per definizione, θ e detto l’angolo tra u e v.

Esempio Dati u =

1210

, v =

1021

si ha:

‖u‖ =√

6, ‖v‖ =√

6, 〈u, v〉 = 3.

Dunque cos θ = 12 cioe θ = π

3 .

2 Basi ortonormali

2.1 Ortogonalita e indipendenza lineare

Proposizione Siano v1, . . . , vk vettori non nulli di Rn, a due a due ortogonali. Allorav1, . . . , vk sono linearmente indipendenti. In particolare, k ≤ n.

Dimostrazione. Supponiamo che

a1v1 + · · ·+ akvk = O. (1)

Prendendo il prodotto scalare dei due membri della (1) per v1 otteniamo

0 = 〈a1v1 + a2v2 + · · ·+ akvk, v1〉= a1〈v1, v1〉+ a2〈v2, v1〉+ · · ·+ ak〈vk, v1〉= a1‖v1‖2

perche per ipotesi 〈vj , v1〉 = 0 per ogni j = 2, . . . , k. Per ipotesi, v1 e non nullo, dunque‖v1‖2 > 0 e ne segue che a1 = 0. Prendendo successivamente il prodotto scalare dei due

4

membri della (1), ordinatamente per v2, . . . , vk, si dimostra in modo analogo che aj = 0per ogni j. �

• n vettori non nulli, a due a due ortogonali formano una base di Rn (che sara chiamatabase ortogonale).

Esempio I vettori v1 =(

1−2

), v2 =

(21

)formano una base ortogonale di R2 perche

〈v1, v2〉 = 0.

I vettori w1 =

111

, w2 =

1−10

, w3 =

11−2

sono non nulli e a due a due ortogonali:

〈w1, w2〉 = 〈w1, w3〉 = 〈w2, w3〉 = 0.

Dunque (w1, w2, w3) e una base ortogonale di R3.

Esempio La matrice

A =

1 1 1 −11 1 −1 11 −1 1 11 −1 −1 −1

ha rango 4. Infatti i suoi vettori colonna sono a due a due ortogonali, e quindi sonolinearmente indipendenti.• Il numero massimo di vettori di Rn, non nulli e ortogonali a due a due, e n.

In modo analogo, possiamo definire la nozione di base ortogonale di un qualunque sot-tospazio E di Rn: se dimE = k allora i vettori v1, . . . , vk formano una base ortogonale diE se sono non nulli e 〈vi, vj〉 = 0 per ogni i 6= j.

Esempio Il sottospazio E : x + y + z = 0 di R3 ha dimensione 2. I due vettori v1 = 1−10

, v2 =

11−2

appartengono a E e sono ortogonali tra loro, dunque formano una

base ortogonale di E.

2.2 Basi ortonormali

Diremo che una base (v1, . . . , vk) di un sottospazio E di Rn e una base ortonormale di Ese:

〈vi, vj〉 =

{0 se i 6= j,

1 se i = j.

5

Dunque una base ortonormale e formata da vettori a due a due ortogonali, tutti di normaunitaria. Una base ortonormale e, in particolare, anche ortogonale.

Esempio La base canonica di Rn e una base ortonormale.

Fare i conti con le basi ortonormali e piu semplice. Ad esempio, trovare le coordinate diun vettore rispetto a una base implica, normalmente, la risoluzione di un certo numero disistemi lineari. Se la base e ortonormale, e sufficiente calcolare un certo numero di prodottiscalari.

Proposizione Sia B = (v1, . . . , vk) una base ortonormale di un sottospazio E di Rn.Allora le coordinate del vettore v ∈ E rispetto a B sono date da〈v, v1〉...

〈v, vk〉

,

e sono dette coefficienti di Fourier di v.

Dimostrazione. Se v ∈ E possiamo scrivere

v = a1v1 + · · ·+ akvk

e per definizione le coordinate di v sono a1, . . . , ak. Ora, prendendo il prodotto scalare deidue membri successivamente per v1, . . . , vk, otteniamo facilmente

aj = 〈v, vj〉

per ogni j = 1, . . . , k. �

Esempio I vettori:

v1 =12

1111

, v2 =12

11−1−1

, v3 =12

1−11−1

, v4 =12

−111−1

,

sono a due a due ortogonali e hanno tutti norma 1. Dunque tali vettori formano una

base ortonormale B di R4. Calcoliamo le coordinate del vettore v =

1234

rispetto a B. I

coefficienti di Fourier sono

〈v, v1〉 = 5, 〈v, v2〉 = −2, 〈v, v3〉 = −1, 〈v, v4〉 = 0.

6

Dunque v ha coordinate 5−2−10

,

rispetto a B. In altre parole v = 5v1 − 2v2 − v3. �

3 Algoritmo di Gram-Schmidt

Lo scopo di questa sezione e quello di dimostrare che ogni sottospazio di Rn ammettealmeno una base ortonormale.

3.1 Vettore normalizzato

Proposizione 1) Dato un vettore v e uno scalare a ∈ R si ha: ‖av‖ = |a|‖v‖.

2) Se v 6= O il vettore

u =1‖v‖

v

ha norma 1.

Dimostrazione. Si ha, dalle proprieta del prodotto scalare:

‖av‖2 = 〈av, av〉 = a2〈v, v〉 = a2‖v‖2,

e la 1) segue prendendo la radice quadrata ad ambo i membri. La 2) segue immediatamente

dalla 1) prendendo a =1‖v‖

. �

Il vettore u =1‖v‖

v si dice normalizzato di v. Normalizzare un vettore significa semplice-

mente dividere il vettore per la propria norma.

Esempio Il vettore v =

123

ha norma√

14. Il suo normalizzato e dunque

u =1‖v‖

v =1√14

123

7

e ha norma 1.

Corollario Se (v1, . . . , vk) e una base ortogonale del sottospazio E, allora i vettori nor-malizzati

u1 =1‖v1‖

v1, . . . , uk =1‖vk‖

vk

formano una base ortonormale di E.

Dimostrazione. I vettori u1, . . . , uk hanno tutti norma 1, ed evidentemente appartengonoa E. Essi sono a due a due ortogonali, poiche

〈ui, uj〉 =1‖vi‖

1‖vj‖〈vi, vj〉 = 0

per ogni i 6= j. �

Esempio Il sottospazio di R3 definito dall’equazione E : x+ y+ z = 0 ha dimensione 2 eha una base ortogonale formata dai vettori

v1 =

1−10

, v2 =

11−2

.

Per ottenere una base ortonormale di E e sufficiente normalizzare i vettori v1, v2. Si ottienela base ortonormale

u1 =1√2

1−10

, u2 =1√6

11−2

.

3.2 Procedimento di ortonormalizzazione

L’algoritmo di Gram-Schmidt e un procedimento che, applicato ad una base di un sot-tospazio di Rn, permette di ottenere una base ortogonale del sottospazio stesso; normal-izzando i vettori di tale base, otterremo una base ortonormale. Descriviamo l’algoritmoin dettaglio.Sia E un sottospazio di Rn e sia (v1, . . . , vk) una sua base. Dunque dimE = k.Notiamo che se k = 1 la base e formata dal solo vettore v1. E sufficiente dunque normal-izzare v1 per ottenere la base ortonormale cercata.1) Supponiamo che la dimensione di E sia 2, e sia (v1, v2) una base di E. Introduciamonuovi vettori (w1, w2) nel modo seguente:{

w1 = v1

w2 = v2 − aw1

8

con a ∈ R da determinare in modo opportuno. Notiamo che i vettori w1, w2 appartengonoa E; inoltre w2 non e nullo (altrimenti v1 e v2 sarebbero linearmente dipendenti ). Orascegliamo il coefficiente a in modo tale che w2 risulti ortogonale a w1. E facile vedere checio’ accade se solo se:

a =〈v2, w1〉〈w1, w1〉

.

Dunque, con tale scelta, otteniamo la base ortogonale (w1, w2) di E.

2) Supponiamo ora che dimE = 3, con base (v1, v2, v3) e poniamo:w1 = v1

w2 = v2 − aw1

w3 = v3 − bw1 − cw2

dove a =〈v2, w1〉〈w1, w1〉

e stato gia determinato, cosicche 〈w1, w2〉 = 0. Imponendo le condizioni

〈w3, w1〉 = 〈w3, w2〉 = 0,

otteniamo:b =〈v3, w1〉〈w1, w1〉

, c =〈v3, w2〉〈w2, w2〉

.

Con tali scelte di a, b, c otteniamo quindi la base ortogonale (w1, w2, w3) di E e quindi,normalizzando, una base ortonormale (notiamo che w3 non e nullo, altrimenti v1, v2, v3sarebbero linearmente dipendenti ).Procedendo per induzione, possiamo enunciare il seguente teorema.

Teorema (Algoritmo di Gram-Schmidt) Sia (v1, . . . , vk) una base del sottospazio E diRn. Si introducano i vettori:

w1 = v1

w2 = v2 − a21w1

w3 = v3 − a31w1 − a32w2

. . .

wk = vk − ak1w1 − ak2w2 − · · · − ak,k−1wk−1

dove si e posto:

aij =〈vi, wj〉〈wj , wj〉

.

9

Allora (w1, . . . , wk) e una base ortogonale di E, e quindi i vettori normalizzati:

u1 =1‖w1‖

w1, . . . , uk =1‖wk‖

wk,

formano una base ortonormale di E.

Esempio Trovare una base ortonormale del sottospazio E di R3 di equazione:

E : x− y − 2z = 0.

Soluzione. Determiniamo una base di E, e poi applichiamo l’algoritmo di Gram-Schmidtper ottenere una base ortonormale. Base di E:

v1 =

110

, v2 =

201

.

L’algoritmo consiste di due passi: {w1 = v1

w2 = v2 − a21w1.

Si ha w1 =

110

, dunque:

a21 =〈v2, w1〉〈w1, w1〉

=22

= 1.

Allora:

w1 =

110

w2 =

201

−1

10

=

1−11

.

Si verifica che in effetti 〈w1, w2〉 = 0. Una base ortonormale di E e dunque:

u1 =1√2

110

, u2 =1√3

1−11

.

10

• Ovviamente la base ortonormale ottenuta dipende dalla base di partenza. Per eser-cizio, vedere quale base ortonormale si ottiene scambiando i vettori della base di partenza.

Esempio Trovare una base ortonormale del sottospazio di R4 generato dai vettori:

v1 =

1100

, v2 =

2010

, v3 =

13−12

.

Soluzione. I tre vettori formano una base di E. Applichiamo l’algoritmo di Gram-Schmidtalla terna v1, v2, v3:

w1 = v1

w2 = v2 − a21w1

w3 = v3 − a31w2 − a32w2

Abbiamo w1 =

1100

, e quindi a21 = 1. Dunque

w2 =

2010

1100

=

1−110

.

Ora: a31 =

〈v3, w1〉〈w1, w1〉

=42

= 2

a32 =〈v3, w2〉〈w2, w2〉

=−33

= −1

dunque:

w3 =

13−12

− 2

1100

+

1−110

=

0002

.

Otteniamo la base ortogonale:

w1 =

1100

, w2 =

1−110

, w3 =

0002

,

11

e, normalizzando, la base ortonormale:

u1 =1√2

1100

, u2 =1√3

1−110

, u3 =

0001

.

4 Matrici ortogonali

Abbiamo visto che la matrice M di passaggio fra due basi B,B′ di uno spazio vettoriale einvertibile. Se le basi B,B′ sono ortonormali, la matrice di passaggio avra delle proprietaparticolari.

Definizione Una matrice quadrata M si dice ortogonale se verifica MM t = I. Quindiuna matrice ortogonale M e invertibile e

M−1 = M t,

cioe l’inversa coincide con la trasposta.

Esempio La matrice M =1√5

(1 −22 1

)=

1√5−2√

52√5

1√5

e ortogonale.

Esempio La matrice M =

1/√

2 1/√

3 1/√

6−1/√

2 1/√

3 1/√

60 1/

√3 −2/

√6

e ortogonale.

In entrambi i casi si verifica infatti che MM t = I.

Osserviamo che, se MM t = I allora, prendendo il determinante di ambo i membri eapplicando il teorema di Binet, si ha (detM)2 = 1. Dunque• se M e una matrice ortogonale allora detM = 1 oppure detM = −1.

Il teorema seguente fornisce le proprieta importanti di una matrice ortogonale.

Teorema a) La matrice di passaggio fra due basi ortonormali di Rn (o di un suo sot-tospazio) e ortogonale.b) Una matrice A ∈Mat(n × n) e ortogonale se e solo se le colonne di A formano unabase ortonormale di Rn.

Dimostrazione. La dimostrazione si riduce a una verifica, che omettiamo. �

12

Osserviamo che le colonne delle matrici ortogonali dei due esempi precedenti formano,effettivamente, una base ortonormale di R2 (primo esempio), e di R3 (secondo esempio).Dalla parte b) del teorema abbiamo anche• Incolonnando i vettori di una base ortonormale di Rn otteniamo una matrice ortog-

onale n× n.

Infine, si puo dimostrare che le matrici ortogonali di R2 sono di due tipi:(cos θ − sin θsin θ cos θ

)con θ ∈ R, oppure (

cosα sinαsinα − cosα

),

con α ∈ R. Le matrici del primo tipo hanno determinante 1, mentre quelle del secondotipo hanno determinante −1.

5 Complemento ortogonale di un sottospazio

Sia u1 un vettore fissato di Rn e si consideri il sottoinsieme

E = {v ∈ Rn : 〈v, u1〉 = 0},

formato da tutti i vettori ortogonali a u1. Per le proprieta di bilinearita del prodottoscalare, E risulta allora un sottospazio di Rn. Piu in generale, fissati k vettori di Rn,diciamo u1, . . . , uk, l’insieme:

E = {v ∈ Rn : 〈v, u1〉 = · · · = 〈v, uk〉 = 0},

formato dai vettori di Rn ortogonali a u1, . . . , uk e un sottospazio di Rn.

Esempio Sia u1 =

11−1

. Trovare una base di E = {v ∈ R3 : 〈v, u1〉 = 0}.

Soluzione. Sia v =

xyz

il vettore generico di R3. Imponendo l’ortogonalita al vettore u1

otteniamo l’unica condizionex+ y − z = 0.

13

Dunque E e il sottospazio delle soluzioni dell’equazione, e una sua base e, ad esempio, 1−10

,

011

. E ha dimensione 2. �

Esempio Dati i vettori u1 =

11−1

, u2 =

01−2

si consideri il sottospazio

F = {v ∈ R3 : 〈v, u1〉 = 〈v, u2〉 = 0}.

a) Trovare una base di F e calcolare la sua dimensione.

b) Trovare un vettore di F avente norma 1.

Soluzione. a) Imponendo al vettore generico v =

xyz

l’ortogonalita a u1 e u2 vediamo

che F e descritto dalle equazioni

F :

{x+ y − z = 0y − 2z = 0

.

La matrice dei coefficienti del sistema che definisce F e A =(

1 1 −10 1 −2

). Notiamo che

le righe di A sono proprio i vettori u1, u2 (piu precisamente, ut1, ut2): siccome u1, u2 sono

linearmente indipendenti il rango vale 2 e l’insieme delle soluzioni F ha dimensione:

dimF = 3− rkA = 1.

Una base si ottiene risolvendo il sistema. Si ottiene ad esempio la base

−121

.

b) Un vettore di E di norma 1 si ottiene normalizzando il vettore della base trovata,

dunque w =1√6

−121

. Un altro vettore possibile e −w =1√6

1−2−1

. Verificare che

non ce ne sono altri. �

Generalizzando, otteniamo il seguente risultato.

Proposizione Se i vettori u1, . . . , uk ∈ Rn sono linearmente indipendenti, allora

E = {v ∈ Rn : 〈v, u1〉 = · · · = 〈v, uk〉 = 0},

14

e un sottospazio di Rn di dimensione n− k.

Dimostrazione. Abbiamo gia osservato che E e un sottospazio. Sia v = (x1, . . . , xn)t ilvettore generico di Rn. Imponendo l’ortogonalita di v a ciascuno dei vettori u1, . . . , ukotteniamo un sistema lineare omogeneo di k equazioni nelle n incognite x1, . . . , xn. DunqueE ha dimensione n− rkA, dove A e la matrice dei coefficienti. Ora, si verifica che le righedi A sono i vettori trasposti di u1, . . . , uk. Poiche per ipotesi u1, . . . , uk sono linearmenteindipendenti il rango di A vale k e dunque

dimE = n− k.

5.1 Complemento ortogonale di un sottospazio

Sia E un sottospazio di Rn. Definiamo complemento ortogonale di E l’insieme E⊥ costi-tuito dai vettori di Rn ortogonali a tutti i vettori di E:

E⊥ = {v ∈ Rn : 〈v, w〉 = 0 per ogni w ∈ E}.

Dalle proprieta del prodotto scalare risulta che E⊥ e chiuso rispetto alla somma e alprodotto per uno scalare, dunque e un sottospazio di Rn.

Risulta che v ∈ E⊥ se e solo se v e ortogonale a tutti i vettori di una base di E. Infatti:

Proposizione Sia (v1, . . . , vk) una base di E. Allora v ∈ E⊥ se e solo se 〈v, vi〉 = 0 perogni i = 1, . . . , k.

Dimostrazione. Supponiamo che 〈v, vi〉 = 0 per ogni i = 1, . . . , k. Se w e un qualunquevettore di E, allora w e combinazione lineare dei vettori della base: w = a1v1 + · · ·+akvk.Quindi

〈v, w〉 = a1〈v, v1〉+ · · ·+ ah〈v, vk〉 = 0,

che dimostra che v e ortogonale a w. Siccome w ∈ E e arbitrario, v ∈ E⊥. Il viceversa eimmediato. �

Esempio Determinare una base di E⊥, complemento ortogonale del sottospazio E di R4

generato dai vettori v1 =

1111

, v2 =

1010

.

15

Soluzione. Imponiamo al vettore generico v = (x, y, z, w)t ∈ R4 l’ortogonalita ai vettoridella base (v1, v2) di E, ottenendo il sistema omogeneo:{

x+ y + z + w = 0x+ z = 0

.

Risolvendo il sistema, otteniamo la base di E⊥:

10−10

,

010−1

. �

Le proprieta importanti del complemento ortogonale sono espresse nel seguente teorema.

Teorema Sia E un sottospazio di Rn e E⊥ il suo complemento ortogonale. Alloraa) E ∩ E⊥ = {O}.b) dimE⊥ = n− dimE.c) Rn = E ⊕ E⊥.

Dimostrazione. a) Se v ∈ E∩E⊥ allora v e ortogonale a tutti i vettori di E; in particolarev e ortogonale a se stesso, e dunque 〈v, v〉 = 0. Ma l’unico vettore con tale proprieta e ilvettore nullo.b) Sia dimE = k e sia (u1, . . . , uk) una base di E. Sappiamo che v ∈ E⊥ se e solo se v eortogonale ai vettori di una base di E: dunque

E⊥ = {v ∈ Rn : 〈v, u1〉 = · · · = 〈v, uk〉 = 0}.

Siccome u1, . . . , uk sono linearmente indipendenti, dalla proposizione del paragrafo prece-dente otteniamo che dimE⊥ = n− k = n− dimE.c) Applichiamo la formula di Grassmann ai sottospazi E,E⊥:

dim(E + E⊥) + dim(E ∩ E⊥) = dimE + dimE⊥.

Da a) e b) concludiamo che dim(E+E⊥) = n. Dunque E+E⊥ = Rn. Poiche E∩E⊥ = {O}la somma e diretta: Rn = E ⊕ E⊥. �

5.2 Proiezione ortogonale su un sottospazio

Dal teorema precedente abbiamo che un vettore v ∈ Rn si spezza, in modo unico, comesomma di un vettore w ∈ E e di un vettore w⊥ ∈ E⊥:

v = w + w⊥.

16

In particolare, w e w⊥ sono ortogonali.• Il vettore w e detto la proiezione ortogonale di v sul sottospazio E. Denoteremo w

con il simbolo PE(v).

Esempio E dato il sottospazio di R3 descritto dall’equazione x + y − 2z = 0. Il vettore

v =

120

∈ R3 si spezza 120

=

1/23/21

+

1/21/2−1

,

dove il primo vettore appartiene a E e il secondo a E⊥. Quindi PE(v) =

1/23/21

.

In generale, se (u1 . . . , uk) e una base ortonormale di E allora la proiezione ortogonale sicalcola con la formula

PE(v) = 〈v, u1〉u1 + · · ·+ 〈v, uk〉uk.

6 Endomorfismi simmetrici

In questa sezione studieremo una classe importante di endomorfismi di Rn: gli endomor-fismi detti simmetrici. Tali endomorfismi sono caratterizzati dalla proprieta di ammettereuna base ortonormale di autovettori, e sono legati in modo naturale alle matrici simmet-riche. In particolare, risultera che ogni matrice simmetrica e diagonalizzabile.

Definizione Un endomorfismo di Rn si dice simmetrico se la sua matrice associatarispetto alla base canonica e simmetrica.

Esempio Sia f : R2 → R2 definito da f(xy

)=(−3x+ 3y3x+ 5y

). La matrice canonica di f

e:

A =(−3 33 5

).

Siccome A e simmetrica, f e simmetrico.

Esempio L’endomorfismo f(xy

)=(x+ 2y

3y

)ha matrice canonica

(1 20 3

)dunque non

e simmetrico.

17

Teorema Le seguenti condizioni sono equivalenti.a) f e un endomorfismo simmetrico di Rn.b) La matrice associata a f rispetto ad una qualunque base ortonormale di Rn e simmet-rica.c) Per ogni coppia di vettori u, v ∈ Rn si ha

〈f(u), v〉 = 〈u, f(v)〉.

Dimostrazione. a) =⇒ b) Supponiamo che f sia simmetrico, e sia A la sua matrice

canonica. Per definizione, A e simmetrica. Se B e una base ortonormale di Rn, e A′ e lamatrice associata a f rispetto a tale base, allora sappiamo che

A′ = M−1AM,

dove M e la matrice di passaggio dalla base canonica BC alla base B. Poiche tali basi sonoentrambe ortonormali, si ha che M e ortogonale, quindi M−1 = M t. Dunque A′ = M tAM ,ed e sufficiente dimostrare che M tAM e simmetrica. Ma questo e immediato:

(M tAM)t = M tA(M t)t = M tAM.

b) =⇒ c) Si ha la seguente identita, valida per ogni matrice A e per ogni scelta di u, v,

vettori colonna di Rn:〈Au, v〉 = 〈u,Atv〉.

L’identita si verifica con un calcolo diretto, e fornisce un legame tra il prodotto scalare ela trasposta di una matrice. Supponiamo che la matrice A, associata ad f rispetto allabase canonica, sia simmetrica. Ora sappiamo che f si scrive

f(v) = Av.

Poiche A e simmetrica, si ha A = At e dall’identita precedente:

〈f(u), v〉 = 〈Au, v〉 = 〈u,Av〉 = 〈u, f(v)〉.

c) =⇒ a) Premettiamo che, se A e una matrice n × n e e1, . . . , en sono i vettori della

base canonica di Rn, un calcolo mostra che

〈Aei, ej〉 = aji,

dove aji e l’elemento di posto (j, i) della matrice A.

18

Per ipotesi, si ha la proprieta c). Dunque, se A e la matrice canonica di f , l’identita

〈Au, v〉 = 〈u,Av〉

risulta vera per ogni scelta dei vettori colonna u, v. Prendendo u = ei e v = ej otteniamo

aji = aij

per ogni i, j, dunque la matrice canonica di f e simmetrica e f risulta simmetrico. �

Isoliamo la seguente proprieta degli autospazi di un endomorfismo simmetrico.

Proposizione Gli autospazi di un endomorfismo simmetrico sono ortogonali fra loro. Inaltre parole, se λ1 e λ2 sono autovalori distinti di f , e se u ∈ E(λ1) e v ∈ E(λ2) allora:

〈u, v〉 = 0.

Dimostrazione. Per ipotesi f(u) = λ1u; dunque

〈f(u), v〉 = λ1〈u, v〉.

D’altra parte, per la c) del teorema, poiche f(v) = λ2v:

〈f(u), v〉 = 〈u, f(v)〉 = λ2〈u, v〉.

Uguagliando otteniamo λ1〈u, v〉 = λ2〈u, v〉 cioe

(λ1 − λ2)〈u, v〉 = 0,

e poiche λ1 − λ2 6= 0 si ha necessariamente 〈u, v〉 = 0. �

Esempio Sia f : R2 → R2 definito da f

(xy

)=(−3x+ 3y3x+ 5y

). Verifichiamo che gli au-

tospazi di f sono ortogonali. Matrice canonica A =(−3 33 5

)con polinomio caratteristico

x2 − 2x − 24. e abbiamo due autovalori distinti: λ1 = −4 e λ2 = 6 e due autospaziE(−4), E(6), entrambi di dimensione 1. Si trova che E(−4) ha equazione x+ 3y = 0 con

base(

3−1

), e E(6) ha equazione 3x− y = 0 con base

(13

).

Effettivamente, gli autospazi sono ortogonali tra loro, la coppia(

3−1

),

(13

)e una base

ortogonale di autovettori, e la coppia

1√10

(3−1

),

1√10

(13

)19

e una base ortonormale di R2 formata da autovettori di f . �

Esempio L’endomorfismo f(xy

)=(x+ 2y

3y

)ha matrice canonica

(1 20 3

)dunque non

e simmetrico. Si osserva che f ha autovalori λ1 = 1, λ2 = 3 e autospazi:

E(1) : y = 0, E(3) : x− y = 0.

Si vede subito che gli autospazi non sono ortogonali. Risulta che f e diagonalizzabile,

con base di autovettori(

10

),

(11

)ma non e possibile trovare una base ortonormale di

autovettori (se ortonormalizziamo la base, non otteniamo piu autovettori).

Esempio Sia E un sottospazio di Rn. L’endomorfismo PE che associa al vettore v ∈ Rn

la sua proiezione ortogonale sul sottospazio E e simmetrico.Infatti, se fissiamo una base ortonormale (u1 . . . , uk) di E allora la proiezione ortogonalee data da

PE(v) = 〈v, u1〉u1 + · · ·+ 〈v, uk〉uk.

Se w e un secondo vettore di Rn si ha

〈PE(v), w〉 = 〈v, u1〉〈u1, w〉+ · · ·+ 〈v, uk〉〈uk, w〉.

Poiche il secondo membro rimane uguale scambiando v con w, si ha 〈PE(v), w〉 = 〈PE(w), v〉 =〈v, PE(w)〉 e PE e simmetrico.

7 Teorema spettrale

Veniamo al seguente importante teorema, di cui omettiamo la dimostrazione.

Teorema spettrale. Sia f un endomorfismo simmetrico di Rn. Allora f e diagonaliz-zabile; inoltre esiste una base ortonormale di Rn costituita da autovettori di f .

Anche il viceversa e vero, ed e facile da dimostrare:

Teorema Sia f un endomorfismo di Rn, e supponiamo che esista una base ortonormaledi Rn formata da autovettori di f . Allora f e simmetrico.

Dimostrazione. La matrice associata alla base di autovettori (che e ortonormale per ipotesi)e diagonale, dunque simmetrica, e quindi f e simmetrico per il teorema della sezione prece-dente. �

20

Dunque, la classe degli endomorfismi di Rn che ammettono una base ortonormale diautovettori coincide con la classe degli endomorfismi simmetrici.Notiamo anche il fatto seguente.

Corollario Ogni matrice simmetrica e diagonalizzabile, ed e ortogonalmente simile aduna matrice diagonale. Cioe, possiamo trovare una matrice diagonale D e una matriceortogonale M tali che:

D = M−1AM = M tAM.

Dimostrazione. Sia f l’endomorfismo di Rn rappresentato daA rispetto alla base canonica.Poiche’ A e simmetrica, anche f e simmetrico. Per il teorema spettrale, possiamo trovareuna base ortonormale B formata da autovettori di f . In questa base, f si rappresenta conuna matrice diagonale D; inoltre si ha

D = M−1AM,

dove M e la matrice di passaggio dalla base canonica alla base B. Poiche’ tali basi sonoentrambe ortonormali, la matrice M e ortogonale, quindi M−1 = M t. �

Diamo ora il procedimento per determinare una base ortonormale di autovettori di unendomorfismo simmetrico.

1. Calcoliamo il polinomio caratteristico e quindi troviamo gli autovalori di f , diciamoλ1, . . . , λk.

2. Con l’algoritmo di Gram-Schmidt, troviamo una base ortonormale di ciascun au-tospazio, diciamo B1, . . . ,Bk.3. Uniamo le basi ortonormali cosi’ trovate per ottenere la base B = B1 ∪ · · · ∪ Bk di Rn.L’insieme di vettori cosi’ ottenuto formera’ una base ortonormale di autovettori.

Infatti, ogni vettore di B ha chiaramente norma 1. Inoltre, se prendiamo due vettoriappartenenti alla stessa base Bi questi sono ortogonali per costruzione; se prendiamo duevettori appartenenti a basi diverse, questi appartengono ad autospazi diversi e quindi sonoortogonali grazie alla proposizione della sezione precedente. I vettori di B sono a due adue ortogonali e di norma 1, dunque B e una base ortonormale.

Infine, per diagonalizzare una matrice simmetrica A, procediamo cosi’:

1. Troviamo una base ortonormale B formata da autovettori dell’endomorfismo di Rn

rappresentato da A rispetto alla base canonica.

2. Incolonniamo la base B per ottenere una matrice ortogonale M .

3. Scriviamo la matrice diagonale D, i cui elementi diagonali sono gli autovalori di f ,presi nello stesso ordine dei corrispondenti autovettori di B.

4. Risultera’ allora D = M tAM .

21

7.1 Esempio

Sia f l’operatore di R2 rappresentato da(−3 33 5

)rispetto alla base canonica. Abbiamo

gia trovato una base ortonormale di autovettori:

1√10

(3−1

),

1√10

(13

),

associati rispettivamente a −4 e 6. Quindi se prendiamo

M =1√10

(3 1−1 3

), D =

(−4 00 6

).

si avra D = M tAM .

7.2 Esempio

Sia f l’operatore di R3 rappresentato da

1 1 11 1 11 1 1

rispetto alla base canonica. f e

simmetrico. Il polinomio caratteristico e −x3 + 3x2 e gli autovalori sono 0, 3. E(0) e

il nucleo, di equazione x + y + z = 0 e base

1−10

,

10−1

. Applicando l’algoritmo di

Gram-Schmidt, otteniamo la base ortonormale di E(0):

w1 =1√2

1−10

, w2 =1√6

11−2

.

E(3) ha base

111

; si osserva che E(3) e ortogonale a E(0). Otteniamo la base ortonormale

di E(3):

w3 =1√3

111

.

Ne segue che una base ortonormale di autovettori e (w1, w2, w3) cioe:

1√2

1−10

,1√6

11−2

,1√3

111

.

22

Ponendo

M =

1√2

1√6

1√3

− 1√2

1√6

1√3

0 − 2√6

1√3

, D =

0 0 00 0 00 0 3

,

si ha D = M tAM .

7.3 Esempio

Sia f l’endomorfismo di R4 rappresentato, rispetto alla base canonica, dalla matrice

A =

2 0 1 00 2 0 −11 0 2 00 −1 0 2

.

Poiche A e simmetrica, f e un endomorfismo simmetrico. Un calcolo mostra che pA(x) =(x − 1)2(x − 3)2, dunque f ammette due autovalori distinti: λ1 = 1 e λ2 = 3, entrambidi molteplicita algebrica 2. Gia sappiamo che f e diagonalizzabile, dunque la molteplicitageometrica di entrambi gli autovalori sara 2.

Descriviamo gli autospazi. A− I =

1 0 1 00 1 0 −11 0 1 00 −1 0 1

dunque E(1) ha equazioni:

{x1 + x3 = 0x2 − x4 = 0

e quindi

E(1) = {

ts−ts

∈ R4 : t, s ∈ R}.

Procedendo in modo analogo, si ha:

E(3) = {

t′

s′

t′

−s′

∈ R4 : t′, s′ ∈ R}.

23

Osserviamo che i due autospazi sono fra loro ortogonali, nel senso che:

ts−ts

,

t′

s′

t′

−s′

〉 = tt′ + ss′ − tt′ − ss′ = 0

per ogni t, s, t′, s′ ∈ R.Passiamo ora a costruire una base ortonormale di autovettori di f . Una base di E(1)e data dalla coppia ((1, 0,−1, 0)t, (0, 1, 0, 1)t): i due vettori sono ortogonali, dunque unabase ortonormale di V (1) e:

w1 =1√2

10−10

, w2 =1√2

0101

,

In modo analogo, dalla base ((1, 0, 1, 0)t, (0, 1, 0,−1)t) di E(3) otteniamo la base ortonor-male di E(3):

w3 =1√2

1010

, w4 =1√2

010−1

Dunque

B = B1 ∪ B2 = (w1, w2, w3, w4)

e una base ortonormale di R4, costituita da autovettori di f .La matrice A e diagonalizzabile; se M e la matrice ottenuta incolonnando la base ortonor-male di autovettori descritta in precedenza, cioe

M =1√2

1 0 1 00 1 0 1−1 0 1 00 1 0 −1

allora M e una matrice ortogonale che diagonalizza A, nel senso che

M tAM =

1 0 0 00 1 0 00 0 3 00 0 0 3

.

24