InfoQuant - Chap 1

INTRODUCTIONÀ

L’INFORMATIQUE QUANTIQUEVOLUME I

PRINCIPES MATHÉMATIQUESET PHYSIQUES

Pierre Vinetc© Tous droits réservés – 2010

Préface

ii Préface

Liste de symboles

iv Liste de symboles

Table des matières

Préface i

Liste de symboles iii

Table des figures vii

Liste des tableaux ix

1 L’espace de Hilbert 11.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Les espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.1 Exemples d’espaces vectoriels . . . . . . . . . . . . . . 21.2.2 Sous-espaces vectoriels . . . . . . . . . . . . . . . . . . 41.2.3 Bases et dimensions . . . . . . . . . . . . . . . . . . . 51.2.4 Applications linéaires et isomorphismes . . . . . . . . 71.2.5 L’espace dual . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Les espaces pré-hilbertiens . . . . . . . . . . . . . . . . . . . . 131.3.1 Le produit scalaire . . . . . . . . . . . . . . . . . . . . 13

1.4 Les espaces vectoriels normés . . . . . . . . . . . . . . . . . . 181.5 Les espaces métriques . . . . . . . . . . . . . . . . . . . . . . 221.6 Les espaces de Hilbert de dimension infinie . . . . . . . . . . . 25

1.6.1 Topologie usuelle sur les espaces métriques* . . . . . . 251.6.2 Les espaces complets* . . . . . . . . . . . . . . . . . . 301.6.3 Les espaces séparables* . . . . . . . . . . . . . . . . . 351.6.4 Les espaces vectoriels topologiques . . . . . . . . . . . 38

1.6.4.1 L’espace dual topologique . . . . . . . . . . . 401.6.5 Les bases hilbertiennes . . . . . . . . . . . . . . . . . . 41

1.7 Quelques représentations de H . . . . . . . . . . . . . . . . . 571.7.1 L’espace l2* . . . . . . . . . . . . . . . . . . . . . . . . 571.7.2 L’espace fonctionnel L2* . . . . . . . . . . . . . . . . . 59

vi TABLE DES MATIÈRES

1.7.3 L’espace-état . . . . . . . . . . . . . . . . . . . . . . . 641.8 La notation de Dirac : bra et ket . . . . . . . . . . . . . . . . 661.9 Les triplets de Gel’fand* . . . . . . . . . . . . . . . . . . . . . 671.10 Problèmes du Chapitre 1 . . . . . . . . . . . . . . . . . . . . . 70

Annexes du Chapitre 1 73Annexe 1.A Les structures algébriques . . . . . . . . . . . . . . . 75

1.A.1 Le produit cartésien . . . . . . . . . . . . . . . . . . . 751.A.2 Loi de composition interne . . . . . . . . . . . . . . . . 751.A.3 Loi de composition externe . . . . . . . . . . . . . . . 761.A.4 La structure algébrique de corps . . . . . . . . . . . . 761.A.5 La structure d’espace vectoriel . . . . . . . . . . . . . 771.A.6 Les algèbres . . . . . . . . . . . . . . . . . . . . . . . . 80

Annexe 1.B Les nombres complexes . . . . . . . . . . . . . . . . . 821.B.1 Les opérations arithmétiques sur les nombres complexes 821.B.2 La conjugaison complexe . . . . . . . . . . . . . . . . . 841.B.3 La forme algébrique des nombres complexes . . . . . . 841.B.4 La forme trigonométrique des nombres complexes . . . 851.B.5 Les fonctions de la variable complexe . . . . . . . . . . 871.B.6 La forme exponentielle des nombres complexes . . . . 881.B.7 Appréciation des nombres complexes . . . . . . . . . . 91

Annexe 1.C Topologie générale . . . . . . . . . . . . . . . . . . . . 971.C.1 Les espaces topologiques . . . . . . . . . . . . . . . . . 971.C.2 Voisinage d’un point . . . . . . . . . . . . . . . . . . . 991.C.3 Prébase d’un espace topologique . . . . . . . . . . . . 1001.C.4 Base d’un espace topologique . . . . . . . . . . . . . . 1021.C.5 Topologie induite . . . . . . . . . . . . . . . . . . . . . 1041.C.6 Continuité . . . . . . . . . . . . . . . . . . . . . . . . . 1051.C.7 Équivalence topologique . . . . . . . . . . . . . . . . . 1091.C.8 Convergence . . . . . . . . . . . . . . . . . . . . . . . . 1101.C.9 Adhérence . . . . . . . . . . . . . . . . . . . . . . . . . 1111.C.10 Espaces de Hausdorff . . . . . . . . . . . . . . . . . . . 1131.C.11 Axiomes de dénombrabilité . . . . . . . . . . . . . . . 1151.C.12 Séparabilité . . . . . . . . . . . . . . . . . . . . . . . . 1181.C.13 Compacité . . . . . . . . . . . . . . . . . . . . . . . . . 119

Bibliographie 133

Index 135

Table des figures

1.1 Opérations vectorielles . . . . . . . . . . . . . . . . . . . . . . 31.2 Injections, surjections et bijections . . . . . . . . . . . . . . . 81.3 Boules ouvertes dans R2 et C . . . . . . . . . . . . . . . . . . 241.4 Une boule ouverte est un voisinage de chacun de ses points . 271.5 Intersection de deux boules ouvertes . . . . . . . . . . . . . . 281.6 Boules ouvertes en tant qu’ouverts de Td . . . . . . . . . . . . 281.7 Espace de Hausdorff . . . . . . . . . . . . . . . . . . . . . . . 361.8 Projection orthogonale . . . . . . . . . . . . . . . . . . . . . . 521.9 Comparaison entre le plan cartésien et le plan d’Argand . . . 861.10 Le cercle unité dans le plan complexe . . . . . . . . . . . . . . 891.11 Nombres complexes dans le plan d’Argand . . . . . . . . . . . 901.12 Racines de l’équation quadratique . . . . . . . . . . . . . . . . 921.13 Racines de l’équation cubique . . . . . . . . . . . . . . . . . . 931.14 Voisinage d’un point . . . . . . . . . . . . . . . . . . . . . . . 991.15 Base d’un espace topologique . . . . . . . . . . . . . . . . . . 1031.16 Continuité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1051.17 Exemple d’application continue . . . . . . . . . . . . . . . . . 1061.18 Continuité en un point . . . . . . . . . . . . . . . . . . . . . . 1081.19 Exemple d’application continue en un point . . . . . . . . . . 1091.20 Théorème de Heine-Borel . . . . . . . . . . . . . . . . . . . . 1201.21 Partie fermée d’un ensemble compact . . . . . . . . . . . . . . 1211.22 Ensemble compact d’un espace de Hausdorff . . . . . . . . . . 1241.23 Espaces localement compacts . . . . . . . . . . . . . . . . . . 1271.24 Espaces bornés . . . . . . . . . . . . . . . . . . . . . . . . . . 1291.25 Sous-ensemble totalement borné (précompact) . . . . . . . . . 130

viii TABLE DES FIGURES

Liste des tableaux

1.1 Morphismes d’espaces vectoriels . . . . . . . . . . . . . . . . . 10

x LISTE DES TABLEAUX

PRINCIPES

MATHÉMATIQUES

ET PHYSIQUES

Chapitre 1

L’espace de Hilbert

I am sitting on a table — not necessarily in Hilbert space.Martin J.G. Veldman

1.1 Introduction

Le cadre mathématique formel de la mécanique quantique est l’espacede Hilbert, un espace vectoriel normé de dimension infinie, complet, quiadmet une base vectorielle dénombrable. Un espace de Hilbert est un casparticulier d’un espace de Banach, celui où la norme dérive d’un produitscalaire. Tous les espaces de Hilbert de dimension infinie sont isomorphesentre eux ; autrement dit, à un isomorphisme près, il n’existe qu’un seulespace de Hilbert.

Ce chapitre contient considérablement plus d’informations que l’on en re-trouve généralement dans les ouvrages d’informatique quantique ou même demécanique quantique. Il développe en effet la théorie des espaces de Hilbertde façon compréhensive et complète.

L’espace de Hilbert est un espace très vaste. Toutefois, la pleine compré-hension des algorithmes quantiques ne nécessite que l’étude de sous-espacesde dimension finie, ce qui a l’avantage de réduire considérablement les dif-ficultés mathématiques. De plus, dans les premiers volumes de cette série,le traitement réservé à l’unité quantique d’information, le qubit 1, sera pu-rement abstrait, sans faire aucune référence à une quelconque incarnationphysique.

Puisque l’espace-état du qubit n’est que bi-dimensionnel, le modèle quan-tique du qubit est l’un des plus simples qui soient et son étude se dispense

1. Contraction linguistique anglophone de « quantum bit », ou de bit quantique.

2 L’espace de Hilbert

d’un traitement quantique des variables externes telles que r et p. Il estdonc possible d’accéder au coeur du sujet en réduisant au strict minimumles notions nécessaires.

Mais le chemin le plus court et le plus rapide n’est ni nécessairementle plus désirable ni le plus utile. Le grand philosophe Edgar Morin ne nousmet-il pas en garde contre la trop grande simplicité de nos modèles qui com-partimente la pensée, défigure le réel et conduit à une forme de connaissanceaveugle[10] ? Malgré son apparente simplicité, le qubit manifeste pleinementtoutes les merveilleuses et déroutantes propriétés qui font de la mécaniquequantique cet étincelant joyau de la pensée scientifique. Peut-on rêver d’unemeilleure opportunité d’étudier les fondements de la plus réussie de toutesles sciences ?

La décision ultime revient au lecteur qui est seul responsable du rythmeet de la profondeur de son apprentissage. Le lecteur pressé qui possède déjàles connaissances suffisantes en algèbre linéaire peut se contenter de lire lesencadrés des pages 25 et 57 ainsi que la section 1.8 sur la notation de Dirac.Celui qui désire rafraîchir ces notions saura se contenter, en première lecture,des sections non annotées d’un astérisque.

Mais, plus qu’un exposé de connaissances, cet ouvrage se veut un appelà un changement de paradigme. Et le lecteur qui fournira l’effort additionnelde chercher à en comprendre toutes les sections et de s’attaquer aux diffé-rents problèmes acquièrera une vision nouvelle, fascinante et indélébile decet magnifique monde physique dont il fait lui-même partie intégrante.

1.2 Les espaces vectoriels

Nous allons maintenant passer en revue certaines notions essentielles d’al-gèbre linéaire. Pour les deux prochaines sections, notre intérêt portera prin-cipalement sur les espaces vectoriels de dimension finie.

1.2.1 Exemples d’espaces vectoriels

Nous supposons que le lecteur est déjà familier avec les opérations fonda-mentales d’addition vectorielle et de multiplication scalaire sur les vecteurstelles qu’illustrées à la Fig. 1.1. Pour une définition axiomatique d’un es-pace vectoriel ou une explication sur les conventions de notation, le lecteurest prié de consulter l’appendice 1.A sur les structures algébriques.

Voici quelques exemples d’espaces vectoriels qui sont particulièrementpertinents pour l’informatique quantique.

1.2.1 Exemples d’espaces vectoriels 3

(a) (b)

v

v

u

u

u +v

1.5u

u−0.5u

Figure 1.1 – (a) addition vectorielle (loi du parallélogramme) et (b) multi-plication scalaire sur un espace vectoriel réel

Exemple 1.1. Soit V = Rn et définissons les opérations d’additionvectorielle et de multiplication scalaire sur les n-uplets par :

(x1, x2, . . . , xn) + (y1, y2, . . . , yn) = (x1 + y1, x2 + y2, . . . , xn + yn) (1.1a)

α(x1, x2, . . . , xn) = (αx1, αx2, . . . , αxn) (1.1b)

Alors V est un espace vectoriel qui vérifie tous les axiomes de la définition1A.5. Les vecteurs de V sont les n-uplets x = (x1, x2, . . . , xn) et V est unexemple d’espace vectoriel réel, que nous désignerons par Rn.

Exemple 1.2. Si dans l’exemple précédent nous remplaçons Rn par Cn

et les n-uplets réels par des n-uplets complexes, nous obtenons un espace vec-toriel complexe. Ce sont ces espaces vectoriels Cn qui sont d’une importancefondamentale en informatique quantique.

Note. Si le besoin d’un rappel sur les nombres complexes se fait sentir,le lecteur est invité à consulter l’appendice 1.B.

Exemple 1.3. L’ensembleMm,n(K) des matrices m× n doté des opé-rations d’addition vectorielle et de multiplication scalaire suivantes possèdeaussi la structure d’espace vectoriel :

x11 · · · x1n... xij

...

xm1 · · · xmn

+

y11 · · · y1n... yij

...

ym1 · · · ymn

=

x11 + y11 · · · x1n + y1n

... xij + yij...

xm1 + ym1 · · · xmn + ymn

(1.2a)


α ·

x11 · · · x1n... xij

...

xm1 · · · xmn

=

αx11 · · · αx1n... αxij

...

αxm1 · · · αxmn

(1.2b)

Si les exemples élémentaires décrits ci-haut conviennent parfaitement ànos besoins, en revanche ils ne font qu’effleurer le concept d’espace vectoriel.Les vecteurs peuvent assumer des identités aussi différentes que des n-uplets,des polynômes, des applications, des suites convergentes ou encore des solu-tions d’équations différentielles linéaires homogènes. En particulier, la notiond’espace vectoriel de fonctions, ou d’espace fonctionnel, a joué un rôle trèsimportant dans le développement de la mécanique quantique.

1.2.2 Sous-espaces vectoriels

De façon informelle, un sous-espace vectoriel de V n’est autre qu’unsous-ensemble U ⊆ V tel que (U,+, �) possède aussi la structure d’espacevectoriel. Selon nos conventions, nous désignerons ce sous-espace vectoriel(ou simplement sous-espace en l’absence d’ambiguïté) par U.

La définition suivante permet d’en formaliser le concept.

Définition 1.1 Soient V un espace vectoriel sur un corps K et{v1,v2, . . . ,vn} un ensemble fini de vecteurs arbitraires de V. Une com-binaison linéaire est toute expression de la forme :

α1v1 + α2v2 + · · ·+ αnvn

où les αi sont des scalaires quelconques de K.

Définition 1.2 Soient V un espace vectoriel et U , un sous-ensemblenon-vide de V . Nous dirons que U est un sous-espace vectoriel de V si toutecombinaison linéaire d’éléments de U est aussi un élément de U.

Nous dirons alors que le sous-espace U est stable par combinaison li-néaire.

Remarque. La définition 1.2 implique que 0 soit un élément de toutsous-espace vectoriel (Pourquoi ?).

Exemple 1.4. Le sous-ensemble {0} est un sous-espace de tout espaceV et constitue un exemple de sous-espace trivial.

1.2.3 Bases et dimensions 5

Exemple 1.5. Soient u et v, deux vecteurs de R3 non nuls et noncolinéaires (c.-à-d. tels qu’il n’existe aucun scalaire α pour lequel u = αv).Alors le plan contenant à la fois les vecteurs u et v ramenés à l’origine estun sous-espace de R3.

Il existe une recette simple pour « fabriquer » des sous-espaces vectoriels.

Théorème 1.1 Soient V un espace vectoriel et A = {v1,v2, . . . ,vn},une famille quelconque de vecteurs de V. L’ensemble des combinaisons li-néaires des vecteurs v1,v2, . . . ,vn engendre un sous-espace vectoriel de V,dénoté Vect(A).

Remarques.

1. Par convention, si A = ∅, alors Vect(A) = {0}.2. Vect(A) est le plus petit sous-espace vectoriel contenant A.

3. A est un sous-espace vectoriel ssi Vect(A) = A.

Il est facile de démontrer que l’intersection U ∩V de deux sous-espacesissus d’un même espace vectoriel W constitue aussi un sous-espace de W.

De plus, si nous définissons la somme U + V des deux sous-espacescomme suit :

U + V = {u + v | u ∈ U,v ∈ V} (1.3)

alors la somme U + V constitue aussi un sous-espace de W.

1.2.3 Bases et dimensions

Il conviendra ici de rafraîchir la notion d’indépendance linéaire.

Définition 1.3 Un ensemble fini {v1,v2, . . . ,vn} de vecteurs distinctsest dit linéairement indépendant si aucun des vecteurs vi n’est une combi-naison linéaire des autres vecteurs. Dans le cas contraire, nous dirons queles vecteurs sont linéairement dépendants entre eux.

Remarques.

1. Il existe beaucoup de propositions qui sont équivalentes à la définition1.3. Nous retiendrons celle-ci : les vecteurs v1,v2, . . . ,vn sont linéaire-ment indépendants entre eux si :

α1v1 + α2v2 + · · ·+ αnvn = 0 =⇒ αi = 0, ∀i.


2. Si les vecteurs v1,v2, . . . ,vn contiennent le vecteur 0, alors ils sontautomatiquement linéairement dépendants.

Définition 1.4 Une famille de vecteurs {v1,v2, . . . ,vn} forme unebase d’un espace vectoriel V si les deux conditions suivantes sont remplies :

1. les vecteurs {v1,v2, . . . ,vn} sont linéairement indépendants.

2. les vecteurs {v1,v2, . . . ,vn} engendrent V,c.-à-d. Vect(v1,v2, . . . ,vn) = V.

La définition 1.4 équivaut à dire que tout élément v de V s’exprime defaçon unique en tant que combinaison linéaire des vecteurs de base, c.-à-d.qu’il existe toujours des α1, α2, . . . , αn ∈ K tels que :

v = α1v1 + α2v2 + · · ·+ αnvn

Dans Rn, il existe une infinité de bases admissibles. L’ensemble desn-uplets indépendants {(1, 0, . . . , 0), (0, 1, . . . , 0), . . . , (0, 0, . . . , 1)} forme unebase particulièrement simple qu’il convient d’appeler la base usuelle ou en-core la base canonique et qui sert à établir un repère cartésien.

Si l’ensemble des vecteurs de base est de cardinal fini n, nous disons quel’espace vectoriel est de dimension n ou encore que nous sommes en présenced’un espace n-dimensionnel. Tout ensemble de n + 1 vecteurs d’un espacen-dimensionnel est nécessairement linéairement dépendent.

Remarque. On peut démontrer que tout espace vectoriel, même ceux dedimension infinie, admet une (des) base(s) 2.

Exemple 1.6. Précisons la dimension des espaces vectoriels finis vusjusqu’à présent.

– L’espace Rn de l’exemple 1.1 est de dimension n.– L’espace Cn de l’exemple 1.2 est aussi de dimension n.– L’espaceMm,n de l’exemple 1.3 est de dimension mn.– L’espace {0} de l’exemple 1.4 est de dimension 0.– Le sous-espace décrit à l’exemple 1.5 est un espace de dimension 2 dont{u, v} constitue une base.

– Notons aussi que l’espace Pn des polynômes de degré égal ou inférieurà n est un espace vectoriel de dimension n + 1 et que les monômes{1, x, x2, . . . , xn} constituent une base de Pn.

2. Cette démonstration nécessite le lemme de Zorn, qui est une formulation équivalentede l’axiome du choix.

1.2.4 Applications linéaires et isomorphismes 7

Nous désignerons la dimension d’un espace V par dim V. Si dim V = n,alors pour tout sous-espace U de V, dim U 6 n.

De plus, si dim U = n, alors U = V.

Proposition 1.2 Soit V, un espace vectoriel de dimension finie n.Alors tout ensemble {v1,v1, . . . ,vn} de n vecteurs linéairement indépendantsest une base de V.

Définition 1.5 Un espace vectoriel V est la somme directe de ses sous-espaces V1,V2, . . . ,Vk, ce que nous dénoterons par :

V = V1 ⊕V2 ⊕ · · · ⊕Vk

ssi tout vecteur v ∈ V s’exprime de façon unique en tant que :

v = v1 + v2 + · · ·+ vk

où v1 ∈ V1,v2 ∈ V2, . . . ,vk ∈ Vk.

Proposition 1.3 Un espace vectoriel V est la somme directe des sessous-espaces V1,V2, . . . ,Vk ssi :

1. V = V1 + V2 + · · ·+ Vk

2. Vi ∩i 6=j

Vj = {0}

Remarque. Soient V un espace vectoriel et {B1, B2, . . . , Bk} une parti-tion quelconque d’une base de V. Alors,

V = Vect(B1)⊕Vect(B2)⊕ · · · ⊕Vect(Bk) (1.4)

1.2.4 Applications linéaires et isomorphismes

Cette section se veut essentiellement être un rappel terminologique.

Définition 1.6 Soient X et Y , deux ensembles non-vides. Une applica-tion F : X → Y est une règle qui fait correspondre à chaque élément x ∈ Xun unique élément y ∈ Y . Nous utiliserons le symbole 7→ pour indiquer cettecorrespondance unique et nous écrirons :

x 7→ y ou encore x 7→ F (x)

et dirons que y est l’ image de x (par F ) et que x est la pré-image de y.L’ensemble X est le domaine de F et l’ensemble Y son co-domaine.


Remarque. Lorsque le co-domaine est R ou C, nous préférerons le termefonction (réelle ou complexe selon le cas) à celui d’application. Nous utili-serons des caractères minuscules romains, par exemple f : X → C, pourdésigner les fonctions. Nous dirons que y est l’image de x par f si y = f(x).

Une application est dite injective, ou encore est une injection, si l’imagede chaque élément x ∈ X est unique. Autrement dit :

x 6= y ⇐⇒ F (x) 6= F (y)

Une application est dite surjective, ou encore est une surjection, si chaquey ∈ Y est l’image d’au moins un x ∈ X.

Une application est dite bijective, ou encore est une bijection, si elle està la fois injective et surjective.

Une application bijective F : X → Y est inversible, c.-à-d. qu’il existetoujours une application réciproque F−1 : Y → X qui soit elle aussi bijec-tive.

a

b

c

d

m

n

o

p

q

X Y

F

(a)

a

b

c

d

e

m

n

o

p

X Y

F

(b)

a

b

c

d

e

m

n

o

p

q

X Y

F �

� F−1

(c)

Figure 1.2 – (a) application injective mais non surjective (b) applicationsurjective mais non injective (c) application bijective (injective et surjective)

Nous nous limiterons aux applications dont le domaine et le co-domainepossèdent la structure d’espace vectoriel. Plus particulièrement, nous nousconcentrerons sur les applications linéaires.

1.2.4 Applications linéaires et isomorphismes 9

Définition 1.7 Soient (V,+, �) et (W, +, �), deux espaces vectoriels dé-finis sur un même corps K et F : V→W, une application quelconque. Nousdirons que F est une application linéaire si :

1. ∀u,v ∈ V, F (u + v) = F (u)+F (v)

2. ∀α ∈ K et ∀v ∈ V, F (αv) = αF (v)

Remarque. Les conditions 1 et 2 peuvent être condensées ainsi :

F (αu + βv) = αF (u)+βF (v)

De plus, il est toujours vrai que F (0V) = 0W (Pourquoi ?).

Note. Les lois de composition interne ne sont pas nécessairement iden-tiques pour les espaces vectoriels V et W ce qui, strictement, exigerait deconserver les notations différentes + et +. Il est d’usage toutefois de re-laxer cette contrainte et de n’utiliser qu’un seul symbole + dans les deux caspuisque le contexte ne porte pas à la confusion.

Convention. Lorsque le co-domaine de l’application linéaire est R ouC, nous utiliserons l’appellation forme linéaire plutôt que celle de fonctionlinéaire.

Une application linéaire est un exemple d’homomorphisme 3 d’espacesvectoriels. L’application linéaire respecte la structure algébrique d’espacevectoriel.

Si l’application linéaire est définie sur un seul et même espace vectoriel,F : V→ V, nous sommes en présence d’un endomorphisme.

Une application linéaire qui est aussi une bijection est un exemple d’iso-morphisme d’espaces vectoriels. Un endomorphisme bijectif est appelé unautomorphisme. La table 1.1 jette un peu de clarté sur cette nomenclaturequi peut prêter à confusion.

Dans ce premier chapitre, c’est la notion d’isomorphisme qui bénéficied’un traitement de faveur. En règle générale, si nous sommes en mesure detrouver une application linéaire bijective F , entre deux K-espaces vectorielsV et W, alors l’application F est un isomorphisme d’espaces vectoriels etnous dirons que les deux espaces sont isomorphes.

Convention. Nous utiliserons le symbole ∼= pour représenter le fait quedeux espaces vectoriels sont isomorphes, par exemple :

V ∼= W

3. Du grec, homos « même » et morphê « forme ».


Application linéaire F : V→W F : V→ VF

non bijective homomorphisme endomorphisme

bijective isomorphisme automorphisme

Table 1.1 – Une application linéaire est un homomorphisme d’espaces vec-toriels. Si l’application linéaire est bijective, alors les espaces vectoriels sontisomorphes

Deux espaces vectoriels isomorphes peuvent être considérés comme étantdeux réalisations différentes d’un même espace abstrait. « Être isomorphe à »est une relation d’équivalence, c.-à-d. à la fois réflexive (V ∼= V), symétrique(si V ∼= W alors W ∼= V) et transitive (si U ∼= V et V ∼= W alors U ∼= W).

Démontrons maintenant que tout K-espace vectoriel V de dimension nest isomorphe à Kn.

Exemple 1.7. Soit une base quelconque {v1,v2, . . . ,vn} de V. Puisquetout vecteur v ∈ V s’exprime d’une façon unique en tant que combinaisonlinéaire des vecteurs de base, nous pouvons toujours écrire :

v = α1v1 + α2v2 + · · ·+ αnvn (1.5)

où les αi ∈ K. Définissons F : V→ Kn par :

v 7→ (α1, α2, . . . , αn)

Nous établissons ainsi une correspondance unique entre tout vecteur de Vet le n-uplet de ses coordonnées relatives à la base choisie. À l’inverse, à toutn-uplet de Kn nous pouvons faire correspondre un vecteur de V à l’aide del’équation 1.5. La correspondance étant biunivoque, l’application F est doncune bijection 4. Par conséquent :

V ∼= Kn

4. Le n-uplet est alors un vecteur de coordonnées (relatif à la base choisie).

1.2.5 L’espace dual 11

Proposition 1.4 Deux K-espaces vectoriels V et W de dimension finiesont isomorphes ssi ils ont la même dimension.

Remarque. De cette dernière proposition, on retient que tous les espacesvectoriels de dimension finie n sont isomorphes entre eux. En d’autres termes,il n’existe, à un isomorphisme près, qu’un seul espace vectoriel de dimensionfinie n.

Une mise en garde serait maintenant appropriée. Le lieu géométrique desnombres complexes est le plan d’Argand (voir Fig. 1.10b) qui ressemble à s’yméprendre au plan cartésien à deux dimensions. Si l’application F : C→ R2

définie par :

z 7→ (<(z),=(z))

(où <(z) est la partie réelle de z et =(z) sa partie imaginaire) est effec-tivement une bijection, il serait malheureux d’en conclure hâtivement queC ∼= R2 et qu’ainsi l’espace vectoriel C est 2-dimensionnel 5. Le lecteurdevrait se convaincre que l’application F telle que définie n’est pas une ap-plication linéaire (Pourquoi ?) et que tout espace vectoriel K défini sur sonpropre corps K est unidimensionnel.

Convention. L’ensemble de tous les isomorphismes F : V → W estdénoté par LK(V,W) ou tout simplement par L(V,W). L’ensemble de tousles endomorphismes est dénoté par L(V) plutôt que par L(V,V).

1.2.5 L’espace dual

Il est souvent utile d’établir, en mathématiques, une relation biunivoqueentre deux familles d’objets mathématiques de nature possiblement très dif-férente. La notion de dualité a été forgée à partir de ce besoin. Le pointessentiel de cette section est de faire ressortir l’isomorphisme qui existe entreun espace vectoriel de dimension finie V et son espace dual 6 V∗.

5. Un risque de confusion existe car si R2 et C, pris en tant qu’espaces vectoriels nesont pas équivalents, par contre R2 et C, pris en tant qu’espaces métriques le sont (voirl’exemple 1.12.

6. Il est question ici d’espace dual algébrique. Une notion apparentée qui s’applique auxespaces vectoriels topologiques, est celle d’espace dual topologique, V′, qui est l’ensemblede toutes les formes linéaires continues Lc(V,K). En dimension finie, les deux notionscoïncident. En dimension infinie, V′ est un sous-espace vectoriel strict de V∗.


Définition 1.8 Soit un K-espace vectoriel V de dimension finie. SoitL(V,K), l’ensemble de toutes les formes linéaires f : V → K. Dotons cetensemble d’une loi de composition interne additive et d’une loi de compositionexterne multiplicative :

∀f, g ∈ L(V,K), (f + g)(v) = f(v) + g(v)∀α ∈ K,∀f ∈ L(V,K), (αf)(v) = αf(v)

Alors L(V,K) est lui aussi un K-espace vectoriel que nous appelleronsl’espace dual (algébrique) de V et que nous dénoterons par V∗.

Convention. Selon la définition 1.8, V∗ est un espace vectoriel bona fideet ses éléments sont des « vecteurs » qui méritent d’être dénotés par descaractères gras. Nous utiliserons l’alphabet grec pour désigner les formeslinéaires de l’espace dual, par exemple φ, ψ ∈ V∗, du moins jusqu’à ce quenous adoptions la notation de Dirac.

Remarque. Intuitivement toutefois, il semble opérationnellement justi-fiable de maintenir une différence entre un espace de vecteurs d’une part etun espace de formes linéaires de l’autre. C’est pourquoi, si nous continueronsd’appeler vecteurs les éléments de V, à partir de maintenant, les élémentsde l’espace dual V∗ seront désignés par l’appellation covecteurs 7.

Théorème 1.5 Soit un K-espace vectoriel V de dimension finie n et{v1,v2, . . . ,vn} une base de V. Soit de plus {φ1,φ2, . . . ,φn} un ensemblede covecteurs de l’espace dual V∗ tels que :

∀i, j = 1, . . . , n φi(vj) = δij =

{1 si i = j

0 si i 6= j(1.6)

Alors {φ1,φ2, . . . ,φn} est une base de V∗.

Remarques.

1. On dit que la base {φ1,φ2, . . . ,φn} de covecteurs de V∗ est la baseduale des vecteurs {v1,v2, . . . ,vn} de V.

7. Cette distinction est justifiée par le fait que les coordonnées des vecteurs et descovecteurs se transforment de façon inverse : de façon contravariante pour les premiers etde façon covariante pour les seconds.

1.3 Les espaces pré-hilbertiens 13

2. Le symbole δij est le delta de Kronecker. En pratique, il arrive souventqu’un des indices est fixe (indice réel) alors que l’autre varie librement(indice muet). Un exemple typique de l’utilisation du delta de Krone-cker dans une sommation (ici l’indice j est réel) serait :

∑i

aiδij = aj

Une conséquence directe du théorème 1.5 est que l’espace V∗ est lui aussin-dimensionnel et donc isomorphe à V :

V ∼= V∗

Puisque les espaces de dimension finie V et V∗ sont isomorphes, il existetoujours une correspondance biunivoque entre leurs éléments. Nous verronsque si l’espace V est un espace pré-hilbertien, il est possible d’établir cettecorrespondance biunivoque à l’aide du produit scalaire. La méthode s’étendaux espaces de dimension infinie, mais cette fois l’isomorphisme est établientre V et son dual topologique V′.

1.3 Les espaces pré-hilbertiens

Pour le lecteur pressé qui désire acquérir le minimum de notions néces-saires à une compréhension rapide de l’informatique quantique, cette sectionest sans doute la plus importante du chapitre. Il devra toutefois souffrir unedéfinition redondante du produit scalaire dont le seul but est de faire ressortirles différences qui existent entre les cas réel et complexe.

1.3.1 Le produit scalaire

Il est grand temps de doter nos espaces vectoriels d’un produit scalaire,ce qui nous permettra d’introduire la notion d’orthogonalité. Commenconspar définir le produit scalaire euclidien.


Définition 1.9 Soit V un espace vectoriel sur le corps des réels R.L’application 〈· , ·〉 :

〈· , ·〉 : V ×V→ R

qui vérifie les conditions suivantes :

∀u,v,w ∈ V 〈u ,v + w〉 = 〈u ,v〉+ 〈u ,w〉 (1.7a)∀u,v ∈ V, ∀α ∈ R 〈u , αv〉 = α〈u ,v〉 (1.7b)∀u,v ∈ V 〈u ,v〉 = 〈v ,u〉 (1.7c)∀v ∈ V 〈v ,v〉 > 0 (1.7d)∀v ∈ V 〈v ,v〉 = 0 =⇒ v = 0 (1.7e)

est un produit scalaire euclidien sur V.

Les équations 1.7a, 1.7b et 1.7c peuvent être combinées pour donner :

〈u , αv + βw〉 = 〈u , αv〉+ 〈u , βw〉 = α〈u ,v〉+ β〈u ,w〉 (1.8a)

et〈αv + βw ,u〉 = 〈u , αv + βw〉 = 〈u , αv〉+ 〈u , βw〉

= α〈u ,v〉+ β〈u ,w〉 = α〈v ,u〉+ β〈w ,u〉(1.8b)

Nous voyons bien que l’application 〈· , ·〉 est linéaire relativement à cha-cunes de ses variables ; nous disons alors que 〈· , ·〉 est une forme bilinéaire.Par 1.7c, 〈· , ·〉 est symétrique, par 1.7d et 1.7e, 〈· , ·〉 est définie positive.

En conclusion, le produit scalaire euclidien est une forme bilinéaire, sy-métrique et définie positive.

L’inégalité de Cauchy-Schwartz découle directement des conditions im-posées au produit scalaire :

|〈u ,v〉|2 6 〈u ,u〉〈v ,v〉 (1.9)

Remarque. Le symbole de valeur absolue dans le membre de gauche del’inégalité est superflu puisque nous avons affaire ici à un produit scalaireeuclidien ; nous le conservons quand même par souçi de compatibilité avecle produit scalaire hermitien où il sera alors interprété comme le module dunombre complexe 〈u |v 〉.

Définition 1.10 Nous dirons que deux vecteurs u et v sont orthogo-naux si :

〈u ,v〉 = 0

La relation d’orthogonalité entre deux vecteurs s’exprime aussi symbolique-ment par u ⊥ v.

1.3.1 Le produit scalaire 15

La définition 1.10 implique que le vecteur 0 est orthogonal à tout vecteurde V.

Remarque. Le fait que 〈u ,w〉 = 〈v ,w〉 n’implique pas nécessairementque u = v mais bien que u− v ⊥ w.

Soient u = (u1, u2, . . . , un) et v = (v1, v2, . . . , vn), deux n-uplets de Rn.Le produit scalaire canonique sur Rn est défini par :

〈u ,v〉 = u1v1 + u2v2 + · · ·+ unvn (1.10)

Il est facile de démontrer que les conditions 1.7a à 1.7e sont bien remplies.

Puisque 〈u ,u〉 et 〈v ,v〉 sont des quantités réelles positives pour desvecteurs u et v non-nuls, nous pouvons reformuler l’inégalité de Cauchy-Schwartz en extrayant la racine carrée de 1.9 :

0 6 |〈u ,v〉| 6√〈u ,u〉

√〈v ,v〉 (1.11a)

− 1 6〈u ,v〉√

〈u ,u〉√〈v ,v〉

6 1 (1.11b)

Cette dernière inégalité sert à définir l’angle entre deux vecteurs non-nuls :

θ = arccos〈u ,v〉√

〈u ,u〉√〈v ,v〉

(1.12)

où 0 6 θ 6 π, (θ est un angle saillant non-orienté).

La définition du produit scalaire hermitien se poursuit selon des lignessimilaires mais accuse toutefois des différences notables. Les identités de basedes nombres complexes sont énumérées au médaillon de la Fig. 1.11. Voicipar ailleurs un bref rappel terminologique :

– z∗ est le conjugué complexe de z– |z| est le module 8 de z

8. La notation |z| est utilisée aussi bien pour les nombres complexes que pour lesnombres réels. Dans ce dernier cas, elle signifie une valeur absolue.


Définition 1.11 Soit V un espace vectoriel sur le corps des nombrescomplexes C. L’application 〈 · | · 〉 :

〈 · | · 〉 : V ×V→ C


∀u,v,w ∈ V 〈u |v + w 〉 = 〈u |v 〉+ 〈u |w 〉 (1.13a)∀u,v ∈ V, ∀α ∈ C 〈u |αv 〉 = α〈u |v 〉 (1.13b)∀u,v ∈ V 〈u |v 〉 = 〈v |u 〉∗ (1.13c)∀v ∈ V 〈v |v 〉 ∈ R et 〈v |v 〉 > 0 (1.13d)∀v ∈ V 〈v |v 〉 = 0 =⇒ v = 0 (1.13e)

est un produit scalaire hermitien sur V.

Remarque. La première chose à noter est que la forme 〈 · | · 〉 n’est plussymétrique à proprement parler mais possède plutôt la propriété de symétriehermitienne (1.13c). La deuxième chose à noter est que 〈 · | · 〉 n’est plus uneforme bilinéaire. En effet, en combinant 1.13a, 1.13b et 1.13c, nous obtenons :

〈u |αv + βw 〉 = 〈u |αv 〉+ 〈u |βw 〉 = α〈u |v 〉+ β〈u |w 〉 (1.14a)

et

〈αv + βw |u 〉 = 〈u |αv + βw 〉∗ =[〈u |αv 〉+ 〈u |βw 〉

]∗=[α〈u |v 〉+ β〈u |w 〉

]∗= α∗〈u |v 〉∗ + β∗〈u |w 〉∗

= α∗〈v |u 〉+ β∗〈w |u 〉(1.14b)

Nous sommes maintenant en présence d’une forme qui est linéaire parrapport à la deuxième variable et semi-linéaire par rapport à la première.Nous dirons alors que le produit scalaire hermitien est une forme sesquili-néaire 9.

La sesquilinéarité permet de préserver la positivité du produit scalairehermitien. En effet, ∀v ∈ V :

〈 iv | iv 〉 = i∗i〈v |v 〉 = −i2〈v |v 〉 = 〈v |v 〉

9. Cette expression veut dire de façon très littérale : une fois et demie linéaire.

1.3.1 Le produit scalaire 17

Une forme bilinéaire aurait plutôt donné 〈 iv | iv 〉 = −〈v |v 〉, nous grati-fiant d’un signe moins particulièrement fâcheux. Enfin, la mention explicite〈v |v 〉 ∈ R en 1.13d n’est qu’une instance de renforcement positif puisquepar 1.13c, nous avons toujours 〈v |v 〉 = 〈v |v 〉∗, ce qui constitue la défini-tion même d’un nombre réel.

Convention. La définition de sesquilinéarité donnée plus haut est celleque l’on retrouve habituellement dans les textes de physique. Les ouvragesmathématiques inversent la plupart du temps l’ordre des variables, soit li-néaire par rapport à la première et semi-linéaire par rapport à la seconde.Dans cet ouvrage, nous nous en tiendrons à la convention utilisée en phy-sique.

En résumé, le produit scalaire hermitien est une forme sesquilinéaire,hermitienne et définie positive.

Le produit scalaire hermitien satisfait lui aussi à l’inégalité de Cauchy-Schwartz :

|〈u |v 〉|2 6 〈u |u 〉〈v |v 〉 (1.15)

Remarquez que, contrairement à la formule 1.9, les barres verticales sontmaintenant obligatoires puisque, pour un produit scalaire hermitien, 〈u |v 〉est généralement un nombre complexe. Le membre de gauche de l’inégalité1.15 représente donc le carré du module du nombre complexe 〈u |v 〉, soit〈u |v 〉〈u |v 〉∗ (voir l’identité 7 du médaillon de la Fig. 1.11).

Le produit scalaire canonique sur Cn est défini par :

〈u |v 〉 = u∗1v1 + u∗2v2 + · · ·+ u∗nvn (1.16)

Si la notion d’orthogonalité demeure valide pour deux vecteurs d’un es-pace vectoriel hermitien, ce n’est plus le cas pour la notion d’angle puisquele numérateur de l’expression :

〈u |v 〉√〈u |u 〉

√〈v |v 〉

n’est plus nécessairement un nombre réel. Il est toujours permis d’utiliser lesymbole u ⊥ v, mais cela ne saurait insinuer d’aucune façon que les vecteursfont un angle droit entre eux.

Définition 1.12 Un espace vectoriel V doté d’un produit scalaire estun espace pré-hilbertien ( V, 〈 · | · 〉 ).


Convention. Nous n’avons plus de raisons de maintenir artificiellementdeux notations différentes pour indiquer d’une part un produit scalaire eucli-dien 〈· , ·〉 et de l’autre un produit scalaire hermitien 〈 · | · 〉. Désormais, seulela notation 〈u |v 〉 10 aura cours légal.

Dans un espace pré-hilbertien, le produit scalaire nous permet toujoursd’établir une correspondance biunivoque entre les vecteurs de V et les formeslinéaires de l’espace dual V∗.

Théorème 1.6 Soit V, un K-espace pré-hilbertien de dimension finieet V∗, son dual algébrique.

Alors pour toute forme linéaire φ ∈ V∗, il existe un unique vecteur u ∈ Vtel que :

φ(v) = 〈u |v 〉, ∀v ∈ V

Ainsi, dans un espace pré-hilbertien de dimension finie, à tout vecteur ude l’espace V correspond un unique covecteur φu ≡ 〈u | · 〉 de V∗ et vice-versa 11.

1.4 Les espaces vectoriels normés

Les espaces pré-hilbertiens vus jusqu’à présent demeurent des structuresalgébriques plutôt limitées car, outre l’addition vectorielle et la multiplicationscalaire, tout ce qu’ils nous permettent de faire, c’est de vérifier l’orthogona-lité de ses éléments, pris deux à deux. Même la notion de « grandeur » d’unvecteur s’y trouve absente.

Mais il ne faudrait pas sous-estimer la riche potentialité de l’espace pré-hilbertien. En effet, le produit scalaire permet d’induire une norme qui elle-même induit une métrique qui elle-même génère une topologie de sorte qu’enun clin d’oeil nous nous retrouvons avec une structure complexe qui supportede nombreuses applications.

C’est cet enchaînement que nous nous proposons d’étudier, en commen-çant par la notion de norme qui nous permettra de définir une « grandeur »pour chaque vecteur de l’espace.

10. Cette notation a l’avantage d’être compatible avec la notation de Dirac (section 1.8).11. Cette « notation » peu orthodoxe n’a pour but que de fixer les idées et sera supplan-

tée par celle de Dirac, dans laquelle un covecteur est simplement représenté par φu ≡ 〈u |.

1.4 Les espaces vectoriels normés 19

Définition 1.13 Soit V, un espace pré-hilbertien sur le corps des com-plexes. L’application ‖ · ‖ :

‖ · ‖ : V→ R


∀v ∈ V ‖v ‖ > 0 (1.17a)∀v ∈ V ‖v ‖ = 0 =⇒ v = 0 (1.17b)∀v ∈ V,∀α ∈ C ‖αv ‖ = |α| ‖v ‖ (1.17c)∀u,v ∈ V ‖u + v ‖ 6 ‖u ‖+ ‖v ‖ (1.17d)

est une norme sur V et (V, ‖ · ‖) est un espace vectoriel normé.

Remarque. Par 1.17a et 1.17b, la norme est une forme définie positive.Cependant, cette forme n’est pas linéaire, mais respecte plutôt l’inégalité deMinkowski 12 (1.17d).

Remarque. L’inégalité 1.17a n’est pas indépendante car elle peut êtredéduite des trois conditions subséquentes. D’abord, on constate que l’impli-cation dans la condition 1.17b est valide dans les deux sens. En effet, puisque∀v ∈ V, on a 0 = 0v, alors la condition 1.17c nous donne :

‖0 ‖ = ‖ 0v ‖ = |0|‖v ‖ = 0

Par la suite, on a que ∀v ∈ V :

0 = ‖0 ‖ = ‖v − v ‖ 6 ‖v ‖+ ‖−v ‖ par 1.17b et 1.17d6 ‖v ‖+ | − 1| ‖v ‖ par 1.17c6 2 ‖v ‖

d’où il est clair que ‖v ‖ > 0. Son inclusion n’est qu’une simple mesure derenforcement.

Définition 1.14 Tout vecteur v dont la norme est de grandeur unité :

‖v ‖ = 1

est appelé vecteur unitaire.

On peut associer une norme à tout produit scalaire. Pour cela, il suffitde prendre :

‖v ‖ =√〈v |v 〉 (1.18)

12. Communément appelée inégalité triangulaire.


Remarque. Cette définition de la norme est consistante puisque par1.13d, 〈v |v 〉 est toujours un réel défini positif.

Cette norme associée donne à l’inégalité de Cauchy-Schwartz 1.11a saforme la plus élégante :

|〈u |v 〉| 6 ‖u ‖ ‖v ‖ (1.19)

Les conditions 1.17a, 1.17b et 1.17c sont immédiatement vérifiées. L’in-égalité de Minkowski se démontre facilement à l’aide de l’inégalité de Cauchy-Schwartz (qui ne dépend que de l’existence d’un produit scalaire).

Démonstration.

‖u + v ‖2 = 〈u + v |u + v 〉= 〈u |u 〉+ 〈u |v 〉+ 〈v |u 〉+ 〈v |v 〉= ‖u ‖2 + 〈u |v 〉+ 〈u |v 〉∗ + ‖v ‖2

= ‖u ‖2 + 2< ( 〈u |v 〉 ) + ‖v ‖2 par 1B-4g

6 ‖u ‖2 + 2 |< ( 〈u |v 〉 )|+ ‖v ‖2

Mais puisque pour tout nombre complexe z, nous avons |<(z)| 6 |z|,

‖u + v ‖2 6 ‖u ‖2 + 2|〈u |v 〉|+ ‖v ‖2

6 ‖u ‖2 + 2‖u ‖‖v ‖+ ‖v ‖2 par 1.19

6 (‖u ‖+ ‖v ‖)2

Extrayant la racine carrée des deux côtés, nous retrouvons l’inégalité deMinkowski.

La troisième ligne de la démonstration ci-dessus contient le germe duthéorème de Pythagore :

〈u |v 〉 = 0 =⇒ ‖u + v ‖2 = ‖u ‖2 + ‖v ‖2

La norme dérivant du produit scalaire usuel sur Rn est appelée normeeuclidienne,

‖v ‖ =√v21 + v2

2 + · · ·+ v2n (1.20)

et la norme dérivant du produit scalaire usuel sur Cn est appelée normehermitienne.

‖v ‖ =√v∗1v1 + v∗2v2 + · · ·+ v∗nvn =

√|v1|2 + |v2|2 + · · ·+ |vn|2 (1.21)

1.4 Les espaces vectoriels normés 21

Si à tout produit scalaire nous pouvons associer une norme, l’inverse parcontre n’est pas nécessairement vrai. Par exemple, la norme uniforme ‖ · ‖∞,appliquée ici à un vecteur de coordonnées :

‖v ‖∞ = supi|vi| (1.22)

ne dérive d’aucun produit scalaire.Il est facile de démontrer qu’une norme dérivant d’un produit scalaire

hermitien doit respecter l’identité du parallélogramme :

‖u + v ‖2 + ‖u− v ‖2 = 2( ‖u ‖2 + ‖v ‖2 ) (1.23)

Si tel est le cas et que pour tout vecteur v la valeur ‖v ‖ correspon-dante est connue, l’identité de polarisation permet de reconstituer le produitscalaire hermitien :

〈u |v 〉 =14

( ‖u + v ‖2 − ‖u− v ‖2 + i ‖u + iv ‖2 − i ‖u− iv ‖2 ) (1.24)

La norme dérivant d’un produit scalaire 1.18 est unique. À l’inverse, unenorme qui respecte l’identité du parallélogramme 1.23 détermine un produitscalaire 1.24 qui est unique lui aussi.

Deux normes différentes définies sur un même espace vectoriel sont tou-tefois considérées équivalentes si elles engendrent une même topologie sur cetespace 13. Le critère suivant est utilisé pour déterminer l’équivalence entre lesnormes.

Définition 1.15 Soit V un espace vectoriel et ‖ · ‖1, ‖ · ‖2, deux normesdifférentes sur ce même espace. Ces normes sont dites équivalentes s’il existedes nombres réels α, β > 0 tels que :

α‖v ‖1 < ‖v ‖2 < β‖v ‖1

∀v ∈ V.

Note. On démontre que, pour un R-espace vectoriel ou un C-espace vec-toriel normé de dimension finie, toutes les normes sont équivalentes, qu’ellessoient induites par un produit scalaire ou non. Ce n’est pas le cas pour unespace de dimension infinie.

13. Les notions de topologie et d’espace topologique sont expliquées à l’annexe 1.C.


1.5 Les espaces métriques

Un espace métrique est un couple (X, d) où X est un ensemble quel-conque, pas nécessairement un espace vectoriel, et d est une fonction quidéfinit une notion de « distance » entre chaque paire d’éléments de X.

Définition 1.16 Soit X un ensemble non vide. La fonction d(·, ·) :

d(·, ·) : X ×X → R


∀x, y ∈ X d(x, y) > 0 (1.25a)∀x, y ∈ X d(x, y) = 0 ⇐⇒ x = y (1.25b)∀x, y ∈ X d(x, y) = d(y, x) (1.25c)∀x, y, z ∈ X d(x, y) 6 d(x, z) + d(z, y) (1.25d)

est une métrique ou distance sur X et (X, d) est un espace métrique.

Remarque. L’inégalité 1.25a n’est pas indépendante car elle peut êtredéduite des trois conditions subséquentes. En effet,

0 = d(x, x) 6 d(x, y) + d(y, x) par 1.25b et 1.25d6 2 d(x, y) par 1.25c

d’où il est clair que d(x, y) > 0. Son inclusion n’est qu’une simple mesure derenforcement.

Note. Il est possible de doter n’importe quel ensemble X d’une métriqueen utilisant la distance triviale (espace métrique trivial) :

d(x, y) =

{1 si x 6= y

0 si x = y

Aussi, il est possible de définir plusieurs métriques sur un même ensemble.Par exemple, la métrique suivante :

d0(x, y) =d(x, y)

1 + d(x, y)

limite la distance entre deux points à l’intervalle semi-ouvert [0,1).

1.5 Les espaces métriques 23

Un espace métrique (X, d) est une instance d’un espace plus général, soitun espace topologique. Les éléments d’un espace topologique sont générale-ment appelés tout simplement des points.

Une boule ouverte est un sous-ensemble particulier d’un espace métrique,très utile pour construire une topologie sur l’espace.

Définition 1.17 Soit x, un point quelconque de l’espace métrique (X, d)et r > 0, un nombre réel quelconque. L’ensemble de tous les points qui sontsitués à une distance de x qui soit inférieure à r forme une boule ouverteB(x, r) de centre x et de rayon r :

B(x, r) = {y | d(x, y) < r, r > 0}

Si l’ensemble X possède la structure d’espace vectoriel, les « points » del’espace métrique (X, d) se confondent avec les vecteurs de X. L’additionvectorielle permet alors « l’addition de points » dans (X, d), ce qui n’est pastoujours le cas pour un espace métrique plus général (X, d). Si, de plus,l’espace vectoriel est normé, alors la norme à son tour induit une métrique :

d(x,y) = ‖x− y ‖ (1.26)

Il est alors trivial de vérifier que cette métrique associée à la normesatisfait à toutes les conditions de la définition 1.16 et qu’elle possède enplus la propriété d’invariance translationnelle :

∀x,y, z ∈ X, d(x + z,y + z) = d(x,y) (1.27)

La métrique associée à la norme euclidienne 1.20 dans Rn est évidemmentla métrique ou distance euclidienne :

d(x,y) =√

(x1 − y1)2 + · · ·+ (xn − yn)2 =

√√√√ n∑i=1

(xi − yi)2 (1.28)

Selon 1.27, cette distance est indépendante du choix de l’origine. De plus,on démontre que cette distance est invariante pour une rotation quelconquedu système de coordonnées.

Un vecteur dont l’origine se confond avec l’origine du repère cartésien estappelé vecteur position. Dans un espace métrique Rn, la norme d’un vecteurposition est donc égale à la distance euclidienne entre l’extrémité du vecteurposition et l’origine du repère (soit le vecteur 0).


0 1 2

1

2

(x1, x2)

(y1, y2)

R2

√(y1 − x1)2 + (y2 − x2)2 < r

0 1 2

i

2i

z1

z2

C

√|z2 − z1|2 < r

r

(a)

r

(b)

Figure 1.3 – Boules ouvertes a) dans R2 b) dans C

d(x,0) =√

(x1 − 0)2 + · · ·+ (xn − 0)2 =√x2

1 + · · ·+ x2n = ‖x ‖

La métrique ou distance hermitienne associée à la norme hermitienne1.21 dans Cn est définie de façon analogue :

d(x,y) =√

(x1 − y1)∗(x1 − y1) + · · ·+ (xn − yn)∗(xn − yn)

=

√√√√ n∑i=1

|xi − yi|2(1.29)

Lorsque la métrique est associée à une norme, cette dernière suffit àrendre convenablement la notion de « distance ». Par exemple, la boule ou-verte B(x, r) peut être redéfinie de façon équivalente :

B(x, r) = {y : ‖y − x ‖ < r, r > 0} (1.30)

La Fig. 1.3 illustre le concept de boule ouverte dans les espaces R2 etC où la métrique utilisée est respectivement euclidienne et hermitienne. Lagénéralisation à des espaces de dimension finie n ne pose aucun problème.

Ceci complète la révision des notions d’algèbre linéaire sur les espacesde dimension finie. Le lecteur désireux d’approfondir les fondements mathé-matiques de la mécanique quantique est invité à poursuivre la lecture des

1.6 Les espaces de Hilbert de dimension infinie 25

prochaines sections, notées par un astérisque, qui traitent en détail des as-pects plus techniques de l’espace de Hilbert.

Le lecteur plus pressé peut se donner bonne conscience en consultantl’encadré intitulé "Sommaire exécutif" pour un briefing éclair avant de passerdirectement à la section 1.6.5 qui traite des bases hilbertiennes.

Sommaire exécutif

– Tous les espaces vectoriels de même dimension finie sont iso-morphes.

– Toutes les normes définies sur un même espace vectoriel de di-mension finie sont équivalentes.

– Les normes équivalentes engendrent toutes une même topologie.– Tous les espaces pré-hilbertiens de dimension finie dotés de la

topologie usuelle sont séparables.– Tous les espaces pré-hilbertiens de dimension finie sont complets.– Tous les espaces de Hilbert séparables de dimension infinie sont

isomorphes.– L’espace du qubit est C2.– Aucune équation vue jusqu’à présent n’est plus importante que

celle du produit scalaire hermitien canonique :

〈u |v 〉 = u∗1v1 + u∗2v2 + · · ·+ u∗nvn

1.6 Les espaces de Hilbert de dimension infinie

Dans un espace de dimension infinie, les considérations algébriques nesuffisent plus et nous devons obligatoirement faire appel à l’analyse.

1.6.1 Topologie usuelle sur les espaces métriques*

Note. Si les espaces métriques peuvent accélérer l’apprentissage des no-tions topologiques, il demeure que les résultats obtenus ne sont pas toujoursvalides pour des espaces plus généraux. D’un point de vue pédagogique, ilest préférable d’introduire ces notions en évitant sciemment de faire appel àune métrique quelconque. C’est ce que nous avons fait à l’annexe 1.C où l’onretrouvera toutes les définitions de base. Veuillez prendre note que nous fe-rons fréquemment référence aux résultats généraux de l’annexe tout au long


de cette section.

En nous servant de Rn comme exemple, nous entendons maintenant dé-finir une topologie « standard » sur tout espace métrique. Il s’agit de latopologie usuelle, soit celle qui sera généralement sous-entendue lorsque l’ontravaillera dorénavant avec tout espace métrique.

Tous les ouverts de cette topologie proviennent de l’union de boules ou-vertes dont nous reprenons ici la définition :

B(x, r) = {y | d(x, y) < r, r > 0}

Nous affirmons que l’ensemble de toutes les boules ouvertes B(x, r), oùx ∈ Rn et r > 0 constitue une base topologique de l’espace Rn.

Remarquez que, puisque r est strictement plus grand que zéro, la topologieusuelle n’admet aucun point isolé 14 ; toute boule ouverte contient une infinité(non dénombrable) de points.

Nous allons démontrer, dans un premier temps, que pour tout point ap-partenant à une boule ouverte, il existe une autre boule ouverte contenantce point, elle-même contenue dans la première. Soit un point quelconquey ∈ B(x, r). Alors, par définition, d(x, y) < r. Posons

r′ = r − d(x, y) > 0

et démontrons que B(y, r′) ⊆ B(x, r).Supposons que z ∈ B(y, r′). Alors d(y, z) < r′ = r − d(x, y), de sorte

que :d(x, y) + d(y, z) < r

Il en découle, par 1.25d, que d(x, z) < r, ou encore que z ∈ B(x, r) etpar conséquent, que B(y, r′) ⊆ B(x, r) (voir Fig. 1.4).

Avec ce résultat, nous avons fait d’une pierre deux coups. Nous avons dé-montré que le choix de la boule ouverte en tant qu’ouvert pour la topologieusuelle est logiquement consistant puisque par la proposition 1C.1, une bouleouverte est bien un voisinage de chacun de ses points. D’autre part, le théo-rème 1C.5 confirme que l’ensemble de toutes les boules ouvertes constituebien une base topologique de Rn.

Pour se donner bonne conscience, nous allons prouver que l’ensemblede toutes les boules ouvertes respecte bien les axiomes qui définissent unetopologie. Par le théorème 1C.6, Rn et ∅ appartiennent bien à la topologieusuelle puisque l’union de tous les éléments de la base est un recouvrement

14. Un point x est un point isolé si le singleton {x} est un ouvert.

1.6.1 Topologie usuelle sur les espaces métriques* 27

x

y

z

r

r′

B(x, r)

B(y, r′)

Figure 1.4 – Toute boule ouverte B(x, r) est un voisinage de chacun de sespoints.

ouvert de l’espace et l’intersection de deux boules disjointes donne l’ensemblevide.

Démontrer que l’union de deux boules ouvertes (ou même une unionquelconque de boules ouvertes) donne aussi un ouvert ne présente aucunedifficulté.

Nous poursuivons en démontrant que l’intersection de deux boules ou-vertes donne bien un ouvert. Soient deux boules ouvertes B(a, r1) et B(b, r2).Supposons que les deux deux boules ne soient pas disjointes et soit x, un pointquelconque de B(a, r1)∩B(b, r2). Alors x ∈ B(a, r1) et par ce qui précède, ilexiste une boule ouverte B(x, r′1) telle que B(x, r′1) ⊆ B(a, r1). D’une façontoute similaire, nous avons aussi que B(x, r′2) ⊆ B(b, r2). De deux chosesl’une : ou bien nous avons r′1 6 r′2 ou bien r′2 6 r′1. Supposons, sans perte degénéralité, que r′1 6 r′2. Alors, B(x, r′1) ⊆ B(x, r′2) ⊆ B(b, r2).

Puisque B(x, r′1) ⊆ B(a, r1) et B(x, r′1) ⊆ B(b, r2), il en découle queB(x, r′1) ⊆ B(a, r1) ∩B(b, r2). En posant r′1 = r, nous venous de démontrerque tout point x appartenant à l’intersection de deux boules ouvertes appar-tient aussi à une boule ouverte elle-même entièrement contenue dans laditeintersection (voir Fig. 1.5) :

x ∈ B(x, r) ⊆ B(a, r1) ∩B(b, r2)

Puisque x est quelconque, l’intersection de deux boules ouvertes est un voi-sinage de chacun de ses points, donc un ouvert.

Ce résultat peut être étendu à toute intersection finie de boules ouvertes.Remarquez que l’intersection quelconque de boules ouvertes ne donne pas


a bx

B(a, r1) B(b, r2)

B(x, r)

Figure 1.5 – Si le point x est tel que x ∈ B(a, r1) et x ∈ B(b, r2), alors ilexiste une boule ouverte B(x, r) telle que B(x, r) ⊆ B(a, r1) ∩B(b, r2).

nécessairement un ouvert. Par exemple, l’intersection des boules ouvertesappartenant à la famille {B(x, 1

n) | n ∈ N} donne le singleton {x} qui n’estpas un ouvert 15.

La base constituée de l’ensemble de toutes les boules ouvertes engendreune topologie unique que nous désignerons par Td pour souligner le fait queles ouverts de la base sont tributaires d’une métrique 16. Notons que le choixde la métrique détermine aussi la forme géométrique des ouverts de cettebase (voir Fig. 1.6). Mais indépendamment de l’allure de la boule ouverteunitaire, nous entenderons toujours par (X, Td) un espace métrique doté dela topologie usuelle.

(a) (b) (c)

−1 1

1

−1

−1 1

1

−1

−1 1

1

−1

Figure 1.6 – En (a), la métrique est d1(x, y) = |x1 − x2| + |y1 − y2|. En(b) la métrique est euclidienne, soit d2(x, y) =

√(x1 − x2)2 + (y1 − y2)2.

En (c), on a d∞(x, y) = sup{|x1 − x2|, |y1 − y2|}. La boule ouverte unitaireB( (0, 0), 1) dans R2 est tracée pour chacun des cas.

15. En fait, on peut démontrer que le singleton {x} est un fermé de la topologie usuelle.16. On dit alors que Td est la topologie engendrée par la métrique d.

1.6.1 Topologie usuelle sur les espaces métriques* 29

Notons en particulier que pour la droite des réels R, la base de la topologieusuelle consiste de l’ensemble de tous les intervalles ouverts de type (a, b) oùa < b et, pour le plan R2, de l’ensemble de tous les cercles ouverts.

Nous allons maintenant reprendre certaines notions de topologie généralepour en tirer des caractérisations spécifiques aux espaces métriques munis dela topologie usuelle, en commencant par la notion de continuité locale. En seréférant à la remarque qui suit la définition 1C.9, l’expression « l’applicationF est continue en a ssi la préimage de tout voisinage de F (a) est un voisinagede a » se traduit dans le langage des espaces métriques par « la préimage detoute boule ouverte BY (F (a), r2) contient une boule ouverte BX(a, r1) ». Enanalyse, il est courant de poser r1 = δ et r2 = ε, de sorte que la définition dela continuité en un point d’une application prend la formulation delta-epsilonbien connue :

Définition 1.18 Soient deux espaces métriques (X, Td1) et (Y, Td2) etsoit F : X → Y , une application quelconque.

Nous dirons que F est continue en a ∈ X ssi :

∀ε, ∃δ tel que d1(x, a) < δ =⇒ d2(F (x), F (a)) < ε

L’application F est continue partout sur X si elle est continue en tout pointa ∈ X.

Pour le lecteur qui a étudié les fonctions réelles de la variable réelle, nousfaisons remarquer que la distance euclidienne sur R se réduit à la valeurabsolue. Dans ce contexte, la continuité en un point a d’une fonction fprend l’allure familière suivante :

∀ε,∃δ tel que |x− a| < δ =⇒ |f(x)− f(a)| < ε

Nous verrons un peu plus loin qu’il est possible de faire encore mieuxet de donner une caractérisation séquentielle de la continuité locale pour lesespaces métriques 17.

Dans un espace métrique, nous avons aussi le loisir de caractériser lanotion de convergence à l’aide de la métrique. Le fait que toute boule ouverteB(x, ε) doit contenir tous les éléments de la suite (xn)n∈N sauf, au maximum,un nombre fini, se traduit par :

17. Ceci est possible dû au fait que les espaces métriques vérifient automatiquement lepremier axiome de dénombrabilité.


Définition 1.19 Soit (X, Td), un espace métrique. Nous dirons que lasuite (xn)n∈N converge vers le point x ∈ X ssi :

∀ε > 0,∃N ∈ N tel que d(x, xn) < ε ∀n > N

Remarque. De façon générale, plus petite est la valeur de ε, plus grandeest la valeur correspondante de N et il est coutumier de reconnaître cettedépendance en écrivant explicitement N(ε).

Pour terminer, voici un exemple instructif de deux espaces métriques quisont topologiquement équivalents.

Exemple 1.8. Soit l’espace topologique (R, Td) doté de la topologieusuelle. Soit maintenant le sous-espace topologique qui consiste de l’intervalleouvert (0, 1) sur lequel la topologie usuelle est induite. Nous allons démontrerque ces deux espaces sont isomorphes.

En effet, la fonction f : R → (0, 1) et sa réciproque f−1 : (0, 1) → Rdéfinies par :

f(x) =1π

arctanx+12

f−1(y) = tanπ(y − 12

)

sont toutes deux des bijections continues. f est donc un isomorphisme et,par conséquent, (R, Td) ∼= ((0, 1), Td(0, 1)).

1.6.2 Les espaces complets*

Dans un espace métrique, on peut aussi reformuler la définition d’unepartie dense à l’aide de la métrique.

Définition 1.20 Soit (X, Td), un espace métrique. Un sous-ensembleA ⊆ X est dense en X ssi :

∀x ∈ X,∀ε > 0, ∃a ∈ A tel que d(x, a) < ε

Remarque. La définition 1.20 nous informe que toute boule ouvertecontient au moins un élément de A :

B(x, ε) ∩A 6= ∅

1.6.2 Les espaces complets* 31

Exemple 1.9. Le sous-ensemble des nombres rationnels Q est une par-tie dense de (R, Td) puisque tout intervalle ouvert centré sur n’importe quelpoint x ∈ R contiendra toujours un nombre rationnel différent de x (uneinfinité en fait). L’ensemble des irrationnels R\Q est aussi une partie densede (R, Td).

L’avantage majeur de travailler avec des espaces métriques provient dufait que ces espaces nous permettent de caractériser toutes les notions to-pologiques importantes en n’utilisant que les limites de suites convergentes.C’est ce que nous nous proposons de faire en commencant par la notiond’adhérence.

Théorème 1.7 Soit (X, Td), un espace métrique. Dans un tel espace,un point x ∈ X est un point adhérent à une partie non-vide A ⊆ X ssi ilexiste une suite (xn)n∈N entièrement contenue dans A et qui converge versx. Dans un espace métrique, l’adhérence de A est définie par :

A = {x ∈ X | ∃(xn)n∈N ⊆ A t.q. limn→∞

xn = x}

Démonstration. Il faut montrer que la définition générale 1C.18 de l’adhé-rence se ramène à la forme équivalente donnée ci-haut dans le cas particulierd’un espace métrique 18.

=⇒ L’espace métrique (X, Td) vérifie le premier axiome de dénom-brabilité 19. Pour tout x ∈ X, la famille B(x) = {Bn(x, 1

n) | x ∈ R, n ∈ N}constitue une base locale d’ouverts emboîtés. Supposons que x ∈ A ; alorstout ouvert G contenant x rencontre A. Ceci est vrai en particulier pour toutélément de la base locale en x, c.-à-d. :

∀n ∈ N, Bn(x, 1n) ∩A 6= ∅

Choississons un point dans chacune de ces intersections :

x1 ∈ B1(x, 1n) ∩A, x2 ∈ B2(x, 1

n) ∩A, . . . , xn ∈ Bn(x, 1n) ∩A, . . .

La suite x1, x2, . . . , xn, . . . est entièrement contenue dans A. Et puisque toutouvert Bn(x, 1

n) de la base locale contient tous les éléments de la suite, saufpeut-être les n − 1 premiers, il s’ensuit que limn→∞ xn = x. En jetant uncoup d’oeil sur la définition 1C.20 d’une base locale, nous constatons que :

∀G ∈ T t.q. x ∈ G, G ∩A 6= ∅ =⇒ ∃(xn)n∈N ⊆ A t.q. limn→∞

xn = x

18. Prenez note que cette preuve utilise l’axiome du choix.19. Nous anticipons ici sur un des résultats de la section 1.6.3.


⇐= S’il existe une suite convergente (xn)n∈N entièrement contenuedans A telle que limn→∞ xn = x, alors d’après la définition 1.19 de mêmeque la définition de la boule ouverte :

∀ε > 0,∃N ∈ N tel que xn ∈ B(x, ε) ∀n > N

Ce que nous aimerions, bien entendu, c’est d’avoir tous les xn ∈ Bn(x, 1n).

Qu’à cela ne tienne, en choisissant N ′ tel que N ′ > N et N ′ > 1ε , nous

obtenons :

∀ε > 0, ∃N ′ ∈ N tel que xn ∈ Bn(x, 1n) ∀n > N ′

Donc ∀ε > 0, aussi petit soit-il, il existe toujours un élément de la base localeen x qui contient tous les éléments de la suite convergente, sauf peut-être unnombre fini de ceux-ci. Puisque B(x) est une base locale, alors tout ouvertG contenant x contient lui aussi un élément de cette base locale d’ouvertsemboîtés. Il s’ensuit que tout ouvert G contenant x contient aussi tous leséléments de la suite (xn)n∈N sauf peut-être un nombre fini d’entre eux. Maispuisque tous les éléments de cette suite appartiennent à A, nous devonsconclure que :

∃(xn)n∈N ⊆ A t.q. limn→∞

xn = x =⇒ ∀G ∈ T t.q. x ∈ G, G ∩A 6= ∅

Pour tout espace topologique, dire que A est dense en X revient à direque A = X. Par ce qui précède, dans un espace métrique, A est dense en Xssi tout point de l’espace X est la limite d’une suite convergente entièrementcontenue dans A 20.

Remarque. Il est bon de rappeler que l’adhérence A ne peut contenirque trois types de points :

(i) Les points isolés appartenant à A. Rappelons que les seules suites quiconvergent vers ces points isolés sont de type a1, . . . , ak, a, a, a, a, . . . .

(ii) Les points d’accumulation de A qui appartiennent à A.(iii) Les points d’accumulation de A qui n’appartiennent pas à A. Cespoints d’accumulation doivent toutefois appartenir à l’espace X.

Encore devons-nous prendre conscience que la notion de convergence quinous a servi jusqu’à maintenant accuse une faiblesse notable : pour qu’elle

20. Notez que ceci est différent que d’affirmer que toute suite convergente entièrementcontenue dans A converge vers un point x de l’espace X !

1.6.2 Les espaces complets* 33

soit pleinement fonctionnelle elle exige la connaissance a priori de la limitex, ce qui n’est pas toujours naturel et évident. Nous profiterions d’un critèrenous permettant de « prospecter » des limites sans ressentir le besoin deconnaître au préalable leurs valeurs précises. C’est ce nous offre le critère deconvergence de Cauchy.

Définition 1.21 Soit (X, Td), un espace métrique. Nous dirons que lasuite (xn)n∈N est une suite de Cauchy ssi :

∀ε > 0,∃N ∈ N tel que d(xm, xn) < ε ∀m,n > N

Théorème 1.8 Toute suite convergente dans (X, Td) est une suite deCauchy.

Démonstration. Soit (xn)n∈N, une suite convergente dans (X, Td) telle quelimn→∞ xn = x. Alors pour un ε

2 > 0, il existe un N tel que pour m,n > N ,

d(xm, x) <ε

2et d(xn, x) <

ε

2Le reste suit facilement.

d(xm, xn) 6 d(xm, x) + d(xn, x) <ε

2+ε

2= ε par 1.25d

À l’inverse, il ne faudrait pas s’empresser de clamer que toute suite deCauchy qui soit entièrement contenue dans (X, Td) est une suite convergentedans (X, Td). Le problème vient du fait que, si le critère de Cauchy nouscertifie la présence d’un point limite, il ne nous garantit pas que ce pointlimite fasse partie de l’espace topologique ! C’est d’ailleurs la raison qui nousamène à définir la notion de complétude.

Définition 1.22 Un espace métrique (X, Td) est dit complet si toutesuite de Cauchy converge vers un point limite contenu dans l’espace.

Exemple 1.10. L’espace des nombres rationnels (Q, Td) n’est pas com-plet. Par exemple, considérons la suite des sommes partielles (sn)n∈N où :

sn =n∑k=0

(−1)k

2k + 1= 1− 1

3+

15− 1

7+ · · ·+ (−1)n

2n+ 1

Puisque pour tout m,n > 1−ε2ε , nous avons d(sm, sn) < ε, il s’agit bien d’une

suite de Cauchy. Or si tous les éléments de la suite sont des rationnels, lalimite converge vers un nombre irrationnel puisque limn→∞ sn = π

4 /∈ Q.


Exemple 1.11. L’espace des nombres réels (R, Td) est complet. Dans R,toute suite de Cauchy converge vers un nombre réel. L’ensemble des nombrescomplexes C est lui aussi complet. Dans C, toute suite de Cauchy convergevers un nombre complexe.

De façon imagée, on peut dire que le critère de Cauchy nous permetd’examiner le « tissu » de l’espace pour vérifier la présence de « trous ». Lesespaces qui ne sont pas complets possèdent leur lot d’inconvénients qu’heu-reusement nous ne serons pas obligés de subir. Mais auparavant, une autrepetite définition est de mise.

Définition 1.23 Soient deux espaces métriques (X, TdX) et (Y, TdY

).Nous appellerons toute bijection I : X → Y qui préserve les distances, c.-à-d.telle que ∀x1, x2 ∈ X :

dX(x1, x2) = dY (I(x1), I(x2))

une isométrie. Deux espaces (X, TdX) et (Y, TdY

) sur lesquels on peut définirune isométrie sont dits isométriquement isomorphes.

« Être isométriquement isomorphe à » est une relation d’équivalence.

Remarque. Deux espaces isométriquement isomorphes sont considéréscomme étant mathématiquement identiques. Si l’isométrie ne peut être éta-blie que sur une partie de Y , on parlera plutôt de plongement isométriquede X dans Y . On considère alors X comme étant un sous-espace de Y .

Exemple 1.12. Les espaces métriques (C, | · |) et (R2, ‖ · ‖) sont iso-métriquement isomorphes puisque l’application I : C → R2 définie parI(z) = (<(z),=(z)) est une isométrie.

Définition 1.24 Un espace métrique (X, Td) est le complété d’un es-pace métrique (X, Td) ssi :

1) X est isométriquement isomorphe à X où X est une partie de X.2) X est dense dans X.3) L’espace (X, Td) est complet.

Théorème 1.9 Tout espace métrique peut être complété. Cette complé-tion est unique à un isomorphisme isométrique près.

La démonstration de ce théorème ne présente pas de difficultés majeuresmais elle est quand même assez longue pour qu’il soit préférable de la reléguer

1.6.3 Les espaces séparables* 35

aux exercices de fin de chapitre. Le lecteur peut accepter dogmatiquement lefait qu’il soit toujours possible de trouver un espace métrique complet X danslequel on puisse plonger X. Le fait que X soit isométriquement isomorphe àX implique que l’image (par isométrie) de toute suite convergente dans Xest une suite convergente dans X dont la limite est dans X. Grossièrement,cette procédure vise à « boucher les trous » de l’espace original.

Exemple 1.13. L’espace métrique (R, Td) est le complété de (Q, Td).Q est évidemment dense en R. Ceci n’est pas un accident puisque toutnombre réel peut être considéré comme la limite d’une suite de Cauchy denombres rationnels, une procédure visant justement à boucher les trous del’ensemble Q.

Veuillez noter que la complétude n’est pas une propriété topologique. Eneffet, la suite :

(sn)n∈N =12,13,14, . . . ,

1n+ 1

, . . .

n’est pas complète en (0, 1) puisque le point limite (zéro) ne fait pas partiede l’intervalle ouvert. Par contre, cette suite est complète dans (R, Td) etpuisque (R, Td) ∼= ((0, 1), Td(0, 1)) (voir l’exemple 1.8), il est clair que lacomplétude n’est pas une propriété topologique.

1.6.3 Les espaces séparables*

Pour tout espace métrique doté de la topologie usuelle, la conditionpour qu’il soit aussi un espace de Hausdorff s’exprime ainsi : si x1 et x2

sont deux points de l’espace, alors il est toujours possible de trouver deuxboules ouvertes B(a, r1) et B(b, r2) telles que x1 ∈ B(a, r1), x2 ∈ B(b, r2)et B(a, r1) ∩ B(b, r2) = ∅. De fait, rien ne nous empêche de choisir x1 etx2 pour centre de chacune des boules ouvertes ; dans ce cas, nous n’avonsqu’à nous assurer que B(x1, r1) ∩ B(x2, r2) = ∅. Il suffit alors de prendrepour r1 et r2 toute valeur 0 < r 6 d(x1,x2)

2 . En effet, posons ε = d(x1, x2)et r1 = r2 = ε

2 . Procédons par reductio ad absurdum et supposons queB(x1,

ε2) ∩ B(x2,

ε2) 6= ∅. Dans ce cas, il existe un x qui appartient à la

fois à B(x1,ε2) ainsi qu’à B(x2,

ε2), ce qui revient à dire que d(x1, x) < ε

2 etd(x2, x) < ε

2 . Mais d’après l’inégalité de Minkowski,

d(x1, x2) 6 d(x1, x) + d(x, x2) < ε2 + ε

2 = ε

ce qui contredit le fait que d(x1, x2) = ε. Donc, B(x1,ε2) ∩ B(x2,

ε2) = ∅ et

l’espace est de Hausdorff. Par conséquent :


Tout espace métrique (X, Td) est un espace de Hausdorff.

x1

x2

B(a, r1)

B(b, r2)r1

r2

Figure 1.7 – Un espace métrique (X, Td) possède la propriété suivante :pour toute paire de points x1 et x2, on peut toujours trouver deux boulesouvertes disjointes B(a, r1) et B(b, r2) telles que x1 ∈ B(a, r1), x2 ∈ B(b, r2)et B(a, r1)∩B(b, r2) = ∅. Tout espace métrique est un espace de Hausdorff.

Puisque selon le théorème 1C.12, toute suite convergente dans un espacede Hausdorff converge vers une limite unique, le résultat suivant s’impose delui-même.

Toute suite convergente dans un espace métrique (X, Td) n’admetqu’une seule limite.

Les espaces métriques dotés de la topologie usuelle vérifient tous le pre-mier axiome de dénombrabilité. Il suffit en effet de choisir, pour chaque pointx de l’espace, la base locale B(x) = {Bn(x, 1

n) | x ∈ R, n ∈ N} constituéed’une suite dénombrable de boules ouvertes concentriques dont le rayon tendéventuellement vers zéro.

Tout espace métrique (X, Td) vérifie le premier axiome dedénombrabilité.

Puisque les espaces métriques vérifient le premier axiome de dénombra-bilité, dans leurs cas, les notions de continuité et de continuité séquentiellesont strictement équivalentes.

1.6.3 Les espaces séparables* 37

Proposition 1.10 Soient deux espaces métriques (X, TdX) et (Y, TdY

)et soit F : X → Y , une application quelconque.

Alors F est continue en x ∈ X ssi F est séquentiellement continue enx ∈ X et :

limn→∞

xn = x ⇐⇒ limn→∞

F (xn) = F (x)

Nous serions presque portés à croire d’emblée que tout espace métrique(X, Td) vérifie le second axiome de dénombrabilité, mais ce n’est pas toujoursle cas. Une condition additionnelle s’impose :

Proposition 1.11 Tout espace métrique (X, Td) qui est séparable vé-rifie le second axiome de dénombrabilité.

L’espace métrique (R, Td) est éminemment séparable puisqu’il contientune partie dense dénombrable, soit Q, l’ensemble des rationnels. Et puisquele produit cartésien de toute famille finie d’ensembles dénombrables est dé-nombrable, tous les espaces de dimension finie Rn et Cn sont aussi séparables.

Les espaces Rn et Cn munis de la topologie usuelle vérifient lesecond axiome de dénombrabilité.

Puisque, par définition, les espaces qui vérifient le second axiome de dé-nombrabilité possèdent une base topologique dénombrable, il s’ensuit que :

Les espaces Rn et Cn munis de la topologie usuelle possèdent unebase topologique dénombrable.

Quelles sont les bases dénombrables privilégiées pour les espaces (Rn, Td)et (Cn, Td) ? Prenons R2 par exemple. Alors :

B ={Bn

((q1, q2),

1n

)| q1, q2 ∈ Q, n ∈ N

}est une base dénombrable 21 constituée de toutes les boules ouvertes dontles coordonnées du centre et le rayon sont des nombres rationnels. Le mêmeprincipe demeure valide pour les espaces de dimension supérieure.

L’énoncé suivant nous renseigne sur le nombre maximum de points quepeut contenir un espace de Hilbert.

Tout espace métrique à base topologique dénombrable possède auplus la puissance du continu.

21. Pour C, il suffit de prendre B = {Bn((q1 + i q2),1n) | q1, q2 ∈ Q, n ∈ N}.


La cardinalité de tout espace de Hilbert de dimension infinie est donc ℵ1

(aleph-un), soit la puissance du continu.

1.6.4 Les espaces vectoriels topologiques

Les espaces topologiques, et plus particulièrement les espaces métriques,dont nous avons traités jusqu’à présent n’étaient pas nécessairement dotés destructures algébriques supplémentaires. À partir de maintenant, nous nousintéresseront aux espaces topologiques qui sont à la fois des espaces vectoriels.Les espaces de Banach constituent une catégorie importante de tels espaces :

Un espace vectoriel normé complet pour la norme est un espace deBanach.

Par l’expression « complet pour la norme » nous entendons bien sûr« complet pour la métrique associée à la norme ». Dans un espace de Ba-nach, la notion de norme prend nettement la préséance sur la notion de mé-trique et il est d’usage de tout ramener à cette première. Ainsi, la topologieengendrée par la norme T‖ · ‖ est en fait la topologie engendrée par la métriqueassociée à la norme et il sera toujours sous-entendu que d(x,y) = ‖x− y ‖et que T‖ · ‖ équivaut à la topologie usuelle Td.

Les notions de convergence 1.19 et de continuité 1.18 peuvent aussi êtreramenées à la norme. Ainsi, dans un espace vectoriel normé, nous dirons quela suite (xn)n∈N converge vers le point x ssi :

∀ε > 0, ∃N ∈ N tel que ‖x− xn ‖ < ε ∀n > N (1.31a)

et que l’application F : (X1, ‖ · ‖1)→ (X2, ‖ · ‖2) est continue en a ∈ X1 ssi :

∀ε, ∃δ tel que ‖x− a ‖1 < δ =⇒ ‖F (x)− F (a) ‖2 < ε (1.31b)

Un espace de Hilbert est une instance particulière d’un espace de Banachqui tire sa norme d’un produit vectoriel.

Un espace pré-hilbertien séparable et complet pour la norme estun espace de Hilbert.

L’espace de Banach est toutefois plus général puisque sa norme n’est pasnécessairement issue d’un produit scalaire de sorte que la notion de vecteursorthogonaux n’y est pas définie, contrairement à l’espace de Hilbert 22. Deplus, un espace de Hilbert se doit d’être séparable, c.-à-d. de posséder unepartie dénombrable dense.

22. On peut toutefois définir une notion d’orthogonalité entre un espace de Banach etson dual topologique.

1.6.4 Les espaces vectoriels topologiques 39

Convention. Un espace de Hilbert sera toujours dénoté par H.

Nous pouvons nous prévaloir du fait que l’espace de Hilbert est implici-tement un espace métrique, pour lequel la continuité et la continuité séquen-tielle sont des notions équivalentes, et simplifier davantage les expressions1.31a et 1.31b en laissant tomber la notation δ-ε pour celle de la limite d’unesuite. À partir de maintenant, nous conviendrons d’écrire :

convergence : limn→∞

‖x− xn ‖ = 0 (1.32a)

critère de Cauchy : limm→∞n→∞‖xm − xn ‖ = 0 (1.32b)

continuité : limn→∞

‖x− xn ‖1 = 0 =⇒ limn→∞

‖F (x)− F (xn) ‖2 = 0

(1.32c)

Remarque. Nous utiliserons l’expression convergence en norme lorsquenous sommes en présence de la condition 1.32a.

Exercice 1.1. Démontrez que si la suite (xn)n∈N converge en normevers x, alors lim

n→∞‖xn ‖ = ‖x ‖.

Démonstration. Par 1.17c et 1.17d, les inégalités suivantes sont toujours vé-rifiées :

‖x ‖ 6 ‖x− xn ‖+ ‖xn ‖‖xn ‖ 6 ‖x− xn ‖+ ‖x ‖

Par hypothèse nous avons limn→∞

‖x − xn ‖ = 0. Prenant la limite des deuxinégalités ci-dessus, nous obtenons :

‖x ‖ 6 limn→∞

‖xn ‖ et limn→∞

‖xn ‖ 6 ‖x ‖

Par conséquent, limn→∞

‖xn ‖ = ‖x ‖.

Exercice 1.2. Démontrez la bicontinuité du produit scalaire hermitiendans un espace de Hilbert.

Démonstration. Soient deux suites (xn)n∈N et (ym)m∈N qui convergent res-pectivement vers les points (vecteurs) x et y de l’espace de Hilbert H dotédu produit scalaire 〈 · | · 〉 : H×H→ C. Par 1.32a, nous avons :

limn→∞

‖x− xn ‖H = 0 et limm→∞

‖y − ym ‖H = 0


Par 1.17a et 1.17d, nous avons :

0 6 ‖ 〈x |y 〉 − 〈xn |ym 〉 ‖C6 ‖ 〈x |y 〉 − 〈xn |y 〉 ‖C + ‖ 〈xn |y 〉 − 〈xn |ym 〉 ‖C6 ‖ 〈x− xn |y 〉 ‖C + ‖ 〈xn |y − ym 〉 ‖C

Nous profitons ensuite du fait que la norme hermitienne sur C est égale aumodule d’un nombre complexe

(soit ‖ z ‖C =

√zz∗ = |z|

), ce qui nous offre

une excellente opportunité d’utiliser l’inégalité de Cauchy-Schwartz 1.19 :

0 6 ‖ 〈x |y 〉 − 〈xn |ym 〉 ‖C 6 | 〈x− xn |y 〉 | + | 〈xn |y − ym 〉 |6 ‖x− xn ‖H ‖y ‖H + ‖xn ‖H ‖y − ym ‖H

Il ne nous reste plus qu’à passer à la limite, ce qui donne :

0 6 limm,n→∞

‖ 〈x |y 〉 − 〈xn |ym 〉 ‖C 6 0 · ‖y ‖H + ‖x ‖H · 0 = 0

où nous avons utilisé le résultat de l’exercice précédent. Nous avons ainsiprouvé que :

limn→∞

‖x− xn ‖H = 0

limm→∞

‖y − ym ‖H = 0

=⇒ limm,n→∞

‖ 〈x |y 〉 − 〈xn |ym 〉 ‖C = 0

ce qui démontre la bicontinuité du produit scalaire.

Remarque. La bicontinuité du produit scalaire permet de faire passerl’opération de prise de limite à l’intérieur du produit scalaire sans autreforme de procès :

limm,n→∞

〈xn |ym 〉 = 〈 limn→∞

xn | limm→∞

ym 〉

= 〈x | limm→∞

ym 〉 = 〈x |y 〉

Il en va de même pour la norme associée :

limn→∞

‖xn ‖ = ‖ limn→∞

xn ‖ = ‖x ‖

1.6.4.1 L’espace dual topologique

La continuité étant un des concepts centraux de la topologie, il convientde définir le dual topologique d’un espace de dimension infinie comme étant

1.6.5 Les bases hilbertiennes 41

l’ensemble de toutes les formes linéaires continues sur V, soit Lc(V,K). Nousutiliserons la notation abbréviée V′ pour indiquer le dual topologique de V.

Le fait Lc(V,K) ⊂ L(V,K), ou que V′ soit un sous-ensemble strict deV∗ ne pose pas de problèmes en dimension infinie, puisque les ensemblesinfinis ont tous la propriété d’être équipotents à certaines de leurs parties 23.V′ et V ont donc tous deux la même cardinalité (soit la puissance du continusi V est un espace de Hilbert de dimension infinie).

La bicontinuité du produit scalaire obligeant, le théorème 1.6 demeurevalide en dimension infinie, à la condition de remplacer le dual algébrique parle dual topologique V′. Ainsi, à tout vecteur u ∈ V correspond une uniqueforme linéaire continue φu = 〈u | · 〉 ∈ V′, et inversement.

1.6.5 Les bases hilbertiennes

Avant d’aborder le vif du sujet de cette section, nous allons tout d’abordétablir un certain nombre de résultats dans des espaces de dimension finie.De tous les espaces de dimension infinie, l’espace de Hilbert est certes celuiqui s’accommode le mieux de l’extrapolation naïve des résultats algébriquesobtenus sur des espaces de dimension finie.

Nous allons maintenant porter notre attention sur les familles de vecteursnon-nuls, deux à deux orthogonaux {ui}i∈I , 〈ui |uj 〉 = 0, i 6= j, qui consti-tuent une famille orthogonale. Dans un premier temps, nous ne considéreronsque des familles orthogonales finies.

Proposition 1.12 Soit une famille orthogonale finie {u1, . . . ,uN} devecteurs d’un espace vectoriel normé. Alors :∥∥∥∥∥

N∑i=1

ui

∥∥∥∥∥2

=N∑i=1

‖ui ‖2 (1.33)

De plus, les vecteurs {u1, . . . ,uN} sont linéairement indépendants.

23. Par exemple, l’application n 7→ 2n entre l’ensemble des entiers naturels N et l’en-semble des entiers naturels pairs établit une bijection entre les deux ensembles ; ils pos-sèdent donc tous deux la même cardinalité même si l’un est strictement inclus dans l’autre.


Démonstration.∥∥∥∥∥N∑i=1

ui

∥∥∥∥∥2

=

⟨N∑i=1

ui

∣∣∣∣∣N∑j=1

uj

⟩=

N∑i=1

N∑j=1

〈ui |uj 〉

=N∑i=1

〈ui |ui 〉 =N∑i=1

‖ui ‖2

Prenons maintenant une combinaison linéaire quelconque de cette familleorthogonale et égalons-là à zéro,

∑Ni=1 λiui = 0. Alors :

0 =

∥∥∥∥∥N∑i=1

λiui

∥∥∥∥∥2

=N∑i=1

‖λiui ‖2 =N∑i=1

|λi|2‖ui ‖2

Cette dernière égalité n’est possible que si tous les termes (positifs) de lasomme sont nuls, c.-à-d. si chaque |λi|2‖ui ‖2 = 0. Mais puisqu’aucun desvecteurs n’est nul, tous les scalaires λi se doivent de l’être. Par conséquent,les vecteurs sont linéairement indépendants.

Remarque. L’équation 1.33 propose une version N -dimensionnelle duthéorème de Pythagore.

Une famille orthonormale (ou famille orthonormée) est une famille or-thogonale où en plus tous les vecteurs sont unitaires.

Convention. Nous utiliserons souvent les symboles e ou ei pour iden-tifier des vecteurs unitaires et {ei}i∈I , avec 〈 ei | ej 〉 = δij pour représenterune famille orthonormale.

Passer d’une famille orthogonale à une famille orthonormale est un jeud’enfant ; il suffit en effet de diviser chaque vecteur de la famille orthogonalepar sa norme :

ei =ui‖ui ‖

En pratique, il arrive souvent qu’on ait à notre disposition une famillede vecteurs qui soient linéairement indépendants sans être nécessairementorthogonaux. Nous verrons un peu plus loin qu’il est toujours possible d’enextraire une famille orthonormale grâce à l’algorithme de Gram-Schmidt.

Soit {e1, . . . , eN}, une base orthonormée d’un espace de Hilbert de di-mension finie N . Puisque tout vecteur x d’un espace vectoriel fini peut être


décomposé selon les vecteurs de base, nous pouvons toujours écrire :

x =N∑i=1

λiei (1.34)

Le produit scalaire nous permet de trouver une expression pour chaque λi :

〈 ei |x 〉 =

⟨ei

∣∣∣∣∣N∑j=1

λjej

⟩

=N∑j=1

λj〈 ei | ej 〉 =N∑j=1

λjδij

= λi

Ainsi, les coordonnées du vecteur x dans cette base orthonormée sontdonnés par :

λi = 〈 ei |x 〉 (1.35)

et tout vecteur de l’espace se décompose selon :

x =N∑i=1

〈 ei |x 〉 ei (1.36)

Si on prend la norme des deux côtés de l’équation 1.34, qu’on l’élève aucarré et qu’on applique ensuite le résultat 1.33, on obtient immédiatement :

‖x ‖2 =N∑i=1

|λi|2 (1.37)

Une dernière relation très utile est l’identité de Parseval :

〈x |y 〉 =N∑i=1

〈x | ei 〉〈 ei |y 〉 (1.38)

Démonstration. La décomposition 1.36 nous permet de poser :

〈x |y 〉 =

⟨N∑i=1

〈 ei |x 〉ei

∣∣∣∣∣ y

⟩

=N∑i=1

〈 ei |x 〉∗〈 ei |y 〉 =N∑i=1

〈x | ei 〉〈 ei |y 〉


Notons que l’équation 1.37 n’est qu’un cas particulier de l’identité deParseval 1.38 obtenue en posant y = x.

Nous consacrerons le restant de cette section à démontrer que, dans unespace de Hilbert de dimension infinie, les équations 1.36, 1.37 et 1.38 de-meurent valides si l’on remplace N par ∞. Mais d’abord, nous allons exa-miner la signification d’expressions telle que {ei}i∈I ou encore

∑i∈I λiei.

Dans le cas le plus général, l’ensemble d’indices I peut être fini, dénom-brable ou non dénombrable, mais nous allons anticiper ici sur la proposition1.18 et restreindre notre champ d’investigation aux familles orthonorméesdénombrables. Lorsque la famille orthonormée est dénombrable, nous pou-vons toujours identifier I à N, comme nous en avons l’habitude lorsqu’il s’agitd’une suite.

Mais substituer {ei}i∈N pour {ei}i∈I ou∑∞

i=1 λiei pour∑

i∈I λiei nefait que déplacer le problème puisque le concept algébrique de combinaisonlinéaire ne s’applique, par définition, qu’à un nombre fini de vecteurs. Eneffet, si B = {ei}i∈N est une famille orthonormée dénombrable, alors l’espacevectoriel engendré par B est l’ensemble des combinaisons linéaires finies deséléments de B :

Vect(B) ={ N∑i=1

λiei

∣∣∣∣ N <∞, λi ∈ K}

(1.39)

Une première étape consiste donc à compléter Vect(B). Mais encorefaut-il d’abord préciser la notion de convergence dans un espace vectoriel dedimension infinie.

Nous allons commencer par développer séparément le concept d’une sériede vecteurs. Supposons que nous sommes en présence d’une famille dénom-brable de vecteurs {λiei}i∈N dans un espace pré-hilbertien de dimensioninfinie. Quelle signification doit-on donner à l’expression suivante ?

∞∑i=1

λiei

Intuitivement, il serait tout naturel de ramener la convergence d’unesérie de vecteurs à la convergence en norme de la suite des sommes partiellessn =

∑ni=1 λiei :∞∑i=1

λiei = limn→∞

sn = v ⇐⇒ limn→∞

∥∥∥∥∥ v −n∑i=1

λiei

∥∥∥∥∥ = 0 (1.40)

mais encore faut-il composer avec un détail technique supplémentaire : lasérie doit converger quel que soit l’ordre dans lesquels les termes sont pris


et la somme de la série ne doit pas non plus dépendre de l’ordre des termes.Ceci est consistant avec le fait que si l’on veut qu’un vecteur représente unequantité physique, il ne doit pas dépendre de la base que l’on choisit pour ledécrire. Nous imposons donc la condition supplémentaire :

∞∑i=1

λiei = v =⇒ ∀σ : N→ N,∞∑i=1

λσ(i)eσ(i) = v

où σ est une permutation quelconque, c.-à-d. une bijection de N dans lui-même. En langage clair, nous dirons alors que la série de vecteurs se doit deconverger commutativement. Heureusement pour nous, le théorème suivantvient à notre rescousse.

Théorème 1.13 Soit {ei}i∈N, une famille orthonormée dénombrabledans un espace de Hilbert. La série de vecteurs

∑∞i=1 λiei converge en norme

dans H ssi la série∑∞

i=1‖λiei ‖2 converge absolument dans R :

∞∑i=1

λiei = v ∈ H ⇐⇒∞∑i=1

‖λiei ‖2 <∞

Une série qui converge dans R et dont tous les termes sont non-négatifsconverge absolument et la convergence ne dépend alors pas de l’ordre danslequel les termes ont été pris ; autrement dit, une série qui converge absolu-ment, converge aussi commutativement.

Ayant disposé de ce léger détail technique, nous pouvons utiliser le théo-rème 1.9 pour compléter Vect(B) et ainsi obtenir notre espace de Hilbert H.Un des effets secondaires de la complétion est que Vect(B) est maintenantdense dans le complété, ce qui s’exprime mathématiquement par :

∀x ∈ H, ∀ε > 0, ∃N∑i=1

λiei ∈ Vect(B) t.q.

∥∥∥∥∥ x−N∑i=1

λiei

∥∥∥∥∥ < ε

Cette condition satisfait le critère intuitif de convergence de la suite dessommes partielles énoncé en 1.40.

Toutes ces considérations nous amènent à la définition suivante d’unebase hilbertienne 24 :

24. Une base hilbertienne est une base vectorielle de l’espace de Hilbert, essentiellementune famille de points, à ne jamais confondre avec la base topologique du même espace qui,elle, est une famille d’ouverts.


Définition 1.25 Une famille B = {ei}i∈I est une base hilbertienned’un espace de Hilbert H ssi :

1) la famille B est orthonormée.2) Vect(B) est dense dans H.

Remarque. Dire que Vect(B) est dense dans H équivaut à dire quel’adhérence de l’espace vectoriel engendré par B est l’espace H lui-même :

Vect(B) = H. (1.41)

Cette définition d’une base hilbertienne, soit une famille orthonorméedont l’ensemble des combinaisons linéaires est dense dans son complété de-meure un peu abstraite. Nous demandons au lecteur de faire preuve d’unpeu de patience car nous nous acheminons sûrement vers le théorème 1.19qui affirme justement que nous sommes en présence d’une base hilbertienneque si et seulement si nous pouvons remplacer N par ∞ dans les équations1.36, 1.37 et 1.38 ! Mais auparavant, nous devons encore établir certainesdéfinitions et résultats intermédiaires importants.

Proposition 1.14 (Inégalité de Bessel) Soit une famille orthonormale{ei}i∈I au plus dénombrable dans un espace de Hilbert H. Alors ∀x ∈ H :∑

i∈I|〈 ei |x 〉|2 6 ‖x ‖2 (1.42)

Démonstration. Démontrons d’abord l’inégalité pour le cas où I est fini.Pour alléger l’écriture, nous utiliserons l’égalité 1.35, soit λi = 〈 ei |x 〉.

0 6

∥∥∥∥∥ x−N∑i=1

〈 ei |x 〉 ei

∥∥∥∥∥2

=

⟨x−

N∑i=1

〈 ei |x 〉 ei

∣∣∣∣∣ x−N∑j=1

〈 ej |x 〉 ej

⟩

6 〈x |x 〉 −

⟨x

∣∣∣∣∣N∑j=1

λjej

⟩−

⟨N∑i=1

λiei

∣∣∣∣∣ x

⟩+

⟨N∑i=1

λiei

∣∣∣∣∣N∑j=1

λjej

⟩

6 〈x |x 〉 −N∑j=1

λj〈x | ej 〉 −N∑i=1

λ∗i 〈 ei |x 〉+N∑i=1

N∑j=1

λ∗iλj〈 ei | ej 〉

6 ‖x ‖2 −N∑j=1

λjλ∗j −

N∑i=1

λ∗iλi +N∑j=1

λ∗jλj


ce qui démontre l’inégalité de Bessel pour tout N <∞.

N∑i=1

|λi|2 6 ‖x ‖2 (1.43a)

Supposons maintenant que I soit dénombrable. Puisqu’une série positiveconverge ssi la suite des sommes partielles est bornée, nous pouvons directe-ment passer à la limite en 1.43a et écrire :

∞∑i=1

|λi|2 6 ‖x ‖2 (1.43b)

D’ici la fin de cette section, il sera beaucoup question de sous-espacesfermés d’un espace de Hilbert.

Définition 1.26 Une partie W d’un espace de Hilbert H est un sous-espace fermé ssi :

1. W est un sous-espace vectoriel de H.

2. W contient tous ses points d’adhérence.

Remarque. La condition que W contienne tous ses points d’adhérencerevient à dire que W se confond avec son adhérence, soit W = W. Par (i)de l’exercice 1C.1, W est donc un fermé.

Dans un espace de Hilbert, fermé et complet sont des concepts inter-changeables, ce qui n’est généralement pas le cas puisque le premier est unconcept extrinsèque alors que le second est un concept intrinsèque.

En effet, l’adhérence d’une partie A est toujours contenue dans l’espaceinitial, A ⊆ X, même si X n’est pas complet puisque l’adhérence ne vise queles suites dont les limites appartiennent à X. Les suites de Cauchy qui neconvergent pas dans X convergeront dans le complété X, et dans cet espace,leurs points limites feront partie de l’adhérence de A. Dans un tel cas, lefermé A dans X n’est pas le même que le fermé A dans X ; le concept defermé est un concept relatif et extrinsèque.

D’un autre côté, toute partie A qui est complète se suffit à elle-même et nedépend pas, pour fins de complétude, d’un quelconque sur-espace dans lequelelle serait éventuellement plongée. Dans ce sens, le concept de complétudeest un concept absolu et intrinsèque.

Ce qu’il faut retenir ici, c’est que tout sous-espace fermé de Hilbert estautomatiquement complet.


Il serait opportun ici de définir le complément orthogonal (ou simplementl’orthogonal) d’un ensemble.

Définition 1.27 Soit une partie A ∈ H. Le complément orthogonal deA, dénoté A⊥, est constitué de l’ensemble des vecteurs orthogonaux à tousles éléments de A, soit :

A⊥ = {v ∈ H | 〈v |w 〉 = 0, ∀w ∈ A}

Exercice 1.3. Soit H, un espace de Hilbert. Démontrez que pour toutesparties A,B ⊆ H :

1) A⊥ est un sous-espace fermé.2) A ⊆ B =⇒ B⊥ ⊆ A⊥.3) A⊥ = (A)⊥.4) A ⊆ (A⊥)⊥.

Démonstration.

1) Nous devons d’abord démontrer que A⊥ est un sous-espace vectoriel,c.-à-d. stable par combinaison linéaire. Soient u et v, deux vecteursquelconques de A⊥. Alors, pour tous scalaires α, β ∈ C et tout w ∈ A :

〈αu + βv |w 〉 = α∗〈u |w 〉+ β∗〈v |w 〉 = 0 + 0 = 0

Ainsi, αu + βv ∈ A⊥ et A⊥ est donc un sous-espace vectoriel.Démontrons maintenant que A⊥ contient tous ses points d’adhérence.Considérons une suite de Cauchy (vn)n∈N quelconque et entièrementcontenue dans A⊥. Par la complétude de l’espace de Hilbert, cette suiteconverge vers un point v ∈ H. Nous utilisons la continuité du produitscalaire pour démontrer que v appartient aussi à A⊥ :

〈v |w 〉 = 〈 limn→∞

vn |w 〉 = limn→∞

〈vn |w 〉 = 0

Donc, v ∈ A⊥ et puisque A⊥ contient tous ses points d’adhérence, ils’agit bien d’un fermé. A⊥ est bien un sous-espace fermé.

2) Soit x ∈ B⊥, nous allons démontrer que x ∈ A⊥.x ∈ B⊥ revient à dire que 〈x |y 〉 = 0, ∀y ∈ B. Mais ∀z ∈ A, on aque z ∈ B. Donc, ∀z ∈ A on a aussi que 〈x | z 〉 = 0. Par conséquent,x ∈ A⊥.


3) Puisque A ⊆ A par 1C-3, il découle par 2) que (A)⊥ ⊆ A⊥. Il nousreste à démontrer que A⊥ ⊆ (A)⊥. Le théorème 1.7, adapté aux espacesde Hilbert, donne :

A = {x ∈ H | ∃(xn)n∈N ⊆ A t.q. limn→∞

xn = x}

Soient x ∈ A et y ∈ A⊥. Puisque la suite (xn)n∈N est entièrementcomprise dans A, nous avons

∀n ∈ N, 〈y |xn 〉 = 0

Par la continuité du produit scalaire, il s’ensuit que 〈y |x 〉 = 0 et doncque y ∈ (A)⊥. Puisque y ∈ A⊥ =⇒ y ∈ (A)⊥, on a A⊥ ⊆ (A)⊥.Nous en concluons que A⊥ = (A)⊥, c.-à-d. qu’une partie quelconquegénère donc le même complément orthogonal que son adhérence.

4) ∀x ∈ A et ∀y ∈ A⊥, on a 〈y |x 〉 = 0. Par symétrie, 〈x |y 〉 = 0, et∀x ∈ A,x ∈ (A⊥)⊥. D’où, A ⊆ (A⊥)⊥.

Si les résultats de l’exercice 1.3 sont valides pour toutes parties quel-conques A,B de H, parties qui ne sont ni nécessairement des sous-espacesvectoriels ni même des fermés, il demeure que ce sont les sous-espaces fer-més de H qui mériteront exclusivement notre attention. La raison en estsimple : en effet, il n’est pas trop difficile de démontrer que tout sous-espaced’un espace métrique séparable est lui-même séparable (voir problème 1.28)et on sait que tout sous-espace fermé d’un espace de Hilbert est complet.Par conséquent, tout sous-espace fermé d’un espace de Hilbert constitue enlui-même un espace de Hilbert de plein droit.

Par la suite, lorsque nous parlerons d’un sous-espace d’un espace de Hil-bert, il sera toujours sous-entendu qu’il s’agit d’un sous-espace fermé.

Théorème 1.15 Soit B, un sous-espace fermé de H. Alors pour toutx ∈ H, il existe un point unique y ∈ B tel que :

‖x− y ‖ = inf{ ‖x− z ‖ | z ∈ B}

Remarque. L’infimum de { ‖x − z ‖ | z ∈ B} établit la distance dupoint x au sous-espace B. Remarquez que cette distance est non-nulle quessi x 6∈ B.

Convention. Pour le reste de cette section, nous ferons grand usage desnotations suivantes. Si B = {ei}i∈I est une famille orthonormale au plusdénombrable d’un espace de Hilbert H, et x un point quelconque de H,alors :


B déf.=== Vect(B) (1.44a)

xBdéf.===

∑i∈I〈 ei |x 〉 ei (1.44b)

Rappelons que selon le théorème 1.1, Vect(B) est un sous-espace vecto-riel de H. Si l’ensemble B est fini, alors Vect(B) = Vect(B) = B, puisquetout espace vectoriel de dimension finie est complet. Par la proposition 1.12,les vecteurs de la famille B sont linéairement indépendants, et puisqu’ils en-gendrent B, ils en constituent une base. Notons qu’en dimension finie, lanotion de base hilbertienne se confond avec celle de base orthonormée.

Si B est dénombrable, alors Vect(B) est défini suivant 1.39. D’après ladéfinition 1.25, B est alors une base hilbertienne de B.

Notons enfin que xB est bien défini. En effet, le théorème 1.13 nous ditque

∑i∈I〈 ei |x 〉 ei converge dans H ssi

∑i∈I‖ 〈 ei |x 〉 ei ‖2 converge dans

R. Or c’est toujours le cas puisque par l’inégalité de Bessel 1.42 :∑i∈I‖ 〈 ei |x 〉 ei ‖2 =

∑i∈I|〈 ei |x 〉|2 6 ‖x ‖2 <∞

Exercice 1.4. Soit B = {ei}i∈I , une famille orthonormale au plus dé-nombrable d’un espace de Hilbert H. Soit x, un point quelconque de H.

Démontrez :1) B⊥ = B⊥.2) xB ∈ B.3) x− xB ∈ B⊥.4) ‖x− xB ‖ 6 ‖x− z ‖, pour tout z ∈ B.5) ‖xB ‖2 6 ‖x ‖2.

Démonstration.

1) Puisque B ⊆ B, on a que B⊥ ⊆ B⊥ par 2) de l’exercice 1.3.Soit x ∈ B⊥ ; alors ∀i ∈ I, 〈x | ei 〉 = 0. Soit maintenant y ∈ Vect(B) ;alors il existe une combinaison linéaire finie des vecteurs de B telle quey =

∑Ni=1 λiei. Mais dans ce cas,

〈x |y 〉 = 〈x |N∑i=1

λiei 〉 =N∑i=1

λi 〈x | ei 〉 = 0

et x ∈ Vect(B)⊥. Mais Vect(B)⊥ = Vect(B)⊥

par 3) de l’exercice1.3. D’où, B⊥ ⊆ B⊥. Par conséquent, B⊥ = B⊥.


2) Si I est fini, alors xB est une combinaison linéaire finie des vecteursde B. Donc xB ∈ Vect(B) et xB ∈ B puisque tout espace vectoriel dedimension finie est complet.Si I est dénombrable, alors chaque élément de la suite des sommespartielles

sn =n∑i=1

〈 ei |x 〉ei

est dans Vect(B). Puisque par 1C-3, Vect(B) ⊆ Vect(B), chaque snest aussi dans B. Et puisque B est complet, la limite

∑∞i=1〈 ei |x 〉ei

appartient aussi à B. Donc dans tous les cas, xB ∈ B.3) Il suffit de noter que ∀j, 〈xB | ej 〉 = 〈x | ej 〉. En effet,

〈xB | ej 〉 =

⟨∑i∈I〈 ei |x 〉 ei

∣∣∣∣∣ ej

⟩=∑i∈I〈 ei |x 〉∗〈 ei | ej 〉

=∑i∈I〈x | ei 〉 δij = 〈x | ej 〉

Il en découle directement que ∀j, 〈x− xB | ej 〉 = 0.Puisque x− xB est orthogonal à chacun des vecteurs de B, il s’ensuitque x−xB ∈ B⊥. Mais B⊥ = B⊥ par 1). Par conséquent, x−xB ∈ B⊥.

4) Puisque xB ∈ B par 2), il demeure vrai que ∀z ∈ B, xB− z ∈ B. Parle résultat précédent, x− xB ∈ B⊥. Donc, ∀z ∈ B et ∀x ∈ H :

‖x−z ‖2 = ‖x−xB +xB−z ‖2 = ‖x−xB ‖2 +‖xB−z ‖2 par 1.33

Il s’ensuit naturellement que :

0 6 ‖x− xB ‖2 6 ‖x− z ‖2

ou encore, en extrayant la racine carrée :

‖x− xB ‖ 6 ‖x− z ‖ =⇒ d(x,xB) 6 d(x, z)

en faisant appel à la métrique associée. Puisque l’égalité n’est possibleque si ‖xB − z ‖ = 0, c.-à-d. que si z = xB, nous retenons que quelsque soient les points x ∈ H et z ∈ B, xB est l’unique point de B quiminimise la distance au point x.

5) Puisque x = (x− xB) + xB, il s’ensuit que :

‖x ‖2 = ‖x− xB ‖2 + ‖xB ‖2 par 1.33


Le résultat désiré découle immédiatement. Prenez note que l’expression‖xB ‖2 6 ‖x ‖2 n’est évidemment qu’une formulation alternative del’inégalité de Bessel 1.42.

Si l’on conjugue le théorème 1.15 avec le résultat 4) de l’exercice 1.4,il est clair que xB = inf{ ‖x − z ‖ | z ∈ B}. Ceci justifie la définition del’application PB : H→ B, dite de projection orthogonale (voir Fig. 1.8) :

PB(x) = xB =∑i∈I〈 ei |x 〉 ei (1.45)

Nous dirons de façon équivalente que xB est la meilleure approximation dex dans B, c.-à-d. :

‖x−∑i∈I〈 ei |x 〉ei ‖ 6 ‖x−

∑i∈I

λiei ‖, ∀λi ∈ K

l’égalité n’ayant lieu que si λi = 〈 ei |x 〉,∀i ∈ I.Il est facile de vérifier que PB est une application linéaire continue. Nous

aurons encore beaucoup à dire à propos des projecteurs orthogonaux dansle chapitre sur les opérateurs de l’espace de Hilbert.

xH

BxB

y

x� xB

Figure 1.8 – Projection orthogonale du point x sur le sous-espace fermé B,PB(x) = xB. De tous les points de B, seul xB minimise la distance du pointx au sous-espace B. Le vecteur x− xB réside dans B⊥, avec H = B⊕B⊥.

Exercice 1.5. Soit un sous-espace fermé B d’un espace de Hilbert H.Démontrez :


1) B ∩B⊥ = {0}.2) H = B⊕B⊥.3) B = (B⊥)⊥.4) H⊥ = {0} et {0}⊥ = H.

Démonstration.

1) Pour tout x ∈ B ∩ B⊥, on doit avoir 〈x |x 〉 = 0. Par 1.13e, ceciimplique que x = 0. Donc, B ∩B⊥ = {0}.

2) Pour tout x ∈ H, on a x = PB(x) + (x − PB(x)) où PB(x) ∈ B et(x−PB(x)) ∈ B⊥. Donc H = B+B⊥. Combinant ce résultat avec 1),on obtient H = B⊕B⊥.Tout vecteur x ∈ H peut donc être décomposé de manière unique enune partie contenue dans B et en une partie perpendiculaire à B.

3) Nous avons déjà démontré que B ⊆ (B⊥)⊥ par 4) de l’exercice 1.3.Nous allons maintenant démontrer que (B⊥)⊥ ⊆ B.Soit x ∈ (B⊥)⊥. On a toujours x = PB(x) + (x−PB(x)). Notons quele terme (x − PB(x)) ∈ (B⊥)⊥ puisqu’il est une combinaison linéairede x ∈ (B⊥)⊥ (par hypothèse) et de PB(x) ∈ B ⊆ (B⊥)⊥. Mais on aaussi que (x− PB(x)) ∈ B⊥ par 3) de l’exercice 1.4.Donc, (x−PB(x)) ∈ B⊥∩(B⊥)⊥. Par 1) de cet exercice, cela impliqueque (x−PB(x)) ∈ {0} et donc que x = PB(x) ∈ B. D’où, (B⊥)⊥ ⊆ Bet il s’ensuit que B = (B⊥)⊥.

4) ∀x ∈ H, on a x = x + 0 où x ∈ H et 0 ∈ {0}. Donc H = H + {0}.D’un autre côté, on a que H ∩ {0} = {0}. Par la proposition 1.3, ildécoule que H = H ⊕ {0}. En posant B = H dans 2), on obtientdirectement que H⊥ = {0}De plus, {0}⊥ = (H⊥)⊥ = H par 3).

Nous proposons maintenant de démontrer l’algorithme de Gram-Schmidt.Soit une famille de vecteurs linéairement indépendants {vi}i∈I . Puisque cettefamille ne peut contenir le vecteur 0, nous pouvons toujours poser :

e1 =v1

‖v1 ‖

e2 =v2 − 〈 e1 |v2 〉 e1

‖v2 − 〈 e1 |v2 〉 e1 ‖

e3 =v3 − 〈 e2 |v3 〉 e2 − 〈 e1 |v3 〉 e1

‖v3 − 〈 e2 |v3 〉 e2 − 〈 e1 |v3 〉 e1 ‖


et, de façon générale :

en =vn −

n−1∑i=1〈 ei |vn 〉 ei∥∥∥∥ vn −

n−1∑i=1〈 ei |vn 〉 ei

∥∥∥∥ (1.46)

Il va sans dire que e1 est une combinaison linéaire de v1, et inversement.Nous laissons au lecteur le soin de vérifier que e2 est une combinaison linéairede v1 et v2 (à l’inverse, v2 est une combinaison linéaire de e1 et e2) et parconséquent que l’expression v2 − 〈 e1 |v2 〉 e1 6= 0 (Pourquoi ?). Il s’ensuitque e2 est bien défini et unitaire. On vérifiera aussi que 〈 e1 | e2 〉 = 0.

Supposons maintenant que pour k ∈ {1, 2, . . . , n− 1} chaque ek est unecombinaison linéaire des v1,v2, . . . ,vk et que la famille {e1, e2, . . . , en−1}est une famille orthonormale. Nous démontrons alors par récurrence que en,tel que donné par l’expression 1.46 , est lui aussi un vecteur unitaire qui estorthogonal à tout membre de la famille {e1, e2, . . . , en−1}, soit 〈 en | ek 〉 = 0.

En effet, puisque les vecteurs v1,v2, . . . ,vn sont linéairement indépen-dants, l’expression vn−

∑n−1i=1 〈 ei |vn 〉 ei 6= 0 et par conséquent, en est bien

défini et unitaire. De plus, pour tout i, k ∈ {1, 2, . . . , n− 1} :

〈 en | ek 〉 =1∥∥∥∥ vn −


∥∥∥∥⟨

vn −n−1∑i=1

〈 ei |vn 〉 ei

∣∣∣∣∣ ek

⟩

=1∥∥∥∥ vn −


∥∥∥∥[〈vn | ek 〉 −

n−1∑i=1

〈 ei |vn 〉∗ 〈 ei | ek 〉︸︷︷︸= δik

]

=1∥∥∥∥ vn −


∥∥∥∥[〈vn | ek 〉 − 〈vn | ek 〉

]= 0

ce qui démontre bien la validité de l’algorithme de Gram-Schmidt. Puisqu’onpeut encore une fois exprimer le vecteur unitaire en en tant que combinaisonlinéaire des v1,v2, . . . ,vn, il s’ensuit que pour toute valeur finie de n, on a :

Vect(e1, . . . , en) = Vect(v1, . . . ,vn)

et la famille orthonormale engendre le même espace vectoriel que la familleoriginale, par la proposition 1.2.


Pour apprécier l’algorithme de Gram-Schmidt, il suffit de constater qu’àchaque étape de l’itération 1.46, on soustrait du vecteur vn sa projectionorthogonale PBn−1 sur le sous-espace Bn−1 = Vect(e1, . . . , en−1) ; le vecteurrésultant vn − PBn−1 est alors orthogonal à tout vecteur de Bn−1. Il nereste plus qu’à le normaliser et le rajouter aux autres pour obtenir une baseorthonormée de l’espace Bn, et ainsi de suite.

Il est grand temps de rendre plus conviviale la définition de base hil-bertienne, ce que nous entreprenons de faire à l’aide des critères de densitésuivants.

Théorème 1.16 Soit B = {ei}i∈I , une famille orthonormale d’un es-pace de Hilbert H. Alors les énoncés suivants sont équivalents :

1) B est une base hilbertienne

2) B⊥ = {0}3) ∀ei ∈ B, 〈x | ei 〉 = 0 =⇒ x = 0

4) Vect(B) = H

Démonstration.

1) =⇒ 2) Puisque B est une base hilbertienne de H, par définitionVect(B) = H. Alors Vect(B)

⊥= H⊥ = {0}. Donc B⊥ = {0}, et

utilisant le résultat 1) de l’exercice 1.4, on obtient B⊥ = {0}.2) =⇒ 3) Par définition, B⊥ = {x ∈ H | 〈x | ei 〉 = 0, ∀ei ∈ B}.

Puisque B⊥ = {0}, alors forcément x ∈ B⊥ implique que x = 0.3) =⇒ 4) Inversement, si ∀x ∈ H on a que x ∈ B⊥ =⇒ x = 0,

alors forcément B⊥ = {0}. Puisque B⊥ = B⊥, alors (B⊥)⊥ = {0}⊥ou encore B = H. Mais par convention B = Vect(B), et il s’ensuitque Vect(B) = H et que B est dense dans H.

4) =⇒ 1) Le fait que B soit une famille orthonormale dense dans Hen fait une base hilbertienne par définition.

Théorème 1.17 Tout espace de Hilbert séparable possède une base hil-bertienne dénombrable.

Proposition 1.18 Toute base hilbertienne d’un espace de Hilbert est auplus dénombrable.

Avec le théorème suivant, la notion de base hilbertienne perd son carac-tère abstrait et prend toute sa signification.


Théorème 1.19 Soit B = {ei}i∈I , une famille orthonormale d’un es-pace de Hilbert H et x, un point quelconque de l’espace. Alors les énoncéssuivants sont équivalents :

1) B est une base hilbertienne

2) x =∑i∈I〈 ei |x 〉 ei

3) 〈x |y 〉 =∑i∈I〈x | ei 〉〈 ei |y 〉

4) ‖x ‖2 =∑i∈I|〈 ei |x 〉|2

Démonstration.

1) =⇒ 2) Si B est une base hilbertienne, alors B⊥ = {0} par2) du théorème 1.16. Par 1) de l’exercice 1.4, on a que B⊥ = B⊥ oùB = Vect(B). Puisque x−PB(x) ∈ B⊥, il s’ensuit que x−PB(x) = 0,ou encore que :

x = PB(x) =∑i∈I〈 ei |x 〉 ei

2) =⇒ 3) Du résultat précédent, on tire que :

〈x |y 〉 = 〈PB(x) |y 〉 =∑i∈I

⟨〈 ei |x 〉 ei

∣∣∣∣ y⟩

=∑i∈I〈 ei |x 〉∗〈 ei |y 〉 =

∑i∈I〈x | ei 〉〈 ei |y 〉

3) =⇒ 4) Posant y = x dans le résultat précédent, on obtient :

〈x |x 〉 = ‖x ‖2 =∑i∈I|〈 ei |x 〉|2

4) =⇒ 1) Supposons que x ∈ B⊥. Alors 〈x | ei 〉 = 0,∀ei ∈ B. Parle résultat précédent, cela signifie que ‖x ‖ = 0 et donc que x = 0 par1.17b. Donc, ∀x ∈ B⊥ =⇒ x = 0 revient à dire que B⊥ = {0} et,par le théorème 1.16, que B est une base hilbertienne.

1.7 Quelques représentations de H 57

FORMULES À RETENIR

Si B = {ei}i∈N est une base hilbertienne de H, alors pour tousvecteurs x,y ∈ H :

x =∞∑i=1

〈 ei |x 〉 ei (1.47)

‖x ‖2 =∞∑i=1

|〈 ei |x 〉|2 (1.48)

〈x |y 〉 =∞∑i=1

〈x | ei 〉〈 ei |y 〉 (1.49)

L’espace de Hilbert permet l’extrapolation simple des résultats algé-briques obtenus dans des espaces de dimensions finies. À tel point que, pourle profane, le passage à la dimension infinie se résume à un simple change-ment de borne supérieure, de N à ∞, dans les équations 1.36, 1.37 et 1.38,sans autre forme de procès et sans encourir de pénalités.

1.7 Quelques représentations de H

1.7.1 L’espace l2*

L’espace l2, dit « petit-el-deux », est l’espace de toutes les suites infiniesde nombres réels (xi)i∈N dont la somme des carrés des termes converge :

∞∑i=1

x2i <∞ (1.50)

On en fait un espace vectoriel normé en identifiant les éléments de lasuite aux composantes d’un vecteur considéré comme un ∞-uplet :

x = (x1, x2, . . . , xi, . . . )

L’addition vectorielle et la multiplication scalaire sont naturellement définies


par :

x + y = (x1, x2, . . . , xi, . . . ) + (y1, y2, . . . , yi, . . . )= (x1 + y1, x2 + y2, . . . , xi + yi, . . . )

αx = (αx1, αx2, . . . , αxi, . . . )

l2 utilise la norme euclidienne, généralisée aux ∞-uplets :

‖x ‖ =

√√√√ ∞∑i=1

x2i

On vérifiera que la condition de convergence 1.50 nous assure que tout vecteurde l’espace l2 est de norme finie, puisque ‖x ‖2 <∞.

Initialement conçu comme un espace sur le corps des réels, l2 peut aussiêtre considéré comme l’espace de toutes les suites infinies de nombres com-plexes (zi)i∈N dont la somme des carrés des modules converge :

∞∑i=1

|zi|2 <∞ (1.51)

Les éléments de la suite sont identifiés aux composantes d’un vecteur z :

z = (z1, z2, . . . , zi, . . . )

On utilise alors la norme hermitienne, généralisée aux ∞-uplets :

‖ z ‖ =

√√√√ ∞∑i=1

|zi|2

L’espace l2 est bien un espace vectoriel car il est stable par combinationlinéaire, c.-à-d. que pour tout scalaires α et β et tout vecteurs u et v, αu+βvrespecte 1.51. En effet :

∞∑i=1

|αui + βvi|2 6∞∑i=1

[|αui|+ |βvi|

]2

6∞∑i=1

[|α|2|ui|2 + |β|2|vi|2 + 2|α||ui||β||vi|

]

1.7.2 L’espace fonctionnel L2* 59

Puisque pour tout réels a et b, l’inégalité 2ab 6 a2+b2 est toujours valide,nous obtenons en posant a = |α||ui| et b = |β||vi| que :

∞∑i=1

|αui + βvi|2 6 2 |α|2∞∑i=1

|ui|2 + 2 |β|2∞∑i=1

|vi|2 <∞

Ce résultat s’étend évidemment à toute combinaison linéaire finie de vec-teurs de l2.

Il n’est pas trop difficile de démontrer que l2 est un espace complet (Voirle Prob. 1.5).

La base hilbertienne la plus couramment utilisée sur l2 est bien entendu :

e1 = (1, 0, 0, 0, 0, 0, . . . )e2 = (0, 1, 0, 0, 0, 0, . . . )e3 = (0, 0, 1, 0, 0, 0, . . . ). . . . . . . . . . . . . . . . . .

Le produit scalaire sur l2 est la généralisation du produit scalaire hermi-tien :

〈x |y 〉 =∞∑i=1

x∗i yi

L’inégalité de Cauchy-Schwartz nous assure que le produit scalaire esttoujours bien défini :

|〈x |y 〉|2 6 ‖x ‖2‖y ‖2 <∞

L’espace l2 fut proposé pour la première fois par David Hilbert vers 1909,dans le cadre de ses études sur les équations intégrales. La première formula-tion de la mécanique quantique, par Werner Heisenberg en 1925, la « méca-nique matricielle »[7], modélise les états physiques et les observables à l’aidede vecteurs et de matrices infinies opérant sur l’espace l2. Aujourd’hui, l’in-formatique quantique récupère cette mécanique matricielle dans des espacesde dimension finie.

C’est John von Neumann qui, dans un ouvrage sur l’axiomatisation dela théorie de la mécanique quantique, formalisa l’appellation « espace deHilbert » en 1929.

1.7.2 L’espace fonctionnel L2*

Plusieurs des équations intéressantes en physique mathématique se pré-sentent sous la forme d’équations différentielles aux valeurs propres, dont la


forme prototypique est :Aφ(x) = λφ(x) (1.52)

où A est un opérateur 25 différentiel linéaire et λ et φ(x) sont les valeurspropres et les fonctions propres à déterminer. Ce type de problème se cadrebien dans un espace de Hilbert transformé pour l’occasion en un espace fonc-tionnel, ou espace de fonctions, où chaque point de l’espace est une fonction(par exemple, du type φ : R 7→ C) 26.

Notre point de départ est l’ensemble des fonctions continues sur un in-tervalle fermé, C0([a, b]). On peut démontrer que cet espace est complet sion le munit de la norme uniforme :

‖φ ‖∞ = supx∈[a,b]

|φ(x)|

mais, tel que nous l’avons mentionné à la section 1.4, cette norme ne dérived’aucun produit scalaire. Nous sommes donc en présence d’un espace deBanach, et non d’un espace de Hilbert.

Qu’à cela ne tienne puisque nous nous proposons d’introduire le produitscalaire suivant sur notre espace fonctionnel.

〈φ |ψ 〉 =∫ b

aφ(x)∗ψ(x) dx (1.53)

La norme hermitienne associée est donnée par :

‖φ ‖2 =(∫ b

a|φ(x)|2 dx

) 12

(1.54a)

et cette norme induit la métrique :

d(φ,ψ) = ‖φ−ψ ‖2 =(∫ b

a|φ(x)−ψ(x)|2 dx

) 12

(1.54b)

C’est ici que les difficultés commencent. En effet, si dans les espaces de di-mension finie toutes les normes sont équivalentes, ce n’est plus le cas pour lesespaces de dimension infinie. En particulier, si l’espace C0([a, b]) est completpour la norme uniforme ‖ · ‖∞, il ne l’est pas pour la norme ‖ · ‖2.

25. La notion d’opérateur est examinée en détail au chapitre 2.26. Pour simplifier, nous considérons ici les fonctions complexes d’une seule variable

réelle. Si l’extension aux fonctions à plusieurs variables ne pose conceptuellement pas deproblèmes, en pratique elle nécessite cependant d’avoir recours à des intégrales multiples.


On peut le vérifier facilement. Prenons par exemple la suite de fonctions(φn)n∈N dans C0([−1, 1]) définie par :

φn(x) =

−1 si − 1 6 x 6 − 1

n

nx si − 1n < x < 1

n

1 si 1n 6 x 6 1

Cette suite est de Cauchy 27. Pour que la suite converge vers une fonctionφ(x) il faut que :

limn→∞

(∫ 1

−1|φ(x)− φn(x)|2 dx

) 12

= 0

À la limite, on tend vers la fonction

φ(x) =

{−1 si − 1 6 x < 01 si 0 < x 6 1

qui contient une discontinuité en x = 0. Étant discontinue, φ(x) ne peutappartenir à C0([−1, 1]).

Constatant qu’aucune des fonctions φn n’est lisse, nous serions peut-êtretentés de prendre comme espace de départ C1([a, b]), l’ensemble des fonctionsà dérivées continues sur l’intervalle [a, b] ou encore C∞([a, b]), l’ensemble desfonctions infiniment différentiables mais ce serait peine perdue. Force nousest de constater que le complété de C0([a, b]) pour la norme ‖ · ‖2 contient desfonctions qui sont continues par morceaux. Ce complété est bien un espacede Hilbert, dénoté L2([a, b]), dit « grand-el-deux ».

L’espace L2([a, b]) comporte son lot de particularités.1) Le traitement rigoureux de l’espace L2([a, b]) nécessite une introduc-

tion à la théorie de la mesure, une branche des mathématiques dont laplupart des phycisiens n’ont eu ni le loisir ni l’inclinaison de se fami-liariser.

2) Le produit scalaire 1.53 doit être intégrable au sens de Lebesgue plutôtqu’au sens de Riemann. Que le lecteur se rassure, les quelques intégralesque nous rencontrerons dans le cadre de cet ouvrage seront toujoursintégrables au sens de Riemann.

3) La norme associée 1.54a cache maintenant une petite technicalité.C’est qu’elle rencontre toutes les conditions d’une norme, sauf 1.17b,

27. On peut démontrer en effet que, pour 1 6 m < n, on a ‖φm − φn ‖2 <√

2m.


car :

‖φ ‖2 =

√∫ b

a|φ(x)|2 dx = 0 Y=⇒ φ(x) = 0

où φ(x) est la fonction continue identiquement nulle sur tout l’inter-valle [a, b]. En effet, il s’avert que φ(x) peut être différente de zéro enun sous-ensemble dénombrable de points sans que la valeur de l’inté-grale en soit affectée : autrement dit, l’élément neutre de l’espace n’estpas unique. On contourne cet obstacle technique en prenant pour vec-teurs de L2([a, b]) non plus les fonctions individuelles, mais les classesd’équivalence de fonctions qui sont égales presque partout 28.

4) Jusqu’à présent, le critère de convergence utilisé pour les suites deCauchy en a toujours été un de convergence simple ou ponctuelle. Maisdans l’espace fonctionnel L2([a, b]), tout « point » de l’espace est enréalité une classe d’équivalence de fonctions définies sur [a, b]. Ainsi,deux fonctions, φ1 et φ2, qui sont égales presque partout sont consi-dérées équivalentes

φ1∼= φ2

et sont donc représentées par un seul et même point de l’espace. Toutesuite de Cauchy de L2([a, b]) qui converge vers φ1 converge aussi versφ2. Pour assurer la complétude de l’espace L2, un critère moins res-trictif de convergence presque partout suffit. Nous dirons qu’une suitede Cauchy (φn)n∈N dans un espace fonctionnel converge presque par-tout vers une fonction φ si elle converge simplement vers φ sauf surun ensemble de mesure nulle. On démontre que si :

limm,n→∞

‖φm − φn ‖2 = limm,n→∞

∫ b

a|φm(x)− φn(x)|2 dx = 0

alors il existe une fonction φ, intégrable au sens de Lebesgue, verslaquelle la suite converge en moyenne quadratique :

limn→∞

‖φ− φn ‖2 = limn→∞

∫ b

a|φ(x)− φn(x)|2 dx = 0 (1.55)

Si la suite de fonctions (φn)n∈N converge en moyenne quadratique versφ, il est toujours possible d’en extraire une suite partielle qui convergepresque partout. Bref, pour l’espace fonctionnel L2([a, b]), le critèremoins restrictif de convergence en moyenne quadratique 1.55 est suffi-sant pour assurer la complétude de l’espace.

28. En théorie de la mesure, on dit que les fonctions ne diffèrent entre elles que sur unensemble de mesure nulle.


5) Puisque la convergence en moyenne quadratique n’implique pas laconvergence simple en tout point du domaine [a, b], il conviendraitd’utiliser un symbole différent, disons « .= », pour indiquer que lacomplétude de l’espace repose sur un critère de convergence presquepartout :

ψ.=∞∑i=1

〈φi |ψ 〉φi (1.56)

quitte à préserver le symbole « = » pour les cas où la série convergeponctuellement vers ψ en tout point du domaine. Bien que justifiée,cette distinction est rarement renforcée.

Un des avantages de choisir C0([a, b]) comme point de départ de notreespace fonctionnel tient au fait que toutes les fonctions continues qui sontdéfinies sur un domaine compact sont nécessairement bornées (voir section1.C.13), ce qui se traduit par :∫ b

a|φ(x)| dx <∞

Cette condition nous assure immédiatement que tout vecteur de C0([a, b])est de norme finie, c.-à-d. :

‖φ ‖2 =(∫ b

a|φ(x)|2 dx

) 12

<∞

Mais la mécanique quantique ne saurait se limiter qu’aux domaines com-pacts et, du moins en théorie, il est nécessaire de lever toutes restrictionsquant aux bornes et de considérer l’espace étendu qu’est L2(R) 29. Une fonc-tion peut très bien être continue sur l’intervalle non compact (−∞,∞) sanspour autant être bornée (par exemple, la fonction exponentielle) de sortequ’il devient impératif d’imposer la condition suivante si l’on veut obtenirl’assurance que tout vecteur de l’espace est bien de norme finie.∫ ∞

−∞|φ(x)|2 dx <∞ (1.57)

On se sert souvent de cette dernière condition pour définir L2(R), outout simplement L2, en tant qu’espace des fonctions de carré sommable.

29. Le fait que le domaine sous-tendu par les fonctions de L2 soit compact ou non aun impact majeur sur le spectre - l’ensemble des valeurs propres - que peut prendre unopérateur. Dans le premier cas, le spectre est discret, ou quantifié, alors que dans le secondil est continu.


Sous réserve de 1.57, les fonctions φ de l’espace L2 peuvent être linéairesou non-linéaires, continues ou discontinues (elles vont jusqu’à admettre uneinfinité dénombrable de points de discontinuité).

Dans L2, l’inégalité de Cauchy-Schwartz prend la forme :∣∣∣∣ ∫ ∞−∞

φ(x)∗ψ(x) dx∣∣∣∣ 6

√∫ ∞−∞|φ(x)|2 dx

√∫ ∞−∞|ψ(x)|2 dx

Le lecteur vérifiera que, tout comme l2, l’espace L2 est stable par com-binaison linéaire et que la condition 1.57 ainsi que l’inégalité de Cauchy-Schwartz garantissent que le produit scalaire est toujours bien défini.

Il existe plusieurs familles de fonctions pouvant servir de bases hilber-tiennes sur l’espace de Hilbert 30. Une base populaire sur L2([−π, π]) faitappel aux fonctions trigonométriques {1, cosnx, sinnx}n∈N . On utilise cettebase 31 pour obtenir une décomposition d’une fonctionψ en séries de Fourier,les scalaires λi = 〈φi |ψ 〉 étant alors appelés les coefficients de Fourier 32.

Malgré tous les efforts déployés par les mathématiciens pour concrétiserl’espace fonctionnel L2, ce dernier n’a pas vraiment la cote chez les physi-ciens. D’une part, certains auteurs sont d’avis que l’espace L2 est « tropgrand » d’un point de vue physique et préfèrent s’en tenir à l’espace des« fonctions suffisamment régulières », un sous-ensemble de fonctions infi-niment différentiables, rapidement décroissantes, sans points de singularité[3], et de l’autre, il s’avert que les triplets de Gel’fand constituent un cadremathématique mieux approprié pour la mécanique quantique que l’espacefonctionnel L2 proprement dit.

1.7.3 L’espace-état

Dans sa recherche de l’explication de l’effet photo-électrique, Albert Ein-stein proposa pour la première fois, en 1905, le concept de « particule delumière » pour décrire ce que l’on connaît aujourd’hui sous l’appellation mo-derne de photon. Dans une expérience célèbre en 1922, l’américain ArthurCompton démontra que les rayons X manifestent bien l’aspect corpusculaire

30. En particulier, toutes les « fonctions spéciales » qui sont solutions d’un problèmede Sturm-Liouville peuvent fournir une base orthogonale de fonctions pour l’espace deHilbert.31. Notez que cette base est orthogonale plutôt qu’orthonormale.32. Indépendamment de la base hilbertienne utilisée, il est d’usage d’appeler les coeffi-

cients 〈φi |ψ 〉 de l’expansion 1.56 les coefficients généralisés de Fourier, en hommage àl’homme et à son oeuvre.

1.7.3 L’espace-état 65

prédit par Einstein. En 1924, le français Louis de Broglie 33 proposa de gé-néraliser cette dualité onde-corpuscule à l’ensemble des particules massives,une idée si audacieuse et si saugrenue pour l’époque qu’elle n’aurait proba-blement pas été prise au sérieux sans la chaude approbation d’Einstein. En1926, l’autrichien Erwin Schrödinger jeta les bases de la mécanique ondula-toire en publiant une équation fondamentale, l’équation de Schrödinger[14],qui décrit l’évolution temporelle de la « fonction d’onde » associée à touteparticule. Dans l’ouvrage d’axiomatisation de la mécanique quantique pu-blié en 1932 par John von Neumann[12], toute « fonction d’onde » de carrésommable se voit représentée par un vecteur de l’espace L2.

La publication de l’équation éponyme de Schrödinger provoqua une cer-taine rivalité scientifique entre les tenants de la mécanique matricielle et ceuxde la mécanique ondulatoire. Ce débat fut toutefois de courte durée car, dès1926, Schrödinger réconcilia les deux écoles de pensée en démontrant l’équi-valence des deux formalismes[15]. L’essence de l’argument de Schrödinger serésume ainsi : à chaque fonction d’onde ψ de L2 correspond le∞-uplet de l2

dont les composantes sont les coefficients 〈φi |ψ 〉 de la décomposition 1.56 :

ψ 7→ (〈φ1 |ψ 〉, 〈φ2 |ψ 〉, · · · , 〈φi |ψ 〉, · · · )

L’inégalité de Bessel garantit alors le respect de la condition 1.51.Le théorème suivant propose un résultat encore plus fort :

Théorème 1.20 (Riesz-Fisher) Tous les espaces de Hilbert séparablesde dimension infinies sont isomorphes à l2.

Autrement dit, à un isomorphisme près, il n’existe qu’un seul espace deHilbert de dimension infinie ! Ainsi, tous les espaces de Hilbert concrets,tels que l2 et L2, ne sont que des réalisations différentes d’un même espaceabstrait. Dans le cadre de la mécanique quantique, les physiciens désignentcet espace sous l’appellation d’espace-état. Dans un même ordre d’idées, lesvecteurs de l’espace-état sont appelés vecteurs d’état.

Entre 1939 et 1947, Paul Dirac proposa un formalisme général pour lathéorie quantique qui devint rapidement très populaire auprès de la com-munauté des physiciens[4]. Ce formalisme s’accompagne d’une notation trèspratique pour les calculs symboliques dans l’espace-état.

33. La prononciation correcte est « de Breuille ».


1.8 La notation de Dirac : bra et ket

Les vecteurs de l’espace de Hilbert ont été jusqu’à présent dénotés à l’aidede caractères gras, par exemple v ou encore ψ. Nous proposons dorénavantd’adopter la notation suivante, dûe au célèbre physicien Pierre Dirac, pourreprésenter cesdits vecteurs :

v notation de Dirac−−−−−−−−−−−→ | v 〉

ψnotation de Dirac−−−−−−−−−−−→ |ψ 〉

On inscrit simplement le symbole représentant le vecteur à l’intérieur d’unpetit enclos orienté vers la droite, appelé ket, sans recourir aux caractèresgras 34.

Nous avons déjà établi qu’à chaque vecteur |ψ 〉 de H correspond ununique covecteur de l’espace dual H∗. En notation de Dirac, ce covecteur estdénoté par 〈ψ |.

|ψ 〉 ∈ H←→ 〈ψ | ∈ H∗

Le petit enclos orienté vers la gauche est appelé un bra.La juxtaposition d’un bra et d’un ket prend alors un air familier :

〈ψ ||φ 〉

De fait, si l’on fusionne les barres verticales, on obtient le symbole du produitscalaire des vecteurs |ψ 〉 et |φ 〉 :

〈ψ |φ 〉

de même que l’explication de l’origine des termes, puisque bra-ket se pro-nonce « bracket », ce qui signifie crochet en anglais.

Si v est un vecteur de H, alors il en est de même pour tout vecteur λv.Selon la notation de Dirac, il est légitime d’écrire ce vecteur |λv 〉, bien quenous encourageons dans ce livre la pratique consistant à extraire les scalairesdes kets 35 :

|λv 〉 = λ | v 〉

34. On permet cependant une exception dans le cas du vecteur nul de l’espace, pourlequel le recours au caractère gras est justifié, c.-à-d. |0 〉 = 0H. Ceci permet de distinguerle vecteur nul du vecteur | 0 〉, un vecteur de la base calculatoire qui lui n’est jamais nul !On peut aussi éliminer toute nécessité de recourir à des caractères gras en adoptant lesymbole | null 〉 pour désigner 0H.35. En mécanique quantique, on utilise parfois l’alphabet grec pour désigner à la fois

et les scalaires et les vecteurs d’états. Néanmoins, il est possible de faire grand usaged’expressions telles que α|ψ 〉+ β|φ 〉 sans créer de confusion.

1.9 Les triplets de Gel’fand* 67

Mais attention : au vecteur |λψ 〉 correspond le covecteur λ∗〈ψ | et nonle covecteur λ〈ψ | :

|ψ 〉 ↔ 〈ψ ||λψ 〉 ↔ 〈λψ | = λ∗〈ψ |

cette correspondance étant toute à fait cohérente avec la semi-linéarité parrapport à la première variable du produit scalaire :

〈λψ |φ 〉 = λ∗〈ψ |φ 〉 (1.58)

À titre d’exemple, voici comment la formule 1.47 s’écrit dans la notationde Dirac :

|x 〉 =∞∑i=1

〈 ei |x 〉 | ei 〉

À première vue, ce changement peut sembler mineur, mais nous seronsmieux en mesure d’apprécier au chapitre 2 toute l’utilité de la notation deDirac lorsque nous développerons l’algèbre des opérateurs linéaires sur H.

Puisque l’enclos du ket suffit à lui seul pour souligner le caractère vectorield’une variable, le choix du symbole qu’il contient est laissé à notre bonneconvenance. De fait, la littérature physique foisonne d’expressions de toutessortes telles que :

|ψ 〉, | i 〉, | j 〉, | 1 〉, | 2 〉, |+ 〉, | − 〉, | 001 〉, |DEAD 〉, |ALIVE 〉, | ↑ 〉, | ↓ 〉, . . .

pour désigner des vecteurs de l’espace-état. Les covecteurs correspondantssont alors donnés par :

〈ψ |, 〈 i |, 〈 j |, 〈 1 |, 〈 2 |, 〈+ |, 〈− |, 〈 001 |, 〈DEAD |, 〈ALIVE |, 〈 ↑ |, 〈 ↓ |, . . .

1.9 Les triplets de Gel’fand*

De son propre aveu, Hilbert a développé la théorie de l’espace l2 à partirde considérations purement mathématiques, sans aucune arrière-pensée pourd’éventuelles applications physiques. Coïncidence ou synchronicité, toujoursest-il que la théorie était là, disponible, juste au moment où les physiciens enressentirent fortement le besoin. La mécanique quantique héritait ainsi d’uncadre mathématique dans lequel elle pouvait se développer de façon formelle,sous l’oeil bienveillant des mathématiciens.

En réalité, les choses ne se sont pas tout à fait passées ainsi. Le manquede rigueur des physiciens eut tôt fait de provoquer l’ire des mathématiciens.Les principaux reproches adressés aux physiciens visaient :


– l’utilisation de la « fonction » de Dirac 36. Dans l’espace L2, nous se-rions tentés d’inclure cette fonction dans la classe d’équivalence de lafonction nulle puisqu’elle est identiquement égale à zéro sauf en un seulpoint. Le hic, c’est que la fonction n’est pas définie en ce point 37 ! Enfait, la « fonction » de Dirac ne prend sa signification que lorsqu’elleapparaît sous un signe d’intégrale.

– l’insistance des physiciens à utiliser des bases non dénombrables del’espace de Hilbert, malgré le fait que les vecteurs de ces bases n’ap-partiennent ni à l’espace de Hilbert ni ne correspondent à des étatsphysiques du système sous étude.

– l’application systématique du formalisme de Dirac par les physiciensqui favorise l’insouciance mathématique et conduit à des contradictionsparfois très étonnantes[6].

Bien que reconnaissant la simplicité et l’utilité du formalisme de Dirac,von Neumann ne pouvait se résoudre à entériner l’usage de telles « fictionsmathématiques ». Pour sa part, le mathématicien français Jean Dieudonnéqualifiait cette invraisemblable accumulation de non-sens de « bouillie pourles chats ».

À leur défense, les physiciens invoquaient :– que l’espace de Hilbert est trop englobant. En particulier, l’espace L2

admet quantité de fonctions discontinues. Or les états physiques sontmodélisés à l’aide de fonctions lisses de classe C∞, définies partout etinfiniment différentiables. Les physiciens se contenteraient d’un sous-ensemble strict de L2 qui ne retiendrait que les fonctions continues.

– que l’espace de Hilbert n’est pas assez inclusif. La physique nécessiteque le spectre de certains opérateurs, notamment l’opérateur d’im-pulsion P, soit continu. Or les vecteurs propres correspondant à cesopérateurs n’appartiennent pas à l’espace de Hilbert puisqu’ils sontde norme infinie. Il en va de même pour les vecteurs propres qui sontsolutions de l’équation de Schrödinger pour une particule libre.

– que le calcul symbolique rendu possible par le formalisme de Dirac esttrop intuitif et bien trop pratique pour qu’on envisage de s’en départir.

Disons qu’à leur honneur, les mathématiciens ont travaillé très fort pourfinalement établir un terrain d’entente entre eux et les physiciens. La pre-mière percée fut effectuée à la fin des années quarante par le mathématicienfrançais Laurent Schwartz[16] qui établit une fondation mathématique so-

36. Nous verrons plus en détail la fonction de Dirac au chapitre 4.37. Un point que l’on fait ressortir parfois avec l’abus de notation suivant : δ(0) =∞.

1.9 Les triplets de Gel’fand* 69

lide pour la fonction de Dirac en développant la théorie des distributions 38.Cette fonction impropre aux propriétés auto-contradictoires obtenait enfinses lettres de noblesse ! Vers la fin des années cinquante, le mathématicienjaponais Mikio Sato élabora une théorie profondément originale qui fusionneà la fois les notions de fonctions et de distributions dans celle des hyperfonc-tions.

Enfin, dans les années soixante, le mathématicien russe Israïl Gel’fand[5]complèta le travail en introduisant le triplet de Gel’fand, appellation quidésigne l’ensemble ordonné d’espaces {Φ,H,Φ×} en relation d’inclusionstricte :

Φ ⊂ H ⊂ Φ× (1.59)

où en plus, Φ est dense dans H et H est dense dans Φ×. Plus pertinent peut-être est le « Rigged Hilbert Space 39 », abbrévié RHS, qui désigne simplementle couple ordonné {Φ,Φ×}. On conçoit alors le RHS comme un élargissementde l’espace de Hilbert qui permet d’accommoder la théorie des distributions.C’est le cadre mathématique indiqué en mécanique quantique lorsqu’on esten présence d’opérateurs non-bornés ou d’observables à spectre continu[9].

De façon générale, les opérateurs non-bornés ne sont pas définis sur latotalité de l’espace H. Il convient alors de choisir pour Φ un domaine dedéfinition qui est laissé invariant par l’opérateur. Ce domaine constitue unsous-espace dense de L2. L’espace anti-dual 40 de Φ, dénoté Φ×, vient com-pléter le RHS. On obtient ainsi le meilleur de deux mondes : Φ rassembleles fonctions lisses à décroissance rapide si prisées par les physiciens et Φ×

contient les « kets généralisés », dont la fameuse fonction de Dirac.Le RHS est le cadre prévilégié en physique des particules pour étudier

les phénomènes de diffusion et de résonance[8]. Utilisé avec discernement, leformalisme de Dirac convient tout aussi bien à un espace de Hilbert séparablequ’à un RHS.

38. Pour l’ensemble de ses travaux sur la théorie des distributions, Schwartz se vitaccorder le plus prestigieux prix en mathématiques, la médaille Fields. Cette récompenseest considérée comme l’équivalent du Prix Nobel, sauf qu’elle n’est décernée qu’une fois àtous les quatre ans et que le récipiendaire se doit d’avoir moins de 40 ans.39. Ce terme anglophone emprunte la connotation nautique de gréé telle qu’utilisée

dans l’expression «fully rigged» plutôt que celle plus négative de truquée, dans «riggedelections» par exemple.40. Une forme linéaire sur un C-espace vectoriel Φ est une fonction f : Φ → C qui

respecte la condition f(αu+βv) = αf(u)+βf(v). Une forme antilinéaire respecte plutôtla condition f(αu + βv) = α∗f(u) + β∗f(v). L’espace anti-dual Φ× correspond ainsi àl’ensemble des formes antilinéaires continues sur Φ.


1.10 Problèmes du Chapitre 1

Problèmes

Problème 1.1. Nombres complexes. Trouvez le résultat de l’ex-pression ii.

Problème 1.2. Espace dual. Démontrez le théorème 1.5.

Problème 1.3. Cauchy-Schwartz. Montrez que la définition 1.11du produit scalaire hermitien implique l’inégalité de Cauchy-Schwartz.

Problème 1.4. Identités. Démontrez l’identité du parallélogramme1.23 et l’identité de polarisation 1.24.

Problème 1.5. Complétude. Démontrez que l’espace l2 est complet.

Problèmes supplémentaires

Problème 1.6. Topologies. Soit l’ensembleX = {a, b, c}. Énuméreztoutes les topologies sur X où seuls ∅ et X sont à la fois des ouverts et desfermés.

Problème 1.7. Voisinages. Démontrez la proposition 1C.1.

Problème 1.8. Intersection de topologies. Démontrez le théo-rème 1C.2.

Problème 1.9. Base équivalente. Démontrez la proposition 1C.4.

Problème 1.10. Base topologique. Démontrez le théorème 1C.5.

Problème 1.11. Base d’une topologie dicrète. Démontrez quetoute base d’une topologie discrète doit nécessairement contenir tous lessingletons de l’espace.

Problème 1.12. Critère pour base topologique. Démontrez lethéorème 1C.6.

Problème 1.13. Prébase. Soit l’ensemble X = {a, b, c, d, e} et

A = {{a, b, c}, {a, d, e}, {b, c, d}, {c, d, e}}

une prébase. Trouvez la topologie TA générée par la prébase A. Outre ∅ etX, existe-t-il d’autres éléments de TA qui soient à la fois des ouverts et desfermés ?

1.10 Problèmes du Chapitre 1 71

Problème 1.14. Topologie induite. Démontrez que T (S), tel quedéfini au théorème 1C.7, constitue bien une topologie sur S.

Problème 1.15. Continuité. Démontrez que l’application

F : (X, TX)→ (X, TY )

est continue ssi la préimage de tout fermé de TY est un fermé de TX .

Problème 1.16. Continuité. Démontrez le théorème 1C.8.

Problème 1.17. Application continue. Démontrez que l’applica-tion identité

F : (X, T )→ (X, T ′)

où ∀x ∈ X, F (x) = x n’est continue que ssi T ′ est moins fine que T .

Problème 1.18. Espaces de Hausdorff. Démontrez la proposition1C.10.

Problème 1.19. Singletons dans un espace de Hausdorff. Dé-montrez la proposition 1C.11.

Problème 1.20. Premier axiome de dénombrabilité. Démontrezla proposition 1C.14.

Problème 1.21. Deuxième axiome de dénombrabilité. Démon-trez la proposition 1.11.

Problème 1.22. Adhérence. Démontrez la proposition 1C.9.

Problème 1.23. Complétion d’un espace métrique. Démontrezle théorème 1.9.

Problème 1.24. Continuité séquentielle. Démontrez la propo-sition 1.10.

Problème 1.25. Convergence. Démontrez le théorème 1.13.

Problème 1.26. Base hilbertienne. Démontrez le théorème 1.17.

Problème 1.27. Base hilbertienne. Démontrez la proposition 1.18.

Problème 1.28. Sous-espaces fermés. Démontrez que tout sous-espace d’un espace métrique séparable est lui-même séparable et que toutsous-espace fermé d’un espace métrique complet est lui-même complet.


Problème 1.29. Ensembles compacts. Démontrez la proposition1C.19.

Problème 1.30. Ensembles compacts. Démontrez la proposition1C.20.

Problème 1.31. Ensembles totalement bornés. Démontrez quetout ensemble totalement borné est borné.

Annexesdu

Chapitre 1

1.A Les structures algébriques 75

Annexe 1.A Les structures algébriques

Un bref rappel sans prétention dans lequel on précise certaines conven-tions pour la notation.

1.A.1 Le produit cartésien

Définition 1A.1 Soient A et B, deux ensembles non-vides. Le produitcartésien de A par B, dénoté :

A×B

est l’ensemble constitué de tous les couples ordonnés (a, b) où la premièrecomposante appartient à l’ensemble A et la seconde composante appartient àl’ensemble B.

A×B = {(a, b) | a ∈ A, b ∈ B}

Exemple 1A.1. Le plan cartésien est le produit cartésien de l’ensembledes réels R par lui-même. On utilise R2 pour désigner le plan cartésien :

R2 = R× R

On peut étendre la notion de produit cartésien binaire à celle de produitcartésien fini. Par exemple, l’espace tri-dimensionnel est le produit cartésiende l’ensemble des réels pris trois fois par lui-même, R3 = R × R × R. Leséléments de R3 sont des triplets (x1, x2, x3) plutôt que des couples.

Par extension, Rn est le produit cartésien de R pris n fois par lui-même :

Rn = R× R× · · · × R︸︷︷︸n fois

Les éléments de Rn sont des multiplets, ou encore des n-uplets, soit uneséquence finie ordonnée de n nombres réels (x1, x2, . . . , xn).

1.A.2 Loi de composition interne

Définition 1A.2 Soit A un ensemble non-vide. Une loi de compositioninterne est toute application (∗) qui associe à tout couple d’éléments (a, b)de A×A un unique élément de A. Nous dénoterons cet élément unique para ∗ b :

∗ : A×A→ A

(a, b) 7→ a ∗ b

L’ensemble A est automatiquement stable pour la loi de composition interne.

76 Annexe 1A

Note. Le symbole de composition « ∗ » est générique et on lui substituela plupart du temps un symbole plus spécifique, par exemple un « + »lorsqu’on est en présence d’une loi additive 41.

1.A.3 Loi de composition externe

Définition 1A.3 Soient A et B, deux ensembles non-vides. Une loide composition externe est toute application (�) qui associe à tout coupled’éléments (a, b) de A × B un unique élément de B. Nous dénoterons cetélément unique par a � b :

� : A×B → B

(a, b) 7→ a � b

1.A.4 La structure algébrique de corps

Concrètement, un corps est un ensemble dans lequel les opérations d’addi-tion, de soustraction, de multiplication et de division sont définies. Nous tra-vaillerons principalement avec le corps des nombres réels et celui des nombrescomplexes.

Définition 1A.4 Un ensemble non-vide K, muni d’une loi de compo-sition interne (+) dite additive, ainsi que d’une seconde loi de compositioninterne (·) dite multiplicative possède la structure algébrique de corps si lesaxiomes suivants sont vérifiés :

∀α, β ∈ K α+ β = β + α (1A-1a)∀α, β, γ ∈ K (α+ β) + γ = α+ (β + γ) (1A-1b)∃ 0K ∈ K, ∀α ∈ K α+ 0K = α (1A-1c)∀α ∈ K, ∃ -α ∈ K α+ (-α) = 0K (1A-1d)∀α, β ∈ K α · β = β · α (1A-1e)∀α, β, γ ∈ K (α · β) · γ = α · (β · γ) (1A-1f)∃ 1K ∈ K, 1K 6= 0K , ∀α ∈ K α · 1K = α (1A-1g)

∀α ∈ K, α 6= 0K , ∃α-1 ∈ K α · α-1 = 1K (1A-1h)∀α, β, γ ∈ K α · (β + γ) = α · β + α · γ (1A-1i)∀α, β, γ ∈ K (α+ β) · γ = α · γ + β · γ (1A-1j)

41. L’usage courant veut aussi qu’on laisse carrément tomber le symbole de compositionlorsque la loi est de nature multiplicative, en écrivant tout simplement ab au lieu de a ∗ b.

1.A.5 La structure d’espace vectoriel 77

Ces axiomes stipulent, d’une part, la commutativité, l’associativité etl’existence d’un élément neutre pour chacune des deux lois de compositioninterne. Ces deux éléments neutres sont obligatoirement distincts. De plus,tous les éléments du corps possèdent un élément inverse additif. Il en vade même pour la loi de composition multiplicative si l’on fait exception del’élément 0K qui lui n’est pas inversible. La distributivité à droite et à gauchede la multiplication par rapport à l’addition viennent compléter la liste desaxiomes.

Il est trivial de démontrer l’unicité de l’élément neutre et de l’élémentinverse, tant pour l’addition que pour la multiplication. Dans le cas des réelset des complexes, ces éléments neutres sont respectivement 0 et 1.

Mentionnons, à des fins de complétude, que la stabilité des lois de com-position interne dans K s’exprime formellement par :

∀α, β ∈ K α+ β ∈ K∀α, β ∈ K a · β ∈ K

Remarque. Notons que (K,+, 0K) possède la structure de groupe additifet (K\{0K}, ·, 1K), celle de groupe multiplicatif.

Convention. La spécification complète d’un corps nécessiterait l’écritureencombrante (K,+, ·, 0K , 1K). Puisque la plupart des théorèmes en algèbrevectoriel sont valides pour un corps quelconque, nous conviendrons d’allégerl’écriture en identifiant tout simplement ce corps par K. Lorsqu’il sera spé-cifiquement question de l’ensemble des réels ou de celui des complexes, nousutiliserons la notation standard R et C 42.

Veuillez prendre note que nous réserverons les caractères grecs minusculespour désigner les éléments d’un corps quelconque K.

1.A.5 La structure d’espace vectoriel

Nous présumons de la part du lecteur une certaine familiarité avec leconcept de vecteur géométrique, soit une « grandeur dirigée » qui ne peutêtre complètement spécifiée par la donnée d’une seule quantité scalaire. Ainsi,il ne suffit pas de dire qu’un corps physique se déplace de tant de mètres àla seconde, encore faut-il lui préciser une direction et un sens pour que savitesse soit entièrement définie.

La généralisation du concept de vecteur géométrique conduit à la notiond’espace vectoriel. Concrètement, un espace vectoriel est un ensemble dans

42. Puisque R ⊆ C, toutes les propositions démontrées pour le corps des complexes Cseront automatiquement vérifiées pour le corps des réels R.

78 Annexe 1A

lequel on a défini une opération d’addition vectorielle à l’aide d’une loi decomposition interne ainsi qu’une opération de multiplication scalaire par unélément d’un corps K à l’aide d’une loi de composition externe.

Convention. Nous utiliserons les caractères romains majuscules graspour illustrer qu’un ensemble possède la structure d’espace vectoriel. Parexemple, si l’ensemble V possède bien la structure d’espace vectoriel, nousle désignerons par V. Les éléments de V seront appelés vecteurs et serontdésignés par des caractères romains minuscules gras, par exemple, u et v.Les éléments de K seront appelés scalaires et continueront d’être désignéspar des caractères grecs minuscules.

Facultativement, nous utiliserons l’expression K-espace vectoriel lorsqu’ilconviendra de préciser le corps de référence.

Procédons maintenant à la définition axiomatique d’un espace vectorielsur un corps quelconque K.

Définition 1A.5 Un espace vectoriel V ou espace linéaire sur un corpsK consiste en un ensemble non-vide V muni d’une loi de composition interne(+) dite d’addition vectorielle :

+ : V × V → V

ainsi que d’une loi de composition externe ( � ) dite de multiplication scalaire :

� : K× V → V

vérifiant les axiomes suivants :

∀v,w ∈ V v + w = w + v (1A-2a)∀u,v,w ∈ V (u + v) + w = u + (v + w) (1A-2b)∃0V∈ V, ∀v ∈ V v + 0V = v (1A-2c)∀v ∈ V, ∃ -v ∈ V v + (-v) = 0V (1A-2d)∀α, β ∈ K, ∀v ∈ V (α+ β) � v = α � v + β � v (1A-2e)∀α ∈ K, ∀v,w ∈ V α � (v + w) = α � v + α �w (1A-2f)∀α, β ∈ K, ∀v ∈ V (α · β) � v = α � (β � v) (1A-2g)∀v ∈ V 1K � v = v (1A-2h)

Note. Veuillez noter qu’un même symbole (+) est utilisé pour indiqueraussi bien une addition scalaire dans le corps K (membre de gauche de

1.A.5 La structure d’espace vectoriel 79

l’équation 1A-2e) qu’une addition vectorielle (membre de droite de la mêmeéquation). Cette utilisation double ne devrait normalement pas entraîner deconfusion. De plus, nous limiterons l’utilisation explicite de l’opérateur demultiplication scalaire (�) à de rares cas d’exception ; la notation simplifiéesuivante sera préférée :

αv ≡ α � v

Aussi, nous avons défini la multiplication scalaire par � : K × V → Valors que certains auteurs utilisent plutôt � : V × K → V . Bref, l’ordren’est pas significatif, ce qui impute une « commutativité » intrinsèque à lamultiplication scalaire :

vα ≡ αv

Dans cet ouvrage, l’usage voudra que les vecteurs soient toujours précédésdes scalaires.

Convention. Dorénavant, nous désignerons l’élément neutre additif deV simplement par 0 plutôt que par 0V. Aucune confusion n’est possible avec0, l’élément neutre additif du corps K.

À titre d’exemple, voici la reformulation usuelle des équations 1A-2c et1A-2f :

v + 0 = v α(v + w) = αv + αw

L’existence d’un élément inverse additif nous permet par ailleurs de dé-finir une nouvelle opération, soit la soustraction vectorielle :

u− v déf.=== u + (-v)

Les espaces vectoriels admettent par ailleurs certains propositions sup-plémentaires facilement démontrables ; nous nous contenterons simplementici de les énumérer.

- l’élément neutre 0 de V est unique.- l’élément inverse -v de v est unique.- pour tout v, (−1)v = -v.- pour tout v, 0v = 0.- pour tout α, α0 = 0.- si αv = 0, alors ou bien α = 0 ou bien v = 0 (ou encore les deux).

Remarque. La distinction essentielle entre un espace vectoriel et uncorps est que ce dernier possède deux lois de composition interne alors qu’unespace vectoriel possède une loi de composition interne et une loi de com-position externe. Cette distinction s’estompe complètement lorsqu’on choisit

80 Annexe 1A

le corps en tant qu’ensemble de départ de notre espace vectoriel. Non seule-ment on ne différencie plus entre loi de composition interne et loi de com-position externe, mais encore les vecteurs se confondent avec les scalaires.Par exemple, les ensembles R et C deviennent des espaces vectoriels bonafide lorsque définis sur leurs propres corps, la multiplication par un scalairese réduisant à une multiplication ordinaire dans les deux cas. Fidèles à nosconventions, nous dénoterons ces espaces vectoriels par R et C.

1.A.6 Les algèbres

Nous allons maintenant introduire la notion d’algèbre sur un corps Kou K-algèbre. Dans cet ouvrage, nous favoriserons les algèbres définis sur lecorps des complexes, soit les C-algèbres.

Concrètement, un espace vectoriel est promu à la structure complèted’algèbre lorsqu’il est complémenté par une deuxième loi de compositioninterne définissant un « produit vectoriel ».

Définition 1A.6 Soit V, un K-espace vectoriel. Nous dirons que Vpossède la structure de K-algèbre s’il est muni d’une seconde loi de compo-sition interne (◦), définissant un produit de vecteurs :

◦ : V ×V→ V

qui vérifie les axiomes suivants :

∀u,v,w ∈ V u ◦ (v + w) = u ◦ v + u ◦w (1A-3a)∀u,v,w ∈ V (u + v) ◦w = u ◦w + v ◦w (1A-3b)∀α, β ∈ K, ∀u,v ∈ V (αu) ◦ (βv) = (αβ)(u ◦ v) (1A-3c)

Les axiomes stipulent que la loi de composition (◦) est distributive àgauche et à droite par rapport à l’addition vectorielle.

Si la loi de composition (◦) est associative :

∀u,v,w ∈ V (u ◦ v) ◦w = u ◦ (v ◦w) (1A-4)

nous dirons que le K-algèbre est un algèbre associatif. De plus, si la loi decomposition (◦) est commutative :

∀u,v ∈ V u ◦ v = v ◦ u (1A-5)

nous dirons que le K-algèbre est un algèbre commutatif.

1.A.6 Les algèbres 81

Note. Il se peut que la loi de composition (◦) admette un élément neutre1V :

∀v ∈ V, ∃1V ∈ V v ◦ 1V = 1V ◦ v = v

et nous dirons alors que le K-algèbre est un algèbre unitaire. S’il existe,l’élément neutre du produit vectoriel 1V est un vecteur, contrairement àl’élément neutre de la multiplication scalaire 1K qui, lui, est un scalaire.

Exemple 1A.2. Pour fixer les idées, voici quelques exemples d’algèbresparmi les plus courants :

– Les espaces vectoriels issus d’un corps, tels R et C, forment des al-gèbres associatifs et commutatifs. Ici, le produit vectoriel se confondavec la multiplication scalaire et son élément neutre multiplicatif estle « vecteur » 1.

– L’espace euclidien R3, muni du produit vectoriel standard (exprimé icien coordonnées cartésiennes) :

u× v = (uyvz − uzvy) i + (uzvx − uxvz) j + (uxvy − uyvx) k

est un algèbre non associatif et non commutatif puisque :

(u× v)×w 6= u× (v ×w)u× v 6= v × u

Ce produit vectoriel n’admet pas d’élément neutre.– L’espace L(V) des applications linéaires de V dans lui-même, muni

de la loi interne de composition d’applications, constitue un algèbreassociatif mais non commutatif. L’élément neutre de la compositionest l’application identité.

– L’espaceMn,n des matrices carrées définies sur un corps quelconque,auquel on rajoute la multiplication matricielle, constitue aussi un al-gèbre associatif mais non commutatif. Ici, l’élément neutre de la mul-tiplication matricielle est la matrice identité.

Lorsque V est un K-espace vectoriel de dimension n, alors le K-algèbreL(V) est isomorphe au K-algèbre Mn,n. Ainsi, toutes les opérations surL(V) peuvent s’effectuer à l’aide de matrices. Nous reviendrons sur ce pointau Chapitre 2.

82 Annexe 1B

Annexe 1.B Les nombres complexes

Nous allons maintenant procéder à une brève revue des principales pro-priétés des nombres complexes.

1.B.1 Les opérations arithmétiques sur les nombres com-plexes

De la même façon qu’il nous est possible de représenter tout nombrerationnel à l’aide d’un couple d’entiers, nous pouvons représenter tout nombrecomplexe z à l’aide d’un couple (a, b) de nombres réels, assujetti à certainesrègles :

z = (a, b) a, b ∈ R

où a et b sont appelés respectivement la partie réelle et la partie imaginairedu nombre complexe z, ce que l’on dénote par :

a = <(z) b = =(z)

L’égalité entre deux nombres complexes z1 = (a1, b1) et z2 = (a2, b2)n’est vérifiée que si et seulement si a1 = a2 et b1 = b2.

Lorsque la partie imaginaire de z est nulle, nous sommes effectivementen présence d’un nombre réel :

∀x ∈ R, x = (x, 0)

Par conséquent, R ⊆ C.Si (x, 0) est un nombre purement réel, le nombre complexe (0, x), où

x 6= 0, est par ailleurs un nombre imaginaire pur. Le nombre complexe (0, 1)est tellement particulier qu’il mérite son propre symbole, soit i :

idéf.=== (0, 1)

Cette représentation sous forme de couple s’avère pratique pour définirles opérations usuelles d’addition, de multiplication, de soustraction et dedivision sur les nombres complexes. Ainsi, l’addition de deux nombres com-plexes est définie par :

z1 + z2 = (a1, b1) + (a2, b2) = (a1 + a2, b1 + b2) (1B-1)

et la multiplication par :

z1 · z2 = (a1, b1) · (a2, b2) = (a1a2 − b1b2, a1b2 + a2b1) (1B-2)

1.B.1 Les opérations arithmétiques sur les nombres complexes83

Si l’on multiplie le nombre complexe i par lui-même, on obtient :

i2 = i · i = (0, 1) · (0, 1) = (−1, 0) = −1

ce qui justifie presque l’abus d’écriture suivant : i =√−1 43.

L’élément neutre additif et l’élément neutre multiplicatif pour le corpsdes complexes C sont respectivement (0, 0) et (1, 0), ce qui correspond auxmêmes valeurs que pour le corps des réels R.

L’inverse additif −z d’un nombre complexe z quelconque est défini parla règle :

z + (−z) = (−z) + z = (0, 0) = 0

Il s’ensuit que, si z = (a, b), alors −z = (−a,−b). L’existence d’un élémentinverse additif nous permet par ailleurs de définir la soustraction de deuxnombres complexes :

z1 − z2déf.=== z1 + (−z2)

L’inverse multiplicatif z−1 d’un nombre complexe non-nul z est définipar la règle :

z · z−1 = z−1 · z = (1, 0) = 1

Si z = (a, b), alors :

z−1 =(

a

a2 + b2,−b

a2 + b2

)Ceci nous permet de définir la division du nombre complexe z1 par le nombrecomplexe non-nul z2 comme le produit de z1 par l’inverse multiplicatif dez2 :

z1z2

déf.=== z1 · z−12

ou, plus explicitement, en utilisant 1B-2 :

z1z2

=(a1a2 + b1b2a2

2 + b22,a2b1 − a1b2a2

2 + b22

)(1B-3)

Dans le cas particulier où z1 = (a1, 0) et z2 = (a2, 0), on note que lesopérations arithmétiques sur les nombres complexes se confondent avec lesopérations arithmétiques correspondantes sur les nombres réels.

43. L’usage inconsidéré de l’abus d’écriture i =√−1 peut conduire à des absurdités.

Par exemple : i =√−1 =

√1

−1=

1√−1

=1

i=−i2

i= −i.

84 Annexe 1B

1.B.2 La conjugaison complexe

La conjugaison complexe est à la fois une des plus simples et une des plusimportantes opérations que l’on puisse effectuer sur un nombre complexe.

Le conjugué complexe d’un nombre complexe z = (a, b) est défini commele nombre complexe z∗ = (a,−b) qui possède la même partie réelle que z,mais dont la partie imaginaire est de signe opposé.

Les identités suivantes sont facilement vérifiées.

(z1 + z2)∗ = z∗1 + z∗2 (1B-4a)(−z)∗ = −z∗ (1B-4b)

(z1 − z2)∗ = z∗1 − z∗2 (1B-4c)(z1z2)∗ = z∗1z

∗2 (1B-4d)

(z∗)∗ = z (1B-4e)(z1z2

)∗=z∗1z∗2, z2 6= 0 (1B-4f)

<(z) =12

(z + z∗) (1B-4g)

=(z) =12i

(z − z∗) (1B-4h)

On vérifie à l’aide de 1B-2 que le produit d’un nombre complexe avec sonconjugué donne toujours un nombre réel non-négatif.

zz∗ = (a, b) · (a,−b) = a2 + b2 > 0 (1B-5)

Cette propriété facilite la divison de deux nombres complexes quelconquescar on peut rationaliser le dénominateur de la façon suivante :

z1z2

=z1z2

z∗2z∗2

=z1z∗2

a22 + b22

1.B.3 La forme algébrique des nombres complexes

Si la représentation par un couple de nombre réels rend triviales les opé-rations d’addition et de soustraction sur les nombres complexes, il n’en vapas autant pour la multiplication et la division. Les formules 1B-2 et 1B-3sont lourdes et se prêtent mieux à la programmation qu’à la mémorisation.Heureusement, nous n’avons nul besoin de les retenir car nous pouvons ai-sément passer à une représentation algébrique des nombres complexes en

1.B.4 La forme trigonométrique des nombres complexes 85

utilisant le fait que tout nombre imaginaire pur (0, b) puisse être réécrit sousforme du produit :

(0, b) = (0, 1) · (b, 0) = ib

Ainsi, tout nombre complexe z = (a, b) peut être représenté sous la formealgébrique z = a+ ib, puisque :

z = (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1) · (b, 0) = a+ ib

La forme z = a+ ib combinée à l’identité i2 = −1 permet de traiter algé-briquement les nombres complexes comme s’il s’agissait de nombres réels. Parexemple, la multiplication « algébrique » des nombres complexes s’effectuecomme suit :

z1z2 = (a1 + ib1)(a2 + ib2) = a1a2 + ia1b2 + ia2b1 + i2b1b2

= (a1a2 − b1b2) + i(a1b2 + a2b1) = (a1a2 − b1b2, a1b2 + a2b1)

Nous retrouvons exactement le même résultat qu’en 1B-2 sans avoir be-soin d’en mémoriser la formule. À partir de maintenant, nous délaisserons lareprésentation des nombres complexes sous la forme de couple au profit dela représentation algébrique.

Le lieu géométrique des nombres complexes est le plan d’Argand, ou plancomplexe, qui ressemble à s’y méprendre au plan cartésien (voir Fig. 1.9).Notons d’abord le changement de nomenclature des axes de coordonnées :l’abcisse et l’ordonnée du plan cartésien sont rebaptisés axe réel et axe ima-ginaire dans le plan d’Argand. La différence majeure est que l’échelle de l’axeimaginaire est maintenant graduée en multiples du nombre imaginaire pur i.

Il est clair que l’on peut définir une bijection 44 F : R2 → C entre lesdeux plans, par exemple :

(a, b) 7→ a+ ib

mais un point du plan cartésien se distingue toujours du point correspondantdans le plan d’Argand en ce sens que le premier est un 2-uplet alors que lesecond est un être mathématique complet en soi (1-uplet).

1.B.4 La forme trigonométrique des nombres complexes

L’équation 1B-5 nous permet de définir le module d’un nombre complexez = a+ ib, que l’on dénote par |z|, comme étant la racine carrée positive duproduit de z et de son conjugué complexe z∗.

|z| déf.===√zz∗ =

√a2 + b2 (1B-6)

44. Les applications bijectives ou bijections sont définies à la section 1.2.4.

86 Annexe 1B

1 2 3 4

1

2

3

4

0

abcisse

ordonnée

R× R

(a)

(a, b)b

a 1 2 3 4

i

i

i

i

2

3

4

0

axe réel

axe imaginaire

C

(b)

z = a + ibib

a

Figure 1.9 – (a) Plan cartésien (b) Plan d’Argand

Le module d’un nombre complexe est bien évidemment un nombre réelnon-nul, |z| > 0. Le carré du module est tout simplement :

|z|2 = zz∗ = a2 + b2

Note. Il est important de préciser que |z|2 6= z2, puisque :

z2 = (a+ ib)2 = (a2 − b2) + i(2ab)

et donc, généralement, z2 est un nombre complexe alors que |z|2 est toujoursréel.

Les identités suivantes sont facilement vérifiées.

|z| = |z∗| (1B-7a)|z1z2| = |z1||z2| (1B-7b)

Puisqu’il nous est toujours permis de réécrire un nombre complexe diffé-rent de zéro sous la forme :

z = a+ ib =√a2 + b2

(a√

a2 + b2+ i

b√a2 + b2

)et que :

−1 6a√

a2 + b26 1, −1 6

b√a2 + b2

6 1

nous pouvons toujours trouver un θ ∈ [0, 2π) pour lequel cos θ = a√a2+b2

et

sin θ = b√a2+b2

45. Et puisque |z| =√a2 + b2, nous obtenons alors la forme

trigonométrique des nombres complexes :

z = |z|(cos θ + i sin θ) (1B-8)

45. Notons que cos2 θ + sin2 θ = 1, comme il se doit.

1.B.5 Les fonctions de la variable complexe 87

Note. L’équation 1B-8 reste valide même lorsque z est nul puisque, dansce cas, |z| = 0 (c’est le seul cas où θ demeure indéterminé).

1.B.5 Les fonctions de la variable complexe

L’analyse complexe est une des branches les plus réussies des mathé-matiques qui, à bien des égards, est beaucoup plus complète que celle del’analyse réelle. La principale raison tient au fait que la définition de la dé-rivée en un point d’une fonction de la variable complexe est beaucoup plusrestrictive qu’elle ne l’est pour une fonction de la variable réelle. Dans cedernier cas, le point est situé sur la droite des réels et le processus de limitene nous permet de tendre vers ce point que selon deux directions, soit parla gauche ou soit par la droite. La fonction est dite dérivable en ce pointssi la « dérivée à gauche » est égale à la « dérivée à droite ». Dans le casd’une fonction de la variable complexe, le « point » est situé dans le pland’Argand et il existe une infinité de façons différentes de s’en approcher.Une fonction de la variable complexe n’est dérivable en ce point que si leprocessus de limite est indépendant du chemin choisi 46. Il s’agit en réalitéd’une contrainte heureuse car c’est cette « isotropie » de la dérivée au senscomplexe qui permet à la théorie de prendre tout son envol.

Nous serons principalement concernés dans ce texte par les fonctionsuniformes du type :

f : C→ Cplus particulièrement celles qui sont dérivables en tout point d’un ouvert 47

du plan complexe. Ces fonctions sont appelées fonctions holomorphes et ellespossèdent la propriété remarquable d’être localement analytiques, c.-à-d.qu’elles admettent un développement en série entière en chaque point del’ouvert. Une fonction uniforme qui est définie et holomorphe sur l’ensembledu plan complexe est appelée fonction entière.

Le prototype de la fonction entière est la fonction exponentielle complexeez. Tout comme l’exponentielle réelle admet un développement en série surl’ensemble de son domaine :

∀x ∈ R, ex =∞∑n=0

xn

n!

46. La condition nécessaire et suffisante pour qu’une fonction de la variable complexesoit différentiable en un point est que la fonction vérifie les équations de Cauchy-Riemannen ce point.47. La notion topologique d’ouvert est définie formellement à la section 1.C.1. Pour fins

de la discussion présente, on peut considérer un ouvert comme étant l’intérieur d’un cercledans le plan d’Argand.

88 Annexe 1B

l’exponentielle complexe admet aussi un développement en série sur l’en-semble du plan complexe :

∀z ∈ C, ez =∞∑n=0

zn

n!(1B-9)

Outre la fonction ez, l’autre fonction qui retiendra notre attention, dansune moindre mesure, est la fonction logarithme complexe ln z. Une com-plication résulte du fait que ln z est multiforme. Nous verrons un peu plusloin qu’il est possible de la transformer en fonction uniforme en limitantson domaine de définition. Une fois ceci accompli, ln z devient une fonctionholomorphe sur l’ensemble du plan complexe, à l’exception du point z = 0.

Ces quelques lignes ne rendent pas justice à la théorie de l’analyse com-plexe. Le lecteur intéressé à en connaître davantage est invité à consulter letexte classique d’Ahlfors[1] ou celui, plus récent, de Needham[11] qui proposeune approche plus géométrique.

1.B.6 La forme exponentielle des nombres complexes

Substituant la représentation algébrique de z dans la fonction ez, nousobtenons :

ez = ea+ib = eaeib (1B-10)

Ainsi, l’exponentiation d’un nombre complexe quelconque équivaut auproduit d’une exponentiation réelle et de l’exponentiation d’un nombre ima-ginaire pur. Concentrons-nous sur ce deuxième facteur. Pour l’occasion, noussubstituons le symbole θ en lieu de b (nous insistons sur le fait que θ est unevaleur réelle). Par 1B-9 :

eiθ =∞∑n=0

(iθ)n

n!

= 1 + iθ +i2θ

2

2!+i3θ

3

3!+i4θ

4

4!+i5θ

5

5!+i6θ

6

6!+i7θ

7

7!+ · · ·

=[1− θ2

2!+θ4

4!− θ6

6!+ · · ·

]+ i

[θ − θ3

3!+θ5

5!− θ7

7!+ · · ·

]= cos θ + i sin θ

puisque les quantités apparaissant dans les crochets sont respectivement lesdéveloppements en série de Taylor des fonctions réelles cos θ et sin θ.

1.B.6 La forme exponentielle des nombres complexes 89

Nous obtenons ainsi une des plus belles formules des mathématiques, dueà Leonhard Euler :

eiθ = cos θ + i sin θ (1B-11a)

Il est trivial de vérifier que :

e−iθ = cos θ − i sin θ (1B-11b)

Puisque (e±iθ)n = e±inθ, nous obtenons directement la formule de DeMoivre :

(cos θ ± i sin θ)n = cosnθ ± i sinnθ (1B-12)

On vérifie trivialement que le conjugué complexe de eiθ est e−iθ et que,quelle que soit la valeur de θ, eiθ est de module 1 :

|eiθ| = 1

De fait, tout nombre complexe eiθ est un élément de U(1), le groupeunitaire de degré 1 :

U(1) = {z ∈ C : |z| = 1}

eiθ

θ

i

−i

−1 1

(a) (b)

Figure 1.10 – (a) Le nombre complexe eiθ est toujours situé sur le cercleunité du plan d’Argand (b) Démonstration géométrique de l’identité d’Euler

Ainsi, lorsque θ varie continuellement de 0 à 2π, le point eiθ se déplacecontinuellement le long de la circonférence du cercle unité, dans le sens anti-horaire. Si l’on permet à θ de varier sur l’ensemble des réels, alors la fonctionf : R → C définie par f(θ) = eiθ est périodique de période imaginaire 2πipuisque :

eiθ = ei(θ+2π)

et e2πi = 1. On peut donc parcourir ce trajet circulaire autant de fois quel’on veut, dans un sens comme dans l’autre.

90 Annexe 1B

Remarque. Lorsque θ = π, on obtient la fameuse identité d’Euler quicombine cinq des constantes les plus fondamentales des mathématiques :

eiπ + 1 = 0 (1B-13)

En combinant les équations 1B-8 et 1B-11a, nous obtenons la représen-tation exponentielle des nombres complexes :

z = |z| eiθ (1B-14)

On appelle θ l’argument de z, que l’on dénote aussi par Arg z. Danscertains ouvrages, on retrouve parfois l’écriture z = |z| eiArg z. On pourravérifier qu’effectivement cos θ = a√

a2+b2et sin θ = b√

a2+b2et que l’argument

de z est donné par :

θ = tan−1 b

a(1B-15)

lorsque z n’est pas un nombre imaginaire pur (a 6= 0). Le conjugué complexeest donné par :

z∗ = |z| e−iθ

Si l’on pose r = |z|, on fait ressortir le lien évident entre la représentationexponentielle d’un nombre complexe et les coordonnées polaires (r, θ) dupoint correspondant dans le plan cartésien :

z = reiθ (1B-16)

0 a

ib

−ib

plan d’Argand

z

z∗

|z|

|z∗|

θ−θ

(1) z = a + ib; z∗ = a− ib

(2) |z| = |z∗| =√

a2 + b2

(3) θ = arctan(

b

a

)(4) a = <(z) = |z| cos θ

(5) b = =(z) = |z| sin θ

(6) z = |z|eiθ; z∗ = |z|e−iθ

(7) zz∗ = |z|2

Figure 1.11 – Représentation géométrique des nombres complexes dans leplan d’Argand

1.B.7 Appréciation des nombres complexes 91

De toutes les représentations des nombres complexes vues jusqu’à pré-sent, la représentation exponentielle est de loin celle qui nous sera la plusutile. La représentation exponentielle n’est pas idéale pour les opérationsd’addition et de soustraction mais se révèle très appropriée pour les opéra-tions de multiplication et de division :

z1z2 = |z1| eiθ1 |z2| eiθ2 = |z1z2| ei(θ1+θ2) (1B-17a)

z1z2

=|z1| eiθ1|z2| eiθ2

=|z1||z2|

ei(θ1−θ2) (1B-17b)

Nous pouvons nous servir de l’équation 1B-16 pour définir le logarithmecomplexe :

ln z = ln(reiθ) = ln r + iθ (1B-18)

avec ln z = −∞ lorsque z = 0. Cette définition respecte bien la propriétéprincipale des logarithmes qui est de transformer des multiplications en ad-ditions :

ln z1z2 = ln(r1eiθ1 r2eiθ2) = ln r1 + iθ1 + ln r2 + iθ2 = ln z1 + ln z2

On remarquera à l’équation 1B-18 que la partie imaginaire de ln z n’estautre que l’argument de z. Contrairement à l’exponentielle complexe, le lo-garithme complexe n’est pas une fonction périodique de période imaginaire2πi. On peut concevoir ln z comme une fonction multiforme à une infinitéde branches uniformes. En restreignant l’argument à l’intervalle [0, 2π), ez

et ln z redeviennent des fonctions réciproques. Tout comme dans le cas de lavariable réelle, les identités suivantes s’appliquent alors :

z = ln ez = eln z (1B-19)

1.B.7 Appréciation des nombres complexes

Découvre-t-on ou invente-t-on les mathématiques ? Le cas des nombrescomplexes semble faire résolument pencher la balance en faveur de la pre-mière hypothèse. Découverts durant la Renaissance italienne, à une époqueoù même les nombres négatifs étaient suspects, leur acceptation s’est faite àreculons au cours des siècles qui suivirent.

À l’époque, la méthode de résolution des équations du second degré étaitbien connue. La traduction latine de l’ouvrage du grand mathématicien perseal-Khwarizmi, Kitâb al-jabr w’al-muqâbala, publié originalement en 825, était

92 Annexe 1B

disponible en Europe depuis le XIIème siècle. Dans cet ouvrage, le père del’algèbre (à qui l’on doit aussi notre système décimal de numérotation), pro-pose un traitement systématique des équations quadratiques.

De nos jours, tout étudiant du secondaire connaît la solution algébraïquede l’équation ax2 + bx+ c = 0 :

x1, x2 =−b±

√b2 − 4ac

2a(1B-20)

mais il est instructif d’aborder le problème selon une approche géométrique.Pour cela, il est avantageux de réécrire ax2 + bx+ c = 0 sous la forme :

x2 = px+ q (1B-21)

où p = −b/a et q = −c/a.Géométriquement, les racines de l’équation 1B-21 sont les points d’in-

tersection d’une parabole (membre de gauche) avec une droite quelconque(membre de droite). Lorsque la pente de la droite est nulle (p = 0), nousobtenons deux points d’intersection lorsque q > 0, un point d’intersectionlorsque q = 0 (l’abcisse est alors tangente à la parabole) et aucun point d’in-tersection lorsque q < 0. Le même scénario se produit lorsque la pente estnon-nulle.

x

y

y = x2

−√q√

q

y = q

(a)

x

y

y = x2

y = px + q

q

(b)

Figure 1.12 – (a) cas où p = 0 (b) cas où p < 0 (les mêmes conclusionss’appliquent lorsque p > 0)

Supposons maintenant que la pente soit négative, comme c’est le cas àla Fig. 1.12b. Le nombre de points d’intersection dépend de la valeur dudiscréminant b2−4ac de l’équation 1B-20. Lorsque ce dernier est positif, nulou négatif, on a respectivement deux, un ou aucun points d’intersection. Par


symétrie, on obtient des résultats similaires lorsque la pente est positive. Laprojection verticale de ces points d’intersection sur l’abcisse détermine lesracines de l’équation quadratique.

Jusqu’au milieu du XVIème siècle, les mathématiciens n’éprouvèrent au-cune motivation à définir la racine carrée d’un nombre négatif. Lorsque lediscréminant était négatif, on disait simplement que l’équation quadratiquen’admettait pas de solutions réelles. C’est la recherche d’une méthode sys-tématique de résolution des équations du troisième degré, dont la formegénérale est donnée par ax3 + bx2 + cx+ d = 0, qui fit basculer cet état dechoses.

Cette fois, il est avantageux de réduire l’équation ax3 + bx2 + cx+d = 0,en effectuant le changement de variable suivant : x → x − b/3a, de façon àfaire disparaître le terme quadratique et ainsi obtenir 48 :

x3 = px+ q (1B-22)

(nous avons conservé le même symbole x pour désigner la variable transfor-mée). Géométriquement cette fois, les racines de l’équation cubique sont lespoints d’intersection de la courbe plane du troisième degré x3 avec une droitequelconque. On remarquera que lorsque la pente de la droite est négative, iln’existe qu’un et un seul point d’intersection.

x

y

y = x3

y = px + q

x1

(a)

x

y

y = x3

y = px + q

x1 x2 x3

q

(b)

Figure 1.13 – (a) cas étudié par Tartaglia (p 6 0) (b) casus irreducibilisconstaté par Cardano

48. On verifiera que p = b2

3a2 − caet q = − 2b3

27a3 + bc3a2 − d

a.

94 Annexe 1B

En 1535, il devint évident que le professeur de mathématiques NiccoloFontana, dit "Tartaglia", était en possession d’une méthode de résolutiongénérale pour une classe particulière d’équations du troisième degré, corres-pondant au cas où la pente de la droite est négative 49 (voir Fig. 1.13a). En1539, Gerolamo Cardano, alors conférencier en mathématiques à la fonda-tion Piatti de Milan, supplia Tartaglia de lui faire part de sa méthode. Cedernier acquiesca en soutirant toutefois à Cardano la promesse de ne jamaisla dévoiler à quiconque 50. Par la suite, Cardano généralisa la méthode pourinclure le cas où la pente est positive (voir Fig. 1.13b). Il obtint alors laformule générale suivante :

3

√√√√q

2+

√(q

2

)2

−(p

3

)3

+3

√√√√q

2−

√(q

2

)2

−(p

3

)3

Cette formule ne pose aucun problème lorsque p 6 0 ou même lorsquep > 0 et que (q/2)2 > (p/3)3. Mais le cas où p > 0 et (q/2)2 < (p/3)3 provo-quait chez Cardano une véritable dissonance cognitive car c’est précisémentle cas où la droite intersecte la courbe y = x3 en trois endroits distincts !Pour obtenir une solution qu’il savait bien réelle, il était forcé de prendrela racine carrée d’un nombre négatif. Par exemple, la méthode de Cardanodonne pour l’équation :

x3 = 15x+ 4

des solutions exprimées sous la forme :

3

√2 +√−121 +

3

√2−√−121 (1B-23)

ce qui, à première vue, ne semble pas favoriser une solution réelle, parexemple x = 4 51. Ne sachant comment opérer sur des nombres complexespour obtenir des solutions réelles, il qualifia ce cas particulier de casus irredu-cibilis. Cardano croyait avoir découvert une moisissure dans le tissu parfaitdes mathématiques. Mais contrairement à Alexander Fleming, il lui manqual’ouverture d’esprit nécessaire pour transformer cette moisissure en décou-verte scientifique majeure.

49. Puisqu’à l’époque on évitait autant que possible l’utilisation des nombres négatifs,cette classe de problèmes aurait plutôt été formulée ainsi : x3 + px = q, avec p > 0.50. Tartaglia supplémentait ses revenus en participant à des défis publics lancés par

d’autres mathématiciens. Il cherchait ainsi à conserver un avantage compétitif en gardantses méthodes secrètes.51. C’est pourtant exact ! Les valeurs réelles 4,−2+

√3 et −2−

√3 sont bien les valeurs

réduites de l’expression 1B-23.


En 1545, Cardano publia sa méthode 52 dans son livre Ars Magna etrévéla au monde entier la louche « réalité » des racines carrées de nombresnégatifs.

C’est le début de la longue saga des nombres complexes qui s’échelonnesur plusieurs siècles. Déjà en 1569, dans son livre L’Algebra, l’italien RaffaeleBombelli contribue à la compréhension des nombres imaginaires en intro-duisant les symboles i et −i. En 1593, le français François Viète offre unepremière solution du casus irreducibilis en utilisant des arguments trigono-métriques. En 1629, le français Albert Girard postule qu’une équation algé-brique possède autant de racines que son degré, même s’il doit se trouver queces racines ne soient pas toutes réelles. Au siècle suivant, le suisse LeonardEuler rendit plus palpable le concept d’un nombre complexe en identifiantles trois racines cubiques de l’unité et en léguant à l’humanité une de sesplus belles formules mathématiques. Dans sa dissertation doctorale de 1799,l’allemand Carl Friedrich Gauss démontra rigoureusement le théorème fon-damental de l’algèbre intuitionné par Girard. En 1806, le suisse Jean-RobertArgand, fournit une interprétation géométrique des nombres complexes entant que points dans un plan. Dans la première moitié du XIXème siècle, lefrançais Augustin-Louis Cauchy établit tous les fondements de l’analyse com-plexe. En 1843, l’irlandais William Rowan Hamilton généralisa les nombrescomplexes à un espace à quatre dimensions, inventant ainsi les nombres hy-percomplexes appelés quaternions.

Mais, ironiquement, l’ultime démarche qui fit passer le statut des nombrescomplexes de simple « artifice de calcul » à celui d’objet mathématique légi-time n’en fut pas une qui cherchait à les démarquer davantage des nombresréels mais plutôt une qui visait à fondre les deux concepts dans le creusetd’une seule et même abstraction. Élaborée par le dernier élève de Gauss,Richard Dedekind, et formalisée en 1895 par son ami Heinrich Weber dansson livre Lehrbuch der Algebra, le concept de corps 53 vient enrichir la théoriealgébrique des nombres. Désormais, il est d’usage de considérer les nombresréels et complexes comme deux représentations spécifiques d’une structurealgébrique abstraite dont ils héritent leurs propriétés. Vus sous cet angle, lesréels ne sont pas moins « imaginaires » que les complexes !

52. En 1543, lors d’une visite à Bologne, Cardano obtint la confirmation que Scipionedel Ferro, un professeur de mathématiques à l’Université qui était décédé en 1526, avaitété le premier à découvrir la méthode de résolution de l’équation cubique sans toutefoisla publier. Se sentant libéré de sa promesse faite à Tartaglia, Cardano décida de publierses propres résultats. Il s’ensuivit une violente querelle entre les deux hommes qui sepoursuivit jusqu’à la mort de Tartaglia en 1557.53. Körper, en allemand, dont on retiendra le symbole K pour désigner un corps quel-

conque.

96 Annexe 1B

Que retient-on aujourd’hui de la nature propre des nombres, qu’ils soientréels ou complexes ? Je ne crois pas me tromper en disant que, pour le mathé-maticien moderne, les nombres complexes ne suscitent plus la méfiance maisbien l’admiration. Le célèbre mathématicien Roger Penrose[13] va même jus-qu’à les qualifier de « nombres magiques ». Le sentiment actuel s’en trouvebien résumé par la citation suivante, attribuée au mathématicien francaisJacques Hadamard 54 :

Le plus court chemin entre deux vérités dans le domaine réelpasse par le domaine complexe.

Les ingénieurs, qui sont des gens pratiques, utilisent couramment la nota-tion complexe pour décrire des quantités physiques pourtant bien réelles. Parexemple, l’intensité du champ électrique d’une onde plane monochromatiquevarie selon :

E = E0 cos(k · r− ωt)

Les ingénieurs préférent toutefois travailler avec l’expression complexe sui-vante :

E0ei(k·r−ωt)

quitte à traîner dans leurs calculs une partie imaginaire, sans aucune contre-partie physique, qu’ils laisseront ultérieurement tomber pour ne retenir quela partie réelle de l’expression finale, selon :

E = <(E0e

i(k·r−ωt))Mais, de tous les scientifiques, ce sont assurément les physiciens qui ap-

précient le plus les nombres complexes pour leur qualité intrinsèque. Qu’onse le dise : à la plus petite échelle, les lois qui régissent notre univers sontfondamentalement tributaires des nombres complexes. De tous les systèmesde nombres que nous ayons découverts ou inventés, c’est encore celui quidécrit le plus adéquatement la réalité des phénomènes naturels.

54. Une certaine controverse existe toujours quant à l’origine précise de cette citationdont la formulation concise est souvent préférée à le citation antérieure dûe au mathé-maticien et à l’homme politique français Paul Painlevé, sur laquelle il ne plane aucuneéquivoque : Il apparut que, entre deux vérités du domaine réel, le chemin le plus facile etle plus court passe souvent par le domaine complexe.

1.C Topologie générale 97

Annexe 1.C Topologie générale

La topologie générale puise ses racines dans la théorie des ensembles. Elleformalise la notion intuitive de « proximité » entre les éléments, même lorsquel’espace en question n’est qu’un ensemble de points dénué de norme, demétrique ou de toute structure additionnelle. Elle permet l’étude de conceptsfondamentaux tels que la convergence d’une suite de points et la continuitédes applications définies sur de tels espaces.

Cet annexe se veut une introduction élémentaire à la topologie générale.La théorie s’applique à des ensembles quelconques X qui ne sont ni néces-sairement des espaces vectoriels, ni nécessairement des espaces métriques.

1.C.1 Les espaces topologiques

Convention. L’ensemble des parties de l’ensemble X sera désigné parP(X).

Définition 1C.1 Soit X un ensemble non vide. Une famille T ⊆ P(X)est une topologie sur X si les trois axiomes suivants sont vérifiés :

– L’ensemble vide ∅ de même que X appartiennent à T :

∅, X ∈ T (1C-1a)

– L’union quelconque d’éléments de T appartient à T :

Gi ∈ T , i ∈ I a =⇒⋃i∈I

Gi ∈ T (1C-1b)

– L’intersection finie d’éléments de T appartient à T :

Gi ∈ T , i ∈ {1, . . . , n} =⇒⋂

i∈{1,...,n}

Gi ∈ T (1C-1c)

Le couple (X, T ) forme alors un espace topologique b.

a. L’ensemble des indices I peut être fini, dénombrable ou non dénombrable.b. Pour soulager l’écriture, il suffira de parler simplement de l’espace topologique X

plutôt que de l’espace topologique (X, T ) sans que cela prête à confusion.

Les éléments d’une topologie T sont appelés des ouverts 55. Les complé-

55. Les lois de Morgan nous offrent une façon équivalente de définir une topologie enchoisissant plutôt le fermé comme unité fondamentale. Nous poursuivrons ici l’usage gé-néral qui privilégie l’ouvert.

98 Annexe 1C

mentaires des ouverts dans X sont appelés des fermés. Il est important debien comprendre qu’en topologie les notions d’ouverts et de fermés ne sontpas mutuellement exclusives. D’ailleurs le premier axiome nous garantit quetoute topologie contient des éléments qui sont à la fois des ouverts et desfermés. En effet, les ouverts X et ∅ sont mutuellement complémentairespuisque X\∅ = X et que X\X = ∅ ; par conséquent, X et ∅ sont à la foisdes ouverts et des fermés.

Notons qu’il est toujours possible de définir une topologie sur tout en-semble non-vide. Les deux exemples suivants sont incontournables.

Exemple 1C.1. Soit X un ensemble quelconque non vide. La topologieT = {∅, X} dont les seuls ouverts sont l’ensemble vide et l’ensemble X estappelée la topologie grossière.

Exemple 1C.2. Soit X un ensemble quelconque non vide. La topologieT = P(X) où toutes les parties de X sont des ouverts est appelée la topologiediscrète.

Remarque. La topologie grossière et la topologie discrète sont deuxexemples de topologies triviales. Ces deux exemples sont deux cas extrèmesoù tous les éléments de T sont à la fois des ouverts et des fermés. Nousverrons que les topologies les plus désirables sont les topologies non trivialesoù les seuls éléments qui possèdent cette propriété sont ∅ et X.

Le nombre de topologies différentes que l’on peut définir sur un ensemblecroit très rapidement avec la cardinalité de l’ensemble. Ainsi, si l’on ne peutdéfinir qu’une seule topologie sur un ensemble ne contenant qu’un élément(la topologie grossière), on peut en définir quatre sur un ensemble contenantdeux éléments et déjà vingt-neuf sur un ensemble ne contenant que troiséléments.

Exemple 1C.3. Soit l’ensemble X = {a, b, c, d}. Alors,

T1 = {∅, {b}, {a, b}, {b, c}, {b, d}, {a, b, c}, {a, b, d}, {b, c, d}, X}et T2 = {∅, {b}, {d}, {a, b}, {b, c}, {b, d}, {a, b, c}, {a, b, d}, {b, c, d}, X}

sont deux topologies différentes sur X. Notez que les seuls éléments de T1qui soient à la fois des ouverts et des fermés sont ∅ et X, ce qui n’est pasle cas pour T2, car {d} et {a, b, c} ont aussi cette propriété. Remarquez que{a, b, c} est ouvert dans T1 alors qu’il est à la fois ouvert et fermé dans T2. Ilest très important de comprendre que la notion d’« ouvert » et de « fermé »est une notion relative qui dépend du choix de la topologie.

1.C.2 Voisinage d’un point 99

1.C.2 Voisinage d’un point

Dans un espace topologique, les éléments de l’ensembleX sont des points.Remarquez que pour qu’un point x ∈ X soit un ouvert, il faut que le singleton{x} ∈ T .

Définition 1C.2 Soit (X, T ), un espace topologique. Une partie V deX est un voisinage d’un point x ∈ X ssi V contient un ouvert G ∈ T qui luimême contient x.

V ⊆ X est un voisinage de x ⇐⇒ ∃G ∈ T : x ∈ G ⊆ V

xG

VX

Figure 1.14 – La partie V de X est un voisinage du point x puisqu’ellecontient un ouvert G tel que x ∈ G ⊆ V .

Remarque. Pour la définition d’un voisinage, nous n’exigeons pas que lapartie V soit elle-même un ouvert. En fait, il peut s’agir d’un ouvert, d’unfermé ou encore d’un sous-ensemble qui ne soit ni un ouvert, ni un fermé.

Exemple 1C.4. La partie {a, c, d} de l’ensemble X décrit à l’exemple1C.3 n’est un voisinage d’aucun des points de l’espace topologique (X, T1)mais est un voisinage du point d de l’espace topologique (X, T2) (et seulementdu point d).

Proposition 1C.1 Soit (X, T ), un espace topologique. Une partie V deX est un ouvert ssi V est un voisinage de chacun de ses points.

Exemple 1C.5. Il est clair que la partie {a, c, d} de l’exemple 1C.3 n’estpas un ouvert de l’espace topologique (X, T2) puisqu’elle n’est un voisinageni de a ni de c. Dans ce cas précis, on vérifie qu’il s’agit effectivement d’unfermé puisque {a, c, d} = X\{b} où {b} est un ouvert de T2.

100 Annexe 1C

Convention. L’ensemble des voisinages de x est dénoté par V(x), soit :

V(x) = {V ∈ P(X) | ∃G ∈ T , x ∈ G ⊆ V }

Exemple 1C.6. Soit l’ensemble X = {a, b, c, d, e} doté de la topologie :

T = {∅, {b}, {c}, {a, b}, {b, c}, {c, d}, {a, b, c}, {b, c, d}, {a, b, c, d}, X}

L’ensemble des voisinages de d est :

V(d) = {{c, d}, {a, c, d}, {b, c, d}, {c, d, e}, {a, b, c, d}, {a, c, d, e}, {b, c, d, e}, X}

Rappelons que si tout voisinage de d contient un ouvert, il n’est pas néces-sairement un ouvert pour autant. Dans l’exemple, {a, c} est un voisinage dec, mais n’est ni un ouvert, ni un fermé.

1.C.3 Prébase d’un espace topologique

Définition 1C.3 Soit (X, T ), un espace topologique et A un ouvertquelconque. Une famille {Gi}i∈I d’ouverts de T est un recouvrement ouvertde A ssi :

A =⋃i∈I

Gi (1C-2a)

Remarque. Le concept de recouvrement ouvert est utile même lorsque Aest une partie quelconque de X, pas nécessairement un ouvert. Dans ce casil faut remplacer l’égalité dans l’équation 1C-2a par le symbole d’inclusion,soit :

A ⊆⋃i∈I

Gi (1C-2b)

La relation d’ordre partiel d’inclusion, appliquée aux différentes topolo-gies comparables, conduit à la définition suivante :

Définition 1C.4 Soient deux topologies T1 et T2 définies sur un mêmeensemble X. Si :

T1 ⊆ T2alors la topologie T1 est dite moins fine que la topologie T2 et la topologie T2est dite plus fine que la topologie T1.

Exemple 1C.7. À l’exemple 1C.3, la topologie T2 est plus fine que latopologie T1 puisque T1 ⊆ T2.

1.C.3 Prébase d’un espace topologique 101

Remarque. Il est évident que la topologie grossière est la moins fine etla topologie discrète est la plus fine de toutes les topologies que l’on puissedéfinir sur un ensemble quelconque X.

Théorème 1C.2 Soit {Ti}i∈I , une famille quelconque de topologies dé-finies sur un même ensemble X. Alors l’intersection :⋂

i∈ITi

de toutes ces topologies est aussi une topologie sur X.

Exemple 1C.8. Soit l’ensemble X = {a, b, c, d, e} ainsi que les topolo-gies T1 et T2 définies sur X :

T1 = {∅, {b}, {c}, {a, b}, {b, c}, {c, d}, {a, b, c}, {b, c, d}, {a, b, c, d}, X}T2 = {∅, {c}, {e}, {a, e}, {c, d}, {c, e}, {a, c, e}, {c, d, e}, {a, c, d, e}, X}

Alors T1 ∩ T2 = {∅, {c}, {c, d}, X} qui est aussi une topologie sur X.

Il existe plusieurs façons de définir une topologie sur un ensemble. Toutefamille de parties de X peut en effet servir à engendrer une topologie unique.

Définition 1C.5 Soit X un ensemble non-vide et soit A ⊆ P(X) unefamille quelconque de parties de X. La topologie TA engendrée par la familleA de parties de X est l’intersection de toutes les topologies Ti∈I définies surX qui contiennent A :

TA =⋂i∈ITi ∀i ∈ I, A ⊆ Ti

Nous dirons que A est la prébase de la topologie TA.

Note. Une définition alternative de la prébase exige que les éléments dela famille quelconque de parties recouvrent l’espace X. Ce n’est pas le caspour la définition 1C.5.

Remarque. Par construction, la topologie TA est la moins fine des to-pologies contenant la prébase A. Notez que TA existe toujours ; dans le plusextrême des cas, il s’agit de P(X).

102 Annexe 1C

1.C.4 Base d’un espace topologique

La définition 1C.5 nous dit bien que toute prébase A engendre une topo-logie unique TA mais la construction d’une telle topologie peut rapidements’avérer fastidieuse si l’on s’en tient à la méthode décrite. Heureusement, ilexiste une procédure beaucoup plus pratique que nous verrons à la fin decette section.

Définition 1C.6 Soit (X, T ) un espace topologique. Une famille d’ou-verts B = {Bi}i∈I ⊆ T est une base de la topologie T ssi pour chaque ouvertde T , il existe un recouvrement ouvert d’éléments de B :

∀G ∈ T , G =⋃j∈J

Bj , Bj ∈ B

Remarque. Il ne faut en aucun cas confondre base d’un espace vecto-riel et base d’un espace topologique. Les éléments d’une base d’un espacevectoriel sont des vecteurs. D’une part, un espace topologique ne possèdepas nécessairement la structure d’espace vectoriel et de l’autre, les élémentsd’une base d’un espace topologique sont des ouverts.

Nous sommes donc maintenant en mesure, étant donné une topologie Tet une base supposée B, de vérifier que B est bien une base de T . De plus,il est facile de concevoir que, si nous sommes en possession d’une base B,nous pouvons toujours reconstruire la topologie T en prenant l’ensemble detoutes les unions possibles des éléments de B. Mais est-ce que cette procéduredétermine T de façon unique ? Le théorème suivant répond à cette question.

Théorème 1C.3 Soit (X, T ) un espace topologique et B une base deT . Alors B détermine T de façon unique.

Démonstration. Procédons par reductio ad absurdum. Supposons que B soitune même base pour deux topologies différentes, T et T ′. Alors il existeau moins un élément G ∈ P(X) qui appartient à l’une des topologies sansappartenir à l’autre. Sans perte de généralité nous pouvons supposer queG ∈ T mais que G 6∈ T ′. Puisque B est une base de T nous avons que :

G =⋃i∈I

Bi Bi ∈ B

Mais puisque B est aussi une base de T ′, alors toute union d’éléments quel-conques de B doit nécessairement appartenir à T ′. En particulier, G ∈ T ′, cequi contradit notre hypothèse de départ et confirme le fait que la topologieengendrée par la base B est bien unique.

1.C.4 Base d’un espace topologique 103

Ici, un petit caveat s’impose. S’il est vrai qu’une base détermine unetopologie de façon unique, la même topologie peut être engendrée par deuxbases différentes.

Définition 1C.7 Soit (X, T ) un espace topologique et deux basesB1,B2 ⊆ T . Ces deux bases sont dites équivalentes si elles engendrent unemême topologie, c.-à-d. si :

TB1 = TB2

Proposition 1C.4 Soit (X, T ) un espace topologique et B une base deT . Alors toute famille B′ telle que :

B ⊆ B′ ⊆ T

est une base équivalente de T .

Exemple 1C.9. Les bases B = {∅, {b}, {c}, {a, b}, {b, c}, {c, d}, X} etB′ = {∅, {b}, {c}, {a, b}, {b, c}, {c, d}, {a, b, c, d}, X} engendrent toutes deuxla topologie T1 de l’exemple 1C.8.

Les deux théorèmes suivants proposent chacuns une définition équivalentede la base d’une topologie.

Théorème 1C.5 Soit (X, T ) un espace topologique. Une famille B ⊆ Test une base de T ssi ∀G ∈ T et ∀x ∈ G, il existe un Bi ∈ B tel que :

x ∈ Bi ⊆ G

x

Bi

G

X

Figure 1.15 – Si pour tout point x d’un ouvert quelconque G il existe unBi ∈ B tel que x ∈ Bi ⊆ G, alors B est une base de T .

104 Annexe 1C

Théorème 1C.6 Soit X un ensemble non-vide.Une famille d’ouverts B ⊆ P(X) est la base d’une topologie unique TB oùTB = {A ⊆ X | A est l’union d’éléments de B} ssi :

1. X est l’union d’éléments de B.2. L’intersection d’une paire quelconque d’éléments de B est aussi l’union

d’éléments de B.

Nous sommes maintenant en mesure de construire une topologie unique àpartir d’une prébase quelconque. Dans un premier temps, nous construisonsl’ensemble de toutes les intersections finies des éléments de la prébase. S’ilsne sont pas déjà présents, nous rajoutons les éléments ∅ et X et, de cettefaçon, nous obtenons une base. En prenant l’ensemble des unions possiblesdes éléments de la base, nous obtenons la topologie désirée.

Exemple 1C.10. Soit l’ensemble X = {a, b, c, d, e} et

A = {{a, e}, {c, d}, {c, e}}

une prébase. Remarquez que l’union des éléments de la prébase ne couvrepas l’ensemble X. L’ensemble des intersections finies de A rajouté de ∅ etde X constitue la base {∅, {c}, {e}, {a, e}, {c, d}, {c, e}, X} de la topologieTA qui est identique à la topologie T2 de l’exemple 1C.8.

1.C.5 Topologie induite

Nous avons beaucoup discouru sur les topologies engendrées par des baseset des prébases. Nous allons maintenant préciser la notion de topologie in-duite sur une partie de X.

Théorème 1C.7 Soit (X, T ) un espace topologique et soit S ⊆ X,une partie de X. La topologie induite de (X, T ) sur S est la topologie T (S)résultant de l’intersection des ouverts de T avec S :

T (S) = {S ∩G | ∀G ∈ T }

Remarque. Un sous-espace S muni de la topologie induite T (S) consti-tue un sous-espace topologique (S, T (S)) de l’espace (X, T ).

1.C.6 Continuité 105

1.C.6 Continuité

La topologie permet de définir la notion de continuité sans faire appel àune métrique quelconque.

Définition 1C.8 Soient (X, TX) et (Y, TY ), deux espaces topologiques.Une application F : X → Y est dite continue ssi l’image réciproque (lapréimage) de tout ouvert de TY est un ouvert de TX , c.-à-d. ssi :

∀GY ∈ TY , F−1[GY ] ∈ TX

GX

GY

(X, TX) (Y, TY )F−1

Figure 1.16 – L’application F est continue ssi la préimage de tout ouvertde TY est un ouvert de TX .

Remarque. L’expression F−1 utilisée à la définition 1C.8 de même qu’àla Fig. 1.16 doit être interprétée comme la correspondance réciproque au sensde la théorie des ensembles, c.-à-d. :

F−1[A] = {x ∈ X | A ⊆ Y et F (x) ∈ A}

ce qui n’implique pas que l’application F soit inversible. Autrement dit, l’uti-lisation de l’expression F−1 n’implique pas dans ce contexte que F soit unebijection. Le lecteur devrait se convaincre que si la topologie TX est la topolo-gie discréte P(X) ou que si la topologie TY est la topologie grossière {∅, Y },alors l’application F sera toujours continue, quel que soit la façon dont elleest définie (Pourquoi ?).

Remarque. La définition de la continuité n’implique pas que l’imaged’un ouvert soit aussi un ouvert.

106 Annexe 1C

Remarque. On peut aussi caractériser la continuité à l’aide de fermés.Ainsi, l’application F est continue ssi la préimage de tout fermé de TY estun fermé de TX (Voir le Prob. 1.15).

Remarque. Une application continue peut cesser de l’être (tout commeune application non continue peut le devenir) par un remplacement appropriéd’une des topologies. Ainsi, nous pourrions être portés à croire que l’applica-tion identité F (x) = x est trivialement continue, mais même dans ce cas, lechoix des topologies demeure le facteur discréminant (Voir le Prob. 1.17).

Exemple 1C.11. Soient (X, TX) et (Y, TY ) deux espaces topologiquesoù X = {a, b, c, d, e}, Y = {m,n, o, p, q} et :

TX = {∅, {a}, {b}, {a, b}, {b, c, d}, {a, b, c, d}, X}TY = {∅, {n}, {o}, {m,n}, {n, o}, {o, p}, {m,n, o}, {n, o, p}, {m,n, o, p}, Y }

Soit l’application F : X → Y définie ainsi (voir Fig. 1.17) :

F (a) = m; F (b) = n; F (c) = n; F (d) = n; F (e) = q

a

b

c

d

e

m

n

o

p

q

X Y

F

Figure 1.17 – L’application F est continue pour les topologies TX et TY del’exemple 1C.11.

Alors F est continue pour les topologies TX et TY puisque la préimagede chaque ouvert de TY est un ouvert de TX :

1.C.6 Continuité 107

F−1[∅] = ∅;

F−1[Y ] = X;

F−1[{n}] = {b, c, d};F−1[{o}] = ∅;

F−1[{m,n}] = {a, b, c, d};F−1[{n, o}] = {b, c, d};F−1[{o, p}] = ∅;

F−1[{m,n, o}] = {a, b, c, d};F−1[{n, o, p}] = {b, c, d};F−1[{m,n, o, p}] = {a, b, c, d};

Remarquez que F n’est pas inversible puisqu’il ne s’agit pas d’une bijectionet que l’image d’un ouvert de TX n’est pas nécessairement un ouvert de TY(par exemple : F [{a}] = {m}). De plus, si l’on substitue à TX la topologie :

T ′X = {∅, {a}, {b}, {a, b}, {a, b, c, d}, X}

l’on vérifiera que F cesse d’être continue.

Selon la définition donnée en 1C.8, la continuité est un attribut globald’une application. Il est tout aussi utile de définir une notion locale de lacontinuité, valide en un point précis de l’espace.

Définition 1C.9 Soient (X, TX) et (Y, TY ), deux espaces topologiques.Une application F : X → Y est dite continue en un point a ∈ X ssi lapréimage de tout ouvert GY de TY contenant F (a) est un sur-ensemble d’unouvert GX de TX contenant a, c.-à-.d. ssi :

∀GY ∈ TY , F (a) ∈ GY , ∃GX ∈ TX , a ∈ GX tel que GX ⊆ F−1[GY ]

ou de façon équivalente :

∀GY ∈ TY , F (a) ∈ GY , ∃GX ∈ TX , a ∈ GX tel que F [GX ] ⊆ GY

Remarque. Pour démontrer qu’une application F n’est pas continue enun point a, il suffit de trouver un seul ouvert GY contenant F (a) dont lapréimage ne contient pas un ouvert contenant a.

108 Annexe 1C

Remarque. On peut donner une définition équivalente de la continuitéen un point en termes de voisinages. Une application F : X → Y est continueen un point a ssi la préimage de tout voisinage de F (a) est un voisinage dea, autrement dit ssi :

∀VY ∈ VY (F (a)), F−1[VY ] ∈ VX(a)

aF (a)GX

GY

X YF−1

Figure 1.18 – L’application F est continue au point a ssi la préimage detout voisinage de F (a) est un voisinage de a. Ici, nous avons choisi un ouvertGY en tant que voisinage de F (a).

Exemple 1C.12. Soit (X, T ) un espace topologique où :

X = {a, b, c, d, e} et T = {∅, {a}, {b}, {a, b}, {b, c, d}, {a, b, c, d}, X}

Soit l’application F : X → X définie ainsi (voir Fig. 1.19) :

F (a) = b; F (b) = a; F (c) = e; F (d) = c; F (e) = d

L’application F n’est pas continue en d car {b, c, d} est un ouvert conte-nant F (d) = c dont la préimage {a, d, e} n’est pas un voisinage de d. Demême, F n’est pas continue en e puisque {b, c, d} est un ouvert contenantF (e) = d dont la préimage {a, d, e} n’est pas un voisinage de e. Enfin, lacontinuité du point c est assurée car le seul ouvert contenant F (c) = e estX, qui est un voisinage de e par défaut.

Remarquez que le fait que l’application F soit une bijection est sansconséquence pour les questions de continuité.

Théorème 1C.8 Soient (X, TX) et (Y, TY ), deux espaces topologiques.Une application F : X → Y est continue ssi F est continue en tout point deX.

1.C.7 Équivalence topologique 109

a

b

c

d

e

a

b

c

d

e

X X

F

Figure 1.19 – L’application F de l’exemple 1C.12 est continue pour lespoints a, b et c mais non pour les points d et e.

1.C.7 Équivalence topologique

La continuité permet d’établir la notion d’équivalence topologique entredeux espaces.

Définition 1C.10 Soient (X, TX) et (Y, TY ), deux espaces topologiques.Une application F : X → Y est un homéomorphisme ssi F est une bijectioncontinue et si l’application réciproque F−1 est aussi une bijection continue.

Remarque. S’il n’est pas nécessaire que l’application F soit une bijectionpour qu’elle soit continue, il est cependant essentiel que F soit une bijec-tion pour qu’elle soit un homéomorphisme. Le fait que F soit une bijectionentraîne automatiquement l’existence de la bijection réciproque F−1. Parcontre le fait que F soit une bijection continue n’entraîne pas nécessairementla continuité de F−1.

Définition 1C.11 Deux espaces topologiques (X, TX) et (Y, TY ) sontdits homéomorphes, ou topologiquement équivalents, s’il existe une applica-tion F : X → Y qui soit un homéomorphisme.

Convention. Nous utiliserons le symbole ∼= pour représenter le fait quedeux espaces topologiques sont homéomorphes, en écrivant :

(X, TX) ∼= (Y, TY )

« Être homéomorphe à » est aussi une relation d’équivalence.

110 Annexe 1C

Définition 1C.12 Une propriété qui est partagée par tous les espacestopologiquement équivalents est une propriété topologique.

Remarque. La topologie est souvent définie comme étant l’étude despropriétés qui demeurent invariantes sous l’action de transformations conti-nues.

1.C.8 Convergence

Jusqu’à présent, les espaces qui nous ont servi d’exemples étaient des es-paces simples, ne contenant qu’un nombre fini de points. Les espaces qui nousintéressent sont généralement constitués d’une infinité 56 de points. Nouspoursuivons l’étude de tels espaces, en commencant par la notion de conver-gence d’une suite de points dans un espace topologique X.

Rappellons qu’une suite est une application 57 N → X qui associe àchaque n ∈ N un point xn ∈ X :

n 7→ xn

Convention. Nous écrirons symboliquement (xn)n∈N pour désigner unesuite infinie :

(xn)n∈N ≡ x1, x2, . . . , xn, . . .

Définition 1C.13 Soit (X, T ), un espace topologique. Nous dirons quela suite (xn)n∈N de points de l’espace X converge vers le point x ∈ X, ouencore qu’elle admet x comme limite, ssi pour tout ouvert G ∈ T qui contientle point x, il existe un entier positif nG ∈ N tel que :

n > nG =⇒ xn ∈ G

Autrement dit, tous les termes de la suite, à l’exemption possible d’unnombre fini, sont contenus dans G.

Si tel est le cas, alors la suite (xn)n∈N est une suite convergente vers x,ce que nous dénoterons par :

limn→∞

xn = x

Remarque. Le point limite x doit absolument appartenir à X pour quel’on puisse parler de convergence.

56. Cette infinité peut être dénombrable ou non dénombrable.57. On peut utiliser indifféremment N = {0, 1, 2, 3, . . .} ou N\{0} selon le besoin spéci-

fique.

1.C.9 Adhérence 111

Les propriétés des suites convergentes dépendent du choix de la topologietel qu’en témoigne abondamment l’exemple suivant.

Exemple 1C.13. Soit (R, {∅, X}) l’ensemble des réels muni de la to-pologie grossière. Le seul ouvert qui contient des points de X est X lui-mêmeet il les contient tous. De plus, toute suite de réels (xn)n∈N est entièrementcontenue dans X. D’après la définition 1C.13, il s’ensuit que, pour un telespace topologique, toute suite converge vers tous les points de l’espace.

Nous terminons cette section en établissant un lien intéressant entre lanotion de convergence d’une suite et celle de continuité en un point.

Définition 1C.14 Soient deux espaces topologiques (X, TX) et (Y, TY )et soit F : X → Y , une application quelconque.

Nous dirons que F est séquentiellement continue en un point x ∈ X sipour toute suite (xn)n∈N qui converge vers x, la suite (F (xn))n∈N convergeelle aussi vers F (x) dans Y . Symboliquement :

limn→∞

xn = x =⇒ limn→∞

F (xn) = F (x)

Remarque. Il est facile de démontrer que toute application qui est conti-nue en un point est nécessairement séquentiellement continue en ce mêmepoint. Par contre l’inverse n’est pas vrai en général, car il faut pour celaque les espaces vérifient le premier axiome de dénombrabilité (voir section1.C.11).

1.C.9 Adhérence

Nous abordons cette section en introduisant encore d’autres conceptsgénéraux, valides pour tous les espace topologiques.

Définition 1C.15 Soit (X, T ), un espace topologique. Une partie Aest dite dense en X ssi tout ouvert non-vide G ∈ T contient au moins unélément de A, soit :

A est dense en X ⇐⇒ ∀G 6= ∅ ∈ T , G ∩A 6= ∅

Définition 1C.16 Soit (X, T ) un espace topologique. Un point x ∈ Xest un point adhérent à une partie non-vide A ⊆ X ssi tout ouvert contenantx rencontre A, c.-à-d. :

x est un point adhérent à A ⇐⇒ ∀G ∈ T t.q. x ∈ G, G ∩A 6= ∅

112 Annexe 1C

Remarque. On dit qu’un point x est un point isolé si le singleton {x} estun ouvert. Si x est un point isolé, la condition nécessaire pour qu’il soit aussiun point adhérent à A est qu’il doit déjà être contenu dans A (Pourquoi ?).

Une notion très voisine du point adhérent est celle du point d’accumula-tion.

Définition 1C.17 Soit (X, T ) un espace topologique. Un point x ∈ Xest un point d’accumulation d’une partie non-vide A ⊆ X ssi tout ouvertcontenant x rencontre A en un point autre que x, c.-à-d. :

x est un pt. d’accumulation de A⇐⇒ ∀G ∈ T t.q. x ∈ G, G\{x} ∩A 6= ∅

Remarque. Un point isolé ne peut jamais être un point d’accumulation.Le lecteur devrait se convaincre que si un point d’accumulation de A esttoujours un point adhérent à A, à l’inverse, un point adhérent est soit unpoint d’accumulation, soit un point isolé appartenant à A.

Définition 1C.18 Soit (X, T ) un espace topologique. L’adhérenced’une partie non-vide A ⊆ X, dénotée A, est constituée de l’ensemble despoints adhérents à A. Autrement dit :

A = {x ∈ X | ∀G ∈ T t.q. x ∈ G, G ∩A 6= ∅}

Remarque. Il est clair de par la définition 1C.18 que tout point x ∈ Afait nécessairement partie de l’adhérence de A. Par conséquent, il est toujoursvrai que :

A ⊆ A (1C-3)

Remarque. La notion d’adhérence nous offre une façon alternative d’ex-primer le fait qu’une partie A soit dense en X. En effet, la définition 1C.15nous dit qu’une partie A est dense en X ssi tout ouvert non-vide G ∈ Tcontient au moins un élément de A. Ceci équivaut à dire qu’une partie A estdense en X ssi tout point x ∈ X fait partie de l’adhérence de A :

A est dense en X ⇐⇒ A = X (1C-4)

La notion d’adhérence est si importante qu’elle mérite bien une formula-tion alternative.

Proposition 1C.9 Soit (X, T ) un espace topologique. L’adhérenced’une partie non-vide A ⊆ X est l’intersection de tous les fermés contenantA :

A = ∩{F ⊆ X | F est un fermé et A ⊆ F}

1.C.10 Espaces de Hausdorff 113

Exercice 1C.1. Démontrez les trois affirmations suivantes :(i) A est un fermé.(ii) A est le plus petit fermé contenant A.(iii) Une partie A est un fermé ssi A = A.

Démonstration. (i) Il faut montrer que X\A est un ouvert. Il est préfé-rable de faire usage de la notation « complémentaire » suivante :

Scdéf.=== X\S

Puisque A =⋂i∈I

Fi où A ⊆ Fi, nous obtenons, en appliquant la loi de

Morgan :

Ac ={⋂i∈I

Fi

}c=⋃i∈I

F ci

Mais tous les Fi sont des fermés et par conséquent tous les F ci sontdes ouverts. Le terme de droite étant une union quelconque d’ouvertsest donc un ouvert. En conclusion, Ac est un ouvert et A est bien unfermé.

(ii) Puisque A = ∩i∈I

Fi, il s’ensuit que tout fermé F contenant A est un

sur-ensemble de A :A ⊆ A ⊆ F

(iii) Puisque par hypothèse on a que A est un fermé contenant A, on tirede (ii) que A ⊆ A. Comme nous avons toujours A ⊆ A et que nousavons démontré en (i) que A est un fermé, nous devons conclure queA est un fermé ssi A = A.

Remarque. Tout espace topologique X est dense en lui-même, ce quis’exprime par X = X selon 1C-4. Par (i) de l’exercice 1C.1, cela revient àdire que l’espace X pris en lui-même, est un fermé. Cela vient confirmer quetout espace topologique X est à la fois un ouvert et un fermé.

1.C.10 Espaces de Hausdorff

À l’exemple 1C.13, nous avons vu qu’il est possible pour une suite deconverger vers plusieurs points à la fois. Or, il existe une propriété topolo-gique qui assure l’unicité de la limite d’une suite convergente.

114 Annexe 1C

Définition 1C.19 Un espace topologique (X, T ) est un espace de Haus-dorff s’il satisfait à la condition suivante : si x1 et x2 sont deux pointsdistincts de l’espace, alors il est toujours possible de trouver deux ouvertsdisjoints G1 et G2 tels que :

x1 ∈ G1, x2 ∈ G2 et G1 ∩G2 = ∅

Remarque. On dit souvent d’un espace de Hausdorff que c’est un espaceséparé 58. Nous éprouvons une certaine réticence face à cette appellation po-pulaire car elle risque d’être confondue avec la notion différente d’espaceséparable 59. Nous nous en tiendrons donc à l’appellation d’espace de Haus-dorff.

« Être un espace de Hausdorff » est une propriété topologique.

Proposition 1C.10 Soient (X, TX) ∼= (Y, TY ), deux espaces homéo-morphes. Alors si l’un des espaces est un espace de Hausdorff, l’autre l’estaussi.

Proposition 1C.11 Soit (X, TX) un espace de Hausdorff. Alors toutsingleton est un fermé.

Théorème 1C.12 Toute suite convergente (xn)n∈N dans un espace deHausdorff converge vers une limite unique x. Il conviendra alors d’écrire :

limn→∞

xn = x

Démonstration. Procédons par reductio ad absurdum. Soit une suite conver-gente (xn)n∈N dans un espace de Hausdorff et supposons que limn→∞ xn = aet limn→∞ xn = b avec a 6= b. Puisque l’espace est de Hausdorff, il existedes ouverts G1 et G2 tels que a ∈ G1, b ∈ G2 et G1 ∩ G2 = ∅. Puisquelimn→∞ xn = a, par la définition 1C.13, il existe un entier positif NG1 ∈ Ntel que n1 > NG1 =⇒ xn1 ∈ G1. De façon similaire, il existe un entierpositif NG2 ∈ N tel que n2 > NG2 =⇒ xn2 ∈ G2. Soit N = max(NG1 , NG2).Alors ∀n > N , xn ∈ G1 et xn ∈ G2, c.-à-d. xn ∈ G1∩G2. Mais ceci contreditle fait que G1 et G2 sont disjoints. L’unicité de la limite est donc démon-trée.

58. Plus techniquement, un espace de Hausdorff vérifie l’axiome de séparation T2. Lesaxiomes de séparation ne sont pas couverts dans cet ouvrage.59. Un espace séparable contient une partie dénombrable et dense. Un espace topolo-

gique peut être séparé mais non séparable ou encore séparable mais non séparé.

1.C.11 Axiomes de dénombrabilité 115

Nous sommes en mesure de nous demander si la réciproque du théorème1C.12 est vraie, c.-à-d. si le fait que toute suite convergente n’admet qu’uneseule limite implique que l’espace est de Hausdorff. La réponse courte est :pas nécessairement. La réponse longue nous demande d’introduire le premieraxiome de dénombrabilité.

1.C.11 Axiomes de dénombrabilité

Nous commencons par établir la notion de base locale.

Définition 1C.20 Soit (X, T ) un espace topologique et x un point quel-conque de X. Une famille d’ouverts B(x) ⊆ T , chacun contenant x, est unebase locale en x ssi pour tout ouvert G contenant x on peut trouver unélément Bi ∈ B(x) lui-même entièrement contenu dans G. Autrement dit :

∀G ∈ T t.q. x ∈ G, ∃Bi ∈ B(x) t.q. x ∈ Bi ⊆ G

Remarque. Si B est une base de la topologie T , alors l’ensemble deséléments de B qui contiennent x forme une base locale B(x) en x.

Définition 1C.21 Un espace topologique (X, T ) vérifie le premieraxiome de dénombrabilité ssi pour tout point quelconque x ∈ X il existeune base locale B(x) qui soit dénombrable.

Remarque. Toute base locale dénombrable B(x) = {B1, B2, . . . , Bn, . . .}peut être ordonnée en une suite décroissante d’ouverts emboîtés, c.-à-d. unesuite telle que :

B′1 ⊇ B′2 ⊇ · · · ⊇ B′n ⊇ . . .

En effet, il suffit pour cela de prendre B′1 = B1, B′2 = B′1∩B2, B′3 = B′2∩B3,et en général, B′n = B′n−1 ∩ Bn pour obtenir une suite décroissante d’ou-verts non-vides emboîtés. Chaque B′n est lui-même un ouvert contenant xpuisqu’il résulte de l’intersection finie d’ouverts contenant x. Par construc-tion, nous avons que B′n ⊆ Bn. Et puisque B(x) est une base locale, pourtout ouvert G contenant x, il existe un Bi tel que B′i ⊆ Bi ⊆ G. Donc,B′(x) = {B′1, B′2, . . . , B′n, . . .} est aussi une base locale de x. À moins d’indi-cation contraire, nous présumerons que toute base locale est ordonnée ainsi.

Théorème 1C.13 Soit (X, T ) un espace topologique vérifiant le pre-mier axiome de dénombrabilité. Si toute suite convergente n’admet qu’uneseule limite, alors l’espace (X, T ) est de Hausdorff.

116 Annexe 1C

Démonstration. Procédons par reductio ad absurdum 60. Supposons que l’es-pace (X, T ) n’est pas un espace de Hausdorff. Alors il existe deux pointsdistincts x1, x2 ∈ X, x1 6= x2 pour lesquels l’intersection de tout ouvertcontenant x1 et de tout ouvert contenant x2 est non-nulle. Puisque l’es-pace respecte le premier axiome de dénombrabilité, il existe aussi deux baseslocales dénombrables d’ouverts emboîtés B(x1) = {A1, A2, . . . , An, . . .} etB(x2) = {B1, B2, . . . , Bn, . . .} telles que Ai ∩ Bj 6= ∅ pour tout i, j. Si l’onprend un à un les éléments de chacune des deux bases locales, on peut vé-rifier aisément que leurs intersections forment aussi une suite décroissanted’ouverts emboîtés :

A1 ∩B1 ⊇ A2 ∩B2 ⊇ · · · ⊇ An ∩Bn ⊇ . . .

Choississons un point dans chacune de ces intersections :

a1 ∈ A1 ∩B1, a2 ∈ A2 ∩B2, . . . , an ∈ An ∩Bn, . . .

et construisons la suite (an)n∈N. Par définition, pour tout ouvert G contenantx1, il existe un élément Ai de la base locale B(x1) tel que Ai ⊆ G. Maispuisque les Ai sont emboîtés, G contient tous les élément de la suite (an)n∈Nsauf possiblement les i− 1 premiers. Par conséquent :

limn→∞

an = x1

D’un autre côté, puisque pour tout ouvert G contenant x2, il existe un élé-ment Bj de la base locale B(x2) tel que Bj ⊆ G, un raisonnement identiquenous amène à la conclusion que :

limn→∞

an = x2

Mais ceci contredit l’hypothèse de départ qui veut que toute suite convergenten’admette qu’une seule limite. L’espace (X, T ) est donc bel et bien un espacede Hausdorff.

« Vérifier le premier axiome de dénombrabilité » est aussi une propriététopologique.

Proposition 1C.14 Soient (X, TX) ∼= (Y, TY ), deux espaces homéo-morphes. Alors si l’un des espaces vérifie le premier axiome de dénombrabi-lité, l’autre le vérifie aussi.

60. Prenez note que cette preuve utilise l’axiome du choix.

1.C.11 Axiomes de dénombrabilité 117

On peut se demander s’il ne serait pas avantageux de privilégier en touttemps la topologie discrète. Après tout, il s’agit de la topologie la plus fineque l’on puisse définir sur un ensemble et, puisqu’elle fait de tout singletonun ouvert, elle génère automatiquement un espace de Hausdorff. De plus ellevérifie trivialement le premier axiome de dénombrabilité puisque, pour toutpoint x, il suffit de choisir comme base locale dénombrable B(x) = {x} cartout ouvert contenant x contient par défaut le seul élément de cette baselocale.

Un élément de réponse s’impose si l’on garde en mémoire la définition1C.13 d’une suite convergente. En effet, si on concilie ensemble les faitssuivants :

– le fait que toute suite convergente (an)n∈N dans un espace de Hausdorffn’admet qu’une seule limite,

– le fait que tout ouvert doit contenir tous les termes de la suite à l’ex-ception possible d’un nombre fini,

– le fait que pour la topologie discrète tout singleton est un ouvert,il s’ensuit que, pour la topologie discrète, toute suite qui converge vers lepoint a doit nécessairement prendre la forme a1, a2, . . . , ak, a, a, a, . . . oùpour n > k, tous les termes an = a. Bref, dans un espace où règne latopologie discrète, toute prise de limite se réduit à l’expression d’énoncéstriviaux de type :

limn→∞

a = a

Si l’exemple 1C.13 témoigne amplement du fait que la topologie grossièrene contient « pas assez » d’ouverts, il est évident que la topologie discrèteen contient « trop ». Le second axiome de dénombrabilité nous fournit uneexcellente indication de ce qui pourrait constituer « juste assez » d’ouverts.

Définition 1C.22 Un espace topologique (X, T ) vérifie le secondaxiome de dénombrabilité ssi il admet une base dénombrable pour sa to-pologie T .

Remarque. Par opposition au premier axiome de dénombrabilité, l’exis-tence d’une base dénombrable est une propriété globale d’un espace topolo-gique.

Remarque. Tout espace vérifiant le second axiome de dénombrabilitévérifie aussi par défaut le premier axiome de dénombrabilité. En effet, pourobtenir une base dénombrable B(x) en un point quelconque x, il suffit deprendre tous les éléments de la base dénombrable B qui contiennent x.

118 Annexe 1C

Remarque. Il est clair que tout espace Rn ou Cn muni de la topologiediscrète ne respecte pas le second axiome de dénombrabilité. En effet, on saitpar le problème 1.19 que toute base d’une topologie discrète doit contenirtous les singletons de l’espace. Or dans Rn ou Cn, l’ensemble de ces pointsisolés n’est pas dénombrable. Par opposition, la topologie usuelle (voir section1.6.1) définie sur Rn ou Cn possède, quant à elle, une base dénombrable, soit« juste ce qu’il faut » d’ouverts.

« Vérifier le second axiome de dénombrabilité » est aussi une propriététopologique.

Proposition 1C.15 Soient (X, TX) ∼= (Y, TY ), deux espaces homéo-morphes. Alors si l’un des espaces vérifie le second axiome de dénombrabilité,l’autre le vérifie aussi.

1.C.12 Séparabilité

Définition 1C.23 Un espace topologique (X, T ) est dit séparable ssi ilcontient une partie dénombrable et dense.

Remarque. Il ne faut pas confondre espace séparé et espace séparable.Un espace séparé est un espace de Hausdorff qui peut ou non être sépa-rable. Par exemple, la droite réelle munie de la topologie usuelle est à la foisséparée et séparable ; la droite réelle munie de la topologie discrète est sé-parée puisque chaque singleton est un ouvert mais, pour cette même raison,toute partie dense doit contenir tous les singletons et doit par conséquentêtre non dénombrable ; la droite réelle munie de la topologie triviale {∅,R}n’est pas séparée mais elle est séparable puisqu’elle admet une partie denseet dénombrable par défaut, soit R.

Théorème 1C.16 Tout espace topologique (X, T ) qui vérifie le secondaxiome de dénombrabilité est séparable.

Démonstration. Soit B = {B1, B2, . . . , Bn, . . .} une base dénombrable de(X, T ) 61. Choisissons un point dans chacun des éléments de la base :

x1 ∈ B1, x2 ∈ B2, . . . , xn ∈ Bn, . . .

Alors l’ensemble S = {x1, x2, . . . , xn, . . .} est dénombrable. Soit un ouvertnon-vide G ∈ T . Maintenant, ∀x ∈ G, il existe un élément Bi ∈ B tel que

61. Prenez note que cette preuve utilise l’axiome du choix.

1.C.13 Compacité 119

x ∈ Bi ⊆ G. C’est dire que G contient au moins un élément de S, soitxi. Et puisque G est quelconque, selon la définition 1C.15, S est une partiedénombrable et dense de X et donc (X, T ) est un espace séparable.

Nous sommes en mesure de nous demander si la réciproque du théorème1C.16 est vraie, c.-à-d. si tout espace topologique séparable possède nécessai-rement une base dénombrable. La réponse courte est : pas nécessairement.La réponse un peu plus longue est oui si l’espace topologique en question estaussi un espace métrique (voir la section 1.6.3).

Pour un espace vectoriel topologique de dimension infinie tel qu’un es-pace de Hilbert, la condition de séparabilité conduit à l’existence d’une basehilbertienne dénombrable.

1.C.13 Compacité

Voici la définition moderne d’un ensemble compact.

Définition 1C.24 Un ensemble compact d’un espace topologique (X, T )est un sous-ensemble K ⊆ X dont tout recouvrement ouvert admet un sous-recouvrement fini.

Autrement dit, quelque soit le recouvrement ouvert de K, {Gi}i∈I , oùl’ensemble indiciel I est généralement de cardinalité infinie (dénombrable ounon dénombrable) :

K ⊆⋃i∈I

Gi

il est toujours possible d’en extraire un sous-ensemble fini J ⊆ I tel que :

K ⊆⋃j∈J

Gj

Note. Dans les textes mathématiques de langue française qui s’inspirentde Bourbaki[2], on utilise plutôt le terme semi-compact pour décrire l’en-semble tel que défini en 1C.24, le terme compact étant réservé pour les en-sembles qui ont la propriété supplémentaire d’être de Hausdorff (séparé).À l’inverse, certains ouvrages anglophones plus anciens différencient entre« compact set » (définition 1C.24) et « compactum » (réservé pour les es-paces de Hausdorff ou pour les espaces métriques).

Tout ensemble fini d’un espace topologique est compact. De même, l’en-semble vide est compact.

120 Annexe 1C

Bien que cette définition s’applique aux espaces topologiques en toutegénéralité, la notion de compacité a été élaborée à partir de résultats obtenusen considérant des espaces métriques.

C’est le célèbre théorème de Heine-Borel qui est à l’origine de la définitionmoderne de la compacité.

Théorème 1C.17 (Heine-Borel) Tout recouvrement ouvert de l’in-tervalle fermé et borné [a, b] sur la droite des réels R admet un sous-recouvrement fini.

a b

R

Figure 1.20 – L’intervalle [a, b] est compact. Pour fins de visualisation, lerecouvrement se fait à l’aide de boules ouvertes dans R2. Dans R, le recouvre-ment consiste de six intervalles ouverts là où les boules ouvertes intersectentla droite des réels.

La compacité est une propriété topologique.Les théorèmes suivants valent pour les ensembles compacts d’espaces

topologiques généraux.

Théorème 1C.18 Toute partie fermée d’un ensemble compact est com-pacte.

Démonstration. Soit F , une partie fermée d’un ensemble compact K d’unespace topologique (X, T ). Soit maintenant {Gi}i∈I , un recouvrement ouvertde F (voir Fig. 1.22) :

F ⊆⋃i∈I

Gi

F étant un fermé, F c = X\F est donc un ouvert. Puisque X = F ∪ F c,on a que

⋃i∈I Gi ∪ F c est un recouvrement ouvert de X.

X =⋃i∈I

Gi ∪ F c


F

⋃i∈I

Gi K

X

Figure 1.21 – F est une partie fermée de l’ensemble compact K. On peutsupposer que le recouvrement ouvert

⋃i∈I Gi de F résulte de l’union d’une

infinité d’ouverts de X.

et, a fortiori, un recouvrement ouvert de K :

K ⊆⋃i∈I

Gi ∪ F c

L’ensemble K étant compact, il admet un sous-recouvrement fini de sorteque :

K ⊆ G1 ∪G2 ∪ · · · ∪Gn ∪ F c

et puisque F ⊆ K, par hypothèse, le recouvrement fini de K est aussi unrecouvrement fini de F :

F ⊆ G1 ∪G2 ∪ · · · ∪Gn ∪ F c (1C-5)

Posons G = G1 ∪G2 ∪ · · · ∪ Gn et procèdons ensuite à quelques opérationsensemblistes :

F ⊆ G ∪ F c =⇒ F ∩ F ⊆(G ∪ F c

)∩ F =⇒ F ⊆ (G ∩ F ) ∪ (F c ∩ F )

=⇒ F ⊆ G ∩ F =⇒ F ⊆ G

pour obtenirF ⊆ G1 ∪G2 ∪ · · · ∪Gn

Donc, tout recouvrement ouvert {Gi}i∈I de F admet un sous-recouvre-ment fini. Nous en concluons que F est compact.

Note. Lorsque nous affirmons qu’une partie A d’un espace topologique(X, T ) est compacte, nous sous-entendons toujours qu’elle est compacte pourla topologie induite (A, T (A)).

122 Annexe 1C

Proposition 1C.19 L’intersection d’un ensemble compact et d’unfermé est un ensemble compact.

Proposition 1C.20 L’union finie d’ensembles compacts est un en-semble compact.

Théorème 1C.21 L’image continue d’un ensemble compact est un en-semble compact.

Démonstration. Soient (X, TX) et (Y, TY ), deux espaces topologiques. SoitF : X → Y , une application continue et K un ensemble compact de X.

Considérons un recouvrement ouvert quelconque de F [K] :

F [K] ⊆⋃i

Gi

Alors,

K = F−1F [K] ⊆ F−1[⋃

i

Gi

]=⋃i

F−1[Gi]

Puisque F est continue, la préimage F−1[Gi] de tout ouvert Gi de Y est unouvert de X. Par conséquent,

⋃i F−1[Gi] est un recouvrement ouvert de K.

Comme K est compact, on peut en extraire un sous-recouvrement fini, soit :

K ⊆ F−1[G1] ∪ F−1[G2] ∪ · · · ∪ F−1[Gn]

et

F [K] ⊆ F[F−1[G1] ∪ F−1[G2] ∪ · · · ∪ F−1[Gn]

]⊆ FF−1[G1] ∪ FF−1[G2] ∪ · · · ∪ FF−1[Gn]⊆ G1 ∪G2 ∪ · · · ∪Gn

Donc, tout recouvrement ouvert de F [K] admet un sous-recouvrement finiet l’image continue de l’ensemble compact K est aussi compacte.

Le théorème suivant vaut pour tous les espaces de Hausdorff.

Théorème 1C.22 Tout sous-ensemble compact d’un espace de Haus-dorff est fermé.


Démonstration. Soit K, un sous-ensemble compact d’un espace de Hausdorff(X, T ). Nous allons démontrer que Kc = X\K est un ouvert.

Si Kc = ∅ alors K = X et K est un fermé par défaut. Supposons doncque ce n’est pas le cas et qu’il existe un point x qui n’appartient pas à K,donc x ∈ Kc.

Considérons la famille de tous les ouverts qui contiennent un point de K,{Up | p ∈ K}. Cette famille forme un recouvrement ouvert de K :

K ⊆⋃p∈K

Up

K étant compact, il existe un sous-recouvrement fini {Up1 , Up2 , . . . , Upn} telque :

K ⊆ Up1 ∪ Up2 ∪ · · · ∪ Upn

Comme x ∈ Kc et pi ∈ K, alors pi 6= x, pour toute valeur de i = 1, . . . , n.Et puisque X est un espace de Hausdorff, pour chaque valeur de i, il existedes ouverts Upi et Vpi tels que :

pi ∈ Upi , x ∈ Vpi , et Upi ∩ Vpi = ∅ (1C-6)

Définissons maintenant :

U = Up1 ∪ Up2 ∪ · · · ∪ Upn (1C-7a)V = Vp1 ∩ Vp2 ∩ · · · ∩ Vpn (1C-7b)

U et V sont tous deux des ouverts puisqu’ils résultent de l’union et de l’in-tersection finie d’ouverts. Par définition, nous avons :

K ⊆ U

D’un autre côté, V étant l’intersection de tous les Vpi , il est nécessairementcontenu dans chacun de ces ouverts,

V ⊆ Vpi , i = 1, . . . , n

de sorte que Upi ∩ Vpi = ∅ implique que Upi ∩ V = ∅. Il est facile dedémontrer maintenant que U ∩ V = ∅. En effet,

U ∩ V = (Up1 ∪ Up2 ∪ · · · ∪ Upn) ∩ V= (Up1 ∩ V ) ∪ (Up2 ∩ V ) ∪ · · · ∪ (Upn ∩ V )

=n⋃i=1

Upi ∩ V = ∅

124 Annexe 1C

p

UK

X

x

V

Figure 1.22 – Lorsque K est un sous-ensemble compact d’un espace deHausdorff X, pour tout point x ∈ Kc, on peut trouver deux ouverts U et Vtels que K ⊆ U , x ∈ V et U ∩ V = ∅.

Puisque K ⊆ U , il s’ensuit que K ∩ V = ∅ et, par conséquent, que V ⊆ Kc.De plus, comme le point x appartient à chacun des Vpi , on a que x ∈ V ⊆ Kc.

Puisque x est un point tout à fait quelconque de Kc, il s’ensuit que Kc

est un voisinage de chacun de ses points, donc un ouvert par définition.Si Kc est un ouvert, alors K est un fermé.

Un espace topologique (X, T ) est dit compact si l’ensemble X est compactdans l’espace (X, T ). Lorsque c’est le cas, nous dirons simplement que X estun espace compact.

Un ensemble compact d’un espace qui n’est pas nécessairement compactdevient un sous-espace compact lorsqu’il est doté de la topologie induite. Sil’on considère ce sous-espace en tant qu’entité propre, alors il convient d’enparler en terme d’espace compact.

Notons que les espaces métriques de dimension finie Rn et Cn ne sontpas compacts. Si on peut recouvrir la droite réelle à l’aide d’une infinitédénombrable d’intervalles ouverts de type (x − 1, x + 1), où x est un entierrelatif, il est toutefois impossible d’en extraire un sous-recouvrement fini.

Définition 1C.25 Un espace topologique (X, T ) est dit localementcompact si chacun de ses points admet un voisinage compact. Ainsi, pourtout point x de l’espace, il existe un ouvert G contenant x qui est lui-mêmecontenu dans un ensemble compact V :

∀x ∈ X, ∃G ∈ T , ∃V ⊆ X, tel que x ∈ G ⊆ V et V est compact


Tous les espaces compacts sont localement compacts. En effet, si x est unpoint quelconque d’un espace compact X, alors chaque ouvert G contenantx satisfait x ∈ G ⊆ X. Par contre, l’inverse n’est pas nécessairement vrai.Par exemple, tous les espaces Rn et Cn de dimension finie sont localementcompacts, mais ils ne sont pas compacts.

Théorème 1C.23 Dans un espace de Hausdorff localement compact,tout ouvert et tout fermé est localement compact.

Démonstration. 1) Soit A, un ouvert d’un espace de Hausdorff (X, T ) etx ∈ A, un point quelconque de A. Puisque X est localement compact, ilexiste un ouvert O et un ensemble compact Q tels que :

x ∈ O ⊆ Q et Q est compact

Notons qu’il n’y a rien dans la définition 1C.25 qui exige que le voisinagecompact Q (dans X) soit inclus dans l’ouvert A. C’est pourquoi nous allonsdémontrer que dans un espace de Hausdorff, on peut toujours trouver unvoisinage compact de x entièrement inclus dans A :

∀x ∈ A, ∃G ⊆ T , ∃K ⊆ X, tel que x ∈ G ⊆ K ⊆ A et K est compact

Notre point de départ est O ⊆ Q. Le théorème 1C.22 nous dit d’une partque Q est un fermé de sorte que Q = Q et O ⊆ Q. Considérons maintenantO, l’adhérence de O. Par (i) de l’exercice 1C.1, O est un fermé et par (ii) dumême exercice, O est le plus petit fermé contenant O, de sorte que :

x ∈ O ⊆ O ⊆ Q

Enfin, par le théorème 1C.18, O est compact.Définissons G comme étant l’intersection de A et de l’ouvert O :

G = A ∩O

Par construction, G est un ouvert pour lequel :

G ⊆ O ⊆ O et x ∈ G ⊆ A

Considérons G, l’adhérence de G. Par (i) et (ii) de l’exercice 1C.1, G est leplus petit fermé contenant G :

G ⊆ G ⊆ O

126 Annexe 1C

et par le théorème 1C.18, G est compact. Dénotons par H la différence entreles ensembles G et G :

H = G\G ≡ G ∩Gc 62

Puisque H résulte de l’intersection d’un ensemble compact et d’un fermé, ilest compact par la proposition 1C.19.

Nous devons considérer la possibilité que H = ∅ (Pourquoi ?). Si H = ∅,alors G = G et G est à la fois un ouvert et un fermé. Par conséquent,

x ∈ G = G ⊆ A

Il suffit alors de poser K = G pour obtenir :

x ∈ G ⊆ K ⊆ A, K est compact

Examinons maintenant le cas où H 6= ∅. Puisque x ∈ G, par définitionx /∈ H, ou encore, x ∈ Hc. Nous avons vu, lors de la démonstration du théo-rème 1C.22, qu’étant donné un ensemble compact dans un espace de Haus-dorff et un point extérieur à cet ensemble, il est toujours possible de trouverdeux ouverts disjoints dont l’un est un sur-ensemble de l’ensemble compactet l’autre est un voisinage du point extérieur (voir Fig. 1.22). Contextuelle-ment, cela signifie que, pour tout point p de H et pour le point x ∈ Hc, ilexiste deux ouverts U et W tels que :

p ∈ H ⊆ U, x ∈W, et U ∩W = ∅

Nous rappelons l’implication suivante tirée de la théorie des ensembles :

H ⊆ U =⇒ U c ⊆ Hc

Posons V = G ∩W . V est alors un voisinage ouvert de x tel que :

x ∈ V ⊆ G ⊆ G, et U ∩ V = ∅ =⇒ V ⊆ U c

Puisque V appartient à la fois à G et U c, il appartient à leur intersection :

V ⊆ G ∩ U c

Par la proposition 1C.19, G ∩ U c est compact et par le théorème 1C.22, ilest fermé de sorte que :

V ⊆ V ⊆ G ∩ U c

62. Notez que le complément dans X d’un ensemble A, Ac, n’est qu’un cas particulierde la différence entre deux ensembles : X\A ≡ X ∩Ac = Ac.


et V est compact par le théorème 1C.18. Mais U c ⊆ Hc =⇒ G∩U c ⊆ G∩Hc

et il s’ensuit que :

V ⊆ V ⊆ G ∩Hc = G\H = G\(G\G)

Utilisons maintenant l’identité suivante de la théorie des ensembles :

A\(A\B) = A ∩B

pour obtenir :G\(G\G) = G ∩G = G ⊆ A

et finalement :x ∈ V ⊆ V ⊆ A

Puisque V est compact, on n’a qu’à poser K = V , et :

x ∈ V ⊆ K ⊆ A, K est compact

encore une fois on a trouvé un voisinage de x entièrement inclus dans A.Puisque x est un point quelconque de A, il s’ensuit, par définition, que A estun espace localement compact.

K

x

V

A

X

Figure 1.23 – Dans un espace de Hausdorff, étant donné un ouvert A, il esttoujours possible de trouver un voisinage compact K de tout point x ∈ A quisoit entièrement inclus dans A. L’affirmation est aussi vraie pour un ferméquelconque.

2) Soit B, un fermé de (X, T ) et y ∈ B, un point quelconque de B.Puisque X est localement compact, il existe un ouvert O et un ensemblecompact Q tels que :

y ∈ O ⊆ Q et Q est compact

128 Annexe 1C

Posons G = O ∩ B et K = Q ∩ B. Alors G est un ouvert (de la topologieinduite) et K un ensemble compact (par la proposition 1C.19) tels que :

y ∈ G ⊆ K ⊆ B

Par conséquent, B est un espace localement compact.

Exemple 1C.14. Dans les espaces Rn et Cn de dimension finie, la bouleouverte unité B(0, 1) et la boule fermée unité Bf (0, 1) 63

Bf (0, 1) = {x | d(0, x) ≤ 1}

sont toutes deux localement compactes.

Pouvons-nous étendre le résultat du théorème de Heine-Borel aux espacesmétriques de dimension supérieure ? La réponse courte est oui : toute partiebornée et fermée des espaces de dimension finie Rn et Cn est compacte.

Ceci étant dit, il convient, d’une part, de définir rigoureusement ce quenous entendons par une partie bornée d’un espace métrique et, de l’autre,d’apporter une précision sur les parties « fermées ».

Dans un espace métrique, le diamètre d’une partie A, dénoté diam(A), estla plus petite borne supérieure de la distance entre deux points quelconquesde A :

diam(A) = sup{ d(x, y) |x, y ∈ A}

Le diamètre de A peut être infini. La partie A est dite bornée si son diamètreest fini.

diam(A) <∞

Exemple 1C.15. Dans l’espace métrique euclidien Rn de dimensionfinie, la boule ouverte unité B(0, 1) et la boule fermée unité Bf (0, 1) sonttoutes deux bornées, chacune ayant un diamètre égal à 2.

Considérons l’espace topologique que constitue intrinsèquement la bouleouverte unité d’un espace euclidien Rn. La boule ouverte unité est bornéepuisque son diamètre est égal à 2 et « fermée » car l’espace entier est toujoursun fermé de toute topologie. Peut-on alors affirmer que la boule ouverte unitéest compacte ? Non. La raison en revient à l’usage cavalier que nous faisonsici du terme « fermé ». Tel que discuté à la section 1.6.5, lorsque l’on parle del’espace Rn ou encore de l’espace de Hilbert, il est implicitement entendu quel’espace en question est complet, dans quel cas les termes fermé et complet

63. Ici, le 0 est en fait une abbréviation pour le n-uplet (0, . . . , 0).


sont interchangeables, ce qui n’est généralement pas le cas car la notionde fermeture est un concept extrinsèque alors que celle de complétude estun concept intrinsèque. La boule fermée unité étant complète et bornée estcompacte ; la boule ouverte unité n’étant pas complète ne l’est pas.

Définition 1C.26 Une partie A d’un espace topologique (X, T ) est diterelativement compacte si son adhérence A dans X est compacte.

Exemple 1C.16. Puisque tout fermé d’un espace de Hausdorff est com-pact, toute partie d’un tel espace est relativement compacte. En particulierles boules ouvertes unité et les boules fermées unité de Rn et Cn sont relati-vement compactes.

(a) (b) (c)

Figure 1.24 – Trois espaces bornés. (a) L’espace n’est pas compact puis-qu’il n’est pas complet, mais il est localement compact (b) L’espace n’estpas compact puisqu’il n’est pas complet (le petit cercle au centre illustremaladroitement le fait que le point central est manquant), mais il est relati-vement compact. (c) L’espace est compact puisqu’il est borné et complet.

Réflexion faite, pouvons-nous étendre le résultat du théorème de Heine-Borel aux parties bornées et complètes de tous les espaces métriques, mêmeceux de dimension infinie ? Cette fois la réponse courte est non. La réponseun peu plus longue nécessite l’introduction d’une dernière définition.

Définition 1C.27 Une partie A d’un espace métrique X est dite pré-compacte ou encore totalement bornée si pour tout ε > 0, on peut trouverun recouvrement ouvert fini de A par des boules ouvertes de rayon moindreque ε.

A ⊆⋃

i=1,...,n

B(xi, ε)

130 Annexe 1C

Figure 1.25 – La boule fermée unité dans le plan est totalement bornée carpour toute valeur de ε > 0, on peut la recouvrir à l’aide d’un nombre finide boules ouvertes de rayon moindre que ε. Ce résultat s’étend à toutes lesboules fermées unité de dimension finie.

Tout espace métrique compact est précompact. Toute partie totalementbornée d’un espace métrique est bornée (voir problème 1.31). L’inverse estfaux : toute partie bornée n’est pas nécessairement totalement bornée.

Par exemple, tout espace métrique trivial 64 est borné car son diamètreest égal à 1. Mais si l’espace est infini, il est impossible de le recouvrir à l’aided’un nombre fini de boules ouvertes de rayon moindre que 1. Cet espace estborné sans être totalement borné. Un exemple plus important est celui de laboule fermée unité dans l’espace de Hilbert :

Bf (0, 1) = {x ∈ H | d(0,x) 6 1}

En effet, soit B = {ei}i∈I , une base hilbertienne. Alors tous les vecteurs debase ei sont inclus dans Bf (0, 1). Au problème 1.27, il a été établi que pourdeux indices différents i, j ∈ I, i 6= j,

d(ei, ej) =√

2

Par conséquent, toute boule ouverte dont le rayon est plus petit que√

22 ne

peut contenir au maximum qu’un seul des ei. La boule fermée unité dansl’espace de Hilbert, bien que bornée n’est pas totalement bornée (précom-pacte).

64. Dans un espace métrique trivial, la distance entre deux points x et y est 1 si lesdeux points sont distincts et 0 si les deux points sont confondus.


Nous venons de donner deux exemples d’espaces qui sont complets sansêtre totalement bornés. Ceci nous amène à professer un critère de compacitévalide pour tout espace métrique, qu’il soit de dimension finie ou non.

Théorème 1C.24 Tout espace métrique complet et totalement borné(précompact) est compact.

Le fait que la boule unité fermée ne soit pas compacte pour un espacevectoriel de dimension infinie est significatif ; de fait, l’existence d’une boulefermée unité compacte implique la dimensionalité finie de l’espace comme entémoigne le théorème suivant :

Théorème 1C.25 Dans un espace vectoriel normé, les énoncés sui-vants sont équivalents :

1) L’espace est de dimension finie.2) La boule unité fermée est compacte.3) L’espace est localement compact.4) Toute partie bornée est relativement compacte.

Puisque selon le théorème 1C.21 l’image continue d’un compact est uncompact, il s’ensuit que toutes les fonctions continues définies sur un domainecompact sont nécessairement bornées.

132

Bibliographie

[1] Ahlfors, Lars. Complex Analysis. McGraw-Hill, 3ème édition, 1979.

[2] Bourbaki, N. Topologie générale, chapitres 1-4. Springer-Verlag Berlinet Heidelberg GmbH & Co. K, réimpression inchangée de l’édition 1971,2006.

[3] Cohen-Tannoudji C., Diu B. et Laloë F. Mécanique quantique, Tome I.Hermann, 1997.

[4] Dirac, P.A.M. The Principles of Quantum Mechanics. Oxford UniversityPress, 4ème. édition, 1958.

[5] Gel’fand, I.M. et Vilenkin, N.Ya. Les distributions, Vol 4 - Applicationsde l’analyse harmonique. Dunod, Paris, 1967.

[6] Gieres, François. Formalisme de Dirac et surprises en mécanique quan-tique. http: // arxiv. org/ abs/ quant-ph/ 9907070 , 1999.

[7] Heisenberg, Werner. Über quantentheoretische umdeutung kinemati-scher und mechanischer beziehungen. Zeitschrift für Physik, 33 :879–893, Sept. 1925.

[8] Madrid, Rafael de la. Quantum Mechanics in Rigged Hilbert Space lan-guage. Thèse de doctorat, Université de Valladolid, 2001.

[9] Madrid, Rafael de la. The role of the Rigged Hilbert Space in QuantumMechanics. http: // arxiv. org/ abs/ quant-ph/ 0502053 , 2005.

[10] Morin, Edgar. Introduction à la pensée complexe. Éditions du Seuil,nouvelle édition, 2005.

[11] Needham, Tristan. Visual Complex Analysis. Clarendon Press, 1997.

[12] von Neumann, Johann. Mathematische Grundlagen der Quantenmecha-nik. Berlin, Springer, 1932.

[13] Penrose, Roger. The Road to Reality - A complete guide to the laws ofthe universe. Vintage Books, 2006.

http://arxiv.org/abs/quant-ph/9907070

http://arxiv.org/abs/quant-ph/0502053

134 BIBLIOGRAPHIE

[14] Schrödinger, Erwin. Quantisierung als eigenwertproblem (Erste mittei-lung.). Annalen der Physik, 79 :361–376, 1926.

[15] Schrödinger, Erwin. Uber das verhaeltnis der Heisenberg-Born-Jordanschen quantenmechanik zu der meinen. Annalen der Physik,79 :489–527, 1926.

[16] Schwartz, Laurent. Théorie des distributions. Hermann, nouveau tirage,1997.

Index

adhérence, 32, 46–47, 112dans un espace métrique, 31

algorithme de Gram-Schmidt,42, 53–55

application, 7bijection, 8injection, 8linéaire, 9surjection, 8

base d’un espace vectoriel, 6base hilbertienne, 46, 55–57boule ouverte, 23, 24, 26

combinaison linéaire, 4, 44compacité, 119

locale, 124relative, 129

continuité, 105, 106, 108en un point, 107séquentielle, 111

covecteur, 12, 18, 66

delta de Kronecker, 13dimension, 6

équivalence topologique,voir homéomorphisme

espace de Haussdorff,35–36, 114

espace de Hilbert, 38

L2, 61l2, 57complet, 47pré-hilbertien, 17

espace du qubit, 25espace dual, 11

algébrique, 12topologique, 40

espace-état, 65espace linéaire, voir espace

vectorielespace métrique, 22

complet, 33de Hausdorff, 36précompact, 129séparable, 37topologie usuelle, 26–29

espace topologique, 97séparable, 118

espace vectoriel, 78complexe, 3de fonctions, 4normé, 19espace de Banach, 38

réel, 3sous-espace, 4

fermé, 98forme linéaire, 9

homéomorphisme, 109

136 INDEX

identité de Parseval, 43inégalité de Bessel, 46, 52inégalité de Cauchy-Schwartz,

17, 20indépendance linéaire, 5isomorphisme, 9

isométrique, 34

métrique, 22euclidienne, 23hermitienne, 24triviale, 22

norme, 18équivalente, 21euclidienne, 20hermitienne, 20uniforme, 21, 60

notation de Dirac,bra, 66ket , 66produit scalaire, 66

ouvert, 97

produit scalaire, 13canonique sur Cn, 17canonique sur Rn, 15euclidien, 14hermitien, 16

suite convergente, 110dans l’espace L2, 62dans un espace de Hausdorff, 114dans un espace métrique, 30, 31,

36dans un espace topologique, 110dans un espace vectoriel normé,

38suite de Cauchy, 33

théorème de Heine-Borel, 120

topologie, 97base topologique, 26, 102discrète, 98, 117grossière, 98, 111induite, 104plus (moins) fine, 100

triplet de Gel’fand, 69RHS, 69

vecteur, 78d’état, 65de coordonnées, 10orthogonal, 14position, 23unitaire, 19

voisinage d’un point, 99

Documents

InfoQuant - Chap 1