64
X 0 (N ) H := {z C, =(z ) > 0} C D z 7z-i z+i D H C P 1 (C)=(C 2 \{0})/C × H 2 (C) C 2 P 1 (C) C × P 1 (C)= C {∞} C P 1 (C) z 7(1,z )C × P 1 (C)= H P 1 (R) ¯ H + 2 (R)

Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Cours fondamental de M2

Formes modulaires et leurs propriétés

arithmétiques

Jean-François Dat

2014-2015

Table des matières

1 Théorie analytique 1

1.1 Le demi-plan de Poincaré et ses quotients . . . . . . . . . . . . . . . . . . . 11.2 Formes modulaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Opérateurs de Hecke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2 Théorie géometrico-arithmétique 44

2.1 Liens entre formes modulaires et représentations Galoisiennes . . . . . . . . 442.2 Algébricité des valeurs propres de Hecke . . . . . . . . . . . . . . . . . . . 512.3 Le modèle canonique de X0(N) . . . . . . . . . . . . . . . . . . . . . . . . 572.4 Relations d'Eichler-Shimura . . . . . . . . . . . . . . . . . . . . . . . . . . 62

1 Théorie analytique

1.1 Le demi-plan de Poincaré et ses quotients

Posons H := z ∈ C,=(z) > 0. C'est un ouvert connexe et simplement connexede C biholomorphe au disque unité ouvert D par l'application z 7→ z−i

z+i. Dans la théorie

des surfaces de Riemann, on montre que, à biholomophisme près, les seules surfaces deRiemann simplement connexes sont D ' H, le plan complexe C et la sphère de RiemannP1(C) = (C2 \ 0)/C×.

1.1.1 Automorphismes de H. L'action linéaire de GL2(C) sur C2 descend en uneaction par biholomorphismes sur P1(C) qui est triviale sur le centre C×. Écrivons P1(C) =C∐∞ où l'on a plongé C dans P1(C) par z 7→ (1, z)C×. Cette coordonnée nous permet de

décomposer P1(C) = H∐

P1(R)∐

H et on voit que le sous-groupe GL+2 (R) des matrices à

1

Page 2: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

déterminant positif respecte cette décomposition et en particulier agit surH. Explicitement,si γ = [ a bc d ], on a

γz =az + b

cz + d, et =(γz) =

det(γ)

|cz + d|2=(z).

Théorème. Soit Aut(H) le groupe des automorphismes biholomorphes de H.i) L'action décrite ci-dessus induit un isomorphisme de groupes

SL2(R)/±1 = GL+2 (R)/R× ∼−→ Aut(H)

ii) L'action de SL2(R) sur H est transitive et le xateur de i dans SL2(R) est SO2(R).De plus l'application γ 7→ γi induit un homéomorphisme

SL2(R)/SO2(R)∼−→ H.

Dans le ii), on a muni SL2(R)/SO2(R) de la topologie quotient, par dénition la plus netopologie pour laquelle la projection canonique SL2(R) −→ SL2(R)/SO2(R) est continue.

Démonstration. Commençons par ii). Un calcul montre que [ a bc d ] xe i si et seulementsi a = d et b = −c. La condition de déterminant donne en plus a2 + b2 = 1, donc lexateur de i dans SL2(R) est SO2(R). Par ailleurs, si on écrit z = x+ iy, on constate que

z = [ y x0 1 ]i =[y−1/2 −xy−1/2

0 y1/2

]i, d'où la transitivité de l'action. On en déduit que l'application

du point ii) est une bijection. Comme l'action de SL2(R) sur H est visiblement continue,cette bijection est continue et il ne reste plus qu'à voir qu'elle est aussi ouverte. Pour celail sut de voir que si U est un ouvert de SL2(R) alors U.i est un voisinage de i dans H, cequi est clair par la formule x+ iy =

[y1/2 −xy−1/2

0 y−1/2

]i. 1

Passons au i). Un calcul montre que le noyau de l'action est bien ±1. Pour la sur-jectivité, soit γ ∈ Aut(H). Par le point ii), quitte à composer avec un α ∈ SL2(R), onpeut supposer que γi = i. Transportons cela via τ = [ 1 −i

1 i ] : z 7→ z−iz+i

. On obtient unautomorphisme τγτ−1 du disque unité ouvert D qui envoie 0 sur 0. Le lemme de Schwarznous dit alors que τγτ−1 est une homothétie z 7→ ζz avec |ζ| = 1. On peut donc écrire

τγτ−1(z) =[eiθ 00 e−iθ

]z pour un θ ∈ R. Or, on calcule que τ−1

[eiθ 00 e−iθ

]τ =

[cos(θ) − sin(θ)sin(θ) cos(θ)

],

ce qui assure que γ et[

cos(θ) − sin(θ)sin(θ) cos(θ)

]induisent le même automorphisme de H.

Un élément γ ∈ SL2(R) possède 2 valeurs propres (en comptant la multiplicité) dansC. On dit que γ est

elliptique si ses valeurs propres ne sont pas réelles, hyperbolique si ses valeurs propres sont réelles et distinctes, parabolique si ses valeurs propres sont égales (et donc réelles) et γ 6= ±1.

1. Lorsqu'un groupe topologique G agit continuement et transitivement sur un espace X, alors pourtout x ∈ X, l'action de X induit une bijection continue G/Gx −→ X. Celle-ci peut ne pas être unhoméomorphisme, mais elle en est toujours un si G et X sont localement compacts.

2

Page 3: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

En raisonnant sur le polynôme caractéristique on voit que (γ elliptique) ⇔ | tr(γ)| < 2,que (γ hyperbolique) ⇔ | tr(γ)| > 2, et que (γ parabolique) ⇔ (| tr(γ)| = 2 et γ 6= ±1).Ainsi un élément γ 6= ±1 tombe dans l'une (et une seule) des trois classes. On peut aussicaractériser cette terminologie par les points xes de γ dans P1(C).

Lemme. Soit γ ∈ SL2(R).

i) γ est elliptique si et seulement si γ a un point xe dans H. Ce point est alors unique,et γ est conjugué dans SL2(R) à une rotation

[cos(θ) − sin(θ)sin(θ) cos(θ)

]∈ SO2(R).

ii) γ est hyperbolique si et seulement si γ a deux points xes dans P1(R).

iii) γ est parabolique si et seulement si γ a un unique point xe dans P1(R). De plus, γest conjugué dans GL2(R) à une matrice de la forme ±[ 1 1

0 1 ].

Démonstration. i) γ est elliptique si et seulement si, vu comme élément de GL2(R), il estdiagonalisable sur C mais pas sur R. Il a alors exactement 2 droites propres dans C2 etaucune dans R2. Il ne xe donc aucun point de P1(R) et xe 2 points conjugués dansP1(C) \ P1(R). Un et un seul de ces 2 points est donc dans H. Ce point est équivalent à isous SL2(R), donc γ est conjugué à un élément du xateur de i qui est SO2(R).

ii) est clair. iii) par dénition, γ est parabolique si et seulement si il est conjugué dansGL2(R) à une matrice de la forme [ a b0 a ] diérente de ±1. Comme det γ = 1, on a a = ±1.En conjuguant par [ 1 0

0 ±b ] on obtient la matrice ±[ 1 10 1 ]. Celle-ci a un unique point xe dans

P1(C), à savoir ∞.

1.1.2 Sous-groupes discrets de SL2(R). Un sous-groupe Γ de SL2(R) est dit discret s'ilest discret pour la topologie induite. Le premier exemple est SL2(Z), qu'on appelle groupemodulaire et qu'on notera aussi Γ(1). Plus généralement, on notera pour N ∈ N

Γ(N) := Ker(SL2(Z) −→ SL2(Z/NZ)) = [ a bc d ] ≡ [ 1 00 1 ](mod N).

C'est un sous-groupe d'indice ni de SL2(Z) appelé sous-groupes de congruences principalde niveau N . Dans ce cours, les groupes qui nous intéresseront particulièrement sont

Γ1(N) := [ a bc d ] ≡ [ 1 ∗0 1 ](mod N)

Γ0(N) := [ a bc d ] ≡ [ ∗ ∗0 ∗ ](mod N)

On a Γ(N) ⊂ Γ1(N) ⊂ Γ0(N) ⊂ Γ(1) = SL2(Z).Il y a beaucoup d'autres exemples de sous-groupes discrets de SL2(R) qui ne sont pas

commensurables à SL2(Z), au sens où Γ ∩ SL2(Z) n'est pas d'indice ni dans SL2(Z) nidans Γ. Certains, obtenus à partir d'algèbres de quaternions, jouent aussi un rôle importanten théorie des nombres.

Proposition. Soit Γ un sous-groupe discret de SL2(R).

i) Pour tout z ∈ H, le xateur Γz de z dans Γ est cyclique (et en particulier, ni).

ii) Tout z ∈ H admet un voisinage ouvert U tel que ∀γ ∈ Γ, γU ∩ U 6= ∅ ⇒ γz = z.

3

Page 4: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

iii) Deux orbites distinctes Γz et Γz′ admettent des voisinages ouverts disjoints.

Démonstration. i) Le xateur de z est conjugué à un sous-groupe discret de SO2(R), doncni. Un tel sous-groupe est cyclique (identier SO2(R) au cercle unité dans C×).

Pour ii) et iii) on utilise le fait suivant : si A,B sont deux compacts dans H, alorsSL2(R)A,B := γ ∈ SL2(R), γA ∩ B 6= ∅ est compact dans SL2(R). En eet si π désigne

l'application γ 7→ γi et ι sa section x + iy 7→[y1/2 −xy−1/2

0 y−1/2

], alors SL2(R)A,B = γ ∈

SL2(R), γπ−1(A) ∩ π−1(B) 6= ∅ est compact puisque π−1(A) = ι(A)SO2(R) et π(B) lesont.

ii) On applique ceci à V un voisinage compact de z. Alors ΓV := γ ∈ Γ, γV ∩ V 6= ∅est un compact dans Γ, donc est ni. Pour chaque γ ∈ ΓV qui ne xe pas z on peut trouverun voisinage ouvert Uγ de z tel que γUγ ∩Uγ = ∅. Prenant l'intersection (nie) sur de telsγ on obtient un U comme dans l'énoncé.

iii) Comme ci-dessus, si V ′ est un voisinage compact de z′, l'ensemble ΓV,V ′ := γ ∈Γ, γV ∩ V ′ 6= ∅ est ni et on en déduit U voisinage ouvert de z et U ′ de z′ tels queγU ∩ U ′ = ∅ pour tout γ. Alors

⋃γ γU et

⋃γ γU

′ sont deux voisinages disjoints de Γz etΓz′ respectivement.

Le iii) de la proposition implique que l'espace topologique quotient Γ\H est séparé. Onaimerait munir ce dernier d'une structure complexe. Ceci est facile et classique lorsque Γ(ou plutôt Γ/(Γ ∩ ±1) agit librement sur H (i.e. ∀γ ∈ Γ,∀z ∈ H, γz = z ⇒ γ = 1).Cependant PSL2(Z) n'agit pas librement !

1.1.3 Γ\H comme surface de Riemann. Pour z ∈ H, on note hz le cardinal de Γz/(Γz∩±1). On dit que z ∈ H est un point elliptique de Γ si hz > 1. Ainsi, Γ agit librement siet seulement si il ne possède pas de point elliptique.

On rappelle que pour dénir une structure complexe de dimension 1 sur un espacetopologique X, on peut se donner un atlas holomorphe (ou sa classe d'équivalence), ouencore se donner un faisceau de fonctions OX tel que tout point x ∈ X possède un voisinageouvert U tel que (U, (OX)|U) soit isomorphe, en tant qu'espace annelé, à un ouvert de Cmuni de son faisceau de fonctions holomorphes.

Proposition. Notons π : H −→ Γ\H la projection canonique et posons, pour toutouvert U de Γ\H,

OΓ\H(U) := OH(π−1(U))Γ (fonctions holomorphes sur π−1(U) invariantes sous Γ).

Alors OΓ\H est un faisceau et dénit une structure complexe sur Γ\H pour laquelle π estholomorphe. On notera aussi Y (Γ) cette surface de Riemann.

Démonstration. Il est clair que OΓ\H est un faisceau. Si z est un point non-elliptique, on

peut trouver V voisinage ouvert de z tel que π|V est un homéomorphisme V∼−→ π(V ).

Dans ce cas π induit un isomorphisme (V,OV )∼−→ (U,OU) comme souhaité. Si z est un

point elliptique, choisissons τ ∈ SL2(C) tel que τ(H) = D et τz = 0. Le lemme de Schwarz

4

Page 5: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

assure que τΓzτ−1 agit par rotations sur D. Plus précisément il existe un isomorphisme de

groupe ι : Γz∼−→ µhz (racines de l'unité d'ordre hz) tel que τ(γz′) = ι(γ)τ(z′) pour tout

z′ ∈ H. Pour tout rayon r < 1, l'ouvert V := τ−1(D(0, r)) est stable par Γz, et pour rsusamment petit on a γV ∩ V 6= ∅ ⇒ γ ∈ Γz d'après le ii) de la proposition précédente.On a alors un diagramme commutatif

V ∼τ

//

π

D(0, r)

x 7→xhz

π(V ) = Γz\V ∼τ// µhz\D(0, rhz) = D(0, r)

où τ est un homéomorphisme. Comme pour tout U ⊂ π(V ) on a O(U) = O(π−1(U) ∩V )Γz , on voit que τ transporte le faisceau de fonction Oπ(V ) vers le faisceau des fonctionsholomorphes en x ∈ D(0, r) invariantes sous µhz , qui est aussi le faisceau des fonctionsholomorphes en xhz , donc le faisceau des fonctions holomorphes usuel sur D(0, rhz).

Le faisceau de l'énoncé dénit donc bien une structure complexe sur Γ\H et π estvisiblement holomorphe. On retiendra que z′ 7→ τ(z′)hz descend en une coordonnée localeau voisinage de π(z) dans Γ\H.

1.1.4 Pointes. Un point x de P1(R) est appelé pointe de Γ (en anglais, un cusp) s'ilexiste un élément parabolique de Γ qui xe x. Dans ce cas, si on choisit τ ∈ SL2(R) telque τ∞ = x, alors τ−1Γxτ est un sous-groupe discret du xateur de ∞, ce dont on déduitqu'il existe h > 0 tel que

τ−1Γxτ.±1 = ±[ 1 h0 1 ]

m, m ∈ Z.

Notons PΓ ⊂ P1(R) l'ensemble des pointes de Γ et H∗ = H∗Γ := HtPΓ. On munit H∗ de latopologie engendrée par les ouverts de H et les ensembles de la forme Vτ,r := τ(Ur t∞),où

r > 0 et Ur = z ∈ H,=(z) > r τ ∈ SL2(R) et τ.∞ ∈ PΓ.

Si on écrit τ = [ a bc d ], alors τ(Ur) est le disque ouvert de diamètre r−1c−2 contenu dans Het dont l'adhérence dans P1(C) contient τ∞ = a/b. Par construction, l'action de Γ sur H∗préserve cette topologie (i.e. est continue), et on peut donc munir le quotient Γ\H∗ de latopologie quotient.

Lemme. Si x1, x2 ∈ PΓ, il existe un voisinage Vτ1,r de x1 et un voisinage Vτ2,r de x2

tels que∀γ ∈ Γ, γVτ1,r ∩ Vτ2,r 6= ∅ ⇒ γx1 = x2.

En particulier, l'espace Γ\H∗ est séparé et le sous-ensemble Γ\PΓ y est discret.

Démonstration. Quitte à conjuguer la situation on peut supposer x2 =∞ et donc Vτ2,r =Ur. On a alors un h∞ > 0 tel que Γ∞.±1 = ±γm∞,m ∈ Z avec γ∞ =

[1 h∞0 1

]. Notons

5

Page 6: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

x = x1 et xons τ = τ1 tel que τ∞ = x, ce qui nous donne h > 0 comme ci-dessus. Nousallons alors vérier que tout r tel que r2 > h.h∞ convient.

Pour cela, soit γ ∈ Γ et supposons que γτUr ∩ Ur 6= ∅. On doit montrer que γx =γτ∞ = ∞. En notant c(σ) la coordonnée (2, 1) d'une matrice σ ∈ SL2(R), on veut doncmontrer que c(γτ) = 0. Vu la description de γτUr, l'hypothèse γτUr ∩Ur 6= ∅ implique quer < r−1c(γτ)−2, ou encore c(γτ)2 < r−2.

Posons δ1 := τ−1γ−1γ∞γτ , qui est un élément du goupe discret τ−1Γτ . Un calcul montreque c(δ1) = −c(γτ)2h∞, et donc |c(δ1)h| < 1 d'après notre choix de r. On doit montrerque c(δ1) = 0, ce qui équivaut à δ1 ∈ (τ−1Γτ)∞ = τ−1Γxτ .

Pour cela, posons δn+1 := δn[ 1 h0 1 ]δ−1

n , qui est un élément de τ−1Γτ . Le même calculmontre que c(δn+1) = −c(δn)2h, mais aussi b(δn+1) = a(δn)2h et a(δn+1) = 1− a(δn)c(δn)h.

Il s'en suit que c(δn) = −c(δ1)(c(δ1)h)2n−1 tend vers 0 quand n → ∞ et donc que δntend vers la matrice [ 1 h

0 1 ]. Or, le groupe τ−1Γτ étant discret, cela implique δn = [ 1 h0 1 ] pour

n assez grand, donc c(δn) = 0 et nalement c(δ1) = 0.On laisse au lecteur les conséquences annoncées.

Considérons maintenant l'application z 7→ exp(2iπz/h). Elle réalise un homéomor-phisme envoyant ∞ sur 0

[ 1 h0 1 ]

Z\(Ur t ∞)∼−→ D(0, ρ)

où ρ = exp(−2πr/h), ce qui munit Ur t∞ d'une structure complexe. Si x = τ∞ est unepointe de Γ et h est comme au début, le lemme précédent nous dit que pour r assez grandon a un diagramme

Vτ,r∼τ−1

//

π

Ur t ∞z 7→exp(2iπz/h)

π(Vτ,r) = Γx\Vτ,r ∼

τ−1// D(0, ρ)

ce qui munit π(Vτ,r) d'une structure complexe. Concrètement, la fonction exp(2iπτ(z)/h)fournit une coordonnée locale au voisinage de π(x). On laisse au lecteur le soin de vérierque ces structures se recollent avec celle sur Γ\H pour munir Γ\H∗ d'une structure desurface de Riemann. On notera généralement X(Γ) cette surface de Riemann.

1.1.5 Le quotient modulaire. Nous allons expliciter le quotient Γ\H∗ dans le cas dugroupe modulaire Γ(1). Selon la coutume on abrège X(1) := X(Γ(1)) et Y (1) := Y (Γ(1)).

Définition. Un domaine fondamental pour Γ dans H est un ouvert connexe D t.q. ∀γ ∈ Γ, γD ∩D 6= ∅ ⇒ γ = ±1, H =

⋃γ∈Γ γD où D désigne l'adhérence de D.

Tout sous-groupe discret de SL2(R) admet un domaine fondamental. Cela découle del'existence d'une distance d(z, z′) sur H qui est invariante par SL2(R). En eet, ayant choisiun z0, on peut alors prendre

D = z ∈ H,∀γ ∈ Γ \ ±1, d(z, z0) < d(z, γz0).

6

Page 7: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

La distance d(z, z′) est la distance géodésique pour la métrique de Poincaré dz.dz|=(z)|2 dont on

voit facilement qu'elle est invariante par SL2(R). Pour cette métrique, les courbes géodé-siques sont les demi-cercles perpendiculaires à l'axe réel et les droites verticales.

An d'expliciter un domaine fondamental pour Γ(1), on notera S := [ 0 −11 0 ] et T := [ 1 1

0 1 ].On a donc pour tout z ∈ H

Sz =−1

zet Tz = 1 + z,

et on constate aussi les relations S2 = 1 et (ST )3 = 1 dans PSL2(R) = Γ(1)/±1.

Théorème. L'ouvert D := z ∈ H, |z| > 1 et |<(z)| < 12 est un domaine fonda-

mental pour Γ(1). De plus,

i) si z 6= z′ ∈ D sont Γ(1)-conjugués, alors

<z = ±1

2et z′ = z ± 1 = T±1z,

ou |z| = 1 et z′ = −1z

= Sz

ii) le xateur Γ(1)z d'un élément z ∈ D contient strictement ±1 si et seulement siz = i, auquel cas Γ(1)i = 〈S〉 et Γ(1)i/±1 ' Z/2Z

ou z = j := exp(2iπ/3), auquel cas Γ(1)j = 〈ST 〉 et Γ(1)j/±1 ' Z/3Zou z = −1/j = exp(2iπ/6), auquel cas Γ(1)j2 = 〈TS〉 et Γ(1)−1/j/±1 ' Z/3Z

Démonstration. Soit Γ′ le sous-groupe de Γ engendré par S et T . Nous montrons d'abordque H =

⋃γ∈Γ′ γD. Pour z ∈ H et γ = [ a bc d ], la formule =(γz) = =(z)/|cz+d|2 et le fait que

c et d sont des entiers nous disent que γ 7→ =(γz) atteint son maximum. Si ce maximumest atteint en z′ = γ0z, alors |z′| > 1 puisque sinon on aurait =(Sz′) = =(−1/z′) > =(z′).Mais comme =(Tz′) = =(z′), on peut supposer, quitte à faire agir T , que |<(z′)| 6 1/2.

Prouvons maintenant i) et ii). On peut supposer =(z′) > =(z). Si z′ = γz, cela implique|cz + d| 6 1 et donc c = 0, 1 ou −1. Quitte à remplacer γ par −γ (qui agit pareil), onpeut se contenter des cas c = 0 ou c = 1. Si c = 0, on a |d| = 1 et γz = T bz, ce qui n'estpossible que si b = 1 et <(z) = −1/2 ou b = −1 et <(z) = 1/2. Si c = 1, puisqu'on veut|z+d| 6 1, 2 cas sont possibles : d = 0 ou (|d| = 1 et z ∈ j, Sj). Si d = 0, alors det γ = 1implique b = −1 et donc z′ = a − 1/z. Comme |z| = 1, −1/z est dans D donc, commeci-dessus, on a trois cas : (a = 0 et |z| = 1) ou (a = 1 et <(z) = −1/2, auquel cas z = j))ou (a = −1 et <(z) = 1/2, auquel cas z = −1/j). Si d = 1 et z = j, alors a− b = 1 doncz′ = a− 1/(1 + j) = a+ j donc a = 0 ou 1. Idem pour d = −1 et z = −1/j.

Remarque. Géométriquement, D∪∞ est le triangle géodésique de sommets j,−1/jet∞ dans H∗. C'est peut-être plus clair si on considère S.D qui est un triangle géodésiquede sommets j,−1/j et 0.

Corollaire. PSL2(Z) est engendré par (les images de) S et T .

Démonstration. Comme dans la preuve précédente, notons Γ′ le groupe engendré par S etT . On a vu que H =

⋃γ′∈Γ′ γ

′D. Soit alors γ ∈ Γ, et choisissons z0 ∈ D. On peut trouverγ′ ∈ Γ′ tel que γ′γz0 ∈ D. Mais d'après le i) on a alors z0 = γ′γz0 et d'après le ii) on endéduit γ′γ = ±1. Donc Γ(1)/±1 est engendré par les images de S et T .

7

Page 8: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Remarque. On peut montrer que 〈S, T |S2, (ST )3〉 est une présentation de PSL2(Z).En particulier PSL2(Z) est isomorphe au produit libre de Z/2Z et Z/3Z.

Le théorème précédent montre que Γ(1) a deux orbites de points elliptiques, l'uned'ordre 2 et l'autre d'ordre 3.

points elliptiques de Γ(1) dans H = Γ(1)i⊔

Γ(1)j.

Quant aux pointes, il est clair que ∞ ∈ PΓ(1) avec Γ(1)∞ = ±1.[ 1 10 1 ]Z. En fait, tout

élément parabolique de SL2(Z) est conjugué, dans GL2(Q), à [ 1 10 1 ]. Donc toute pointe de

Γ(1) appartient à GL2(Q).∞ = P1(Q). En remarquant (exercice) que P1(Q) = SL2(Z)∞,on a donc

PΓ(1) = P1(Q) = Γ(1).∞.

1.1.6 Corollaire. La surface de Riemann Y (1) = Γ(1)\H est isomorphe au plancomplexe, tandis que X(1) = Γ(1)\H est isomorphe à la sphère de Riemann.

Démonstration. Nous donnons une explication topologique utilisant la classication dessurfaces de Riemann compactes. Nous verrons plus tard des fonctions explicites qui réalisentles isomorphismes annoncés.

Il sut de montrer que X(1) est compacte et de genre 0. Pour la compacité, vu ladescription des pointes, on remarque que X(1) est l'image par π : H∗ −→ Γ(1)\H∗ deD∗ := D t ∞. Or il est clair que D∗ est compact : si on a un recouvrement ouvert, l'unde ces ouverts est de la forme (Ur t ∞) ∩ D∗ et son complémentaire est compact dansD.

Pour le genre 0, plusieurs arguments géométriques sont possibles, que l'on ne formaliserapas. En voici un. Topologiquement, on peut obtenir Y (1) en deux étapes à partir de D :

identication des demi-droites <(z) = 1/2 et <(z) = −1/2 identication du segment [i, j] avec le segment [i, Sj].

La première étape fournit un cylindre de base un cercle obtenu en identiant les extrémitésj et Sj du segment géodésique [j, Sj]. La deuxième étape ferme ce cylindre en applatissantle cercle sur un segment [i, j]. On voit alors que la rétraction géodésique verticale deD sur le segment [j, Sj] passe au quotient pour donner une rétraction de Y (1) sur l'imagede [j, Sj]. Mais celle-ci est un segment. Donc l'espace obtenu est simplement connexe. Ils'ensuit que Y (1) est isomorphe à C ou D, mais puisqu'on peut la compactier par unpoint, c'est de C qu'il s'agit. Par suite X(1) est isomorphe à P1(C).

1.1.7 Sous-groupes de congruence. Soit Γ un sous-groupe d'indice ni de Γ(1).Domaine fondamental. Soit d := |Γ±1\Γ(1)|. Si on choisit γ1, · · · , γd tels que Γ(1) =⊔

i Γγi (la barre désigne l'image dans PSL2), alors la réunion D′ = γ1D t · · · t γdD atoutes les vertus d'un domaine fondamental sauf celle d'être connexe. Le jeu, dans les casconcrets, consiste alors à choisir les γi de sorte que l'adhérence D′ soit connexe. Dans cecas, l'intérieur de D′ est un domaine fondamental pour Γ.

8

Page 9: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Pointes. Il est clair que PΓ ⊂ PΓ(1) = P1(Q). Mais comme Γ(1)x est inni pour toutepointe x ∈ P1(Q) et Γ d'indice ni, on a aussi Γx inni et x est donc une pointe. DoncPΓ = P1(Q). Par contre, en général il y a plusieurs Γ-orbites dans P1(Q). On note n∞ lenombre de telles orbites.

Points elliptiques. Si z est un point elliptique de Γ, il est conjugué à i ou j sous Γ(1). Onnote n2 le nombre de Γ-orbites de points elliptiques conjugués à i (ils sont d'ordre h = 2)et n3 le nombre de Γ-orbites de points elliptiques conjugués à i (ils sont d'ordre h = 3).

Théorème. La surface de Riemann X(Γ) est compacte. La projection X(Γ) −→X(1) est holomorphe de degré (ou valence) d et le genre de X(Γ) est

g = 1 + d/12− n2/4− n3/3− n∞/2.

Démonstration. La compacité se prouve comme pour Γ(1) en remarquant que X(Γ) estl'image de la réunion γ1D

∗∪· · ·∪γdD∗ qui est compact. Le fait que l'application Y (N) −→Y (1) est holomorphe découle de la dénition des structures complexes, et de même pourl'holomorphie de X(N) −→ X(1) au voisinage des pointes. Comme elle est non-constante,elle a un degré (aussi appelé valence) qu'on peut calculer en comptant la préimage d'unpoint ordinaire (ni elliptique ni pointe). On obtient d, vu la forme d'un domaine fonda-mental. Pour calculer le genre, on utilise la formule d'Hurwitz

χ(X(Γ)) = d.χ(X(1)) +∑P

(eP − 1)

où χ(X) = 2g(X)−2 est la caractéristique d'Euler d'une surface de Riemann compacte X,et eP désigne l'indice de ramication de f : X(Γ) −→ X(1) en P ∈ X(Γ) (i.e., localementautour de P , f est de la forme z 7→ zeP ). Dans notre cas, cela donne

g(X(Γ)) = 1− d+1

2

∑P

(eP − 1).

Notons π : H∗ −→ X(1) la projection canonique. On a vu que le degré de ramicationde π en un point de H est ni, égal à 1 pour un point ordinaire, 2 pour un point elliptiqueéquivalent à i ou 3 pour un point elliptique équivalent à j. Par multiplicativité des indicesde ramication, l'indice eP de f en un point qui n'est pas une pointe est aussi 1, 2 ou 3.

Plus précisément, considérons la bre f−1(π(i)). Pour P dans cette bre, on a eP = 1 si P est (l'image d') un point elliptique pour Γ. eP = 2 si P est (l'image d') un point ordinaire pour Γ.

Par dénition de n2, il y a donc n2 points P ∈ f−1(π(i)) tels que eP = 1. Vu les propriétésdu degré, il y a donc d−n2

2points P ∈ f−1(π(i)) tels que eP = 2. D'où une contribution∑

P 7→π(i)(eP − 1) = (d− n2)/2 à la formule de Hurwitz.Considérons maintenant la bre f−1(π(j)). Pour P dans cette bre, on a eP = 1 si P est (l'image d') un point elliptique pour Γ. eP = 3 si P est (l'image d') un point ordinaire pour Γ.

9

Page 10: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Par dénition de n3, il y a donc n3 points P ∈ f−1(π(i)) tels que eP = 1. Vu les propriétésdu degré, il y a donc d−n3

3points P ∈ f−1(π(i)) tels que eP = 3. D'où une contribution∑

P 7→π(j)(eP − 1) = 2(d− n2)/3 à la formule de Hurwitz.Considérons enn la bre f−1(π(∞)), qui est l'ensemble des (images de) pointes de

X(Γ). Son cardinal est n∞ et∑

P 7→π(∞) eP = d. D'où une contribution∑

P 7→π(∞)(eP −1) =d− n∞ à la formule de Hurwitz.

Il ne reste plus qu'à rassembler les termes.

Remarque. Sur la ramication aux pointes. Supposons que x ∈ P1(R) est une pointepour Γ, d'image P dans X(Γ). Son stabilisateur Γx±1 est un sous-groupe d'indice nih de Γ(1)x. Si l'on ramène x au point ∞ par un élément de τ de Γ(1), on a vu qu'unecoordonnée locale autour de P est donnée par exp(2iπτ(z)/h) tandis qu'une coordonnéelocale autour de π(z) est exp(2iπτ(z)). Dans ces coordonnées, la projection X(Γ) −→ X(1)prend donc la forme x 7→ xh, ce qui montre que h est l'indice de ramication de cetteprojection au point P .

1.1.8 Interprétation modulaire. Le mot modulaire renvoie à la notion d'espace demodule, i.e. d'espace qui classie certains objets. En l'occurrence, la courbe Y (1) classieles surfaces de Riemann de genre 1 à isomorphisme (ie biholomorphisme) près.

Pour expliquer cela, on utilise la notion de tore complexe (de dimension 1). Par dé-nition, c'est le quotient C/Λ de C par un réseau Λ = Zω1 ⊕ Zω2, muni de la structurecomplexe donnée par le faisceau des fonctions holomorphes invariantes par Λ, comme dansla proposition 1.1.3 (sauf qu'ici Λ agit proprement et librement, de sorte que C −→ C/Λ estun revêtement localement trivial, i.e. sans ramication). Il est clair que C/Λ est compacteet de genre 1. Inversement :

Proposition. Toute surface de Riemann X de genre 1 est biholomorphe à un torecomplexe (de dimension 1).

Démonstration. Le théorème d'uniformisation de Riemann nous dit que le revêtement uni-versel de X est C ou H, et qu'on peut réaliser X comme quotient de son revêtementuniversel par un groupe y opérant librement et proprement.

Si X est de la forme Γ\H pour Γ ⊂ Aut(H), alors : Γ doit être discret (pour agir proprement) Γ n'a pas de point elliptique (pour agir librement) ni de pointe (sinon on pourrait

agrandir X qui est déjà compacte). Γ est isomorphe au groupe fondamental de X qui est Z2.

Le groupe Γ est donc constitué d'éléments hyperboliques qui admettent 2 droites proprescommunes dans R2 (diagonalisation simultanée). Donc, après conjugaison, Γ est un sous-groupe des matrices diagonales dans SL2(R) (modulo ±1), donc de R×. Mais ce dernier nepossède pas de sous-groupe discret isomorphe à Z2. Contradiction.

DoncX est de la forme Γ\C. Or Aut(C) est l'ensemble des z 7→ az+b avec a, b ∈ C××C.Si a 6= 1 un tel automorphisme possède un point xe donc n'agit pas librement. Donc

10

Page 11: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

nalement Γ est un groupe discret de translations, donné par un réseau Λ comme ci-dessus,et Γ\C = C/Λ.

Remarque. Une conséquence est que toute surface de Riemann de genre 1 peut êtremunie d'une structure de groupe analytique, puisque c'est le cas de C/Λ.

Étudions maintenant les biholomorphismes entre deux tores complexes.

Proposition. Toute application holomorphe ϕ : C/Λ −→ C/Λ′ est de la forme[z + Λ] 7→ [αz + β + Λ′] où β ∈ C et α ∈ C est tel que αΛ ⊂ Λ′.

Démonstration. Notons π : C −→ C/Λ et π′ : C −→ C/Λ′ les projections canoniques.Comme C est simplement connexe, il existe une application continue ϕ : C −→ C telleque ϕ π = π′ ϕ, et cette application est holomorphe. Pour tout λ ∈ Λ, l'applicationz 7→ ϕ(z + λ) − ϕ(z) est à valeurs dans Λ′ qui est discret, et donc est constante puisqueC est connexe. Il s'ensuit que la dérivée ϕ′ est invariante sous Λ. Celle-ci descend donc enune fonction holomorphe sur C/Λ, qui n'a d'autre choix que d'être constante, de valeurα ∈ C. On en déduit l'existence de β ∈ C tel que ϕ(z) = αz + β.

Remarque. Une conséquence est que toute application holomorphe entre tores com-plexes qui envoie 0 sur 0 est un homomorphisme de groupes analytiques. Il s'ensuit que, siX est une surface de Riemann compacte de genre 1 munie d'un point x, alors la structurede groupe analytique avec élément neutre x donnée par la remarque précédente est unique,i.e. ne dépend pas du biholomorphisme C/Λ ∼−→ X choisi, pourvu qu'il envoie 0 sur x.

Maintenant, un réseau Λ admet une base (ω1, ω2) comme Z-module. Toutes les basesse déduisent l'une de l'autre par action de GL2(Z) sur le vecteur colonne

(ω1

ω2

)∈ C2. On

peut ordonner la base de sorte que =(ω1/ω2) > 0. Les bases ainsi ordonnées se déduisentl'une de l'autre par action de SL2(Z). On obtient ainsi une bijection entre l'ensemble Rdes réseaux et l'ensemble SL2(Z)\V des vecteurs

(ω1

ω2

)∈ C2 avec ω1/ω2 ∈ H modulo action

de SL2(Z). Via cette bijection, l'action par homothétie de C× sur R correspond à l'actionpar homothétie sur V . On vient de voir que le quotient R/C∗ s'identie à l'ensemble Edes classes d'isomorphisme de tores complexes. De l'autre côté, l'application

(ω1

ω2

)7→ ω1/ω2

induit une bijection de V/C× sur H. Au nal, on obtient le résultat suivant.

Proposition. On a des bijections

Y (1) = SL2(Z)\H

z 7→Zz⊕Z ∼

Surf. de R. de genre 1/biholom

Réseaux de C/homothétie

Λ7→C/Λ∼

// tores complexes/isom

∼OO

1.2 Formes modulaires

Γ désigne toujours un sous-groupe d'indice ni dans SL2(Z).

11

Page 12: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

1.2.1 Fonctions modulaires de poids 0. On rappelle qu'une fonction méromorpheX 99KC sur une surface de RiemannX (donc dénie en dehors de ses pôles) se prolonge de manièreunique en une application holomorphe X −→ P1(C). On noteMX le corps des fonctionsméromorphes sur X. Par exempleMP1(C) ' C(z). Un résultat spectaculaire de la théorie(dont nous n'avons pas besoin) dit que X 7→ MX est une équivalence entre la catégoriedes surfaces de Riemann compactes munie des applications holomorphes non-constantes,et la catégorie des corps à engendrement ni et degré de transcendence 1 sur C. C'est unemotivation pour étudier le corpsMX(Γ).

Soit ϕ une fonction méromorphe X(Γ) −→ P1(C). Notons f la composée H −→X(Γ)

ϕ−→ P1(C). C'est une fonction méromorphe Γ-invariante sur H. Réciproquement,si on se donne une telle fonction f , celle-ci descend bien à Y (Γ) mais pour pouvoir laprolonger à X(Γ), il faut une condition de méromorphie aux pointes.

Pour expliciter cette condition, partons plus généralement d'une fonction méromorphef sur H qui est horizontalement périodique au sens où il existe un entier non nul h tel quef(z) = f(z+h) (autrement dit, f est invariante par une matrice [ 1 h

0 1 ]). Elle s'écrit commeune fonction méromorphe en q = exp(2iπz/h) ∈ D \ 0 et admet donc un développement

f(z) =∑n∈Z

anqn

au voisinage de q = 0 (donc de z = ∞). On dit que f est méromorphe à l'inni si cettefonction de q est méromorphe en 0, c'est à dire si an = 0 pour n << 0. On note alors

ord∞,h(f) le plus petit n ∈ Z tel que an 6= 0,

et on dit que f est holomorphe à l'inni si ord∞,h(f) > 0. On peut remarquer que cesnotions ne dépendent pas du choix de h tel que f soit [ 1 h

0 1 ]-invariante (mais bien-sûrl'entier ord∞,h dépend de h).

Revenons à une fonction méromorphe Γ-invariante. Pour une pointe x ∈ P1(Q), onchoisit τ ∈ SL2(Z) tel que τx = ∞, et on dit que f est méromorphe ou holomorphe àla pointe x si τ ∗f : z 7→ f(τ−1z), qui est horizontalement périodique, est méromorphe ouholomorphe à l'inni. Cela ne dépend pas du choix de τ , pas plus que l'entier

ordx,h(f) := ord∞,h(τ∗f).

Les fonctions f : H −→ C invariantes par Γ et méromorphes sur H et aux pointes sontappelées fonctions modulaires de niveau Γ et poids 0. Elles correspondent aux fonctionsméromorphes sur X(Γ).

Les fonctions f : H −→ C invariantes par Γ et holomorphes sur H et aux pointessont appelées formes modulaires de niveau Γ et poids 0. Elles correspondent aux fonctionsholomorphes sur X(Γ), et sont donc ... constantes !

1.2.2 Formes modulaires de poids 2. Après les fonctions méromorphes, il est naturel deregarder les formes diérentielles méromorphes sur X(Γ). Sur un ouvert U de C une formediérentielle holomorphe, resp. méromorphe, s'écrit ω = f(z)dz avec f holomorphe, resp.

12

Page 13: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

méromorphe. Si ϕ : V∼−→ U est un biholomorphisme sur un autre ouvert de C, on peut

transporter ω en ϕ∗ω = f(ϕ(z)).ϕ′(z)dz. Sur une surface de Riemann X plus générale,une forme diérentielle est la donnée, pour chaque carte X ⊇ O

∼−→ U ⊂ C, d'une formediérentielle sur U , et ce de manière compatible avec la formule de changement de carteci-dessus.

Soit π : H −→ X(Γ) la restriction de la projection canonique à H ⊂ H∗. Une forme dif-férentielle méromorphe ω sur X(Γ) induit une forme diérentielle méromorphe Γ-invarianteπ∗ω = f(z)dz. La condition d'invariance s'écrit :

∀γ ∈ Γ, f(γz)d(γz) = f(z)dz

et un calcul montre que pour γ = [ a bc d ], et en posant jγ(z) = cz + d on a

d(γz) = jγ(z)−2dz.

On a donc la propriété suivante d' automorphie sur la fonction f

∀γ ∈ Γ, f(z) = jγ(z)−2f(γz).

Puisque j±[ 1 h0 1 ](z)2 = 1, on voit que toute fonction f satisfaisant cette propriété d'automor-

phie est horizontalement périodique. De même, pour tout τ ∈ SL2(Z), la forme diérentielleτ ∗(f.dz) = jτ (z)−2f(τz)dz est invariante sous τ−1Γτ donc la fonction jτ (z)−2f(τz) est ho-rizontalement périodique. On dit alors que f est méromorphe ou holomorphe à la pointeτ∞ si la fonction z 7→ jτ (z)−2f(τz) est méromorphe ou holomorphe à l'inni. Cela nedépend pas du choix de τ , pas plus que l'entier 2

ordx,h(f) := ord∞,h(jτ (z)−2f(τz)).

Une fonction modulaire de niveau Γ et poids 2 est une fonction sur H qui satisfaitla propriété d'automorphie ci-dessus et est méromorphe sur H et aux pointes. Une tellefonction correspond donc à une forme diérentielle méromorphe sur X(Γ).

Une forme modulaire de niveau Γ et poids 2 est une fonction modulaire qui est de plusholomorphe sur H et aux pointes.

Attention. L'holomorphie de f n'est pas équivalente à celle de ω ! ! Pour expliquercela, introduisons la notation ordP (f) pour l'ordre du zéro ou du pôle en un point P d'unefonction méromorphe f sur une surface de Riemann. Si on développe f = g(z) dans unecoordonnée locale z au voisinage de P on a ordP (f) = ord0(g). De même, si dans cettecoordonnée on développe une forme diérentielle méromorphe sous la forme ω = g(z)dz,alors l'entier ord0(g) ne dépend pas du choix de la coordonnée et se note ordP (ω). Bien sûrω est holomorphe en P si et seulement si ordP (ω) > 0.

2. on remarquera que cette dénition de ordx,h(f) est diérente de la précédente (sauf si x = ∞),qui s'appliquait à une fonction Γ-invariante. Ici, c'est fdz qui est Γ-invariante. La notation peut paraitreambigüe, mais l'ambiguité n'existe que pour une fonction f telle que f et fdz sont Γ-invariantes. Or unetelle fonction est nulle.

13

Page 14: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Lemme. Soit ω une forme diérentielle méromorphe sur X(Γ) et soit f la fonctionméromorphe sur H telle que π∗ω = f(z)dz. Alors on a les égalités suivantes :

i) ordP (f) = ordπ(P )(ω) si P est un point de H ordinaire pour Γ.

ii) ordP (f) = e.ordπ(P )(ω) + e− 1 si P est un point elliptique d'ordre e (égal à 2 ou 3).

iii) ordx,h(f) = ordπ(x)(ω) + 1 si x est une pointe d'ordre h.

Démonstration. i) et ii). On a vu qu'au voisinage d'un point P de H, il existe une coor-donnée locale z′ = τ(z) telle que π est de la forme z′ 7→ z′e, avec e = 1 si P est ordinaire.La fonction u = z′e descend donc en une coordonnée locale autour de π(P ). Il s'ensuit quesi ω = g(u)du au voisinage de π(z0), alors π∗ω = g(z′e)d(z′e) = ez′e−1g(z′e)dz′ et doncordP (f) = ordP (π∗ω) = ord0(z′e−1g(z′e)) = e.ord0(g) + e− 1 = e.ordπ(P )(ω) + e− 1.

iii) Quitte à translater par un τ ∈ SL2(Z) on peut supposer que x = ∞. Dans ce cas,on a vu que q = exp(2iπz/h) est une coordonnée locale autour de π(x). Ainsi si ω est dela forme g(q)dq, π∗ω est de la forme 2iπ/h.g(exp(2iπz/h)).exp(2iπz/h)dz = f(z)dz, desorte que f(z) = 2iπ/h.q.g(q), et nalement ord∞,h(f) = ord0(q.g(q)) = ord0(g(q)) + 1 =ordπ(x)ω + 1.

Notons M2(Γ) le C-espace vectoriel des formes modulaires de niveau Γ et poids 2 S2(Γ) le sous-espaces des formes modulaires paraboliques (aussi appelées cuspidales,

et en anglais cusp forms), qui par dénition sont celles qui s'annulent aux pointes(ie ordx,h(f) > 0 pour chaque pointe x).

La théorie des diviseurs de Weil et en particulier le théorème de Riemann-Roch montre queces espaces sont de dimension nie et permet de calculer leur dimension. Faisons quelquesrappels à ce sujet.

Un diviseur sur X est une somme∑

P∈X aP [P ] où aP ∈ Z est nul sauf pour unnombre ni de points. L'ensemble des diviseurs Div(X) est donc le groupe abélienlibre de base X. Il est partiellement ordonné par la relation

∑P aP [P ] 6

∑P bP [P ]

si aP 6 bP pour tout P . Le dégré d'un diviseur est déni par deg(

∑P aP [P ]) =

∑P aP ∈ Z.

A toute fonction méromorphe non-nulle f on associe son diviseur

div(f) :=∑P

ordP (f)[P ].

On a div(fg) = div(f)+div(g) et div(f+g) > inf(div(f), div(g)). 3 On obtient ainsiun homomorphisme de groupeM×

X

div−→ Div(X) dont l'image est notée Div.pr(X).Un tel diviseur est dit principal. Le quotient Div(X)/Div.pr(X) s'appelle groupe dePicard de X et se note Pic(X). (C'est l'analogue du groupe des classes d'un corpsde nombres).

3. Ici la notation inf est à prendre comme un pgcd pour la relation d'ordre partiel sur les diviseurs.C'est donc l'élément maximal parmi les élements inférieurs à div(f) et div(g).

14

Page 15: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

L'application deg se factorise par Pic(X). En eet, si l'on considère f ∈M×X comme

une application holomorphe X −→ P1(C) dont on note eP l'indice de ramicationen un point P ∈ X, alors

div(f) =∑P 7→0

eP [P ]−∑P 7→∞

eP [P ]

donc son degré est nul. De même à toute forme diérentielle méromorphe on associe

div(ω) =∑P

ordP (ω)[P ].

Comme div(fω) = div(f)+div(ω), ∀f ∈M×X , l'image de ω dans Pic(X) ne dépend

pas de ω, s'appelle le diviseur canonique de X, et se note K. Si D ∈ Div(X), on note

L(D) := f ∈M×X , div(f) +D > 0 t 0.

C'est un C-espace vectoriel dont la dimension `(D) := dimC L(D) ne dépend que del'image de D dans Pic(X), puisque pour f0 ∈ M×

X , la multiplication par f0 induitun isomorphisme linéaire L(D)

∼−→ L(D + div(f0)). Le théorème de Riemann-Roch arme que

`(D) = deg(D) + 1− g + `(K −D)

où g est le genre deX. Sachant que `(0) = 1 (fonctions holomorphes surX compacte,donc constantes) , on voit en particulier, en prenant D = 0 puis D = K, que

`(K) = g et deg(K) = 2g − 2.

Il s'ensuit que si deg(D) > 2g − 2, alors deg(K − D) < 0 donc L(K − D) = 0(puisqu'un diviseur positif a un degré positif) et

`(D) = deg(D) + 1− g.

Revenons à X = X(Γ) et notons Dπ :=∑

P∈X(Γ)(1 − 1/eP )[P ] ∈ Div(X(Γ)) ⊗Z Q oùeP vaut 1 pour un point ordinaire, 2 ou 3 pour un point elliptique, et +∞ pour une pointe.On a donc deg(Dπ) = 1

2n2 + 2

3n3 + n∞.

Corollaire. On a les égalités dimC(M2(Γ)) = `(Dπ +K) = g − 1 + n∞, dimC(S2(Γ)) = `(K) = g.

Démonstration. Le lemme précédent nous dit que l'application ω 7→ f dénie par π∗ω =f(z)dz induit un isomorphisme

ω, div(ω) +Dπ > 0 t 0 ∼−→M2(Γ).

15

Page 16: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Fixons une forme diérentielle méromorphe ω0 sur X(Γ) 4, et écrivons les autres sous laforme ω = g.ω0, alors puisque div(ω) = div(g) + div(ω0), l'application g 7→ gω0 7→ f induitun isomorphisme

L(div(ω0) +Dπ)∼−→M2(Γ).

La même application induit l'isomorphisme

L(div(ω0) +Dπ −∑P 7→∞

[P ])∼−→ S2(Γ).

Notons bDπc la partie entière de Dπ, c'est-à-dire bDπc =∑

P 7→∞[P ]. Alors bien-sûr, on aL(div(ω0) +Dπ) = L(div(ω0) + bDπc). Il s'ensuit que

dimC(M2(Γ)) = `(div(ω0) + bDπc) = `(K + bDπc) = `(K +∑P 7→∞

[P ]).

On a deg(K +∑

P 7→∞[P ]) = 2g − 2 + n∞ > 2g − 2 de sorte que la forme simpliée duthéorème de Riemann-Roch s'applique pour donner

`(K +∑P 7→∞

[P ]) = deg(K +∑P 7→∞

[P ]) + 1− g = g − 1 + n∞.

Par le même raisonnement, on obtient que

dimC(S2(Γ)) = `(div(ω0) + bDπc −∑P 7→∞

[P ]) = `(K) = g.

1.2.3 Formes modulaires de poids k ∈ N. Pour un entier k ∈ Z, on dénit une actionde GL2(R)+ surMX par la formule

f [γ]k(z) := det(γ)k/2jγ(z)−kf(γz).

Le fait que ce soit une action, i.e. que [γγ′]k = [γ]k[γ′]k, découle de la formule jγγ′(z) =

jγ(γ′z)jγ′(z) que l'on vériera sans peine.On espère que le paragraphe précédent rend plus naturelle la dénition suivante :

Définition. Soit Γ un sous-groupe d'indice ni de SL2(Z). Une forme modulaire deniveau Γ et poids k ∈ N est une fonction f : H −→ C satisfaisant les propriétés suivantes :

i) ∀γ ∈ Γ, f [γ]k = f (propriété d'automorphie).

ii) f est holomorphe sur H ainsi qu'aux pointes 5.

4. Il en existe toujours. Par exemple, sur X(1) = P1 on peut prendre dz (qui a div(dz) = −2[∞]) puistirer en arrière dz via X(Γ) −→ X(1)

5. Comme dans le cas de poids 2, l'holomorphie à la pointe∞ est bien dénie car f est horizontalementpériodique. Pour une pointe x = τ∞, τ ∈ SL2(Z), on dit que f est holomorphe ou méromorphe en x si latranslatée f [τ ]k, qui est aussi horizontalement périodique, l'est à l'inni. Cela ne dépend pas du choix deτ , pas plus que l'entier ordx,h(f) := ord∞,h(f [τ ]k).

16

Page 17: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Ces fonctions forment un C-espace vectoriel que l'on noteMk(Γ). On dit que f est para-bolique (ou cuspidale, et en anglais cusp form) si f s'annule aux pointes. L'espace desformes paraboliques est noté Sk(Γ).

On dira aussi d'une fonction satisfaisant ces propriétés avec méromorphe au lieu deholomorphe que c'est une fonction modulaire de niveau Γ et poids k.

Remarque. Si k est impair et−1 ∈ Γ, alorsMk(Γ) = Sk(Γ) = 0 puisque f [−1]k = −f .

Remarque. Pour vérier qu'une fonction est automorphe pour (Γ, k) il sut de vérierl'égalité f [γ]k = f pour un ensemble de générateurs de Γ. Par exemple, si Γ = Γ(1) et kpair, il sut de vérier f(z + 1) = f(z) et f(−1/z) = zkf(z).

Remarque. Si f est méromorphe et automorphe de poids k, pour vérier que f estholomorphe aux pointes, il sut de montrer que pour tout τ ∈ Γ(1), la fonction τ ∗f(z)admet une limite lorsque =(z)→∞.

Remarque. La multiplication des fonctions induit un produitMk(Γ) ⊗Mk′(Γ) −→Mk+k′(Γ), qui fait de M(Γ) :=

⊕k∈NMk(Γ) une C-algèbre graduée, et de S(Γ) :=⊕

k∈N Sk(Γ) un idéal de cette algèbre.

Remarque. Lorsque Γ = Γ(1), il est intéressant d'exprimer la propriété d'automorphieen termes de fonctions sur les réseaux. Une fonction sur R est dite homogène de poids k si

∀Λ ∈ R, ∀α ∈ C×, ϕ(αΛ) = α−kϕ(Λ)

Notons Λz := zZ ⊕ Z. L'égalité Λγz = jγ(z)−1Λz montre que l'application ϕ 7→ f déniepar f(z) = ϕ(Λz) est une bijection

Fonctions homogènes de poids k sur R ↔ Fonctions Γ(1)-automorphes de poids k

dont la bijection réciproque est donnée par ϕ(Λ) = ω−k2 f(ω1/ω2) où(ω1

ω2

)est n'importe

quelle base de Λ telle que ω1/ω2 ∈ H.

Exemple. (Séries d'Eisenstein) La manière la plus naïve de fabriquer une fonction depoids k sur R est de poser

Gk(Λ) :=∑ω∈Λ∗

1

ωk

où Λ∗ = Λ \ 0. Cette somme converge absolument pour k > 3 (exercice) et, comme il sedoit, est nulle si k est impair. La fonction correspondante sur H s'écrit

Gk(z) =∑

(m,n)∈(Z2)∗

1

(mz + n)k.

Pour étudier l'holomorphie, choisissons ε > 0 susamment petit pour qu'il existe zε tel que|zε| = 1− ε et 2<(zε) = 1 + ε. Considérons le voisinage ouvert Dε du domaine fondamentalD donné par les inégalités |z| > (1− ε) et |2<(z)| < 1 + ε. Pour z dans Dε, l'inégalité

|mz + n|2 = m2zz + 2mn<(z) + n2 > m2(1− ε)2 −mn(1 + ε) + n2 = |mzε − n|2

17

Page 18: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

montre que Gk converge normalement sur Dε et y est donc holomorphe. Par automorphie,Gk est donc holomorphe sur tout H. Pour montrer qu'elle est aussi holomorphe à la pointe∞, il faut montrer que Gk(z) possède une limite lorsque =(z)→∞. Par invariance sous T ,on peut garder z dans D, et la convergence normale nous montre que, puisque k est pair,

limz∈D,=(z)→∞

Gk(z) =∑

n∈Z\0

1

nk= 2ζ(k).

Ainsi Gk ∈Mk(Γ(1)) et Gk(∞) = 2ζ(k) (avec toujours k pair).

Exemple. (Fonction ∆) Pour une raison qui apparaitra quand nous parlerons decourbes elliptiques, il est d'usage de poser g2 := 60G4 et g3 := 140G6. Admettant mo-mentanément que ζ(4) = π4

2.32.5et ζ(6) = π6

33.5.7(cf feuille d'exercices), on constate alors

que∆ := g3

2 − 27g23 ∈ S12(Γ(1)),

donnant donc un premier exemple de forme parabolique.

1.2.4 Pôles et zéros des fonctions modulaires. Lorsque k = 2k′ est pair, on peutinterpréter les formes modulaires de poids k comme certaines k′-formes diérentielles surX(Γ). Une k′-forme diérentielle sur un ouvert de C est une expression de la forme ω =f(z)(dz)k

′. Si ϕ est une application biholomorphe entre deux ouverts on transporte une

telle forme par la formule ϕ∗ω = f(ϕ(z))ϕ′(z)k′(dz)k

′. Ceci permet de dénir ce qu'est une

k′-forme diérentielle sur une variété comme la donnée d'une k′-forme sur chaque cartede X, avec compatibilité au changement de carte. On se retrouve alors dans une situationsemblable au poids 2, avec notamment une correspondance

Fonctions modulaires f de poids k niveau Γ↔ k′-formes diérentielles ω méromorphes sur X(Γ)

donnée par l'égalité π∗ω = f(z)(dz)k′. Comme pour le poids 2, on a la relation suivante

entre pôles et zéros de f et ω.ordP (f) = e.ordπ(P )(ω) + k′(e− 1) si P ∈ H et e est son indice de ramicationordx,h(f) = ordπ(x)(ω) + k′ si x est une pointe d'ordre h

Proposition. Soit f une fonction modulaire non nulle de poids k et niveau Γ. Alors∑P∈Γ\H

ordP (f)/eP +∑

x∈Γ\PΓ

ordx,hx(f) =k

2(2g − 2 +

1

2n2 +

2

3n3 + n∞) =

kd

12

où l'on rappelle que d = [Γ(1) : Γ±1].

Démonstration. Lorsque k = 2k′ est pair, les égalités ci-dessus montrent que le terme degauche s'identie à deg(div(ω)) + k′ deg(Dπ). Le degré deg(div(ω)) ne dépend pas de ω(puisque les autres sont de la forme gω avec g ∈ M×

X(Γ)). On peut le calculer en prenant

18

Page 19: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

ω′ de la forme ωk′

1 où ω1 est une 1-forme diérentielle méromorphe sur X(Γ) et ωk′

1 désignela k′-forme diérentielle donnée par ωk

′1 = f(z)k

′(dz)k

′sur une carte où ω1 = f(z)dz. On

obtient deg(div(ω)) = k′ deg(div(ω1)) = k′(2g − 2), dont on déduit la première égalité. Laseconde vient de la formule donnant le genre.

Lorsque k est impair, il sut d'appliquer le cas pair à f 2.

Application. (Calcul deM(Γ(1))) Pour Γ = Γ(1), la formule devient

ord∞,1(f) +1

2ordi(f) +

1

3ordj(f) +

∑P 6=i,j,∞

ordP (f) = k/12.

On sait queMk(Γ(1)) est nul si k est impair. Si on fait k = 2, puisque chacun des ord?(f)est > 0, on constate qu'il n'y a pas de f satisfaisant cette égalité. Donc

M2(Γ(1)) = 0.

Si on fait k = 4, on obtient que toute f ∈ M4(Γ(1)) possède un zéro simple en j, etne s'annule nulle part ailleurs. Cela s'applique à G4, et montre que f/G4 est une formemodulaire de poids 0 donc constante, donc

M4(Γ(1)) = C.G4.

De même avec k = 6, on obtient que G6 possède un zéro simple en i et ne s'annule nullepart ailleurs, puis que

M6(Γ(1)) = C.G6.

Le même raisonnement montre queM8 etM10 sont de dimension 1 et plus précisément

M8(Γ(1)) = C.G8 = CG24 et M10(Γ(1)) = C.G10 = CG4G6.

Enn pour k = 12, toute forme parabolique f ne peut s'annuler en dehors de ∞, et sonzéro en ∞ est d'ordre 1. Ceci s'applique à ∆, et on en déduit que

S12(Γ(1)) = C.∆.

Maintenant, puisque ∆ est inversible en tant que fonction sur H, l'application f 7→ ∆.finduit un isomorphisme

Mk(Γ(1))∼−→ Sk+12(Γ(1))

pour tout k ∈ N. Par ailleurs, puisque Sk(Γ(1)) est de codimension 1 dans Mk(Γ(1))(noyau de l'application f 7→ f(∞), et puisque Gk n'est pas parabolique, on a pour k > 12

Mk(Γ(1)) = CGk ⊕ Sk(Γ(1)).

Grâce aux calcul desMk pour k < 12 on en déduit

dimC(Mk(Γ(1)) =

0 si k impairb k

12c si k ≡ 2 (mod 12)

b k12c+ 1 si k ≡ 0, 4, 6, 8, 10 (mod 12)

En fait, on a encore mieux :

19

Page 20: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Proposition. L'algèbreM(Γ(1)) est l'algèbre des polynômes en G4 et G6.

Démonstration. Il s'agit de montrer que pour k ∈ 2N, la famille des Gn4G

m6 où n,m ∈ N et

4n+ 6m = k est une base deMk(Γ(1)). On l'a déjà vérié pour k 6 10.Montrons par récurrence que cette famille est génératrice pour k > 12. Choisissons pour

cela n,m tels que 4n+ 6m = k, et soit f ∈Mk. Puisque Gn4G

m6 ne s'annule pas à l'inni, il

existe λ tel que f−λGn4G

m6 soit parabolique. Mais alors f−λGn

4Gm6 = ∆.g pour g ∈Mk−12,

et par récurrence, on conclut que f ∈ C[G4, G6] (rappelons que ∆ = (60)3G34−27(140)2G2

6).Montrons maintenant que cette famille est libre. Soit (n0,m0) tel que 4n0 + 6m0 = k

avec m0 maximal. En divisant par Gn04 G

m06 , une relation de dépendence linéaire fournit un

polynôme dans C[T ] qui annule la fonction méromorphe G34G−26 , laquelle devrait donc être

constante, ce qui n'est pas le cas.

Exemple. (L'invariant modulaire j) Puisque ∆ est de poids 12 avec un seul zérosimple en ∞, la fonction

j := 1728g3

2

∆=

1728g32

(g32 − 27g2

3)

est une fonction modulaire de poids 0, holomorphe sur H et avec un pôle d'ordre 1 en ∞.En particulier, j descend en une fonction holomorphe j : Y (1) = Γ(1)\H −→ C, restrictiond'une application holomorphe j : X(1) −→ P1(C).

Proposition. j est un isomorphisme de surfaces de Riemann. En particulier, on a

MX(1) = C(j) et Fonctions modulaires de poids 0 niveau Γ(1) = C(j).

Démonstration. Puisque j possède un unique pôle simple en ∞, elle est de degré (ouvalence) 1 et par suite est un biholomorphisme X(1)

∼−→ P1(C). Le reste en découle.[Alternativement, on peut utiliser la proposition ci-dessus pour voir que la fonction j − λpossède un unique zéro simple pour tout λ ∈ C, puis conclure par le théorème d'inversionlocale].

Pourquoi 1728 ? Pour avoir un résidu égal à 1 en ∞. On peut calculer que avec q =exp(2iπz) on a j(z) = q−1 + 744 + · · · . Remarquons que 1728 = 2633.

1.2.5 À propos des q-développements. Posons q = exp(2iπz). Les formes ou fonctionsmodulaires ci-dessus ont des q-développements remarquables obtenus à une époque où lesfonctions spéciales étaient peut-être mieux maitrisées que maintenant. Un exercice de TDexpliquera le développement

Ek(z) :=1

2ζ(k)Gk(z) = 1− 2k

Bk

∞∑n=1

σk−1(n)qn

où les Bk sont les nombres de Bernoulli, rationnels, et σk−1(n) =∑

d|n dk−1. Un autre

résultat classique dû à Jacobi, cf ci-dessous, est l'expression

∆(z) = (2π)12q∞∏n=1

(1− qn)24

20

Page 21: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

qui montre que, dans le développement 1(2π)12 ∆(z) =

∑∞n=1 τ(n)qn, la fonction n 7→ τ(n) est

à valeurs entières. Cette fonction a été étudiée par Ramanujan qui a énoncé les conjecturessuivantes :

i) τ(nm) = τ(n)τ(m) pour (m,n) = 1, et τ(pr+1) = τ(pr)τ(p)−p11τ(pr−1) si p premier.

ii) |τ(p)| 6 2√p11 pour p premier.

Nous montrerons/expliquerons plus loin comment ces conjectures ont été résolues et géné-ralisées. Enn, le résultat de Jacobi montre aussi que dans le developpement

j(z) = q−1 + 744 +∞∑n=1

c(n)qn

les c(n) sont entiers ! (il faut aussi utiliser le fait que 1/B2 est entier)

Remarque. (Sur une preuve de la formule de Jacobi) Le but est de montrer que lafonction f(z) = q

∏∞n=1(1− qn)24 est modulaire de poids 12. Elle est alors clairement para-

bolique, donc un multiple de ∆ puisque S12(Γ(1)) = C.∆, et en comparant les termesdominants on trouve le facteur (2π)12. Puisque f(z) = f(z + 1), il sut de prouverf(−1/z) = z12f(z). Chose remarquable, la dérivée logarithmique de f s'écrit

d

dzlog(f(z)) = 2iπ

(1− 24

∞∑n=1

σ1(n)qn

)=: 2iπE2(z)

où l'on reconnait le q-développement de ce qui devrait être la série d'Eisenstein (normalisée)de poids 2, si la somme

∑m,n

1(mz+n)2 convergeait. Or, si on suit la méthode utilisée pour

calculer le q-développement de Gk (cf TD), on s'aperçoit que

2ζ(2)E2(z) =∑m∈Z

∑n∈Zm

1

(mz + n)2

où Zm = Z si m 6= 0 et Zm = Z \ 0 sinon. L'ordre des sommations est crucial pour laconvergence. Si on inverse le sens de sommation, on a encore convergence mais le résultatchange. On peut montrer (cf livre de Serre) que∑

m∈Z

∑n∈Zm

1

(mz + n)2= −2iπ/z +

∑n∈Z

∑m∈Zn

1

(mz + n)2.

Ceci implique que E2(−1/z) = z2E2(z) + 12z2iπ

, et en remontant la dérivée logarithmique onobtient f(1/z) = z12f(z).

1.2.6 Dimension des espaces de formes modulaires. Revenons au cas d'un sous-groupede congruence Γ plus général. Pour calculer la dimension des espaces de formes modulairesdans le cas où k est impair, on a besoin de la notion de pointe irrégulière. Cette notionvient de l'observation suivante : si f est une fonction telle que f(

[ −1 h0 −1

]z) = −f(z),

21

Page 22: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

c'est-à-dire f(z + h) = −f(z), alors elle est 2h-périodique et dans son développementf(z) =

∑n∈Z anq

n2h où q2h = exp(2iπz/2h), tous les an avec n pair sont nuls. En particulier,

si elle est holomorphe à l'inni, elle s'y annule nécessairement.Forts de cette observation, on dira que x est une pointe irrégulière pour (Γ, k) si

i) k est impair et −1 /∈ Γ

ii) écrivant x = τ∞, le groupe τ−1Γxτ contient[ −1 hx

0 −1

].

Si x = τ∞ est irrégulière et f est modulaire de poids k, alors f [τ ]k(z + hx) = −f [τ ]k(z).On décompose n∞ = nreg

∞ + nirr∞ (et on a nreg

∞ = n∞ et nirr∞ = 0 si k est pair).

Théorème. Pour k > 2 on a les formules de dimension suivantes, où l'on suppose−1 /∈ Γ lorsque k est impair.

dimC(Mk(Γ)) = (k − 1)(g − 1) + bk4cn2 + bk

3cn3 + k

2nreg∞ + bk

2cnirr∞

dimC(Sk(Γ)) = dimC(Mk(Γ))− nreg∞

Remarque. i) Dans le cas impair (et donc −1 /∈ Γ), on a n2 = 0. Exercice !ii) En utilisant la formule donnant le genre, on peut aussi écrire

dimC(Mk(Γ)) =kd

12− g + 1 +

(k

4−⌊k

4

⌋)n2 +

(k

3−⌊k

3

⌋)n3 +

(k

2−⌊k

2

⌋)nirr∞ .

Ainsi, si k est divisible par 12, alors dimC(Mk(Γ)) = kd12− g + 1.

Démonstration. Dans le cas pair k = 2k′, on procède comme on l'a fait en poids k = 2. Onxe une k′-forme diérentielle méromorphe ω0 sur X(Γ) (par exemple de la forme ω0 = ωk

′1

avec ω1 une 1-forme), on note f la fonction modulaire de poids k associée et on déduit desformules

ordP (π∗(g)f) = eP .ordπ(P )(g) + eP .ordπ(P )(ω0) + k′(eP − 1) si P ∈ Hordx,hx(π

∗(g)f) = ordπ(x)(g) + ordπ(x)(ω0) + k′ si x est une pointe

que l'application g 7→ π∗(g)f induit des isomorphismes

L(div(ω0) + k′Dπ)∼−→Mk(Γ)

et

L

(div(ω0) + k′Dπ −

∑P 7→∞

[P ]

)∼−→ Sk(Γ)

où Dπ =∑

P∈X(Γ)(1− 1/eP )[P ]. On en déduit que dimC(Mk(Γ)) = `(k′K + bk′Dπc) avec

bk′Dπc =∑P 7→i

bk4c[P ] +

∑P 7→j

bk3c[P ] +

∑P 7→∞

k

2[P ].

On utilise alors la formule de Riemann-Roch pour calculer dimMk(Γ), aidés par le faitque deg(k′K+ bk′Dπc) > 2g− 2. Pour calculer la dimension de Sk(Γ) il sut de remplacerdiv(ω0) par div(ω0)−

∑P 7→∞[P ]. Dans ce cas on a bien deg > 2g − 2 dès que k > 2.

22

Page 23: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Dans le cas impair, pour suivre un raisonnement similaire, il nous faut connaitre l'exis-tence d'une fonction modulaire de poids k. Admettons momentanément l'existence d'unetelle fonction f (à condition que −1 /∈ Γ). Alors f 2 est de poids 2k et correspond à unek-forme diérentielle méromorphe ω0 sur X(Γ). Vu les formules

ordP (π∗(g)2f 2) = 2eP .ordπ(P )(g) + eP .ordπ(P )(ω0) + k(eP − 1) si P ∈ Hordx,hx(π

∗(g)2f 2) = 2ordπ(x)(g) + ordπ(x)(ω0) + k si x est une pointe

on constate que l'application g 7→ π∗(g)f induit des isomorphismes

L

(1

2div (ω0) +

k

2Dπ

)∼−→Mk(Γ)

et

L

(1

2div (ω0) +

k

2Dπ −

1

2

∑P 7→∞

[P ]

)∼−→ Sk(Γ).

PourMk, il faut alors calculer la partie entière du diviseur

1

2div (ω0) +

k

2Dπ =

∑P∈X(Γ)

(1

2ordP (ω0) +

k

2(1− 1/eP )

)[P ].

Pour un point P de Y (Γ) et un point P ∈ H tel que P = π(P ), on remarque que l'égalité

2ordP (f) = e.ordP (ω0) + k(e− 1)

implique que ordP (ω0) est pair si e = 1 ou 3. Comme n2 = 0, ce nombre est donc pair pourtout P ∈ Y (Γ), et il s'ensuit que⌊

1

2ordP (ω0) +

k

2(1− 1/eP )

⌋=

1

2ordP (ω0) +

⌊k

2(1− 1/eP )

⌋Pour une pointe P ∈ X(Γ) et x ∈ P1(Q) tel que π(x) = P , l'égalité

ordx,2hx(f) = ordx,hx(f2) = ordP (ω0) + k

montre que : si x = τ∞ est régulière, alors f [τ ]k est hx-périodique donc ordx,2hx(f) = 2ordx,hx(f)

et par conséquent ordP (ω0) est impair, et⌊1

2ordP (ω0) +

k

2(1− 1/eP )

⌋=

1

2ordP (ω0) +

k

2.

si x = τ∞ est irrégulière, alors f [τ ]k est 2hx-périodique et vérie f [τ ]k(z + hx) =−f [τ ]k(z). Donc dans le développement f [τ ]k(z) =

∑n∈Z anq

n avec q = exp(2iπz/2hx),on a an = 0 si n est pair, de sorte que ordx,2hx(f) est impair, et nalement⌊

1

2ordP (ω0) +

k

2(1− 1/eP )

⌋=

1

2ordP (ω0) +

k − 1

2.

23

Page 24: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

On obtient donc⌊1

2div (ω0) +

k

2Dπ

⌋=

1

2div (ω0) +

∑P 7→j

⌊k

3

⌋[P ] +

∑P 7→∞,reg

k

2[P ] +

∑P 7→∞,irr

k − 1

2[P ].

Pour k > 3, son degré est supérieur à 1/2 deg(div(ω0)) = k/2(2g − 2) > 2g − 2, donc laformule de Riemann-Roch simpliée s'applique et on obtient la dimension annoncée pourMk(Γ).

Pour calculer la dimension de Sk(Γ), il faut calculer la partie entière du diviseur12div (ω0) + k

2Dπ − 1

2

∑P 7→∞[P ]. Seule la discussion aux pointes est aectée, et les détails

sont laissés en exercice.

Remarque. (Que se passe-t-il pour k = 1 ?) La preuve précédente dit que (sous réservede l'existence d'une fonction modulaire de poids 1), en notant ω0 une forme diérentielleméromorphe sur X(Γ))

dimC(M1(Γ)) = `

(1

2

(div(ω0) +

∑P 7→∞,reg

[P ]

)).

Le diviseur qui apparait est bien entier malgré les apparences, et son degré est g−1+nreg∞ /2.

Lorsque nreg∞ > 2g − 2, on peut conclure que dimC(M1(Γ)) = nreg

∞ /2. Sinon, la formule deRiemann-Roch ne permet pas de conclure, mais fournit la minoration dimC(M1(Γ)) >nreg∞ /2. Dans tous les cas dimC(S1(Γ)) = dimC(M1(Γ))− nreg

∞ /2.

Remarque. (Existence de fonctions modulaires de poids 1) Dans le cas k impair dela preuve précédente on a supposé l'existence de fonctions modulaires de poids k lorsque−1 /∈ Γ. Il sut bien-sûr de la prouver en poids 1. Voici un argument qui utilise le fait,que nous verrons plus tard, que pour une surface de Riemann compacte, le groupe Pic0(X)des diviseurs modulo les diviseurs principaux de degré 0 est un groupe divisible.

Ainsi, si P est un point de X(Γ), l'élement K − (2g − 2)[P ] de Pic0(X) est divisiblepar 2. Il s'ensuit que, si ω0 est une forme diérentielle méromorphe sur X(Γ), il en existeune autre, ω, telle que div(ω) = 2(div(ω0)− (2g − 2)[P ]). Soit f2 la fonction modulaire depoids 2 et niveau Γ telle que f2(z)dz = π∗(ω). Alors ordz(f2) est pair en tout point de Hqui est simplement connexe, donc il existe une fonction f : H −→ C, méromorphe sur H,telle que f 2 = f2. Cette fonction n'est pas nécessairement automorphe de poids 1, mais ilexiste au moins un caractère χ : Γ −→ ±1 tel que pour tout γ ∈ Γ on a f [γ]1 = χ(γ)f .En particulier, f est automorphe de niveau Γ′ := Ker(χ), qui est un sous-groupe d'indice2 de Γ, et par ailleurs, elle est aussi méromorphe aux pointes.

Si Γ′ = Γ, on a gagné. Sinon, il sut de trouver une fonction f0 méromorphe sur H etaux pointes vériant ∀γ ∈ Γ, f0(γz) = χ(γ)f0(z). Car alors la fonction f0f sera modulairede poids 1 pour Γ. Pour cela, on remarque que X(Γ′) est de degré 2 au-dessus de X(Γ)(ici on utilise −1 /∈ Γ, qui assure que l'image de Γ′ dans PSL2(R) est d'indice 2 danscelle de Γ). Donc il existe une fonction g ∈ MX(Γ′) \ MX(Γ). La fonction π∗g est doncmodulaire de poids 0 pour Γ′, mais pas pour Γ. Il s'ensuit que si γ ∈ Γ \ Γ′, la fonctionf0(z) := π∗g(z)− π∗g(γz) vérie ce que l'on veut.

24

Page 25: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Exemple. (Le cas de Γ(N), N > 1) On a vu en TD que dans ce cas, n2 = n3 = 0tandis que n∞ = dN/N où dN désigne le degré de X(N) −→ X(1), donné par

dN = [Γ(1) : Γ(N)±1] =

12N3∏

p|N(1− p−2) si N 6= 2

6 si N = 2

Ainsi, le genre vaut g = 1+dN/12−dN/2N . Par ailleurs, lorsque−1 /∈ Γ(N) (ie lorsqueN >2) toutes les pointes sont visiblement régulières, puisqu'une matrice

[ −1 n0 −1

]n'appartient

pas à Γ(N). Les formules de dimension deviennent donc, pour N > 2,

dimC(Mk(Γ(N)) =k − 1

12dN +

dN2N

et dimC(Sk(Γ(N)) =k − 1

12dN −

dN2N

1.2.7 Séries de Poincaré. Nous présentons ici une méthode générale pour fabriquer desformes modulaires de niveau Γ. Une idée naïve serait de partir d'une fonction quelconquef et de fabriquer la série ϕ(z) =

∑γ∈Γ f(γz)/jγ(z)k. La formule jγγ′(z) = jγ(γ

′z)jγ′(z)montre qu'une telle fonction serait bien automorphe de poids k pour Γ. Le problème estqu'une telle série ne peut pas converger car, par exemple, jγ(z) = 1 pour une innité de γ.Justement, pour contourner le problème, notons

Γ+∞ := γ ∈ Γ, jγ = 1 = Γ ∩ [ 1 n

0 1 ], n ∈ Z = Γ ∩ [ 1 10 1 ]Z,

un sous-groupe d'indice 1 ou 2 dans Γ∞, et partons d'une fonction f qui est déjà invariantepar Γ+

∞. Alors la fonction ϕ(z) =∑

γ∈Γ+∞\Γ f(γz)/jγ(z)k a plus de chance de converger

(absolument), et dans ce cas serait encore automorphe de poids k. Dans cette somme, γdécrit un ensemble de représentants des classes à gauche selon Γ+

∞ dans Γ.Soit h tel que Γ+

∞ = [ 1 h0 1 ]

Z (remarquons que h = h∞ si ∞ est une pointe régulière deΓ, et h = 2h∞ sinon). Des exemples typiques de fonctions f invariantes sous Γ+

∞ sont lesf(z) = exp(2iπnz/h), n ∈ Z.

Proposition. La série de Poincaré de poids k > 3 et caractère n ∈ N

ϕn(z) :=∑

γ∈Γ+∞\Γ

jγ(z)−kexp(2iπnγz/h)

dénit une forme modulaire ϕn ∈Mk(Γ). De plus :

i) Si n > 0, ϕn ∈ Sk(Γ).

ii) Pour n = 0, ϕ0 s'annule à toutes les pointes x 6=∞ et on a

ϕ0(∞) =

[Γ+∞\Γ∞] si k est pair ou Γ+

∞ = Γ∞0 sinon

.

Démonstration. Pour trouver un ensemble agréable de représentants de Γ+∞\Γ, partons de

l'égalité [ 1 m0 1 ][ a bc d ] =

[a+mc b+mdc d

]. Elle nous dit que γ′ ∈ Γ+

∞γ ⇒ (a′, b′) ≡ (a, b)(mod h).

25

Page 26: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Réciproquement, si γ′ vérie (a′, b′) ≡ (a, b)(mod h) et (c′, d′) = (c, d), alors la conditionde déterminant det γ = det γ′ = 1 implique a − a′ = cm et b − b′ = dm avec h|m, doncimplique γ′ ∈ Γ+

∞\Γ. Finalement, on voit qu'on obtient un ensemble de représentants deΓ+∞\Γ en choisissant, pour tout (c, d) ∈ Z2 un élément γc,d ∈ Γ dont la deuxième ligne est

(c d) (lorsque c'est possible !).Il s'ensuit que

∑Γ+∞\Γ |jγ(z)−kexp(2iπnγz/h)| 6

∑(c,d)6=(0,0)

1|cz+d|k dont on a vu qu'elle

converge uniformément sur un domaine fondamental dès que k > 3. On en déduit laconvergence normale sur les domaines fondamentaux (et donc sur les compacts) de la sériede Poincaré et donc son holomorphie sur H.

Pour α ∈ SL2(Z), la formule

ϕn(αz) =∑

γ∈Γ+∞\Γ

jγ(αz)−kqnγαzh = jα(z)k∑

γ∈Γ+∞\Γ

jγα(z)−kqnγαzh = jα(z)k∑

γ∈Γ+∞\Γα

jγ(z)−kqnγzh .

montre, lorsqu'on prend α ∈ Γ que ϕn est bien automorphe de poids k et niveau Γ.Puisque jγ(z)−k → 0 lorsque =(z) → ∞ et γ /∈ Γ(1)∞, la convergence normale sur un

domaine fondamental nous donne aussi pour α ∈ Γ(1)

lim=(z)→∞

ϕn[α]k(z) =∑

γ∈Γ+∞\(Γα∩Γ(1)∞)

lim=(z)→∞

(jγ(z)−k.exp(2iπnγz/h)).

La somme qui apparait ici est nie et on en déduit que ϕn[α]k est holomorphe en∞ ce quiéquivaut à dire que ϕn est holomorphe en la pointe x = α∞. Distinguons deux cas.

Si la pointe x n'est pas Γ-équivalente à∞, c'est-à-dire si∞ /∈ Γx, alors Γα∩Γ(1)∞ = ∅donc la somme ci-dessus est trivialement nulle pour tout n > 0.

En la pointe∞, on peut prendre α = 1 et on s'aperçoit que la limite ci-dessus est nullesi n > 0 tandis qu'on obtient la formule de l'énoncé pour ϕ0(∞), puisqu'ici jγ(z) = −1 siγ ∈ Γ∞ \ Γ+

∞ et jγ = 1 pour γ ∈ Γ+∞.

Remarque. (Lien avec les séries d'Eisenstein) Supposons Γ = Γ(1) (et donc k pair) etn = 0. Comme dans la preuve précédente, on peut prendre des représentants de Γ(1)+

∞\Γ(1)de la forme [ a bc d ] où (c, d) décrit l'ensemble des lignes possibles pour une matrice dans Γ(1),c'est-à-dire tous les (c, d) dont le pgcd vaut 1. On a donc

ϕ0(z) =∑

γ∈Γ(1)+∞\Γ(1)

jγ(z)−k =∑

pgcd(c,d)=1

1

(cz + d)k.

La ressemblance avec Gk n'est pas parfaite, mais on peut réarranger Gk comme ceci

Gk(z) =∑

(c,d) 6=(0,0)

1

(cz + d)k=∞∑n=1

∑pgcd(c,d)=1

1

(cnz + dn)k=∞∑n=1

1

nk

∑pgcd(c,d)=1

1

(cz + d)k

pour obtenir que Gk(z) = ζ(k)ϕ0(z) et nalement ϕ0(z) = 2Ek(z).

26

Page 27: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Application. (La partie Eisenstein deMk(Γ)) Supposons Γ distingué dans Γ(1) avecpointes régulières. On pense par exemple à Γ = Γ(N) si N > 2. Pour tout α ∈ Γ(1),la fonction ϕ0[α]k est dans Mk(α

−1Γα) = Mk(Γ) et s'annule à toutes les pointes saufx := α−1∞. Si α′ est un autre élément de Γ(1) tel que x = α′−1∞, alors il existe σ ∈ Γ(1)∞tel que α′ = σα et on calcule, grâce à jσγ(z) = jσ(γz)jγ(z) = jσ.jγ(z) où jσ = ±1 (selonque σ ∈ ±[ 1 1

0 1 ]Z),

ϕ0[α′]k(z) =∑

γ∈Γ+∞\Γα′

jγ(z)−k =∑

γ∈Γ+∞\σΓα

jγ(z)−k = j−kσ ϕ0[α]k(z)

ce qui montre que ϕ0[α]k ne dépend que de la classe de α dans Γ\Γ(1)/Γ(1)+∞ lorsque k est

impair, et que de la classe de α dans Γ\Γ(1)/Γ(1)∞, c'est-à-dire de la pointe x, lorsque kest pair. Si on impose en plus à α = [ a bc d ] la condition d > 0, alors ϕ0[α]k ne dépend quede la pointe x pour tout k, et on peut lui associer la série d'Eisenstein

Exk := [Γ∞ : Γ+

∞]−1.ϕ0[α]k

Puisque Exk ne s'annule pas en x et s'annule aux autres pointes, la famille (Ex

k )x∈Γ\P1(Q) estlibre dansMk(Γ). Comme on sait par ailleurs que dim(Mk(Γ))− dim(Sk(Γ)) = n∞ (pourk > 3), on voit que cette famille engendre un sous-espace supplémentaire de Sk(Γ), commedans le cas Γ = Γ(1). On appelle ce sous-espace la partie Eisenstein deMk(Γ).

Exemple. (Séries d'Eisenstein pour Γ(N).) Lorsque Γ = Γ(N), N > 2, deux pointesx = r/t et x′ = r′/t′ (où pgcd= 1 et t, t′ > 0) sont équivalentes si et seulement si (r, t) ≡±(r′, t′)[N ] (exercice). On calcule alors que

Exk (z) =

∑pgcd(c,d)=1

(c,d)≡(t,−r)[N ]

1

(cz + d)k,

de sorte que la somme∑

xExk est la série d'Eisenstein Ek pour Γ(1). Cela suggère d'indexer

les séries d'Eisenstein par un vecteur ligne v ∈ Z/NZ × Z/NZ d'ordre N . On peut alorsposer

Evk(z) =

∑pgcd(c,d)=1(c,d)≡v[N ]

1

(cz + d)k, et Gv

k(z) :=∑

(c,d)≡v[N ]

1

(cz + d)k,

et un calcul similaire au cas Γ(1) montre la formule

Gvk(z) =

∑n∈Z/NZ×

ζn,N(k)Envk (z) avec ζn,N(k) =

∞∑m=1

m≡n[N ]

1

mk.

1.2.8 Produit scalaire de Petersson. On rappelle que H possède une mesure invariantesous SL2(R), dite mesure de Poincaré, et donnée par dµ(z) = 1

y2dx.dy = i2=(z)2dz.dz.

27

Page 28: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Si f : H −→ C est une fonction continue et bornée, alors pour tout α ∈ SL2(Z),l'intégrale

∫Df(αz)dµ(z) de f sur le domaine fondamental D = z, |<(z)| 6 1/2, |z| > 1

converge absolument.Soit maintenant Γ un sous-groupe de congruences de SL2(Z) et supposons f invariante

par Γ (et toujours bornée). Si on écrit Γ(1) =⊔ri=1 Γαi, alors la somme∫

X(Γ)

f.dµ :=r∑i=1

∫D

f(αiz)dµ(z)

est indépendante du choix des représentants αi. En d'autres termes, si DΓ est un domainefondamental de Γ dans H, alors

∫DΓf(z)dµ(z) existe et∫

X(Γ)

f.dµ =

∫DΓ

f(z)dµ(z).

Cela s'applique à la fonction constante 1 et on note VΓ :=∫X(Γ)

dµ le volume de X(Γ). SiΓ′ ⊂ Γ est d'indice ni, on a VΓ′ = [Γ±1 : Γ′±1]VΓ (exercice). On a donc en généralVΓ = dΓVΓ(1) et on peut calculer 6 VΓ(1) = π/3.

Soit maintenant f, g ∈ Mk(Γ). La relation =(γz) = =(z)|jγ(z)|−2 montre que la fonc-tion h(z) := =(z)kf(z)g(z) est invariante par Γ.

Lemme. Si de plus, l'une des deux formes f ou g est parabolique, alors cette fonctionh est bornée sur H.

Démonstration. En eet, il sut de voir que pour α ∈ Γ\Γ(1), la fonction h(αz) estbornée au voisinage de ∞. Si h est la largeur (ie l'ordre) de la pointe α∞, on a undéveloppement h(z) = =(z)k

∑∞n=0 anq

nh où qh = exp(2iπz/h). Or, si l'une des deux formes

est parabolique, alors a0 = 0, et h(x + iy) = O(ykexp(−cy)). Comme h(αz) est aussihorizontalement périodique, elle est donc bornée au voisinage de ∞.

Définition. Pour f ∈ Sk(Γ), g ∈Mk(Γ), on appelle

〈f, g〉Γ :=1

∫X(Γ)

=(z)kf(z)g(z)dµ(z)

le produit scalaire de Petersson de f et g.

La restriction à Sk(Γ)×Sk(Γ) est un produit hermitien déni positif. La normalisationpar le volume permet d'avoir 〈f, g〉Γ′ = 〈f, g〉Γ pour Γ′ ⊂ Γ.

Théorème. Soit f ∈ Sk(Γ) de développement f(z) =∑∞

n=1 anqnh avec qh = exp(2iπz/h)

et h la largeur de la pointe ∞. Alors pour toute série de Poincaré ϕn on a

〈f, ϕn〉Γ =

0 si n = 0hk(k−2)!(4πn)k−1an pour n > 1

6. Plus généralement, on peut montrer que l'aire d'un triangle géodésique dans H∪P1(R) vaut π moinsla somme des angles

28

Page 29: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

La conséquence la plus intéressante de ce théorème est que toutes les formes parabo-liques sont combinaisons linéaires de séries de Poincaré. En eet, toute forme paraboliqueorthogonale aux ϕn, n > 0 est nulle. En joignant les séries d'Eisenstein, on obtient :

Corollaire. Sk(Γ) est engendré par les ϕn, n > 0. De plus, pour Γ distingué, lapartie Eisenstein Ek(Γ) est orthogonale à Sk(Γ) et on aMk(Γ) = Sk(Γ)⊕ Ek(Γ).

Démonstration (du théorème). Vu l'absolue convergence de la série dénissant ϕn on peutécrire (en notant DΓ un domaine fondamental pour Γ)

〈f, ϕn〉Γ =∑

γ∈Γ+∞\Γ

1

∫DΓ

=(z)kf(z)jγ(z)−k

exp(−2iπnγz/h)dµ(z)

=∑

γ∈Γ+∞\Γ

1

∫DΓ

=(γz)kjγ(z)kf(z)exp(−2iπnγz/h)dµ(z)

=∑

γ∈Γ+∞\Γ

1

∫DΓ

=(γz)kjγ−1(γz)−kf(γ−1γz)exp(−2iπnγz/h)dµ(z)

=∑

γ∈Γ+∞\Γ

1

∫DΓ

=(γz)kf(γz)exp(−2iπnγz/h)dµ(z)

=∑

γ∈Γ+∞\Γ

1

∫γDΓ

=(z)kf(z)exp(−2iπnz/h)dµ(z)

Pour la deuxième ligne on utilise =(z) = =(γz)|jγ(z)|2, pour la troisième ligne on utilise 1 =jγ−1γ(z) = jγ−1(γz)jγ(z) et pour la quatrième on utilise l'automorphie de f . Maintenant,on remarque que

⊔γ∈Γ+

∞\Γ γDΓ est un domaine fondamental pour Γ+∞, qui dépend du choix

de représentants des Γ+∞-classes à gauche. On peut choisir ces représentants de sorte que

cette réunion soit (un ouvert dense du) le domaine fondamental agréable Dh = z, 0 6<(z) 6 h. On peut donc écrire

〈f, ϕn〉Γ =1

∫ ∞y=0

∫ h

x=0

yk−2f(x+ iy)exp(−2iπnx/h)exp(−2πny/h)dxdy

Insérons le développement f(x+ iy) =∑

m>0 amexp(2iπmx/h)exp(−2πmy/h) et interver-tissons intégrales et sommes. On obtient

〈f, ϕn〉Γ =h

an

∫ ∞0

yk−2exp(−4πny/h)dy

et des intégrations par parties montrent la formule annoncée.

1.3 Opérateurs de Hecke

1.3.1 Formalisme général. Deux sous-groupes Γ1,Γ2 d'un groupe G sont dits commen-surables si Γ1∩Γ2 est d'indice ni dans Γ1 et Γ2. On obtient ainsi une relation d'équivalence

29

Page 30: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

sur les sous-groupes de G (exercice : prouver la transitivité). Un sous-groupe Γ sera appelésous-groupe de Hecke de G si pour tout α ∈ G, Γ et αΓα−1 sont commensurables. Dans cecas tout sous-groupe Γ′ commensurable avec Γ est un sous-groupe de Hecke.

Exemple. Dans G = GL2(Q), les sous-groupes d'indice ni de SL2(Z) sont des sous-groupes de Hecke. Pour le voir, il sut de montrer que si α ∈ GL2(Q), alors αΓ(1)α−1∩Γ(1)est d'indice ni dans Γ(1). Quitte à multiplier α par un scalaire, on peut supposer queα ∈ M2(Z). Soit alors N son déterminant. On a Nα−1 ∈ M2(Z) (c'est la transposée dela comatrice de α) donc α−1(NM2(Z))α ⊂ M2(Z), donc α−1Γ(N)α ⊂ M2(Z). Commeα−1Γ(N)α est un groupe, on a α−1Γ(N)α ⊂ GL2(Z), et comme det(α−1γα) = det(γ), ona α−1Γ(N)α ⊂ SL2(Z), et nalement Γ(N) ⊂ αΓ(1)α−1 ∩ Γ(1).

Soit Γ1,Γ2 deux sous-groupes de Hecke commensurables de G. Alors les orbites de Γ2

agissant à droite sur Γ1\G sont nies. En eet, on a une bijection

(α−1Γ1α ∩ Γ2)\Γ2∼−→ Γ1\(Γ1αΓ2)

donnée par (α−1Γ1α ∩ Γ2)γ 7→ Γ1αγ. Cela permet d'identier 7 Z[Γ1\G/Γ2] aux invariantsZ[Γ1\G]Γ2 . Considérons alors l'application

HomZ[G](Z[Γ2\G],Z[Γ1\G]) → Z[Γ1\G/Γ2]ϕ 7→ ϕ([Γ2.1])

.

Le Hom désigne les homomorphismes de Z[G]-modules (à droite). Comme Z[Γ2\G] estengendré, en tant que Z[G]-module, par [Γ2.1], un tel homomorphisme est entièrementdéterminé par sa valeur ϕ([Γ2.1]), laquelle doit être un élément Γ2-invariant de Z[Γ1\G],que l'on peut donc identier à un élément de Z[Γ1\G/Γ2]. Réciproquement, la donnée d'untel élément détermine un ϕ, i.e. l'application ci-dessus est donc bijective. Explicitement,l'action de [Γ1αΓ2] est donnée par

[Γ1αΓ2] : Z[Γ2\G] → Z[Γ1\G][Γ2g] 7→

∑Γ1γ∈Γ1\(Γ1αΓ2)

[Γ1γg] .

La notation en indice signie concrètement que l'on peut sommer sur γ décrivant n'importequel ensemble L(Γ1αΓ2) de représentants dans G de l'ensemble quotient Γ1\(Γ1αΓ2), lerésultat étant clairement indépendant du choix de ces représentants.

Si Γ3 est un troisième sous-groupe commensurable à Γ1 (et donc à Γ2), la compositiondes homomorphismes nous fournit une application produit

Z[Γ1\G/Γ2]⊗ Z[Γ2\G/Γ3] −→ Z[Γ1\G/Γ3]

qui est explicitement donnée, sur les bases canoniques, par la formule

[Γ1αΓ2].[Γ2βΓ3] =∑δ

cδ.[Γ1δΓ3]

7. Pour un ensemble X, Z[X] désigne le Z-module libre de base [x], x ∈ X

30

Page 31: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

où cδ ∈ N est le cardinal de l'ensemble suivant

(Γ1γ, γ′) ∈ Γ1\(Γ1αΓ2)× L(Γ2βΓ3), Γ1γγ

′ = Γ1δ .

Dans cet ensemble, on a noté L(Γ2βΓ3) un ensemble de représentants, dansG, de Γ2\(Γ2βΓ3).L'ensemble décrit dépend du choix de ces représentants, mais le cardinal n'en dépend pas,puisque c'est le coecient de [Γ1δΓ3] dans l'expression du produit décrit ci-dessus. [Exer-cice : vérier directement que le cardinal ne dépend pas du choix de représentants].

Remarque. cδ 6= 0 si et seulement si Γ1δΓ3 ⊂ Γ1αΓ2βΓ3.

Lorsqu'on fait Γ1 = Γ2 = Γ3 =: Γ, on a ainsi obtenu une structure d'anneau surZ[Γ\G/Γ] appelé anneau de Hecke de (G,Γ), ainsi qu'un isomorphisme d'anneaux

EndZ[G](Z[Γ\G])∼−→ Z[Γ\G/Γ].

Si ∆ ⊂ G est un sous-ensemble stable par multiplication et contenant Γ, on note Z[Γ\∆/Γ]le sous-module de Z[Γ\G/Γ] engendré par les [ΓδΓ], δ ∈ ∆. Vu la formule donnant leproduit, c'est un sous-anneau de Z[Γ\G/Γ].

Maintenant, donnons-nous un C-espace vectoriel V (ou un Z-module) muni d'une actionlinéaire à droite de G, que l'on note (v, g) 7→ v.g. Pour la même raison que plus haut,l'application suivante

HomZ[G](Z[Γ\G], V ) → V Γ

ϕ 7→ ϕ([Γ.1])

est un isomorphisme de C-espaces vectoriels. On en déduit, par composition avec [Γ1αΓ2],une application linéaire V Γ1 −→ V Γ2 qui est explicitement donnée par

∀v ∈ V Γ1 , v.[Γ1αΓ2] =∑

Γ1γ∈Γ1\(Γ1αΓ2)

vγ.

[Exercice : vérier directement que le membre de droite est bien invariant par Γ2.] Pardénition, ces applications sont compatibles au produit, et en particulier, lorsque Γ2 =Γ1 = Γ, on obtient une structure de Z[Γ\G/Γ]-module à droite sur V Γ.

Exemple. Prenons V l'espace des fonctions H −→ C sur lequel G = GL2(Q)+ agit parl'action de poids k > 0 donnée par f [γ]k(z) := det(γ)k/2jγ(z)−kf(γz) L'espace V Γ contientles sous-espacesMk(Γ) et Sk(Γ). La formule f.[Γ1αΓ2]k =

∑γ∈L(Γ1αΓ2) f [γ]k montre (exer-

cice) que [Γ1αΓ2]k respecte l'holomorphie sur H et aux pointes, et donc envoie Mk(Γ1)dansMk(Γ2) et Sk(Γ1) dans Sk(Γ2). En particulier, on a une action à droite de Z[Γ\G/Γ]surMk(Γ) et Sk(Γ).

1.3.2 L'anneau de Hecke en niveau Γ(1). Soit ∆ = ∆(1) = M2(Z)∩GL2(Q)+. Il est clairque ∆ est stable par produit et contient Γ(1). Nous allons décrire l'anneau Z[Γ(1)\∆/Γ(1)].

Le conoyau Coker(α) = Z2/α(Z2) de α ∈ ∆ est de la forme Z/lZ⊕Z/mZ avec l,m > 1uniquement déterminés si on demande l|m (théorème des diviseurs élémentaires).

31

Page 32: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Lemme. Notons ∆l,m l'ensemble des matrices α ∈ ∆ de diviseurs élémentaires (l,m).

i) ∆l,m = Γ(1)[ l 00 m ]Γ(1)

ii) l'ensemble L(Γ(1)[ l 00 m ]Γ(1)) := [ a b0 d ], ad = lm, 0 6 b < d et (a, b, d) = l est un

ensemble de représentants des Γ(1)-classes à gauche dans ∆l,m

Démonstration. i) Supposons α = γ1[ l 00 m ]γ2 avec γ1, γ2 ∈ Γ(1). Alors α(Z2) = γ1(lZ⊕mZ).

Donc l'automorphisme γ1 de Z2 induit un isomorphisme Z2/(lZ ⊕mZ)∼−→ Coker(α) qui

montre que Coker(α) a pour diviseurs élémentaires (l,m).Réciproquement, supposons que α a pour diviseurs élémentaires (l,m). Il existe alors

une base (ω1, ω2) de Z2 telle que (lω1,mω2) soit une base de α(Z2). Soit γ1 la matrice depassage de la base canonique (e1, e2) de Z2 à (ω1, ω2), et soit γ2 la matrice de passage dela base (lω1,mω2) de α(Z2) à la base (α(e1), α(e2) de α(Z)2. Alors on a α = γ1[ l 0

0 m ]γ2.A priori on a seulement γ1, γ2 ∈ GL2(Z), mais quitte à changer γ1 par γ1[ 1 0

0 −1 ] et γ2 par[ 1 0

0 −1 ]γ2, on voit que α ∈ Γ(1)[ l 00 m ]Γ(1).

ii) On utilise la remarque suivante :

si β, β′ ∈ ∆, alors βΓ(1) = β′Γ(1)⇔ β(Z2) = β′(Z2).

En eet, le sens ⇒ est clair et l'autre sens se voit en remarquant que β′ = βγ si γ désignela matrice de passage de (β(e1), β(e2)) à (β′(e1), β′(e2)). Malheureusement, nous voulonsdes classes à gauche, pas à droite. Nous allons donc raisonner sur les transposées.

Soit α ∈ ∆l,m. D'après la remarque ci-dessus, on a [ a b0 d ] ∈ Γ(1)α si et seulement si leréseau Λ := tα(Z2) est engendré par (ae1 + be2, de2). Si tel est le cas, d est visiblement leplus petit entier k tel que ke2 ∈ Λ, puis a est déterminé par ad = lm, ce qui détermineaussi b modulo d. On en déduit l'unicité d'une éventuelle matrice [ a b0 d ] ∈ Γ(1)α vériant0 6 b < d. Pour prouver l'existence, considérons la suite exacte

0 −→ (Λ + Ze2)/Λ −→ Z2/Λ −→ Z2/(Λ + Ze2) −→ 0.

Le terme de gauche est cyclique (engendré par l'image de e2). Notons d son ordre, on ade2 ∈ Λ. Le terme de droite est aussi cyclique (engendré par l'image de e1). Notons a sonordre. On a alors ad = |Z2/Λ| = | det(tα)| = lm et (ae1 + Ze2)∩Λ 6= ∅. Pour tout ω1 danscet ensemble, (ω1, de2) est une base de Λ, et puisque de2 ∈ Λ, on peut choisir ω1 = ae1 +be2

avec 0 6 b < d. On a donc trouvé (a, b, d) mais il reste à prouver que (a, b, d) = l. Pour celanotons que la transposée tα est aussi dans ∆l,m, et donc que Z2/Λ ' Z/lZ ⊕ Z/mZ. Enparticulier, le noyau de la multiplication par l dans Z2/Λ est isomorphe à (Z/lZ)2, ce quiéquivaut à lZ2 ⊇ Λ et implique l|(a, b, d). Réciproquement, si λ := (a, b, d), alors Λ ⊆ λZ2

et Z2/Λ contient (Z/λZ)2, ce qui implique λ|l.

Notons T (l,m) := [Γ(1)[ l 00 m ]Γ(1)]. D'après le lemme, les T (l,m), 1 6 l|m, forment une

base de Z[Γ(1)\∆/Γ(1)]. Voici la table de multiplication dans cette base.

Proposition. On a les égalités suivantes (où p désigne un nombre premier) :

i) T (l,m) = T (l, l)T (1,m/l) = T (1,m/l)T (l, l)

32

Page 33: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

ii) T (l,m)T (l′,m′) = T (ll′,mm′) si (lm, l′m′) = 1.

iii) T (1, p)T (1, pr) = T (1, pr+1) +

(p+ 1)T (p, p) si r = 1pT (p, p)T (1, pr−1) si r > 1

En particulier, l'anneau Z[Γ(1)\∆/Γ(1)] est l'anneau des polynômes en les T (1, p) et T (p, p)où p parcourt les nombres premiers.

Démonstration. i) De manière plus générale, si z est un élément central de G, alors laformule de produit dans l'anneau de Hecke montre que [ΓzΓ][ΓαΓ] = [ΓzαΓ] = [ΓαΓ][ΓzΓ].

ii) Grâce au i), on peut supposer que l = l′ = 1. La première chose à démontrerest l'égalité ensembliste Γ(1)[ 1 0

0 m ]Γ(1)[ 1 00 m′ ]Γ(1) = Γ(1)[ 1 0

0 mm′ ]Γ(1) (cf la remarque surle produit de doubles classes). Vu le lemme précédent, cela revient à montrer que pourtous α, α′ de diviseurs élémentaires respectifs (1,m) et (1,m′), le produit a pour diviseursélémentaires (1,mm′) Or on a une suite exacte

0 −→ αZ2/αα′Z2 −→ Z2/αα′Z2 −→ Z2/αZ2 −→ 0

qui montre que le conoyau Coker(αα′) est une extension abélienne de Z/mZ par Z/m′Z.Mais puisque (m,m′) = 1, une telle extension est isomorphe à Z/mZ⊕Z/m′Z = Z/mm′Z,donc les diviseurs élémentaires de αα′ sont bien (1,mm′).

Ceci implique que T (1,m)T (1,m′) = c.T (1,mm′) avec c le cardinal de l'ensemble

C := (α, α′) ∈ L(Γ(1)[ 1 00 m ]Γ(1))× L(Γ(1)[ 1 0

0 m′ ]Γ(1)), Γ(1)αα′ = Γ(1)[ 1 00 mm′ ].

Ici nous pouvons utiliser les systèmes de représentants donnés par le lemme précédent.Donc si (α, α′) ∈ C on a α = [ a b0 d ] avec ad = m, 0 6 b < d et (a, b, d) = 1 et de mêmeα′ =

[a′ b′

0 d′

]avec a′b′ = m′, 0 6 b′ < d′ et (a′, b′, d′) = 1. Alors αα′ =

[aa′ ab′+bd′

0 dd′

]. D'après

la preuve du lemme précédent, on a donc αα′ ∈ Γ(1)[ 1 00 mm′ ] si et seulement si aa′ = 1,

dd′ = mm′ et mm′|(ab′ + bd′). Ceci équivaut encore a = a′ = 1, d = m, d′ = m′ (puisque(m,m′) = 1) et donc mm′|(b′ + bm′) ⇔ b′ + bm′ = 0 ⇔ b = b′ = 0. On voit donc que(α, α′) = ([ 1 0

0 m ], [ 1 00 m′ ]) et par suite, que c = 1, comme voulu.

iii) Commençons par évaluer l'ensemble Γ(1)[

1 00 p

]Γ(1)

[1 00 pr]Γ(1). Pour cela, il faut com-

prendre les diviseurs élémentaires d'un produit αα′ lorsque α est de type (1, p) et α′ estde type (1, pr). Or, la suite exacte donnée ci-dessus nous dit que Coker(αα′) est une ex-tension de Z/pZ par Z/prZ. Il y a donc deux possibilités : soit Coker(αα′) ' Z/pr+1Z,soit Coker(αα′) ' Z/pZ⊕Z/prZ. Les diviseurs élémentaires de αα′ sont donc (1, pr+1) ou(p, pr) et on en déduit

Γ(1)[

1 00 p

]Γ(1)

[1 00 pr]Γ(1) = Γ(1)

[1 00 pr+1

]Γ(1)

⊔Γ(1)

[p 00 pr

]Γ(1).

La dénition du produit nous donne alors

T (1, p)T (1, pr) = cT (1, pr+1) + c′T (p, pr).

Commençons par évaluer c. Par dénition c'est le cardinal de l'ensemble

C := (α, α′) ∈ L(Γ(1)[

1 00 p

]Γ(1))× L(Γ(1)

[1 00 pr]Γ(1)),Γ(1)αα′ = Γ(1)

[1 00 pr+1

].

33

Page 34: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

L'ensemble de représentants fourni par le lemme précédent s'écrit ici

L(Γ(1)[

1 00 pr]Γ(1)) :=

[pr−s m

0 ps

], 0 6 s 6 r, m < ps, (m, ps, pr−s) = 1

On voit alors que C = (

[1 00 p

],[

1 00 pr]), et en particulier c = 1.

Pour évaluer c′ on pourrait aussi expliciter l'ensemble

C ′ := (α, α′) ∈ L(Γ(1)[

1 00 p

]Γ(1))× L(Γ(1)

[1 00 pr]Γ(1)),Γ(1)αα′ = Γ(1)

[p 00 pr

].

Mais il est plus élégant d'utiliser le degré d'une double classe. Par dénition, on pose

deg([ΓαΓ]) = |Γ\(ΓαΓ)| (cardinal),

et on l'étend par linéarité à l'anneau de Hecke. On vérie alors (exercice ci-dessous) quel'application deg : Z[Γ\G/Γ] −→ Z est un homomorphisme d'anneaux. Dans notre cas, ona deg(Γ(1)

[1 00 pr]Γ(1)) = pr + pr−1, et on obtient

(1 + p)(pr + pr−1) = c(pr+1 + pr) + c′ deg(Γ(1)[p 00 pr

]Γ(1)),

ce qui, compte tenu de c = 1 et de

deg(Γ(1)[p 00 pr

]Γ(1)) = deg(Γ(1)

[1 00 pr−1

]Γ(1) =

1 si r = 1pr−1 + pr−2 si r > 1

nous donne c′ = 1 + p lorsque r = 1 et c′ = p lorsque r > 1.Examinons maintenant la dernière assertion. D'après i) et ii), les T (1, p) et T (p′, p′) com-

mutent entre eux lorqu'on varie p et p′. D'après iii) et ii), ils engendrent Z[Γ(1)\∆/Γ(1)].Il reste alors à vérier l'indépendence algébrique de ces éléments. Pour cela, si 1 6 l|m,notons P (l,m) le monôme

∏p|l T (p, p)vp(l)

∏p|m/l T (1, p)vp(m/l). Alors ii) et iii) montrent

qu'en ordonnant l'ensemble des couples (l,m) selon n'importe quel ordre strict ranantl'ordre partiel induit par la divisibilité m|m′, la matrice donnant les P (l,m) en fonction desT (l,m) est triangulaire supérieure avec des 1 sur la diagonale. Puisque les T (l,m) formentune base de Z[Γ(1)\∆/Γ(1)), il s'ensuit que les P (l,m) forment aussi une base.

Exercice. Montrer que dans l'expression [ΓαΓ][ΓβΓ] =∑

δ cδ[ΓδΓ], on a

cδ = |(γ, γ′) ∈ L(ΓαΓ)× L(ΓβΓ), Γγγ′Γ = ΓδΓ|.|Γ\(ΓδΓ)|−1.

En déduire que l'application degré de la preuve précédente est bien un homomorphismed'anneaux. Montrer aussi que l'égalité [ΓαΓ][ΓβΓ] = [ΓαβΓ] est équivalente à ce queL(ΓαΓ).L(ΓβΓ) (produit dans ∆) soit un ensemble de représentants de Γ\(ΓαβΓ).

Corollaire. Pour n ∈ N, notons T (n) :=∑

lm=n T (l,m) (en particulier on aT (p) = T (1, p)). Alors on a les formules :

i) T (nm) = T (n)T (m) si (n,m) = 1,

ii) T (pr+1) = T (p)T (pr)− pT (p, p)T (pr−1),

et, de manière équivalente, la formule générale T (n)T (m) =∑

l|(m,n) lT (l, l)T (mn/l2).

Démonstration. Exercice.

34

Page 35: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

1.3.3 Action sur les formes modulaires de niveau 1. On a déjà remarqué que l'actionde Z[Γ(1)\∆/Γ(1)] sur les fonctions automorphes de poids k pour Γ(1) préserveMk(Γ(1))et Sk(Γ(1)). Rappelons que cette action est induite par l'action de poids k du groupeG = GL2(Q)+ donnée par f [γ]k(z) = det(γ)k/2jγ(z)−kf(γz). Néanmoins, pour obtenirdes formules rationnelles, et même entières, il est préférable de normaliser cette actiondiéremment en posant

f [γ]′k(z) = det(γ)k−1jγ(z)−kf(γz) = det(γ)k/2−1f [γ]k(z).

On a alors de même [Γ(1)αΓ(1)]′k = det(α)k/2−1[Γ(1)αΓ(1)]k. Voici des formules explicites.

Lemme. Pour n > 1 et f ∈Mk(Γ(1)), on a

f [T (n)]′k(z) = nk−1∑ad=n

d−1∑b=0

d−kf((az + b)/d).

Si f(z) =∑

m∈N a(m)qm est son q-développement en ∞ (avec q = exp(2iπz)), alors

f [T (n)]′k(z) =∑m∈N

∑d|(m,n)

dk−1a(mn/d2)

qm.

Démonstration. Par dénition, si L ⊂ ∆ est n'importe quel ensemble de représentants desΓ(1)-classes à gauche dans Γ(1)[ l 0

0 m ]Γ(1), on a

f [T (l,m)]′k(z) =∑γ∈L

det(γ)k−1jγ(z)−kf(γz).

En prenant l'ensemble

L = L(Γ(1)[ l 00 m ]Γ(1)) = [ a b0 d ], ad = lm, 0 6 b < d, (a, b, d) = l

fourni par le lemme précédent, on voit que f [T (l,m)]′k(z) est donné par une somme similaireà celle de l'énoncé, restreinte aux indices (a, b, d) tels que (a, b, d) = l. En sommant sur les(l,m) tels que lm = n, on obtient la première formule de l'énoncé.

La seconde découle de la première et des deux égalités

f((az + b)/d) =∑m∈N

a(m)e2iπmb/dqma/d, etd−1∑b=0

e2iπmb/d =

d si d|m0 sinon.

Nous allons maintenant montrer que les T (n) sont auto-adjoints pour le produit dePetersson. Nous aurons besoin du lemme suivant.

35

Page 36: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Lemme. Soit α ∈ ∆ et Γ d'indice ni dans Γ(1) ∩ α−1Γ(1)α. Alors pour f, g ∈Sk(αΓα−1), on a f [α]k, g[α]k ∈ Sk(Γ) et

〈f [α]k, g[α]k〉Γ = 〈f, g〉αΓα−1 .

Démonstration. Le fait que f [α]k, g[α]k ∈ Sk(Γ) est évident. Soit h(z) := =(z)kf(z)g(z).La formule =(αz) = det(α)|jα(z)|−2=(z) montre que h(αz) = =(z)kf [α]k(z)g[α]k(z). On adonc

〈f [α]k, g[α]k〉Γ =1

∫DΓ

h(αz)dµ(z) =1

∫αDΓ

h(z)dµ(z) = 〈f, g〉αΓα−1 .

Ici,DΓ est un domaine fondamental pour Γ dansH. La première égalité vient de la dénitiondu produit de Petersson, la seconde de l'invariance de dµ(z) sous GL2(R)+, et la troisièmedu fait que αDΓ est un domaine fondamental pour αΓα−1, de volume égal à celui deDΓ.

Proposition. Pour f, g ∈ Sk(Γ(1)) on a 〈f [T (n)]′k, g〉Γ(1) = 〈f, g[T (n)]′k〉Γ(1).

Démonstration. Il sut bien sûr de prouver la même formule pour [T (l,m)]k. Montronsd'abord qu'il existe un système de représentants commun aux Γ(1)-classes à gauche et àdroite dans ∆l,m. Partons d'un ensemble L de représentants des classes à gauche. Puisque∆l,m est stable par transposition, tL est un ensemble de représentants des classes à droite.Pour chaque α ∈ L il existe γα, δα ∈ Γ(1) tels que tα = γααδα. Posons alors α := γαα =tαδ−1

α . On a donc Γ(1)α = Γ(1)α et αΓ(1) = tαΓ(1). L'ensemble L = α, α ∈ L fait doncl'aaire.

Considérons maintenant l'anti-involution de ∆ donnée par α∗ := det(α)α−1. Puisqu'ellestabilise Γ(1) et envoie [ l 0

0 m ] sur [m 00 l ], elle stabilise aussi ∆l,m. Puisque L est un ensemble

de représentants des Γ(1)-classes à droite dans ∆l,m, L∗ est un ensemble de représentantsdes classes à gauche. Enn, pour tout α ∈ ∆ on a f [α−1]k = f [α∗]k.

Choisissons maintenant Γ distingué dans Γ(1) et contenu dans Γ(1)∩ [ l 00 m ]

−1Γ(1)[ l 0

0 m ].Ainsi Γ est contenu dans tous les αΓ(1)α−1 et α−1Γ(1)α pour α ∈ L. On a alors, d'aprèsle lemme précédent,

〈f [T (l,m)]k, g〉Γ(1) = 〈f [T (l,m)]k, g〉Γ=

∑α∈L

〈f [α]k, g〉Γ =∑α∈L

〈f [α]k, g〉Γ(1)∩α−1Γ(1)α

=∑α∈L

〈f, g[α−1]k〉αΓ(1)α−1∩Γ(1) =∑α∈L

〈f, g[α∗]k〉Γ

= 〈f, g[T (l,m)]k〉Γ = 〈f, g[T (l,m)]k〉Γ(1).

Corollaire. L'espace Sk(Γ(1)) admet une base orthogonale formée de formes quisont des vecteurs propres pour tous les T (n) (et même pour tous les T (l,m)). De plus, sif(z) =

∑n>0 a(n)qn est une forme propre et de valeurs propres (λ(n))n∈N∗, alors

∀n ∈ N∗, a(n) = a(1)λ(n).

36

Page 37: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

En particulier, si f est normalisée de sorte que a(1) = 1, on a les propriétés :a(nm) = a(n)a(m) si (n,m) = 1a(pr+1) = a(p)a(pr)− pk−1a(pr−1) pour p premier, r > 1.

Démonstration. L'existence d'une base orthogonale de formes propres découle de la diago-nalisabilité des T (l,m) (qui sont auto-adjoints), et de la commutativité de Z[Γ(1)\∆/Γ(1)]qui permet une diagonalisation simultanée.

Pour f ∈Mk(Γ(1)), on a vu que le terme en q dans le q-développement de f [T (n]′k](z)est a(n). Le terme en q de λ(n)f est a(1)λ(n) d'où l'égalité a(n) = a(1)λ(n).

Enn lorsque a(1) = 1, les formules annoncées sont équivalentes aux mêmes for-mules pour λ(n). Or les λ(n) sont les valeurs en T (n) d'un homomorphisme d'algèbresλ : Z[Γ(1)\∆/Γ(1)] −→ C, donc vérient les égalités.

λ(nm) = λ(n)λ(m) si (n,m) = 1λ(pr+1) = λ(p)λ(pr)− pλ(T (p, p))a(pr−1) pour p premier, r > 1.

Il reste donc à calculer λ(T (p, p)), mais f [T (p, p)]′k(z) = det[p 00 p

]k−1j[ p 0

0 p

](z)−1f(z) =

p2k−2p−kf(z), donc λ(T (p, p)) = pk−2.

Remarque. La formule a(n) = λ(n)a(1) montre que pour une forme paraboliquepropre (donc non nulle, comme tout vecteur propre) on a toujours a(1) 6= 0, de sorte quef est un multiple d'une forme propre normalisée.

Exemple. L'espace S12(Γ(1)) est de dimension 1, donc ∆ est vecteur propre des opéra-teurs de Hecke. On en déduit les propriétés de multiplicativité de la fonction τ conjecturéespar Ramanujan.

Remarque. La seconde conjecture de Ramanujan, sur la taille des τ(n) se généraliseainsi : si f ∈ Sk(Γ(1)) est une forme propre et normalisée, alors a(n) = o(n(k−1)/2+ε)pour tout ε > 0. Cette conjecture, dite de Ramanujan-Petersson, équivaut (cf TD) à ceque les racines up, vp du polynôme X2 − a(p)X + pk−1 soient conjuguées complexes (etdonc de module p(k−1)/2). Des travaux de Shimura ont montré comment cette conjectureétait impliquée par les conjectures de Weil sur la taille du nombre de points rationnelsde certaines variétés sur des corps nis, lesquelles conjectures de Weil ont nalement étédémontrées par Deligne à l'aide de la cohomologie étale de Grothendieck.

Remarque. (cf TD) Pour une forme parabolique propre et normalisée, la somme deDirichlet L(f, s) =

∑a(n)n−s converge pour Re(s) > k/2 et admet un produit Eulerien

L(s, f) =∏p

1

1− a(p)p−s + pk−1−2s.

La conjecture de Ramanujan-Petersson implique la convergence pour Re(s) > (k + 1)/2.

37

Page 38: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

1.3.4 L'anneau de Hecke en niveau Γ0(N). Nous allons décrire l'anneau de HeckeH0(N) := Z[Γ0(N)\∆0(N)/Γ0(N)] où ∆0(N) := [ a bc d ] ∈ ∆, c ≡ 0[N ] et (a,N) = 1.L'invariant principal d'une matrice α ∈ ∆0(N) est toujours le couple (l,m) des diviseursélémentaires de son conoyau. La condition α ∈ ∆0(N) impose que (l, N) = 1.

Lemme. Notons ∆0(N)l,m l'ensemble des α ∈ ∆0(N) d'invariants (l,m).

i) ∆0(N)l,m = Γ0(N)[ l 00 m ]Γ0(N).

ii) l'ensemble L0(N)l,m := [ a b0 d ], (a,N) = 1, ad = lm, 0 6 b < d et (a, b, d) = l estun ensemble de représentants des Γ0(N)-classes à gauche dans ∆0(N)l,m.

Démonstration. i) La diérence avec le cas Γ(1) est la suivante. Partant de α ∈ ∆0(N) ondoit trouver une base (ω1, ω2) de Z2 telle que :

(lω1,mω2) soit une base de α(Z2) ω1 ∈ (Z⊕NZ) (pour que la matrice de passage γ1 soit dans Γ0(N)). α(e1) ∈ (lZω1 ⊕NmZω2) (pour que la matrice de passage γ2 soit dans Γ0(N)).

On peut montrer que toute base (ω1, ω2) de Z2 telle que (lω1,mNω2) soit une base deα(Z⊕NZ) convient (exercice ou cf Miake 4.5.1).

ii) On procède comme dans le cas Γ(1)) en remarquant que pour α, α′ ∈ ∆0(N), siα′ = γα pour un γ ∈ Γ(1), alors γ ∈ Γ0(N).

Notons encore T (l,m) := [Γ0(N)[ l 00 m ]Γ0(N)]. D'après le lemme, les T (l,m), pour 1 6

l|m et (l, N) = 1, forment une base de H0(N). Voici la table de multiplication dans cettebase.

Proposition. On a les égalités suivantes (où p désigne un nombre premier) :

i) T (l,m) = T (l, l)T (1,m/l) = T (1,m/l)T (l, l)

ii) T (l,m)T (l′,m′) = T (ll′,mm′) si (lm, l′m′) = 1.

iii) Si p - N , T (1, p)T (1, pr) = T (1, pr+1) +

(p+ 1)T (p, p) si r = 1pT (p, p)T (1, pr−1) si r > 1

iv) Si p|N , T (1, p)T (1, pr) = T (1, pr+1).

En particulier, l'anneau Z[Γ0(N)\∆0(N)/Γ0(N)] est l'anneau des polynômes en les T (1, p),p premier et les T (p′, p′), p′ premier ne divisant pas N .

Démonstration. A partir du lemme précédent, et notamment des ensembles L0(N)l,m, onpeut suivre le même raisonnement que dans le cas Γ(1).

Corollaire. Pour n ∈ N, notons T (n) :=∑

lm=n,(l,N)=1 T (l,m) (en particulier ona T (p) = T (1, p)). Alors on a les formules :

i) T (nm) = T (n)T (m) si (n,m) = 1,

ii) T (pr+1) = T (p)T (pr)− pT (p, p)T (pr−1), si p - Niii) T (pr+1) = T (p)T (pr) si p|N .

38

Page 39: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

et, de manière équivalente, la formule générale

T (n)T (m) =∑l|(m,n)(l,N)=1

lT (l, l)T (mn/l2).

Démonstration. Exercice.

1.3.5 Action sur le formes modulaires en niveau Γ1(N). Bien-sûr, l'anneau de HeckeH0(N) agit naturellement sur Mk(Γ0(N)). Mais en fait, il agit aussi sur les formes mo-dulaires en niveau Γ1(N), une fois qu'on les a coupées en morceaux. Le point de départpour cela est le fait que Γ1(N) est distingué dans Γ0(N) avec un quotient abélien ni. Celanous permet de décomposer

Mk(Γ1(N)) =⊕

χMk(N,χ)

f =∑

χ fχ avec fχ = [Γ0(N) : Γ1(N)]−1∑

γ∈Γ0(N)/Γ1(N)

χ−1(γ).f [γ]k.

où χ décrit les caractères (=homomorphismes) Γ0(N)/Γ1(N) −→ C× et

Mk(N,χ) = f ∈Mk(Γ1(N)), f [γ]k = χ(γ)f, ∀γ ∈ Γ0(N) .

En d'autres termes,Mk(N,χ) consiste en des fonctions invariantes sous Γ0(N) pour l'actionde poids k et tordue par χ donnée par f [γ]χk := χ−1(γ)f [γ]k. Le point clef, expliqué ci-dessous, est que le caractère χ se prolonge en une application multiplicative χ : ∆0(N) −→C×. Ceci permet de tordre l'action de ∆0(N) par la même formule f [α]χk := χ(α)−1f [α]′ket de faire agir H0(N) surMk(N,χ) par la formule habituelle

f [Γ0(N)αΓ0(N)]χk :=∑

α′∈Γ0(N)\(Γ0(N)αΓ0(N))

f [α′]χk =∑

α′∈Γ0(N)\(Γ0(N)αΓ0(N))

χ(α′)−1f [α′]′k.

Pour voir que χ se prolonge à ∆0(N), on remarque que l'application

[ a bc d ] ∈ Γ0(N) 7→ d(mod N) ∈ (Z/NZ)×

induit un isomorphisme Γ0(N)/Γ1(N)∼−→ (Z/NZ)×. Ainsi les caractères de Γ0(N)/Γ1(N)

sont de la forme χ([ a bc d ]) = ψ(d) = ψ(a)−1 = ψ(a) où ψ décrit les caractères de Dirichletmodulo N . On peut donc prolonger χ à ∆0(N) par la formule χ([ a bc d ]) = ψ(a) (mais pasψ(d) car d n'est pas nécessairement premier à N !).

Dorénavant, nous ferons l'abus de noter par la même lettre χ un caractère de Γ0(N) etle caractère de Dirichlet correspondant, et même la fonction Z −→ C correspondante quienvoie n sur χ(n) si (n,N) = 1 et sur 0 sinon.

Lemme. Pour n > 1 et f ∈Mk(N,χ), on a

f [T (n)]χk(z) = nk−1∑ad=n

d−1∑b=0

χ(a)d−kf((az + b)/d).

39

Page 40: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Si f(z) =∑

m∈N a(m)qm est son q-développement en ∞ (avec q = exp(2iπz)), alors

f [T (n)]χk(z) =∑m∈N

∑d|(m,n)

χ(d)dk−1a(mn/d2)

qm.

Démonstration. Même calcul que pour Γ(1)). Dans la première formule, on n'oubliera pasque χ(a) = 0 si (a,N) 6= 1, idem dans la seconde ligne pour χ(d).

Venons-en aux propriétés d'adjonction des T (n) pour le produit de Petersson. Ici seproduit un vrai changement par rapport à Γ(1). Commençons par un exercice.

Exercice. Vérier que la somme Sk(Γ1(N)) =⊕

χ Sk(N,χ) est une somme orthogo-nale pour le produit de Petersson sur Sk(Γ1(N)).

Proposition. Supposons (n,N) = 1. Alors pour f, g ∈ Sk(N,χ) on a

〈f [T (n)]χk , g〉Γ1(N) = χ(n) 〈f, g[T (n)]χk〉Γ1(N) .

En particulier, [T (n)]χk est un opérateur normal sur Sk(N,χ).

Démonstration. Il sut de prouver l'analogue pour [T (l,m)]χk sous l'hypothèse que (lm,N) =1. Pour cela on utilise la même involution α 7→ α∗ = det(α)α−1 que dans le cas Γ(1). Lepoint clef est que, sous l'hypothèse (lm,N) = 1, la matrice [m 0

0 l ] est encore dans ∆0(N), etdonc ∆0(N)l,m est stable par l'involution ∗, puisque Γ0(N) l'est. Cela permet de montrerl'existence d'un système de représentants L commun aux classes à gauche et à droite (noterque la transposée ne fonctionne pas ici). Puis on fait le même calcul que pour Γ(1) ; onchoisit Γ distingué contenu dans Γ1(N) ∩ [ l 0

0 m ]−1

Γ1(N)[ l 00 m ] et on écrit

〈f [T (l,m)]χk , g〉Γ1(N) = 〈f [T (l,m)]χk , g〉Γ=

∑α∈L

〈f [α]χk , g〉Γ =∑α∈L

χ−1(α)〈f [α]k, g〉Γ1(N)∩α−1Γ1(N)α

=∑α∈L

χ−1(α)〈f, g[α−1]k〉αΓ1(N)α−1∩Γ1(N) =∑α∈L

χ−1(α)χ(α∗)〈f, g[α∗]χk〉Γ

= χ(det(α))〈f, g[T (l,m)]χk〉Γ = χ(lm)〈f, g[T (l,m)]χk〉Γ(1).

(Noter que χ−1 = χ.)

Le point nouveau, ici, est que les T (p) pour p|N ne sont pas normaux en général, doncon n'a pas d'argument général pour les diagonaliser. On peut donc seulement diagonalisersimultanément les T (n) pour (n,N) = 1.

Corollaire. L'espace Sk(N,χ) admet une base orthogonale formée de formes quisont des vecteurs propres pour tous les T (n) avec (n,N) = 1 (et même pour tous les

40

Page 41: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

T (l,m) avec (lm,N) = 1). De plus, si f(z) =∑

n>0 a(n)qn est une forme propre et devaleurs propres (λ(n))(n,N)=1, alors

∀n t.q. (n,N) = 1, a(n) = a(1)λ(n).

En particulier, si f est normalisée de sorte que a(1) = 1, on a les propriétés :a(nm) = a(n)a(m) si (n,m) = 1 et (n,N) = 1a(pr+1) = a(p)a(pr)− χ(p)pk−1a(pr−1) pour p premier - N, r > 1.

Démonstration. Même preuve que dans le cas Γ(1) sauf deux points. Pour la premièrepropriété de multiplicativité, on utilise a(nm) = a(m)λ(n), qui découle de la formuledonnant le terme en qm dans le développement de Fourier de f [T (n)]χk . Pour la seconde,on a besoin de la valeur propre de [T (p, p)]χk qui est maintenant χ(p)pk−2.

Maintenant se posent deux problèmes qui n'apparaissaient pas en niveau Γ(1).

Problème. Pour une forme propre comme dans le corollaire, on n'a qu'une factorisa-tion partielle de la fonction L.

L(s, f) =∏p-N

1

1− a(p)p−s + χ(p)pk−1−2s.

(∑n′

a(n′)n′−s

)

où n′ décrit les entiers dont tous les facteurs premiers divisent N . Ce n'est pas satisfaisant,et nous devons donc travailler plus pour gagner plus.

Problème. Si f est comme dans le corollaire, rien n'empêche a(1) d'être nul ! Dansce cas, on a même a(n) = 0 pour tout n tel que (n,N) = 1, et on n'a rien appris sur lafonction L de f .

1.3.6 Formes anciennes, formes nouvelles, formes primitives. En fait, ces deux pro-blèmes sont liés. Pour le voir, xons un système de valeurs propres λ′ = (λ(n))(n,N)=1 etnotons Sk(N,χ)[λ′] le sous-espace propre associé à ce système. Comme les T (p) pour p|Ncommutent aux T (n), ils stabilisent Sk(N,χ)[λ′]. Si cet espace est par aventure de dimen-sion 1, alors chaque T (p) agit par un scalaire λ(p) et l'espace est donc propre pour tous lesλ(n), n ∈ N. Dans ce cas la fonction L a bien un produit Eulerien de la forme attendue

L(s, f) =∏p-N

1

1− a(p)p−s + χ(p)pk−1−2s

∏p|N

1

1− a(p)p−s=∏p

1

1− a(p)p−s + χ(p)pk−1−2s

(on se rappelle que χ(p) = 0 si p|N .)Si maintenant l'espace Sk(N,χ)[λ′] est de dimension > 1, alors il n'y a pas d'argument

a priori pour diagonaliser les T (p), p|N . Néanmoins, on remarque que, justement dans cecas, la forme linéaire f 7→ a1(f) = a(1) a un noyau non nul, i.e. Sk(N,χ)[λ′] contient desformes non nulles telles que a(n) = 0 pour tout n premier à N .

Le résultat suivant explique d'où viennent de telles formes.

41

Page 42: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Théorème. i) Soit l > 1 un diviseur de N et f ∈ Sk(Γ1(N/l)). Alors la fonctionilf : z 7→ f(lz) est dans Sk(Γ1(N)) et vérie an(ilf) = 0 pour (n,N) = 1.

ii) Réciproquement, si f ∈ Sk(Γ1(N)) vérie an(f) = 0 pour (n,N) = 1, alors il existedes formes fl ∈ Sk(Γ1(N/l)) pour l > 1 diviseur de N telles que f =

∑l|N ilfl.

Démonstration. i) Remarquons que f(lz) = l1−k.f [ l 00 1 ]

′k(z) qui est une fonction auto-

morphe de poids k pour le groupe [ l 00 1 ]

−1Γ1(N/l)[ l 0

0 1 ] ∩ Γ(1) qui contient Γ1(N). Elle estaussi clairement holomorphe et s'annule aux pointes, donc ilf appartient bien à Sk(Γ1(N)).De plus, son q-développement s'écrit f(lz) =

∑n∈N an(f)qln, de sorte que an(ilf) = 0 si

l - n. En particulier, an(ilf) = 0 si (n,N) = 1.ii) La réciproque est plus dicile et fait l'objet d'une feuille de TD.

Ce résultat suggère que la source de nos problèmes se trouve dans les formes modulairesqui proviennent des niveaux plus bas. Il nous invite donc à considérer le sous-espaceSk(Γ1(N))old de Sk(Γ1(N)) engendré par toutes les fonctions de la forme f(lz) où :

f ∈ Sk(Γ1(M)) pour un diviseur M |N strict. l|(N/M) (et l = 1 est permis).

Et même si ce n'est pas encore évident, il est très opportun de dénir Sk(Γ1(N))new commel'orthogonal de Sk(Γ1(N))old pour le produit de Petersson.

Lemme. i) Sk(Γ1(N))old et Sk(Γ1(N))new sont stables sous l'action de Γ0(N) depoids k, et en particulier se décomposent

Sk(Γ1(N))old =⊕

χ∈ Z/NZ×

Sk(N,χ)old et Sk(Γ1(N))new =⊕

χ∈ Z/NZ×

Sk(N,χ)new.

De plus on a, en notant mχ le conducteur de χ,

Sk(N,χ)old =∑

mχ|M |N,M 6=Nl|(N/M)

il(Sk(M,χ)) =∑

mχ|M |N,M 6=Nl|(N/M)

il(Sk(M,χ)new).

ii) Soit mχ|M |N et l un diviseur premier ou unité de N/M . Alors pour p premier ona

[T (p)]χ,Nk il =

il [T (p)]χ,Mk si l 6= pi1 si l = p

iii) L'application f 7→ f [wN ]k, où wN = [ 0 −1N 0 ] induit une involution de Sk(Γ1(N)) qui

envoie Sk(N,χ) dans Sk(N,χ). De plus on a

[wN ]k il = l−1.(i1 [wN/l]k)

de sorte que [wN ]k stabilise Sk(Γ1(N))old.

42

Page 43: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Démonstration. i) Soit f ∈ Sk(Γ1(N/l)) et [ a bc d ] ∈ Γ0(N) (donc l|c). On a

(ilf)[ a bc d ]k = l1−k.f [ l 00 1 ]k[

a bc d ]k = l1−k.f

[a blc/l d

]k[ l 0

0 1 ]k = il(f[a blc/l d

]k)

où l'on remarque que f[a blc/l d

]k∈ Sk(Γ1(N/l)) puisque

[a blc/l d

]∈ Γ0(N/l). Ceci montre

que Sk(Γ1(N))old est stable par Γ0(N). Par adjonction de [α]k et [α−1]k pour α ∈ Γ(1) (cflemme plus haut), on en déduit que l'orthogonal Sk(Γ1(N))new est aussi stable par Γ0(N).

Par ailleurs, si χ est un caractère de Dirichlet module M et l un diviseur de N/M , laformule ci-dessus montre aussi que il(Sk(M,χ)) ⊂ Sk(N,χ), d'où l'inclusion⊇ dans l'égalitéannoncée. Cela montre l'autre inclusion aussi. En eet si on écrit f ∈ Sk(N,χ)old sous laforme f =

∑j iljfj avec fj ∈ Sk(Mj, χj) et lj|(N/Mj), alors on a aussi f =

∑j,χj=χ

iljfj.ii) Soit f ∈ Sk(M,χ). La formule décrivant l'action de T (p) sur les q-développements

montre que

an(il(f [T (p)]χ,Mk ) =

0 si l - n∑

d|(n/l,p) χ(d)dk−1anp/ld2(f) si l|n

an((ilf)[T (p)]χ,Nk ) =∑d|(n,p)

χ(d)dk−1anp/d2(ilf) avec anp/d2(ilf) =

0 si l - np/d2

anp/ld2(f) si l|np/d2

Supposons d'abord l 6= p. Dans ce cas, on a l|(np/d2) ⇔ l|n et (n, p) = (n/l, p), et ontrouve que an((ilf)[T (p)]χ,Nk ) = an(il(f [T (p)]χ,Mk ) comme voulu.

Supposons maintenant l = p. Alors en particulier p|N et χ(p) = 0. La formule ci-dessusse simplie en an((ipf)[T (p)]χ,Nk ) = anp(ip(f)) = ap(f) = ap(i1f).

iii) Si [ a bc d ] ∈ M2(Z) on calcule que wN [ a bc d ]w−1N =

[d −c/N−bN a

]. On voit donc que la

conjugaison par wN induit une involution de Γ1(N) et de Γ0(N). L'application f 7→ f [wN ]′kinduit donc une involution sur les fonctions automorphes de poids k et niveau Γ1(N), quipréserve visiblement les formes modulaires et les formes paraboliques. La conjugaison parwN sur Γ0(N) induit aussi une involution χ 7→ wNχ sur les caractères de Γ0(N) et on awNχ([ a bc d ]) = χ(wN [ a bc d ]w−1

N ) = χ(a) = χ(d) = χ([ a bc d ]), donc wNχ = χ. Il est alors clairque f 7→ f [wN ]k envoie Sk(N,χ) dans Sk(N, wNχ) = Sk(N,χ).

Finalement, on calcule [wN ]kil avec la formule explicite f [wN ]k(z) = N−1z−kf(−1Nz

).

Remarque. D'après le i), si χ est primitif (i.e.mχ = N), alors Sk(N,χ) = Sk(N,χ)new.

Corollaire. Sk(N,χ)old et Sk(N,χ)new sont stables sous l'action de H0(N) surSk(N,χ).

Démonstration. D'après le ii) du lemme, Sk(N,χ)old est stable par tous les T (p). Commeil est aussi clairement stable par les T (p, p), p - N , il est stable par H0(N). Il s'ensuit queSk(N,χ)new est stable par les adjoints des T (p). Pour p - N , l'adjoint de T (p) est χ(p)T (p),donc T (p) stabilise Sk(N,χ)new. Pour p|N , il faut un autre argument !

Rappelons-nous que dans ce cas L0(N)1,p = [

1 j0 p

], 0 6 j < p et on a donc f [T (p)]χk =∑p−1

j=0 f[

1 j0 p

]k. Le calcul utilisé pour montrer que T (p) est normal si p - N montre pour

43

Page 44: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

tout p que l'adjoint T (p)∗ de T (p) est f 7→∑p−1

j=0 f[p j0 1

]k. Cet opérateur n'est autre que

wN [T (p)]χk w−1N . D'après ii) et iii) du lemme, T (p)∗ stabilise donc Sk(N,χ)old, et par

adjonction, T (p) stabilise Sk(N,χ)new, comme voulu.

On peut maintenant faire marcher notre argument basé sur la multiplicité 1 d'un sys-tème de valeurs propres partiel.

Corollaire. L'espace des formes nouvelles Sk(N,χ)new admet une base orthogonaleconstituée de formes propres pour tous les T (n), n ∈ N. De plus, la multiplicité d'unsystème de valeurs propres est 1.

Démonstration. Par un argument déjà donnée, il sut de montrer que la multiplicité d'unsystème de valeurs propres λ′ = (λ(n))(n,N)=1 est 1, i.e. que Sk(N,χ)new[λ′] est de dimension1. Or on a vu que si tel n'est pas le cas, cet espace propre contient une forme non nulletelle que a1(f) = 0 et donc an(f) = 0 pour (n,N) = 1. Mais le ii) du théorème précédentnous dit qu'une telle f est ancienne. Contradiction.

Une forme f ∈ Sk(Γ1(N)) nouvelle, propre et normalisée est appelée forme primitivede conducteur N . Les formes primitives forment une base de Sk(Γ1(N))new. Le i) du lemmemontre comment toutes les formes de niveau Γ1(N) sont obtenues à partir des formesprimitives de niveau Γ1(M), M |N . En fait on peut démontrer (nous ne le ferons pas) lethéorème suivant.

Théorème. L'ensemble f(lz), f ∈ Sk(Γ1(M)) primitive et Ml|N est une base deSk(Γ1(N)).

2 Théorie géometrico-arithmétique

2.1 Liens entre formes modulaires et représentations Galoisiennes

Notre but est d'expliquer autant que possible quelques liens entre formes modulaires etreprésentations Galoisiennes. Ces liens sont apparus lorsque les mathématiciens ont réaliséque chacune de ces notions donnait lieu à des fonctions L dont les propriétés, prouvés ouconjecturales, se ressemblaient beaucoup.

2.1.1 Représentations Galoisiennes. Le groupe de Galois absolu de Q est un objetd'étude fondamental en théorie des nombres. Comme tout groupe, un bon moyen de l'ap-procher est d'étudier ses représentations linéaires. On s'intéresse donc aux représentationscontinues

ρ : Gal(Q/Q) −→ GLn(C)

où C désigne un corps local de caractéristique 0 (ou éventuellement la clôture algébriqued'un tel corps). Ici, le groupe GLn(C) est muni de la topologie qui fait de lui un ouvertde Mn(C) qui est un espace vectoriel de dimension nie sur le corps local C. Le groupe

44

Page 45: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Gal(Q/Q) est lui muni de la topologie qui fait des Gal(Q/K), K extension nie de Q, unebase de voisinages ouverts de l'unité. C'est aussi la topologie produit lorsqu'on écrit

Gal(Q/Q) =

(γK)K ∈∏

[K:Q]<∞

Gal(K/Q), (γK)|K′ = γK′ si K′ ⊂ K

,

ce qui montre que Gal(Q/Q) est proni (limite projective de groupes ni) et donc com-pact. On a alors la dichotomie suivante :

i) Si C = C (ou R), ρ est continue si et seulement si elle se factorise par un groupe deGalois ni Gal(K/Q). Ces représentations sont appelées représentations d'Artin.

ii) Si C est une extension du corps Q` (complété de Q pour la valeur absolue `-adique),alors la continuité de ρ est équivalente aux propriétés suivantes : ρ est à valeurs dans GL2(OC), après éventuelle conjugaison dans GL2(C). Pour tout n, la représentation ρ modulo `n se factorise par le groupe de Galois

d'une extension nie de Q.Ces représentations sont souvent simplement appelées représentations `-adiques.

Exemple. (n = 1 : caractères cyclotomiques.) Soit N un entier, µN le groupe desracines N -èmes de 1 dans Q et ζN ∈ µN une racine primitive. On rappelle que l'applicationσ 7→ nσ où σ(ζN) = ζnσN dénit un isomorphisme εN : Gal(Q(µN)/Q)

∼−→ (Z/NZ)×. Ainsitout caractère de Dirichlet χ modulo N dénit un caractère continu

χ εN : Gal(Q/Q) −→ Gal(Q(µN)/Q) −→ GL1(C).

Par ailleurs, la collection des ε`n , n ∈ N, dénit à la limite un isomorphisme ε`∞ :

Gal(Q(µ`∞)/Q)∼−→ lim

←−n(Z/`nZ)× = Z×` , que l'on peut donc voir comme un caractère

continuε`∞ : Gal(Q/Q) −→ Gal(Q(µ`∞)/Q) −→ GL1(Q`).

Le théorème de Kronecker-Weber nous dit qu'on a ainsi construit toutes les représentationscontinues de dimension 1 de Gal(Q/Q).

Exemple. (n = 2 : courbes elliptiques) Soit E une courbe elliptique sur Q (nousferons quelques rappels plus tard). Alors on sait que le sous-groupe des points de N -torsionE(Q)[N ] est isomorphe à (Z/NZ)2. Comme il est aussi visiblement muni d'une action deGal(Q/Q) compatible au produit dans E et comme les points de N -torsion sont dénis surune extension nie de Q, on obtient une représentation continue

ρE,N : Gal(Q/Q) −→ GL2(Z/NZ).

L'accouplement de Weil nous dit que le déterminant de ρE,N est donné par εN .En considérant le système projectif des E(Q)[`n] où les applications de transition sont

données par la multiplication par `, on obtient à la limite une représentation continue

ρE,`∞ : Gal(Q/Q) −→ lim←−n

GL2(Z/`nZ) = GL2(Z`) ⊂ GL2(Q`).

45

Page 46: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Exemple. (Cohomologie `-adique.) Plus généralement, pour une variété algébrique Xdénie sur Q, Grothendieck a déni des groupes de cohomologie étale H i

et(XQ,Z/NZ)

sur lesquels le groupe de Galois Gal(Q/Q) agit. En prenant la limite projective sur n desH iet(XQ,Z/`nZ) et en inversant `, on obtient un espace vectoriel H i

et(XQ,Q`) de dimensionnie sur Q` et muni d'une action linéaire continue de Gal(Q/Q). De telles représentations`-adiques sont dites d'origine géométrique. Ici, l'usage des coecients `-adiques est cru-cial : Serre a remarqué qu'il n'existe pas de théorie cohomologique Galois équivariante àcoecients complexes.

Représentations locales. Soit p un nombre premier. Fixons une clôture algébrique Qp

de Qp. Tout plongement ι : Q → Qp induit, par restriction des automorphismes, unplongement ι∗ : GQp := Gal(Qp/Qp) → Gal(Q/Q). Comme tout autre ι′ est de la formeιγ pour un γ ∈ Gal(Q/Q), le plongement ι′∗ est conjugué à ι∗ sous γ, et par conséquent lesdeux restrictions ρ ι∗ et ρ ι′∗ de ρ à GQp sont conjuguées sous ρ(γ), et donc équivalentes.On note simplement ρ|GQp

la (classe d'équivalence de) représentation de Gal(Qp/Qp) ainsiobtenue.

Ramication. Notons |.|p l'unique extension à Qp de la valeur absolue p-adique. L'actionde GQp sur Qp préserve la valeur absolue |.|p et en particulier stabilise l'anneau des entiersZp = x ∈ Qp, |x|p 6 1 et son idéal maximal mp := x ∈ Qp, |x|p < 1. Ainsi GQp agit parautomorphismes de corps sur le quotient Zp/mp = Fp, d'où un morphisme

GQp −→ GFp = Gal(Fp/Fp)

dont on note IQp le noyau, appelé sous-groupe d'inertie de GQp . On dit alors que la repré-sentation ρ est non ramiée en p (ou encore que ρ|GQp

est non ramiée) si ρ|IQp est triviale,c'est-à-dire si IQp agit par l'identité sur l'espace V = Cn de la représentation ρ.

Exercice. p est non ramié dans ρ si et seulement si ρ se factorise par Gal(Q(p′)/Q)

où Q(p′)est le sous-corps maximal de Q dans lequel p n'est pas ramié. [Indication : cela

revient à vérier que Q(p′)est le sous-corps xé par le sous-groupe engendré par tous les ι∗(IQp),

où ι décrit les plongements Q → Qp].

Nous ne considèrerons que des représentations qui n'ont qu'un nombre ni de pre-miers ramiés. Cette condition est automatique pour les représentations d'Artin, car si parexemple ρ se factorise par Gal(K/Q), alors tout p non ramié dans K est non ramié pourρ. Par contre, cette condition n'est pas automatique pour les représentations `-adiques.Pour un entier N , nous dirons que ρ est non ramiée en dehors de N si les seuls premiersramiés dans ρ sont des diviseurs de N . Cela équivaut à demander que ρ se factorise par

Gal(Q(N)/Q) où Q(N)

désigne le sous-corps de Q maximal dans lequel les seuls premiersramiés sont les diviseurs de N .

Polynômes caractéristiques de Frobenius. On sait que le morphisme GQp −→ GFp estsurjectif. Soit σp n'importe quel élément deGQp s'envoyant sur le Frobenius (x 7→ xp) ∈ GFp .

46

Page 47: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Alors σp normalise IQp donc stabilise les IQp-invariants VIQp dans l'espace V = Cn de la

représentation ρ. On pose alors

Φρ,p(X) := det((id−Xρ(σp))|V IQp

)∈ C[X]

le polynôme caractéristique (ou presque) de ρ(σp) agissant sur ces IQp-invariants. Celui-ciest indépendant du choix de σp puisque tout autre choix appartient à σp.IQp .

On voit sur la dénition que Φp(X) est de degré au plus n, et que que p est ramié siet seulement si Φp(X) est de degré < n.

2.1.2 Représentations d'Artin et formes de poids 1. La possibilité d'une correspondanceentre formes modulaires et représentations Galoisiennes se voit plus facilement sur lesreprésentations d'Artin. Dans ce cas, les polynômes Φp(X) sont à coecients complexesbornés indépendamment de p. En eet, puisque ρ se factorise par un groupe ni, les valeurspropres de ρ(σp) sont des racines de l'unité et donc | tr(∧iρ(σp))| 6

(ni

). Il s'ensuit que le

produit EulerienL(s, ρ) =

∏p

Φp(p−s)−1

converge pour <(s) > 1.

Exercice. Supposons n = 1. Si ρ est la représentation triviale, on a L(s, ρ) = ζ(s).Plus généralement, si ρ = χ εN pour un caractère de Dirichlet primitif χ modulo N , ona L(s, ρ) = L(s, χ) :=

∑∞n=1

χ(n)ns

.

Exemple. Soit K une extension nie de Q, et X l'ensemble ni des plongements de Kdans Q. Le groupe Gal(Q/Q) agit sur X et donc agit linéairement sur l'espace vectoriel CX .D'où une représentation d'Artin ρ de dimension n = [K : Q]. On montre alors (excellentexercice) que L(s, ρ) = ζK(s) =

∏p∈Max(OK)(1− (Np)−s)−1 =

∑a |Na|−s (la fonction ζ du

corps K). Ici a décrit les idéaux non nuls de OK .

Remarque. Si ρ = ρ1 ⊕ ρ2, alors L(s, ρ) = L(s, ρ1)L(s, ρ2).

Le théorème de Cebotarev nous dit que tout élément d'un groupe de Galois Gal(K/Q)ni est une substitution de Frobenius 8 pour un p non ramié dans K (et même pour uneinnité de tels p). Ainsi, puisqu'une représentation complexe d'un groupe ni est déterminéepar son caractère, une représentation d'Artin ρ est uniquement déterminée par les tr(ρ(σp))pour les premiers p où ρ est non ramiée. Comme on peut retrouver tr(ρ(σp)) = bp dans ledéveloppement L(s, ρ) =

∑∞n=1 bnn

−s, elle est donc a fortiori déterminée par sa fonctionL(s, ρ).

Artin a montré que L(s, ρ) admet un prolongement méromorphe à s ∈ C et satisfaitune certaine équation fonctionnelle du même type que celle satisfaite par ζ, L(s, χ) ouζK par exemple. Il a ensuite conjecturé que ce prolongement L(s, ρ) est holomorphe si et

8. i.e. un élément de la forme ι∗(σp)|K pour un plongement ι et un relèvement du Frobenius σp commeci-dessus

47

Page 48: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

seulement si ρ n'a pas de vecteurs xes sous Gal(Q/Q). Cette conjecture est toujours unproblème ouvert.

Lorsque ρ est de dimension 2, l'équation fonctionnelle de L(s, ρ) est semblable à cellesatisfaite par la fonction L(s, f) d'une forme primitive de poids 1. De plus, Hecke avaitprouvé l'holomorphie de L(s, f). Le spectaculaire théorème suivant a été conjecturé parLanglands, qui y voyait une raison profonde à la conjecture d'Artin.

Théorème. (Deligne-Serre) Soit f ∈ S1(N,χ) une forme primitive. Il existe uneunique représentation d'Artin ρf de dimension 2 telle que L(s, f) = L(s, ρf ).

Remarque. L'égalité L(s, f) = L(s, ρf ) est équivalente à l'égalité de tous les facteurslocaux

∀p, 1− ap(f)p−s + χ(p)p−2s = Φp(p−s),

et donc aux égalités

∀p - N, ap(f) = tr(ρ(σp)) et χ(p) = det(ρ(σp))et ∀p|N, ap(f) = tr(ρ(σp)|V Ip).

En particulier, on voit que ρf est non ramiée en dehors de N et ramiée en tout pre-mier divisant N . En fait, comme on l'a vu ci-dessus, la représentation ρf est entièrementdéterminée par les égalités

tr(ρ(σp)) = ap(f) pour p - N.

Dans leur preuve, Deligne et Serre construisent ρf satisfaisant l'égalité des facteurs locauxen p - N , puis montrent que les égalités en les facteur locaux en p|N découlent des équationsfonctionnelles pour chacune des fonctions L.

Remarque. Comme L(s, f) n'est pas le produit de deux fonctions L de Dirichlet, la re-présentation ρf est irréductible. Par ailleurs, son déterminant est manifestement det(ρf ) =χ εN . En particulier, on voit que la conjugaison complexe 9 σ∞ a pour déterminantdet(ρ(σ∞)) = χ(−1) = −1. Cette dernière égalité est une condition nécessaire pour avoirS1(N,χ) 6= 0.

De manière remarquable, ce résultat enrichit les deux mondes : D'une part, il implique la conjecture de Ramanujan-Petersson pour f de poids 1,

qui prédisait |ap(f)| 6 2. D'autre part, il implique la conjecture d'Artin pour les représentations ρf . D'ailleurs,

la forme moderne donnée par Langlands à la conjecture d'Artin est que toute re-présentation irréductible de dimension 2 est de la forme ρf . Notons que pour lesreprésentations réductibles de dimension 2, donc de la forme ρ = (χεN)⊕(χ′εN ′),on sait construire une série d'Eisenstein telle que L(s, f) = L(s, χ)L(s, χ′).

9. On peut supposer que Q est plongé dans C pour simplier. Sinon, une conjugaison complexe n'estdénie qu'à conjugaison près, et joue le rôle de substitution de Frobenius pour la valeur absolue archimé-dienne.

48

Page 49: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Nous n'allons pas expliquer la preuve de Deligne et Serre, mais nous signalons que, bien quele théorème concerne des objets plus simples (représentations d'Artin), sa preuve utilisela construction de représentations Galoisiennes associées à des formes de poids k > 1, quicomme nous allons le voir, sont `-adiques.

2.1.3 Représentations `-adiques et formes de poids k > 2..

Théorème. (Deligne, Shimura) Soit f ∈ Sk(N,χ) une forme primitive de poids k,niveau N , et nebentypus χ.

i) Le corps Kf engendré sur Q par les valeurs propres λ(n), n ∈ N est de degré nisur Q, et les λ(n) sont des entiers algébriques.

ii) Soit l un idéal maximal de OKf au dessus d'un premier `. Notons Kf,l le complétéde Kf pour la valeur absolue associée à l. C'est donc une extension nie de Q`.Alors il existe une unique (à conjugaison près) représentation continue

ρf,l : Gal(Q/Q) −→ GL2(Kf,l)

telle que pour tout p - `N on a l'égalité

(∗)p Φp,ρf,l(X) = 1− λ(p)X + χ(p)pk−1X2.

De plus, ρf,l est irréductible, son déterminant est le caractère (χεN).εk−1`∞ , et l'égalité

(∗)p est vraie pour tout p 6= `.

Remarque. (Sur l'unicité) La représentation ρf,l, si elle existe, est visiblement nonramiée en p - `N (et ramiée en p|`N). Comme dans le cas des représentations d'Artin,le théorème de Cebotarev assure que ρf,l est déterminée, à semi-simplication près, par leségalités (∗)p en chaque p - `N , et même simplement par les égalités tr(ρ(σp)) = λ(p) pourp - `N . Mais puisque ρf,l est irréductible, elle est complètement déterminée par ces égalités.

Remarque. (Sur le déterminant) Notons que χ εN est bien à valeurs dans Kf,l, etmême dans Kf , par construction. De même ε`∞ est à valeurs dans Z×` ⊂ K×f,l. Maintenantl'égalité entre det(ρf,l) (admettant que ρf,l existe) et le caractère annoncé est vraie aumoins en toutes les substitutions de Frobenius en les p - `N d'après (∗)p, et donc en toutélément de Gal(Q/Q) d'après Cebotarev.

Remarque. (Sur l'égalité (∗)p pour p|N , p 6= `) Comme dans le cas de poids 1, ceségalités aux premiers ramiés découlent des équations fonctionnelles satisfaites par lesfonctions L de chaque côté. Sauf qu'il n'est pas clair a priori que ρf,l admette une fonctionL raisonnable (ce n'est pas une représentation complexe !). En fait, la construction mêmede ρf,l via la cohomologie étale `-adique, jointe aux propriétés non triviales de celle-ci,permet de lui associer une telle fonction L.

Remarque. (Et en p = ` ?) Ce qui se passe en p = ` est assez mystérieux, et pourtantcrucial dans les applications arithmétiques. An d'expliquer la particularité de ce cas,remarquons que l'on peut interpréter l'égalité (∗)p lorsque p - `N comme une description

49

Page 50: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

complète de la restriction ρ|GQp. Mais lorsque p|N , on est dans la situation bizarre où on

sait que ρ|GQpest bien déterminée (à cause de Cebotarev), mais on ne sait pas la lire sur

f . Même lorsque p 6= `, l'égalité (∗)p ne sut pas à décrire ρ|GQp. Néanmoins dans ce cas,

on comprend bien depuis Langlands comment décrire complètement ρ|GQp, à partir de la

représentation automorphe associée à f . C'est l'objet de la correspondance de Langlandslocale. Mais lorsque p = `, même la représentation automorphe associée à f est insusantepour décrire ρ|GQ`

. C'est l'objet du récent programme de Langlands p-adique d'essayerde comprendre ce qui se passe, l'outil principal étant la théorie de Hodge p-adique.

Remarque. (Sur les conséquences du théorème) Comme dans le cas de poids 1, cethéorème permet de prouver la conjecture de Ramanujan-Petersson. Sauf que les estiméesdu côté Galoisien sont beaucoup plus diciles ! Là encore, elles découlent de la constructionvia la cohomologie étale, et des conjectures de Weil démontrées par Deligne sur la taille dunombre de points des variétés sur les corps nis !

Remarque. (Sur la réciproque) Comme dans le cas des représentations d'Artin, ilexiste une réciproque conjecturale à ce théorème. Une première version, dûe à Langlands,prédit que toute représentation irréductible de dimension 2 d'origine géométrique (i.e. ap-paraissant comme sous-quotient de la cohomologie d'une variété algébrique sur Q) provientd'une forme modulaire. Ceci contient déjà la conjecture de modularité pour les courbeselliptiques, promue par Shimura, Taniyama et Weil, dont un cas particulier prouvé parWiles a permis de boucler la preuve du théorème de Fermat. Une version encore plus spec-taculaire a été énoncée par Fontaine et Mazur, où l'hypothèse d'origine géométrique estremplacée par une condition liée à la théorie de Hodge `-adique, dont l'énoncé nous mène-rait trop loin. Cette conjecture (en poids > 2) a connu des progrès récents spectaculaires,et seuls quelques cas résistent. MAIS... ce n'est que le cas n = 2 d'une conjecture encoreplus générale, reliant représentations Galoisiennes et représentations automorphes, et quielle, est encore loin d'être comprise...

2.1.4 Stratégie de la preuve. La première idée est d'exhiber un sous-groupe abélien librede type ni H et générateur du C-espace vectoriel Sk(N,χ) qui soit stable par l'action del'anneau de Hecke H0(N). Le théorème de Cayley-Hamilton nous dit alors que les valeurspropres d'un opérateur de Hecke sont des zéros de son polynôme caractéristique en tantqu'endomorphisme de H, lequel est monique à coecients entiers, ce qui prouve le i) duthéorème. Dans le cas k = 2 et χ = 1N , nous pourrons prendre pour H l'homologiesingulière H1(X0(N),Z). En général, il faut prendre l'homologie à coecients dans unsystème local dépendant de k.

La deuxième idée consiste à montrer d'abord que X0(N) possède un modèle canoniquecomme courbe algébrique sur Q, puis à essayer d'en déduire une action de Gal(Q/Q)sur l'homologie H. C'est cette deuxième étape qui est techniquement très dicile, et quid'ailleurs ne fonctionne pas bien. Ce que l'on parvient à faire, c'est dénir une action Ga-loisienne sur l'homologie à coecients Z/`nZ, et donc, en prenant la limite, sur l'homologieHZ` à coecients dans Z`.

À ce point, on dispose d'un Z`-module libre de type ni muni d'une action de H0(N)

50

Page 51: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

et de Gal(Q/Q). Il faut alors montrer que l'action Galoisienne ρ est non ramiée en toutp - `N , puis montrer qu'une substitution de Frobenius σp en un tel p satisfait l'équationpolynomiale (appelée relation de congruence d'Eichler-Shimura)

1− T (p).ρ(σp) + pT (p, p).ρ(σp)2 = 0.

À partir de là, il reste à montrer que l'espace HZ` ⊗Z` Kf,l[λ] (sous-espace propre pourtous les Tp) est de dimension 2 sur Kf,l. C'est la représentation cherchée.

Dorénavant nous supposons k = 2 et χ = 1N . Nous partons donc de f ∈ S2(Γ0(N)). Nousallons essayer de mener à bien la stratégie ci-dessus dans ce cas, en protant de

l'isomorphisme

S2(Γ0(N))∼−→ Ω1(X0(N)) := formes diérentielles holomorphes ω sur X0(N).

2.2 Algébricité des valeurs propres de Hecke

2.2.1 Jacobienne, homologie, théorème d'Abel. Soit X une surface de Riemann com-pacte de genre g. Si ω ∈ Ω1(X) est une forme diérentielle holomorphe, on peut l'intégrerle long de tout chemin continu c : [0, 1] −→ X. Le théorème des résidus et l'holomorphiede ω assurent que si c′ est homotope à c alors

∫c′ω =

∫cω. Fixons un point x0 ∈ X. En se

restreignant aux lacets basés en x0 on obtient un homomorphisme de groupes

π1(X, x0)ab = H1(X,Z) −→ Ω1(X)∗.

Avec un peu de topologie algébrique, on voit que le groupe abélien H1(X,Z) est libre derang 2g, engendré par les lacets longitudinaux c1, · · · , cg et les lacets latitudinaux c′1, · · · , c′gautour des g trous de X. Avec un peu de théorie de Hodge, on montre que la famille∫ci, i = 1, · · · , g ∪

∫c′i, i = 1, · · · , g est une R-base de Ω1(X)∗. En particulier H1(X,Z)

est un réseau co-compact du C-espace vectoriel Ω1(X)∗ et le quotient

J(X) := Ω1(X)∗/H1(X,Z)

est naturellement une variété complexe compacte de dimension g, munie d'une structurede groupe analytique abélien (on parle de tore complexe).

Si maintenant c est un chemin de x0 à x, l'image de l'élément∫c∈ Ω1(X)∗ dans J(X)

ne dépend que de x et on peut la noter simplement∫ xx0. Considérons alors l'application

Div0(X) −→ J(X),∑x

nx[x] 7→∑x

nx

∫ x

x0

.

Le théorème d'Abel-Jacobi arme que cette application induit un isomorphisme de groupes 10

Pic0(X)∼−→ J(X).

Nous allons montrer que, lorsque X = X0(N), tous ces objets sont munis d'une actionnaturelle des opérateurs de Hecke Tp compatible avec l'application d'Abel-Jacobi et avecl'isomorphisme S2(Γ0(N)) ' Ω1(Γ0(N)).

10. Ce qui conrme le fait utilisé précédemment que le groupe Pic0(X) est divisible.

51

Page 52: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

2.2.2 Fonctorialité. Soit π : X −→ Y un morphisme non constant de surfaces deRiemann compactes. Il induit deux homomorphismes

π∗ : Pic0(X) −→ Pic0(Y ) et π∗ : Pic0(Y ) −→ Pic0(X)

dénis par π∗([x]) := [π(x)] et π∗([y]) =∑

x∈π−1(y) ex[x], où ex désigne l'indice de ramica-tion de π en x. Ces dénitions sur Div préservent clairement Div0. Il faut voir qu'elles pré-servent aussi les diviseurs principaux. Pour cela on remarque que π∗(div(f)) = div(f π)tandis que π∗(div(f)) = div(N(f)) où N désigne la norme de l'extension C(X)/C(Y )(concrètement, on a N(f)(y) =

∏x∈π−1(y) f(x)ex).

Il induit aussi deux applications C-linéaires

π∗ : Ω1(X) −→ Ω1(Y ) et π∗ : Ω1(Y ) −→ Ω1(X).

On a déjà rencontré π∗, qui est simplement déni en coordonnées locales u = π(z) parπ∗(f(u)du) = f(π(z))π′(z)dz. Dénir π∗ est un peu plus délicat. On commence par dénirπ∗(ω) sur l'ouvert Y ′ ⊂ Y au-dessus duquel π est non ramié. Pour y ∈ Y ′, on choisitun voisinage V de y tel que π−1(V ) =

⊔x∈π−1(y) Ux avec π|Ux : Ux

∼−→ V . On posealors π∗(ω)|V :=

∑x (π|Ux)

−1∗(ω|Ux). Il faut ensuite voir que ceci se prolonge de manièreholomorphe à Y . En raisonnant au voisinage d'un point de ramication on se ramène aucas où π est de la forme z 7→ u = ze sur un disque épointé D∗ en 0. On calcule alorsque π∗(

∑n∈N anz

ndz)|D∗ =∑

m∈N ae(m+1)−1umdu qui se prolonge visiblement de manière

holomorphe en 0.Enn, on a aussi des applications

π∗ : H1(X,Z) −→ H1(Y,Z) et π∗ : H1(Y,Z) −→ H1(X,Z).

L'application π∗ est simplement la composition c 7→ π c des lacets, et comme ci-dessus,l'application π∗ est plus délicate. Partant d'un lacet c tracé sur Y et basé en y, on commencepar le déformer pour qu'il évite le lieu de ramication. Puisque π est un isomorphisme local,pour chaque x ∈ π−1(y), il existe un unique chemin cx relevant c et tel que cx(0) = x. Onobtient alors une permutation x 7→ cx(1) de la bre π−1(x). Si x0 7→ x1 7→ · · · 7→ xr estune orbite de cette permutation, alors la concaténation des cxi est un lacet tracé sur X.On dénit π∗(c) comme l'image de la somme des lacets associés à chaque orbite. On vériealors sur les dénitions le lemme suivant.

Lemme. Pour un lacet c tracé sur Y et ω ∈ Ω1(X), on a∫π∗c

ω =∫cπ∗ω. Pour un

lacet c tracé sur X et ω ∈ Ω1(Y ), on a∫π∗c

ω =∫cπ∗ω.

Ce lemme implique que les adjoints respectifs de π∗ et π∗ sur les Ω1 induisent desmorphismes

π∗ : J(X) −→ J(Y ) et π∗ : J(Y ) −→ J(X).

Toujours sur les dénitions, on vérie aussi :

Lemme. Les applications d'Abel-Jacobi Pic0 −→ J sont compatibles avec π∗ et π∗.

52

Page 53: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Enn, la situation qui nous intéresse est la suivante.

Lemme. Supposons que X = X(Γ) et Y = X(Γ′) avec Γ ⊂ Γ′, et notons πΓ, respπΓ′ la projection de H∗ sur X(Γ), resp. sur X(Γ′). Alors les diagrammes suivants sontcommutatifs

Ω1(X(Γ)) ∼π∗Γ

// S2(Γ)

Ω1(X(Γ′))

π∗

OO

∼π∗

Γ′

// S2(Γ′)

f 7→f

OOet Ω1(X(Γ))

π∗

∼π∗Γ

// S2(Γ)

f 7→∑γ′∈Γ\Γ′ f [γ′]2

Ω1(X(Γ′)) ∼

π∗Γ′

// S2(Γ′)

Démonstration. Dans les diagrammes, la notation π∗Γ est légèrement abusive, mais est làpour rappeler que l'isomorphisme Ω1(X(Γ))

∼−→ S2(Γ) est déni par ω 7→ f où π∗Γ(ω) =f(z)dz. A partir de là, la commutativité du premier diagrammes est évidente puisqueπ∗Γ′ = (π πΓ)∗ = π∗Γ π∗.

Pour voir la commutativité du second, partons de ω ∈ Ω1(X(Γ)) et notons g ∈ S2(Γ′)telle que π∗Γ′π∗ω = g(z)dz. On veut montrer que g =

∑γ′∈Γ\Γ′ f [γ′]2. Il sut de le prouver

sur l'ouvert dense des points ordinaires (i.e. hors des lieux de ramication de π, πΓ et πΓ′).Soit alors y ∈ X(Γ′) point ordinaire et z ∈ π−1

Γ′ (y). Comme πΓ′ est un isomorphisme localau-dessus d'un voisinage de y, il existe des voisinages Vy de y et Oz de z tels que πΓ′ induise

Oz∼−→ Vy et π−1

Γ′ (Vy) =⊔γ′∈Γ′ γ

′Oz. Alors si on choisit un ensemble L de représentantsde Γ\Γ′, on voit que π−1(y) = πΓ(γ′z), γ′ ∈ L et π−1(Vy) =

⊔γ′∈L πΓ(γ′Oz) avec, pour

chaque γ′, π qui induit un isomorphisme πΓ(γ′Oz)∼−→ Vy. De plus, puisque π πΓ = πΓ′ ,

l'inverse de cet isomorphisme vérie

(∗) : (π|πΓ(γ′Oz))−1 πΓ′ = πΓ γ′.

Maintenant, par dénition, on a

π∗(ω)|Vy =∑γ′∈L

(π|πΓ(γ′Oz))−1∗(ω|πΓ(γ′Oz))

Donc d'après (∗),(π∗Γ′(π∗ω))|Oz =

∑γ′∈L

γ′∗π∗Γ(ω|πΓ(γ′Oz)),

et nalement

(g(z)dz)|Oz =∑γ′∈L

γ′∗((f(z)dz)|γ′Oz) =

(∑γ′∈L

γ′∗(f(z)dz)

)|Oz

Mais γ′∗(f(z)dz) = f(γ′z)d(γ′z) = f [γ′]2(z)dz.

53

Page 54: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

2.2.3 Correspondances. Une correspondance C entre deux S.R. compactes X et X ′ estun diagramme

Xπ←− Y

π′

−→ X ′

dans lequel π et π′ sont des morphismes non constants entre surfaces de Riemann com-pactes. D'après le paragraphe précédent, la correspondance C induit des homomorphismes

C∗ := π′∗ π∗ :

Ω1(X) −→ Ω1(X ′)Pic0(X) −→ Pic0(X ′)H1(X,Z) −→ H1(X ′,Z)J(X) −→ J(X ′)

compatibles avec l'accouplement d'intégration entreH1 et Ω1 et l'application d'Abel-Jacobi.La situation qui nous intéresse est la suivante. Soit X = X(Γ) pour Γ ⊂ Γ(1) un

sous-groupe de congruence, et soit ΓαΓ une double classe dans ∆. On lui associe la corres-pondance CΓαΓ :

X(Γ)πα←− X(α−1Γα ∩ Γ)

π−→ X(Γ)

où πα est la composée X(α−1Γα ∩ Γ)∼−→ X(Γ ∩ αΓα−1) −→ X(Γ) et où le premier

isomorphisme est induit par α : H∗ → H∗.

Lemme. Le diagramme suivant est commutatif.

Ω1(X(Γ))

CΓαΓ,∗

∼π∗Γ

// S2(Γ)

[ΓαΓ]2

Ω1(X(Γ)) ∼π∗Γ

// S2(Γ)

Démonstration. D'après le lemme précédent, l'action de CΓαΓ,∗ sur Ω1(X(Γ)) correspondà l'action suivante sur S2(Γ)

f 7→∑

γ∈(α−1Γα∩Γ)\Γ

(f [α]2)[γ]2 =∑

δ∈Γ\(ΓαΓ)

f [δ]2 = f [ΓαΓ]2,

c'est à dire à l'action de l'opérateur de Hecke [ΓαΓ].

On pourrait montrer directement que l'action des CΓαΓ dénit une action de l'anneaude Hecke Z[Γ\∆/Γ] sur chacun des objets Pic0(X(Γ)), H1(X(Γ),Z) etc, du paragrapheprécédent. Cependant, on peut maintenant le déduire du fait que c'est vrai sur Ω1 par lelemme, donc sur Ω1,∗ par passage au dual, donc sur H1 puisque l'action y est la restricitionde celle sur Ω1,∗, et donc nalement sur J et Pic0.

Corollaire. L'image TΓ de Z[Γ\∆/Γ] dans EndC(S2(Γ)) est un Z-module de typeni.

54

Page 55: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

Démonstration. Il sut de voir que l'image de l'anneau de Hecke dans le dual Ω1(X(Γ))∗

est un Z-module de type ni. Or, l'anneau de Hecke stabilise le réseau H1(X,Z) donc sonimage est contenue dans EndZ(H1(X,Z)) qui est de type ni sur Z.

Nous spécialisons maintenant notre discussion à Γ = Γ0(N) et l'action de l'anneaude Hecke H0(N). On notera T0(N) son image dans EndC (S2(Γ0(N))), qui est un anneaucommutatif.

On rappelle qu'un système de valeurs propres (λ(n)n∈N) des T (n) agissant sur S2(Γ0(N))est déterminé par les λ(p), p premier, et détermine un caractère (ie un homomorphismed'anneaux) λ : H0(N) −→ C. Ce caractère se factorise par T0(N) qui, par le corollaire,est de type ni comme module sur Z. Il s'ensuit que Im(λ) est un ordre dans un corps denombres Kλ. En d'autres termes :

Corollaire. Soit f ∈ S2(Γ0(N)) une forme propre et normalisée pour tous les T (n),n ∈ N. Alors le corps Kf engendré par les coecients an(f), n ∈ N du q-développement def est un corps de nombres, et les an(f) y sont des entiers algébriques.

Pour la suite, il est utile de comparer les systèmes de valeurs propres de H0(N) dansS2(Γ0(N)) avec ceux apparaissant dans H1(X0(N),C). On utilise la notation V [λ] pourdésigner l'espace propre associé à λ sur V , i.e.

V [λ] = v ∈ V, ∀T ∈ H0(N), T v = λ(T )v.

On utilise aussi la notation Vλ pour désigner l'espace propre généralisé associé à λ sur V ,i.e.

Vλ = v ∈ V, ∀T ∈ H0(N), (T − λ(T ))nv = 0 pour n >> 0.

Proposition. Pour tout caractère λ : H0(N) −→ C on a

dimC(H1(X,C)λ) = 2 dimC(S2(Γ0(N))λ),

et dimC(H1(X,C)[λ]) > dimC(S2(Γ0(N))[λ]) si non nul.

Démonstration. On a dimC(S2(Γ0(N))λ) = dimC(Ω1(X0(N))λ) = dimC(Ω1(X0(N))∗λ). Pourvoir la dernière égalité, on peut prendre une base B de Ω1(X0(N)) dans laquelle H0(N)agit de manière triangulaire (triangularisation simultanée d'une famille d'endomorphismescommutants 2 à 2). La dimension de Ω1(X0(N))λ est alors le nombre d'occurences de λsur la diagonale. Mais dans la base duale B∗ de Ω1(X0(N))∗, H0(N) agit par des matricestriangulaires inférieures et on lit aussi la dimension de Ω1(X0(N))∗λ sur la diagonale, quiest la même que dans B.

Par ailleurs, on sait que H1(X,Z) est un réseau cocompact de Ω1(X0(N))∗, et doncl'inclusion H1(X,Z) → Ω1(X0(N))∗ induit un isomorphisme R-linéaire

H1(X,R)∼−→ Ω1(X0(N))∗

et par suite un isomorphisme C-linéaire

H1(X,C)∼−→ Ω1(X0(N))∗ ⊕ Ω1(X0(N))∗

55

Page 56: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

où la notation V désigne le conjugué d'un espace vectoriel complexe, i.e. le même espacemais avec l'action de C conjuguée : ∀z ∈ C, ∀v ∈ V , z ·v := zv. Bien-sûr, H0(N) agit encoresur Ω1(X0(N))∗, et le problème est maintenant de montrer que pour tout caractère λ, on a

dimC(Ω1(X0(N))∗λ) = dimC(Ω1(X0(N))∗λ),

ou encoredimC(S2(Γ0(N))λ) = dimC(S2(Γ0(N))∗λ).

Remarquons que le produit hermitien de Petersson fournit un isomorphisme S2(Γ0(N))∼−→

S2(Γ0(N))∗ par la formule g 7→ (f 7→ 〈f, g〉). Mais les T (n) ne sont pas tous auto-adjointspour ce produit (seulement si (n,N) = 1), donc cet isomorphisme n'est pas entièrementcompatible avec l'action de H0(N). Cependant, on a aussi vu que l'adjoint de [T (p)]2 est[T (p)]∗2 = [wN ]2 [T (p)]2 [w−1

N ]2 lorsque p|N . Cette formule est en fait valable pour toutp car, lorsque p - N , [T (p)]2 commute à [wN ]2. Il s'ensuit que l'isomorphisme

S2(Γ0(N))∼−→ S2(Γ0(N))∗, g 7→ ϕg : (f 7→ 〈f [w−1

N ]2, g〉)

est compatible à l'action de H0(N) (i.e. on a ϕg[T ]2(f) = ϕg(f [T ]2)), et par conséquent

dimC(S2(Γ0(N))λ) = dimC(S2(Γ0(N))∗λ)

et dimC(S2(Γ0(N))[λ]) = dimC(S2(Γ0(N))∗[λ])

pour tout caractère λ : H0(N) −→ C. On a donc prouvé l'égalité annoncée. L'inégalités'ensuit aussi puisque, si dim(Ω1(X0(N))[λ]) 6= 0 alors dim(Ω1(X0(N))∗λ) 6= 0 donc aussidim(Ω1(X0(N))∗[λ]) 6= 0.

Corollaire. Soit f ∈ S2(Γ0(N)) primitive et λ le système de valeurs propres asso-cié. Alors

dimC(H1(X0(N),C)[λ]) = dimKf (H1(X0(N), Kf )[λ]) = 2.

Démonstration. On a vu dans ce cas que S2(Γ0(N))[λ] = S2(Γ0(N))λ est de dimension 1.D'après la proposition on a donc dimC(H1(X0(N),C)[λ]) 6 dimC(H1(X0(N),C)λ) = 2 etaussi dimC(H1(X0(N),C)[λ]) > 1. On a donc dimC(H1(X0(N),C)[λ]) = 2. Comme λ est àvaleurs dans le sous-corps Kf ⊂ C, on a aussi dimKf (H1(X0(N), Kf )[λ]) = 2.

Continuons avec f comme dans le corollaire. Soit maintenant ` un premier et l ∈Max(OKf ) au-dessus de `. Posons

Vf := H1(X,Kf,l)[λ].

Cet espace de dimension 2 sur Kf,l est l'espace de la représentation Galoisienne que nouscherchons. Pour dénir cette représentation, on utilisera le lien suivant avec Pic0.

H1(X,Kf,l) =(

lim←−m

Pic0(X0(N))[`m])⊗Z` Kf,l.

56

Page 57: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

En eet, si on désigne par Pic0(X)[N ] le noyau de la multiplication par N dans Pic0, lethéorème d'Abel-Jacobi identie Pic0(X)[N ] avec N−1H1(X,Z)/H1(X,Z) ' H1(X,Z) ⊗(Z/NZ), ce qui en passant à la limite projective fournit un isomorphisme

lim←−m

Pic0(X)[`m] ' H1(X,Z)⊗ Z` = H1(X,Z`).

On voit ainsi qu'il nous faut maintenant dénir une action de Galois sur Pic0(X0(N))).Pour cela, nous devons d'abord trouver un modèle canonique de X0(N) comme courbealgébrique sur Q.

2.3 Le modèle canonique de X0(N)

On sait que toute surface de Riemann compacte peut être dénie par des équationsalgébriques. Formalisons un peu ce que cela signie.

2.3.1 Variétés algébriques. Soit k un corps. Une variété algébrique X sur k est un k-schéma de type ni intègre. C'est donc un espace annelé localement isomorphe au spectred'une k-algèbre de type ni intègre. Un morphisme de variétés est un morphisme d'espacesannelés.

Une variété est projective si elle est isomorphe à une sous-variété fermée de Pn (dé-nie par des polynômes homogènes). Une variété possède un unique point générique dontl'anneau local est le corps des fonctions rationnelles k(X) de X. La dimension de X (ausens de la longueur d'une chaîne maximale de fermés irréductibles) est égale au degré detranscendence de k(X) sur k.

Une courbe C sur k est une variété de dimension 1. Si k est parfait, on dit que C estlisse sur k si ses anneaux locaux sont des anneaux de valuation discrète. On peut montrerque toute courbe propre (ou complète) est en fait projective. Un des premiers résultatsde la théorie des courbes algébriques est que la correspondance

C 7→ k(C)

établit une anti-équivalence de catégories entre courbes algébriques sur k (avec morphismesnon constants) et corps de degré de transcendence 1 et niment engendrés sur k. Voicicomment on peut reconstruire une courbe CK à partir d'un tel corps K. On prend pourespace

|CK | = η ∪ anneaux de valuation discrète k ⊂ V ⊂ K t.q. Frac(V ) = K,

où η sera le point générique. Un ensemble est déclaré ouvert s'il est le complémentairedans CK d'un sous-ensemble ni, mais contient η. Pour un ouvert U on pose OCK (U) =⋂V ∈U V ⊂ K. On montre que c'est une algèbre de type ni sur k et un anneau de Dedekind.

Le pré-faisceau U 7→ OCK (U) est un faisceau qui dénit donc une structure d'espace annelésur CK , et on vérie que la structure induite sur U est celle de Spec(OCK (U)). Ainsi CKest une courbe, dont on vérie facilement qu'elle est complète.

57

Page 58: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

2.3.2 Algébrisation des tores complexes de dimension 1. L'algébrisation d'une surfacede Riemann compacte peut se faire de manière pragmatique en prenant la courbe algébriquelisse complète associée à son corps de fonctions. Mais dans le cas des tores C/Λ, on peutexhiber des équations dépendant holomorphiquement de Λ. Considérons la série de lavariable x ∈ C

℘′Λ(x) = −2∑ω∈Λ

1

(x− ω)3.

Elle converge normalement sur tout domaine fondamental pour Λ, une fois qu'on enlève lenombre ni de termes qui y ont un pôle. Cette fonction est donc Λ-périodique, holomorpheen dehors de Λ et possède des pôles d'ordre 3 en chaque ω ∈ Λ. Cette fonction admet uneprimitive, la fonction ℘Λ de Weierstrass en x ∈ C

℘Λ(x) =1

x2+∑ω∈Λ

(1

(x− ω)2− 1

ω2

)elle aussi Λ-périodique et méromorphe, mais avec des pôles d'ordre 2 en ω ∈ Λ. Ainsi ℘Λ et℘′Λ descendent en des fonctions méromorphes sur C/Λ. En raisonnant sur les pôles possiblesd'une fonction méromorphe générale sur C/Λ, on montre queMC/Λ = C(℘Λ, ℘

′Λ). Avec le

même genre d'idées, on montre que la fonction

℘′2Γ − 4℘3

Λ + g2(Λ)℘Λ + g3(Λ)

est holomorphe, donc constante, puis nulle. Ceci donne une présentation du corps MC/Λet montre que l'application

C/Λ −→ P2(C), x 6= 0 7→ [℘(x) : ℘′(x) : 1], 0 7→ [0 : 1 : 0]

est un isomorphisme de C/Λ sur la surface de Riemann associée à la courbe elliptiqued'équation y2 = 4x3− g2x− g3. Notons que lorsqu'on fait varier Λ sous la forme Λ = Λz =zZ⊕ Z avec z ∈ H, on obtient une famille analytique de courbes elliptiques sur H, tracéesur H×P2(C), d'équation non-homogène y2 = 4x3−g2(z)−g3(z). Le discriminant de cettefamille est la forme modulaire ∆ ∈ S12(Γ(1)) et son invariant j est la fonction modulairej.

On se rappelle que Y (1) paramétrise les tores complexes à isomorphisme près. On peutnaturellement se demander si la famille précédente descend en une famille de courbeselliptiques sur Y (1). On aimerait même que cette famille dépende algébriquement de lacoordonnée j que l'on a sur Y (1) et que la courbe Ej soit d'invariant j... Mais cela est unpeu trop demander, à cause des points elliptiques, qui correspondent à des courbes ayanttrop d'automorphismes.

Restreignons-donc la famille ci-dessus au lieu ordinaire. Remarquons que c'est le lieuoù g2 6= 0 et g3 6= 0 et c'est aussi le lieu où j 6= 0, 1728. On peut alors faire un changementde variable (x, y) = ((g3/g2)x′, (g3/g2)3/2y′)) pour mettre la famille ainsi restreinte sous laforme Ez : y2 = 4x3 − 27j(z)

j(z)−1728x − 27j(z)

j(z)−1728, ce qui descend manifestement en une famille

58

Page 59: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

algébrique de courbes elliptiques d'équation Ej : y2 = 4x3 − 27jj−1728

x− 27jj−1728

sur la droiteane de coordonnée j et privée des points j = 0, 1728.

Comme on sait qu'une courbe elliptique est dénie sur Q si et seulement si son invariantj est rationnel, on a justié ainsi de choisir, comme modèle X(1)Q de X(1) sur Q, la droiteprojective P1 de corps des fonctions Q(j).

2.3.3 Algébrisation et modèle rationnel de X0(N). Nous allons décrire le corps desfonctions méromorphes de X0(N). On sait que j dénit une fonction méromorphe j ∈MX0(N). Par un calcul déjà vu, la fonction méromorphe jN(z) = j(Nz) = j([N 0

0 1 ]z) estaussi modulaire de niveau Γ0(N).

Théorème. On a MX0(N) = C(j, jN). De plus, il existe un polynôme symétriquefN ∈ Z[X, Y ] tel que fN(X, Y ) = 0. Enn, fp(X, Y ) ≡ (Y −Xp)(Y p −X)(mod p).

Démonstration. Rappelons que l'on connait déjà le degré de MX0(N) sur MX(1) = Q(j)qui est égal à [Γ(1) : Γ0(N)]. Choisissons un ensemble L de représentants de Γ0(N)\Γ(1).Tout α ∈ Γ(1) induit une permutation γ 7→ γα déterminée par Γ0(N)γα = Γ0(N)γα.

Pour toute fonction f ∈MΓ0(N), considérons le polynôme

Pf (Y ) :=∏γ∈L

(Y − f(γz)) =

|L|∑i=0

ai(z)Y i.

Ses coecients ai(z) sont des polynômes symmétriques en les f(γz), γ ∈ L. On a doncai(αz) = ai(z) pour tout α ∈ Γ(1), i.e. ai(z) ∈MΓ(1) = C(j), et ainsi Pf ∈ C(j)[Y ].

D'un autre côté, considérons le polynôme minimal Qf (Y ) =∑r

j=0 bj(z)Y j de f surC(j) (donc bj ∈ C(j)). Comme bj est invariant par tout α ∈ Γ(1), on voit que les fonctionsf(γz), γ ∈ L, sont aussi des racines de ce polynôme. Ainsi, Qf divise Pf dans C(j)[Y ].

Appliquons ceci à la fonction jN . Remarquons d'abord que les fonctions jN(γz), γ ∈ Lsont deux à deux distinctes. En eet, si j(Nγz) = j(Nγ′z) on sait qu'il existe α ∈ Γ(1) telque Nγz = αNγ′z pour tout z. En prenant z dont le xateur dans Γ(1) est ±1 (i.e. zordinaire), on obtient [N 0

0 1 ]γ = ±α[N 00 1 ]γ′ donc γγ′−1 = [N 0

0 1 ]−1 ± α[N 00 1 ] et en particulier

γγ′−1 ∈ Γ(1)∩ [N 00 1 ]−1Γ(1)[N 0

0 1 ] = Γ0(N), donc γ = γ′. Il s'ensuit que le polynôme minimalQjN de jN sur C(j) est égal au polynôme

PjN (Y ) =∏γ∈L

(Y − jN(γz)) ∈ C(j)[Y ].

Puisque son degré est égal à [MX0(N) : C(j)], on en déduitMX0(N) = C(j, jN).Maintenant, les coecients de PjN (Y ) sont à la fois des fonctions rationnelles en j et

des fonctions holomorphes en z. Mais puisque j : H −→ C est surjective, cela implique queces coecients sont polynomiaux en j (sinon ils auraient des pôles en tant que fonctionsde z). Ainsi PjN (Y ) = fN(j, Y ) pour un unique polynôme fN(X, Y ) ∈ C[X, Y ].

Montrons la symétrie de fN(X, Y ) en X, Y . On remarque qu'en changeant z en −1/Nz,on obtient fN(j(−1/Nz), j(−1/z)) = 0, mais par [ 0 −1

1 0 ] invariance de j, on a j(−1/Nz) =

59

Page 60: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

j(Nz) et j(−1/z) = j(z), donc fN(jN , j) = 0. Comme fN(X, Y ) est irréductible dansC(X)[Y ], cela implique que fN(Y,X) est un multiple de fN(X, Y ) dans C(X)[Y ] et en faitaussi dans C[X, Y ]. Donc fN(Y,X) = C(X, Y )fN(X, Y ), ce qui implique C(X, Y )C(Y,X) =1, puis C(X, Y ) = ±1, mais −1 est impossible car implique fN(X,X) = 0, donc (X −Y )|fN(X, Y ) ce qui contredit l'irréductibilité.

Montrons que fN(X, Y ) ∈ Q[X, Y ]. Écrivons pour cela fN(X, Y ) =∑ci,jX

iY j avecci,j ∈ C et ci,|L| = δi,0 (polynôme minimal, donc monique en Y ). Si dans l'équationfN(j, jN) = 0 on substitue le q-développement de j, qui est à coecients dans Z, onobtient un système d'équations linéaires à coecients dans Z qui détermine les cm,n (parunicité du polynôme minimal). Ce système a une solution dans C donc aussi dans Q. Tousles cm,n sont donc dans Q, et fN(X, Y ) ∈ Q[X, Y ] comme voulu.

Avant de continuer, nous aurons besoin du lemme suivant.

Lemme. Considérons le morphisme d'anneaux

C[X, Y ] −→ C[[q]][q−1][Y ], f(X, Y ) 7→ f(j, Y ),

où j est envoyé sur son q-développement j(z) = q−1 +∑

n∈N cnqn. Si I est un sous-groupe

additif stable par multiplication de C, alors

f(j, Y ) ∈ I[[q]][q−1][Y ]⇒ f(X, Y ) ∈ I[X, Y ].

Démonstration. Ecrivons f(X, Y ) =∑

i ai(X)Y i, puis ai(X) =∑

k aikXk. Le coecient

de q−kY i dans f(j, Y ) appartient à aik + Z[ai,k′ ]k′>k. Supposons que f(X, Y ) /∈ I[X, Y ] etsoit aik /∈ I avec k maximal. Alors le coecient de q−kY i dans f(j, Y ) est dans aik + Idonc n'est pas dans I. Contradiction.

Maintenant, du fait que le q-développement de j est à coecients entiers, on déduit quepour tout γ ∈ L, jN(γz) a un qN -développement à coecients dans Z[e2iπ/N ]. Pour cela,on utilise le lemme 1.3.2 qui nous dit que Γ(1)[N 0

0 1 ]γ contient une (unique) matrice [ a b0 d ]telle que ad = N et b < d. On a alors jN(γz) = j([ a b0 d ]z), et on utilise le q-developpementde j pour constater que le qN -développement de jN(γz) est comme annoncé. Il s'ensuit quefN(j, Y ) ∈ Z[e2iπ/N ][[q]][q−1][Y ] et, par le lemme, que fN(X, Y ) ∈ Z[e2iπ/N ][X, Y ]. Joint aufait que fN(X, Y ) ∈ Q[X, Y ], on en déduit que

fN(X, Y ) ∈ Z[X, Y ].

Finalement, supposons N = p. En se rappelant l'ensemble L(Γ(1)[p 00 1

]Γ(1) de 1.3.2, on

voit que

fN(j, Y ) = (Y − j(pz))

p−1∏m=0

(Y − j(z +m

p)

).

On a vu que le qp développement de j( z+mp

) est dans Z[e2iπ/p]. En fait, tous ces développe-

ments sont congrus modulo l'idéal p = (1−e2iπ/p) de Z[e2iπ/p], et donc en particulier congrus

60

Page 61: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

à celui de jp−1(z) = j(z/p). En d'autres termes, on a dans l'anneau Z[e2iπ/p][[qp]][q−1p ][Y ] la

congruencefN(j, Y ) ≡ (Y − jp) (Y − jp−1)p mod p.

Comme les deux côtés sont dans l'anneau Z[[qp]][q−1p ][Y ], on a aussi la même congruence

modulo p dans ce dernier anneau. Or, on a aussi les congruences jp ≡ jp et (jp−1)p ≡ jmodulo (p) dans l'anneau Z[[qp]][q

−1p ]. On en déduit la congruence fN(j, Y ) ≡ (Y −jp)(Y p−

j) dans l'anneau Z[[qp]][q−1p ][Y ], et puisque ces deux éléments vivent dans Z[[q][q−1][Y ], on

a simplement(fN(j, Y )− (Y − jp)(Y p − j)) ∈ pZ[[q][q−1][Y ].

Il s'agit maintenant d'en déduire que

fN(X, Y )− (Y −Xp)(Y p −X) ∈ pZ[X, Y ].

Mais cela découle du lemme ci-dessus avec I = pZ.

Ceci nous suggère un joli modèle sur Q :

Définition. On dénit la courbe modulaire X0(N)Q sur Q comme la courbe algé-brique complète dont le corps des fonctions rationnelles est

Q(j, jN) := Q(j)[jN ]/((fN(j, jN)).

Avec cette dénition, on retrouve X0(N) comme S.R. associée à la courbe algébriquecomplexe obtenue par extension des scalaires de X0(N)Q de Q à C. On voit aussi que laprojection X0(N) −→ X(1) provient d'un morphisme de variétés X0(N)Q −→ X(1)Q.

2.3.4 L'action de Galois sur Pic0(X0(N))[`m]. Soit X0(N)Q l'extension des scalairesde X0(N)Q à Q. On dénit la notion de diviseur exactement comme dans le cas des S.R.Un diviseur est donc une somme

∑P aP [P ] de points fermés de X0(N)Q. De même on

a la notion de diviseur principal (grâce au fait que les anneaux locaux sont de valuationdiscrète, ce qui permet de dénir ordP (f) pour f fonction rationnelle), puis la notion dePic et Pic0.

On peut associer à toute courbe lisse complète C sur un corps k sa variété Jacobienne,qui est une variété abélienne dont les points à valeurs dans k s'identient à Pic0(Ck). Lesseules conséquences qui nous intéressent de ce fait général, mais dicile, sont les suivantes :

i) on a Pic0(X0(N)Q) ⊂ Pic0(X0(N)),

ii) pour tout entier M , on a Pic0(X0(N)Q)[M ] = Pic0(X0(N))[M ].

Autrement dit, les points de torsion de Pic0, a priori complexes, sont dénis sur Q. Mais,ce que nous avons gagné maintenant, c'est une action de Gal(Q/Q) sur ces points detorsion. En eet, Gal(Q/Q) agit sur les points fermés de X0(N)Q, donc sur les diviseurs,préserve clairement les diviseurs principaux, et donc agit sur Pic0(X0(N)Q). Cette actionest compatible avec la loi de groupe, donc elle stabilise les points de M -torsion.

Il nous faut maintenant vérier que cette action de Galois est compatible avec l'actionde l'anneau de Hecke.

61

Page 62: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

2.3.5 Modèle rationnel des correspondances de Hecke. Rappelons que l'action de T (p)est celle de la double classe Γ0(N)

[1 00 p

]Γ0(N). Géométriquement, on a vu que l'action sur

Pic0(X0(N)) est celle induite par la correspondance

X0(N)πp←− X0(N, p)

π−→ X0(N)

où X0(N, p) = X(Γ0(N) ∩[

1 00 p

]−1Γ0(N)

[1 00 p

]), π est la projection canonique, et πp est la

compositition de la projection canonique avec l'action de[

1 00 p

]qui induit un isomorphisme

X(Γ0(N) ∩[

1 00 p

]−1Γ0(N)

[1 00 p

])∼−→ X(

[1 00 p

]Γ0(N)

[1 00 p

]−1 ∩ Γ0(N)). On sait que le corps

des fonctions de X0(N) est C(j, jN). On en déduit que celui de X([

1 00 p

]−1Γ0(N)

[1 00 p

])

est C(jp−1 , jNp−1) (noter que jp−1 = j[

1 00 p

]0est modulaire pour

[1 00 p

]−1Γ0(N)

[1 00 p

]), puis

par composition des corps, queMX0(N,p) = C(j, jN , jp−1 , jNp−1). On constate alors que, entermes de corps de fonctions, la correspondance précédente est donnée par

C(j, jN)ιp−→ C(j, jN , jp−1 , jNp−1)

ι←− C(j, jN)

où ι est l'inclusion canonique donnée par j 7→ j et jN 7→ jN tandis que ιp est donnée parj 7→ jp−1 et jN 7→ jNp−1 . Mais il est maintenant clair que les mêmes applications induisentun diagramme

Q(j, jN)ιp−→ Q(j, jN , jp−1 , jNp−1)

ι←− Q(j, jN)

qui dénit un modèle sur Q de la correspondance T (p), c'est à dire une correspondancealgébrique

X0(N)Qπp←− X0(N, p)Q

π−→ X0(N)Q

qui redonne la précédente après extension des scalaires et passage aux S.R. Ainsi l'actionde T (p) sur Pic0(X0(N)Q est induite par la même formule π∗ πp,∗ qu'au niveau des S.R.,laquelle commute maintenant clairement à l'action de Gal(Q/Q).

2.4 Relations d'Eichler-Shimura

Pour terminer la construction de la représentation ρf associée à f ∈ S2(Γ0(N)), nousdevons comparer l'action de T (p) à celle d'une substitution de Frobenius σp, au moins pourtous les premiers p en dehors d'un nombre ni. Le théorème que nous avons en vue est lesuivant :

2.4.1 Théorème. Pour p premier ne divisant pas `N , l'action de Gal(Q/Q) sur legroupe Pic0(X0(N)Q)[`m] est non ramiée et pour toute substitution de Frobenius σp en p,on a l'égalité

T (p) = σp + pσ−1p

dans End(Pic0(X0(N)Q)[`m]).

La preuve utilise la réduction modulo p de la courbe modulaireX0(N) et utilise quelquesfaits généraux sur les Jacobiennes.

62

Page 63: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

2.4.2 Courbes sur Fp. Soit C une courbe propre et lisse sur Fp, telle que son extensionCFp soit encore une courbe propre et lisse (la seule chose qui peut manquer est la connexité ;en d'autres termes, on veut que la clôture algébrique de Fp dans Fp(C) soit Fp). Commeprécédemment, on peut considérer Pic0(CFp), qui est muni d'une action de Gal(Fp/Fp),et s'identie aux Fp-points de la variété Jacobienne de C. Nous noterons σp le générateurhabituel x 7→ xp de Gal(Fp/Fp).

On dispose sur le corps Fp(C) de l'endomorphisme de Frobenius F ∗ : f 7→ fp. Celui-ci,par extension des scalaires induit un endomorphisme id⊗F ∗ de l'anneau Fp⊗Fp Fp(C) quis'étend à son corps de fractions Fp(C) et est appelé Frobenius géométrique. Attention, cedernier n'est plus donné par f 7→ fp (le Frobenius absolu), puisqu'il est Fp-linéaire. Nousavons plutôt une factorisation

(id⊗F ∗)(σp ⊗ id) = Frobenius absolu sur Fp(C).

Nous noterons par F : CFp −→ CFp l'endomorphisme de Frobenius géométrique obtenupar dualité corps/courbe. Au niveau des points fermés de CFp , le Frobenius absolu agittrivialement et donc le Frobenius relatif agit comme le générateur σp du groupe de Galois.Concrètement, si C est plongée dans PrFp , on a F ([x0, · · · , xr]) = [xp0, · · · , xpr]. Par contre,bien que F induise une permutation des points fermés, ce n'est pas un automorphisme ; ilest ramié (et même inséparable) de degré p en tout point.

L'endomorphisme F induit, comme tout morphisme de courbes algébriques non constant,deux endomorphismes

F∗ et F∗ ∈ End(Pic0(CFp)).

Par ce qui précède, on peut comparer leur action à celle de Galois :

F∗ = σp et F∗ = pσ−1

p .

2.4.3 Réduction des courbes. Soit C une courbe lisse projective sur Q et p un premier.Un modèle C de C sur le localisé Z(p) est un schéma plat sur Z(p) tel que CQ := C ×Spec(Z(p))

Spec(Q) ' C. On dit que c'est un bon modèle si la réduction CFp := C ×Spec(Z(p)) Spec(Fp)est une courbe lisse. Concrètement, pour trouver un modèle, on peut dénir C dans Pr pardes polynômes homogènes à coecients dans Z(p). La réduction CFp est alors dénie parles même polynômes vus modulo p. Mais trouver un bon modèle est plus dicile. Parfoisil n'en existe pas. On dit que C a bonne réduction s'il en existe un.

Dans ce cas, l'application de réduction Pr(Q) −→ Pr(Fp) (noter qu'on peut chasser lesdénominateurs en coordonnées homogènes) induit une application des Q-points de C surles Fp-points de CFp . Plus généralement, si p est un idéal maximal de Z au-dessus de p,alors la réduction modulo p induit une application

C(Q) −→ CFp(Fp).

Cette application se prolonge par linéarité aux diviseurs. On peut alors montrer les pro-priétés suivantes (toujours sous l'hypothèse de bonne réduction) :

63

Page 64: Cours fondamental de M2 Formes modulaires et leurs ... › ~jean-francois.dat › enseignement › FM › FM.pdfdans . Certains, obtenus à partir d'algèbres de quaternions, jouent

Université Pierre et Marie Curie Master de Mathématiques

i) L'application de réduction mod p induit un épimorphisme Pic0(CQ) −→ Pic0(CFp).

ii) Pour ` 6= p, elle induit un isomorphisme Pic0(CQ)[`m]∼−→ Pic0(CFp)[`

m].

2.4.4 Réduction de la courbe modulaire X0(N)Q. On peut montrer que X0(N) a bonneréduction en tout p - N . Cela semble dicile à voir sur l'équation modulaire fN(X, Y )qu'on a obtenue. On le montre plutôt en utilisant une interprétation modulaire de X0(N)comme paramétrisant des courbes elliptiques munies de sous-groupes d'ordre p. Commenous n'avons pas le temps de discuter cela, on se contentera de remarquer qu'une courbesur Q a toujours bonne réduction en dehors d'un nombre ni de premiers. Soit p un telpremier. Alors le corps des fonctions de la réduction X0(N)Fp peut être déni sur Fp(j) parla même équation fN(X, Y ) réduite modulo p, i.e. Fp(X0(N)Fp) = Fp(j)[Y ]/(fN(j, Y )).

On veut comprendre T (p) en termes de F∗ et F ∗. La correspondance T (p) fait intervenirX0(N, p), qui malheureusement n'a pas bonne réduction en p. Cependant, l'équation fp quilie j(z) et j(p−1z) a une réduction intéressante donnée par le théorème 2.3.3.

FaisonsN = 1 pour simplier la discussion et essayons de comprendre la correspondance

X(1)Fpπp←− X0(1, p)Fp

π−→ X(1)Fp

au moins génériquement, c'est-à-dire sur les anneaux totaux de fractions. D'après le théo-rème 2.3.3 on a dualement

Fp(j) −→ Fp(j)[Y ]/(Y p − j)(Y − jp)←− Fp(j).

ou encoreFp(j) −→ Fp(j)[Y ]/(Y p − j)× Fp(j)/(Y − jp)←− Fp(j).

et nalementFp(j) −→ Fp(j1/p)× Fp(j)←− Fp(j).

Dans ce diagramme la èche de droite envoie j sur (j, j), alors que la èche de gauche envoiej sur (Y, Y ) = (j1/p, jp). Un diagramme similaire pour X0(N) montre que, génériquement,la correspondance est de la forme :

X0(N)Fpid∪F←− X0(N)Fp

⋃X0(N)Fp

F ∪ id−→ X0(N)Fp .

Ici par génériquement, on entend que la situation est vraiment comme décrit (avec uniondisjointe), au-dessus d'un ouvert de X0(N)Fp . Mais la réduction de X0(N, p) en entier estune réunion non-disjointe de deux copies de X0(N)Fp .

Nous admettrons que cette situation générique sut à montrer que la correspondanceT (p) coincide avec (F ∪ id)∗ (id∪F )∗ = F + F ∗, ce qui nit de prouver (ou plutôtd'expliquer) la relation d'Eichler-Shimura.

64