0% ont trouvé ce document utile (0 vote)
72 vues156 pages

MAT452 2019 Cours

Ce document présente une analyse fonctionnelle en mathématiques, abordant des concepts clés tels que la géométrie dans les espaces vectoriels normés, les fonctions continues sur un compact, et le théorème de Baire. Il explore également des sujets avancés comme les algèbres de Banach et la théorie spectrale des opérateurs compacts. L'introduction souligne l'importance des mathématiques comme pont entre théorie et pratique, affirmant que la compréhension de la nature repose sur la maîtrise de son langage mathématique.

Transféré par

Angelo Oppio
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
72 vues156 pages

MAT452 2019 Cours

Ce document présente une analyse fonctionnelle en mathématiques, abordant des concepts clés tels que la géométrie dans les espaces vectoriels normés, les fonctions continues sur un compact, et le théorème de Baire. Il explore également des sujets avancés comme les algèbres de Banach et la théorie spectrale des opérateurs compacts. L'introduction souligne l'importance des mathématiques comme pont entre théorie et pratique, affirmant que la compréhension de la nature repose sur la maîtrise de son langage mathématique.

Transféré par

Angelo Oppio
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ANALYSE FONCTIONNELLE

INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

CHAPITRE I. — GÉOMÉTRIE DANS LES ESPACES VECTORIELS NORMÉS . . . . . . . . . . 1


§ 1. Propriétés générales des ensembles convexes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
§ 2. Enveloppes convexes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
§ 3. Théorème de Helly. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
§ 4. Théorème de Hahn-Banach. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
§ 5. Applications à la dualité des espaces normés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
§ 6. Séparation des ensembles convexes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
§ 7. Points extrémaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

CHAPITRE II. — L’ESPACE DES FONCTIONS CONTINUES SUR UN COMPACT . . .. 25


§ 1. Équicontinuité et convergence dans les espaces d’applications. . . . . . . . . . . . . . 25
§ 2. Théorème d’Ascoli. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
§ 3. Analyse dans l’espace des fonctions holomorphes. . . . . . . . . . . . . . . . . . . . . . . . . . 32
§ 4. Approximation uniforme des fonctions continues sur un compact . . . . . . . . . . 37
§ 5. Théorème d’Urysohn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

CHAPITRE III. — LE THÉORÈME DE BAIRE ET SES APPLICATIONS . . . . . . . . . . . . . . 47


§ 1. Théorème de Baire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
§ 2. Applications à la théorie des fonctions discontinues. . . . . . . . . . . . . . . . . . . . . . . . 50
§ 3. Théorème de Banach-Steinhaus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
§ 4. Application à la non-convergence simple des séries de Fourier . . . . . . . . . . . . 54
§ 5. Application à la non-convergence uniforme de l’interpolation de Lagrange. . 56
§ 6. Théorème de Banach de l’application ouverte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

CHAPITRE IV. — ALGÈBRES DE BANACH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63


§ 1. Notion d’algèbre de Banach. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
§ 2. Étude du groupe des inversibles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
ii SOMMAIRE

§ 3. Spectre d’un élément. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68


§ 4. Formule du rayon spectral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
§ 5. Calcul fonctionnel holomorphe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
§ 6. Théorème de Shilov sur la décomposition des opérateurs . . . . . . . . . . . . . . . . . . 79
§ 7. Fonction exponentielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
§ 8. Transformation de Gelfand. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
§ 9. Théorème de Wiener. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

CHAPITRE V. — THÉORIE SPECTRALE DES OPÉRATEURS COMPACTS . . . . . ..... 97


§ 1. Valeurs spectrales et valeurs propres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
§ 2. Notion d’opérateur compact. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
§ 3. Propriétés spectrales des opérateurs compacts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
§ 4. Alternative de Fredholm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
§ 5. Cas d’un opérateur compact auto-adjoint. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
§ 6. Noyaux de Fredholm itérés et noyau résolvant. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
§ 7. Équation intégrale d’Abel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
§ 8. Équations de Sturm-Liouville. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

I. Appendices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
§ 1. Appendice 1 : sur quelques espaces de suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
§ 2. Appendice 2 : sur le lemme de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
§ 3. Appendice 3 : sur l’espace vectoriel réel sous-jacent à un espace complexe . . 133
Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
INTRODUCTION

L’instrument qui sert d’intermédiaire entre la théorie et la pratique, entre la pensée


et l’observation, est la mathématique ; il construit le pont de liaison et le rend de plus en
plus fort. C’est pourquoi toute notre culture actuelle, dans la mesure où elle est basée sur
la pénétration intellectuelle et l’appropriation de la nature, trouve son fondement dans les
mathématiques.

Déjà, Gallilée disait que la nature ne peut être comprise que par celui qui a appris
à connaître son langage et les signes dans lesquels elle nous parle ; mais cette langue est
la mathématique, et ses signes sont les figures mathématiques. Kant a déclaré : « J’af-
firme que dans chaque science de la nature, il n’y a de science que celle qui contient des
mathématiques. »

En fait, nous ne maîtrisons pas une théorie scientifique avant d’avoir maîtrisé son noyau
mathématique complètement mis à nu. Sans les mathématiques l’astronomie et la physique
d’aujourd’hui sont impossibles ; dans leurs parties théoriques ces sciences se fondent avec
les mathématiques. Ce sont elles, ainsi que de nombreuses autres applications, qui confèrent
aux mathématiques ce qu’elles ont d’aura vis-à-vis du grand public.

Néanmoins, tous les mathématiciens ont refusé de prendre les applications comme
point de repère en mathématiques. Gauss parle de l’attrait magique qui a fait de la théorie
des nombres la science préférée des premiers mathématiciens, sans parler de la richesse
inépuisable par laquelle elle dépasse toutes les autres parties des mathématiques. Kronecker
compare les théoriciens des nombres avec les lotophages qui, une fois qu’ils ont goûté à
leurs délices, ne peuvent plus jamais s’en passer.

Le grand mathématicien Poincaré s’en est pris avec une acuité frappante à Tolstoï, qui
avait déclaré que pratiquer « la science pour la science » était une ineptie. Les réalisations
de l’industrie, par exemple, n’auraient jamais vu le jour si seuls les esprits pratiques avaient
existé et si elles n’avaient pas été développées par des esprits désintéressés.

L’honneur de l’esprit humain, ainsi que l’affirme Jacobi le célèbre mathématicien de


Königsberg, est l’unique objectif de toute science.
iv INTRODUCTION

Nous ne devons pas croire ceux qui prophétisent aujourd’hui, avec une expression
philosophique et un ton supérieur, le crépuscule de la culture et qui acceptent l’ignorabimus.
Pour nous, il n’y a pas d’ignorabimus et, à mon avis, il n’y en a pas non plus dans les sciences
naturelles. Au lieu de cet ignorabimus insensé, que notre notre slogan soit :

Nous devons savoir, nous saurons.

David Hilbert

Allocution (enregistrée) faite le 8 septembre 1930 au congrès de la Gesellschaft der Deut-


schen Naturforscher und Ärzte, à Königsberg (aujourd’hui Kaliningrad). Voir :
https://www.maa.org/press/periodicals/convergence/david-hilberts-radio-address-introduction
INTRODUCTION v

[Version originale]

Das Instrument, welches die Vermittlung bewirkt zwischen Theorie und Praxis, zwi-
schen Denken und Beobachten, ist die Mathematik ; sie baut die verbindende Brücke und
gestaltet sie immer tragfähiger. Daher kommt es, dass unsere ganze gegenwärtige Kul-
tur, soweit sie auf der geistigen Durchdringung und Dienstbarmachung der Natur beruht,
ihre Grundlage in der Mathematik findet. Schon GALILEI sagt : Die Natur kann nur der
verstehen der ihre Sprache und die Zeichen kennengelernt hat, in der sie zu uns redet ;
diese Sprache aber ist die Mathematik, und ihre Zeichen sind die mathematischen Figuren.
KANT tat den Ausspruch : “Ich behaupte, dass in jeder besonderen Naturwissenschaft nur
so viel eigentliche Wissenschaft angetroffen werden kann, als darin Mathematik enthalten
ist.” In der Tat : Wir beherrschen nicht eher eine naturwissenschaftliche Theorie, als bis
wir ihren mathematischen Kern herausgeschält und völlig enthüllt haben. Ohne Mathema-
tik ist die heutige Astronomie und Physik unmöglich ; diese Wissenschaften lösen sich in
ihren theoretischen Teilen geradezu in Mathematik auf. Diese wie die zahlreichen weiteren
Anwendungen sind es, denen die Mathematik ihr Ansehen verdankt, soweit sie solches im
weiteren Publikum geniesst.

Trotzdem haben es alle Mathematiker abgelehnt, die Anwendungen als Wertmesser


für die Mathematik gelten zu lassen. GAUSS spricht von dem zauberischen Reiz, der die
Zahlentheorie zur Lieblingswissenschaft der ersten Mathematiker gemacht habe, ihres uner-
schöpflichen Reichtums nicht zu gedenken, woran sie alle anderen Teile der Mathematik so
weit übertrifft. KRONECKER vergleicht die Zahlentheoretiker mit den Lotophagen, die,
wenn sie einmal von dieser Kost etwas zu sich genommen haben, nie mehr davon lassen
können.

Der grosse Mathematiker POINCARé wendet sich einmal in auffallender Schärfe gegen
TOLSTOI, der erklärt hatte, dass die Forderung “die Wissenschaft der Wissenschaft wegen”
töricht sei. Die Errungenschaften der Industrie zum Beispiel hätten nie das Licht der Welt
erblickt, wenn die Praktiker allein existiert hätten und wenn diese Errungenschaften nicht
von uninteressierten Toren gefördert worden wären.

Die Ehre des menschlichen Geistes, so sagte der berühmte Königsberger Mathematiker
JACOBI, ist der einzige Zweck aller Wissenschaft.

Wir dürfen nicht denen glauben, die heute mit philosophischer Miene und überlegenem
Tone den Kulturuntergang prophezeien und sich in dem Ignorabimus gefallen. Für uns gibt
es kein Ignorabimus, und meiner Meinung nach auch für die Naturwissenschaft überhaupt
nicht. Statt des törichten Ignorabimus heisse im Gegenteil unsere Losung :

Wir müssen wissen, Wir werden wissen.


chapitre premier

Géométrie dans les espaces


vectoriels normés

Dans ce chapitre, la notion centrale est celle d’ensemble convexe ; elle donne prise à
l’intuition géométrique. Après les propriétés générales de ces ensembles, nous étudierons les
relations entre convexité et dimension (théorèmes de Carathéodory, de Helly). L’énoncé le
plus important du chapitre est le théorème de Hahn-Banach ; dans sa version analytique, il
montre la possibilité de prolonger les formes linéaires continues sans augmenter leur norme,
ce qui a des conséquences intéressantes pour la dualité des espaces normés et en théorie
de l’approximation. Dans une version géométrique le théorème de Hahn-Banach conduit
à l’étude de la séparation des ensembles convexes par des hyperplans. Enfin, un théorème
de Krein et Milman permet de reconstituer les ensembles convexes à partir de leurs points
extrémaux.
Il s’agit de résultats relativement récents, dont le début remonte aux années vingt ;
le point culminant de leur histoire reste l’admirable livre du mathématicien polonais Ste-
fan Banach, publié à Varsovie en français en 1932 sous le titre « Théorie des opérateurs
linéaires ».

§ 1. PROPRIÉTÉS GÉNÉRALES DES ENSEMBLES CONVEXES

Soit E un espace vectoriel sur R et soit A une partie de E.

Définition 1. — On dit que A est convexe si, chaque fois que A contient deux point x
et y, elle contient le segment [x; y] ; autrement dit, si les hypothèses x, y ∈ A et λ réel avec
0 6 λ 6 1, impliquent la conclusion : λx + (1 − λ)y ∈ A.

Cette définition s’améliore aussitôt en une propriété plus forte :


TS I.2 PROPRIÉTÉS GÉNÉRALES DES ENSEMBLES CONVEXES § 1

Proposition 1. — Soit A convexe. Alors les hypothèses x1 , . . . xp ∈ A, λ1 , . . . λp ∈ R,


λ1 > 0, . . . λp > 0 et λ1 + . . . λp = 1 impliquent la conclusion
λ1 x1 + . . . λp xp ∈ A.
Autrement dit, un ensemble convexe contient tous les barycentres à coefficients positifs
de ses sous-ensembles de points. La démonstration est facile, par récurrence sur p ; essayez
de l’écrire avant de lire ce qui suit !

Preuve. On fait une récurrence sur p. Si p = 2, la proposition n’est autre que la


définition de la convexité de A. Soit p > 2, et supposons la proposition vraie pour moins
de p points. Si l’un des λi était nul, on pourrait supprimer xi et l’on n’aurait affaire qu’à
1 − λ1
moins de p points ; on peut donc supposer tous les λi > 0. Puisque = 1, on a :
λ2 + . . . λp
1 − λ1
λ 1 x1 + λ 2 x2 + · · · + λ p xp = λ 1 x1 + (λ2 x2 + · · · + λp xp )
λ2 + . . . λp
λ2
 λp 
= λ1 x1 + (1 − λ1 ) x2 + · · · + xp .
λ2 + . . . λp λ2 + . . . λp
Par l’hyptohèse de récurrence, nous avons entre crochets un point, disons y, de A, donc
λ1 x1 + λ2 x2 + · · · + λp xp = λ1 x1 + (1 − λ1 )y
est dans A, par définition de la convexité. 

Si E est normé, toute partie convexe A de E est connexe, et même connexe par arcs
puisque deux points peuvent toujours être joints par un segment contenu dans A. En
particulier, les parties convexes de R sont les intervalles (de tout genre).
Dans E normé, toute boule ouverte
B = {x ∈ E : kx − ak < r}
où a ∈ E, r réel > 0, est convexe, car si kx − ak < r, ky − ak < r et 0 6 λ 6 1, on a :
kλx + (1 − λ)y − ak = kλ(x − a) + (1 − λ)(y − a)k
6 λk(x − a)k + (1 − λ)k(y − a)k < λr + (1 − λ)r = r.
De même, toute boule fermée est convexe.

Tout sous-espace vectoriel V de E est convexe, ainsi que, plus généralement, tout
sous-espace affine
V + a = {x = y + a : y ∈ V},
où V est un sous-espace vectoriel de E et a est un vecteur donné de E.

Sont aussi convexes les demi-espaces affines ouverts (resp. fermés)


{x ∈ E : f (x) > α (resp. > α)},
où α ∈ R, et f une forme linéaire sur E non nulle, sont donnés, car par exemple si f (x) > α,
f (x) > α et 0 6 λ 6 1, on a :
f (λx + (1 − λ)y) = λf (x) + (1 − λ)f (y) > λα + (1 − λ)α = α.
§ 1 PROPRIÉTÉS GÉNÉRALES DES ENSEMBLES CONVEXES TS I.3

À partir d’exemples connus comme convexes, on en fabrique d’autres grâce à l’une ou


l’autre des propriétés de permanence énoncées dans la
Proposition 2. — 1◦ L’intersection, le produit cartésien l’image directe ou réci-
proque par application linéaire affine, et (si E est normé) la fermeture, l’intérieur de parties
convexes sont encore convexes.
2◦ Si A et B sont des parties convexes dans E et si µ et ν sont des nombres réels,
l’ensemble
µA + νB = {µa + νb : a ∈ A, b ∈ B}
est convexe dans E ; en particulier A + B et A − B sont convexes.
Les démonstrations sont faciles, sauf peut-être celle qui concerne l’intérieur. Essayez
de les écrire avant de lire ce qui suit !

Preuve. Intersections. Il est évident sur la définition que, si (Aλ )λ∈Λ est une famille
T
finie ou infinie d’ensembles convexes dans E, alors l’ensemble λ∈Λ Aλ est convexe. Par
exemple, dans E normé, toute intersection de demi-espaces fermés est un convexe fermé.
Nous verrons plus tard que la réciproque est vraie : tout convexe fermé est l’intersection
des demi-espaces fermés qui le contiennent.
Exercice 1. — Convainquez-vous d’ores et déjà que cet énoncé est vrai dans le cas d’un
disque fermé du plan euclidien.
Produits cartésiens. Si E1 et E2 sont deux espaces vectoriels sur R, et si A1 et A2 en
sont des parties convexes respectives, alors l’ensemble
A = A1 × A2 = {(x1 , x2 ) : x1 ∈ A1 , x2 ∈ A2 }
est convexe dans E1 × E2 , car si (x1 , x2 ) et (y1 , y2 ) sont dans A et si on a 0 6 λ 6 1, alors
λ(x1 , x2 ) + (1 − λ)(y1 , y2 ) = (λx1 + (1 − λ)x2 , λy1 + (1 − λ)y2 )
est encore dans A1 × A2 = A. Cet énoncé s’étend immédiatement aux produits cartésiens
de n > 2 ensembles convexes. Par exemple dans Rn tout pavé (i.e. tout produit cartésien
d’intervalles) est convexe.

Application linéaire affine. Rappelons qu’on appelle application linéaire affine de E


dans F toute application
x 7→ ψ(x) = ϕ(x) + b,
où ϕ est une application linéaire de E dans F et b est un vecteur fixé dans F. On vérifie
aisément que l’image par ψ de tout segment [x; y] dans E est le segment [ψ(x); ψ(y)] dans
F. En effet, pour 0 6 λ 6 1, on a :
λψ(x) + (1 − λ)ψ(y) = λ[ϕ(x) + b] + (1 − λ)[ϕ(y) + b] = λϕ(x) + (1 − λ)ϕ(y) + b
= ϕ (λx + (1 − λ)y) + b = ψ (λx + (1 − λ)y) .
De ce fait, il résulte aussitôt que, si A est convexe dans E, alors ψ(A) est convexe dans F.
Enfin, soit B convexe dans F ; si x ∈ ψ −1 (B) et y ∈ ψ −1 (B), on a : ψ([x; y]) = [ψ(x); ψ(y)] ⊂
B, donc [x; y] ⊂ ψ −1 (B), ce qui prouve que l’ensemble ψ −1 (B) est convexe.
TS I.4 PROPRIÉTÉS GÉNÉRALES DES ENSEMBLES CONVEXES § 1

En particulier, l’image d’un convexe par une homothétie ou une translation est un
convexe.
Le second point de la proposition est une conséquence de ce que nous venons de dire,
car µA + νB est l’image de A × B par l’application linéaire (x, y) 7→ λx + µy de E × E dans
E.

Fermeture. Soit A un convexe dans E et notons A sa fermeture dans E. Si x ∈ A, y ∈ A


et 0 6 λ 6 1, il existe une suite (xk )k∈N (resp. (yk )k∈N ) dans A telle que lim xk = x
k→∞
(resp. lim yk = y). Alors :
k→∞

λx + (1 − λ)y = λ lim xk + (1 − λ) lim yk = lim (λxk + (1 − λ)yk )


k→∞ k→∞ k→∞

est limite d’éléments de A, donc appartient à A. Ainsi A est convexe.

Intérieur. Notons A◦ l’intérieur de la partie convexe A : c’est l’ensemble des centres


des boules ouvertes contenues dans A. Soient x ∈ A◦ et y ∈ A◦ . On se donne un point
m ∈]x; y[. Puisque x est dans A◦ , il est le centre d’une boule ouverte Bx contenue dans
A. L’homothétie de centre y qui transforme x en m, transforme la boule ouverte Bx en
une boule ouverte Bm centrée en m, et contenue dans A car, par raison d’homothétie, tout
point de Bm est sur un segment [y; z] où z ∈ Bx et donc z ∈ A. Ainsi m ∈ A◦ . 

Remarquons que dans cette démonstration, seule l’hypothèse y ∈ A (et non y ∈ A◦ )


a servi pour obtenir m ∈ A◦ . On a en fait prouvé le résultat plus fort :

Proposition 3. — Soit A une partie convexe d’un espace vectoriel normé. Soient x ∈ A◦
et y ∈ A. Alors tout point m ∈ [x; y[ est dans A◦ . 

Exercice 2. — 1◦ Améliorer la proposition précédente en supposant seulement y ∈ A.


2 Soit A convexe avec A◦ 6= ∅. Montrer que A = A◦ et A◦ = (A)◦ .

Exercice 3. — Soit A un sous-ensemble convexe compact de Rn tel que le point 0 soit


dans l’intérieur de A. Soit la sphère unité S = {x ∈ Rn : kxk = 1}.
1◦ Montrer que, pour tout y ∈ S, la demi-droite d’origine 0 passant par y coupe la
frontière Fr(A) = A A◦ de A en un point, disons δ(y), et un seul.
2◦ Montrer que l’application y 7→ δ(y) est une application continue de S sur Fr(A).

Exercice 4. — Un convexe de Rn est dit de dimension d si le plus petit sous-espace affine


le contenant est de dimension d, i.e. est le translaté d’un sous-espace vectoriel de dimension
d.
1◦ Prouver qu’une partie convexe A est de dimension n si et seulement si son intérieur
A◦ est non vide.
2◦ Déduire de l’exercice 3 que tout convexe compact de dimension d de Rn est
homéomorphe à la boule-unité fermé de Rd .
§ 2 ENVELOPPES CONVEXES TS I.5

§ 2. ENVELOPPES CONVEXES

Soit E un espace vectoriel sur R, et soit A une partie de E.


Définition 1. — Il y a au moins une partie convexe de E qui contient A, à savoir E lui-
même. Donc il y a une plus petite partie convexe de E qui contient A, à savoir l’intersection
de toutes les parties convexes de E qui contiennent A. On la nomme l’ enveloppe convexe de
A, et on la note conv(A).
Ainsi définie « de l’extérieur », on peut aussi la définir « de l’intérieur » :
Proposition 1. — La partie conv(A) n’est autre que l’ensemble des combinaisons linéaires
convexes des points de A ; autrement dit :
Xp p
X
conv(A) = { λi xi : xi ∈ A, λi ∈ R+ , λi = 1, p entier quelconque}.
i=1 i=1

Preuve. Notons provisoirement A b l’ensemble décrit dans l’énoncé. Déjà A b est contenu
dans tout ensemble convexe contenant A, ce qui implique que A b ⊂ conv(A). Pour l’inclusion
réciproque, il suffit de voir que A est convexe. On se donne donc x = i λi xi et y = j λ0j yj
b P P

dans A,
b ainsi que µ tel que 0 < µ < 1. On a :
X X X X
µx + (1 − µ)y = µ λi xi + (1 − µ) λ0j yj = (λi µ)xi + λ0j (1 − µ)yj ,
i j i j

avec xi ∈ A, yj ∈ A, λi µ > 0, λ0j (1 − µ) > 0 et :


X X X X
(λi µ) + λ0j (1 − µ) = µ λi + (1 − µ) λj = µ + (1 − µ) = 1,
i j i j

donc µx + (1 − µ)y est dans A,


b et finalement A
b est convexe. 
Exercice 1. — Soit P(z) un polynôme à coefficients complexes et soit P0 (z) son polynôme
dérivé. Montrer que dans C ' R2 toute racine de P0 est dans l’enveloppe convexe de
l’ensemble des racines de P.
Supposons maintenant E normé. Soit A une partie de E.
Définition 2. — Il y au moins une partie convexe fermée de E qui contient A, à savoir E
lui-même. Donc il y a une plus petite partie convexe fermée de E qui contient A, à savoir
l’intersection de toutes les parties convexes fermées de E qui contiennent A. On la nomme
l’ enveloppe convexe fermée de A.

Proposition 2. — L’enveloppe convexe fermée de A est l’adhérence dans E de l’enveloppe


convexe de A.
Preuve. Cette adhérence est fermée (par définition), convexe (par la proposition 2),
et elle contient A. Si B est un fermé convexe qui contient A, alors B contient conv(A), et
donc conv(A) puisque B est fermé. 

Sans ambiguïté, nous pourrons donc noter conv(A) l’enveloppe convexe fermée de A.
Exercice 2. — Soit A une partie de E espace vectoriel réel et normé.
TS I.6 ENVELOPPES CONVEXES § 2

1◦ Si A est fermée, est-il toujours vrai que conv(A) soit fermée ?


2◦ Si A est ouverte, est-il toujours vrai que conv(A) soit ouverte ?
Si E est de dimension finie, disons n, on peut considérablement améliorer la proposition
1, en y remplaçant « p quelconque » par « p 6 n+1 ». C’est le théorème de Caratheodory :
Théorème 1 (Caratheodory). — Soit A une partie de Rn . Alors
Xp p
X
conv(A) = { λi xi : xi ∈ A, λi ∈ R+ , λi = 1, p 6 n + 1}.
i=1 i=1

Preuve. Soit x un point fixé dans conv(A). Il s’écrit de plusieurs façons x = pi=1 λi xi
P

avec xi ∈ A, λi ∈ R+ , pi=1 λi = 1 et p entier quelconque. On choisit une telle écriture


P

avec p minimal, et on suppose que p > n + 2 afin d’aboutir à une contradiction.

Les vecteurs x1 − x, x2 − x, . . . xp−1 − x sont en nombre p − 1 > n + 1 donc sont


linéairement dépendants : il existe des constantes réelles non toutes nulles µ1 , µ2 , . . . µp−1
telles que
µ1 (x1 − x) + µ2 (x2 − x) + · · · + µp−1 (xp−1 − x) = 0.
Posons µp = 0. Pour tout nombre réel t, on a :
p
X
(λi + tµi )(xi − x) = 0,
i=1

car le premier membre n’est autre que


p p−1
!
X  X
λi xi − x + t · µi (xi − x) = 0 + t · 0 = 0.
i=1 i=1

Lemme 1. — On peut choisir une valeur t0 de t de telle sorte que

λi + t0 µi > 0 pour tout i ∈ {1; 2; . . . p} ;


λk + t0 µk = 0 pour un indice k au moins dans {1; 2; . . . p}.
Si on admet le lemme, la démonstration s’achève comme suit. Pour un tel choix de t0 , on
aurait puisque µp = 0 :
X p
(λi + t0 µi ) > λp > 0
i=1
p
X
puis, d’après (λi + tµi )(xi − x) = 0 :
i=1
p
X λ i + t 0 µi
x= Pp xi ,
i=1,i6=k i=1 (λi + t0 µi )

ce qui fournirait pour x une écriture de longueur < p, contredisant la minimalité de p.

Il reste à prouver le lemme. Comme les λi sont tous > 0 par minimalité de p, on peut
supprimer les indices i tels que µi = 0, et donc supposer tous les µi 6= 0. On veut choisir
§ 2 ENVELOPPES CONVEXES TS I.7

t = − µλkk pour un indice k au moins, tel que de plus


λi λi
t > − si µi > 0 et t 6 − si µi < 0.
µi µi
Pour cela, il suffit de choisir pour k l’indice (ou l’un des indices) i tel que | µλii | soit minimal.


Ce qui est profond dans le théorème de Carathéodory, c’est que l’on passe d’un nombre
de termes p indéterminé, arbitrairement grand, à une taille de combinaison convexe uni-
formément bornée. Ce principe de finitude permet d’obtenir le
Corollaire 1. — Dans un espace vectoriel normé de dimension finie, l’enveloppe convexe
de toute partie compacte est compacte.
Preuve. Soit A un compact de Rn . Dans Rn+1 , l’ensemble
n+1
X
Λ = {(λ1 , λ2 , . . . λn+1 ) ∈ Rn+1 : λi > 0, λi = 1}
i=1
est compact, car fermé et borné (Borel-Lebesgue). Or d’après le théorème de Carathéodory,
conv(A) est l’image du compact Λ × An+1 par l’application continue
n+1
X
(λ1 , λ2 , . . . λn+1 , x1 , x2 , . . . xn+1 ) 7→ λ i xi
i=1

de Rn+1 × Rn+1 dans Rn+1 . Donc conv(A) est compacte. 

On remarquera que le corollaire traite de l’enveloppe convexe de A et non pas de


l’enveloppe convexe fermée. Le résultat n’est pas valabe en dimension infinie, comme le
montre l’exercice qui suit.
Exercice 3. — Dans l’espace de suites `∞ (N), l’ensemble { enn }n>1 ∪ {0} est compact mais
son enveloppe convexe n’est pas fermée.
Cependant, en dimension infinie subsiste le résultat moins fort que voici.
Théorème 2. — Dans un espace de Banach, l’enveloppe convexe fermée de toute partie
compacte est compacte.
Preuve. Notons E l’espace de Banach ambiant. Dans cette démonstration, la notation
B(a, ε) désigne la boule de centre a et de rayon ε. Par ailleurs, par l’inégalité triangulaire,
on a la formule :
ε ε
B(a, ε) = B(a, ) + B(0, ).
2 2

Soit A un compact dans E. On sait déjà que conv(A) est fermée, donc ici complète
puisque E l’est par hypothèse. Il suffit donc de voir que conv(A) est précompacte, i.e.
qu’elle satisfait à la condition du ε-recouvrement (pour ε > 0 arbitrairement petit), qui est
que : pour tout ε > 0, la partie conv(A) admet un recouvrement par une collection finie
de boules de rayon ε. Or, puisque A est compact, il existe une collection finie de boules
ε ε
Bi = B(bi , ) = {bi } + B(0, )
2 2
TS I.8 ENVELOPPES CONVEXES § 2

avec 1 6 i 6 N, telle que A ⊂ B1 ∪ B2 ∪ · · · ∪ BN . On note C l’ensemble


conv({b1 ; b2 ; . . . bN }) : il est compact d’après le corollaire précédent appliqué dans l’espace
réel de dimension finie engendré par les bi . Ainsi, il existe a1 , a2 , . . . am ∈ E tels que
m
[ ε
C⊂ B(ai , ).
2
i=1

Finalement, on obtient la chaîne d’inclusions suivante :


!
[  ε 
conv(A) ⊂ conv Bi = conv {b1 ; b2 ; . . . bN } + B(0, )
2
i
m m
ε [ ε  ε [
= C + B(0, ) ⊂ B(ai , ) + B(0, ) = B(ai , ε),
2 2 2
i=1 i=1
qui permet de conclure en passant à l’adhérence. 

§ 3. THÉORÈME DE HELLY

Les rapports de la notion de convexité avec celle de dimension, quand elle est finie,
apparaissent déjà dans le théorème de Carathéodory : la dimension de E est le plus petit
entier n tel qu’on est assuré d’obtenir, par combinaisons linéaires convexes de n+1 éléments
de A, l’enveloppe convexe de toute partie A de E. Voici une autre manière de caractériser
la dimension par la convexité.
Théorème 1 (Helly). — Dans Rn soient r > n + 1 ensembles convexes A1 , A2 , . . . Ar .
On suppose que, chaque fois qu’on choisit n + 1 de ces ensembles, leur intersection est non
vide. Alors A1 ∩ A2 ∩ . . . Ar 6= ∅.
Songer au cas où n = 2 et où r vaut un milliard !

Remarquons qu’on ne peut abaisser n + 1 en n dans l’énoncé : dans R2 prenons les


r = 3 ensembles convexes que sont les côtés d’un triangle ; deux à deux ils ont des points
en commun mais leur intersection globale est vide.

Remarquons aussi que l’hypothèse de convexité sur les Ai est nécessaire également
(prendre n = 1, A1 = {0; 1}, A1 = {1; 2} et A1 = {0; 2}).

Preuve. La démonstration se fait par récurrence sur r. Si r = n + 1, la conclusion


coïncide avec l’hypothèse. Supposons désormais que r > n + 2, et que le théorème vrai
pour les familles de r − 1 de parties convexes. Par hypothèse de récurrence, pour tout
i = 1, 2, . . . r l’ensemble rj=1,j6=i Aj est non vide ; soit xi ∈ rj=1,j6=i Aj . Considérons le
T T

système linéaire homogène en les inconnues réelles λ1 , λ2 , . . . λr :

λ1 x1 + λ2 x2 + . . . λr xr = 0
λ1 + λ2 + . . . λr = 0
§ 3 THÉORÈME DE HELLY TS I.9

c’est-à-dire, scalairement, et en posant xi = (xi1 , xi2 , . . . , xin ), le système de n+1 équations


à r inconnues :

x11 λ1 + x21 λ2 + . . . xr1 λr = 0


x12 λ1 + x22 λ2 + . . . xr2 λr = 0
...
x1r λ1 + x2r λ2 + . . . xrr λr = 0
λ1 + λ2 + . . . λr = 0

Il y a n + 1 équations pour r > n + 2 inconnues, donc le théorème de Cramer


assure qu’il existe des λi non tous nuls qui sont solutions du système ci-dessus. Renumé-
rotons ces solutions de sorte que pour un indice p les λi avec i 6 p soient > 0 et que
λp+1 , λp+2 , . . . λr < 0. Aucun des deux groupes de λi n’est vide car la somme de tous les
λi vaut 0 (dernière équation du système). En outre les λi avec i 6 p sont non tous nuls.

Le système se réécrit alors


p
X r
X
λ i xi = (−λj )xj
i=1 j=p+1
p
X r
X
λi = (−λj )
i=1 j=p+1

On définit alors un vecteur par combinaison linéaire de deux façons :


Pp Pr
i=1 λi xi j=p+1 (−λj )xj
x = Pp = Pr .
i=1 λi j=p+1 (−λj )
Par sa première écriture, on voit que x appartient à chaque Aj pour j > p ; et par la seconde
écriture, on voit que x appartient à chaque Ai pour i 6 p. Ceci achève la démonstration.


Le théorème de Helly admet une formulation topologique. Rappelons que si F est une
famille (finie ou infinie) de parties compactes dans un espace métrique, telle que l’inter-
section de toute sous-famille finie soit non vide, alors l’intersection de la famille F tout
entière est non vide. On améliore beaucoup cet énoncé si l’on suppose de plus que les
parties compactes sont convexes. Le théorème de Helly fournit alors aussitôt le
Corollaire 1. — Soit F une famille finie ou infinie de parties convexes et compactes
de Rn . Pour que l’intersection de toutes les parties de F soit non vide, il suffit que l’in-
tersection de toute sous-famille de n + 1 parties soit non vide.
Exercice 1. — Dans le plan, soit une famille de segments parallèles deux à deux non alignés
(supports deux à deux distincts) et admettant trois à trois une droite sécante commune.
Alors la famille tout entière admet une droite sécante commune. Indication : on commencera
par le cas d’une famille finie ; en prenant des axes tels que (Oy) soit parallèle aux segments
donnés, pour tout segment S de la famille, soit AS l’ensemble des (α, β) ∈ R2 tels que la
droite {y = αx + β} coupe S. Dans le plan auxiliaire des (α, β) représenter graphiquement
AS et appliquer à la famille des AS le théorème de Helly.
TS I.10 THÉORÈME DE HELLY § 3

Exercice 2. — Dans Rn , soit A un ensemble convexe compact et d’intérieur A◦ non vide.


1◦ Montrer qu’il existe au moins un point z ∈ A◦ tel que toute « corde » [u; v] de A
passant par z vérifie l’inégalité
1 uz
6 6 n.
n zv
Indication : remarquer que, si de tels z existent, ce sont les points d’intersection des homo-
n
thétiques Au de A par les homothéties de rapport n+1 et de centre u quand le paramètre
1 n
u parcourt la frontière de A ; prouver que Au = n+1 u + n+1 A, et appliquer aux Au le
corollaire du théorème de Helly.
2◦ Soit A un simplexe de Rn , i.e. l’enveloppe convexe de {0; x1 ; x2 ; . . . xn } où les
xi forment une base de Rn . Montrer qu’alors z est unique et qu’il est l’isobarycentre des
sommets de A, et que dans ce cas les bornes n et n1 de la double inégalité sont atteintes
(on traitera d’abord à la main le cas n = 2).

§ 4. THÉORÈME DE HAHN-BANACH

Soit E un espace vectoriel sur R.


Définition 1. — Une jauge sur E est une fonction p définie dans E, à valeurs réelles,
telle que pour tous x, y ∈ E et λ ∈ R > 0 , on ait :
p(λx) = λp(x) et p(x + x) 6 p(x) + p(y).
On dit que p est une fonction positivement homogène et sous-additive, respectivement.

Les formes linéaires et les normes sur E sont des exemples de jauge, mais voici des cas
plus intéressants.
Proposition 1. — Soit E un espace normé sur R, et soit A un ensemble ouvert convexe
dans E, contenant l’origine 0. Pour tout x ∈ E, on pose :
x
pA (x) = inf{t > 0 : ∈ A}.
t
Alors :
(i) le point x est dans A si et seulement si pA (x) < 1 ;
(ii) l’application pA est une jauge.
Ceci mérite bien un peu de terminologie.
Définition 2. — On appelle pA la jauge de la partie convexe A.

Preuve. Prouvons (i). Soit x ∈ A. Si x est l’origine, on a pA (x) = 0 < 1 ; supposons


désormais que x 6= 0. L’intersection de A avec la demi-droite ouverte issue de 0 passant
par x est un intervalle ouvert contenant x, donc il existe t ∈]0; 1[ tel que xt ∈ A et par
suite pA (x) < 1. Réciproquement, soit x ∈ E tel que pA (x) < 1. Par définition de la borne
inférieure, il existe t0 < 1 tel que tx0 ∈ A ; par convexité, le segment [0; tx0 ] est contenu dans
A. Comme x appartient à ce segment (puisque t0 < 1), on a x ∈ A.
§ 4 THÉORÈME DE HAHN-BANACH TS I.11

Prouvons (ii). Soient x ∈ E et λ > 0. On a, en posant t


λ = t0 :
λx x
pA (λx) = inf{t > 0 : ∈ A} = inf{t > 0 : ∈ A}
t (t/λ)
x x
= inf{λt0 : t0 > 0, 0 ∈ A} = λ inf{t0 > 0 : 0 ∈ A} = λpA (x),
t t
ce qui prouve l’homogénéité positive de pA .

Soient x, y ∈ E et ε > 0. Par définition de la borne inférieure, il existe t > 0 tel que
x
t ∈ A et t 6 pA (x) + ε, et il existe s > 0 tel que ys ∈ A et s 6 pA (y) + ε. Par convexité
de A, on a :
1 t x + s ys
(x + y) = t
s+t s+t
est dans A, et s + t > 0 donc :
pA (x + y) 6 t + s 6 pA (x) + pA (y) + 2ε,
d’où, vu que ε est arbitrairement petit, l’inégalité :
pA (x + y) 6 pA (x) + pA (y),
qui est la sous-additivité recherchée. 
Exercice 1. — Prouver que la jauge pA est une fonction uniformément continue dans E.
La démonstration du théorème de Hahn-Banach repose sur une récurrence transfinie,
dont nous commençons par extraire l’analogue du passage de n à n + 1 dans une récurrence
ordinaire, en énonçant le
Lemme 1. — Soit V1 un espace vectoriel réel. Soit V0 un sous-espace vectoriel de codimen-
sion 1 dans V1 , ce qui signifie qu’il existe x1 ∈ V1 tel que V1 = V0 ⊕ Rx1 . Soit p une jauge
sur V1 . Soit f0 une forme linéaire sur V0 telle que pour tout x ∈ V0 on a : f0 (x) 6 p(x).
Alors il existe une forme linéaire f1 sur V1 telle que :
(i) la forme linéaire f1 prolonge f0 , i.e. f1 (x) = f0 (x) pour tout x ∈ V0 ;
(ii) pour tout x ∈ V1 , on a : f1 (x) 6 p(x).
Réflexion préliminaire : il est très facile de prolonger f0 en une forme linéaire f1 sur
V1 ; il suffit de choisir une constante réelle α et de poser, pour tout λ ∈ R et tout y ∈ V0 :
f1 (y + λx1 ) = f0 (y) + λα.
La subtilité est de choisir la constante α pour conserver le contrôle de la forme par la jauge.

Preuve. Quels que soient y ∈ V0 et z ∈ V0 , on a :


f0 (z) + f0 (y) = f0 (z + y) 6 p(z + y) 6 p(z + x1 ) + p(y − x1 ),
donc
f0 (y) − p(y − x1 ) 6 −f0 (z) + p(z + x1 )
pour y et z arbitraires dans V0 ; par conséquent
sup (f0 (y) − p(y − x1 )) 6 inf (p(z + x1 ) + p(y − x1 )) .
y∈V0 z∈V0
TS I.12 THÉORÈME DE HAHN-BANACH § 4

Il y a donc des nombres réels entre les bornes supérieure et inférieure ci-dessus ; autrement
dit, il existe α ∈ R tel que

pour tout y ∈ V0 , on a : f0 (y) − α 6 p(y − x1 ) ;


pour tout y ∈ V0 , on a : f0 (y) + α 6 p(y + x1 ).

Pour tout y + λx1 ∈ V1 , où y ∈ V0 et λ ∈ R, décidons de poser :


f1 (y + λx1 ) = f0 (x) + λα,
définition non ambigüe puisqu’il y a une seule manière d’écrire un élément de V1 sous la
forme y + λx1 .

Il est clair que f1 est linéaire sur V1 et que la restriction de f1 à V0 est f0 . Il reste à
voir que, pour λ 6= 0, on a f1 (y + λx1 ) 6 p(y + λx1 ). Distinguons deux cas :

si λ > 0, on applique la seconde inégalité satisfaite par α avec λy au lieu de y, pour


obtenir :
 y  y 
f1 (y + λx1 ) = f0 (y) + λα = λ f ( ) + α 6 λp + x1 = p(y + λx1 );
λ λ
y
si λ < 0, on applique la première inégalité satisfaite par α avec −λ au lieu de y, pour
obtenir :
   
y y
f1 (y + λx1 ) = f0 (y) + λα = −λ f ( ) − α 6 (−λ)p − x1 = p(y + λx1 ).
−λ −λ

Ceci prouve la majoration cherchée de la forme linéaire prolongée par la jauge imposée. 
Théorème 1 (Hahn-Banach, version 1). — Soit E un espace vectoriel sur R et soit p une
jauge sur E. Soit V0 un sous-espace vectoriel de E et soit f0 une forme linéaire sur V0
telle que pour tout x ∈ V0 on ait : f0 (x) 6 p(x). Alors il existe une forme linéaire F sur
E telle que
(i) la forme linéaire F prolonge f0 , i.e. F(x) = f0 (x) pour tout x ∈ V0 ;
(ii) pour tout x ∈ E, on a : F(x) 6 p(x).
Commençons par indiquer une démonstration dans un cas particulier instructif : sup-
posons en effet qu’il existe une suite, finie ou infinie, de vecteurs v1 , v2 , . . . vn , . . . dans E
telle qu’en posant Vn = Vn−1 + Rvn pour tout n > 1, le vecteur vn ne soit pas dans Vn−1
S
(et donc que Vn = Vn−1 ⊕ Rvn ) et qu’on ait E = n Vn . Par récurrence (ordinaire) sur n,
en appliquant le lemme précédent, on obtient pour tout n une forme linéaire fn sur Vn telle
que la restriction de fn à Vn−1 soit fn−1 et telle que pour tout x ∈ Vn on ait fn (x) 6 p(x).
En particulier, fn |V0 = f0 . Pour x fixé dans E, posons F(x) = fn (x) dès lors que x ∈ Vn ;
cette définition ne dépend pas du n en question car si m 6 n et si x ∈ Vm ⊂ Vn , on a
fm (x) = fn (x). En outre il est clair que F est une forme linéaire sur E, qu’elle prolonge f0
et qu’elle est dominée par la jauge p.

Preuve. Dans le cas général, la démonstration du théorème de Hahn-Banach se fait


par récurrence transfinie, c’est-à-dire s’appuie sur l’axiome de Zorn (voir l’appendice 2).
Soit Λ l’ensemble des couples (V, f ) où V est un sous-espace vectoriel de E contenant V0
§ 4 THÉORÈME DE HAHN-BANACH TS I.13

et f est une forme linéaire sur V prolongeant f0 et telle que f (x) 6 p(x) pour tout x ∈ V.
On définit sur Λ une relation d’ordre en posant (V, f ) 4 (V0 , f 0 ) si, et seulement si, on a :
V0 ⊃ V et f 0 |V = f.
L’ensemble Λ est non vide car il contient (V0 , f0 ). Dans Λ une famille non vide et totalement
ordonnée pour 4, disons T , est une famille (Vi , fi )i∈I non vide d’éléments de Λ telle que
si i 6= j sont dans I, ou bien (Vi , fi ) 4 (Vj , fj ) ou bien (Vj , fj ) 4 (Vi , fi ). Pour un telle
famille T , posons VT = i Vi : c’est un sous-espace vectoriel de E qui contient V0 , et pour
S

x ∈ VT posons fT (x) = fi (x) pour un indice i ∈ I (disponible) choisi de telle sorte que
x ∈ Vi ; cette définition est indépendante du choix de i en question. Alors fT est une forme
linéaire sur VT , elle prolonge f0 et est majorée par p sur VT . Autrement dit, on vient
de vérifier que (VT , fT ) appartient à Λ ; en fait, dans l’ensemble partiellement ordonné
(Λ, 4) l’élément (VT , fT ) est une borne supérieure de l’ensemble totalement ordonné T .

Le paragraphe précédent justifie que l’on peut appliquer le lemme de Zorn dans (Λ, 4)
afin d’obtenir un élément maximal, disons (W, F), et il reste à voir que W = E. Sinon,
par l’absurde il existerait dans E un vecteur v 6∈ W et le lemme précédent assurerait
l’existence, dans W0 = W ⊕ Rv, d’une forme linéaire F0 prolongeant F, donc f0 et telle que
F0 (x) 6 p(x) pour tout x ∈ W0 . Ainsi on aurait (W, F) 4 (W0 , F0 ) avec (W, F) 6= (W0 , F0 ),
ce qui contredirait la maximalité de (W, F). 
Corollaire 1. — Soit E un espace vectoriel sur R et soit p une jauge non nulle sur E.
Alors il existe sur E une forme linéaire non nulle F sur E telle que F(x) 6 p(x) pour tout
x ∈ E.
Preuve. Choisissons x0 ∈ E tel que p(x0 ) 6= 0, posons V0 = Rx0 et définissons f0 sur
V0 par f0 (λx0 ) = λp(x0 ). Alors f0 est une forme linéaire non nulle sur V0 , et il suffit de
voir que f0 6 p|V0 pour conclure grâce au théorème de Hahn-Banach qui précède. Faisons
donc cette vérification. Pour y = λx0 , avec λ > 0, on a :
f0 (y) = f0 (λx0 ) = λp(x0 ) = p(λx0 ) = p(y) 6 p(y),
et si y = λx0 , cette fois avec λ < 0, on a : 0 = p(0) 6 p(x0 ) + p(−x0 ) donc −p(x0 ) 6
p(−x0 ) et, par conséquent :
f (y) = f0 (λx0 ) = λp(x0 ) = (−λ) (−p(x0 )) 6 (−λ)p(−x0 ) = p ((−λ)(−x0 )) = p(y),
ce qui conclut la preuve. 
Exercice 2 (moyenne de Banach sur R). — Soit E = B(R) l’espace vectoriel sur R des
fonctions x = x(t) définies et bornées sur R, à valeurs réelles. Si α1 , α2 , . . . αn est un
ensemble fini de nombres réels, on pose :
n
1X
M(x; α1 , α2 , . . . αn ) = sup x(t + αk ),
t∈R n k=1
et
p(x) = inf M(x; α1 , α2 , . . . αn ),
α1 ,α2 ,...αn
où l’infimum est pris sur tous les systèmes finis α1 , α2 , . . . αn de nombres réels.
TS I.14 THÉORÈME DE HAHN-BANACH § 4

1◦ L’application p est une jauge.


2◦ Il existe sur E une forme linéaire F telle que : F(1) = 1, F(x) > 0 si x(t) > 0
pour tout t ∈ R et F est invariante par translations, i.e. F(xτ ) = F(x) pour toute fonction
x, où xτ est la fonction « translatée par τ » définie par t 7→ x(t − τ ).
3◦ En déduire qu’à toute partie A de R on peut attribuer un nombre réel µ(A) de
sorte que : µ(A ∪ B) = µ(A) + µ(B) si A ∩ B = ∅, µ(A) > 0, µ(R) = 1 et µ(A) = µ(B) si
A et B se déduisent l’un de l’autre par translation.
On remarquera l’analogie avec la théorie de la mesure des ensembles.

Soit maintenant E un espace vectoriel normé sur le corps K = R ou C.

Définition 3. — Le dual (topologique) de E est l’espace vectoriel E0 des formes linéaires


f continues sur E, normé par
kf kE0 = sup |f (x)|.
x∈E,kxk 6 1

L’espace E0 , au titre d’espace d’applications linéaires dans un espace de Banach (i.e.


normé complet), est lui-même un espace de Banach.

Théorème 2 (Hahn-Banach, version 2). — Soit E un espace vectoriel normé sur le corps
K = R ou C. Soit V un sous-espace vectoriel de E et soit f une forme linéaire continue
sur V. Alors il existe une forme linéaire F continue sur E telle que
(i) la forme linéaire F prolonge f , i.e. F(x) = f (x) pour tout x ∈ V ;
(ii) on a : kf kE0 = kf kV0 , c’est-à-dire
sup |F(x)| = sup |f (x)|.
x∈E,kxk 6 1 x∈V,kxk 6 1

Le point essentiel est le (ii) : on peut prolonger la forme linéaire f sans augmenter sa
norme.

Preuve. Pour K = R, c’est un corollaire immédiat de la première version : il suffit d’y


prendre p(x) = kf kV0 kxkE , V0 = V et f0 = f ; on obtient alors une forme linéaire F sur E
qui prolonge f et vérifie :
F(x) 6 kf kV0 · kxkE
pour tout x ∈ E. Changeant x en −x, on voit qu’elle vérifie même
|F(x)| 6 kf kV0 · kxkE
pour tout x ∈ E. Donc la forme linéaire F est continue dans E, et
kf kE0 6 kf kV0 ,
d’où kf kE0 = kf kV0 .

Pour K = C, on se ramène au cas K = R en considérant l’espace vectoriel réel


ER sous-jacent à E (voir appendice 3). Soit VR l’espace vectoriel réel sous-jacent à V.
Soit u = Re(f ) ; c’est une forme linéaire continue sur VR , de norme kf kV0 . On vient de
§ 4 THÉORÈME DE HAHN-BANACH TS I.15

voir qu’elle se prolonge en une forme linéaire réelle U continue dans ER , de norme kf kV0 .
Posons, pour tout x ∈ E :
F(x) = U(x) − iU(ix).
Alors F est une forme linéaire complexe sur E, de norme kUkER , c’est-à-dire égale à kf kV0 ,
et puisque f (x) = u(x) − iu(ix), il est clair que F prolonge f . 

Exercice 3. — On suppose que E est un espace de Hilbert dont on note (·|·) le produit
scalaire.
1◦ Rappeler la description des formes linéaires continues sur E.
2◦ En utilisant les théorèmes de projections, retrouver une démonstration du théorème
de Hahn-Banach dans les espaces de Hilbert.
3◦ Constater que, dans ce cas, le prolongement de f par F avec conservation de la
norme est unique et s’annule sur l’orthogonal de V.

Nous passons désormais à une troisième version, dite géométrique, du théorème de


Hahn-Banach.

Théorème 3 (Hahn-Banach, version 3). — Soit E un espace vectoriel normé sur le corps
R. Soit A un ensemble ouvert convexe non vide de E. Soit L un sous-espace affine de E
tel que A ∩ L soit vide. Alors il existe un hyperplan (affine) fermé H de E tel que A ∩ H
soit encore vide et contenant L.

Rappelons qu’un hyperplan fermé est le translaté d’un sous-espace vectoriel fermé de
codimension 1 ; c’est-à-dire qu’il s’agit d’un ensemble de la forme {x ∈ E : F(x) = α} où F
est une forme linéaire continue non identiquement nulle sur E et α est un nombre réel.

Preuve. Commençons par le cas particulier instructif où L est réduit à un point, disons
m (par exemple si E est de dimension 2 et si m est dans la frontière Fr(A) = A A◦ de A,
il s’agit de voir qu’on peut mener une sorte de « tangente » à A en m).
Par translation, on se ramène au cas où A contient l’origine 0. Soit m un point de E
tel que m 6∈ A (ce qui n’empêche pas m d’être sur la frontière de A). On va prouver qu’il
existe un hyperplan fermé H de E contenant m mais ne coupant pas A. Introduisons la
jauge pA de A définie par :
x
pA (x) = inf{t > 0 : ∈ A}
t
pour x ∈ E. Par la proposition 1, on a pA (m) > 1 car m 6∈ A. Soit V = Rm la droite
vectorielle engendrée par m et soit sur V la forme linéaire f : λ 7→ λpA (m). On a f (λm) 6
pA (λm) car :

– si λ > 0, alors f (λm) = λpA (m) = pA (λm) ;


– si λ < 0, alors f (λm) = λpA (m) 6 0 6 pA (λm), car tout pA (x) est > 0.

D’après le théorème de Hahn-Banach (première version), il existe une forme linéaire


F sur E qui prolonge f (et donc en particulier F(m) = f (m) = pA (m) > 1) et telle que,
pour tout x ∈ E, on a F(x) 6 pA (x) (et en particulier F(x) < 1 < pA (m) pour tout x ∈ A
TS I.16 THÉORÈME DE HAHN-BANACH § 4

par la proposition 1). Posons α = pA (m). L’hyperplan


H = {x ∈ E : F(x) = α}
passe par m et, pour tout x ∈ A, on a F(x) < α, donc H ∩ A = ∅. Ceci implique que
l’hyperplan H n’est pas dense, et donc qu’il est fermé dans E. Ceci achève la démonstration
dans le cas particulier où L est réduit à un point.

Passons maintenant à la démonstration dans le cas général. Cette fois, on utilise une
translation judicieuse pour se ramener au cas où L contient l’origine 0, autrement dit au
cas où L est un sous-espace vectoriel de E. On suppose aussi que L est fermé car, A étant
ouvert, l’intersection L ∩ A est encore vide. Passons à l’espace vectoriel normé quotient
E = E/L, muni de la norme
kxk = inf kxkE ,
x∈x

où x = x + L. Dans E l’ensemble A = {x : x ∈ A} est convexe et ouvert, car la projection


x 7→ x est une application linéaire de E sur E qui transforme tout ouvert en un ouvert
(on parle d’application ouverte). De plus, on a 0 = L 6∈ A. D’après le cas particulier traité
ci-dessus, il existe dans E un hyperplan vectoriel fermé H tel que H ∩ A soit vide. Soit
H l’image réciproque de H dans E ; c’est un hyperplan fermé de E tel que H ⊃ L et
H ∩ A = ∅, ce qui achève la démonstration. 
Proposition 2. — Si A est ouvert convexe non vide et ne contient pas 0, il existe une
forme linéaire continue f ∈ E0 telle que f (x) > 0 pour tout x ∈ A.
Preuve. En effet, d’après le cas particulier traité dans la preuve précédente, il existe
un hyperplan vectoriel fermé {f = 0} = {x ∈ E : f (x) = 0} qui ne coupe pas A. Puisque
A est convexe, il est tout entier dans l’un des deux demi-espaces ouverts délimités par cet
hyperplan ; quitte à remplacer f par −f , il est dans le demi-espace {f > 0}. 
Exercice 4. — Dans le cas E = R2 , donner de la troisième version du théorème de Hahn-
Banach une démonstration élémentaire basée sur l’idée suivante. Soit A un ouvert convexe
de R2 ne contenant pas 0 ; il faut montrer qu’il existe une droite issue de 0 et ne coupant
pas A. Soit Γ le cercle unité et, pour tout x ∈ A, soit ϕ(x) l’intersection avec Γ de la
demi-droite issue de 0 passant par x. On montrera que ϕ(A) est un intervalle curviligne
ouvert dans Γ et de longueur 6 π.

§ 5. APPLICATIONS À LA DUALITÉ DES ESPACES NORMÉS

Relisez attentivement l’énoncé de la deuxième version du théorème de Hahn-Banach.


En voici quelques corollaires.
Corollaire 1. — Soit, dans un espace vectoriel normé sur le corps K = R ou C, un
vecteur a non nul. Alors il existe f ∈ E0 telle que
kf kE0 = 1 et f (a) = kak.
§ 5 APPLICATIONS À LA DUALITÉ DES ESPACES NORMÉS TS I.17

En particulier, si E 6= {0} alors E0 6= {0} : un espace vectoriel normé sur K a toujours des
formes linéaires continues non nulles.
Preuve. Soit la droite vectorielle V = Ka. Sur V la forme linéaire f0 : λa 7→ λkak est
continue de norme 1 ; il suffit de la prolonger à E sans changement de norme. 
Corollaire 2. — Le dual topologique E0 sépare les points : si x et y sont deux vecteurs
distincts de E, il existe f ∈ E0 telle que f (x) 6= f (y).
Preuve. En effet, si x 6= y il suffit de prendre a = x − y et d’appliquer le précédent
corollaire. 
Corollaire 3. — On a, pour tout x ∈ E, la formule :
kxkE = sup |f (x)|.
f ∈E0 ,kf kE0 6 1

Preuve. Si x = 0 c’est évident ; supposons désormais que x est non nul. Si kf kE0 6 1,
on a |f (x)| 6 kxkE ; ainsi on sait déjà que
sup |f (x)| 6 kxkE .
f ∈E0 ,kf kE0 6 1

Réciproquement, puisque x 6= 0 le premier corollaire de la section assure l’existence de


f ∈ E0 de norme 1 telle que |f (x)| = kxk ; et donc
sup |f (x)| > kxkE ,
f ∈E0 ,kf kE0 6 1

ce qui prouve l’énoncé. 


Définition 1. — On appelle bidual de l’espace vectoriel E normé sur K = R ou C le
dual topologique E00 = (E0 )0 de l’espace de Banach E0 .
D’après le corollaire qui précède, l’application
x 7→ (ex : f 7→ f (x))
établit une isométrie de E dans son bidual E00 , qui permet d’identifier E à un sous-espace
vectoriel normé de E00 .
Exercice 1. — 1◦ Quel est le bidual de l’espace c0 des suites réelles qui tendent vers
0, muni de la norme sup ?
2◦ Citer des espaces vectoriels normés égaux à leur bidual (ces espaces vectoriels
normés sont dits réflexifs).
3◦ En considérant le sous-espace vectoriel V de `∞ (N) formé des suites réelles conver-
gentes, et sur V la forme linéaire
x = (xn )n∈N 7→ lim xn ,
n→∞
montrer qu’il existe sur `∞ (N) une forme linéaire continue non nulle mais identiquement
nulle sur c0 . En déduire que l’espace `1 (N) n’est pas réflexif.
Corollaire 4. — Soit A une partie convexe non vide de E. Soit x ∈ E. Pour que x soit
dans E limite de combinaisons linéaires de vecteurs de A, il faut et il suffit que toute f ∈ E0
identiquement nulle sur A soit nulle sur x.
TS I.18 APPLICATIONS À LA DUALITÉ DES ESPACES NORMÉS § 5

Preuve. Notons hAi le sous-espace vectoriel de E engendré par A (i.e. l’ensemble des
combinaisons linéaires de vecteurs de A) et notons hAi son adhérence dans E (i.e. l’ensemble
des limites de suites convergentes de telles combinaisons linéaires). La condition proposée
est nécessaire car si x ∈ hAi et si f est identiquement nulle sur A, alors f est identiquement
nulle sur hAi par linéarité, et finalement identiquement nulle sur hAi par continuité et
passage à la limite.

Le point intéressant du corollaire, qui demande le plus de travail pour la preuve, est
de démontrer que la condition est suffisante. Donnons-nous x 6∈ hAi afin de montrer qu’il
existe f ∈ E0 telle que f soit nulle sur A mais que f (x) 6= 0. Soit δ = inf y∈hAi kx − yk :
c’est un nombre réel > 0, sinon x serait limite d’une suite d’éléments de hAi donc serait
lui-même dans hAi. Posons
V = hAi + Kx.
Soit g la forme linéaire sur V définie, pour y ∈ hAi et λ ∈ K par
g(y + λx) = λ.
Puisque, pour λ 6= 0, on a :
y
ky + λxk = |λ|kx + k > |λ|δ = δ|g(y + λx)|,
λ
la forme linéaire g est continue sur V et de norme kgkV0 6 1δ . D’après le théorème de Hahn-
Banach, soit f ∈ E0 une forme linéaire continue qui prolonge g. On a f (x) = g(x) = 1, et
f (y) = g(y) = 0 pour tout y ∈ A. 
Corollaire 5. — Soit A une partie de E telle que la seule f ∈ E0 identiquement nulle
sur A soit la forme nulle. Alors A est totale dans E, c’est-à-dire : tout vecteur de E est
limite de combinaisons linéaires de vecteurs de A.
Preuve. C’est un cas particulier du corollaire précédent. 

Ces deux derniers corollaires jouent un rôle important en théorie de l’approximation.


Exercice 2. — De la démonstration de l’avant-dernier corollaire, dégager le résultat sui-
vant : soit V un sous-espace vectoriel de E et soit x ∈ E tel que δ = inf y∈V kx − yk > 0 ;
alors il existe f ∈ E0 telle que :
1
f (x) = 1, f (y) = 0 pour tout y ∈ V et kf kE0 6 .
δ

§ 6. SÉPARATION DES ENSEMBLES CONVEXES

Dans sa troisième version, le théorème de Hahn-Banach a des applications intéressantes


à la géométrie des ensembles convexes. Soit E un espace vectoriel normé sur R. Dans E
un hyperplan (affine) fermé, de la forme {x ∈ E : f (x) = α} où f ∈ E0 {0} et α ∈ R,
délimite deux demi-espaces ouverts :
{x ∈ E : f (x) < α} et {x ∈ E : f (x) > α},
§ 6 SÉPARATION DES ENSEMBLES CONVEXES TS I.19

ainsi que deux demi-espaces fermés :


{x ∈ E : f (x) 6 α} et {x ∈ E : f (x) > α}.
Soient A et B deux parties de E. Soit H un hyperplan fermé de E.
Définition 1. — On dit que H sépare (resp. sépare strictement) A et B, si A est contenu
dans l’un et B est contenu dans l’autre des demi-espaces fermés (resp. ouverts) délimités
par H.

Dans sa troisième version, le théorème de Hahn-Banach énonce en somme que, si A est


ouvert convexe non vide et L un sous-espace affine disjoint de A, alors il existe un hyperplan
fermé qui sépare A de L. Cet énoncé peut en fait être très notablement amélioré.
Corollaire 1. — Dans un espace vectoriel réel normé E, soient A et B deux ensembles
convexes non vides disjoints.
(i) Si A est ouvert, il existe un hyperplan fermé qui sépare A et B.
(ii) Si A et B sont tous deux ouverts, ou si A est fermé et B compact, il existe un
hyperplan fermé qui sépare strictement A et B.
(iii) Si A et B sont tous les deux fermés, et si E est de dimension finie, il existe un
hyperplan fermé qui sépare A et B.
Preuve. Preuve de (i). L’ensemble C = A − B est ouvert (comme réunion de translatés
de l’ouvert A), convexe (d’après la proposition 2), non vide car A 6= ∅ et ne contient pas
l’origine (car A et B sont disjoints). D’après la proposition 2 il existe f ∈ E0 telle que f (x)
soit > 0 pour tout x ∈ C, donc telles que f (a) > f (b) quels que soient a ∈ A et b ∈ B.
Ainsi α = inf a∈A f (a) > supb∈B f (b) = β. Pour γ un nombre réel dans l’intervalle [α; β],
l’hyperplan {x ∈ E : f (x) = γ} sépare A et B.

Preuve de (ii). Si de plus B est ouvert, l’hyperplan H du (i) sépare strictement A et B,


car si par exemple il existait un point b dans H ∩ B, il existerait une boule ouverte B(b, r)
avec r > 0, contenue dans B (car B est ouvert) ; donc B aurait des points strictement de
part et d’autre de H, ce qui contredit le fait que H sépare A et B.

Maintenant, supposons A fermé et B compact. Alors δ = inf x∈B d(x, A) est > 0 car la
fonction
x 7→ d(x, A) = inf kx − yk
y∈A
est continue (en fait 1-lipschitzienne) et > 0 sur le compact B, donc atteint sa borne
inférieure (laquelle de ce fait ne peut être nulle). Dès lors les ensembles A + B(0, 3δ ) et
B + B(0, 3δ ) sont deux ouverts convexes disjoints, auxquels il suffit d’appliquer l’énoncé (ii)
dans le cas précédent : il existe un hyperplan fermé qui sépare strictement ces deux ouverts
épaississant A et B, donc qui sépare strictement A et B.

Preuve de (iii). Ici E = Rd , qu’on munit du produit scalaire (·|·) et de la norme


euclidienne (équivalente à toute autre norme). Par translation, on suppose que A contient
l’origine ; par rotation et homothétie on suppose que B contient le point e1 = (1, 0, 0, . . . , 0).
Soit S la sphère unité de centre 0. L’ensemble Λ = S × [0; e1 ] est compact ; tout point
TS I.20 SÉPARATION DES ENSEMBLES CONVEXES § 6

λ = (u, ξ) de cet ensemble, où u ∈ S et ξ ∈ [0; e1 ], définit un hyperplan Hλ issu de ξ


et orthogonal à u : c’est l’hyperplan d’équation (x|u) = (ξ|u). C’est avec cet ensemble
d’hyperplans Hλ que nous allons travailler.

Pour tout entier n > 1, soit B(0, n) la boule fermée de centre 0 et de rayon n ; elle est
compacte puisque E est de dimension finie. D’après le point (ii) il existe un hyperplan Hλ
séparant le convexe compact A∩B(0, n) du convexe fermé B. Nécessairement cet hyperplan
coupe l’axe e1 entre les points 0 et e1 , donc en un point ξn du segment [0; e1 ]. Il est donc
du type Hn = Hλn , avec λn = (un , ξn ) ∈ Λ. La séparation par Hn de A ∩ B(0, n) et B se
traduit, en changeant au besoin un en −un , par les inégalités :

(1) (x|un ) > (ξn |un ) pour tout x ∈ B ;


(2) (x|un ) 6 (ξn |un ) pour tout x ∈ A ∩ B(0, n).

Puisque Λ est compact, il existe une suite extraite de (λn )n>0 , par abus encore notée
(λn )n>0 , qui converge vers un λ = (u, ξ) ∈ Λ. Alors l’hyperplan Hλ = {x ∈ E : (x|u) =
(ξn |u)} sépare A et B. En effet, si x ∈ B, en faisant tendre n vers +∞ dans les inégalités
(1) on obtient :
(x|u) > (ξ|u) pour tout x ∈ B.
Si x ∈ A, pour n assez grand, x finit par être dans tous les ensembles A ∩ B (0, ϕ(n)) et,
en faisant dès lors tendre n vers +∞ dans (2), on obtient :
(x|u) 6 (ξ|u) pour tout x ∈ A,
qui est la séparation souhaitée. 
Corollaire 2. — Tout ensemble convexe fermé est l’intersection des demi-espaces fermés
qui le contiennent.
Preuve. Soit A un convexe fermé non vide, et soit A e l’intersection des demi-espaces
fermés qui contiennent A. Évidemment A ⊂ A. e Soit x ∈ E tel que x 6∈ A, il s’agit de
voir que x 6∈ A.
e D’après le corollaire qui précède, il existe un hyperplan fermé H séparant
strictement x de A. Ainsi x n’appartient pas au demi-espace fermé délimité par H qui
contient A, et on a donc x 6∈ A.
e 
Exercice 1. — Tout sous-espace affine fermé est l’intersection des hyperplans affines qui le
contiennent.
Exercice 2. — Soit C un convexe fermé et A une partie de E. Pour que C contienne A, il
faut et il suffit que pour toute f ∈ E0 , on ait f (A) ⊂ f (C).
On souhaite maintenant préciser le corollaire précédent en réduisant le nombre de
demi-espaces fermés mis en jeu.
Définition 2. — Soit A un ensemble convexe fermé non vide et soit x un point de la
frontière de A. Un hyperplan d’appui de A au point x est un hyperplan fermé passant par
x et tel que A soit tout entier contenu dans l’un des deux demi-espace fermés délimités par
H.
§ 7 POINTS EXTRÉMAUX TS I.21

Proposition 1. — Soit A un ensemble fermé convexe d’intérieur non vide. Alors tout
point frontière de A appartient à au moins un hyperplan d’appui de A.
Preuve. Soit x ∈ Fr(A) = A A◦ . Alors {x} ∩ A◦ = ∅. Pour obtenir un hyperplan
d’appui en x il suffit d’appliquer la troisième version du théorème de Hahn-Banach au
sous-espace affine réduit au point x et à l’ouvert convexe A◦ . 
Corollaire 1. — Tout ensemble fermé convexe A qui est, soit d’intérieur non vide, soit
compact non vide, est l’intersection des demi-espaces fermés qui le contiennent et qui sont
bordés par un hyperplan d’appui de A.
Preuve. Soit Ab cette intersection. Évidemment A ⊂ A.
b Soit x ∈ E tel que x 6∈ A ; il
s’agit de voir que x 6∈ A.
b

1◦ ) Supposons A◦ non vide. Choisissons y ∈ A◦ . L’intersection de A et du segment


[x; y] est un segment [z; y] où z ∈ Fr(A) est distinct de x. Par la proposition qui précède,
on dispose d’un hyperplan d’appui de A en z. Le demi-espace fermé délimité par H qui
contient A ne contient pas x, sinon la droite joignant x, y, z serait tout entière dans H et
comme le point y est intérieur à A, s’il était dans H il y aurait des points de A strictement
de part et d’autre de H. Ainsi x 6∈ A.
b

2◦ ) Supposons A compact non vide. D’après le précédent corollaire, il existe un hy-


perplan fermé H séparant strictement A de {x}, donc il existe f ∈ E0 et α ∈ R tels que :
f (x) < α, et f (y) > α pour tout y ∈ A. Soit β = inf y∈A f (y). Le demi-espace fermé
{y ∈ E : f (y) > β} contient A. De plus l’hyperplan H1 = {z ∈ E : f (z) = β} est d’appui
pour A car sur A compact la borne inférieure β est atteinte. Mais x n’appartient pas au
demi-espace {y ∈ E : f (y) > β} car f (x) < α 6 β. Ainsi x 6∈ A.
b 
Exercice 3. — Dans `2 (N) soit A l’enveloppe convexe fermée de l’ensemble {± enn }n>1 .
Montrer que A est compact, que 0 ∈ Fr(A) mais que par 0 ne passe aucun hyperplan
d’appui de A.

§ 7. POINTS EXTRÉMAUX

Soit A un ensemble convexe fermé dans un espace vectoriel normé sur R. Soit a ∈ A
Définition 1. — On dit que a est un point extrémal de A s’il n’existe aucun intervalle
ouvert contenant a et contenu dans A ; en d’autres termes si les relations
α = λx + (1 − λ)y, x, y ∈ A, 0 6 λ 6 1
entraînent x = y = a.
Il revient au même de dire que a n’est pas le milieu d’un segment de longueur > 0
contenu dans A ; en d’autres termes les relations
x+y
a= x, y ∈ A
2
entraînent x = y = a.
TS I.22 POINTS EXTRÉMAUX § 7

Par exemple, dans le plan les points extrémaux d’un domaine polygonal convexe sont
les sommets du polygone frontière.
Toujours si n = 2, l’ensemble A ci-dessus a ses points extrémaux figurés à droite.

On notera Extr(A) l’ensemble des points extrémaux de A. Il est clair que cet ensemble
est contenu dans la frontière de A.

Exercice 1. — Dans Rn muni de sa base canonique (ei )1 6 i 6 n , déterminer les points ex-
trémaux de la boule unité fermée
1◦ pour la norme sup : x = i xi ei 7→ maxi |xip
P
|;
◦ 2
P P
2 pour la norme euclidienne : x = i xi ei 7→ i |xi | .
3◦ Plus généralement, montrer que si E est un espace vectoriel muni d’un produit
scalaire et de la norme associée, tout point de la sphère unité est extrémal pour la boule
unité fermée de E.
4◦ Il en est de même si E = `p (N) avec 1 < p < +∞.

Exercice 2. — 1◦ Les points extrémaux de la boule unité fermée de `∞ (N) sont les
suites (xn )n∈N tels que |xn | = 1 pour tout n ∈ N.
2◦ La boule unité fermée de l’espace c0 des suites qui tendent vers 0 n’a pas de point
extrémal.

Exercice 3. — Dans l’espace euclidien R3 , soit A l’enveloppe convexe de l’ensemble réunion


du cercle {x3 = 0; x21 + x22 − 2x2 = 0} et des deux points {x1 = x2 = 0; x3 = ±1}. Montrer
que A est convexe compact. Déterminer Extr(A) et constater que cet ensemble n’est pas
fermé.

Lemme 1. — Soit A un ensemble convexe fermé dans E, et soit H un hyperplan d’appui


de A. Alors :
Extr(A ∩ H) = Extr(A) ∩ H.

Preuve. Par définition des points extrémaux, on a déjà :

Extr(A ∩ H) ⊃ Extr(A) ∩ H.

Réciproquement, soit x ∈ Extr(A ∩ H). Alors déjà x ∈ H. Par l’absurde, supposons que
x 6∈ Extr(A) ; alors x serait dans un intervalle ouvert I contenu dans A. Cet I serait contenu
dans H, sinon il irait de part et d’autre de H, en contradiction avec le fait que H est un
hyperplan d’appui de A. Ainsi x 6∈ Extr(A ∩ H). 

Un théorème, dû à Krein et Milman, affirme que dans un espace vectoriel normé,


tout ensemble convexe compact est l’enveloppe convexe fermée de l’ensemble de ses points
extrémaux. Nous nous contenterons ici du cas de la dimension finie mais nous y énonçons un
résultat plus fort (remplaçant l’enveloppe convexe fermée par la simple enveloppe convexe).

Théorème 1 (Krein-Milman). — Soit A un ensemble convexe compact non vide dans un


espace vectoriel de dimension finie sur R. Alors A est l’enveloppe convexe de l’ensemble
de ses points extrémaux.
§ 7 POINTS EXTRÉMAUX TS I.23

Preuve. Il est clair que, si on note Fr(A) la frontière de A, on a


A = conv (Fr(A)) .
Il suffit donc de prouver que tout x ∈ Fr(A) est dans conv (Extr(A)). On raisonne par ré-
currence sur la dimension de A (i.e. la dimension du plus petit sous-espace affine contenant
A). Si d = 0 ou 1, l’ensemble A est un segment [a; b] et Extr(A) = {a; b} ; le théorème est
alors évident.

On suppose désormais que d > 1 et que l’énoncé est vrai en dimensions inférieures.
Plongeons A dans l’espace affine Rd qu’il engendre. Dans cet espace l’intérieur de A est
non vide donc, d’après la proposition 1, si x ∈ Fr(A) est donné, il passe par x un hyperplan
d’appui, disons H, de A. L’ensemble A ∩ H est convexe compact non vide et de dimension
6 d − 1 ; par hypothèse de récurrence, on a donc
A ∩ H = conv (Extr(A ∩ H)) .
En appliquant le lemme qui précède, on voit que pour le point x ∈ Fr(A), on a :
x ∈ A ∩ H = conv (Extr(A ∩ H)) = conv (Extr(A) ∩ H) ⊂ conv (Extr(A)) ,
ce qui achève la démonstration. 
Exercice 4. — Soit A un ensemble convexe compact non vide dans Rn . Soit f : A → R
une fonction continue et convexe sur A, ce qui signifie que
f (λx + (1 − λ)y) 6 λf (x) + (1 − λ)f (y)
pour tous x, y ∈ A et λ ∈ [0; 1]. Alors le maximum de A est atteint sur Extr(A) ; en
particulier, si A est un polyèdre il suffit de tester un nombre fini de points.
Exercice 5. — Soit E un espace vectoriel de dimension finie p sur R. Dans E soit K un
polyèdre convexe plein défini par le système d’équations
f1 (x) > 0; f2 (x) > 0; . . . fN (x) > 0,
où N > p et où les fi sont des fonctions linéaires affines sur E (i.e. de la forme fi = ϕi + αi
avec ϕi ∈ E0 et αi ∈ R). Soit a un point extrémal de K. Montrer que le nombre des indices
i ∈ {1; 2; . . . N} tels que fi (a) = 0 est > p ; autrement dit, tout sommet d’un polyèdre
convexe dans Rp est dans l’intersection d’au moins p faces dudit polyèdre.
Exercice 6. — Dans l’espace E de dimension n2 des matrices réelles [aij ]1 6 i,j 6 n , soit
l’ensemble convexe :
A = {a = [aij ]1 6 i,j 6 n ∈ E : aij > 0 pour tous i, j ∈ {1; 2; . . . n}
n
X n
X
et aik = akj = 1 pour tout k ∈ {1; 2; . . . n}}
i=1 j=1
des matrices dites bistochastiques. Soit P l’ensemble des matrices de permutation, i.e. qui
ont un coefficient 1 exactement sur chaque ligne et sur chaque colonne, les autres coefficients
étant nuls. Montrer que P = Extr(A) et en déduire un théorème de Birkhoff : toute matrice
bistochastique est combinaison linéaire convexes de matrices de permutations, et même
d’au plus (n − 1)2 + 1 d’entre elles.
TS I.24 POINTS EXTRÉMAUX § 7

Indication : A est un polyèdre convexe dans l’espace affine


n
X n
X

a = [aij ]1 6 i,j 6 n ∈ E : aik = akj = 1 pour tout k ∈ {1; 2; . . . n}
i=1 j=1

On montrera que cet espace est de dimension (n−1)2 et on appliquera l’exercice précédent.
chapitre ii

L’espace des fonctions continues


sur un compact

Dans ce chapitre sont exposés quelques aspects de l’Analyse dans l’espace de Banach
C (X) dans fonctions continues sur un espace compact X. Une notion de base est celle
de sous-ensemble équicontinu de C (X). Cette propriété a la vertu de rendre uniforme
la convergence simple. De plus l’équicontinuité est la seule condition qu’il faut ajouter
à celles d’être fermée et bornée pour qu’une partie de C (X) soit compacte (théorème
d’Ascoli). En liaison avec l’équicontinuité nous étudions aussi la compacité dans l’espace
O(U) des fonctions holomorphes dans un ouvert U de C (théorèmes de Montel, de Vitali) :
contrairement au cas de C (X) et, curieusement, de façon analogue au cas des espaces de
dimension finie, le seul fait pour une partie de O(U) d’être borné suffit pour qu’on ait dans
cette partie la propriété de Bolzano-Weierstrass.

La seconde moitié du chapitre est consacrée au théorème de Weierstrass d’approxima-


tion uniforme des fonctions continues sur [0; 1] par des polynômes, et à la superbe axio-
matisation de généralisation à C (X) qu’en a donnée en 1948 le mathématicien américain
Marshall Stone, en mettant en évidence le rôle joué dans la question par la structure d’al-
gèbre de C (X) et par la relation d’ordre dans cet espace. Le théorème de Weierstrass-Stone
a d’importantes conséquences en Analyse fonctionnelle.

Enfin, nous terminons le chapitre par l’étude du prolongement à X d’une fonction


définie et continue dans une partie fermée de X (théorème d’Urysohn).

§ 1. ÉQUICONTINUITÉ ET CONVERGENCE DANS LES ESPACES


D’APPLICATIONS

Dans tout ce chapitre, X et F désignent des espaces métriques (en fait, pour ceux qui
connaissent la Topologie générale : X pourrait être un espace topologique – les modifications
TS II.26 ÉQUICONTINUITÉ ET CONVERGENCE DANS LES ESPACES D’APPLICATIONS § 1

des énoncés et des démonstrations étant attendues et mineures). On pensera notamment


au cas où F = R ou C. Soit H un ensemble d’applications f : X → F. On pensera
notamment au cas où H est un ensemble de fonctions définies dans X, à valeurs réelles ou
complexes. De plus, l’ensemble favori sera celui où X est le segment [0; 1] de l’axe réel.
Définition 1. — Soit a un point de X. On dit que H est équicontinu en a si quel que
soit ε > 0 il existe η > 0 tel que, quelle que soit f ∈ H , on ait
dX (x, a) < η ⇒ dF (f (x), f (a)) < ε.
On dit que l’ensemble H est équicontinu dans X si H est équicontinu en a pour tout
a ∈ X.
Ainsi, l’équicontinuité en a requiert une cohérence dans la façon dont les diverses
applications f ∈ H sont continues en a : à un ε > 0 donné on peut, dans la définition de
la continuité, faire correspondre un unique voisinage de a dans X (donné par la boule de
centre a et de rayon η dans le cas métrique que l’on considère) valable d’un seul coup pour
toutes les fonctions f ∈ H .

Tout ensemble fini H = {f1 ; f2 ; . . . fN } d’applications continues au point a ∈ X est


équicontinu en a car, si à ε > 0 correspond, pour chaque i ∈ {1; 2; . . . N}, un ηi tel que
« dX (x, a) < ηi ⇒ dF (fi (x), fi (a)) < ε » il suffit de prendre η = min∈{1;2;...N} . Mais voici
des exemples plus intéressants.
Exercice 1. — Soit X = [0; 1] et F = C et soit k réel > 0 donné. On note Hk l’ensemble
des fonctions f : X → C qui sont k-lipschitziennes de rapport k, c’est-à-dire telles que
quels que soient x, y ∈ X on ait :
|f (x) − f (y)| 6 k|x − y|.
Montrer que Hk est équicontinu dans X. En déduire que l’ensemble Hk0 des f qui admettent
sur [0; 1] une dérivée f 0 telle que |f 0 (x)| 6 k pour tout x ∈ X, est équicontinu sur X.
Exercice 2. — Soit U un ouvert de C. Soit H un ensemble de fonctions holomorphes dans
U tel que, pour tout disque D fermé de rayon > 0 et contenu dans U, il existe une constante
MD telle que pour toute f ∈ H et tout z ∈ D on ait |f (z)| 6 MD .
1◦ Montrer que pour tout disque D comme ci-dessus, il existe une constante M0D telle
que pour toute f ∈ H on ait |f 0 (z)| 6 M0D .
2◦ Montrer que l’ensemble H est équicontinu sur U.
Rappelons quelques notions de base sur les convergences de suites de fonctions.
Définition 2. — Soit (fn )n>0 une suite d’applications de X dans F, et soit g une appli-
cation de X dans F. On dit que (fn )n>0 converge simplement (ou ponctuellement) vers g
dans X si

pour tout x ∈ X et tout ε > 0 il existe un rang N tel que


pour tout n > N on a dF (g(x), fn (x)) 6 ε,

alors qu’on dit que (fn )n>0 converge uniformément vers g dans X si
§ 1 ÉQUICONTINUITÉ ET CONVERGENCE DANS LES ESPACES D’APPLICATIONS TS II.27

pour tout ε > 0 il existe un rang N tel que


pour tout x ∈ X et pour tout n > N on a dF (g(x), fn (x)) 6 ε.

Exercice 3. — Soit X = [0; 1] et F = R. Donner un exemple simple d’une suite (fn )n>0 de
fonctions continues qui converge simplement sur X vers une fonction discontinue. Donner
un exemple simple d’une suite (fn )n>0 de fonctions continues qui converge simplement
mais pas uniformément sur X vers la fonction nulle.
Nous allons voir que ces exemples n’auraient pas été possibles sous l’hypothèse sup-
plémentaire que les fn forment un ensemble équicontinu.

Soient à nouveau X et F des espaces métriques.


Proposition 1. — Soit (fn )n>0 une suite d’applications de X dans F. Soit a ∈ X. On
suppose que {fn }n>0 est équicontinue en a et que (fn )n>0 converge simplement vers une
fonction g. Alors g est continue en a.
Preuve. On se donne ε > 0. On écrit l’équicontinuité en a de la famille {fn }n>0 : il
existe δ > 0 tel que pour tout n > 0 et tout x ∈ B(a, δ) on a d (fn (x), fn (a)) < ε. Par
inégalité triangulaire, on a :

d (g(x), g(a)) 6 d (g(x), fn (x)) + d (fn (x), fn (a)) + d (fn (a), g(a)),

pour tout n > 0. Par convergence simple, pour n assez grand on a :


d (g(x), fn (x)) < ε et d (fn (a), g(a)) < ε.
Comme ε > 0 est quelconque, on en déduit la continuité de g en a. 

Dans cette preuve, on ne fait rien d’autre que passer à la limite quand n → ∞ dans
d (fn (x), fn (a)) < ε ; pour F = R ou C, cela donne |g(x) − g(a)| 6 ε à partir de |fn (x) −
fn (a)| < ε.
Exercice 4. — Soit X = [0; 1] et F = R. On considère la suite des fonctions fn : x 7→ xn .
En quels points cette suite de fonctions est-elle équicontinue ?
Proposition 2. — On suppose que F est complet et on se donne D une partie dense de
X. On se donne aussi une suite d’applications fn : X → F. On suppose que l’ensemble
{fn }n>0 est équicontinu sur X et que (fn )n>0 converge simplement sur D. Alors (fn )n>0
converge simplement sur X.
Preuve. Par complétude de F, il suffit de montrer que pour tout x ∈ X la suite
(fn (x))n>0 est de Cauchy. On fixe donc x ∈ X. Soit ε > 0. On écrit l’équicontinuité en
x de la famille {fn }n>0 : il existe δ > 0 tel que pour tout n > 0 et tout y ∈ B(x, δ) on
a d (fn (x), fn (y)) < ε. Par densité il existe d ∈ D ∩ B(x, δ), pour lequel en particulier
d (fn (x), fn (d)) < ε pour tout n > 0. Par convergence simple, la suite (fn (d))n>0 est
convergente, donc de Cauchy, et il existe n > 1 tel que pour tous m, n > N on ait
d (fn (d), fm (d)) < ε. Par inégalité triangulaire, pour tous m, n > N on a :

d (fn (x), fm (x)) 6 d (fn (x), fn (d)) + d (fn (d), fm (d)) + d (fm (d), fm (x)),
TS II.28 ÉQUICONTINUITÉ ET CONVERGENCE DANS LES ESPACES D’APPLICATIONS § 1

ce qui prouve bien que (fn (x))n>0 est de Cauchy. 


Proposition 3. — On suppose X compact. On se donne (fn )n>0 une suite d’applications
X → F. On suppose que {fn }n>0 est équicontinu sur X et que (fn )n>0 converge simplement
vers une fonction g. Alors la suite (fn )n>0 converge vers g uniformément sur X.
Preuve. Déjà, la proposition 1 dit que g est continue sur X. Soit ε > 0. Pour tout
x ∈ X, par équicontinuité en x de la famille {fn }n>0 et continuité de g en x, il existe δx > 0
tel que pour tout n > 0 et tout y ∈ B(x, δx ) on ait :

d (fn (x), fn (y)) 6 ε et d (g(x), g(y)) 6 ε.


S
Par compacité de X, on extrait du recouvrement X = x∈X B(x, δx ) un sous-
Sk
recouvrement fini, disons X = i=1 B(xi , δi ) avec δi = δxi . Par convergence simple, il
existe n > 0 tel que pour tout i ∈ {1, 2, . . . k} et tout n > N, on ait : d (g(xi ), fn (xi )) 6 ε.
Soit maintenant x ∈ X quelconque : ce point est contenu dans une boule B(xi , δi ) et pour
tout n > N on peut écrire :

d (g(x), fn (x)) 6 d (g(x), g(xi )) + d (g(xi ), fn (xi )) + d (fn (xi ), fn (x)) 6 3ε.

Bref : kg − fn k∞ 6 3ε pour n > N. 

On peut synthétiser les propositions qui précèdent dans le résultat suivant.


Théorème 1. — Soit X un espace métrique compact et soit F un espace métrique complet.
Soit D une partie dense de X. On suppose que {fn }n>0 est équicontinu sur X et que (fn )n>0
converge simplement sur D. Alors la suite (fn )n>0 converge uniformément sur X. 
Exercice 5. — Soit H l’ensemble des fonctions polynomiales P à coefficients réels dont le
maximum des valeurs absolues des coefficients est 6 1.
1◦ On se donne un nombre réel b ∈]0; 1[. Soient x0 et x réels tels que |x| 6 b et
|x0 | 6 b. Soit N un nombre entier > 0. Montrer que
N
X ∞
X
n
|P(x) − P(x0 )| 6 |x − xn0 | +2 bn .
n=0 n=?+1

2◦ En déduire que H est équicontinu sur ] − 1; 1[. Est-ce vrai sur [−1; 1] ?

§ 2. THÉORÈME D’ASCOLI

Dans un espace métrique, toute partie compacte est fermée et bornée. Réciproquement,
dans Rn il suffit qu’un ensemble soit fermé et borné pour qu’il soit compact : c’est le
théorème de Borel-Lebesgue. En revanche, dans un espace normé de dimension infinie,
on sait que la boule unité fermée, quoiqu’évidemment bornée, n’est jamais compacte :
c’est le théorème de F. Riesz ; dans de tels espaces, il faut donc donner des conditions
supplémentaires pour exprimer la compacité.
§ 2 THÉORÈME D’ASCOLI TS II.29

Soit X un espace compact et soit F un espace métrique complet. On notera C (X, F)


l’espace de toutes les applications continues de X dans F, muni de la distance d∞ de la
convergence uniforme :
d∞ (f, g) = sup d (f (x), g(x)) .
x∈X
On sait que l’espace métrique (C (X, F), d∞ ) est complet. En particulier, si F = R ou C,
l’espace C (X, F) est un espace vectoriel ; c’est un espace de Banach pour la norme :
kf k∞ = sup |f (x)|,
x∈X

et d∞ est la distance associée à cette norme.

Nous allons caractériser les parties compactes de l’espace métrique (C (X, F), d∞ ). Il
est remarquable que l’équicontinuité soit la condition essentielle dans cette caractérisation.
Théorème 1 (Arzela-Ascoli). — Soit H une partie de C (X, F), muni de la distance d∞
de la convergence uniforme. Si x ∈ X désignons par H (x) la partie de F formée des valeurs
f (x) quand f parcourt H . Pour que H soit une partie compacte de (C (X, F), d∞ ), il faut
et il suffit que les trois conditions suivantes soient simultanément satisfaites :
(i) la partie H est fermée dans C (X, F) ;
(ii) quel que soit x ∈ X l’adhérence de H (x) dans F est compacte ;
(iii) la partie H est un ensemble équicontinu d’applications X → F.
Remarque 1. — Si F = R ou C, la condition (ii) signifie simplement que, quel que soit
x ∈ X, l’ensemble H (x) est borné dans R ou C, ce qui, en présence de l’hypothèse (iii),
équivaut à l’hypothèse (ii0 ), en apparence plus forte que (ii), suivante :

(ii0 ) la partie H est bornée dans C (X, F), i.e. il existe une constante M telle que,
quels que soient f ∈ H et x ∈ X, on ait : |f (x)| 6 M.
Exercice 1. — Si F = R ou C, justifier que « (ii) et (iii) » équivaut à « (ii0 ) et (iii) ».

Preuve. Prouvons d’abord la partie banale du théorème, à savoir que les conditions
mentionnées sont nécessaires. Soit H une partie compacte de (C (X, F), d∞ ). En particu-
lier, elle est fermée, d’où (i). Puis, à x ∈ X fixé, on utilise que l’application d’évaluation
f 7→ f (x) est continue de C (X, F) dans F, car on a : d (f (x), g(x)) 6 d∞ (f, g), et donc
l’image H (x) du compact H par cette application est compacte elle aussi. On vient de
prouver (ii). Enfin, prouvons (iii). Soit ε > 0. D’après la condition du ε-recouvrement
pour le compact H , il existe f1 , f2 , . . . , fp ∈ H , en nombre fini, telles que pour toute
f ∈ H on ait d∞ (f, fi ) 6 3ε pour un indice i ∈ {1; 2; . . . ; p} convenable. Soit x0 ∈ X.
Par équicontinuité de {f1 ; f2 ; . . . ; fp } en ce point, il existe η > 0 tel que dX (x, x0 ) < η en-
traîne que d (fi (x), fi (x0 )) 6 3ε quel que soit l’indice i ∈ {1; 2; . . . ; p}. Dès lors, l’inégalité
dX (x, x0 ) < η entraîne que quelle soit f ∈ H on ait :
ε ε ε
d (f (x), f (x0 )) 6 d (f (x), fi (x)) + d (fi (x), fi (x0 )) + d (fi (x0 ), f (x0 )) 6 + + = ε,
3 3 3
où l’indice i est l’indice choisi comme ci-dessus par rapport à f . On a donc prouvé (iii) et
le finalement le fait que les conditions mentionnées sont nécessaires à la compacité.
TS II.30 THÉORÈME D’ASCOLI § 2

On va prouver maintenant que les conditions en question sont suffisantes pour la


compacité d’une partie H de (C (X, F), d∞ ), en commençant par le cas particulier où
X = [0; 1] et F = C. C’est une démonstration instructive car elle utilise le procédé diagonal,
et donc toutes les ressources de la dénombrabilité.

Soit donc pour le moment X = [0; 1] et F = C ; soit D = Q ∩ [0; 1] l’ensemble des


nombres rationnels r tels que 0 6 r 6 1 : c’est un ensemble dénombrable et dense dans
[0; 1]. Ordonnons-le : D = {r1 ; r2 ; . . . rn ; . . .} en une suite (peu importe l’ordre). Soit H
une partie de C = C ([0; 1], C) satisfaisant les conditions (i), (ii) et (iii). Puisque déjà H
est fermée dans C , pour montrer qu’elle est compacte il suffit de prouver la propriété de
Bolzano-Weierstrass, à savoir que si (fn )n>0 est une suite dans H on peut en extraire une
sous-suite qui converge uniformément sur [0; 1].

Or, d’après l’hypothèse (ii), la suite de nombres complexes (fn (r1 ))n>0 est bornée ;
donc d’après le théorème de Bolzano-Weierstrass dans C, il existe une suite (fn1 )n>0 ex-
traite de (fn )n>0 telle que la suite numérique fn1 (r1 ) n>0 converge dans C. Puis, d’après


l’hypothèse (ii) appliquée au point x = r2 , il existe une suite (fn2 )n>0 extraite de (fn1)n>0
telle que la suite numérique fn2 (r2 ) n>0 converge dans C (alors que la suite fn2 (r1 ) n>0
reste convergente). On itère ce raisonnement, et l’on prouve ainsi que pour tout entier
p > 1 il existe une suite (fnp )n>0 extraite de (fnp−1 )n>0 , donc de (fn )n>0 , telle que les suites
numériques (fnp (r1 ))n>0 , (fnp (r2 ))n>0 , . . . (fnp (rn ))n>0 convergent.

La suite « diagonale » (gn )n>0 = (fnn )n>0 est extraite de (fn )n>0 et converge sim-
plement sur D car, quel que soit p, dès que n > p la suite (fnn (rp ))n>0 est extraite de la
suite convergente (fnp (rp ))n>0 . Or l’ensemble des gn est contenu dans H , donc équicontinu
dans X. Le théorème de la section précédente assure donc que la suite (gn )n>0 converge
uniformément sur X, donc au sens de d∞ dans C .

Cette démonstration par le procédé diagonal vaut plus généralement chaque fois que
l’espace compact X est séparable, i.e. contient une partie dénombrable et dense, donc pour
la plupart des espaces compacts usuels en Analyse, et ceci même pour F métrique complet
quelconque au lieu de C.

Remarque 2. — D’autres utilisations bien connues du procédé diagonal sont : la démons-


tration par Cantor de la non dénombrabilité de R, le fait que toute limite en norme
d’opérateurs compacts est encore un opérateur compact, et le théorème de Montel que
nous verrons à la section suivante.

Donnons maintenant la preuve du théorème d’Ascoli, valable dans le cas général (et
même si X est un espace topologique compact non nécessairement métrique). Soit H une
partie de C = C (X, F) satisfaisant les conditions (i), (ii) et (iii). D’après (i), l’espace H est
complet donc il suffit, pour vérifier sa compacité, de prouver sa précompacité, i.e. de vérifier
la condition d’ε-recouvrement fini pour ε > 0 arbitrairement petit. Soit donc ε > 0. D’après
(iii) – condition d’équicontinuité, pour tout y ∈ X il existe un ouvert Uy de X, contenant
y et tel que pour toute f ∈ H on a : d (f (x), f (y)) 6 4ε . Par compacité de X, il existe
§ 2 THÉORÈME D’ASCOLI TS II.31

y1 , y2 , . . . yp en nombre fini dans X tel que X soit recouvert par les ouverts Uyi . D’après
(ii) – condition de compacité des ensembles de valeurs, la réunion K = pi=1 H (yi ) est une
S

partie compacte de F, donc il existe des c1 , c2 , . . . cm ∈ K tels que les boules fermées B(cj , 4ε )
(1 6 j 6 m) recouvrent K. Soit Φ l’ensemble des applications i 7→ ϕ(i) de l’ensemble
fini {1; 2; . . . p} dans l’ensemble fini {1; 2; . . . m} : Φ est fini. Pour toute ϕ ∈ Φ, notons Hϕ
l’ensemble des f ∈ H telles que pour tout i ∈ {1; 2; . . . p} on a : d f (yi ), cϕ(i) 6 4 . Il ε


est évident qu’on a : H = ϕ∈Φ Hϕ . Pour achever la démonstration, nous allons voir que
S

si f0 est choisie dans Hϕ et si f est quelconque dans Hϕ , on a : d∞ (f, f0 ) 6 ε. En effet,


soit x ∈ X, et soit i l’un des indices dans {1; 2; . . . p} tels que x ∈ Uyi . On a :
 
d (f0 (x), f (x)) 6 d (f0 (x), f0 (yi )) + d f0 (yi ), cϕ(i) + d cϕ(i) , f (yi ) + d (f (yi ), f (x))
ε ε ε ε
6 + + + = ε,
4 4 4 4
par définition des ouverts Uy et des ensembles de fonctions Hϕ . 
Exercice 2. — L’adhérence dans C (X, F) d’une partie équicontinue est une partie équicon-
tinue. Donc, dans l’énoncé du théorème d’Ascoli « (ii) & (iii) » est une condition nécessaire
et suffisante pour que l’adhérence de H soit compacte.
Exercice 3. — Soit C = C ([0; 1], C). On se donne une fonction continue K(·, ·) sur le carré
[0; 1] × [0; 1] de R2 à valeurs complexes. À toute f ∈ C on fait correspondre la fonction
Tf définie sur [0; 1] par :
Z 1
Tf (x) = K(x, y)f (y) dy.
0
L’application f 7→ Tf s’appelle l’opérateur intégral de noyau K. Soit H l’image par T de
la boule unité de C . Montrer que l’adhérence de H dans C est compacte. Cet exercice
annonce la théorie de Fredholm, qui sera développée plus loin.
Exercice 4. — Si k est un nombre réel > 0, on note Hk l’ensemble des fonctions définies
sur [0; 1], à valeurs réelles, telles que f (0) = 0 et satisfaisant

|f (x) − f (y)| 6 k|x − y| pour tous x, y ∈ [0; 1].


[
On pose E = Hk et pour f ∈ E , on note N(f ) = inf{k > 0 : f ∈ Hk }.
k>0
1◦ Justifier que E est un R-espace vectoriel et que N est une norme sur E .
2◦ Prouver que l’on a kf k∞ 6 N(f ) pour toute f ∈ E mais que k · k∞ et N ne sont
pas des normes équivalentes sur Hk .
3◦ On fixe k > 0. Discuter la compacité de Hk dans (E , k · k∞ ) et dans (E , N(·)).
Exercice 5. — Soit B = B(R, C) l’espace vectoriel des fonctions f bornées dans R, à
valeurs complexes, avec la norme kf k∞ = supx∈R |f (x)|. Soit E le sous-espace vectoriel
fermé de B engendré par les fonctions exponentielles x 7→ exp(iλx), où λ ∈ R. Les fonctions
f ∈ E sont appelées fonctions presque périodiques sur R. Si f ∈ E et τ ∈ R, on note fτ
la fonction telle que fτ (x) = f (x − τ ) pour tout x ∈ R. Montrer que les fτ sont dans
E et que, si f ∈ E est donnée, l’ensemble Hf des fτ , où τ parcourt R, est d’adhérence
compacte dans E. Indication : on commencera par traiter le cas où f est une exponentielle
x 7→ exp(iλx), puis celui où f est un combinaison linéaire g de telles exponentielles ;
TS II.32 THÉORÈME D’ASCOLI § 2

dans le cas général, on prouvera la précompacité pour Hf à partir de celle de Hg pour g


approchant convenablement f .

§ 3. ANALYSE DANS L’ESPACE DES FONCTIONS HOLOMORPHES

Soit U un ensemble ouvert non vide fixé du plan complexe. Notons O(U) l’espace
vectoriel sur C des fonctions f = f (z) définies et holomorphes dans U. On ne fait pas de
O(U) un espace normé, mais pour y pratiquer néanmoins l’Analyse, on utilise la convergence
uniforme sur tout compact de U.
Définition 1. — Une suite (fn )n>0 dans O(U) converge uniformément sur tout com-
pact de U vers une fonction g si :

Pour tout compact X dans U et pour tout ε > 0, il existe N = Nε,X tel que pour tout
n > N et pour tout z ∈ X on a :
|g(z) − fn (z)| 6 ε.
Nous dirons plus brièvement que la suite (fn )n>0 converge vers g dans O(U).
Remarque 1. — 1. Si c’est le cas, la fonction limite est automatiquement holomorphe
dans U, donc appartient à O(U). En effet, soit a ∈ U ; montrons que g est dérivable au
sens complexe au voisinage de a. Soit r > 0 assez petit pour que le disque D = {z ∈ C :
|z − a| 6 r} soit contenu dans U. Pour tout z ∈ D◦ , on a la formule intégrale de Cauchy :
Z
1 fn (ξ)
fn (z) = dξ,
2iπ |z−a|=r ξ − z
qui évidemment converge quand n → ∞ vers
Z
1 g(ξ)
g(z) = dξ,
2iπ |z−a|=r ξ − z
et cette fonction est bien dérivable au sens complexe par rapport à z, sous le signe somme
dans le membre de gauche : pour |z − a| < r, on a :
Z
0 1 g(ξ)
g (z) = dξ.
2iπ |z−a|=r (ξ − z)2
2. Pour vérifier la convergence uniforme sur tout compact, on peut en fait se contenter
de la tester sur une famille particulière (mais bien choisie) de compacts dans X, par exemple
sur la famille des disques fermés. Supposons qu’une suite (fn )n>0 dans O(U) satisfasse la
condition :

Pour tout disque fermé D contenu dans U et pour tout ε > 0, il existe N = Nε,D
tel que pour tout n > N et pour tout z ∈ D on a :
|g(z) − fn (z)| 6 ε.
§ 3 ANALYSE DANS L’ESPACE DES FONCTIONS HOLOMORPHES TS II.33

Il s’agit de voir que (fn )n>0 converge uniformément sur tout compact de U vers g. Soit
X un compact contenu dans U. Tout point a ∈ X est le centre d’un disque fermé DA de
rayon > 0 et contenu dans U. Puisque X est compact, il existe un ensemble fini de points
a1 , a2 , . . . , ap de X tels que
X ⊂ Da1 ∪ Da2 ∪ · · · ∪ Dap .
Soit ε > 0, et soient Nε,Da1 , Nε,Da2 , . . . , Nε,Dap les entiers donnés par la condition de conver-
gence uniforme sur les disques citée ci-dessus. Posons
Nε,X = max Nε,Dai .
16i6p

Si z ∈ X, on a z ∈ Dai pour au moins un indice i ; donc, puisque Nε,X > Nε,Dai :


n > Nε,X =⇒ |g(z) − fn (z)| 6 ε,
ce qui prouve la convergence de (fn )n>0 vers g dans O(U).
Exercice 1. — Il s’agit d’un rappel de théorie élémentaire des séries entières. Soit 0 < R 6
+∞, et soit U = {z ∈ C : |z| < R}. Soit f ∈ O(U). On a : f (z) = a0 + a1 z + a2 z 2 +
· · · + an z n + . . . où la série converge pour tout z ∈ U. Montrer que la suite des sommes
partielles fn définie par fn (z) = nk=0 ak z k converge vers f (z) dans O(U).
P

Définition 2. — Soit H une partie de O(U). On dit que H est bornée dans O(U) si
elle est bornée sur tout compact de U, c’est-à-dire si pour tout compact X de U il existe
une constante MX > 0 telle que pour tout f ∈ H et pour tout z ∈ D on ait |f (z)| 6 MX .
Cette condition est équivalente à la suivante : pour tout disque fermé D de U il existe une
constante MD > 0 telle que pour tout f ∈ H et pour tout z ∈ D on ait |f (z)| 6 MD .

En effet, sous la seconde condition, en s’étant donné un compact X on peut trouver


un recouvrement comme précédemment
X ⊂ Da1 ∪ Da2 ∪ · · · ∪ Dap ,
et il suffit alors de poser
MX = max Mε,Dai
16i6p
pour vérifier la condition pour X.

Dans les deux propositions ci-après nous allons voir que, du point de vue de l’Analyse
dans l’espace O(U), la dérivation est une opération très régulière.
Proposition 1. — Soit (fn )n>0 une suite qui converge vers g dans O(U). Alors la suite
des dérivées (fn0 )n>0 converge vers la dérivée g 0 dans O(U).
Preuve. On va prouver la condition de convergence uniforme sur les disques pour les
dérivées. Soit Da = {z ∈ C : |z − a| 6 r} un disque fermé contenu dans U. Il existe r1 > r
tel que le disque D1a = {z ∈ C : |z − a| 6 r1 } soit encore contenu dans U. Soit ε > 0. Par
l’hypothèse que (fn )n>0 converge vers g dans O(U), il existe Nε tel que pour tout z ∈ D1a
on ait :
(r1 − r)2
|g(z) − fn (z)| 6 ε.
r1
TS II.34 ANALYSE DANS L’ESPACE DES FONCTIONS HOLOMORPHES § 3

Mais alors, pour tout z ∈ Da , d’après la formule intégrale de Cauchy pour la dérivée, on
a:
g(ξ) − fn (ξ)
Z
0 0 1 2πr1 1
|g (z) − fn (z)| = | 2
dξ| 6 sup |g(ξ) − fn (ξ)|
2iπ |ξ−a|=r1 (ξ − z) 2π (r1 − r)2 |ξ−a|=r1
qui est 6 ε dès que n > Nε . Ceci prouve la proposition, par la réduction initiale. 
Exercice 2. — Constater combien cette situation diffère du cas de la variable réelle, en
exhibant une suite (fn )n>0 de fonctions dérivables sur [0; 1] qui converge uniformément
vers une fonction g dérivable, mais telle que les suites numériques (fn0 (x))n>0 n’aient de
limite pour aucun x ∈ [0; 1].
Proposition 2. — Soit H une partie de O(U) et soit H 0 = {f 0 : f ∈ H }. Si H est
bornée dans O(U), alors H 0 l’est aussi.
Preuve. On utilise là aussi la réduction à la famille des disques fermés. Soit Da = {z ∈
C : |z − a| 6 r} un disque fermé contenu dans U. On cherche une constante M0Da telle que
pour toute f ∈ H et tout z ∈ Da on ait : |f 0 (z)| 6 M0Da . Il existe r1 > r tel que le disque
D1a = {z ∈ C : |z − a| 6 r1 } soit encore contenu dans U, et pour tout z ∈ Da on a :
Z
1 f (ξ) 2πr1 1
|f 0 (z)| = | dξ| 6 M 1,
2iπ |ξ−a|=r1 (ξ − z)2 2π (r1 − r)2 Da
où MD1a est une constante provenant de la condition que H est bornée dans O(U). Ceci
prouve la proposition, par la réduction initiale. 
Corollaire 1. — Toute partie bornée dans O(U) est équicontinue.
Preuve. Soit H une partie bornée dans O(U). Soit a ∈ U. Pour démontrer l’équicon-
tinuité de H en a, on se place dans un disque Da centré en a, de rayon > 0, contenu dans
U. D’après la proposition 2, il existe une constante M0Da telle que pour toute f ∈ H et
pour tout z ∈ Da on a : |f 0 (z)| 6 M0Da . En intégrant le long du segment [a; z], on obtient
que, pour toute f ∈ H et pour tout z ∈ Da , on a :
Z z
|f (z) − f (a)| = | f 0 (ξ) dξ 6 |z − a| sup |f 0 (z)| 6 M0Da |z − a| 6 ε
a ξ∈[a;z]
ε
dès que |z − a| 6 0 . 
MDa
Corollaire 2. — Soit (fn )n>0 une suite dans O(U). Supposons que l’ensemble des fn
est borné dans O(U), ce qui signifie que
sup sup |fn (z)| = MX < +∞
n>0 z∈X

pour tout compact X contenu dans U. Supposons de plus que la suite (fn )n>0 converge
simplement dans une partie dense de U. Alors la suite (fn )n>0 converge uniformément sur
tout compact de U, c’est-à-dire dans O(U).
Preuve. Vu le corollaire 1, c’est une conséquence immédiate des propositions 2 et 3
appliquées aux parties compactes X de U. 
§ 3 ANALYSE DANS L’ESPACE DES FONCTIONS HOLOMORPHES TS II.35

Théorème 1 (Montel). — Soit (fn )n>0 une suite dans O(U). Supposons que l’ensemble
des fn est borné dans O(U). Alors on peut extraire de la suite (fn )n>0 une suite convergente
dans O(U).
Preuve. Les points r = x + iy de U avec x, y ∈ Q forment un ensemble D =
{r1 ; r2 ; . . . rn ; . . .} dénombrable et dense dans U. Pour tout r ∈ D l’ensemble de nombres
complexes {fn (r)}n>0 est borné car {r} est compact. Le procédé diagonal utilisé dans la
preuve du théorème d’Ascoli fournit une suite (gn )n>0 extraite de la suite (fn )n>0 , qui
converge simplement en tout point de D, donc dans O(U) d’après le corollaire 2. 

Cet énoncé est remarquable et même étonnant : l’espace O(U), de même que l’espace
de dimension finie Rn , jouit de la propriété de Bolzano-Weierstrass, à savoir que de toute
suite bornée on peut extraire une suite convergente, alors que ceci n’est jamais vrai dans
un espace vectoriel normé de dimension infinie (théorème de F. Riesz).

Voici un complément au théorème de Montel.


Théorème 2 (Vitali). — Soit U un ouvert connexe de C et soit D une partie de U ayant
au moins un point d’accumulation dans U, i.e. D contient au moins une suite injective
(rp )p > 0 qui converge vers un point de U. Soit (fn )n>0 une suite dans O(U). Supposons que
l’ensemble des fn soit borné dans O(U) et que la suite (fn )n>0 converge simplement dans
D. Alors la suite (fn )n>0 converge uniformément sur tout compact de U, c’est-à-dire dans
O(U).
Preuve. Remarque préliminaire : puisque U est connexe, si g1 et g2 sont holomorphes
sur U et si g1 (rp ) = g2 (rp ) pour tout p > 0, alors g1 = g2 par le principe des zéros isolés
appliqué à g1 − g2 .

D’après le théorème 1, il existe des suites extraites de (fn )n>0 qui convergent dans
O(U). Par la remarque préliminaire et l’hyptohèse que la suite (fn )n>0 converge simplement
dans D, donc en chaque rp , pour toute telle sous-suite convergente, la limite g(z) est
toujours la même (car elle est déterminée par ses valeurs en les rp ). Par l’absurde, supposons
que (fn )n>0 ne converge pas vers g dans O(U). Il existe alors un compact X de U et un
α > 0 tels que, pour tout entier k > 1, il existe un entier nk et un zk ∈ X, avec nk > nk−1
et |g(zk ) − fnk (zk )| > α. De la suite bornée (fnk )k > 0 on ne peut extraire aucune sous-suite
convergente (ce qui est en contradiction avec le théorème 1), car cette dernière suite devrait
alors converger vers g tout en satisfaisant les inégalités |g(zk ) − fnk (zk )| > α. 
Exercice 3. — On pose, pour tout z ∈ C :
z zn
exp(z) = 1 + z + + · · · + + ...
2 n!
 z n
Montrer que exp(z) = lim 1 + en procédant comme suit.

n→∞ n
1 Vérifier que c’est vrai pour tous les z réels > 0 en passant au logarithme.
2◦ Montrer que la suite (fn )n>0 , où fn (z) = (1 + nz )n , est bornée dans O(C).
3◦ En déduire, par le théorème de Vitali, que (fn )n>0 converge dans O(C), disons
vers g.
TS II.36 ANALYSE DANS L’ESPACE DES FONCTIONS HOLOMORPHES § 3

4◦ Constater que g(z) = exp(z) car c’est vrai pour z réel > 0.

Exercice 4. — Soit U le disque {z ∈ C : |z − 1| < 1}. Si z ∈ U on pose :

X (1 − z)m
log(z) = − ,
m
m>1

somme d’une série absolument convergente, et

n
X (1 − z)m
fn (z) = − .
m
m=1

1◦ Si z est réel et dans U, constater que log(z) est la fonction bien connue telle que
exp (log(z)) = z.
2◦ Montrer que, quand n → ∞, la suite (exp ◦fn )n>1 converge dans O(U).
3◦ En déduire que, pour tout z ∈ U, on a : exp (log(z)) = z.

Exercice 5. — Soit C = C ([− 12 ; 12 ], R), et soit H le sous-ensemble de C formé des fonc-


tions polynomiales à coefficients réels tous 6 1 en valeur absolue. Soit H l’adhérence de
H dans C .

1◦ Montrer que, pour toute f ∈ H , la dérivé df dx est bornée en valeur absolue par 4
1 1
sur [− 2 ; 2 ].
2◦ En déduire que H est équicontinu dans [− 12 ; 21 ].
3◦ Montrer que H est un sous-ensemble convexe et compact dans C .
4◦ En appliquant le théorème de Vitali, montrer que toute f ∈ H est la restriction
au segment [− 12 ; 21 ] d’une fonction holomorphe dans le disque unité ouvert de C, notée fe.
5◦ Caractériser les fonctions fe où f ∈ H , par une propriété de leurs coefficients de
Taylor à l’origine. Indication : on pourra utiliserZla formule, pour n > 0 et 0 6 r < 1,

1
donnant ces coefficients an , à savoir : an rn = fe(reiθ )e−inθ dθ.
2π 0
6◦ Déterminer l’ensemble des points extrémaux de H .

Exercice 6. — Soit U la bande {z = x + iy : 0 < x < 1; y > 0}. Soit f une fonction
holomorphe et bornée dans U. Supposons que l = lim f ( 12 + iy) existe. Montrer qu’alors,
y→+∞
pour tout x ∈]0; 1[, on a :

lim f (x + iy)
y→+∞

et ceci uniformément pour x ∈ [a; b] quels que soient a < b dans ]0; 1[. Indication : appliquer
le théorème de Vitali à la suite fn (z) = f (z + in) dans le rectangle défini par 0 < x < 1 et
0 < y < 2.
§ 4 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT TS II.37

§ 4. APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR


UN COMPACT

Dans tout ce paragraphe, X désigne un espace compact, et C = C (X, R) est l’espace


de Banach sur R des fonctions continues sur X à valeurs réelles, muni de la norme de la
convergence uniforme :
kf k∞ = sup |f (x)|.
x∈X
Outre les opérations vectorielles, on a dans C :

• la multiplication des fonctions : pour f, g ∈ C , la fonction f g est définie par


(f g)(x) = f (x)g(x) pour tout x ∈ X ; la compatibilité avec la norme est l’inégalité de
sous-multiplicativité :
kf gk∞ 6 kf k∞ · kgk∞ ,
ce qui fait de C une algèbre de Banach dont la théorie générale sera développée plus loin
dans ce cours.
• la relation d’ordre 6 , où f 6 g signifie que f (x) 6 g(x) pour tout x ∈ X. Si f et g
sont dans C , on définit leurs enveloppe supérieure sup(f, g) et enveloppe inférieure inf(f, g)
par les formules pour tout x ∈ X :
sup(f, g)(x) = max{f (x); g(x)} et inf(f, g)(x) = min{f (x); g(x)}.

Exercice 1. — Justifier que les fonctions sup(f, g) et inf(f, g) sont dans C puis, en défi-
nissant |f | par |f |(x) = |f (x)| pour tout x ∈ X, démontrer les formules :
1 1
|f | = sup(f, −f ), sup(f, g) = (f + g + |f − g|) et inf(f, g) = (f + g − |f − g|) .
2 2
Montrer que f 7→ |f | est une application continue de C dans lui-même.
Soit H une partie de C et soit H son adhérence dans C . Soit f ∈ C . On dit que
f peut être approchée uniformément dans X par des fonctions appartenant à H si f
appartient à H , autrement dit si : quel que soit ε > 0 il existe une fonction uε ∈ H telle
que, quel que soit x ∈ X, on ait : |f (x) − uε (x)| 6 ε.

Dire que toute fonction continue sur X peut être approchée uniformément dans X par des
fonctions appartenant à H , c’est donc dire que H = C , ou encore que H est dense dans
l’espace de Banach C . L’exemple historique est le théorème de Weierstrass, dont l’énoncé
est que toute fonction continue [0; 1] est limite uniforme sur [0; 1] de fonctions polynomiales.
C’est cet énoncé que nous allons retrouver après l’avoir généralisé considérablement, suivant
les idées de M. Stone.
Théorème 1 (Stone-Weierstrass). — Soit X un espace compact. On se donne H une
partie de C = C (X, R) telle que :

(i) H est un sous-espace vectoriel de C ;


(ii) H est stable par multiplication : si u, v ∈ H , alors uv ∈ H ;
(iii) H contient la fonction constante égale à 1 ;
(iv) H sépare X : pour tous x 6= x0 dans X, il existe u ∈ H telle que u(x) 6= u(y).
TS II.38 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT § 4

Alors H = C .

On retrouve bien le théorème historique en prenant X = [0; 1] et H l’ensemble des fonctions


polynomiales sur [0; 1] ; le seul polynôme x 7→ x sert ici à séparer les points de X.

En fait, Stone a su dégager l’importance, dans la question, de la relation d’ordre sur


C ; le théorème de Stone-Weierstrass sera obtenu comme conséquence du

Théorème 2 (Stone). — Soit X un espace compact. On se donne H une partie de


C = C (X, R) telle que :

(i) H est un sous-espace vectoriel de C ;


(ii0 ) H est stable par prise de valeur absolue : si u ∈ H , alors |u| ∈ H ;
(iii) H contient la fonction constante égale à 1 ;
(iv) H sépare X.

Alors H = C .

Nous commençons par établir un lemme dont la démonstration est un bel argument
de compacité.

Lemme 1. — Soit H une partie de C telle que si u1 et u2 sont dans H , alors


max(u1 , u2 ) ∈ H . Soit f ∈ C (X; R). On suppose que pour tout y ∈ X il existe uy ∈ H
telle que uy (y) > f (y). Alors il existe v ∈ H telle que v(x) > f (x) pour tout x ∈ X.

Preuve. Pour chaque y ∈ X, note Uy = {x ∈ X : uy (x) > f (x)} : c’est un ouvert


car c’est l’image réciproque de R×
+ par la fonction continue uy − f ; en outre y ∈ Uy . Par
compacité de X, qui est réunion de tous les Uy , on peut écrire X = Uy1 ∪ Uy2 ∪ · · · ∪ Uyp
pour des yi convenables et en nombre fini.

Par récurrence finie, la fonction v : x 7→ max{uy1 (x); uy2 (x); . . . uyp (x)} est dans H . Elle
convient car un élément quelconque x ∈ X est dans un Uyi au moins et on peut écrire :

v(x) > uyi (x) > f (x). 

De ce lemme, on déduit déjà le remarquable :

Théorème 3 (Dini). — Soit X un espace compact. Soit (fn )n>0 une suite de fonctions
continues de X dans R. On fait les hypothèses suivantes.

(i) La suite (fn )n>0 converge simplement vers f dans C (X, R).
(ii) La suite (fn )n>0 est monotone, c’est-à-dire ou bien décroissante ou bien crois-
sante.

Alors (fn )n>0 converge uniformément vers f , c’est-à-dire converge vers f pour la
norme k · k∞ .

Preuve. On travaille dans le cas où la suite (fn )n>0 est croissante (cas auquel on peut
toujours se ramener, quitte à opposer les fonctions). Alors, par monotonie la famille H =
{fn }n>0 est stable par passage au maximum car pour m > n, on a : max{fn ; fm } = fm .
§ 4 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT TS II.39

Maintenant on se donne ε > 0. Par convergence simple, pour tout y ∈ X il existe u ∈ H


telle que u(y) > f (y) − ε. On applique le lemme précédent à la fonction f − ε (toujours
avec H = {fn }n>0 ) : il existe N tel que pour tout x ∈ X on ait :

fN (x) > f (x) − ε.

Finalement, pour tout indice n > N et pour tout x ∈ X, on a :

f (x) − ε < fN (x) 6 fn (x) 6 f (x),

soit kf − fn k∞ 6 ε pour tout n > N. 

Le théorème de Dini a pour conséquence ce premier énoncé, d’apparence anecdotique,


mais utile pour prouver le théorème de Weierstrass historique (approximation uniforme
des fonctions continues sur un segment compact par des fonctions polynomiales).

Lemme 2. — On définit une suite (pn )n>0 de fonctions [0; 1] → R par p1 (x) = 0 pour tout
x ∈ [0; 1] et
1
x − pn (x)2 .

pn+1 (x) = pn (x) +
2

Alors les fonctions pn sont polynomiales et convergent uniformémement vers x 7→ x sur
[0; 1].

Remarqu’ons qu’en remplaçant pn (x) par pn (x2 ), on voit que la fonction valeur absolue
x 7→ |x| est limite uniforme de fonctions polynomiales sur [0; 1].

Preuve. Pour tout n > 1, un calcul montre que :


√ √ 1 √
 
 
x − pn+1 (x) = x − pn (x) 1 − x + pn (x) ,
2
ce qui permet de voir par récurrence que

pn (x) > 0 et pn (x) 6 pn+1 (x) 6 x pour tout x ∈ [0; 1].

À x fixé la suite numérique (pn (x))n>0 est croissante et majorée. Elle converge donc vers

g(x) qui satisfait g(x) = g(x) + 21 x − g(x)2 , autrement dit vers g(x) = x. Ainsi on


vient de voir que · est limite simple des pn sur [0; 1], et le théorème de Dini assure que
la convergence est uniforme. 

La proposition suivante est au cœur de la démonstration de Stone ; sa démonstration


n’est pas vraiment délicate si l’on a compris la preuve du lemme 1.

Proposition 1. — Soit H une partie de C stable par prise d’enveloppe supérieure et


inférieure, i.e. telle que si u1 et u2 sont dans H , alors sup(u1 , u2 ) ∈ H et inf(u1 , u2 ) ∈ H .
Soit f ∈ C . On suppose que pour tout ε > 0 et quels que soient x, y ∈ X il existe une
fonction ux,y telle que

|f (x) − ux,y (x)| < ε et |f (y) − ux,y (y)| < ε.

Alors H = C .
TS II.40 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT § 4

Preuve. Soit ε > 0. Si x ∈ X, notons Hx l’ensemble des fonctions u ∈ H telles que


u(x) < f (x) + ε. Par hypothèse, pour tout y ∈ X, on a :
ux,y ∈ Hx et ux,y (y) > f (y) − ε.
De plus u1 , u2 ∈ Hx entraîne que sup(u1 , u2 ) ∈ Hx . Donc, d’après le lemme 1, il existe
une fonction ux ∈ Hx telle que pour tout z ∈ X on a :
ux (z) > f (z) − ε.
Puisque ux ∈ Hx , on a de plus : ux (x) < f (x) + ε. Soit H 0 l’ensemble des u ∈ H telles
que l’on ait u(z) > f (z) − ε pour tout z ∈ X. Si u1 et u2 sont dans H 0 , il est clair que
inf(u1 , u2 ) ∈ H 0 . Comme les ux appartiennent à H 0 et vérifient ux (x) < f (x) + ε, d’après
le lemme 1 il existe u ∈ H 0 telle que quel que soit z ∈ X on a : u(z) < f (z)+ε. Finalement,
pour cette fonction u, qui est évidemment dans H , on a : kf − uk∞ 6 ε. 
Corollaire 1. — Soit X un espace compact ayant au moins deux éléments. Soit H une
partie de C telle que :

(i) H est stable par prise d’enveloppe supérieure et inférieure ;


(ii) quels que soient x 6= y dans X et α, β ∈ R, il existe g ∈ H telle que g(x) = α et
g(y) = β.

Alors H = C .
Preuve. Soit f ∈ C . Montrons que f et H satisfont aux hypothèse de la proposition
précédente. Si x 6= y, on y satisfait (pour tout ε > 0) en prenant pour ux,y la fonction g
de la condition (ii) ci-dessus pour le choix de α = f (x) et β = f (y). Si x = y, prenons un
z 6= x ; il suffit alors de choisir pour ux,y la fonction g de la condition (ii) ci-dessus pour le
choix de α = f (x) = f (y) et β = f (z). 
Exercice 2. — Par ce corollaire, démontrer que dans C ([0; 1], R) est uniformément dense
l’ensemble des fonctions dont le graphe est une ligne polygonales à nombre fini de côtés.
Maintenant, tout est prêt pour obtenir sans effort la preuve du théorème de Stone.

Preuve. Les hypothèses (i) et (ii0 ) entraînent que H est stable par prise d’enveloppe
supérieure et inférieure, car :
1 1
sup(f, g) = (f + g + |f − g|) et inf(f, g) = (f + g − |f − g|) .
2 2
Si X est réduit à un point, le théorème de Stone est évident (et sans intérêt). Désormais, on
se place dans le cas où X a au moins deux éléments. Si x 6= y sont dans X et si α, β ∈ R,
donnons-nous grâce à l’hypothèse (iv) une fonction h ∈ H telle que h(x) 6= h(y). On
considère alors la fonction g définie par :
h(z) − h(x)
z 7→ g(z) = α1 + (β − α) .
h(y) − h(x)
Cette fonction g est dans H par les hypothèses (i) et (iii), et tout a été fait pour que
g(x) = α et g(y) = β. Donc H = C par le corollaire qui précède. 
§ 4 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT TS II.41

Exercice 3. — Soit (X, d) un espace métrique compact. Soit H l’ensemble des fonctions
lipschitziennes sur X, i.e. telles qu’il existe une constante k (dépendant de f ) pour laquelle
on ait |f (x)−f (y)| 6 kd(x, y) quels que soient x, y ∈ X. Montrer que H est uniformément
dense dans C (X, R).

Passons maintenant à la démonstration du théorème de Stone-Weierstrass.

Preuve. On va le déduire du théorème de Stone ; il suffit de voir que les hypothèses (i)
à (iv) du théorème de Stone-Weierstrass entraînent l’hypothèse (ii0 ) du théorème de Stone.
En fait, il suffit de voir que ces quatre hypothèse entraînent

(ii00 ) u ∈ H ⇒ |u| ∈ H .

C’est une condition plus faible en apparence que (ii0 ), mais l’astuce est la suivante : vu
la continuité de l’application u 7→ |u| de C dans lui-même, on saura alors que u ∈ H
implique |u| ∈ H , et puisque que H est un sous-espace vectoriel, on lui appliquera le
théorème de Stone, ce qui donnera H = C , soit H = C puisque H = H .

Pour vérifier (ii00 ), on se ramène au cas u 6= 0. Posons alors a = kuk∞ . Soient les
polynômes pn du lemme 2, qui approchent uniformément la fonction racine carrée sur
2
[0; 1]. La suite de fonctions un = apn ( ua2 ) est dans H d’après les hypothèses (i) à (iii).
Laqsuite des fonctions un , quand n → ∞, converge uniformément dans X vers la fonction
u2
a a2
= |u|. Donc u ∈ H , ce qui montre que la condition (ii00 ) est satisfaite. 

Relisez l’énoncé du théorème de Stone-Weierstrass et constatez que, plus brièvement,


il peut se lire : toute sous-algèbre de C (X, R), qui contient 1 et sépare X, est dense dans
C (X, R).

Nous pouvons maintenant dérouler une série de corollaires importants.

Corollaire 2 (Weierstrass classique). — Soit X une partie fermée et bornée de Rn .


Alors toute fonction f ∈ C (X, R) est limite uniforme sur X d’une suite de fonctions
(pk (x1 , x2 , . . . , xn ))n>0 polynomiales en n variables et à coefficients réels.

Preuve. En effet, un tel X est compact dans Rn par Borel-Lebesgue ; l’ensemble H


des fonctions polynomiales satisfait les conditions (i), (ii) et (iii), ainsi que (iv) car si x
et y sont distincts dans Rn , l’une au moins de leurs coordonnées diffèrent (les fonctions
coordonnées sont bien sûr polynomiales, de degré 1). 

Corollaire 3 (Stone-Weierstrass complexe). — Soit X un espace compact. On se donne


H une partie de C = C (X, C) telle que :

(i) H est un sous-espace vectoriel de C ;


(ii) H est stable par produit : si u, v ∈ H , alors uv ∈ H ;
(iii) H contient la fonction constante égale à 1 ;
(iv) H sépare X ; et
(v) H est stable par conjugaison complexe : u ∈ H entraîne u ∈ H , où u est la
fonction sur X définie par u(x) = u(x) pour tout x ∈ X.
TS II.42 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT § 4

Alors H = C , i.e. toute fonction continue à valeurs complexes sur X peut être approchée
uniformément sur X par des fonctions dans H .
Plus brièvement : toute sous-algèbre de C (X, C), contenant 1, séparante et auto-
adjointe, est dense dans l’espace de Banach C (X, C).

Preuve. Soit HR l’ensemble des u ∈ H telles que u(X) ⊂ R. Il est clair que HR ⊂
C (X, R) satisfait les conditions (i), (ii), (iii) du théorème de Stone-Weierstrass. De plus,
HR satisfait (iv), c’est-à-dire sépare X : en effet, soient x, y ∈ X avec x 6= y ; il existe
u ∈ H telle que u(x) 6= u(y) ; les fonctions R(u) = u+u 2 et I(u) = 2i sont dans HR et
u−u

l’une au moins prend des valeurs différentes en x et en y car u = R(u) + iI(u). Ainsi, par
le théorème de Stone-Weierstrass toute fonction f ∈ C (X, R) est approchée uniformément
sur X par des u ∈ HR . 
Exercice 4. — Soit X un sous-ensemble compact de C.

1◦ Montrer que toute fonction f ∈ C (X, C) peut être approchée uniformément sur X
par des fonctions polynomiales en les variables z et z, à coefficients complexes.
2◦ Soit X le disque unité {z ∈ C : |z| 6 1}. Soit H l’adhérence dans C (X, C) de
l’ensemble des polynômes à coefficients complexes en la seule variable z. Montrer que pour
toute f ∈ H on a la formule :
Z 2π
1
f (0) = f (eiθ ) dθ,
2π 0
et que, en revanche, la fonction continue f (z) = |z| ne possède pas cette propriété.
3◦ En déduire que H est différent de C (X, C).
Exercice 5. — Soit a 6 b des nombres réels. Montrer que l’ensemble des fonctions de la
forme x 7→ nk=0 λk exp(nn x) où les λk appartiennent à R, les nk à N et n est un indice
P

entier, est uniformément dense dans C ([a; b], R).


Corollaire 4. — Soient X et Y des espaces compacts. Dans l’espace de Banach C (X ×
Y, R) est dense l’ensemble H des sommes finies de fonctions (x, y) 7→ f (x)g(y) où f ∈
C (X, R) et g ∈ C (Y, R).

Preuve. En effet, H est une sous-algèbre de C (X × Y, R) et deux points (x1 , y1 ) = 6


(x2 , y2 ) de X × Y, où par exemple x1 6= x2 , sont séparés par dX (x1 , ·) qui est dans H . 

Ce corollaire, très utile, permet de travailler à variables séparées pour des problèmes
à deux variables.
Corollaire 5. — Toute fonction f = f (x) continue sur R, à valeurs complexes, et de
n
X
période 2π, est limite uniforme sur R de polynômes trigonométriques ak eikx où n ∈ N
k=−n
et les ak appartiennent à C.
Preuve. Soit X le cercle {e ∈ C : |z| = 1} ; il est compact. À toute f ∈ C (R, C)
de période 2π, associons la fonction fe définie sur X par la formule fe(eix ) = f (x) où
0 6 x 6 2π. L’ensemble H des ge, où g est un polynôme trigonométrique sur R, n’est
§ 4 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT TS II.43

n
X
autre que l’ensemble H des fonctions z 7→ ak z k , où n ∈ N et les ak appartiennent
k=−n
à C. Il est clair que H remplit les hypothèses (i) à (v) du corollaire 3, ce qui achève la
démonstration puisqu’évidemment :

sup |f (x) − gn (x)| = sup |fe(z) − gen (z)|. 


x∈R z∈X

Exercice 6. — 1◦ Utilisez vos connaissances classiques sur les séries de Fourier (théo-
rème de Fejer) pour préciser l’énoncé du corollaire précédent.
2◦ Plus généralement, donnez un énoncé du type du corollaire précédent pour les
fonctions périodiques de plusieurs variables.
Exercice 7. — On suppose connu (par exemple par le théorème de Fejer) le fait que toute
fonction continue de période 2π est limite uniforme sur R de polynômes trigonométriques.
En déduire une démonstration du théorème de Weierstrass historique : on se ramène à
démontrer que les fonctions x 7→ sin(nx) et x 7→ cos(nx) sont sur [0; 2π] limites uniformes
de fonctions polynomiales, ce qui résulte de leur développement en série de Taylor.
Revenons au théorème de Weierstrass historique : toute f ∈ C ([0; 1], R) est limite
uniforme sur [0; 1] d’une suite (Pn )n>0 de fonctions polynomiales à coefficients réels. Si f
est donnée, peut-on préciser explicitement de tels Pn qui conviennent pour approximer f ?
Réponse : oui.
Théorème 4 (Bernstein). — Si f ∈ C ([0; 1], R), posons pour tout n > 1 :
n
X k
Pn (x) = Ckn f ( )xk (1 − x)n−k x ∈ [0; 1].
n
k=0
Alors :
lim kf − Pn k = 0.
n→∞
La démonstration commence, de façon élémentaire, par le
Lemme 3. — Pour 1 6 k 6 n, posons :
rkn (x) = rk (x) = Ckn xk (1 − x)n−k .
Alors :

1. nk=0 rk (x) = 1 ;
P

2. nk=0 krk (x) = nx ;


P

3. nk=0 k(k − 1)rk (x) = n(n − 1)x2 ;


P
Pn
4. k=0 (k − nx)2 rk (x) = nx(1 − x).
Preuve. La formule 1. est la formule du binôme. Pour 2, on calcule :
n n
X X (n − 1)!
krk (x) = nx xk−1 (1 − x)n−1−(k−1)
(k − 1)! ((n − 1) − (k − 1))!
k=0 k=1
n−1
X (n − 1)!
= nx xk (1 − x)n−1−k = nx.
k!(n − 1 − k)!
k=0
TS II.44 APPROXIMATION UNIFORME DES FONCTIONS CONTINUES SUR UN COMPACT § 4

Pour 3, on calcule également :


n n
X X (n − 2)!
k(k−1)Ckn xk (1−x)n−k = n(n−1)x 2
xk−2 (1−x)n−2−(k−2)
(k − 2)! ((n − 2) − (k − 2))!
k=0 k=2

n−2
2
X (n − 2)!
= n(n − 1)x xk (1 − x)n−2−k = n(n − 1)x2 .
k!(n − 2 − k)!
k=0
Enfin, le premier membre de 4 vaut :
X X X X X
k 2 rk (x)−2nx krk (x)+n2 x2 rk (x) = k(k−1)rk (x)−(2nx−1) krk (x)+n2 x2 = nx(1−x),
k k k k k

d’après 2 et 3 déjà démontrées. 

Passons à la démonstration du théorème de Bernstein.

Preuve. Soit f ∈ C et soit ε > 0. La fonction f est uniformément continue sur [0; 1]
par le théorème de Heine, donc on peut choisir δ > 0 tel que
ε
|x − x0 | 6 δ ⇒ |f (x) − f (x0 )| 6 .
2
Fixons désormais un tel δ (qui ne dépend que de ε).

Pour tout n entier > 0 et tout x ∈ [0; 1], on a :


n n  
X k X k
|f (x) − Pn (x)| = |f (x) − f ( )rk (x)| = | f (x) − f ( ) rk (x)|
n n
k=0 k=0
 
X k X k
6 |f (x) − f ( )|rk (x) + | f (x) − f ( ) rk (x)|,
n n
k:|k−nx| 6 δn k:|k−nx|>δn

et donc par 1 et choix de δ :


 
ε X k
|f (x) − Pn (x)| 6 + | f (x) − f ( ) rk (x)|.
2 n
k:|k−nx|>δn

Mais, d’autre part :


 
X k X
| f (x) − f ( ) rk (x)| 6 2kf k∞ rk (x)
n
k:|k−nx|>δn k:|k−nx|>δn
n
2kf k∞ X 2kf k∞ X
6 (k − nx)2 rk (x) 6 (k − nx)2 rk (x)
δ 2 n2 δ 2 n2
k:|k−nx|>δn k=0

2kf k∞ 2kf k∞ 1
nx(1 − x) 6 ,
δ 2 n2 δ2 n
ε
qui est aussi 6 2 dès que n est assez grand. 

Notons qu’à degré n fixé, le polynôme de Bernstein Pn de f n’est pas le meilleur


polynôme d’approximation uniforme de f sur [0; 1].
§ 5 THÉORÈME D’URYSOHN TS II.45

§ 5. THÉORÈME D’URYSOHN

Dans un espace compact X, peut-on prolonger toute fonction définie et continue sur
un sous-ensemble fermé de X en une fonction continue sur X tout entier ? La question est
naturelle et la réponse affirmative.

Théorème 1 (Urysohn). — Soit X un espace compact et soit Y un sous-ensemble fermé


de X. Alors toute f ∈ C (Y, R) est la restriction à Y d’une fonction F ∈ C (X, R).

Preuve. Soit H l’ensemble des restrictions à Y des fonctions continues sur X. Pour le
compact Y, l’ensemble H satisfait aux hypothèses (i), (ii) et (iii) du théorème de Stone-
Weierstrass. De plus, H sépare Y, car si y1 ∈ Y, y2 ∈ Y et y1 6= y2 , la fonction x 7→ d(y, x)
est définie et continue sur X et sa restriction à Y sépare y1 et y2 . En appliquant le théorème
de Stone-Weierstrass, on trouve déjà que l’ensemble des restrictions à Y des F ∈ C (X, R)
est uniformément dense dans C (Y, R) ; c’est un pas en direction du théorème mais il faut
faire mieux. Donc on sait déjà que :

pour toute g ∈ C (Y, R) et pour tout ε > 0 il existe gε ∈ C (X, R) telle que :
|g(y) − gε (y)| 6 ε pour tout y ∈ Y.

Dans cette notation gε , on peut même supposer que


kgε k∞,C (X,R) = kgε k∞,C (Y,R)
quitte à tronquer gε en la remplaçant par la fonction sup (α, inf(β, gε )) où α = inf y∈Y g(y)
et β = supy∈Y g(y).

Soit f ∈ C (Y, R). Par récurrence, définissons une suite g (n) d’éléments de C (X, R)
par les formules :
n−1
X
g (1) = f 1 et g (n) = (f − g (i) ) 1 pour n > 1.
2 2n
i=1
1
Par définition du symbole gε , employé ici pour ε valant les 2n , on a donc :
k
X 1
|f (y) − g (i) (y)| 6 pour tout y ∈ Y
2n
i=1

et
1
|g (n) (x)| 6 pour tout x ∈ X.
2n−1

X
Ainsi la série de fonctions g (n) (x) converge uniformément sur X vers une fonction F
n=1
continue et, pour tout y ∈ Y, on a : F(y) = f (y). 

Corollaire 1. — Soient Y1 et Y2 deux fermés disjoints dans un espace compact X. Alors


il existe une f ∈ C (X, R) telle que
0 6 f 6 1, f (y) = 1 si y ∈ Y1 et f (y) = 0 si y ∈ Y2 .
TS II.46 THÉORÈME D’URYSOHN § 5

Preuve. La fonction constante égale à 1 sur Y1 et constante égale à 0 sur Y2 est


continue sur Y1 ∪ Y2 . Si F est un prolongement de cette fonction en une fonction continue
sur X , il suffit de poser f = sup (0, inf(1, F)). 
Exercice 1. — Montrer que le corollaire est satisfait dans tout espace métrique X, même
non compact, en posant
d(x, Y2 )
f (x) = ,
d(x, Y1 ) + d(x, Y2 )
où, si Y est fermé dans X, on pose d(x, Y) = inf y∈Y d(x, y).
chapitre iii

Le théorème de Baire
et ses applications

L’Analyse fournit des exemples divers et importants d’espaces métriques complets :


les espaces Rn , les espaces Lp de la théorie de la mesure, notamment L1 et L2 , l’espace
(C (X), k·k∞ ) des fonctions continues sur X compact, l’espace de Hilbert des fonctions f
holomorphes sur un ouvert U de C telles que kf k2 = U |f (z)|2 dz < +∞, l’espace L (E, F)
R

des applications linéaires continues d’un espace normé vers un espace de Banach F, avec
la norme :
|||ϕ||| = sup kϕ(x)kF = sup kϕ(x)kF
kxkE 6 1 kxkE =1
si E 6= {0}, sont des espaces complets, i.e. dans lesquels toute suite de Cauchy est conver-
gente. De plus, si E est complet, tout sous-ensemble fermé de E est lui-même complet, en
tant que sous-espace métrique de E, par exemple le segment [0; 1] de R.

Influencé par les idées de Cantor sur le dénombrable et le transfini, René Baire (1874-
1932) a découvert en 1899 dans le cas de Rn un théorème, qui en fait est valable dans
tout espace métrique complet (et aussi dans tout sous-espace ouvert non vide d’un tel
espace), et qui dit que si un tel espace n’est pas vide, il ne peut être réunion d’une suite
(i.e. d’une famille dénombrable) de fermés tous d’intérieur vide, alors qu’en revanche, il est
par exemple réunion de la famille de tous ses points, lesquels sont fermés d’intérieur vide
en général. On voit donc combien les hypothèses de dénombrabilité sont essentielles dans
le théorie de Baire.

Ce théorème a d’abord des applications à la théorie des fonctions discontinues ; si une


telle fonction est limite simple de fonctions continues, alors elle n’est pas trop discontinue :
l’ensemble des points où elle est discontinue est maigre en un sens que nous préciserons.

D’autres applications du théorème de Baire apparaissent en théorie des espaces de


Banach. Dans cette théorie, il y a trois résultats fondamentaux. L’un d’eux, le théorème de
Hahn-Banach, a été étudié au chapitre I. Les deux autres, le théorème de Banach-Steinhaus
et le théorème de l’application ouverte (ou théorème de Banach) sont des conséquences du
TS III.48 LE THÉORÈME DE BAIRE ET SES APPLICATIONS Chapitre III

théorème de Baire ; ils sont établis dans le présent chapitre, avec quelques applications
à la théorie de l’approximation, par exemple la non convergence uniforme du procédé
d’interpolation de Lagrange, la non convergence en général de la série de Fourier d’une
application continue etc.

§ 1. THÉORÈME DE BAIRE

Commençons par formuler un lemme sur les espaces métriques complet.


Lemme 1 (Cantor). — Soit (E, d) un espace métrique complet. Soit (Fn )n>0 une suite
décroissante pour l’inclusion de fermés non vides de E dont les diamètres
δ(Fn ) = sup d(x, x0 )
x,x0 ∈Fn

tendent vers 0 quand n → ∞. Alors l’intersection des Fn n’est pas vide ; elle est en fait
réduite à un point.
Preuve. Pour tout entier n > 0, choisissons un point xn dans l’ensemble non vide Fn .
Si m > n, les points xm et xn sont dans Fn par décroissance de (Fn )n>0 , donc
m > n ⇒ d(xm , xn ) 6 δ(Fn ) 6 ε
dès que n est assez grand puisque lim δ(Fn ) = 0. Ceci prouve que la suite (xn )n>0 est de
n→∞
Cauchy, et donc qu’elle a une limite, disons x, puisque E est complet.

Pour p entier fixé, montrons que x ∈ Fp . Pour tout k > 0, le point xp+k est dans Fp ,
donc puisque Fp est fermé :
x = lim xp+k ∈ Fp .
k→∞
\
En fait, Fn = {x} car si y est dans cette intersection on a pour tout n : d(x, y) 6 δ(Fn ),
n>0
et donc en faisant n → ∞ on obtient : d(x, y) = 0. 
Exercice 1. — Soit (E, d) un espace métrique complet. Soit 0 6 k < 1. Soit f une appli-
cation de E dans E contractante de rapport k : pour tous x, y ∈ E, on a :
d (f (x), f (y)) 6 d(x, y).
Pour tout entier n > 1, soit Fn = {x ∈ E : d (f (x), x) 6 n1 }. En appliquant aux parties
Fn le lemme de Cantor, retrouver un théorème de Banach.
Rappelons maintenant quelques notions de topologie dans un espace métrique (E, d).
Dire qu’une partie X est dense dans E, c’est dire que :

pour tout x ∈ E on a une suite (xn )n>0 dans X telle que lim xn = x ;
n→∞
ou encore : l’adhérence de X est E tout entier ;
ou encore : pour tout y ∈ E et tout ε > 0, on a B(y, ε) ∩ X 6= ∅ ;
ou encore : pour tout ouvert non vide U de E, a U ∩ X 6= ∅.
§ 1 THÉORÈME DE BAIRE TS III.49

Soit X une partie de E. L’intérieur X◦ de X est le plus grand ouvert de E contenu


dans X ; autrement dit, c’est la réunion des ouverts de E contenus dans X. Un élément
y ∈ E appartient à X◦ (on dit aussi que y est un point intérieur à X) s’il existe r > 0 tel
que B(y, r) ⊂ X. Souvent, X◦ est vide (penser à sous-espace vectoriel X strictement inclus
dans un espace vectoriel normé E) ; dans ce cas, on dit que X est sans point intérieur, ou
encore d’intérieur vide.

Pour relier les deux précédentes notions, on peut remarquer qu’une partie X est dense
dans E si, et seulement si, son complémentaire E X est d’intérieur vide : X = E ⇔
(E X)◦ = ∅, et donc X◦ = ∅ ⇔ E X = X.

Rappelons aussi la structure des ouverts de R : tout ouvert de R est réunion au


plus dénombrable d’intervalles ouverts deux à deux disjoints (qui sont ses composantes
connexes).

Exercice 2. — Redémontrez ce fait.

Dans l’exemple le plus simple, le théorème de Baire dit que R n’est pas réunion
dénombrable de fermés d’intérieur vide. Plus généralement :

Théorème 1 (Baire). — Dans un espace métrique complet (E, d) non vide, les assertions
suivantes sont satisfaites :

(i) l’intersection de toute suite, i.e. de toute famille dénombrable, d’ouverts denses est
non vide, et en fait est même encore dense ;
(ii) l’intersection de toute suite, i.e. de toute famille dénombrable, de fermés d’inté-
rieur vide est encore d’intérieur vide, et en particulier n’est pas l’espace E tout entier.

Ainsi, un espace métrique complet n’est pas réunion dénombrable de fermés sans point
intérieur.

Preuve. Le point (ii) équivaut à (i) par passage au complémentaire. Prouvons (i). Soit
(Un )n>0 une suite\d’ouverts tous denses dans E. Soit V un ouvert non vide de E. On va
prouver que V ∩ Un n’est pas vide. Par récurrence sur n, construisons une suite de
n>0
boules ouvertes B(xn , rn ) telles que

B(x1 , r1 ) ⊂ U1 ∩ V (possible car U1 ∩ V 6= ∅, vu que U1 est dense) ;


B(x2 , r2 ) ⊂ U2 ∩ B(x1 , r1 ) (possible car U2 est ouvert dense) ;
···
B(xn , rn ) ⊂ Un ∩ B(xn−1 , rn−1 ) et rn < 12 · rn−1 pour tout n > 2.

Les Fn = B(xn , rn ) sont une suite de décroissante de fermés non vides dont les dia-
mètres δ(Fn ) = 2rn tendent vers 0. D’après le lemme d’intersection
! de Cantor, il y a au
\ \
moins un point x dans B(xn , rn ) et donc dans Un ∩ V. 
n>0 n>0
TS III.50 THÉORÈME DE BAIRE § 1

Corollaire 1. — Soit Ω un ouvert non vide dans un espace métrique complet (E, d). Les
assertions (i) et (ii) du théorème de Baire restent vérifiées en remplaçant (E, d) par Ω muni
de la distance induite.

Preuve. En effet, soit (Un )n>0 une suite d’ouverts de Ω tous denses dans Ω ; les ouverts
Un sont encore des ouverts de Ω tous denses dans Ω. Mais l’adhérence Ω de Ω dans E est
un espace complet, auquel on peut appliquer le théorème de Baire : l’intersection des Un
est dense dans Ω, donc a fortiori dans Ω. 

Ainsi, le théorème de Baire est valable dans l’intervalle de ] − 1; 1[ de R, bien que ce


ne soit pas un espace complet.

§ 2. APPLICATIONS À LA THÉORIE DES FONCTIONS DISCONTINUES

Une fonction f : R → R est dite de la première classe de Baire si elle est limite
simple sur R d’une suite (fn )n>0 de fonctions continues sur R. Bien entendu, une telle f
peut être discontinue, mais nous allons voir qu’elle ne peut pas l’être trop.

Pour étudier cette question, rappelons – ou introduisons – la notion d’oscillation.

Définition 1. — L’ oscillation d’une fonction f : R → R au point x ∈ R est par définition


le nombre (fini ou infini) :

ωf (x) = inf sup |f (y 0 ) − f (y)|.


ε>0 y,y 0 ∈B(x,ε)

Proposition 1. — La fonction f est continue en x si, et seulement si, ωf (x) = 0.

Preuve. En effet, d’après le critère de Cauchy, valable parce que R est complet par
construction, dire que lim f (y) = f (x) équivaut à dire que : pour tout η > 0 il existe ε > 0
y→x
tel que y, y 0 ∈ B(x, ε) ⇒ |f (y) − f (y 0 )| 6 ε. Autrement dit :

pour tout η > 0 il existe ε > 0 tel que sup |f (y 0 ) − f (y)| 6 ε.


y,y 0 ∈B(x,ε)

Ou encore : inf sup |f (y 0 ) − f (y)|. 


ε>0 y,y 0 ∈B(x,ε)

Si f : R → R est quelconque, on prendra garde au fait que la fonction x 7→ ωf (x)


n’est pas continue en général ; cependant, on a :

Lemme 1. — Soit f : R → R et soit α un nombre réel > 0. Alors :

Uα = {x ∈ R : ωf (x) < α}

est un ensemble ouvert dans R.


§ 2 APPLICATIONS À LA THÉORIE DES FONCTIONS DISCONTINUES TS III.51

Preuve. On remarque d’abord que la fonction ε 7→ sup |f (y 0 ) − f (y)| est croiss-


y,y 0 ∈B(x,ε)
sante et > 0. Soit x ∈ Uα . Alors il existe η > 0 et ε > 0 tels que
y, y 0 ∈ B(x, ε) ⇒ |f (y 0 ) − f (y)| 6 α − η.
Soit x0 ∈ B(x, 2ε ). On se donne y, y 0 ∈ B(x0 , 2ε ). Par inégalité triangulaire, on a y, y 0 ∈ B(x, ε)
et donc |f (y 0 ) − f (y)| 6 α − η. En passant à la borne supérieure, on obtient
sup |f (y 0 ) − f (y)| 6 α − η,
y,y 0 ∈B(x0 , 2ε )

et donc ωf (x0 ) 6 α − η. Ceci prouve donc que B(x, 2ε ) ⊂ Uα , et donc que Uα est ouvert
puisque c’est un voisinage de tous ses points. 

Lemme 2. — Soit f : R → R dans la première classe de Baire et soit α un nombre réel


> 0. Alors l’ensemble ouvert :
Uα = {x ∈ R : ωf (x) < α}
est dense dans R.

Preuve. Soit (fn )n>0 une suite de fonctions continues R → R qui converge simplement
sur R vers f . Soit Ω un intervalle ouvert non vide de R. On va prouver que Ω ∩ Uα 6= ∅.
Pour tout entier p > 1, l’ensemble
α
Fp = {x ∈ Ω : quel que soit q > p, |fq (x) − fp (x)| 6 }
3
est fermé dans l’espace
[ métrique Ω, car les fonctions différence fq − fp sont continues. De
plus, on a Ω = Fp car, pour tout x ∈ Ω fixé, la suite (fp (x))p > 1 est de Cauchy dans
p>1
R. Appliquons à l’espace Ω le corollaire 1 du théorème de Baire : il existe un indice p0 tel
que Fp0 soit d’intérieur non vide dans Ω. On va montrer que :
(∗) (Fp0 )◦ ⊂ Uα ,
ce qui achèvera la démonstration car alors Ω ∩ Uα ⊃ (Fp0 )◦ 6= ∅.

Soit x ∈ (Fp0 )◦ . En faisant q → ∞ dans la définition de Fp0 , on voit que


α
|f (y) − fp0 (y)| 6
3
pour tout y ∈ Fp0 ; d’où, par inégalité triangulaire :
|f (y) − f (y 0 )| 6 |f (y) − fp0 (y)| + |fp0 (y) − fp0 (y 0 )| + |fp0 (y 0 ) − f (y 0 )|
α α
+ |fp0 (y) − fp0 (y 0 )| + < α
6
3 3
dès que y et y sont assez proches de x tout en étant dans Fp0 , ce qui est loisible car (Fp0 )◦
0

est un ouvert non vide contenant x, et vu la continuité de fp0 au point x, qui permet de
rendre le terme médian < α3 . Ceci prouve que ωf (x) < α et donc (∗). 

On en déduit le
TS III.52 APPLICATIONS À LA THÉORIE DES FONCTIONS DISCONTINUES § 2

Théorème 1 (Baire). — Soit f : R → R dans la première classe de Baire. Alors l’en-


semble X des points de R où f est continue est intersection dénombrable d’ouverts denses.
En particulier, par le théorème de Baire, X est dense dans R.
Preuve. En effet, on a :
\
X = {x ∈ R : ωf (x) = 0} = U1,
n
n>1

où les U 1 sont ouverts et denses dans R par les lemmes qui précèdent. 
n

Bien entendu, le même énoncé reste valable pour tout espace métrique complet (E, d)
à la place de la droite réelle.

Définition 2. — Dans un espace métrique complet (E, d), nous disons qu’un sous-
ensemble est maigre s’il est réunion au plus dénombrable d’ensembles dont l’adhérence est
d’intérieur vide.
Le théorème 1 se lit encore : si f est limite simple de fonctions continues sur E complet,
l’ensemble de ses points de discontinuité est maigre dans E.
Exercice 1. — Soit f : R → R dans la première classe de Baire. Montrer que, pour tout
intervalle ouvert non vide I, il existe un sous-intervalle ouvert non vide J de I sur lequel f
est bornée.
Exercice 2. — Soit l’espace métrique Q des nombres rationnels, muni de la distance de la
valeur absolue des nombres réels. Soit une fonction f : Q → R continue. Alors l’ensemble
D = {x ∈ R : f (r) n’a pas de limite quand r → x, x ∈ Q}
est maigre dans R. Indication : introduire
ω
ef (x) = inf sup |f (r0 ) − f (r)|;
ε>0 r,r0 ∈B(x,ε)∩Q

remarquer que D = {x ∈ R : ω ef (x) 6= 0}, puis montrer que les ensembles Uα = {x ∈ R :


ω
ef (x) < α} sont ouverts et denses dans R, la densité n’étant pas difficile à voir ici.

§ 3. THÉORÈME DE BANACH-STEINHAUS

Rappelons que si E et F sont deux espaces normés sur le même corps des scalaires
K = R ou C, l’espace vectoriel L (E, F) sur K de toutes les applications linéaires et
continues ϕ de E dans F est normé par :
|||ϕ||| = sup kϕ(x)kF .
kxkE 6 1

Si E 6= {0} on peut calculer cette borne supérieure sur la sphère unité : |||ϕ||| =
sup kϕ(x)kF . De plus, pour tout x ∈ E, on a par définition l’inégalité :
kxkE =1

kϕ(x)kF 6 |||ϕ|||kxkE .
§ 3 THÉORÈME DE BANACH-STEINHAUS TS III.53

Un cas important est celui où F = K est de dimension 1. Alors L (E, K) n’est autre que
le dual (topologique) E0 de E.

Soit Φ une partie de L (E, F). Supposons Φ bornée dans l’espace normé L (E, F) ,
c’est-à-dire qu’il existe une constante M telle que pour toute ϕ ∈ Φ on ait : |||ϕ||| 6 M.
Alors il est clair que Φ est bornée en chaque point x de E, c’est-à-dire qu’il existe une
constante Mx telle que pour toute ϕ ∈ Φ on ait : kϕ(x)kF 6 Mx . En effet, il suffit de
prendre Mx = |||ϕ||| · kxkE . Cette conclusion semble être un affaiblissement considérable de
l’hypothèse. C’est un résultat très fort que la réciproque soit vraie sous l’hypothèse que E
est complet.
Théorème 1 (Banach-Steinhaus). — Soit E un espace de Banach et soit F un espace
normé sur le même corps des scalaires K = R ou C. Soit Φ ⊂ L (E, F) un ensemble
d’applications linéaires et continues de E dans F. On suppose que pour tout x ∈ E, on a :
sup kϕ(x)kF < +∞,
ϕ∈Φ

alors on a :
sup |||ϕ||| < +∞.
ϕ∈Φ

Autrement dit, si la famille Φ est bornée en chaque point x de E, alors elle est unifor-
mément bornée sur tous les points de la boule unité de E ; on parle en anglais de uniform
boundedness principle.

Preuve. Pour chaque entier n > 1, notons :


Vn = {x ∈ E : sup kϕ(x)kF > n}.
ϕ∈Φ

D’abord, on remarque que chaque Vn est ouvert dans E. Fixons en effet n > 1. Pour
x0 ∈ Vn , il suffit de trouver un ouvert U0 tel que x0 ∈ U0 ⊂ Vn . Puisque
sup kϕ(x0 )kF > n,
ϕ∈Φ

il existe ϕ0 ∈ Φ telle que kϕ0 (x0 )kF > n ; mais la fonction x 7→ kϕ0 (x)kF est continue donc
l’ensemble
U0 = {x ∈ E : kϕ0 (x)kF > n
est ouvert dans E, et visiblement x0 ∈ U0 ⊂ Vn .

Ensuite, on remarque que l’un au moins des Vn n’est pas dense dans E : sinon, par le
T
théorème de Baire 1, l’intersection n>1 Vn serait non vide : il existerait donc x ∈ E tel
que supϕ∈Φ kϕ(x)kF = +∞, contrairement à l’hypothèse.

On prend donc N tel que VN n’est pas dense dans E. Le complémentaire de VN est
donc d’intérieur non vide : il contient une boule ouverte. Il existe donc a ∈ E et r > 0 tel
que : kxk 6 r ⇒ a + x 6∈ VN . Ainsi, pour toute ϕ ∈ Φ, on a kϕ(a + x)k 6 N dès que
kxk 6 r ; ce qui entraîne que pour toute ϕ ∈ Φ :
kϕ(x)k 6 kϕ(a + x)k + kϕ(a)k 6 2N
TS III.54 THÉORÈME DE BANACH-STEINHAUS § 3

2N
dès que dès que kxk 6 r ; autrement dit sup kϕ(x)k 6 . Ainsi, pour toute ϕ ∈ Φ, on
kxk 6 1 r
a:
2N
|||ϕ||| 6 ,
r
et donc sup |||ϕ||| < +∞. 
ϕ∈Φ

Exercice 1. — Soit E un espace de Banach et F un espace normé sur le même corps


des scalaires K = R ou C. Soit (ϕ)n>1 une suite d’applications linéaires continues qui
converge simplement sur E vers une application ϕ : E → F. Montrer que Φ = {ϕ}n>1
vérifie l’hypothèse du théorème de Banach-Steinhaus ; en déduire que Φ est équicontinue,
et finalement que ϕ est continue.

§ 4. APPLICATION À LA NON-CONVERGENCE SIMPLE DES SÉRIES DE


FOURIER

Faisons tout d’abord quelques rappels sur les séries de Fourier. À toute fonction f :
R → R continue de période 2π, on associe ses coefficients de Fourier :
Z π
1
cn (f ) = f (x)e−inx dx (n ∈ Z)
2π −π
X
et sa série de Fourier : cn (f )einx .
n∈Z

Les sommes de Fourier d’ordre n de f sont les


n Z π
X 1
Sn (f )(x) = ck (f )eikx = f (t)Dn (x − t) dt,
2π −π
k=−n

où Dn est le noyau de Dirichlet :


n
sin (n + 21 )t

X
ikt
Dn (t) = e = .
k=−n
sin( 2t )
On sait que :
lim kSn (f ) − f kL2 ([−π;π]) = 0
n→∞
et que, par conséquent, il existe une suite extraite de (Sn (f ))n>1 qui converge vers f presque
partout.

Il est donc naturel de se demander s’il y a convergence simple de (Sn (f ))n>1 sur [−π; π]
pour toute fonction f : R → R continue de période 2π.

La réponse est négative : grâce au théorème de Banach-Steinhaus, on va prouver que


pour tout x ∈ R il existe une telle fonction f telle que
sup |Sn (f )(x)| = +∞.
n>1
§ 4 APPLICATION À LA NON-CONVERGENCE SIMPLE DES SÉRIES DE FOURIER TS III.55

La suite des Sn (f )(x) étant non bornée, elle n’a évidemment pas de limite finie et en
particulier ne converge pas vers f (x).

Nous utilisons pour cela une estimation du noyau de Dirichlet.

Lemme 1. — On a :
Z π n
1 4 X1
kDn kL1 ([−π;π]) = |Dn (t)| dt > 2 ,
2π −π π k
k=1

et donc :
lim kDn kL1 ([−π;π]) = +∞.
n→∞

Preuve. On utilise un argument de parité et l’inégalité sin( 2t ) 6 2t pour 0 6 t 6 π


pour le calcul qui suit.
Z π
1 π 2 π
Z Z  
1 1 dt
kDn kL1 ([−π;π]) = |Dn (t)| dt = |Dn (t)| dt > | sin (n + )t | ,
2π −π π 0 π 0 2 t
et un changement de variable fournit :
1 n n
2 (n+ 2 )π
Z Z kπ
du 2X 1 4 X1
kDn kL1 ([−π;π]) > | sin(u)| > | sin(u)| du = 2 ,
π 0 u π kπ (k−1)π π k
k=1 k=1

ce qui est le résultat annoncé. 

Reprenons notre problème de convergence simple de (sommes partielles de) séries de


Fourier (Sn (f ))n>1 . Soit E l’espace de Banach des fonctions f : R → C continues, à valeurs
complexes, de période 2π, qu’on munit de la norme de la convergence uniforme k·k∞ :

kf k∞ = sup |f (x)| = sup |f (x)|.


x∈[−π;π] x∈R

Soit F = C. Par translation, on se ramène à se placer au point x = 0. On travaille avec la


suite (ϕn )n>0 de formes linéaires dans E0 = L (E, C) définies par évaluation en 0 :
n Z π
X 1
ϕn : f 7→ Sn (f )(0) = ck (f ) = f (t)Dn (t) dt.
2π −π
k=n

D’après la théorie de l’intégration, on sait que


Z π
1
|||ϕn ||| = sup f (t)Dn (t) dt = kDn kL1 ([−π;π]) .
f ∈E,kf k∞ =1 2π −π

Ainsi, d’après le lemme 1, on a : sup |||ϕn ||| = +∞. En lisant le théorème de Banach-
n>1
Steinhaus à l’envers, on voit qu’il existe une fonction f ∈ E telle que

sup |ϕn (f )| = |Sn (f )(0)| = +∞,


n>1

ce qui est ce qu’on avait annoncé. 


TS III.56 APPLICATION À LA NON-CONVERGENCE SIMPLE DES SÉRIES DE FOURIER § 4

Exercice 1. — Il existe une notion de série de Fourier dans le cadre L1 : à toute fonction
intégrable f : [−π; π] → C on associe une série de Fourier. Montrer qu’il existe f ∈
L1 ([−π; π]) telle que la suite des Sn (f ) ne tende pas vers f en norme L1 quand n → ∞.
Indication : on pourra montrer que l’application linéaire Sn : f 7→ Sn (f ) a pour norme
kDn kL1 ([−π;π]) en tant qu’application de L1 ([−π; π]) dans lui-même.
Ainsi, la situation dans le cadre L1 est bien différente de celle dans le cadre L2 . In-
formation sans démonstration : pour tout p ∈]1; +∞[ et toute f ∈ Lp ([−π; π]), on a :
lim kSn (f ) − f kLp ([−π;π]) = 0.
n→∞

Rappelons aussi qu’en ce qui concerne les fonctions continues 2π-périodiques, la si-
tuation est meilleure si l’on s’intéresse à la convergence en moyenne de Cesaro, i.e. si l’on
remplace les sommes partielles de Fourier Sn (f ) par les sommes partielles de Fejer :
n
1 X
σn (f ) = Sk (f ),
n+1
k=0

ce qui revient à remplacer le noyau de Dirchlet, par une autre fonction (noyau de Fejer),
positive ou nulle cette fois. On sait en effet que la suite (σn (f ))n>1 converge uniformément
vers f sur [−π; π] (et sur R).
Exercice 2. — En supposant connu le théorème de Fejer, prouver que pour toute fonction
f ∈ L1 ([−π; π]) on a : lim kf − σn (f )kL1 ([−π;π]) = 0.
n→∞

§ 5. APPLICATION À LA NON-CONVERGENCE UNIFORME DE


L’INTERPOLATION DE LAGRANGE

Pour tout entier n > 1 et tout entier k tel que 0 6 k 6 n, le polynôme :


n
Y nx − j
lkn (x) =
k−j
j=0,j6=k

est l’unique polynôme de degré n qui vaut 1 en nk et 0 en les points nj avec 0 6 j 6 n


et j 6= k. À toute fonction f ∈ C ([0; 1], C) on associe ses polynômes d’interpolation de
Lagrange pn (f ) définis par
n
X k
pn (f ) : x 7→ f ( )lkn (x)
n
k=0
pour tout n > 1. Ainsi le polynôme pn (f ) est l’unique polynôme de degré n qui prend les
mêmes valeurs que f aux points 0, n1 , n2 , . . . , 1.
Théorème 1. — Il existe une fonction continue f : [0; 1] → C telle que la suite des
polynômes d’interpolation de Lagrange (pn (f ))n>1 ne converge pas uniformément vers f
sur [0; 1] quand n → ∞.
Commençons par deux lemmes.
§ 5APPLICATION À LA NON-CONVERGENCE UNIFORME DE L’INTERPOLATION DE LAGRANGETS III.57

Lemme 1. — Munissons E = C ([0; 1], C) de la norme k·k∞ de la convergence uniforme.


n
X
Alors l’application f 7→ pn (f ) de E dans lui-même est de norme |||pn ||| = sup |lkn (x)|.
x∈[0;1] k=0

Preuve. Pour toute f ∈ E = C ([0; 1], C) et tout x ∈ [0; 1], on a :


n n n
X k n X k n X k
|pn (f )(x)| = | f ( )lk (x)| 6 |f ( )||lk (x)| 6 kf k∞ |f ( )|,
n n n
k=0 k=0 k=0

donc
n
X k
kpn (f )k∞ = sup |pn (f )(x)| 6 kf k∞ sup |f ( ).
x∈[0;1] x∈[0;1] k=0 n
n
X
Ceci fournit déjà : |||pn ||| 6 sup |lkn (x)|, et il s’agit de prouver l’inégalité inverse.
x∈[0;1] k=0

n
X
Soit x0 un point de [0; 1] où la fonction x 7→ |lkn (x)| atteint son maximum sur [0; 1].
k=0
Choisissons f0 une fonction continue sur [0; 1] telle que kf k∞ = 1, et en outre telle que
f0 ( nk ) = signe (lkn (x0 )) c’est-à-dire que f0 (x) vaut 1, −1 ou 0 suivant que lkn (x0 ) est > 0,
< 0 ou = 0. Alors :
n
X n
X
|||pn ||| > kpn (f0 )k∞ > |pn (f0 )(x0 )| = |f (x0 )| = sup |f (x)|,
k=0 x∈[0;1] k=0

qui est la seconde inégalité recherchée. 


Lemme 2. — On a : lim |||pn ||| = +∞.
n→∞

Preuve. En posant Mn (x) = nk=0 |f (x)|, nous allons estimer M( 2n


1
P
) et prouver que
cette suite tend vers +∞ ; il en résultera bien que
1
|||pn ||| = sup Mn (x) > M( )
x∈[0;1] 2n
tend vers +∞. On a :
n n n Qn
1 | 2n − j| 1 1 − 2j 1 1 |1 − 2j|
Qn j=0
Y Y
|lkn ( )| = = n = n
2n |k − j| 2 k−j 2 |2k − 1| j=0,j6=k |k − j|
j=0,j6=k j=0,j6=k

1 1 1 · 3 · · · · · (2n − 1) 1 1 (2n)! n!
n
= 2n 2
,
2 |2k − 1| k!(n − k)! 2 |2k − 1| (n!) k!(n − k)!
donc
n
1 (2n)! X k 1
Mn ( n ) = 2n 2
Cn .
2 2 (n!) |2k − 1|
k=0
Or :
n n n
Z 1 !
1 1
2n
Z Z
X 1 X 1 X
Ckn > k
Cn = Ckn x2k dx = 2
(1+x ) dx > (2x)n dx = .
|2k − 1| 2k + 1 0 0 0 n+1
k=0 k=0 k=0
TS III.58APPLICATION À LA NON-CONVERGENCE UNIFORME DE L’INTERPOLATION DE LAGRANGE§ 5

√ 1
D’après la formule de Stirling, on sait que n! ∼n→∞ 2πnn+ 2 e−n , donc cela fournit :
1
(2n)! 1 (2n)2n+ 2 1
2n 2
∼n→∞ √ 2n 2n+1
=√ .
2 (n!) π2 ·n πn
1 (2n)! 2n 1 2n
Ainsi : Mn ( ) > · , qui équivaut quand n → ∞ à √ , lequel tend bien
2n 22n (n!)2 n + 1 π n 32
vers +∞ quand n → ∞. 

Nous pouvons maintenant passer à la démonstration du théorème 1.

Preuve. On applique le théorème de Banach-Steinhaus 1 avec E = F = C =


C ([0; 1], C) muni de la norme de la convergence uniforme, et Φ l’ensemble des appli-
cation pn . Puisque sup |||pn ||| = +∞, il existe une fonction f ∈ C ([0; 1], C) telle que
n>1
supkpn (f )k∞ = +∞. N’étant pas bornée dans C , la suite (pn (f ))n>1 ne peut converger
n>1
dans C . 
Exercice 1. — Soit (an )n>0 une suite de nombres réels telle que quelle que soit la suite
x = (xn )n>0 ∈ `1 (N), la série
P
n>0 an xn converge. Montrer qu’alors la suite (an )n>1

appartient à ` (N). Indication : considérer la suite (ϕn )n>0 de formes linéaires sur `1 (N)
définie par ϕn (x) = nk=1 ak xk et lui appliquer le théorème de Bananch-Steinhaus. Dans
P

cet énoncé, peut-on remplacer `1 et `∞ par `p et `q où p et q sont réels et tels que p1 + 1q = 1 ?

§ 6. THÉORÈME DE BANACH DE L’APPLICATION OUVERTE

C’est de ce chapitre le théorème dont la démonstration est la plus délicate, même si


l’énoncé est facile à comprendre :
Théorème 1 (Banach, théorème de l’application ouverte). — Soient E et F des espaces
de Banach. Soit ϕ : E → F une application linéaire continue et surjective. Alors ϕ est
ouverte, c’est-à-dire que l’image par ϕ de tout ouvert de E est un ouvert de F.
Ce théorème heurte nos habitudes qui sont que, par une application continue, l’image
réciproque de tout ouvert est un ouvert ; il s’agit ici de l’image directe.

La linéarité de ϕ est une condition forte mais essentielle – s’en convaincre en dessinant
un graphe judicieux d’une fonction réelle d’une variable réelle. Il est essentiel aussi que
non seulement E, mais aussi F, soit complet. Par exemple, si E = `1 (N) muni de sa norme
kxk1 = ∞ 1
P
n=0 |xn | et F = ` (N) muni de la norme kxk∞ = maxn>0 |xn | pour x = (xn )n>0 ,
alors l’application identique de E sur F est continue, surjective, et même bijective, mais sa
réciproque ϕ−1 n’est pas continue : sinon, F serait complet comme E, ce qui n’est pas vu
que F est dense et strictement inclus dans `∞ (N).

Avant de passer à la démonstration, voyons l’intérêt de ce théorème à travers ses


corollaires.
§ 6 THÉORÈME DE BANACH DE L’APPLICATION OUVERTE TS III.59

Corollaire 1. — Soient E et F des espaces de Banach. Soit ϕ : E → F une application


linéaire continue et bijective. Alors ϕ−1 est une application linéaire continue de F sur E.
Preuve. En effet, si U est un ouvert de E, son image réciproque par ϕ−1 n’est autre
que ϕ(U), qui est un ouvert de F par le théorème de Banach 1 qui précède. 
Corollaire 2 (théorème du graphe fermé). — Soient E et F des espaces de Banach. Soit
ϕ : E → F une application linéaire. Supposons que, chaque fois qu’une suite (xn )n>0 tend
vers 0 dans E et que la suite image (ϕ(xn ))n>0 converge dans F, disons vers y, alors la
limite y vaut 0. Alors l’application ϕ est continue.
En appliquant l’hypothèse à la suite décalée des xn − x (pour x ∈ E), on voit qu’elle
équivaut à la formulation en apparence plus générale suivante :

chaque fois qu’une suite (xn )n>0 converge dans E, disons vers x, et que la suite image
(ϕ(xn ))n>0 converge dans F, disons vers y, alors la limite y = ϕ(x),

qui équivaut encore au fait que

le graphe gr(ϕ) de ϕ, c’est-à-dire le sous-ensemble de E × F :

gr(ϕ) = {(x, ϕ(x)) : x ∈ E},


est fermé dans E × F.

Ainsi le corollaire 2 énonce que pour qu’une application linéaire entre espaces de
Banach soit continue, il faut et il suffit que son graphe soit fermé (la partie « condition
nécessaire » est facile, par exemple par le critère séquentiel de continuité).

Bien entendu, ceci ne serait pas vrai si ϕ n’était pas linéaire. Par exemple, pour
E = F = R et ϕ(x) = x1 pour x 6= 0 et ϕ(0) = 0, le graphe de ϕ est fermé sans que la
fonction soit continue.

Passons à la preuve du corollaire.

Preuve. L’espace E × F, normé par


(x, y) 7→ k(x, y)k = max{kxkE ; kxkF },
est un espace de Banach (i.e., il est complet). Puisque ϕ est linéaire, on voit immédiatement
que son graphe
gr(ϕ) = {(x, ϕ(x)) : x ∈ E}
est un sous-espace vectoriel de E × F. Par hypothèse, il est fermé donc complet : c’est un
espace de Banach pour la norme induite. L’application de projection
θ : (x, ϕ(x)) 7→ x
est une application linéaire, continue et bijective de gr(ϕ) sur E. Par le corollaire 1 son
application réciproque θ−1 est continue ; autrement dit, x 7→ (x, ϕ(x)) est continue. En
composant cette application avec la seconde projection prF : E × F → F, on voit que
ϕ = prF ◦ θ−1 est continue, ce qu’il fallait démontrer. 
TS III.60 THÉORÈME DE BANACH DE L’APPLICATION OUVERTE § 6

Exercice 1. — Soit X un ensemble et soit (E, k·k) un espace de Banach de fonctions définies
sur X. On suppose que la norme k·k vérifie :
lim kfn k = 0 =⇒ quel que soit x ∈ X, on a : lim fn (x) = 0.
n→∞ n→∞

Soit ϕ une fonction sur X telle que f ∈ E ⇒ ϕf ∈ E (on dit que ϕ est un multiplicateur de
E). Montrer que l’application f 7→ ϕf est continue pour la norme de E.
Le corollaire 1 est un moyen puissant pour démontrer que des espaces sont distincts ;
faisons-le comprendre à nouveau à propos d’un problème concernant les séries de Fourier.
Si f ∈ L1 ([−π; π], C), soit (cn (f ))n∈Z la suite de ses coefficients de Fourier :
Z π
1
cn (f ) = f (x)e−inx dx (n ∈ Z)
2π −π
Rappelons que lim cn (f ) = 0 ; c’est le lemme de Riemann-Lebesgue. Le problème est le
n→±∞
suivant :

Problème : Étant donnée une suite (an )n∈Z telle que lim an = 0, existe-t-il tou-
n→±∞
jours une fonction f ∈ L1 ([−π; π], C) telle qu’on ait cn (f ) = an pour tout n ∈ Z.

La réponse est négative. Pour le voir, notons c0 (Z) l’espace de Banach des suites
(an )n∈Z telles que lim an = 0, muni de la norme sup :
n→±∞

k(an )n∈Z k = sup |an |.


n∈Z

Appliquons le corollaire 1 avec E = L1 ([−π; π], C), F = c0 (Z) et ϕ : f 7→ (cn (f ))n∈Z .


Elle est linéaire, continue (car |cn (f )| 6 kf k1 ) et injective (car une fonction dont les
coefficients de Fourier sont tous nuls est nulle presque partout pour la mesure de Lebesgue,
par la formule d’inversion de Fourier). Le problème demande si ϕ est surjective. Si elle
l’était, le corollaire assurerait la continuité de ϕ−1 : c0 (Z) → L1 ([−π; π], C), i.e. l’existence
d’une constante M > 0 telle que
(∗) kf k1 6 Mk(cn (f ))n∈Z k∞
pour toute f ∈ L1 ([−π; π], C). Dans cette inégalité prenons pour f les noyaux de Dirichlet
N
X
DN (x) = eikx .
k=−N

Les cn (DN ) valent tous 0 ou 1, donc k(cn (DN ))n∈Z k∞ = 1 pour tout n ∈ Z, alors qu’on a
vu au lemme 1 que
lim kDN kL1 ([−π;π]) = +∞.
N→∞
C’est évidemment en contradiction avec les inégalités (∗) pour les fonctions f = DN avec
n > 1.
Exercice 2. — Si f ∈ L1 (R, dx), sa transformée de Fourier
Z
fˆ(t) = f (x)e−itx dx
R
§ 6 THÉORÈME DE BANACH DE L’APPLICATION OUVERTE TS III.61

appartient à l’espace C0 (R) des fonctions continues sur R de limite 0 en ±∞. Montrer
qu’il existe des g ∈ C0 (R) qui ne sont pas des transformées de fonctions dans L1 (R, dx).

Nous allons maintenant passer à la preuve (difficile) du théorème de Banach de l’ap-


plication ouverte 1.

Preuve. Soit U (resp. V) l’ensemble des x ∈ E (resp. y ∈ F) tels que kxk < 1 (resp.
kyk < 1). Si A ⊂ E (resp. A ⊂ F) et si λ est un scalaire, on note λA l’ensemble des λx
pour x ∈ A.

– Première étape : il existe δ > 0 tel que pour tout y ∈ F et tout ε > 0, il existe x ∈ E
tel que kxk 6 1δ kyk et ky − ϕ(x)k 6 ε.
L’application ϕ étant surjective, l’espace complet F est la réunion de la suite de fermés
ϕ(kU) où k parcourt les entiers > 1. D’après le théorème de Baire 1 l’un au moins de ces
fermés est d’intérieur non vide. Donc il existe un entier k > 1, un point y0 dans F et un
nombre réel η > 0 tels que pour tout y ∈ F vérifiant kyk < η, on ait y0 +y ∈ ϕ(kU). Posons
η
δ = 2k . Par homothétie, on se ramène à vérifier l’assertion de la première étape pour les y
d’une sphère, par exemple ceux vérifiant kyk = η. Pour un tel y, il existe des suites (x0i )i > 1
et (x00i )i > 1 telles que lim ϕ(x0i ) = y0 et lim ϕ(x00i ) = y0 + y. Posons xi = x0i − x00i . Alors
i→∞ i→∞
kxi k < 2k = δ −1 kyk et lim ϕ(xi ) = y.
i→∞

– Deuxième étape : pour tout α > 0, on a : δV ⊂ ϕ ((1 + α)U).


Soit y ∈ δV. D’après la première étape, il existe x1 ∈ E tel que kx1 k < 1 et ky −
ϕ(x1 )k 6 δα2 . Par hypothèse de récurrence, supposons que soient déjà choisis x1 , x2 , . . . xn
tels que
α δα
kxj k < n et ky − ϕ(x1 ) − · · · − ϕ(xj )k 6 j .
2 2
Alors, en utilisant la première étape, où y est remplacé par y − ϕ(x1 ) − · · · − ϕ(xn ), on
obtient un xn+1 ∈ E tel que
α δα
kxn+1 k < et ky − ϕ(x1 ) − · · · − ϕ(xn+1 )k 6 n+1 .
2j−1 2
On obtient ainsi une suite (xn )n>1 dans E et, en posant sn = nk=1 xk , on voit que la suite
P
α
(sn )n>1 est de Cauchy dans E, donc converge vers un x ∈ E. Puisque kxn k < 2n−1 , on
a kxk < 1 + α. Enfin, par construction on a : lim ϕ(sn ) = y, et donc y = ϕ(x). Ainsi :
n→∞
y ∈ ϕ ((1 + α)U).

– Troisième étape : pour tout α > 0, on a : δV ⊂ ϕ(U).


[ δ
En effet, d’après la deuxième étape, on a : ϕ(U) ⊃ V = δV.
1+α
α>0

– Quatrième étape : pour tout ouvert O de E, l’image ϕ(O) est ouverte dans F.
Soit y0 ∈ ϕ(O) et soit x0 ∈ E tel que ϕ(x0 ) = y0 . Puisque O est ouvert, il existe r > 0
tel que la boule x0 + rU soit contenue dans O. Alors, d’après la linéarité de ϕ, l’ensemble
ϕ(O) contient ϕ(x0 + rU) = y0 + rϕ(U). Donc, d’après la troisième étape, ϕ(O) contient
TS III.62 THÉORÈME DE BANACH DE L’APPLICATION OUVERTE § 6

la boule de centre y0 et de rayon rδ. Comme y était quelconque, ceci prouve que ϕ(O) est
un voisinage de tous ses points, donc est ouvert dans F. 
chapitre iv

Algèbres de Banach

La théorie que nous allons présenter est récente (1941) et presque toute entière due
au mathématicien I. M. Gelfand. Dans un même moule, celui des algèbres de Banach, elle
regroupe des algèbres aussi différentes que :

• l’algèbre C (X) des fonctions continues sur un compact X ;


• des algèbres de convolution ;
• des algb̀res de fonctions holomorphes ;
• des algèbres (non commutatives) d’opérateurs dans un espace de Banach.

Les étapes principales de la théorie sont (pour une algèbre de Banach A) :

• l’étude du spectre d’un élément x ∈ A, le fait fondamental étant qu’il n’est jamais
vide ;
• le théorème de Gelfand-Mazur ;
• l’holomorphie, sur l’ouvert complémentaire du spectre, de la fonction résolvante
λ 7→ (λe − x)−1 ;
• l’étude de l’exponentiation dans A.

Si plus particulièrement, l’algèbre de Banach A est commutative, la théorie se poursuit


avec :

• l’identification de l’espace des idéaux maximaux de A avec l’ensemble Ab des formes


linéaires non nulles multiplicatives (ou caractères) de A ;
• la transformation de Gelfand de A dans C (A), b dont un cas particulier est la trans-
formation de Fourier ;
• la re-démonstration, étonnamment simple, d’un théorème de Wiener (1932).
TS IV.64 ALGÈBRES DE BANACH Chapitre IV

§ 1. NOTION D’ALGÈBRE DE BANACH

Nous commençons bien sûr par la notion centrale de cette partie.

Définition 1. — On appelle algèbre de Banach un espace de Banach A 6= {0} sur C muni


d’une multiplication (x, y) 7→ xy de A × A dans A telles que, pour cette multiplication et
l’addition vectorielle, A soit un anneau, et telle que, quels que soient x ∈ A, y ∈ A et
λ ∈ C, on ait :

λ(xy) = (λx)y = x(λy) et kxyk 6 kxkkyk.


Si l’anneau A a un élément neutre e pour la multiplication, on exige de plus que kek = 1
et on dit alors que A est une algèbre de Banach avec unité. On dit que A est commutative si
xy = yx pour tous x et y dans A.

Exercice 1. — Montrer que l’application multiplication d’une algèbre de Banach est conti-
nue.

La théorie axiomatise dans un seul moule structurel des exemples concrets très divers.
En voici quelques-uns.

Exemple 1. — L’algèbre A = C des nombres complexes.

Exemple 2. — Soit X un espace compact non vide et A = C (X) = C (X, C) l’algèbre des
fonctions continues à valeurs complexes sur X. Pour la norme uniforme k·k∞ donnée par
kf k∞ = supx∈X |f (x)|, et pour le produit (point par point) ordinaire donné par (f g)(x) =
f (x)g(x) pour tout x ∈ X, l’algèbre A est une algèbre de Banach commutative, qui a une
unité, à savoir la fonction constante égale à 1.

Exemple 3. — Soit U = {z ∈ C : |z| < 1} et U = {z ∈ C : |z| 6 1}. On prend A = OC (U)


l’algèbre des fonctions f = f (z) continues sur U et holomorphes dans U. Pour la norme
uniforme k·k∞ donnée par kf k∞ = supz∈U |f (z)|, et pour le produit (point par point)
ordinaire donné par (f g)(z) = f (z)g(z) pour tout z ∈ U, l’algèbre A est une algèbre de
Banach commutative, qui a une unité, à savoir la fonction constante égale à 1.

Exemple 4. — Soit Dm ([0; 1]) la sous-algèbre de C ([0; 1]) constituée des fonctions f qui
m
X 1 (j)
sont m fois dérivables. Pour la norme kf k = kf k, l’algèbre A est une algèbre de
j!
j=0
Banach commutative avec unité.

Exemple 5. — Soit A = L1 (R) l’algèbre des (classes de)


Z fonctions intégrables au sens de
Lebesgue sur la droite réelle. Pour la norme kf k1 = |f (x)| dx, et pour le produit de
R
convolution ∗ donné par :
Z
(f ∗ g)(x) = f (x − t)g(t) dt
R
pour toutes f, g ∈ A et tout x ∈ R, l’algèbre A est une algèbre de Banach commutative.
§ 2 ÉTUDE DU GROUPE DES INVERSIBLES TS IV.65

Exemple 6. — Soit A = `1 (Z) l’algèbre des suites x = (xXn )n∈Z de nombres complexes
indexées par les entiers relatifs. Pour la norme kxk1 = |xn |, et pour le produit de
n∈Z
convolution ∗ donné par :
X
(x ∗ y)n = xn−p yp ,
p∈Z
pour toutes suites x = (xn )n∈Z et y = (yn )n∈Z dans A et tout indice n ∈ Z, l’algèbre A
est une algèbre de Banach commutative. Elle admet une unité : la suite e0 qui vaut 1 en 0
et 0 ailleurs.
Exemple 7. — Soit E un espace de Banach non nul. On prend pour A l’algèbre L (E, E)
des applications linéaires continues (ou opérateurs bornés) ϕ de E dans E. Pour la norme
d’opérateur donnée par
|||ϕ||| = sup kϕ(x)kE ,
kxkE 6 1
et pour la multiplication donnée par la composition ◦, l’algèbre A est une algèbre de
Banach, avec pour unité l’application identique idE de E.
Exemple 8. — Munissons Cn d’une norme vectorielle k·k. Prenons A = Mn (C) l’algèbre
des matrices M = [mij ]1 6 i,j 6 n de taille n × n à coefficients complexes. Pour la norme
|||M||| = sup kMxk,
x∈Cn ,kxk=1

et pour le produit usuel des matrices, l’algèbre A est une algèbre de Banach, avec pour
unité la matrice identité In de taille n × n.
Toutes ces algèbres de Banach sont commutatives, sauf les deux derniers exemples.
Elles sont toutes avec unité sauf A = L1 (R).
Exemple 9. — Soit A une algèbre de Banach sans unité. On pose A
e = A×C avec la norme
k(x, λ)k = kxk + |λ| et le produit
(x, λ)(y, µ) = (xy + λx + µy, λµ).
Alors A
e est une algèbre de Banach, avec unité égale à (0A , 1) et dite déduite de A par
adjonction d’un élément neutre.
Exercice 2. — Vérifier que tous les exemples ci-dessus fournissent bien des algèbres de
Banach.

§ 2. ÉTUDE DU GROUPE DES INVERSIBLES

Notons dans toute la suite G le groupe des éléments inversibles de l’algèbre de Banach
A, supposée avec élément unité e dans toute la suite, sauf mention expresse du contraire.
Autrement dit, G est l’ensemble des x ∈ A tels qu’il existe y ∈ A pour lequel xy = yx = e
(auquel cas on notera y = x−1 par unicité de l’inverse). L’ensemble G est un groupe pour
TS IV.66 ÉTUDE DU GROUPE DES INVERSIBLES § 2

la multiplication dans A, car si x ∈ G et y ∈ G alors (xy)−1 = y −1 x−1 et en outre :


(x−1 )−1 = x et e−1 = e.
Théorème 1. — Soit y ∈ A tel que kyk < 1. Alors e+y est inversible dans A et (e+y)−1 =

X
(−1)n y n : de plus :
n=0
kyk2
k(e + y)−1 − e + yk 6 .
1 − kyk
1
Plus généralement, soit x inversible dans A. On pose α = kx−1 k
. Alors pour tout h ∈ A tel
que khk = β < α, l’élément x + h est inversible dans A et on a :
β2
k(x + h)−1 − x−1 + x−1 hx−1 k 6 .
α2 (α − β)


X
Preuve. La série (−1)n y n converge absolument dans l’espace de Banach A car
n=0

X ∞
X
n n
k(−1) y k 6 kykn et kyk < 1.
n=0 n=0
En effet, l’axiome de sous-multiplicativité de la norme implique ky n k 6 kykn par récur-
rence sur n. Posons
X∞ N
X
n n
s= (−1) y et sN = (−1)n y n
n=0 n=0
pour chaque entier n > 0. Alors
(e + y)sN = (e + y)(e − y + y 2 − y 3 + · · · + (−1)N y N )
= e + y − y + y 2 − y 2 + y 3 − y 3 + · · · + (−1)N y N + (−1)N y N+1
= e + (−1)N y N+1
= sN (e + y)
tend vers (e + y)s = e = s(e + y) quand N → ∞, et donc s = (e + y)−1 . De plus
X ∞
X
(e + y)−1 − e + y = (−1)n y n = y 2 (−1)k y k ,
n>2 k=0
donc
∞ ∞
X X kyk2
k(e + y)−1 − e + yk 6 ky 2 kk (−1)k y k k 6 kyk2 kykk = .
1 − kyk
k=0 k=0
Passons maintenant à l’énoncé général. On a :
β
kx−1 hk 6 kx−1 kkhk = ,
α
donc d’après ce qu’on vient de faire e + x−1 h est inversible. Par suite x + h = x(e + x−1 h)
est inversible comme produit de deux inversibles et (x + h)−1 = (e + x−1 h)−1 x−1 . Faisons
y = x−1 h dans l’inégalité qui précède :
kx−1 hk2
k(e + x−1 h)−1 − e + x−1 hk 6 .
1 − kx−1 hk
§ 2 ÉTUDE DU GROUPE DES INVERSIBLES TS IV.67

En multipliant par x−1 l’argument de la norme du membre de gauche, il vient par sous-
multiplicativité :
kx−1 kkx−1 hk2
k(x + h)−1 − x−1 + x−1 hx−1 k 6 1−kx−1 hk
kx−1 k3 khk2
6 1−kx−1 kkhk
β2
= β
α3 (1− α )
β 2
= α2 (α−β)
,

ce qui conclut la démonstration. 

Corollaire 1. — L’ensemble G des éléments inversibles de l’algèbre de Banach avec


unité A est ouvert dans A et l’application inverse x 7→ x−1 est une application continue.
C’est même une application différentiable dans G, sa différentielle au point x ∈ G étant
l’application linéaire de A dans A définie par h 7→ −x−1 hx−1 .

Preuve. L’énoncé général du théorème précédent dit que si x−1 ∈ G, et si α = kx−1 k−1 ,
la boule ouverte de centre x−1 et de rayon α est incluse dans G. De plus, l’inégalité de ce
même énoncé précise que dès que khk = β < α2 , on a :

2
k(x + h)−1 − x−1 + x−1 hx−1 k 6 khk2 ,
α3
ce qui vérifie l’assertion sur la différentielle. 

On notera que l’assertion sur la différentielle est une géralisation du fait que la dérivée
dans C× de la fonction z 7→ z1 est z 7→ −1
z2
.

Exercice 1. — 1. Montrer que, dans Mn (C), toute matrice est limite d’une suite de
matrices inversibles ; autrement dit, que G = GLn (C) est dense dans A = Mn (C).
On va voir que ce fait ne subsiste pas en dimension infinie.
2. Soit en effet `2 (N) l’espace des suites complexes x = (xn )n>0 de carré intégrable,
X∞
|xn |2 < +∞. On note A = L `2 (N), `2 (N) . Soit S l’opérateur

i.e. telles que kxk =
n=0
de décalage, « shift » en bon français, défini par :

S(x0 , x1 , s2 , . . . , xn , . . . ) = (0, x0 , x1 , s2 , . . . , xn , . . . ).

– Remarquer que S est isométrique, mais non surjectif, donc n’est pas inversible
dans l’algèbre de Banach A.
– Par l’absurde, montrer que S n’est pas limite dans A d’une suite (Tn )n>0 d’opé-
rateurs bornés inversibles. Indication : montrer que la suite (|||T|||n )n>0 n’est pas bornée
et en déduire qu’il existerait une suite (Un )n>0 dans A telle que |||U|||n = 1 pour tout
n > 0 et lim |||SUn ||| = 0.
n→∞
TS IV.68 ÉTUDE DU GROUPE DES INVERSIBLES § 2

§ 3. SPECTRE D’UN ÉLÉMENT

On se donne une algèbre de Banach A comme précédemment. Soit x ∈ A.

Définition 1. — On appelle spectre de x (dans A), et l’on note sp(x) ou spA (x), l’en-
semble des λ ∈ C tels que x − λe n’est pas inversible dans A.

Ainsi sp(x) est une partie de C. Par exemple, le spectre d’une matrice M dans Mn (C)
est l’ensemble (fini) de ses valeurs propres complexes. Le spectre d’une fonction f ∈ C (X)
est l’ensemble f (X) des valeurs prises par f .

Proposition 1. — Pour tout x ∈ A, l’ensemble sp(x) est un compact de C, contenu dans


le disque centré à l’origine et de rayon kxk.

Preuve. Supposons |λ| > kxk. Alors λ 6= 0 et x − λe = −λ(e − λx ) est inversible


dans A car k λx k < 1. Donc λ 6∈ sp(x). Ceci prouve que sp(x) est contenu dans le disque
{λ ∈ C : |λ| 6 kxk} : en particulier sp(x) est une partie bornée de C. Par Borel-Lebesgue,
il reste à voir que c’est une partie fermée de C, c’est-à-dire que son complémentaire est
ouvert. Soit λ0 6∈ sp(x). Alors x − λ0 e est inversible dans A, donc x − λe aussi dès que
|λ − λ0 | est assez petit, car G est ouvert (Théorème 1). 

Exercice 1. — Soit S l’opérateur de décalage défini dans l’Exercice 1. Montrer que le


spectre de S dans A = L `2 (N), `2 (N) est exactement le disque unité fermé de C.


Exercice 2. — Soit A = `1 (Z) l’algèbre de Banach de l’Exemple 6. Pour tout n ∈ Z, soit


en l’élément de A qu’est la suite dont tous les termes sont nuls sauf le n-ième, qui vaut 1.
(i) Vérifier la formule de covolution em ∗ en = em+n pour tous m et n dans Z, puis
que (en )−1 = e−n et en = (e1 )n pour tout n dans Z.
(ii) Dans A = `1 (Z), tout élément x = (xn )n∈Z vérifie :
N
X N
X
x = lim xn en = lim xn (e1 )n .
N→∞ N→∞
n=−N n=−N

(iii) Montrer que le spectre de e1 dans A est le cercle unité de C.

Théorème 1. — Soit x ∈ A. Soit ϕ une forme linéaire continue de l’espace de Banach


A. Alors la fonction f d’une variable complexe

λ 7→ f (λ) = ϕ (x − λe)−1


est holomorphe dans l’ouvert C − spA (x). De plus, la fonction λ 7→ λf (λ) est bornée quand
|λ| → ∞.

Preuve. Soit Ω l’ouvert C − spA (x) et soit λ ∈ Ω fixé. Pour µ ∈ C, assez proche de λ
pour qu’on ait :
1
µ ∈ Ω et |λ − µ| < k(x − λe)−1 k,
2
§ 3 SPECTRE D’UN ÉLÉMENT TS IV.69

écrivons l’inégalité du cas général du Théorème 1, en y remplaçant x par x − λe et h par


(λ − µ)e, et donc x + h par x − µe. On obtient :
k(x − µe)−1 − (x − λe)−1 + (λ − µ)(x − λe)−2 k 6 C|λ − µ|2 ,
où C est une constante (pour x et λ fixés). Par conséquent :
(x − µe)−1 − (x − λe)−1
lim = (x − λe)−2
µ→λ,µ6=λ µ−λ
dans l’espace de Banach A. En appliquant la forme linéaire continue ϕ à ce calcul de limite,
on obtient :
f (µ) − f (λ)
= ϕ (x − λe)−2 .

lim
µ→λ,µ6=λ µ−λ
Ainsi f a une dérivée première continue dans Ω : elle est holomorphe dans Ω. En outre :
 x 
λf (λ) = ϕ λ(x − λe)−1 = ϕ ( − e)−1

λ
tend vers ϕ(−e) quand |λ| → ∞, donc est bornée. 

On peut en déduire le résultat fondamental suivant.


Corollaire 1. — Soit x ∈ A. Alors le spectre de x dans A n’est pas vide.

Preuve. On procède par l’absurde, en supposant spA (x) vide. Alors f serait holo-
morphe sur C tout entier (autrement dit, f serait une fonction entière) et bornée (car
λ 7→ λf (λ) est bornée à l’infini). D’après le théorème de Liouville, ces deux proprié-
tés imposent à f d’être constante sur C, et même nulle (à nouveau car λ 7→ λf (λ) est
bornée à l’infini). Or, soit λ0 fixé dans C. Comme spA (x) = ∅, on dispose de l’inverse
(x − λ0 e)−1 , qui est un vecteur non nul de A. Par Hahn-Banch, il existe ϕ ∈ A0 telle que
ϕ λ(x − λ0 e)−1 6= 0. Pour une telle forme linéaire continue ϕ, la fonction holomorphe
associée comme ci-dessus serait non nulle, ce qui est une contradiction. 
Corollaire 2 (Gelfand-Mazur). — Si l’anneau A est un corps, alors A = Ce ; autrement
dit A est isomorphe au corps des nombres complexes.

On notera que A n’est pas supposée commutative au départ.

Preuve. Il s’agit de voir que pour tout x ∈ A, il existe λ ∈ C tel que x = λe. Sinon,
on aurait (x − λe) 6= 0 pour tout λ ∈ C et donc x − λe serait inversible puisque A est
supposé être un corps : contradiction avec le fait que spA (x) 6= ∅. 

Nous passons maintenant à quelques énoncés qui facilitent les calculs de spectre.

Déjà, pour tout x ∈ A et tout λ ∈ C, il est clair que :


spA (λe) = {λ} et spA (x + λe) = spA (x) + λ.
Théorème 2 (Hilbert-Dirac). — Soit P un polynôme à coefficients complexes. Alors
spA (P(x)) = P (spA (x)) .
TS IV.70 SPECTRE D’UN ÉLÉMENT § 3

Plus généralement, si Q est un second polynôme à coefficients complexes, tel que Q(x) est
P
inversible dans A, alors en notant R la fraction rationnelle Q et R(x) = P(x)Q(x)−1 =
Q(x)−1 P(x), on a :
0 6∈ Q (spA (x)) et spA (R(x)) = R (spA (x)) .

Preuve. Si P est constant c’est vrai car spA (λe) = {λ}. On suppose désormais que P
est non constant. Soit µ ∈ C. On écrit :
P(X) − µ = αn (X − λ1 )(X − λ2 ) . . . (X − λn ),
où αn ∈ C× et où les λi dépendent de µ. L’image réciproque par P de µ est P−1 ({µ}) =
{λ1 ; λ2 ; . . . λn }, et l’on a : P(x) − µ = αn (x − λ1 e)(x − λ2 e) . . . (x − λn e). Cette dernière
égalité, et le fait que les facteurs commutent, permet de voir que P(x) − µ est inversible si,
et seulement si, chaque facteur x − λi e l’est. Ainsi :
µ ∈ spA (P(x)) ⇐⇒ λi ∈ spA (x) pour au moins un indice i ∈ {1; 2; . . . n}
⇐⇒ spA (x) ∩ P−1 ({µ}) 6= ∅
⇐⇒ µ ∈ P (spA (x)) ,
ce qui prouve la première assertion.

Passons maintenant au cas général. Remarquons d’abord que PQ = QP, et donc que
P(x)Q(x) = Q(x)P(x), ce qui permet d’écrire aussi P(x)Q(x)−1 = Q(x)−1 P(x) en multi-
pliant à gauche et à droite par Q(x)−1 l’égalité précédente. On note R(x) = P(x)Q(x)−1 =
Q(x)−1 P(x). Puisque Q(x) est inversible, on a bien sûr 0 6∈ spA (Q(x)) = Q (spA (x)). Il
reste donc à prouver la dernière formule spA (R(x)) = R (spA (x)). Soit µ ∈ C. Posons
R − µ = S = PQ1 où P1 = P − µQ. Alors on a les équivalences logiques suivantes :

µ 6∈ spA (R(x)) ⇐⇒ R(x) − µe est inversible ⇐⇒ S(x) est inversible


⇐⇒ P1 (x) est inversible ⇐⇒ 0 6∈ spA (P1 (x))
⇐⇒ 0∈6 P1 (spA (x)) ⇐⇒ 0 6∈ S (spA (x))
⇐⇒ 0 6∈ R (spA (x)) − µ ⇐⇒ µ 6∈ R (spA (x))
ce qui prouve la dernière assertion. 
Corollaire 1. — Supposons x inversible et kxk = kx−1 k = 1. Alors tout λ ∈ spA (x) est
de module 1.

Preuve. En effet, en prenant R(X) = X1 dans le théorème qui précède, on obtient que
spA (x−1 ) = spA (x)−1 . Mais spA (x) est contenu dans le disque {|λ| 6 1} car kxk = 1, et
1 −1 −1
sp (x) = spA (x ) est aussi contenu dans ce disque car kx k = 1.
A


Exercice 3. — (suite de l’Exercice 2). Soient c0 , c1 , . . . ck des nombres complexes tels que
P(λ) = c0 +c1 λ+c2 λ2 +. . . ck λk soit non nul pour λ sur le cercle unité. Montrer que l’élément
x = (xn )n∈Z ∈ `1 (Z) tel que xi = ci pour i ∈ {0; 1; 2; . . . k} et xi = 0 ailleurs, est inversible
dans `1 (Z). Calculer l’inverse de x pour les choix c0 = −24, c1 = 26, c2 = −9 et c3 = 1
(avec k = 3). Indication : on remarquera que le polynôme P(λ) = −24 + 26λ − 9λ2 + λ3 a
1
pour racine évidente 2, et on décomposera la fraction rationnelle P(X) en éléments simples.
§ 4 FORMULE DU RAYON SPECTRAL TS IV.71

Voyons maintenant le comportement du spectre par changement d’algèbre.


Proposition 2. — Sous B une sous-algèbre fermé de A telle que e ∈ B. Alors :
(i) on a spB (x) ⊃ spA (x), mais :
(ii) la frontière de spB (x) est contenue dans spA (x),
(iii) et si spB (x) est d’intérieur vide (par exemple parce qu’il est réel), alors on a :
spB (x) = spA (x).

Preuve. Le point (iii) est une conséquence immédiate de (i) et (ii), car alors l’ensemble
spB (x) est égal à sa frontière. Le point (i) est évident car si x − λe est inversible dans B,
il l’est dans A.
Prouvons le point (ii). Soit λ0 ∈ Fr (spB (x)). On a en particulier λ0 ∈ spB (x) puisque
les spectres sont des ensembles fermés. Il existe dans C une suite (λn )n>0 de limite λ0 et
telle qu’aucun λn ne soit dans spB (x). Pour tout n > 1, l’inverse (x − λe)−1 existe dans B,
donc a fortiori dans A. Supposons que x − λ0 e ait un inverse dans A ; alors par continuité
des opérations dans A, la suite des éléments (x − λn e)−1 de B convergerait dans A vers
(x − λ0 e)−1 . Puisque B est supposée fermée, cela impliquerait que (x − λ0 e)−1 ∈ B, en
contradiction avec λ0 ∈ spB (x). 

Exercice 4. — Soit A = `1 (Z) de l’Exemple 6, et soit


B = {x = (xn )n>0 ∈ A : xn = 0 pour n < 0}.
Montrer que B est une sous-algèbre fermée de A, contenant l’élément neutre e0 . On a
déterminé spA (e1 ) dans l’Exercice 2 ; déterminer spB (e1 ).
Exercice 5. — Soient U = {z ∈ C : |z| < 1}, U = {z ∈ C : |z| 6 1} et T = {z ∈ C : |z| =
1}. On note A = C (T) et B la sous-algèbre des fonctions de A qui se prolongent à U et
qui sont holomorphes sur U. Soit f la fonction identique sur T, i.e. f (z) = z. Déterminer
spA (f ) et spB (f ).
Exercice 6. — Soit λ0 un point frontière de spA (x). Montrer que quand λ 6∈ spA (x) tend
vers λ0 , on a lim k(x − λe)−1 k = +∞.

§ 4. FORMULE DU RAYON SPECTRAL

Rappel technique sur les limites de suites.

Soit R = R t {+∞} t {−∞} la droite achevée. Soit (un )n>0 une suite de R. On pose :
lim sup un = lim (sup up ) = inf sup up
n→∞ p→∞ n > p p>0n>p

et
lim inf un = lim ( inf up ) = sup inf up .
n→∞ p→∞ n > p p>0n>p

Soit l ∈ R. Les assertions suivantes sont alors équivalentes.


TS IV.72 FORMULE DU RAYON SPECTRAL § 4

(i) La suite (un )n>0 a une limite et cette limite est l.


(ii) On a : lim sup un 6 l 6 lim inf un .
n→∞ n→∞

Revenons maintenant aux algèbres de Banach. Soit A une telle algèbre avec unité e.

Définition 1. — Si x ∈ A, on pose :

%(x) = sup |λ|,


λ∈spA (x)

qu’on appelle le rayon spectral de x dans A.

C’est le rayon du plus petit disque fermé de C centré à l’origine et contenant le compact
spA (x). On a vu à la Proposition 1 que

%(x) 6 kxk,

et nous allons prouver la formule du rayon spectral :

Théorème 1 (formule du rayon spectral). — On a :


1
%(x) = lim kxn k n .
n→∞

On peut voir sur les Exemples 6, 7 et 8 que la formule n’est nullement évidente. La
démonstration ci-après, dans le cas général, est assez délicate. Cependant dans le cas de
l’algèbre des matrices Mn (C) une démonstration élémentaire est proposée plus loin en
exercice.

Preuve. D’après le théorème 2, pour tout λ ∈ C, on a λn ∈ spA (xn ), donc |λn | 6 kxn k.
1
Ceci implique |λ| 6 kxn k n , et donc :
1
kλk 6 lim inf kxn k n .
n→∞

1
En passant au supλ∈spA (x) , on obtient : %(x) 6 lim inf n→∞ kxn k n .

Désormais, on se donne λ > kxk. Puisque k λx k < 1, le Théorème 1 donne :



−1
X xn
(∗) − (x − λe) = .
λn+1
n=0

Soit ϕ ∈ A0 . Posons f (λ) = ϕ (x − λe)−1 ; cette fonction f , on l’a vu au Théorème 1,




est holomorphe dans le complémentaire de spA (x), donc a fortiori dans l’ensemble {|λ| >
kxk}. Pour |λ| > kxk, en appliquant ϕ aux deux membres de l’égalité (∗), on obtient le
développement en série de Laurent :

X ϕ(xn )
f (λ) = − .
λn+1
n=0
§ 5 CALCUL FONCTIONNEL HOLOMORPHE TS IV.73

D’après la théorie des fonctions holomorphes, ce développement converge même pour


|λ| > %(x), mieux que |λ| > kxk, puisque f est holomorphe dans {|λ| > %(x)}. En particu-
lier, si |λ| > %(x), alors pour toute ϕ ∈ A0
xn
sup |ϕ( )| < +∞,
n>0 λn
donc d’après le théorème de Banach-Steinhaus appliqué à l’espace de Banach A0 et à la
famille de formes sur A0
xn
ϕ 7→ ϕ( n ) (n > 0),
λ
on a :
xn
sup k n k < +∞.
n>0 λ
n
Ainsi : |λ| > %(x) implique k λxn k 6 C(λ) pour tout n > 0, où la constante C(λ) ne dépend
que de λ. Par conséquent, pour tout λ tel que |λ| > %(x), on a :
1 1
kxn k n 6 C(λ) n |λ|
et donc
1
lim sup kxn k n 6 |λ|.
n→∞
En passant au inf |λ|>%(x) , on obtient :
1
lim sup kxn k n 6 %(x),
n→∞
ce qui, vu le rappel technique sur les suites, achève la démonstration. 
Exercice 1. — On propose ici une preuve élémentaire de la formule du rayon spectral dans
le cas de dimension finie, c’est-à-dire :
1
lim kMn k n = le maximum des modules des valeurs propres de M,
n→∞

pour tout matrice M ∈ Mn (C).


1. Remarquer qu’il suffit de prouver le résultat pour une norme particulière.
2. Montrer que, si M ∈ Mn (C) et ε > 0 sont fixés, il existe une norme matricielle |||·|||
telle que
|||M||| 6 %(M) + ε.
3. Conclure.

§ 5. CALCUL FONCTIONNEL HOLOMORPHE

Soit x ∈ A et soit λ 7→ f (λ) une fonction holomorphe au voisinage de l’ensemble


sp(x) = spA (x). Dans ce paragraphe, on va construire un élément de A, noté f (x), et
justifier ce symbolisme. Mais ceci nécessite quelques préliminaires.

• Préliminaires sur l’intégrale vectorielle.


TS IV.74 CALCUL FONCTIONNEL HOLOMORPHE § 5

Soit A un espace de Banach sur C, et soient A0 et A00 le dual et le bidual de cet


espace, respectivement. Soit γ un arc de courbe de classe C1 par morceaux dans C, et
f : γ → A une fonction définie et continue sur γ, à valeurs (vectorielles) dans A. Si ϕ ∈ A0 ,
l’application λ 7→ hf (λ)|ϕi est une fonction numérique définie et continue sur l’arc γ, donc
son intégrale Z
hf (λ)|ϕi dλ
γ
est une notion bien connue. L’application
Z
ϕ 7→ hf (λ)|ϕi dλ
γ

est une forme linéaire en ϕ, continue sur A0 . Donc il existe un élément et un seul I ∈ A00
tel que Z
I (ϕ) = hf (λ)|ϕi dλ
γ
pour tout ϕ ∈ A0 .En fait, cet élément est dans A, ce qui est mieux que A00 ; nous admettrons
ce fait, qui est une conséquence du théorème selon lequel l’enveloppe convexe fermée d’un
compact est compacte. On pose :
Z~
I = f (λ) dλ.
γ
Z~
Ainsi l’intégrale vectorielle f (λ) dλ est l’unique élément de A tel que
γ
Z~ Z
h f (λ) dλ|ϕi = hf (λ)|ϕi dλ
γ γ

pour toute ϕ ∈ A0 . On a l’inégalité :


Z~ Z
k f (λ) dλk 6 kf (λ)kA dλ.
γ γ

• Préliminaires sur l’espace des fonctions holomorphes au voisinage d’un fermé de C

Soit F un ensemble fermé dans C. Nous noterons H (F) l’ensemble des fonctions f ,
à valeurs complexes, définies et holomorphes dans un ouvert Uf (dépendant de f ) qui
contient F.

On vérifie facilement que si f et g sont dans H (F) et λ ∈ C, alors λf , f + g, f g sont


dans H (F) – les deux affirmations au moyen de l’ouvert Uf ∩ Ug – donc H (F) est un
espace vectoriel, et même une algèbre sur C. Pour faire de l’analyse dans cet espace, on
définit une notion de limite : soit (fn )n>0 une suite dans H (F) et soit f ∈ H (F) ; alors
on dit que (fn )n>0 tend vers f dans H (F) s’il existe un ouvert fixe U indépendant de n
qui contient F et tel que les fonctions fn et f sont définies et holomorphes dans U et la
suite fn converge uniformément vers f sur U.

• Préliminaires sur l’idée du calcul fonctionnel holomorphe


§ 5 CALCUL FONCTIONNEL HOLOMORPHE TS IV.75

Soit A une algèbre de Banach avec élément neutre e. Soit x ∈ A. On sait déjà définir
P(x), élément de A, pour tout polynôme P à coefficients complexes ; si

P(λ) = a0 + a1 λ + a2 λ2 + · · · + an λn ,

on pose :
P(x) = a0 e + a1 x + a2 x2 + · · · + an xn .
On voit aussi comment définir f (x), élément de A, pour certaines fonctions de variable
complexe. Par exemple, pour
λ λ2 λn
f (λ) = exp(λ) = 1 + + + ··· + + ...,
1! 2! n!
on pose
x x2 xn
f (x) = exp(x) = e +
+ + ··· + + ...,
1! 2! n!
en remarquant que la série converge absolument, donc converge, dans l’espace de Banach
∞ ∞
X kxn k X kxkn
A, vu que : 6 = ekxk < +∞.
n! n!
n=0 n=0

Nous étudierons systématiquement exp(x) à la section 7.

Plus généralement, si f (λ) est une fonction entière (i.e. holomorphe sur C tout entier),
de la variable complexe λ ;
f 0 (0) f (2) (0) 2 f (n) (0) n
f (λ) = f (0) + λ+ λ + ··· + λ + ...
1! 2! n!
on peut poser
f 0 (0) f (2) (0) 2 f (n) (0) n
f (x) = f (0)e + x+ x + ··· + x + ...
1! 2! n!
car cette série converge absolument, donc converge, dans A.

Soit f ∈ H (sp(x)) une fonction holomorphe au voisinage de l’ensemble compact


sp(x). On va définir un élément de A qu’on notera f (x) et qui englobera les exemples
précédents. L’idée est de partir de la formule intégrale de Cauchy :
Z
1 f (λ)
f (z) = dz
2πi γ λ − z
et de poser
1 ~
Z
f (x) = (λe − x)−1 f (λ) dλ.
2πi γ
Théorème 1. — Soit A une algèbre de Banach avec unité e. Soit x ∈ A un élément donné
de cette algèbre, et sp(x) son spectre dans A.
Pour toute fonction f ∈ H (sp(x)), donc holomorphe dans un ouvert Uf contenant
sp(x), et pour toute courbe fermée γ de classe C1 par morceaux, contenue dans Uf , entou-
rant l’ensemble sp(x) (i.e. d’indice 1 par rapport à chaque point de sp(x)), définissons un
TS IV.76 CALCUL FONCTIONNEL HOLOMORPHE § 5

élément f (x) de A par l’intégrale vectorielle :


1 ~
Z
f (x) = (λe − x)−1 f (λ) dλ.
2πi γ
Alors, les assertions suivantes sont satisfaites.
(i) L’élément f (x) de A ainsi défini ne dépend pas du choix de lacet γ comme ci-
dessus.
(ii) L’application f 7→ f (x) est un homomorphisme continu de l’algèbre H (sp(x))
dans l’algèbre de Banach A.
(iii) On a : sp (f (x)) = f (sp(x)), ce qui généralise le Théorème de Hilbert-Dirac.
Preuve. Prouvons le point (i). À deux courbes γ1 et γ2 satisfaisant les hypothèses
portant sur γ ci-dessus, correspondent a priori deux éléments de A, que nous noterons
fγ1 (x) et fγ2 (x), respectivement. D’après le Théorème 1, pour toute ϕ ∈ A0 , la fonction
λ 7→ h(x − λe)−1 , ϕif (λ)
est holomorphe dans l’ouvert Vf = Uf ∩ (C sp(x)). D’après le Théorème de Cauchy,
son intégrale le long de γ1 est égale à son intégrale le long de γ2 car on peut déformer
continûment γ1 en γ2 en restant dans Vf . Donc, pour toute ϕ ∈ A0 , on a :
Z Z
1 −1 1
hfγ1 (x)|ϕi = h(λe − x) |ϕif (λ) dλ = h(λe − x)−1 |ϕif (λ) dλ = hfγ2 (x)|ϕi,
2πi γ1 2πi γ2
ce qui implique que fγ1 (x) = fγ2 (x) par Hahn-Banach.

Prouvons le point (ii), c’est-à-dire la continuité de la flèche proposée, ainsi que sa


compatibilité aux lois multiplicatives et aux combinaisons linéaires.

Tout d’abord 1 et λ sont holomorphes dans C tout entier. On peut prendre pour γ un
cercle de rayon assez grand pour que, si λ ∈ γ, on ait :
(λe − x)−1 = λ−1 e + λ−2 x + · · · + λ−n−1 xn + . . .
où la série converge absolument dans A. Alors, en utilisant les formules
Z
1 dλ
= 0 si k 6= 0 et vaut 1 si k = 1,
2πi γ λk
on voit que pour f (λ) = 1, on a :
1 ~
Z  Z 
−1 −2 −n−1 n 1 dλ
f (x) = (λ e + λ x + · · · + λ x + . . . ) dλ = e = e,
2πi γ 2πi γ λ
et pour f (λ) = λ, on a :
1 ~
Z  Z 
−1 −2 −n−1 n 1 dλ
f (x) = (λ e + λ x + · · · + λ x + . . . ) dλ = x = x,
2πi γ 2πi γ λ
La linéarité de l’application est évidente ; travaillons sur la multiplicativité et donnons-nous
f1 et f2 dans H (sp(x)). On a :
1 ~ 1 ~
Z Z
−1
f1 (x) = (λe − x) f1 (λ) dλ et f2 (x) = (λe − x)−1 f2 (λ) dλ,
2πi γ 2πi γ
§ 5 CALCUL FONCTIONNEL HOLOMORPHE TS IV.77

où l’on peut supposer que γ2 contient γ1 en son intérieur. Alors


−1 ~ ~
(λe − x)−1 (µe − x)−1 f1 (λ)f2 (µ) dλdµ
R R
f1 (x)f2 (x) = 4π 2 γ
1 γ2
−1 ~ ~ f1 (λ)f2 (µ)
(λe − x)−1 − (µe − x)−1 dλdµ
R R 
= 4π 2 γ
1 γ2 µ−λ  R f2 (µ) 
1 ~ −1 f (λ) 1
R
= 2πi (λe − x) 1 dµ dλ
γ1 2πi γ2 µ−λ 
1 ~ f (λ)
(µe − x)−1 f (µ)
R R 1
+ 4π 2 γ2 2 dλ dµ.
γ1 µ−λ

Or, d’après la formule intégrale de Cauchy, puisque λ est à l’intérieur de γ2 et µ à l’intérieur


de γ1 , on a : Z Z
1 f2 (µ) f1 (λ)
dµ = f2 (λ) et dλ = 0,
2πi γ2 µ − λ γ1 µ − λ
donc
1 ~
Z
f1 (x)f2 (x) = (λe − x)−1 (f1 f2 )(λ) dλ = (f1 f2 )(x).
2πi γ1

Pour la continuité, on vérifie le critère séquentiel pour la notion de convergence dans


H (sp(x)) décrite ci-dessus. On a :
1 −1
R
kf (x) − fn (x)kA 6 2π γ k(λe − x) k · |f (λ) − f (λ)| dλ
R n
6 supλ∈U |f (λ) − fn (λ)| · 2π γ k(λe − x)−1 k dλ
1

= C supλ∈U |f (λ) − fn (λ)|,


qui tend bien vers 0 quand n → ∞.

Prouvons le point (iii).

Montrons que µ 6∈ f (sp(x)) implique que µ 6∈ sp (f (x)). En effet, si µ 6∈ f (sp(x)),


la fonction λ 7→ f (λ) − µ ne s’annule pas sur sp(x) ; par compacité, il existe un ouvert
U ⊃ sp(x) sur lequel cette fonction ne s’annule pas. Par conséquent, la fonction
1
λ 7→ g(λ) =
f (λ) − µ
est définie et holomorphe dans U, donc appartient à H (sp(x)). Par calcul fonctionnel
holomorphe, i.e. par le point (ii), on a :
g(x) · (f (x) − µe) = e,
ce qui prouve que f (x) − µe est inversible, donc que µ 6∈ sp (f (x)).

Montrons que µ ∈ sp(x) implique que f (µ) ∈ sp (f (x)). On a :


1 ~ −1 (f (µ) − f (λ)) dλ
R
f (µ)e − f (x) = 2πi γ (λe − x)
1 ~ −1 f (µ)−f (λ)
R
= 2πi γ (λe − x) (µ − λ) µ−λ dλ
1 ~ −1
R
= 2πi γ (λe − x) (µ − λ)h(λ)dλ
= (µe − x)h(x)
par calcul fonctionnel holomorphe, avec la fonction h définie par
f (µ) − f (λ)
λ 7→ h(λ) = si λ 6= µ et h(µ) = f 0 (µ),
µ−λ
TS IV.78 CALCUL FONCTIONNEL HOLOMORPHE § 5

qui est bien une fonction de H (sp(x)). Vu que

f (µ)e − f (x) = (µe − x)h(x),

l’élément f (µ)e − f (x) n’est pas inversible puisque (µe − x) ne l’est pas. 

Remarque 1. — 1. Soient x ∈ A et f1 , f2 ∈ H (sp(x)). Alors les éléments f1 (x) et


f2 (x) commutent dans A puisque f1 f2 = f2 f1 .
2. D’après le point (iii) du Théorème, pour que f (x) soit inversible dans A, il faut et
il suffit que la fonction λ 7→ f (λ) ne soit jamais nulle sur sp(x).
3. D’après le point (ii) du Théorème, si on prend pour f un polynôme P(λ) = a0 +
a1 λ + a2 λ2 + · · · + an λn , alors le f (x) ∈ A que lui fait correpondre le calcul fonctionnel
holomorphe :
1 ~
Z
P(x) = (λe − x)−1 P(λ) dλ
2πi γ

n’est autre que P(x) = a0 e + a1 x + a2 x2 + · · · + an xn . Plus généralement, soit x ∈ A, et


soit f (λ) = a0 + a1 λ + a2 λ2 + · · · + an λn + . . . une série entière de rayon de convergence
1 ~
R > kxk. Alors f ∈ H (sp(x)) et si f (x) = 2πi −1
R
γ (λe − x) f (λ) dλ est l’élément de A que
lui fait correspondre le calcul fonctionnel holomorphe, on a la formule :

(∗) f (x) = a0 e + a1 x + a2 x2 + · · · + an xn + . . .

En effet, la série converge absolument dans {kxk < R}, donc le second membre a un sens ;
si on pose
fn (λ) = a0 + a1 λ + a2 λ2 + · · · + an λn ,
R + kxk
les fn convergent vers f (λ) uniformément dans U = {|λ| < r avec r = , donc on
2
a U ⊃ sp(x). Par conséquent les

fn (x) = a0 e + a1 x + a2 x2 + · · · + an xn

converge dans A vers f (x), d’où (∗) d’après le (ii) du théorème qui précède. Par exemple

xn 1 ~
X Z
exp(x) = = (λe − x)−1 eλ dλ
n! 2iπ γ
n=0

si γ est un cercle de rayon assez grand pour englober sp(x) en son intérieur : les deux
définitions de l’exponentielle coïncident.

Exercice 1. — Commencer par relire l’exercice 3. En déduire que si x est un élément d’une
algèbre de Banach avec neutre e, on a :
 x n
lim e + = exp(x).
n→∞ n
§ 6 THÉORÈME DE SHILOV SUR LA DÉCOMPOSITION DES OPÉRATEURS TS IV.79

§ 6. THÉORÈME DE SHILOV SUR LA DÉCOMPOSITION DES


OPÉRATEURS

Le calcul fonctionnel holomorphe est particulièrement utile en théorie des opérateurs ;


si T est un opérateur, il permet de construire de nouveaux opérateurs f (T) pour toute
fonction f holomorphe au voisinage du spectre de T. Voici un exemple frappant d’appli-
cation, dû à G. Shilov : si le spectre de T se casse en deux morceaux, alors l’espace est
somme directe de deux sous-espaces fermés stables par T ; c’est l’idée de base qui permet
ensuite de réduire, et si possible de diagonaliser, l’opérateur T.
Théorème 1. — Soit X un espace de Banach sur C. Notons L (X) = L (X, X) l’algèbre
de Banach des opérateurs dans X (i.e. des opérateurs bornés de X dans X). Soit T ∈ L (X)
et
sp(T) = spL (X) (T) = {λ ∈ C : T − λidX n’est pas inversible dans L (X)}.
Supposons que sp(T) = S1 t S2 , où S1 et S2 sont des compacts disjoints dans C. Alors
il existe deux sous-espaces vectoriels fermés X1 et X2 de X, stables par T, tels que X =
X1 ⊕ X2 , et tels que
spL (X1 ) (T|X1 ) = S1 et spL (X2 ) (T|X2 ) = S2 ,
où T|Xi désigne la restriction de T à Xi pour i ∈ {1; 2}.
Preuve. L’idée est de définir X1 et X2 par leurs projecteurs E1 et E2 , eux-mêmes
obtenus par calcul fonctionnel holomorphe à partir de fonctions e1 et e2 indicatrices d’en-
sembles, car les fonctions indicatrices partagent avec les projecteurs la propriété algébrique
d’être idempotent (i.e. d’être égal à son carré). Agrandissons S1 et S2 en deux ouverts U1
et U2 , respectivement, tels que U1 ∩ U2 soit encore vide ; c’est possible car S1 et S2 étant
compacts, on a :
d(S1 , S2 ) = inf{|λ1 − λ2 | : λ1 ∈ S1 , λ2 ∈ S2 } > 0.
Soit U = U1 t U2 . La fonction e1 définie par e1 (λ) = 1 sur U1 et 0 sur U2 est holomorphe
dans U donc sur sp(T). Le calcul fonctionnel holomoprhe lui fait correspondre un opérateur
E1 = e1 (T) ∈ L (X). De même, la fonction e2 définie par e2 (λ) = 1 sur U2 et 0 sur U1 est
holomorphe dans U donc sur sp(T), et le calcul fonctionnel holomorphe lui fait correspondre
un opérateur E2 = e2 (T) ∈ L (X). Il est clair que les fonctions e1 et e2 satisfont les identités
e1 + e2 = 1; e1 e2 = e2 e1 = 0; e21 = e1 ; e22 = e2 .
Par l’homomorphisme du calcul fonctionnel holomorphe, on a donc dans L (X) les rela-
tions :
E1 + E2 = idX ; E1 E2 = E2 E1 = 0; E21 = E1 ; E22 = E2 .
Soient X1 = {x ∈ X : E1 x = x} et X2 = {x ∈ X : E2 x = x} les sous-espaces propres de
valeur propre 1 associés aux opérateurs E1 et E2 : ce sont évidemment des sous-espaces
fermés de X. On a X1 ∩ X2 = {0} car si x est dans cette intersection, on peut écrire
x = E1 x = E1 (E2 x) = (E1 E2 )x = 0. On a X = X1 + X2 car pour tout x ∈ X on peut
écrire : x = idX x = (E1 + E2 )x = E1 x + E2 x. Ainsi X = X1 ⊕ X2 . Enfin, montrons que X1
et X2 sont stables par T. Si x ∈ Xi , alors x = Ei x, donc Tx = (TEi )x = (Ei T)x = Ei (Tx)
TS IV.80 THÉORÈME DE SHILOV SUR LA DÉCOMPOSITION DES OPÉRATEURS § 6

et donc Tx ∈ E1 (on rappelle que les éléments f (T) commutent entre eux). On peut donc
parler des restrictions T|Xi . Introduisons aussi
T1 = TE1 = E1 T et T2 = TE2 = E2 T ;
ce sont des éléments de L (X). L’opérateur T1 coïncide avec avec T|X1 sur X1 et vaut 0
sur X2 . D’autre part
1 ~
Z
T1 = λe1 (λ)(λidX − T)−1 dλ,
2πi γ=γ1 tγ2
donc, vu que e1 (λ) = 0 sur γ2 et vaut 1 sur γ1 ,
1 ~
Z
T1 = λ(λidX − T)−1 dλ,
2πi γ1
puis, quel que soit µ fixé dans C,
1 ~
Z
T1 − µE1 = (λ − µ)(λidX − T)−1 dλ.
2πi γ1
Supposons µ extérieur à la courbe γ1 ; par calcul fonctionnel holomorphe définissons l’opé-
rateur dans X
1 ~
Z
1
Qµ = (λidX − T)−1 dλ.
2πi γ1 (λ − µ)
On a clairement Qµ = E1 Qµ = Qµ E1 , donc X1 est stable par Qµ . De plus
1 ~ 1 ~
Z Z
1 −1
(T1 −µE1 )Qµ = (λ−µ) (λidX −T) dλ = e1 (λ)(λidX −T)−1 dλ = E1 .
2πi γ1 (λ − µ) 2πi γ1
En restreignant l’égalité (T1 − µE1 )Qµ = E1 aux vecteurs de X1 , on voit que l’on a prouvé
que (T − µidX )|X1 est inversible dans L (X1 ), ayant pour inverse Qµ |X1 ; ceci est valable
quel que soit µ 6∈ S1 , car on peut choisir γ1 laissant µ à l’extérieur. Ainsi est prouvé que
spL (X1 ) (T|X1 ) ⊂ S1 et spL (X2 ) (T|X2 ) ⊂ S2 .
Reste à voir que, par exemple, tout λ0 ∈ S1 est un point du spectre dans L (X1 ) de T|X1 .
On vient de voir que (T − λ0 idX )|X2 est inversible dans L (X2 ), car λ0 est extérieur à γ2 .
Donc il existe Q2 ∈ L (X2 ) tel que
(T − λ0 idX )Q2 y = y pour tout y ∈ X2 .
Si, par l’absurde, (T − λ0 idX )|X1 était inversible, il existerait un opérateur Q1 ∈ L (X1 )
tel que
(T − λ0 idX )Q1 y = y pour tout y ∈ X1 .
En posant Q = Q1 sur X1 et Q = Q2 sur X2 , on obtiendrait un opérateur Q ∈ L (X) tel que
(T − λ0 idX )Q = idX dans X tout entier. C’est absurde, car λ0 ∈ S1 , donc λ0 ∈ spL (X) (T).


Exercice 1. — Soit A une algèbre de Banach avec unité. Soit U un ouvert de C. Soit
Ω = {x ∈ A : spA (x) ⊂ U}. Montrer que Ω est ouvert dans A, et que si f est une fonction
holomorphe dans U, alors l’application x 7→ f (x) de Ω dans l’espace de Banach A est
différentiable.
§ 7 FONCTION EXPONENTIELLE TS IV.81

§ 7. FONCTION EXPONENTIELLE

C’est l’occasion de reprendre ce thème très classique dans un contexte nouveau. Plus
qu’une partie de cours ce pourrait être un travail dirigé. Aussi le lecteur est invité à essayer
de trouver et de rédiger par lui-même, avant de les lire dans le texte, les démonstrations
des énoncés ci-après.

Soit A une algèbre de Banach avec unité e. Pour tout x ∈ A, on pose :


x x2 xn
exp(x) = e + + + ··· + + ...
1! 2! n!
Nous savons déjà que la série converge (absolument) dans A, que dans A on a la formule
x
exp(x) = lim (e + )n ,
n→∞ n
et que, si γ est un cercle de rayon > kxk (ou même seulement de rayon assez grand pour
englober l’ensemble sp(x) dans son intérieur), on a :
1 ~
Z
exp(x) = (λe − x)−1 eλ dλ.
2πi γ
Proposition 1. — L’application x 7→ exp(x) de A dans A est continue.
Preuve. Si kx − x0 k 6 1 et si N est un entier > 1, on a :
1
(xn − xn0 )k
P
kexp(x) − exp(x0 )k = k n>1 n!
PN 1 n 1
= k n=1 n! (x − xn0 ) + n > N+1 n! (xn − xn0 )k
P
PN 1 n n ∞ 1
(kx0 k + 1)n
P
6 k n=1 n! (x − x0 )k + 2 n=N+1 n!
On fixe N de sorte que ∞ 1 n ε
P
n=N+1 n! (kx0 k + 1) 6 4 , ce qui est possible car c’est le reste
d’une série numérique convergente. Pour finir, par continuité des fonctions polynômes on
utilise que
N
X 1 n ε
k (x − xn0 )k 6
n! 2
n=1
dès que kx − x0 k est assez petit. 
Proposition 2. — Si x ∈ A et y ∈ A commutent (i.e. xy = yx), alors on a : exp(x+y) =
exp(x) exp(y).
Preuve. Puisque que x et y commutent, on a, pour tout entier n > 0, la formule du
binôme de Newton :
X n! p q
(x + y)n = p+q =n x y .
p!q!
Le théorème sur la multiplication de Cauchy de deux séries absolument convergentes est
valable dans A (même démonstration que pour les séries dans C, en remplaçant les modules
par des normes) ; d’après ce théorème, si on pose :
X xp X X yq X
exp(x) = = up et exp(y) = = vq ,
p! q!
p>0 p>0 q>0 q>0
TS IV.82 FONCTION EXPONENTIELLE § 7

alors

X
exp(x) exp(y) = wn
n=0
où l’on a :
X 1 X n! p q 1
wn = up vq = x y = (x + y)n
p+q=n
n! p+q=n p!q! n!
pour tout n > 0. 
   
0 1 0 0
Exercice 1. — Soient A ∈ M2 (C), x = et y = . Calculer exp(x), exp(y),
0 0 1 0
exp(x + y) et constater que exp(x) exp(y) 6= exp(x + y).
Un substitut à la Proposition 2, quand x et y ne commutent pas, est la :
Proposition 3. — Pour tous x et y dans A, on a la formule :
 x y n
exp(x + y) = lim exp( ) exp( ) .
n→∞ n n
Preuve. Pour n > k, posons :
n
x + y n X n(n − 1) · · · (n − p + 1) (x + y)p
un = (e + ) = ,
n np p!
p=0

k
X n(n − 1) · · · (n − p + 1) (x + y)p
sn,k =
np p!
p=0
et
n
X n(n − 1) · · · (n − p + 1) (x + y)p
rn,k = .
np p!
p=k+1
D’autre part,
x y 1 1
zn = exp( ) exp( ) = e + (x + y) + 2 wn ,
n n n n
où wn reste borné quand n varie. Donc, pour n > k, on a :
n wn p
wn n X n(n − 1) · · · (n − p + 1) x + y +
  
n 1 n
(zn ) = e + (x + y + ) = ,
n n np p!
p=0

k wn p

X n(n − 1) · · · (n − p + 1) x + y + n
σn,k =
np p!
p=0
et
n wn p

X n(n − 1) · · · (n − p + 1) x + y + n
%n,k = .
np p!
p=k+1
On peut fixer un rang k assez grand pour que pour tout n > k on ait :
ε
(1) krn,k k 6
3
et
ε
(2) k%n,k k 6
3
§ 7 FONCTION EXPONENTIELLE TS IV.83

car d’une part, quel que soit p, on a n(n−1)···(n−p+1)


np 6 1 et, d’autre part, kx + y + wnn k est
borné par une constante C indépendante de n, vu que (wn )n>0 est bornée ; par conséquent,
X (x + y)p X Cp
krn,k k 6 et k%n,k k 6
p! p!
p>k p>k
ε
sont 6 3 pour k assez grand, au titre de restes de séries abslolument convergentes.

L’indice k étant désormais fixé, choisissons N > k tel que pour tout n > N on ait :
ε
(3) ksn,k − σn,k k 6 .
3
C’est possible car, à k fixé pour les p en nombre fini tels que 0 6 p 6 k, on a :
n(n − 1) · · · (n − p + 1) 1
lim = 0 et lim wn = 0,
n→∞ np n→∞ n
donc
n(n − 1) · · · (n − p + 1) (x + y)p − (x + y + n1 wn )p
lim = 0.
n→∞ np p!
La combinaison de (1), (2) et (3) montre que lim (un − (zn )n ) = 0, et comme on sait
n→∞
depuis l’Exercice 1 que lim un = exp(x + y), on obtient que les deux membres de l’égalité
n→∞
dans l’énoncé valent tous les deux lim (zn )n . 
n→∞

Il est bon de relire pour la suite l’Exercice 15 du Chapitre II. Si x ∈ A vérifie kx−ek <
1, on pose
X (e − x)m
log(x) = − ,
m
m>1
ce qui a un sens et définit un élément de A, car la série est absolument convergente, vu que
X (e − x)m X ke − xkm
k− k 6 = − log(1 − ke − xk) < +∞.
m m
m>1 m>1

D’après le calcul fonctionnel holomorphe on a aussi, pour α assez petit :


1 ~
Z
log(x) = (λe − x)−1 log(λ) dλ
2πi |1−λ|=α
où log est la détermination principale du logarithme.
Proposition 4. — Soit x ∈ A tel que kx − ek < 1. Alors exp (log(x)) = x.
Preuve. Soit U le disque {|z − 1| < 1} dans C. Pour z ∈ U et n > 1 entier posons :
n
X (1 − z)m
fn (z) = − .
m
m=1
D’après la théorie des séries entières, (fn )n>1 converge vers log(z) uniformément sur tout
compact de U. Par continuité de l’exponentielle, (efn )n>1 converge vers elog(z) = z unifor-
mément sur tout compact de U. Posons
n
X (e − x)m
fn (x) = − .
m
m=1
TS IV.84 FONCTION EXPONENTIELLE § 7

Par définition de log(x), la suite fn (x) tend vers log(x) dans A quand n → ∞, donc par
continuité la suite des efn (x) tend vers elog(x) dans A quand n → ∞. Mais, d’autre part,
exp (fn (x)) n’est autre que l’image dans A, par le calcul fonctionnel holomorphe, de la
fonction efn (z) : la vérification rigoureuse de ceci consiste à se convaincre d’abord que, à k
k
fixé, la fonction ez donne exp(xk ) dans le calcul fonctionnel holomorphe, ce qui est clair
sur la série exponentielle. Mais, par ailleurs, efn (z) tend vers z dans l’espace H (sp(x)).
Donc exp (fn (x)) tend dans A d’une part vers x et, d’autre part comme on l’a vu, vers
exp (log(x)). Ainsi exp (log(x)) = x. 

Soit exp A = {x ∈ A : il existe y ∈ A tel que x = exp(y)} l’image de A dans A par


l’application exponentielle. Nous allons comparer exp A au groupe des inversibles G = A× .
D’abord une évidence : exp A ⊂ G, car e = exp(0) et, d’après la Proposition 2, pour tout
x∈A:
exp(x) exp(−x) = exp(−x) exp(x) = exp(0) = e,
prouvant que exp(x) est inversible dans A avec exp(x)−1 = exp(−x).

Proposition 5. — Le sous-ensemble exp A est une partie connexe de G.

Preuve. Le sous-ensemble exp A est même connexe par arcs, car pour tout x = exp(y),
le chemin continu t 7→ exp(ty) (0 6 t 6 1) relie e à x. 

Ici, ouvrons une parenthèse pour un :

• Rappel sur la connexité.

Un espace métrique est dit connexe s’il n’est pas réunion de deux ouverts disjoints non
vides. Une partie C d’un espace métrique E est dite connexe si le sous-espace métrique C
de E est connexe, c’est-à-dire si les hypothèses :

U1 et U2 ouverts de E, U1 ∩ C 6= ∅, U2 ∩ C 6= ∅ et C ⊂ U1 ∪ U2

entraînent que C ∩ U1 ∩ U2 6= ∅.

Si C est connexe, alors C est connexe, et toute image continue de C est connexe. Si
T S
(Cλ )λ∈Λ est une famille de parties connexes de E telle que λ∈Λ Cλ 6= ∅, alors λ∈Λ Cλ 6=
∅ est connexe.

Dans E normé, toute partie convexe est connexe.

Soit x ∈ E. La composante connexe de x dans E, notée Cx , est la réunion des par-


ties connexes de E qui contiennent x ; c’est donc la plus grande partie connexe de E qui
contienne x ; elle est fermée dans E. Si x et y sont dans E, ou bien Cx = Cy ou bien
Cx ∩ Cy = ∅. La relation x ∼ y si et seulement si Cx = Cy est une relation d’équivalence
dont les classes s’appellent composantes connexes de E.

Suposons maintenant que E (qu’on notera plutôt G) soit un groupe topologique, ce qui
signifie que sont continues les applications (x, y) 7→ xy de G × G dans G et x 7→ x−1 de G
dans G. C’est le cas pour le groupe G des inversibles d’une algèbre de Banach A.
§ 7 FONCTION EXPONENTIELLE TS IV.85

Proposition 6. — La composante connexe G◦ de l’élément neutre e dans un groupe to-


pologique G est un sous-groupe distingué fermé de G.

Preuve. Si x ∈ G◦ , alors x−1 G◦ est connexe, comme image continue (par la mul-
tiplication à droite par x−1 ) du connexe G◦ , et contient e, donc x−1 G◦ ⊂ G◦ pour tout
x ∈ G◦ . Par conséquent, G◦ est un sous-groupe de G ; il est fermé comme toute composante
connexe. Si a ∈ G, alors a−1 G◦ a est connexe, comme image continue (par la conjugaison
par a−1 ) du connexe G◦ , et contient e, donc a−1 G◦ a ⊂ G◦ pour tout a ∈ G. Ainsi G◦ est-il
distingué dans G. 

Théorème 1. — Soit A une algèbre de Banach avec unité, notée e. Soit G le groupe de
ses éléments inversibles. Soit G◦ la composante connexe de e dans G. Alors les assertions
suivantes sont satisfaites.
(i) Le sous-groupe G◦ est engendré par exp A ;
(ii) Si A est commutative, alors G◦ = exp A.

Preuve. Posons V = exp A. D’après la Proposition 5, V est contenue dans G◦ . Le


sous-groupe de G◦ engendré par V n’est autre que
[
V∞ = Vn
n>0

où Vn est l’ensemble des produits de n éléments de V ; ceci découle du fait que V est
symétrique (i.e. V−1 = V). Bref, hVi est l’ensemble des produits finis d’éléments de V.

On a vu à la Proposition 4 que V contient la boule ouverte de centre e et de rayon


1 (tout élément de cette boule est l’exponentielle de son logarithme), donc e est un point
intérieur à V, donc intérieur à V∞ . Par translation, chaque x ∈ V∞ est intérieur à V∞ ;
par conséquent le sous-groupe V∞ est ouvert dans G◦ ; du coup il est aussi fermé dans G◦
(car c’est le complémentaire dans G◦ des classes à gauche de G◦ modulo V∞ , autres que
V∞ elle-même). Puisque G◦ est connexe et que V∞ 6= ∅, on a : V∞ = G◦ . Ceci prouve le
point (i). En ce qui concerne (ii), si A est commutative exp A est déjà un groupe, d’après
la Proposition 2, et donc G◦ = exp A. 

Exemple 1. — Sachant que le groupe GLn (C) des matrices n × n complexes inversibles
est connexe, on obtient que toute matrice n × n complexe de déterminant 6= 0 est produit
d’un nombre fini de matrices exponentielles.

Exercice 2. — 1. Soit x ∈ A tel que xn = e pour un entier n > 0 au moins. Montrer


que sp(x) est fini, et que x ∈ G◦
2. Supposons A commutative. Soit x ∈ G tel que xn ∈ G◦ pour un entier n > 0 au
moins. Montrer qu’alors x ∈ G◦ . En déduire que si A est commutative, ou bien G = G◦ ou
bien G/G◦ est sans torsion (et c’est alors un groupe infini).
TS IV.86 FONCTION EXPONENTIELLE § 7

§ 8. TRANSFORMATION DE GELFAND

Dans tout ce paragraphe, A désigne une algèbre de Banach commutative avec unité,
notée e. En particulier, A est un anneau commutatif ; à ce titre, A a des idéaux, et en
particulier des idéaux maximaux. Nous allons étudier l’ensemble MA des idéaux maximaux
de A.

Mais d’autre part A est un espace de Banach, pour lequel on connaît déjà l’importance
du dual A0 , ensemble des formes linéaires continues sur A ; là encore, si on veut tenir
compte de l’existence d’un produit sur A, on est amené à faire jouer un rôle privilégié
aux f ∈ A0 , non identiquement nulles, qui sont de plus multiplicatives, c’est-à-dire telles
que f (xy) = f (x)f (y) pour tous x et y dans A. Ces formes multiplicatives continues sont
appelés les caractères de A . Nous allons étudier l’ensemble A
b des caractères de A.

Il y a une bijection naturelle entre MA et A,b chaque idéal maximal étant le noyau
d’un caractère ; réciproquement, le noyau de tout caractère est un idéal maximal de A.

Rappelons qu’un idéal I de A est un sous-espace vectoriel de A tel que x ∈ I et y ∈ A


entraîne xy ∈ A. Un idéal I est dit propre si I est différent de A tout entier. Un idéal M
est dit maximal s’il est propre et si tout idéal propre qui le contient est égal à M. Il revient
au même de dire que A/M est un corps (par définition un corps n’est pas l’anneau nul).
Tout idéal propre I est contenu dans au moins un idéal maximal (théorème de Krull – cf
l’Appendice sur le Lemme de Zorn). Soit I un idéal propre fermé de l’algèbre de Banach
A. Alors l’anneau et espace vectoriel A/I, ensemble des classes x = x + I, où x ∈ A, avec
les opérations évidentes, et la norme
kxk = inf kyk,
y∈x=x+I

est une algèbre de Banach, avec e comme unité.

Soit G l’ensemble des inversibles de A. Si x ∈ G, alors x n’est dans aucun idéal


propre car xx−1 = e appartiendrait à cet idéal, et donc on aurait y = ye ∈ I pour tout
y ∈ A. D’autre part, si x 6∈ G, alors l’idéal xA engendré par x est propre car e 6∈ xA. En
conséquence, la réunion des idéaux maximaux de A coïncide avec le complémentaire de
l’ensemble G des inversibles de A.
Proposition 1. — Soit M un idéal maximal de A. Alors M est fermé dans A et le corps
M/A est le corps des nombres complexes.
Preuve. On vient de voir que M ∩ G est vide. Puisque G est ouvert, M ∩ G est encore
vide, donc M est un idéal propre qui contient M : on a donc M = M, ce qui prouve que M
est fermé. Le quotient A/M est une algèbre de Banach dont l’anneau est un corps puisque
M est maximal ; d’après le théorème de Gelfand-Mazur, ce corps est le corps des nombres
complexes. 
Définition 1. — Un caractère de A est une fonction χ : A → C qui possède les propriétés
suivantes.
(i) La fonction χ n’est pas identiquement nulle.
§ 8 TRANSFORMATION DE GELFAND TS IV.87

(ii) La fonction χ est une forme linéaire sur A.


(iii) La fonction χ est multiplicative.
De cette définition, il résulte que :
(iv) On a χ(e) = 1.
En effet, si χ(a) 6= 0, alors χ(a) = χ(ae) = χ(a)χ(e).
Définition 2. — On appelle spectre de Gelfand de A, et l’on note A,
b l’ensemble des
caractères de A.
On note MA l’ensemble des idéaux maximaux de A.
b sur MA .
Proposition 2. — L’application χ 7→ Ker(χ) établit une bijection de A
Preuve. Soit χ ∈ A. b D’après (ii) et (iii) c’est un homomorphisme d’algèbres, qui
est surjectif car χ(λe) = λχ(e) = λ pour tout nombre complexe λ. Ainsi, A/Ker(χ) est
isomorphe à C, qui est un corps ; donc l’idéal Ker(χ) est maximal, et χ 7→ Ker(χ) est
bien une application de Ab sur MA . Cette application est surjective, car si M ∈ MA , alors
l’homomorphisme quotient associé χ : A → A/M ' C appartient à A, b et Ker(χ) = M.
0
Cette application est injective, car pour χ, χ ∈ A distinctes, il existe a ∈ A tel que
χ(a) 6= χ0 (a). Alors y = a − χ(a)e appartient à Ker(χ) mais pas à Ker(χ0 ). Donc χ 6= χ0
entraîne Ker(χ) 6= Ker(χ0 ). 
Théorème 1. — Soit A une algèbre de Banach commutative avec élément unité, noté e.
Soit Ab son spectre de Gelfand, ensemble des caractères de A.
(i) Soit χ ∈ A.
b Alors la forme linéaire χ sur A est continue et de norme 1. Ainsi, A
b
0
est-il une partie de la sphère unité du dual A de A.
(ii) Soit x ∈ A. Alors
spA (x) = {χ(x) : χ ∈ A}.
b
(iii) Soit x ∈ A. Pour que x soit inversible, il faut et il suffit qu’on ait χ(x) 6= 0 pour
tout χ ∈ A.b

Preuve. On a : χ (x − χ(x)e) = χ(x)−χ(x)1 = 0, donc x−χ(x)e ne peut être inversible


puisqu’il est dans un idéal maximal M = Ker(χ) de A, donc dans le complémentaire de G.
Ceci prouve que spA (x) ⊃ {χ(x) : χ ∈ A}.
b Il en résulte que, pour x ∈ A, on a |χ(x)| 6 kxk ;
autrement dit chaque caractère χ est une forme linéaire continue de norme 6 1, et en fait
de norme exactement 1 puisque χ(e) = 1. On vient donc de prouver (i) et une moitié de
(ii).

Montrons (iii) par la suite d’équivalences logiques :


S
x ∈ G ⇔ x 6∈ M∈MA M
⇔ pour tout χ ∈ A b on a x 6∈ Ker(χ)
⇔ pour tout χ ∈ A b on a χ(x) 6= 0.
Il reste à prouver que
spA (x) ⊂ {χ(x) : χ ∈ A}.
b
Si λ ∈ spA (x), alors x − λe n’est pas inversible, donc, d’après le point (iii) qu’on vient de
prouver il existe χ ∈ Ab tel que χ(x − λe) = 0, soit tel que λ = χ(x). 
TS IV.88 TRANSFORMATION DE GELFAND § 8

Arrêtons-nous un peu sur le cas particulier des algèbres de fonctions complexes conti-
nues sur un compact X.

Soit C = C (X) l’algèbre de Banach des fonctions continues à valeurs complexes sur un
espace compact X, munie de la norme k·k∞ de la convergence uniforme. Pour tout x0 ∈ X
fixé, l’évaluation en x0 :
χx0 : f 7→ f (x0 )
est évidemment un caractère de C ; l’idéal maximal correspondant est
Mx0 = Ker(χx0 ) = {f ∈ C (X) : f (x0 ) = 0}.
Montrons qu’il n’y a pas d’autres idéaux maximaux dans C (X) que les Mx quand x parcourt
X. Autrement dit que X s’identifie au spectre de Gelfand de C (X). Ceci résulte du
Lemme 1. — Soit I un idéal propre de C (X). Alors il existe au moins un point x0 ∈ X tel
que toutes les fonctions f ∈ I s’annulent en ce point x0 .
Preuve. Supposons le contraire afin d’aboutir à une contradiction. Alors pour tout
y ∈ X il existe fy ∈ I non nulle en y et donc par continuité non nulle sur un ouvert Uy
autour de y. On pose gy = |fy | = fy f y : c’est une fonction de I car fy ∈ I et I est un idéal.
Ainsi, pour tout y ∈ X il existe une fonction de I qui est > 0 sur X tout entier et > 0 sur
un ouvert Uy de X contenant y. Par compacité on en déduit une suite finie y1 , y2 , . . . yp ∈ X
telle que X = Uy1 ∪ Uy2 ∪ · · · ∪ Uyp . La fonction g = gy1 + gy2 + · · · + gyp serait dans I et
> 0 sur X tout entier, donc inversible : c’est exclu car I est propre dans C (X). 

Si M est un idéal maximal de C (X), donc propre, pour le point x0 venant du lemme
appliqué à I = M on aura M ⊂ Mx0 , et donc l’égalité par maximalité de M.
Exercice 1. — On va déterminer tous les idéaux fermés de C (X). Soit E un fermé de X.
On introduit les idéaux :
IE = {f ∈ C (X) : f (x) = 0 pour tout x ∈ E}
et
JE = {f ∈ C (X) : il existe un ouvert Uf ⊃ E tel que f (x) = 0 pour tout x ∈ Uf }.
1. Montrer que JE est l’adhérence de IE dans C (X). Indication : penser au Théorème
d’Urysohn en considérant les fermés Y1 = {x : |f (x)| > n2 } et Y2 = {x : |f (x)| < n1 }.
2. Soit I un idéal propre de C (X) et soit
E = {x ∈ X : f (x) = 0 pour toute f ∈ I}.
Montrer que
JE ⊂ I ⊂ IE .
Indication : si f ∈ JE , soit Y le complémentaire de Uf dans X. Montrer qu’il existe une
g ∈ I qui est strictement positive sur Y, puis en prolongeant g1 de Y à X par le Théorème
d’Urysohn, montrer qu’il existe une u ∈ I qui est identiquement égale à 1 sur Y.
3. En déduire que les idéaux fermés de C (X) sont exactement les idéaux IE comme
ci-dessus, quand E parcourt l’ensemble des fermés de X.
4. Tout idéal fermé de C (X) est l’intersection des idéaux maximaux qui le contiennent.
§ 8 TRANSFORMATION DE GELFAND TS IV.89

Exercice 2. — Soit A = Dm ([0; 1]) l’algèbre de Banach définie dans l’Exercice 4. Montrer
que les idéaux maximaux de A sont, ici encore, les noyaux des évaluations aux points de
[0; 1], mais qu’il y a plusieurs idéaux fermés distincts à être contenus dans un seul idéal
maximal donné.
Reprenons la théorie générale des algèbres de Banach commutatives. On ne fait pas de
l’ensemble A,
b spectre de Gelfand de A, un espace métrique, mais constatant que c’est une
partie de la boule unité du dual A0 , on munit A0 de la topologie faible de dualité avec A : par
définition, on dit que les χi ∈ A
b tendent vers χ quand i → ∞ si limi→∞ χi (a) = χ(a) pour
tout a ∈ A. L’ensemble A b devient alors, pour cette notion de limite, un espace topologique
(non métrique en général) compact.

À tout x ∈ A, on va attacher une fonction continue sur le compact A,


b la transformée
de Gelfand de x. L’extrême simplicité apparente de la définition pourrait en masquer la
profondeur :
Définition 3. — Pour tout x ∈ A donné, la fonction G x définie sur A,
b à valeurs com-
plexes, par la formule :
G x(χ) = χ(x),
pour tout χ ∈ A, s’appelle la transformée de Gelfand de x.
b

Chaque fonction G x est continue, car si des χi ∈ A


b tendent vers χ dans A,
b alors pour
x ∈ A fixé, les nombres χi (x) tendent vers le nombre χ(x), c’est-à-dire limi→∞ G x(χi ) =
G x(χ).

De plus, d’après le Théorème 1, on a les relations :


kG xk∞ = sup |G x(χ)| = sup |χ(x)| = %(x) 6 kxk
χ∈A
b χ∈A
b

et
sp(x) = {G x(χ) : χ ∈ A}.
b
Le spectre de x est donc l’ensemble des valeurs prises par la transformée de Gelfand
G x. Il en résulte le
Théorème 2. — Pour que x soit inversible dans A, il faut et il suffit que sa transformée
de Gelfand G x ne s’annule pas dans A.
b

Tout ce que nous avons vu montre aussi que la transformée de Gelfand x 7→ G x est un
homomorphisme continu de l’algèbre de Banach A dans l’algèbre de Banach C (A)b normée
par k·k∞ . En particulier, on a la formule fondamentale :
G (xy) = (G x)(G y),
qui généralise le fait que la transformation de Fourier transforme le produit de convolution
en le produit ponctuel ordinaire. En effet, on a :
G (xy) = χ(xy) = χ(x)χ(y) = G xG y.
1
Si x est inversible dans A, on a G (x−1 ) = .
Gx
TS IV.90 TRANSFORMATION DE GELFAND § 8

On remarquera que G n’est pas toujours injective :


Exercice 3. — Les quatre ensembles suivants sont égaux.
(i) Le noyau de G dans A.
(ii) L’intersection des idéaux maximaux de A.
(iii) L’ensemble des x ∈ A tels que sp(x) = {0}.
1
(iv) L’ensemble des x ∈ A tels que limn→∞ kxn k n = 0.
Cette partie s’appelle le radical de A. Donner un exemple d’algèbre de Banach A avec un
radical non trivial.
Exercice 4. — Montrer que G (A) est en général distincte de C (A),
b mais qu’elle sépare
toujours A.
b

Exercice 5. — Montrer que G est une isométrie de A dans C (A)


b si et seulement si kx2 k =
kxk2 pour tout x ∈ A.
Dans le cas de l’algèbre de Banach A = C (X), où A b ' X, la transformée de Gelfand
fait correspondre à l’élément f ∈ C (X) la fonction f elle-même, ce qui ne présente aucun
intérêt. Vu l’Exercice 2, il en est de même pour l’algèbre A = Dm ([0; 1]). En revanche, la
profondeur et l’efficacité de la théorie vont apparaître dans son application à l’algèbre de
convolution `1 (Z).

§ 9. THÉORÈME DE WIENER

Reprenons l’algèbre `1 (Z) munie du produit de convolution. C’est l’algèbre des suites
P
x = (xn )n∈Z de nombres complexes, telles que n∈Z |xn | < +∞, munie du produit de
convolution :
X
x ∗ y = (x ∗ y)n où (x ∗ y)n = xn−p yp pour tout n ∈ Z
p∈Z

Dans des exercices précédents, nous avons commencé à étudier cette algèbre de Banach
commutative ; résumons ce que nous en savons déjà.
Pour tout k ∈ Z, on définit une suite ek par (ek )n = 1 si n = k et 0 sinon. Alors on
a eh ∗ ek = eh+k pour tous h, k ∈ Z, donc (e1 )n = en pour tout n ∈ Z et e0 est l’élément
neutre de A.
Si x = (xn )n∈Z ∈ `1 (Z), la série n∈Z xn en = n∈Z xn (e1 )n converge (absolument)
P P

vers x dans l’espace de Banach `1 (Z), c’est-à-dire :


N
X
x = lim xn (e1 )n
N→∞
n=−N

au sens de la norme `1 ci-dessus. De plus, nous savons que le spectre de l’élément e1 dans
`1 (Z) est le cercle unité du plan complexe :
sp(e1 ) = T = {λ ∈ C : |λ| = 1} = {eiθ : θ ∈ R}.
On va voir que le spectre de Gelfand de `1 (Z) s’identifie à T.
§ 9 THÉORÈME DE WIENER TS IV.91

Pour tout eiθ ∈ T et toute x = (xn )n∈Z ∈ `1 (Z), posons :



X
χeiθ (x) = xn einθ ,
n=−∞

ce qui a un sens, car la série converge (absolument) dans C. Il est clair que x 7→ χeiθ (x) est
une forme linéaire non nulle sur `1 (Z), car χeiθ (e0 ) = 1. Vérifions que c’est un caractère,
c’est-à-dire qu’elle est multiplicative sur A. Si x ∈ A et y ∈ A, on a :
P  P 
∞ ipθ ∞ iqθ
P i(p+q)θ
χeiθ (x)χeiθ (y) = p=−∞ px e q=−∞ qy e = p,q∈Z xp yq e
 
inθ inθ ,
P P P
= n∈Z p+q=n xp yq e = n∈Z (x ∗ y)n e

ce qui vaut encore χeiθ (x ∗ y) ; dans les calculs qui précèdent, on a pu regrouper les termes
selon les n = p + q, vu le théorème sur la multiplication de Cauchy des séries absolument
convergentes.

Ainsi tout χeiθ est un caractère de `1 (Z) ; montrons qu’il n’y en a pas d’autres. Soit
χ ∈ A.b Cherchons eiθ tel que χ = χeiθ . La valeur candidate de eiθ se trouve au moyen
de e1 . Plus précisément, puisque e−1 = (e1 )−1 on a χ(e1 )χ(e−1 ) = 1 avec |χ(e1 )| 6 1 et
|χ(e−1 )| 6 1 car ke1 k = ke−1 k = 1, et donc |χ(e1 )| = 1 (ce qui résulte aussi du fait que
sp(e1 ) = T). On peut donc écrire χ(e1 ) = eiθ puis, par multiplicativité : χ(e−1 ) = e−iθ et
χ(en ) = einθ pour tout n ∈ Z. On peut maintenant comparer χ et χeiθ : ces deux caractères
coïncident sur chaque en (n ∈ Z), donc par linéarité sur toutes les combinaisons linéaires
finies N n
P
n=−N xn (e1 ) ; donc par passage à la limite quand N → ∞, on a : χ(x) = χeiθ (x)
pour tout x ∈ `1 (Z). En résumé :
Proposition 1. — Les caractères de l’algèbre de Banach A = `1 (Z) sont exactement les :

X
x = (xn )n∈Z 7→ χeiθ (x) = xn einθ .
n=−∞

On peut donc identifier le spectre de Gelfand A b avec le cercle unité T = {eiθ }θ∈R de C,
par χeiθ ↔ e . Après cette identification, la transformée de Gelfand G x d’un élément

x = (xn )n∈Z ∈ `1 (Z) est la fonction continue sur T définie par :



X
G x(eiθ ) = xn einθ .
n=−∞

Corollaire 1. — Pour que x = (xn )n∈Z ∈ `1 (Z) soit inversible dans `1 (Z) il faut et il
suffit que pour tout θ ∈ R, on ait : ∞ inθ 6= 0.
P
n=−∞ xn e

Ce corollaire peut être reformulé plus classiquement, sous la forme d’un théorème
initialement dû à N. Wiener.
Théorème 1 (Wiener). — Soit t 7→ f (t) une fonction continue de variable réelle, de
période 2π et à valeurs complexes. Soient
Z π
1
cn (f ) = f (t)e−int dt
2πi −π
ses coefficients de Fourier (n ∈ N). On fait les deux hypothèses suivantes.
TS IV.92 THÉORÈME DE WIENER § 9

(i) La fonction f ne s’annule pas.


(ii) La série de Fourier de f est absolument convergente :
X
|cn (f )| < +∞.
n∈Z
1
Alors, en posant g(t) = , on a :
f (t)
X
|cn (g)| < +∞.
n∈Z

Autrement dit, si une fonction continue f sur T ne s’annule pas – ce qui permet de
considérer la fonction inverse f1 – et si f est dans la classe (très particulière) des fonctions
à série de Fourier absolument convergente, alors f1 est elle aussi dans cette classe.

Cet énoncé, découvert par Norbert Wiener en 1932, et démontré par de longs calculs de
convolution, fut redémontré comme ci-dessus en quelques lignes par Israël Gelfand comme
application de sa théorie des algèbres de Banach.

Preuve. Soit x ∈ `1 (Z) telle que xn = cn (f ) pour tout n ∈ Z. Alors x satisfait à


l’hypothèse du Corollaire, car f (θ) = n∈Z xn einθ n’est jamais nulle. Donc x est inversible
P

dans `1 (Z) ; soit y = (yn )n∈Z son inverse. Posons g(θ) = n∈Z yn einθ . Puisque x ∗ y = e0 ,
P

par transformation de Gelfand on a : g(θ)f (θ) = 1 pour tout θ, donc g = f1 . Mais les
P
coefficients de Fourier de g sont les yn ; donc n∈Z |cn (g)| < +∞. 
Exercice 1. — Soit A l’algèbre des sommes de séries de Taylor absolument convergentes
f = f (z) = n>0 an z n , munie de la norme kf k = ∞
P P
n=0 |an | < +∞.
1. Montrer que les caractères de A sont exactement les χz0 : f 7→ f (z0 ) où z0 ∈ C
avec |z0 | 6 1. Ceci permet d’identifier A
b au disque unité fermé de rayon 1 de C.
2. Montrer que si f ∈ A n’est jamais nulle sur ce disque, alors il existe des nombres
complexes bn tels que

1 X X
= bn z n et |bn | < +∞.
f (z)
n>0 n=0

3. Soient f1 , f2 , . . . fp des fonctions appartenant à A et n’ayant aucun zéro commun


dans {z ∈ C : |z| 6 1}. Montrer qu’il existe g1 , g2 , . . . gp telles que pi=1 fi gi = 1.
P

Exercice 2. — Soit A = OC (U) l’algèbre de l’Exemple 3. On pose e1 (z) = z.


1. Montrer que tout f ∈ A est limite en norme de A de polynômes en e1 .
2. Montrer que les seuls caractères de A sont les évaluations aux points de U.
3. Soient f1 , f2 , . . . fp des fonctions appartenant à A et n’ayant aucun zéro commun
dans U. Montrer qu’il existe g1 , g2 , . . . gp telles que pi=1 fi gi = 1.
P

4. Montrer que cette algèbre est strictement plus grande que celle de l’Exercice 6.
Exercice 3. — Soit A une algèbre de Banach possédant un élément a (appelé générateur)
tel que l’ensemble des P(a), où P ∈ C[X], soit dense dans A. Montrer que dans ce cas
χ 7→ χ(a) établit une bijection de A
b sur spA (a). Reconsidérer les Exercices 6 et 2 dans
cette perspective.
§ 9 THÉORÈME DE WIENER TS IV.93

Exercice 4. — Soit X un espace compact. Soit A une sous-algèbre de C (X). On fait les
hypothèses suivantes
(i) A sépare X ;
(ii) 1 ∈ A ;
(iii) A est auto-adjointe, i.e. f ∈ A ⇒ f ∈ A ;
(iv) si f ne s’annule jamais sur A, alors f1 ∈ A.
Montrer qu’alors les seuls homomorphismes non identiquement nuls de l’algèbre A dans
le corps C sont les homomorphismes d’évaluation χx : f 7→ f (x), où x parcourt X. En
particulier, si A est une algèbre de Banach, son spectre de Gelfand s’identifie à X.

Vis-à-vis du calcul fonctionnel holomorphe, la transformation de Gelfand se comporte


comme on peut l’espérer.

Proposition 2. — Soit x ∈ A. Soit F une fonction holomorphe au voisinage de sp(x) et


soit F(x) l’élément qui correspond à F dans le calcul fonctionnel holomorphe. Alors
G F(x) = F ◦ G x.

Preuve. C’est un calcul. Pour tout χ ∈ A,


b on a :

1 ~
Z
G F(x)(χ) = χ (F(x)) = h (λe − x)−1 F(λ) dλ|χi
Z 2πiZ γ
1 1
= −1
h(λe − x) |χiF(λ) dλ = (λz − χ(x))−1 F(λ) dλ
2πi γ 2πi γ
= F (χ(x)) = F (G x(χ)) ,
qui est bien (F ◦ G x)(χ). 

On en déduit une généralisation du Théorème de Wiener :

Théorème 2 (Wiener-Lévy). — Soit f = f (t) une fonction continue de variable réelle et


de période 2π, dont la série de Fourier de f est absolument convergente :
X
|cn (f )| < +∞.
n∈Z

Soit F une fonction holomorphe au voisinage de l’ensemble f (T) des valeurs prises par f .
Alors la fonction
(F ◦ f ) : t 7→ F (f (t))
est encore une fonction 2π-périodique à série de Fourier de f absolument convergente.
1
Évidemment, pour F(z) = z on retrouve le Théorème de Wiener.

1 (Z), on a :
Preuve. Sur T ' `[
X
f (θ) = cn (f )einθ = G x(χeiθ )
n∈Z

où x = (cn (f ))n∈Z appartient à `1 (Z) par hypothèse. Le spectre de x est l’ensemble f (T)
des valeurs prises par G x = f , donc F est holomorphe au voisinage de sp(x) ; on peut donc
TS IV.94 THÉORÈME DE WIENER § 9

appliquer la Proposition 2 :
X
(∗) (F ◦ f )(θ) = G F(x)(χeiθ ) = dn einθ
n∈Z

avec F(x) = (dn )n∈Z ∈ `1 (Z), donc


P
n∈Z |cn (f )| < +∞. Mais, d’après (∗), on a dn =
cn (F ◦ f ) pour tout n ∈ Z. 

Exercice 5. — Énoncer et démontrer un théorème de type Wiener-Lévy pour l’algèbre de


l’Exercice 6.

• Transformation de Fourier comme transformation de Gelfand

On cite ici des résultats sans les démontrer.

L’algèbre de Banach commutative la plus importante est peut-être l’algèbre de convo-


lution L1 (R) pour la norme k·k1 et le produit
Z
(f1 ∗ f2 )(x) = f1 (x − t)f2 (t) dt.
R

Or cette algèbre n’a pas d’élément neutre (un tel élément neutre ne pourrait être que
la mesure de Dirac, qui n’est pas une fonction), donc ce qui précède ne s’applique pas
directement à L1 (R).
e l’algbèbre déduite de L1 (R) par adjonction d’un élément neutre, définie dans
Soit A
l’Exemple 9. Pour tout t ∈ R et tout (f, λ) ∈ Ae = L1 (R) × C, la formule :
Z
χt (f, λ) = f (x)e−ixt dx = F f (t),
R

qui donne la transformée de Fourier de f ∈ L1 (R), définit évidemment un caractère de A, e


car F (f1 ∗ f2 ) = F (f1 )F (f2 ). On montre qu’il n’y a pas d’autre caractère de A, excepté
e
χ∞ défini par χ∞ (f, λ) = λ.

Ainsi le spectre de Gelfand de A e s’identifie à R t {∞}. Dans cette identification, la


restriction à R de la transformée de Gelfand de (f, λ) n’est autre que la transformée de
Fourier de la fonction f . Un théorème de type Wiener est le suivant : soient a < b des
nombres réels et soit f ∈ L1 (R) telle que F f (t) ne soit nulle pour aucun t ∈ [a; b]. Alors
il existe g ∈ L1 (R) telle que F g(t) = F f1(t) pour tout t ∈ [a; b].

On retrouvera toutes ces idées dans un contexte un peu moins difficile en résolvant
l’exercice qui suit.

Exemple 1. — L’algèbre de Banach L1 (T) des fonctions intégrables de période 2π, avec le
produit de convolution
Z π
(f1 ∗ f2 )(θ) = f1 (θ − ϕ)f2 (ϕ) dϕ.
−π
§ 9 THÉORÈME DE WIENER TS IV.95

est une algèbre de Banach sans élément unité. Soit A e l’alg ebre obtenue en lui adjoignant
un élément unité. Montrer que, pour tout n ∈ Z
Z π
1
(f, λ) 7→ cn (f ) = f (θ)e−inθ dθ
2π −π
est un caractère de A,e et qu’il n’y a pas d’autre caractère de A e hormis c∞ défini par
e s’identifie-t-il à Z t {∞}. En utilisant la
c∞ (f, λ) = λ. Ainsi le spectre de Gelfand de A
mesure de Dirac, pouvez-vous énoncer un théorème de type Wiener dans cette situation ?
chapitre v

Théorie spectrale
des opérateurs compacts

Dans le chapitre sur les algèbres de Banach, nous avons étudié le spectre en général.
Nous allons approfondir cette notion dans le cas d’un opérateur T dans un espace de
Banach. Une partie de sp(T) est formée de valeurs propres de T. Si E est de dimension
finie, sp(T) est tout entier formé de valeurs propres de T : c’est l’ensemble (fini) des racines
du polynôme caractéristique de l’endomorphisme T.

Si E est de dimension quelconque, finie ou infinie, l’opérateur T est dit compact si,
pour toute suite (fn )n>0 bornée dans E, on peut extraire de la suite (Tfn )n>0 une suite
de Cauchy dans E. Alors T a des propriétés spectrales remarquables : tout λ ∈ sp(T) non
nul est en fait une valeur propre de T ; ces valeurs propres sont en nombre fini ou forment
un ensemble dénombrable (λn )n>0 avec limn→∞ λn = 0 ; leurs sous-espaces propres sont
de dimension finie.

Les opérateurs intégraux f 7→ Tf dans C ([a; b]), dits de Fredholm et définis par :
Z b
Tf (x) = K(x, y)f (y) dy
a

sont les exemples les plus intéressants d’opérateurs compacts. Leur théorie spectrale per-
met de résoudre les équations intégrales associées (alternative de Fredholm, équations de
Volterra, d’Abel). À cette théorie se rattache naturellement celle de Sturm-Liouville.

§ 1. VALEURS SPECTRALES ET VALEURS PROPRES

Dans ce chapitre, E désigne un espace de Banach sur C. On note simplement L (E)


l’algèbre de Banach L (E, E) des opérateurs bornés T dans E, c’est-à-dire des applications
TS V.98 VALEURS SPECTRALES ET VALEURS PROPRES § 1

linéaires continues E → E, avec la norme :


|||T||| = sup kTf k.
f ∈E,kf k 6 1

Cette algèbre, non commutative dès que dim E > 2, a un élément neutre, l’opérateur
identique idE .
Définition 1. — Soit T un opérateur dans E et soit λ ∈ C.
(i) On dit que λ est une valeur spectrale de T, ou que T appartient au spectre sp(T)
de T, si – conformément à la théorie des algèbres de Banach – l’opérateur T − λidE n’est
pas inversible dans L (E) ; autrement dit, s’il n’existe pas d’opérateur borné S ∈ L (E) tel
que (T − λidE ) ◦ S = S ◦ (T − λidE ) = idE .
(ii) On dit que λ est valeur propre de T si T−λidE n’est pas injectif dans E ; autrement
dit, s’il existe f ∈ E {0} tel que Tf = λf . De tels vecteurs f sont appelés des vecteurs
propres de T pour la valeur propre λ.
(iii) On dit que λ est une valeur propre généralisée de T s’il existe une constante
c > 0 et une suite (fn )n>0 dans E telle que lim Tfn − λfn = 0, mais avec kfn k > c pour
n→∞
tout n > 0.
Si E est un espace de fonctions, on parle de fonction propre plutôt que de vecteur
propre. Dans tous les cas, on omet souvent de préciser la valeur propre pour un vecteur
propre.

Rappel : la partie précédente a permis de voir dans un contexte plus général :

(i) que sp(T) est un sous-ensemble compact et non vide de C, contenu dans le disque
{λ ∈ C : |λ| 6 kTk} ;
(ii) que la fonction λ 7→ h(T − λidE )−1 , ϕi est, pour toute forme linéaire continue ϕ
sur L (E), holomorphe dans l’ouvert de C complémentaire de sp(T) ;
(iii) qu’on a la formule du rayon spectral :
1
sup |λ| = lim |||T|||n n ;
λ∈sp(T) n→∞

(iv) que, si pour F holomorphe au voisinage de sp(T), on définit l’opérateur F(T) dans
E par :
1 ~
Z
F(T) = (T − λidE )−1 F(λ) dλ,
2πi γ
alors F 7→ F(T) est un homomorphisme d’algèbres de H (sp(T)) dans L (E) (calcul fonc-
tionnel holomorphe) ;
(v) et que sp (F(T)) = F (sp(T)) (théorème de Hilbert-Dirac).

Ce qui apparaît en plus dans L (E), c’est la notion de valeur propre.


Proposition 1. — Soit T un opérateur dans E et soit λ ∈ C.
(i) Si λ est une valeur propre de T, alors λ est une valeur propre généralisée de T.
(ii) Si λ est une valeur propre généralisée de T, alors λ est une valeur spectrale de T.
(iii) Si λ appartient à la frontière de sp(T), alors λ est une valeur propre généralisée
de T.
§ 2 NOTION D’OPÉRATEUR COMPACT TS V.99

Preuve. Les points (i) et (ii) sont évidents, mais ça va mieux en l’écrivant.

Prouvons le point (iii). Soit λ un point frontière du compact sp(T). Soit (λn )n>0 une
suite qui tend vers λ mais avec λn 6∈ sp(T) pour tout n > 0. Ainsi chaque opérateur
T − λn idE est inversible dans E, alors que T − λidE ne l’est pas. Puisque T − λidE =
T − λn idE + (λn − λ)idE , on en déduit que
1
|λ − λn | > ,
|||(T − λn idE )−1 |||
sinon T − λidE serait inversible, au titre d’élément suffisamment proche de l’inversible
T − λn idE (cf Théorème 1). Ceci prouve que (T − λn idE )−1 tend vers +∞ quand
n → ∞. Posons
(T − λn idE )−1
Sn = .
|||(T − λn idE )−1 |||
1
On a |||Sn ||| = 1, donc il existe des gn ∈ E tels que kgn k = 1 et 2 6 kSn gn k 6 1 pour
tout n > 0. Posons fn = Sn gn . Alors kfn k > 21 = c > 0 et

(T − λidE )fn = (T − λn idE )fn + (λn − λ)fn


= (T − λn idE )Sn gn + (λn − λ)fn
1
= gn + (λn − λ)fn
|||(T − λn idE )−1 |||
tend vers 0 car kfn k 6 kgn k 6 1. 

Exercice 1. — Soit S l’opérateur de décalage défini et étudié dans l’exercice 1. On sait que
le spectre de S est le disque unité fermé de S. Montrer que S n’a pas de valeur propre et
que le cercle unité est l’ensemble des valeurs propres généralisées de S.

§ 2. NOTION D’OPÉRATEUR COMPACT

Soit E un espace de Banach sur C et soit T ∈ L (E).

Définition 1. — On dit que T est un opérateur compact dans E si quelle que soit la
suite (fn )n>0 bornée dans E on peut extraire de (Tfn )n>0 une sous-suite convergente ;

Autrement dit, T est un opérateur compact dans E si l’image par T de la boule unité de
E est d’adhérence compacte.

On notera L K (E) l’ensembles des opérateurs compacts dans E. Tout opérateur de


rang fini, c’est-à-dire de la forme :

f 7→ T(f ) = α1 (f )g1 + α2 (f )g2 + · · · + αn (f )gn ,

où g1 , g2 , · · · gn sont des vecteurs donnés dans E et α1 , α2 , · · · αn sont des formes linéaire


continues données sur E, est compact.
TS V.100 NOTION D’OPÉRATEUR COMPACT § 2

Ceci provient du fait que T(E) est un espace vectoriel de dimension finie, donc l’image
par T de la boule unité de E est une partie bornée d’un espace normé de dimension finie :
cette image a une adhérence compacte par le théorème de Borel-Lebesgue.

À partir des opérateurs de rang fini, on peut fabriquer beaucoup d’opérateurs compacts
au moyen du résultat suivant.

Théorème 1. — Soit T ∈ L (E) et soit (Tn )n>0 une suite d’opérateurs compacts dans E,
telle que limn→∞ |||T − Tn ||| = 0. Alors T est un opérateur compact.

Preuve. On va utiliser le procédé diagonal. Soit (fn )n>0 une suite dans E telle que
kfn k 6 1 pour tout n. On va montrer que la suite (Tfn )n>0 admet une sous-suite de
Cauchy dans E.

Puisque T1 est un opérateur compact, on peut extraire de (fn )n>0 une sous-suite
(fn1 )n>0telle que la suite (T1 fn1 )n>0 soit de Cauchy. Puis, T2 étant compact, on peut
extraire de la suite (fn1 )n>0 une sous-suite (fn2 )n>0 telle que (T2 fn2 )n>0 soit de Cauchy,
etc. Par récurrence, on construit pour tout entier m > 1 une suite (fnm )n>0 extraite de
(fnm−1 )n>0 et telle que la suite (Tm fnm )n>0 soit de Cauchy.

Considérons la suite diagonale (fnn )n>0 : elle est extraite de la suite initiale (fn )n>0 ,
et pour tout m > 1 fixé, la suite (Tm fnn )n>0 est de Cauchy. Pour ε > 0 donné, fixons un
indice m tel que |||T − Tm ||| 6 4ε . Quels que soient les indices q > p, on a :
T(fqq ) − T(fpp ) = (T − Tm )(fqq − fpp ) + Tm (fqq ) − Tm (fpp ),
donc
ε
kT(fqq ) − T(fpp )k 6 2 ·+ kTm (fqq ) − Tm (fpp )k 6 ε
4
dès que q > p > Nε , vu que la suite (Tm fnn )n>0 est de Cauchy. 

Remarquons que idE est compact si, et seulement si, E est de dimension finie, car
d’après le théorème de F. Riesz, la finitude de la dimension est la condition nécessaire et
suffisante pour que la boule unité de E soit compacte.

Remarquons aussi que L K (E) est un idéal bilatère de L (E) : si T est compact et
si S ∈ L (E), alors ST et TS sont des opérateurs compacts ; car l’image par S de la boule
unité de E est borné, et l’image par S d’un compact est un compact.

Des deux remarques précédentes, il résulte que dans un espace E de dimension infinie,
un opérateur compact n’est jamais inversible ; dans ce cas, 0 est toujours dans le spectre
de l’opérateur.

Mais les opérateurs compacts les plus importants en Analyse sont les opérateurs inté-
graux que nous allons définir maintenant.

Soit K = K(x, y) une fonction continue donnée, à valeurs complexes, sur le carré
[a; b] × [a; b] de R2 . Dans l’espace de Banach E = C ([a; b], C) des fonctions continues sur
[a; b], à valeurs complexes, muni de la norme uniforme k·k∞ , l’opérateur de Fredholm de
§ 3 PROPRIÉTÉS SPECTRALES DES OPÉRATEURS COMPACTS TS V.101

noyau K, à savoir f 7→ Tf , où
Z b
Tf (x) = K(x, y)f (y) dy,
a
est compact. En effet, l’ensemble des fonctions Tf , où kf k∞ 6 1, est équicontinu, car :
|Tf (x) − TF(y)| 6 (b − a) sup |K(x, y) − K(x0 , y)| 6 ε
y∈[a;b]

dès que |x − x0 | 6 η, vu l’uniforme continuité de K dans le carré [a; b] × [a; b] Donc l’image
par T de la boule unité {kf k∞ 6 1} est d’adhérence compacte dans E = C ([a; b], C), par
le Théorème d’Ascoli.

Dans le même espace E = C ([a; b], C) est aussi compact l’opérateur de Volterra, à
savoir f 7→ Sf défini par :
Z x
Sf (x) = K(x, y)f (y) dy (a 6 x 6 b)
a
comme on le voit aussi par le Théorème d’Ascoli.
Exercice 1. — Soit 1 6 p 6 +∞. On prend pour E l’espace `p (Z) (voir l’Appendice
sur les espaces de suites). Soit (an )n>1 une suite bornée de nombres complexes donnée.
Dans l’espace de Banach `p soit x 7→ y = Tx l’opérateur défini par yn = an xn pour tout
n > 1. Montrer que T est compact si et seulement si limn→∞ an = 0. Indications : on
prouvera d’abord que |||T||| = supn |an | ; si limn→∞ an = 0, on fera apparaître T comme
limite d’opérateurs de rang fini.

§ 3. PROPRIÉTÉS SPECTRALES DES OPÉRATEURS COMPACTS

Dans un espace E de dimension finie, l’Algèbre linéaire nous a appris qu’un opérateur
injectif est automatiquement bijectif, donc n’a pas d’autres valeurs spectrales que les valeurs
propres, et que ces valeurs propres sont en nombre fini, étant les racines du polynôme
caractéristique.

Dans un espace E de dimension quelconque, nous allons voir que les opérateurs com-
pacts ont des propriétés spectrales très particulières, qui généralisent celles des opérateurs
en dimension finie.
Lemme 1. — Soit T ∈ L K (E). Soit λ une valeur propre généralisée non nulle de T.
Alors λ est une valeur propre de T.
Preuve. Par hypothèse il existe une suite (fn )n>0 telle que kfn k > c > 0 et lim (Tfn −
n→∞
λfn ) = 0. En divisant fn par kfn k on se ramène à kfn k = 1 pour tout n. De la suite
(Tfn )n>0 on peut extraire une suite convergente : lim Tfnk = g. Évidemment (λfnk )k > 0
k→∞
tend vers λg. On a :
kgk = |λ| lim kfnk k = |λ| =
6 0,
k→∞
TS V.102 PROPRIÉTÉS SPECTRALES DES OPÉRATEURS COMPACTS § 3

donc g 6= 0. Enfin, par continuité de T on a :


Tg = lim T(λfnk ) = λ lim T(fnk ) = λg,
k→∞ k→∞
ce qui prouve que λ est une valeur propre de T. 
Lemme 2. — Soit T ∈ L K (E). Alors pour tout nombre réel c > 0, l’opérateur T n’a
qu’un nombre fini de valeurs propres distinctes de module > c.
Preuve. On raisonne par l’absurde, en se donnant une suite (λn )n>0 de valeurs propres
distinctes telles que |λn | > c > 0 pour tout n et où c ne dépend pas de n. Soit (en )n>0 une
suite de vecteurs propres associés : Ten = λn en et en 6= 0 pour tout n > 0. Les vecteurs en
forment une famille libre car les valeurs propres sont deux à deux distinctes. Soit Ln le sous-
espace vectoriel engendré par les vecteurs e1 à en . Le vecteur en n’appartient pas à Ln−1
et par ailleurs, par le lemme de Riesz, il existe hn ∈ Ln tel que khn k= 1 et khn − f k > 12
pour tout f ∈ Ln−1 . Il existe α ∈ C et f0 ∈ Ln−1 tels que hn = f0 + αen . On a :
Thn = Tf0 + αTen = Tf0 + λn αen = Tf0 + λn (hn − f0 ) = (T − λn )f0 = λn (hn − fn ),
où fn ∈ Ln−1 . Donc, pour m < n, on a :
Thn − Thm = λn (hn − f ),
où f ∈ Ln−1 . Par suite kThn − Thm k = |λn | · khn − f k > 2c pour tout n > m, ce qui
évidemment interdit à toute suite extraite de (Thn )n>0 d’être de Cauchy, contrairement à
l’hypothèse suivant laquelle l’opérateur T est compact. 
Lemme 3. — Soit T ∈ L K (E). Soit λ ∈ sp(T) {0}. Alors λ est valeur propre de T.
Preuve. D’après la Proposition 1 (iii) et le Lemme 1, c’est déjà vrai pour tout λ 6= 0
point frontière de sp(T). De plus, la Proposition 1 (iii) et le Lemme 2 impliquent qu’étant
donné c > 0, il n’y a qu’un nombre fini de points frontière de sp(T) de module > c.
Raisonnons par l’absurde, et supposons que sp(T) contienne un point intérieur λ 6= 0.
Posons c = |λ|, et soient λ1 , λ2 , . . . λn les points frontière de sp(T) de module > c. Par
λ menons une demi-droite extérieure au disque centré en 0 de rayon c, et qui évite les
λi . Puisque λ est intérieur à sp(T), qui est compact, cette demi-droite devrait couper la
frontière de sp(T), ce qui est impossible car cela fournirait un point frontière de module
> c supplémentaire. 

Les lemmes ont déjà prouvé l’essentiel du résultat qui suit.


Théorème 1. — Soit T un opérateur compact dans un espace de Banach. Alors toute
valeur spectrale non nulle, i.e. tout λ 6= 0 tel que T − λidE est non inversible, est en fait
une valeur propre de T, et le sous-espace propre associé
Vλ = Ker(T − λidE )
est de dimension finie. De plus, l’ensemble de ces valeurs propres est au plus dénombrable
et 0 en est le seul point d’accumulation possible.
Preuve. Il reste seulement à prouver que dim Vλ < +∞. Or, Vλ est stable par T,
et donc T|Vλ est un opérateur à la fois compact et inversible (car homothétie de rapport
λ 6= 0) de Vλ . On a vu, grâce au théorème de Riesz, que ceci impose dim Vλ < +∞. 
§ 4 ALTERNATIVE DE FREDHOLM TS V.103

Exercice 1. — Dans l’exercice 2, quelles sont les valeurs propres des T ? Quels sont les
vecteurs propres correspondants ?
Exercice 2. — Montrer que dans C ([0; π2 ], C), l’opérateur de Fredholm f 7→ Tf où
Z π
2
Tf (x) = cos(x − y)f (y) dy,
0
est de rang 2. Quelles sont les valeurs propres non nulles de T et les vecteurs propres
associés ?

§ 4. ALTERNATIVE DE FREDHOLM

C’est l’analogue de ce qui se passe en Algèbre linéaire de dimension finie. Rappelons


ce qu’on appelle dans ce cas l’alternative de Cramer. Soit A une matrice complexe n × n.
Alors :

• ou bien : quel que soit ~b ∈ Cn l’équation A~x = ~b a une solution et une seule ;
• ou bien : l’équation A~x = ~0 a une solution non nulle.

En effet, on est dans le premier cas si et seulement si det A 6= 0 ; dans le second si et


seulement det A = 0. Et il faut bien que l’un des deux ait lieu.
Proposition 1 (alternative Fredholm). — Soit T un opérateur compact dans un espace
de Banach E sur C. Alors :
• ou bien : quel que soit g ∈ E l’équation (idE − µT)f = g a une solution f et une
seule dans E ;
• ou bien : l’équation (idE − µT)f = 0 a une solution f non nulle.
L’intérêt de l’énoncé est que le second terme de l’alternative de Fredholm est plus
facile à discuter que le premier.

Preuve. Si µ = 0, on est trivialement dans le premier cas, et pas dans le second.


Désormais on suppose que µ 6= 0, on pose λ = µ1 et on étudie l’équation
(T − λidE )f = −λg
d’inconnue f , qui est équivalente à la précédente. On est nécessairement dans l’un des deux
cas suivants (qui s’excluent mutuellement) :

– ou bien λ 6∈ sp(T), donc T − λidE est inversible, et on est dans le premier cas de
l’alternative ;
– ou bien λ ∈ sp(T), donc par le Théorème 1 λ est valeur propre de T, et on est dans
le second cas de l’alternative.

Ceci prouve l’énoncé cherché. 

Reprenons les exemples des opérateurs intégraux.


TS V.104 ALTERNATIVE DE FREDHOLM § 4

Proposition 2. — Soit K = K(x, y) un noyau continu sur [a; b] × [a; b] et soit µ ∈ C.


Alors :
– ou bien l’équation intégrale
Z b
f (x) = µ K(x, y)f (y) dy + g(x)
a
a, quel que soit g ∈ C ([a; b], C), une solution f ∈ C ([a; b], C) et une seule ;
– ou bien l’équation homogène associée
Z b
f (x) = µ K(x, y)f (y) dy
a
a une solution non identiquement nulle. 
Le second cas ne peut se produire que pour un ensemble fini, ou au plus dénombrable,
de valeurs µ ∈ C (qui dans ce dernier cas tendent vers l’infini). Ces valeurs exceptionnelles
de µ sont souvent des valeurs physiquement intéressantes (phénomènes de résonance).
Exercice 1. — Pour toute fonction gC ([0; π], C), l’équation intégrale
Z π
f (x) − sin(x + y)f (y) dy = g(x)
0
a une solution et une seule.
Pour l’équation de Volterra, la dichotomie devient drastique : le second cas n’a jamais
lieu ! On a d’abord le lemme suivant :
Lemme 1. — Soit K = K(x, y) un noyau continu sur [a; b]×[a; b] et soit f 7→ Sf l’opérateur
de Volterra S : C ([a; b], C) → C ([a; b], C) défini par
Z x
Sf (x) = K(x, y)f (y) dy.
a
Alors λ = 0 est la seule valeur propre possible de S. On a donc : sp(S) = {0}.
Proposition 3. — Soit K = K(x, y) un noyau continu sur [a; b] × [a; b]. Alors, quelle que
soit g ∈ C ([a; b], C), l’équation de Volterra :
Z x
f (x) − K(x, y)f (y) dy = g(x)
a
a une solution f ∈ C ([a; b], C) et une seule.
En effet, le Lemme ci-dessus indique que, dans la Proposition 2 avec µ = 1, seul le
premier volet de l’alternative se présente. 

Preuve du Lemme. Soient λ 6= 0 et f ∈ C ([a; b], C) tels que Sf (x) = λf (x). Rai-
sonnons par l’absurde et supposons que f n’est pas la fonction nulle. Puisque Sf (a) =
Ra
a K(x, y)f (y) dy = 0, on a f (a) = 0. On se ramène au cas où f n’est pas identiquement
nulle au voisinage de a, quitte à changer a en le repoussant à droite jusqu’à cela se produise.
Posons :
m(δ) = sup |f (x)|.
a 6 x 6 a+δ
§ 5 CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT TS V.105

Le nombre m(δ) est non nul pour tout δ > 0, et tend vers 0 quand δ > 0 tend vers 0. De
plus, il existe xδ ∈ [a; a + δ] tel que |f (xδ )| = m(δ). Alors
Z xδ
|λ|m(δ) = |λf (xδ )| = |Sf (xδ )| = | K(x, y)f (y) dy|
Z xδ a
6 |K(x, y)||f (y)| dy 6 Cδm(δ),
a
où C = sup |K(x, y)|. Mais cette inégalité |λ|m(δ) 6 Cδm(δ), c’est-à-dire |λ| 6 Cδ,
a 6 x,y 6 b
est absurde dès que δ > 0 est assez petit, vu que λ 6= 0. 
Exercice 2. — Exprimer par une quadrature l’unique solution f de l’équation de Volterra :
Z x
f (x) − f (y) dy = g(x).
0
En déduire explicitement f quand g(x) = 1, quand g(x) = ex .
Exercice 3. — Soit E = C ([0; 1], C) et
K(x, y) = min{x; y}.
Si f ∈ E, on pose :
Z 1 Z x Z 1
g(x) = Tf (x) = K(x, y)f (y) dy = f (y) dy + x f (y) dy.
0 0 x
(i) Montrer que g est de classe C2 sur [0; 1], que g 00 (x) = −f (x), et que g(0) = 0 et
g 0 (1)
= 0.
(ii) Soit F le sous-espace vectoriel de E des g ∈ E de classe C2 telles que g(0) = 0 et
g (1) = 0. Montrer que T établit une bijection de E sur F. Préciser l’application T−1 : F →
0

E.
(iii) Dans E, soit le produit scalaire :
Z 1
(f |g) = f (x)g(x) dx.
0
Montrer que (Tf |g) = (f |Tg). En déduire que les valeurs propres de T sont réelles.
(iv) Vérifier que T n’a pas de valeur propre 6 0. Montrer que les valeurs propres de T
sont les nombres λn = ( π2 + nπ)−2 pour n entier > 0. Déterminer le sous-espace vectoriel
Vλn = Ker(T − λn idE ).

§ 5. CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT

Dans ce paragraphe, E est un espace dep Hilbert sur C dont le produit scalaire est noté
(·|·) et la norme associée k·k ; on a kf k = (f |f ) pour tout f ∈ E.

Rappelons qu’un opérateur borné T ∈ L (E) est dit auto-adjoint , ou hermitien, si


quels que soient f1 et f2 dans E on a :
(Tf1 |f2 ) = (f1 |Tf2 ).
TS V.106 CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT § 5

Les faits suivants sur les opérateurs auto-adjoints sont standard. Soit T un opérateur
auto-adjoint.

(i) Toutes les valeurs propres de T sont réelles.


(ii) Deux vecteurs propres pour des valeurs propres distinctes sont orthogonaux.
(iii) Si V est un sous-espace vectoriel T-stable, alors son orthogonal T⊥ l’est aussi.
Exercice 1. — Redémontrer ces faits.
Nous y ajouterons les propriétés suivantes.
Proposition 1. — Soit T un opérateur auto-adjoint dans un espace de Hilbert E. Alors :
T2 = |||T|||2 et |||T||| = sup |λ|.
λ∈sp(T)

Donc si T 6= 0, alors sp(T) 6= {0}. En particulier, si T est auto-adjoint compact et non


nul, alors T a des valeurs propres 6= 0.
Preuve. Pour tout f avec kf k 6 1, on a par l’inégalité de Cauchy-Schwarz :
kTf k2 = (Tf |Tf ) = (T2 f |f ) 6 kT2 f k · kf k 6 kT2 f k,
donc
|||T|||2 = sup kTf k2 6 sup kT2 f k = T2 .
kf k 6 1 kf k 6 1
L’inégalité en sens contraire est banale.

Ainsi, on a :
1 1 n 1
|||T||| = T2 2
= T4 4
= ··· = T2 2n

n 1
pour tout n ; or, quand n → ∞, par la formule du rayon spectrale on a : limn→∞ T2 2n
=
supλ∈sp(T) |λ|. Ceci fournit bien |||T||| = supλ∈sp(T) |λ|, ce qu’il fallait démontrer. 
Théorème 1. — Soit T un opérateur non nul, auto-adjoint et compact dans un espace
de Hilbert E. Soit (λn )1 6 n<p la suite finie ou infinie (avec alors p = ∞) des valeurs
propres (nécessairement réelles) non nulles de T, chacune comptée autant de fois que sa
multiplicité, i.e. dim Vλ avec Vλ = Ker(T−λidE ). Soit (en )1 6 n<p une famille orthonormée
de vecteurs de E, avec Ten = λn en pour tout n. Alors :

(i) Pour tout f ∈ E, on a la formule :


X
Tf = λn (f |en )en
1 6 n<p

où, si p = ∞, la série converge en norme dans E.


1
(ii) Soit µ un nombre complexe distinct de tous les inverses λn . Alors, pour tout
g ∈ E, l’équation
f − µ · T(f ) = g
a une solution f ∈ E et une seule, qui est donnée par la formule :
X λn
f =g+µ (g|en )en
1 − µλn
1 6 n<p
§ 5 CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT TS V.107

où, si p = ∞, la série converge en norme dans E.


Preuve. Soit V le sous-espace de Hilbert de E engendré par les en : il est T-stable, donc
V⊥ l’est également. On a : E = V ⊕ V⊥ et la restriction T|V⊥ est un opérateur auto-adjoint
compact de V⊥ , sans valeur propre 6= 0 par construction de V. La Proposition 1 impose
donc T|V⊥ = 0.

Soit f ∈ E. Les en formant une base orthonormée de V, on a une décomposition


X
f= (f |en )en + g
1 6 n<p

avec g ∈ V⊥ . En appliquant T aux deux membres, et en remarquant que Tg = 0, on


obtient la formule annoncée, ce qui finit de prouver (i).

Le début de (ii) n’est autre que l’alternative de Fredholm. Pour prouver la formule
donnant f , remarquons d’abord que si p = ∞, la série du second membre converge dans E
car la suite (λn )1 6 n<p tend vers 0 ; ainsi pour n > n0 , on a :
2
X λn X
|(g|en )|2 6 |(g|en )|2 6 kgk2 .
n > n0
1 − µλn n > n0

Posons
X λn
f =g+µ (g|en )en .
1 − µλn
1 6 n<p
Alors
X λ2n
Tf = Tg + µ (g|en )en
1 − µλn
1 6 n<p
Mais d’après (i), on a :
X
Tg = λn (g|en )en ,
1 6 n<p
donc
X  µλ2n

Tf = λn + (g|en )en ,
1 − µλn
1 6 n<p
et finalement
X  λn µ µ2 λ2n

f − µ · T(f ) = g + − µλn − (g|en )en ,
1 − µλn 1 − µλn
1 6 n<p

qui vaut bien g. 


Exercice 2. — Réciproquement, soit E un espace de Hilbert ; soit (en )n>1 une suite ortho-
normée dans E et soit (λn )n>1 une suite de nombres réels qui tend vers 0. Pour tout f ∈ E
on pose :
X
Tf = λn (f |en )en .
n>1
Montrer que cette série converge dans E, et que l’opérateur T dans E ainsi défini est
auto-adjoint compact.
TS V.108 CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT § 5

Une classe d’opérateurs auto-adjoints compacts est donnée par les opérateurs à noyau
symétrique.
Exemple 1. — Soient a < b des nombres réels. Soit E = L2 ([a; b], C) l’espace de Hilbert
des (classes de) fonctions de carré sommable sur [a; b] avec le produit scalaire
Z b
(f1 |f2 ) = f1 (x)f2 (x) dx
a
et la norme p
kf k2 = (f |f ).
On sait que C ([a; b], C) est dense dans E et que, si f ∈ C ([a; b], C), on a :

kf k2 6 b − a · kf k∞ .
Soit K = K(x, y) un noyau continu sur [a; b] × [a; b]. On pose
Z b
Tf (x) = K(x, y)f (y) dy
a
pour toute f ∈ L2 ([a; b], C).Il est clair que Tf ∈ L2 ([a; b], C), et même Tf ∈ C ([a; b], C)
par continuité sous le signe somme. Nous savons déjà que T : C ([a; b], C) → C ([a; b], C) est
un opérateur compact pour C ([a; b], C) muni de la norme k·k∞ de la convergence uniforme.

Voyons que T : L2 ([a; b], C) → L2 ([a; b], C) est un opérateur compact pour la norme
k·k2 . L’ensemble H = {Tf : f ∈ L2 ([a; b], C), kf k2 6 1} est contenu dans C ([a; b], C) ;
de plus, H est :

– équiborné, car
Z b Z b  21
2
|Tf (x)| = K(x, y)f (y) dy 6 sup |K(x, y) | dy = M,
a x a
par Cauchy-Schwarz.
– équicontinu, car par uniforme continuité de K, on a :

Z b Z b
0 0
|Tf (x) − Tf (x )| 6 |K(x, y) − K(x , y)| · |f (y)| dy 6 ε |f (y)| dy 6 ε b − a
a a
dès que |x − x0 | 6 ηε . D’après le Théorème d’Ascoli, si (gn )n>1 est une suite dans H , on
√ la norme k·k∞ , donc a fortiori de Cauchy pour
peut en extraire une suite de Cauchy pour
la norme k·k2 car on a vu que k·k2 6 b − a · k·k∞ .
Remarque 1. — Les fonctions propres de T dans L2 ([a; b], C), pour une valeur propre 6= 0,
sont déjà dans C ([a; b], C), car on peut écrire f = λ1 Tf et Tf ∈ C ([a; b], C). Ainsi, il
n’apparaît pas de nouvelle valeur propre quand on étend T de C ([a; b], C) à L2 ([a; b], C).
Revenons maintenant aux opérateurs auto-adjoints.

Proposition 2. — Soit K = K(x, y) un noyau continu sur le carré [a; b] × [a; b], et soit
T l’opérateur compact dans l’espace sde Hilbert L2 ([a; b], C) donné par la formule :
Z b
Tf (x) = K(x, y)f (y) dy
a
§ 5 CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT TS V.109

pour toute f ∈ L2 ([a; b], C). Alors, pour que T soit auto-adjoint dans L2 ([a; b], C), il faut
et suffit que K(x, y) = K(y, x) pour tous x, y ∈ [a; b].
Dans ce cas, on dit que le noyau K est symétrique.

Preuve. En effet, pour f et g dans L2 ([a; b], C), par Fubini on a :


RbRb RbRb
(Tf |g) − (f |Tg) = a a K(x,y)f (y)g(x) dxdy −  a a f (y)K(y, x)g(x) dxdy
R
= [a;b]×[a;b] K(x, y) − K(y, x) f (y)g(x) dxdy
Mais il faut se rappeler qu’une des conséquences du théorèmes de Stone-Weierstrass est
que les fonctions de la forme (x, y) 7→ f (x)g(y), avec f et g continues sur [a; b], sont
uniformément denses dans C ([a; b] × [a; b], C), donc par Cauchy-Schwarz denses aussi pour
k·k2 dans C ([a; b] × [a; b], C), lequel est dense pour la norme L2 dans L2 ([a; b] × [a; b], C).
Ceci implique l’équivalence cherchée. 
Exercice 3. — Sur les noyaux de Hilbert-Schmidt. Soit K = K(x, y) une fonction mesurable
de R × R telle que :
Z Z 1
2
2
kKk2 = |K(x, y)| dxdy < +∞.
R2
Montrer que la formule : Z
Tf (x) = K(x, y)f (y) dy
R
définit dans l’espace de Hilbert L2 (R, dx) un opérateur borné de norme |||T||| 6 kKk2 ,
que cet opérateur est compact, et qu’il est auto-adjoint si et seulement si K(x, y) = K(y, x)
presque partout.
Indication : d’après la théorie de la mesure, il existe une suite (Kn (x, y))n>1 de fonc-
tions continues à support compact dans R2 , telle que kK − Kn kL2 (R2 , dx) tende vers 0
quand n → ∞. Chaque fonction Kn est nulle en dehors d’un carré [an ; bn ] × [an ; bn ]. Pour
f ∈ L2 (R, dx) poser
Z bn
Tn f (x) = Kn (x, y)f (y dy,
an
et montrer que chaque Tn est un opérateur compact.
Exercice 4. — Déterminer les valeurs propres de l’opérateur de Fredholm T dans
C ([0; 1], C) défini par :
Z 1
Tf (x) = e|x−y| f (y) dy.
0
Montrer que sup kTf k2 6 1, 426.
kf k2 6 1

Exercice 5. — On reprend l’exercice 3 en supposant en outre que le noyau K est symétrique.


Soit (λn )n>1 la suite finie ou infinie des valeurs propres non nulles de T, comptées autant
de fois que leurs multiplicités. Soit (ϕn )n>1 une famille orthonormée de fonctions propres
de T, avec Tϕn = λn ϕn pour tout n > 1. Prouver la formule :
X
K(x, y) = λn ϕn (x)ϕn (y),
n>1
TS V.110 CAS D’UN OPÉRATEUR COMPACT AUTO-ADJOINT § 5

où la série converge dans l’espace de Hilbert L2 (R2 , dxdy).

§ 6. NOYAUX DE FREDHOLM ITÉRÉS ET NOYAU RÉSOLVANT

On peut dans certains cas résoudre l’équation de Fredholm par approximations suc-
cessives. Soit K = K(x, y) un noyau continu sur le carré [a; b] × [a; b], et soit T l’opérateur
de Fredholm de noyau K sur C ([a; b], C) donné par la formule :
Z b
Tf (x) = K(x, y)f (y) dy
a

pour toute f ∈ C ([a; b], C). Par Fubini, son carré T2 est encore un opérateur de Fredholm,
Rb
de noyau : K2 (x, y) = a K(x, z)K(z, y) dz. Et plus généralement, les puissances Tn sont
des opérateurs de Fredholm, donnés par les noyaux itérés Kn définis par K1 = K et
Z b
Kn (x, y) = K(x, z)Kn−1 (z, y) dz.
a
Exercice 1. — Prouver les formules :
Z b Z bZ b
Km+n (x, y) = Km (x, z)Kn (z, y) dz et Kn (x, y) = K(x, z)Kn−2 (z, t)K(t, y) dzdt.
a a a
Théorème 1 (E. Schmidt). — Faisons l’hypothèse que :
Z bZ b
|K(x, y)|2 dxdy < 1.
a a
Alors la série, dite de Neumann, associée au noyau K :

X
R(x, y) = Kn (x, y)
n=1

converge uniformément en (x, y) sur le carré [a; b] × [a; b] et, pour toute g ∈ C ([a; b], C),
la formule :
Z b
f (x) = g(x) + R(x, y)g(y) dy
a
fournit l’unique solution f ∈ C ([a; b], C) de l’équation de Fredholm
Z b
f (x) = K(x, y)f (y) dy + g(x).
a
Preuve. Si N(x, y) est un noyau, on notera pour abréger :
Z b Z b  12
2
kNk2 = |N(x, y)| dxdy .
a a

Ainsi, par hypothèse kKk2 < 1.


Montrons d’abord que l’équation de Fredholm ci-dessus a une solution et une seule.
Grâce à l’alternative de Fredholm (cf Proposition 2), il suffit de s’assurer que f (x) =
§ 6 NOYAUX DE FREDHOLM ITÉRÉS ET NOYAU RÉSOLVANT TS V.111

Rb
a K(x, y)f (y) dy implique que f est identiquement nulle. Or, d’après Cauchy-Schwarz, on
a sous cette hypothèse :
Z b Z b
2 2
|f (x)| 6 |K(x, y)| dy · |f (y)|2 dy,
a a
et en intégrant en x, il vient :
Z b
|f (x)|2 dx · 1 − (kKk2 )2 6 0,

a
Rb
ce qui exige que a |f (x)|2 dx = 0, et finalement que f soit la fonction nulle.
En appliquant l’inégalité de Cauchy-Schwarz à la formule de récurrence définissant les
Kn , il vient :
Z b Z b
2 2
|Kn (x, y)| 6 |K(x, z)| dz · |Kn−1 (z, y)|2 dz,
a a
puis en intégrant les deux membres en x et en y, on obtient :
(kKn k2 )2 6 (kKk2 )2 · (kKn−1 k2 )2 ,
d’où l’inégalité
kKn k2 6 (kKk2 )n .
De même, en appliquant l’inégalité de Cauchy-Schwarz à la seconde formule de l’Exercice
1, on a :
Z b Z b  Z b Z b 
2 2 2
|Kn (x, y)| 6 |Kn−2 (z, t)| dzdt · |K(x, z) · K(t, y)| dzdt .
a a a a

La deuxième intégrale à droite est continue en (x, y), donc bornée. En utilisant kKn k2 6
(kKk2 )n , on voit donc que pour tous x et y dans [a; b], on a :
|Kn (x, y)| 6 C(kKk2 )n .
Par suite la série de Neumann associée à K(x, y) :

X
R(x, y) = Kn (x, y),
n=1

vu l’hypothèse du théorème, converge normalement, donc absolument, sur [a; b]×[a; b]. Par
la définition de la série de Neumann et intégration terme à terme, on voit qu’on a aussi :
Z b
R(x, y) = K(x, y) + K(x, z)R(z, y) dz.
a
Montrons enfin que la solution proposée dans l’énoncé résout bien le problème de
Fredholm considéré. On a :
Rb Rb Rb  Rb 
f (x) − a K(x, y)f (y) dy = g(x) + a R(x, y)g(y)dy − a K(x, y) g(y) + a R(y, z)g(z)dz dy
Rb Rb 
= g(x) + a R(x, y) − K(x, y) − a K(x, z)R(z, y) dz g(y) dy
= g(x),
par la relation entre R et K obtenue juste auparavant. 
TS V.112 NOYAUX DE FREDHOLM ITÉRÉS ET NOYAU RÉSOLVANT § 6

Exercice 2. — Pour 0 6 x 6 2π et 0 6 y 6 2π, on pose :



X sin(px) sin ((p + 1)y))
K(x, y) = .
p2
p=1

(i) Montrer que, pour tout n > 1, on a :



X sin(px) sin ((p + 1)y))
Kn (x, y) = π n−1 .
p2 (p+ 1)2 . . . (p + n − 1)2
p=1
1
(ii) En déduire que la série de Neumann associée λK :

X 1
Rλ (x, y) = Kn (x, y)
λn
n=1
converge uniformément quel que soit λ 6= 0, et que l’opérateur de Fredholm de noyau K
n’a aucune valeur propre non nulle.
Appliquons une méthode analogue pour intégrer l’équation de Volterra. Soit S l’opé-
rateur de Volterra de noyau K, défini par :
Z x
Sf (x) = K(x, y)f (y) dy.
a

Les itérés Sn sont des opérateurs de Volterra dont les noyaux sont cette fois les K(n) (x, y)
où K(1) = K et pour n > 2 :
Z x
(n)
K (x, y) = K(x, z)K(n−1) (z, y) dz.
y

En posant
M= sup |K(x, y)|,
a 6 x,y 6 b
on vérifie par récurrence que
|x − y|n−1
|K(n) (x, y)| 6 Mn .
(n − 1)!
En effet, c’est vrai pour n = 1, et d’après la relation de récurrence qui précède, on a :
Rx
|K(n) (x, y)| 6 |x − y|M y |K(n−1) (z, y)| dz
n−2
6 |x − y|Mn y |z−y|
Rx
(n−2)! dz
n−1
6 Mn |x−y|
(n−1)! .

Par conséquent,
Mn (b − a)n−1
|K(n) (x, y)| 6 ,
(n − 1)!
et la série

X
R(x, y) = K(n) (x, y)
n=1
converge normalement, donc uniformément, en (x, y). En terminant comme dans la preuve
précédente, on a prouvé cette fois sans hypothèse sur la norme k·k2 de K le résultat suivant.
§ 7 ÉQUATION INTÉGRALE D’ABEL TS V.113

Théorème 2. — L’unique solution de l’équation de Volterra


Z x
f (x) = K(x, y)f (y) dy + g(x)
a
est donnée par la formule :
Z x
f (x) = g(x) + R(x, y)g(y) dy,
a
où le noyau résolvant R est donné par la somme de série uniformément convergente :

X
R(x, y) = K(n) (x, y)
n=1

dans laquelle K(1) = K et


Z x
(n)
K (x, y) = K(x, z)K(n−1) (z, y) dz
y

pour n > 2. 
On notera la réciprocité entre les noyaux K et R : le noyau résolvant R(x, y) du noyau
de Volterra n’est autre que −K(x, y).
Exercice 3. — Appliquer le théorème qui précède pour résoudre l’équation
Z x
f (x) = (y − x)f (y) dy + x,
0
puis retrouver la solution par une méthode élémentaire directe.

§ 7. ÉQUATION INTÉGRALE D’ABEL

Soit E = C ([0; 1], C) l’espace de Banach des fonctions f à valeurs complexes définies
et continues sur [0; 1], muni de la norme k·k∞ de la convergence uniforme :
kf k∞ = sup |f (x)|.
06x61

Soit α un paramètre réel donné tel que 0 < α < 1. Pour toute fonction f ∈ E et tout
x ∈ [0; 1], on pose :
Z x Z x
f (y) f (x − y)
Tf (x) = α
dy = dy.
0 (x − y) 0 yα

Définition 1. — L’opérateur T s’appelle l’ opérateur intégral d’Abel de paramètre α.


L’intégrale ci-dessus a un sens ; elle est même absolument convergente car :
Z x Z x
|f (y)| |f (x − y)| x1−α
α
dy = dy 6 kf k∞ < +∞.
0 (x − y) 0 yα 1−α
TS V.114 ÉQUATION INTÉGRALE D’ABEL § 7

De plus, la fonction x 7→ Tf (x) est continue sur [0; 1] car pour ε > 0 donné, par continuité
uniforme de f et par continuité de x 7→ x1−α , on a :

|f (x0 − y) − f (x − y)| 6 ε et |(x0 )1−α − x1−α | 6 ε

dès que |x − x0 | 6 ηε , et donc, si par exemple x0 > x, on a :


R x |f (x0 −y)−f (x−y)| R x0 0
|Tf (x0 ) − Tf (x)| 6 0 yα dy + x |f (xyα−y)| dy
6 ε 0 ydyα + kf k∞
R1 0 1−α − x1−α )
1−α ((x )
1+kf k∞
6 1−α ε
1
Ainsi, T envoie bien E dans E. De plus, T est un opérateur borné de norme 6 1−α d’après
l’inégalité utilisée pour vérifier la convergence absolue de l’intégrale définissant Tf (x). En
fait, on a exactement :
1
|||T||| =
1−α
car cette valeur est atteinte pour la fonction constante égale à 1. L’opérateur T est presque
du type Volterra au sens précédent, mais le noyau est ici singulier. Ceci nous oblige à faire
une démonstration pour prouver que T est un opérateur compact.
Pour cela considérons, pour 0 < a < 1, l’opérateur Ta dans E défini par :
Z x
f (x − y)
Ta f (x) = dy
a yα
si x > a, et Ta f (x) = 0 sinon. On a :
a
f (x − y)
Z
(T − Ta )f (x) = dy si x > a
0 yα
et (T − Ta )f (x) = 0 si 0 6 x 6 a. Ceci implique que
a1−α
|(T − Ta )f (x)| 6 kf k∞ ,
1−α
d’où
lim |||T − Ta ||| = 0.
a>0,a→0

Par le Théorème 1, il suffit donc de prouver que les opérateurs Ta sont compacts. Pour
cela, on regarde les images de la boule unité {k·k∞ 6 1} par ces opérateurs, précisément :

Ha = {Ta f : f ∈ E avec kf k∞ 6 1}.

Les valeurs de toutes les fonctions de tous les Ha sont uniformément bornées par ce qui
précède. Pour appliquer Ascoli et conclure, il suffit donc de vérifier l’équicontinuité de
chaque famille Ha . Pour a donné, l’équicontinuité en x ∈ [0; a[ est évidente car toutes les
fonctions de Ha sont identiquement nulles au voisinage de x ; idem pour l’équicontinuité à
gauche en a. Pour vérifier l’équicontinuité à droite en a, on calcule :
Z x
f (x − y) |x − a|
|Ta f (x) − Ta f (a)| = |Ta f (x)| = | α
dy| 6 .
a y aα
§ 7 ÉQUATION INTÉGRALE D’ABEL TS V.115

Si maintenant a < x 6 x0 6 1, on a puisque kf k∞ 6 1 :


R x0 f (x0 −y) Rx
|Ta f (x) − Ta f (a)| = a yα dy − a f (x−y)
yα dy
R x0 −a f (y) R x−a f (y)
= 0 (x0 −y)α dy − 0 (x−y)α dy
R x0 −a f (y) R x−a  1 1

6 x−a (x −y) 0 α dy + 0 0
(x −y)α − (x−y) α f (y) dy
R x0 −a f (y) R x−a  1 1

6 x−a (x0 −y)α dy + 0 (x0 −y)α − (x−y)α f (y) dy
1
(x0 − x + a)1−α − a1−α + (x0 )1−α − a1−α − (x)1−α + (x0 − x + a)1−α

= 1−α
2(x0 − x + a)1−α − 2a1−α + (x0 )1−α − (x)1−α

6
6 C(x0 − x),
où la constante C dépend de a et de α mais pas de x. Ceci prouve l’équicontinuité de Ha .
Lemme 1. — Pour tout entier n > 1, toute f ∈ E et tout x ∈ [0; 1], on a :
xnβ (Γ(β))n
|Tn f (x)| 6 · kf k∞ ,
Γ(1 + nβ)
où l’on a posé β = 1 − α.
Preuve. On fait une récurrence sur n > 1. Pour n = 1, cela résulte immédiatement de
Z x Z x
|f (y)| |f (x − y)| x1−α
|Tf (x)| 6 α
dy = dy 6 kf k∞ .
0 (x − y) 0 yα 1−α
Pour l’hérédité, on calcule :
(Γ(β))n
Z x n Z x
n+1 n |T f (y)| y nβ
|T f (x)| = |(T ◦ T )f (x)| 6 α
dy 6 · kf k∞ α
dy,
0 (x − y) Γ(1 + nβ) 0 (x − y)
donc, par le changement de variable y = sx, on obtient :
(Γ(β))n nβ R 1
|Tn+1 f (x)| 6 Γ(1+nβ) · kf k∞ xxαx 0 snβ (1 − s)−α ds
n
(Γ(β))
= x(n+1)β Γ(1+nβ) B(nβ + 1, β)kf k∞
n
(Γ(β)) Γ(1+nβ)Γ(β)
= x(n+1)β Γ(1+nβ) Γ(1+(n+1)β) kf k∞ ,
ce qui est l’inégalité cherchée pour prouver la récurrence. 

Il résulte du Lemme que :


(Γ(β))n
|||Tn ||| 6 .
Γ(1 + nβ)
D’après la formule de Stirling, Γ(x) tend vers +∞ quand x → +∞ plus vite que toute
k x où k > 0 est donné. Donc pour tout µ ∈ C donné, la série d’opérateurs n>1 µn Tn
P

converge absolument dans l’espace de Banach L (E). Il en résulte immédiatement que pour
tout µ ∈ C, l’opérateur idE − µT est inversible dans L (E), et

X
−1
(idE − µT) = µn Tn .
n=1
Ainsi, comme les opérateurs de Volterra classiques, l’opérateur d’Abel T n’a d’après l’al-
ternative de Fredholm, aucune valeur propre 6= 0.

Nous allons enfin prouver la formule d’inversion d’Abel.


TS V.116 ÉQUATION INTÉGRALE D’ABEL § 7

Théorème 1 (formule d’inversion d’Abel). — Si f ∈ E et si


Z x
f (y)
g(x) = α
dy,
0 (x − y)
alors Z y
sin(πα) d g(x)
f (y) = dx.
π dy 0 (y − x)1−α
Preuve. L’idée est d’utiliser le Théorème d’approximation de Weierstrass afin de ré-
duire la preuve de la formule à une vérification sur les monômes.

Prouvons donc la formule pour f (x) = xk où k est un entier > 0. Dans ce cas :
Z x Z 1
−α k Γ(1 − α)Γ(k + 1) 1−α+k
g(x) = (x − y) y dy = x 1−α+k
(1 − s)−α sk ds = x
0 0 Γ(2 − α + k)
et
Ry g(x) Γ(1−α)Γ(k+1) R y α−1 x1−α+k dx
0 (y−x)1−α dx = Γ(2−α+k) 0 (y − x)
Γ(1−α)Γ(k+1) α−1+1−α+k+1 R 1 α−1 s1−α+k
= Γ(2−α+k) y 0 (1 − s) ds
Γ(1−α)Γ(k+1) Γ(α)Γ(2−α+k) k+1
= Γ(2−α+k) Γ(k+2) y
π y k+1
= sin(πα) k+1 ,
donc Z y  k+1 
sin(πα) d g(x) d y
1−α
dx = = y k = f (y).
π dy 0 (y − x) dy k + 1
Ceci prouve la formule d’inversion dAbel pour les monômes et donc, par combinaison
linéaire, pour les fonctions polynomiales.

Faisons maintenant usage du Théorème d’approximation de Weierstrass pour conclure


en toute généralité. Soit f ∈ E une fonction continue quelconque. On dispose d’une suite
(pn )n>1 de fonctions polynomiales telle que :
lim kf − pn k∞ = 0.
n→∞

Soit F (resp. Pn ) la primitive de f (resp. pn ) qui s’annule en 0. On a aussi


lim kF − Pn k∞ = 0.
n→∞

Soit g = Tf et gn = Tpn . Puisque l’opérateur T est borné, on a :


lim kg − gn k∞ = 0.
n→∞

La transformation d’Abel de paramètre 1 − α étant elle aussi continue, on voit que :


Z y Z y
gn (x) g(x)
1−α
dx converge vers 1−α
dx
0 (y − x) 0 (y − x)

uniformément en y ∈ [0; 1]. Mais d’après la formule déjà prouvée pour les fonctions poly-
nomiales, on a :
Z y
gn (x) π
1−α
dx = Pn (y)
0 (y − x) sin(πα)
§ 8 ÉQUATIONS DE STURM-LIOUVILLE TS V.117

pour tout n > 1. Les fonctions données par le second membre forment une suite qui tend
π
vers F(y) sin(πα) uniformément en y, ce qui prouve la formule d’inversion d’Abel en toute
généralité. 

Noter que la formule d’inversion d’Abel implique que Ker(T) = {0}, et donc que T
n’a pas de valeur propre du tout.

§ 8. ÉQUATIONS DE STURM-LIOUVILLE

On sait qu’une équation différentielle du deuxième ordre


y 00 + p(x)y 0 + q(x)y = f (x),
où les fonctions p, q et f sont données, continues sur [a; b], a une solution et une seule pour
des conditions initiales du type Cauchy donnant les valeurs y(x0 ) et y 0 (x0 ), en un point
fixé x0 ∈ [a; b], de la fonction inconnue y et de sa dérivée.

Mais la Physique conduit à chercher des solutions y = y(x) satisfaisant à des conditions
aux limites, par example :
y(a) = y(b) = 0,
ou plus généralement
Ay 0 (a) + By(a) = 0 et Cy 0 (b) + Dy(b) = 0,
où A, B, C et D sont des constantes données. Pensez par exemple au problème des cordes
vibrantes.

Un exemple très simple, lié aux séries de Fourier, montre que la recherche de solutions
avec conditions aux limites fournit des résultats bien différents de ceux mettant en jeu des
conditions initiales. Si λ est une constante, le problème
y 00 + λy = 0 avec y(0) = y(π) = 0
n’a de solution non identiquement nulle que si λ = n2 où n est un nombre entier > 0,
auquel cas il y a alors une infinité de solutions.

Sur des exemples, nous allons voir que ce type de problème peut se ramener à la réso-
lution d’équations de Fredholm. Nous avons déjà constaté les liens entre les deux théories
dans des exercices ci-dessus. Ils apparaissent de façon élémentaire dans l’exercice qui suit,
qui d’ailleurs est à la base des considérations qui vont suivre.
Exercice 1. — Soit sur [a; b] × [a; b] le noyau symétrique
(x − b)(y − a) (x − a)(y − b)
N(x, y) = pour y 6 x et N(x, y) = pour x 6 y.
b−a b−a
Soit f ∈ C ([a; b], C) donnée. Montrer que
Z b
F(x) = N(x, y)f (y) dy
a
TS V.118 ÉQUATIONS DE STURM-LIOUVILLE § 8

est la fonction de classe C2 telle que F00 = f et F(a) = F(b) = 0.


Ainsi le problème de Sturm-Liouville élémentaire
y 00 = f et y(a) = y(b) = 0
est résolu en appliquant à f l’opérateur de Fredholm de noyau N.

On va commencer par étudier un cas simple, celui d’une équation


d2 y
= λA(x)y + f (x)
dx2
pour les conditions aux limites
y(a) = y(b) = 0,
où A et f sont des fonctions continues données sur [a; b], à valeurs complexes, et λ est un
paramètre complexe.

En adoptant d’abord une démarche heuristique, cherchons à satisfaire l’équation dif-


férentielle, formellement et par un développement ordonné suivant les puissances de λ :
y(x) = y0 (x) + λy1 (x) + λ2 y2 (x) + · · · + λn yn (x) + . . .
et où chaque yn satisfait les conditions aux limites, i.e. yn (a) = yn (b) = 0.

Le premier terme y0 s’obtient en résolvant l’équation différentielle avec λ = 0, c’est-à-


dire :
y 00 (x) = f (x) et y(a) = y(b) = 0,
dont la solution, on vient de le voir dans l’Exercice précédent, est :
Z b
y0 (x) = N(x, s)f (s) ds
a
en posant
(x − b)(s − a) (x − a)(s − b)
N(x, y) = pour s 6 x et N(x, y) = pour x 6 s.
b−a b−a
Ce noyau est continu et symétrique dans le carré [a; b] × [a; b]. Les autre termes du déve-
loppement se calculent (toujours formellement) de proche en proche ; on a :
d2 yn
= λA(x)yn−1 et yn (a) = yn (b) = 0,
dx2
d’où en remplaçant dans ce qui précède f par Ayn−1 :
Z b
yn (x) = N(x, s)A(s)yn−1 (s) ds.
a
Comme on l’a vu, ce sont précisément les calculs qu’il faudrait effectuer pour résoudre
par approximations successives l’équation de Fredholm :
Z b Z b
(∗) y(x) = λ N(x, s)A(s)y(s) ds + N(x, s)f (s) ds,
a a
ce qui rend extrêmement plausible l’énoncé suivant.
§ 8 ÉQUATIONS DE STURM-LIOUVILLE TS V.119

Proposition 1. — Étant donnée l’équation :


d2 y
(∗) = λA(x)y + f (x),
dx2
où A et f sont des fonctions continues données sur [a; b], à valeurs complexes, et λ est un
paramètre complexe. Introduisons le noyau N(x, s) défini par :
(x − b)(s − a) (x − a)(s − b)
N(x, y) = pour s 6 x et N(x, y) = pour x 6 s,
b−a b−a
puis le noyau non symétrique :

K(x, s) = N(x, s)A(s),

et posons :
Z b
g(x) = N(x, s)f (s) ds.
a
Alors, pour une fonction y = y(x) les deux assertions suivantes sont équivalentes :
(i) la fonction y est solution de (∗) et y(a) = y(b) = 0 ;
(ii) la fonction y est solution de l’équation de Fredholm :
Z b
y(x) = λ K(x, s)y(s) ds + g(x).
a

Preuve. Supposons (i), autrement dit qu’on a : y 00 (x) = λA(x)y(x) + f (x) et y(a) =
y(b) = 0. Il suffit d’appliquer l’Exercice d’introduction avec f (x) remplacé par λA(x)y(x)+
f (x) pour obtenir (ii).

Réciproquement, supposons (ii). Dans


Z b
y(x) = λ K(x, s)y(s) ds + g(x),
a

remplaçons K(x, s) et g(x) par leurs expressions en fonction de N(x, s), puis revenons à la
définition de N(x, s). On constate alors que y satisfaisant (∗∗) satisfait automatiquement
(i). 

Corollaire 1. — Soit λ un nombre complexe. Alors :


(i) ou bien l’équation
d2 y
(∗) = λA(x)y + f (x),
dx2
a, pour tout fonction f , une solution y = y(x) et une seule telle que y(a) = y(b) = 0 ;
(ii) ou bien l’équation homogène associée
d2 y
(∗∗) = λA(x)y
dx2
a des solution non identiquement nulles telles que y(a) = y(b) = 0.
TS V.120 ÉQUATIONS DE STURM-LIOUVILLE § 8

Dans le second cas, nous dirons que λ est une valeur singulière pour l’équation (∗∗)
ou l’équation (∗) ; cela signifie que λ1 est valeur propre de l’opérateur intégral de noyau
N(x, s)A(s).

Supposons désormais que A n’est pas identiquement nul.

La théorie spectrale des opérateurs compacts (cf le Théorème 1) montre qu’il y a au


plus une infinité dénombrable de valeurs singulières de λ pour l’équation (∗∗), et au plus
un nombre fini dans tout disque {|λ| 6 R}. Nous verrons bientôt que si A(x) est une
fonction réelle, il y a en effet une infinité de valeurs singulières.

Proposition 2. — Chaque valeur singulière de (∗∗) est de multiplicité 1 seulement : pour


λ singulière, il y a, à multiplication par un facteur constant près, une seule fonction propre,
donc non identiquement nulle, solution de (∗∗) avec y(a) = y(b) = 0.

Preuve. S’il existait deux telles solutions linéairement indépendantes, elles engendre-
raient l’espace vectoriel (de dimension 2) des solutions de (∗∗). Ainsi toute solution de
ladite équation vérifierait automatiquement les conditions aux limites y(a) = y(b) = 0,
ce qui serait en contradiction avec le Théorème de Cauchy suivant lequel (∗∗) avec les
conditions y(a) = 1 et y 0 (a) = 0 admet une solution. 

Proposition 3. — Supposons que A(x) soit continue réelle et non identiquement nulle
sur [a; b]. Alors les valeurs singulières de (∗∗) sont toutes réelles.

Preuve. Le noyau K(x, s) = N(x, s)A(s) de l’équation de Fredholm


Z b
y(x) = λ K(x, s)y(s) ds + g(x)
a
n’est pas symétrique, donc le résultat annoncé ne peut se déduire de considérations sur les
opérateurs auto-adjoints. On va travailler directement sur l’équation différentielle.

Soit λ = α + iβ une valeur singulière complexe, et y(x) = u(x) + iv(x) une fonction
propre (donc non identiquement nulle). L’équation
d2 y
(∗∗)
= λA(x)y
dx2
donne, en passant aux parties réelle et imaginaire :
u00 = (αu − βv)A et v 00 = (βu + αv)A,
d’où
vu00 − uv 00 = β(u2 + v 2 )A et uu00 + vv 00 = α(u2 + v 2 )A,
et donc
Z b
0
0 = [vu − uv 0 ]ba = −β (u2 + v 2 )A dx,
a
et
Z b Z bZ b
0 = [uu0 + vv 0 ]ba = (u0 )2 + (v 0 )2 dx + α (u2 + v 2 )A dx.

a a a
§ 8 ÉQUATIONS DE STURM-LIOUVILLE TS V.121

6 0 on obtient
Ainsi, en supposant β =
Z b Z b
2 2
(u0 )2 + (v 0 )2 dx = 0,

(u + v )A dx =
a a

u0 v0 y0
ce qui implique = = 0, donc que est constante, autrement dit nulle par les conditions
aux limites satisfaites par y : c’est exclu, et on a donc nécessairement β = 0. 

Nous abondonnons provisoirement l’étude des valeurs singulières de (∗∗) pour exposer
la théorie de Sturm pour les zéros des solutions (réelles) de l’équation différentielle :
y 00 (x) + p(x)y 0 (x) + q(x)y(x) = 0.

Soient a < b deux nombres réels. Soient P et Q deux fonctions réelles continues sur
[a; b]. On suppose de plus que P(x) est > 0 et admet une dérivée première continue sur
[a; b]. On va en fait étudier l’équation différentielle :
 
d dy
P(x) + Q(x)y = 0,
dx dx
qui équivaut à la précédente si on pose :
P0 (x) Q(x)
p(x) = et q(x) = ,
P(x) P(x)
ou, réciproquement :
Z x
P(x) = exp p(t) dt et Q(x) = q(x)P(x).
a

Proposition 4. — Une solution y(x) non identiquement nulle de


 
d dy
P(x) + Q(x)y = 0
dx dx
n’a qu’un nombre fini de zéros dans [a; b].
Preuve. Sinon, il existerait dans [a; b] un point d’accumulation, disons c, des zéros de
y(x) qui, d’après le théorème de Rolle serait aussi un point d’accumulation des zéros de
y 0 (x). Par continuité, on aurait y(c) = y 0 (c) = 0, forçant y à être identiquement nulle par
unicité de la solution sous conditions de Cauchy. 
Proposition 5. — Soient c < d deux zéros consécutifs d’une solution y1 non identique-
ment nulle de  
d dy
P(x) + Q(x)y = 0
dx dx
et soit y2 une solution de la même équation, non proportionnelle à y1 . Alors y2 a un zéro
et un seul dans ]c; d[.
Preuve. Prouvons l’existence par l’absurde. Si, pour tout x ∈]c; d[, on a y2 (x) 6= 0, on
a aussi y2 (c) 6= 0 et y2 (d) 6= 0 (car sinon y2 serait proportionnelle à y1 comme ayant des
conditions initiales proportionnelles). Ainsi yy12 est une fonction continue sur [c; d] nulle en
TS V.122 ÉQUATIONS DE STURM-LIOUVILLE § 8

y 0 y −y y 0
c et en d ; sa dérivé 1 (y2 2 )21 2 s’annule quelque part entre c et d, ce qui est impossible car le
 
y1 y2
wronskien det 0 n’est jamais nul pour deux solutions linéairement indépendantes.
y1 y20

Prouvons l’unicité par l’absurde. Supposons qu’il existe α < β dans ]c; d[ tels que
y2 (α) = y2 (β) = 0. D’après la partie existence qui vient d’être démontrée, y1 aurait un
zéro entre α et β, ce qui est exclu par le fait que c et d sont consécutifs. 

On va maintenant comparer les solutions de deux équations différentielles du même


type que ci-dessus, mais différentes.

Proposition 6. — Soient les deux équations :


 
d dy
(E) P(x) + Q(x)y = 0
dx dx
et  
d dy
(E0 ) P(x) + Q1 (x)y = 0
dx dx
où P(x), Q(x) et Q1 (x) sont continues réelles, P(x) est > 0 et où

Q(x) < Q1 (x)

pour tout x ∈ [a; b]. Soient c < d deux zéros consécutifs d’une solution y non nulle de (E).
Alors toute solution z de (E1 ) s’annule au moins une fois dans ]c; d[.

Autrement dit, à P(x) donnée, on augmente le nombre des oscillations des solutions
de (E) quand on augmente Q(x).

Preuve. Multipliant (E) par z et (E1 ) par y, puis soustrayant, on obtient :


d
P(zy 0 − yz 0 ) = (Q1 − Q)yz,

dx
d’où, en intégrant entre c et d :
Z d
(Q1 − Q)yz dx = P(d)z(d)y 0 (d) − P(c)z(c)y 0 (c).
c

Par l’absurde, si z(x) n’était jamais nulle dans ]c; d[, alors y(x) et z(x) garderaient chacune
un signe constant sur cet intervalle. Si, par exemple, les fonctions y et z restent > 0 sur
]c; d[, alors le premier membre est > 0 alors que le second est 6 0 car y 0 (d) 6 0 et
y 0 (c) > 0 (vu le signe de y sur ]c; d[). Les trois autres possibilités de signes conduisent elles
aussi à une contradiction à chaque fois. 

Par exemple, soit l’équation :

y 00 + Q(x)y = 0,

où Q(x) est réelle continue, et vérifie l’inégalité

0 < ω 2 < Q(x) < Ω2


§ 8 ÉQUATIONS DE STURM-LIOUVILLE TS V.123

pour tout x ∈ [a; b], avec ω et Ω constantes. Comparons une solution de cette équation aux
solutions de l’équation
y 00 + α2 y = 0,
où successivement α = ω et α = Ω. Les solutions sont de la forme C sin (α(x − x0 )) et ont
pour zéros les nombres x0 + k απ où k est un entier. L’écart entre deux zéros consécutifs est
constant et égal à απ . Il en résulte que, si δ = d − c est l’écart variable entre deux zéros
consécutifs de la solution non identiquement nulle de y 00 + Q(x)y = 0, on a les inégalités :
π π
6 δ 6 .
Ω ω
π
Car si δ était < Ω , on trouverait un x0 (par exemple x0 = c) tel que pour aucun entier
k, le nombre ne serait dans ]c; d[. Et si δ était > ωπ il existerait x0 tel que [x0 ; x0 + Ω
π
]
π π
soit contenu dans ]c; d[, donc ne contiendrait aucun zéro de y. Les inégalités Ω 6 δ 6 ω
permettent d’assigner des bornes au nombre de zéros de y(x) contenus dans un segment
donné.

Exercice 2. — Soit pour ν réel l’équation de :


1 0 ν2
(Eν ) y 00 + y + (1 − 2 )y = 0 (x > 0)
x x
et sa solution la fonction de Bessel :
∞ 2
 x ν X (− x4 )k
Jν (x) = .
2 Γ(k + 1)Γ(ν + k + 1)
k=0

(i) En posant Y = xy, transformer (Eν ) en une équation du type considéré dans la
2
Proposition précédente avec Q(x) = 1 − 4ν4x−1
2 .

(ii) Soit n(X) le nombre des zéros positifs de Jν qui sont 6 X. Montrer que
limX→∞ n(X)
X = π.
1

Revenons à l’étude des valeurs singulières λ de l’équation


y 00 = λA(x)y
sous les conditions aux limites
y(a) = y(b) = 0
où l’on suppose A(x) continue réelle et non identiquement nulle sur [a; b]. Si x0 ∈ [a; b], y0
et m0 sont donnés, notons y(x, λ) la solution de y 00 = λA(x)y qui satisfait aux conditions
de Cauchy, indépendante de λ, suivantes :
d
y(x0 , λ) = y0 y(x0 , λ) = m0 .
et
dx
Il résulte des théorèmes généraux sur les équations différentielles linéaires à coefficients
dépendant d’un paramètre que, pour pour tout x ∈ [a; b] fixé, la fonction
λ 7→ y(x, λ)
est holomorphe dans C : c’est une fonction entière de la variable complexe λ.
TS V.124 ÉQUATIONS DE STURM-LIOUVILLE § 8

Remarque 1. — On en déduit une nouvelle démonstration, indépendante de la théorie


spectrale, du fait que le nombre de valeurs singulières dans tout disque fermé de rayon fini,
est fini.
Preuve. En effet, soient y1 (x, λ) et y2 (x, λ) deux solutions de y 00 = λA(x)y correspon-
dant à des conditions initiales linéairement indépendantes. La solution générale de cette
équation s’écrit alors comme une combinaison linéaire :
y(x) = C1 y1 (x, λ) + C2 y2 (x, λ).
Alors λ est valeur singulière si et seulement si il existe C1 et C2 non toutes deux nulles et
telles que
y(x) = C1 y1 (a, λ) + C2 y2 (a, λ) = 0
et
y(x) = C1 y1 (b, λ) + C2 y2 (b, λ) = 0,
donc si et seulement si la fonction entière
λ 7→ y1 (a, λ)y2 (b, λ) − y2 (a, λ)y1 (b, λ)
est nulle au point λ. Or cette fonction entière n’est pas identiquement nulle car 0 n’est pas
valeur singulière. Donc ses racines sont isolées dans C. 
Lemme 1. — Soit y(x, λ) la solution de
y 00 = λA(x)y
correspondant à des conditions initiales x0 , y0 et m0 indépendantes de λ. Alors il existe un
signe ε = ± tel que quand λ réel tend vers ε∞, le nombre de zéros de cette solution tend
vers l’infini.
Preuve. Puisque A n’est pas identiquement nulle, on peut trouver c < d dans [a; b]
tels que |A(x)| > ω 2 > 0 pour tout x ∈ [c; d]. Prenons λ du signe de A(x) sur [c; d]. On a :
λA(x) >p |λ|ω 2 . D’après le Théorème de comparaison de Sturm, y(x, λ) s’annule au moins
(d − c) ωπ |λ| − 1 fois sur [c; d]. 
Proposition 7. — Si A(x) est réelle continue non identiquement nulle sur [a; b], alors
l’équation
y 00 = λA(x)y
a une infinité de valeurs singulières (nécessairement réelles) pour le problème aux limites
y(a) = y(b) = 0.
Preuve. Soit y(x, λ) la solution de y 00 = λA(x)y telle que y(x, λ) = 0 et y 0 (x, λ) = 1.
Pour fixer les idées, supposons que c’est quand λ → +∞ que le nombre de zéros de y(x, λ)
augmente indéfiniment (suivant le lemme qui précède). Puisque y(x, λ) dépend continûment
de λ et puisque tous ses zéros sont simples (par unicité de Cauchy), le nombre de ces zéros
ne peut augmenter que lorsqu’on passe par une valeur de λ telle que y(b, λ) = 0, c’est-à-dire
une valeur singulière. Quand λ → +∞ en croissant, le lemme impose donc qu’on passe une
infinité de fois par des valeurs singulières. 
§ 8 ÉQUATIONS DE STURM-LIOUVILLE TS V.125

Étudions donc pour terminer les cas particulier où A(x) est < 0 pour tout x ∈ [a; b].
En posant alors :
Q(x) = −A(x)
on étudie le problème :
y 00 = λQ(x)y avec y(a) = y(b) = 0,
où Q(x) est > 0 pour tout x ∈ [a; b]. À tout ce qui a été déjà écrit, on peut ajouter les
compléments suivants.

Les valeurs singulières sont toutes réelles strictement positives.


Rb
En effet, puisque a y(y 00 + λQy) dx = 0, on a :
Z b Z b
0 = [yy 0 ]ba = (y 0 )2 dx − λ Qy 2 dx,
a a
Rb
donc λ a Qy 2 dx > 0, puis λ > 0, donc λ > 0 puisque 0 n’est pas valeur singulière.

Rangeons les valeurs singulières par ordre croissant : λ1 < λ2 < · · · < λn . . . , et soit
yn une fonction propre de l’équation ci-dessus associée à λn . Alors yn a exactement (n − 1)
racines dans ]a; b[.

On le voit en approfondissant un peu la méthode de démonstration de la Proposition


7 ; et en vérifiant que, chaque nouvelle fois que y(b, λ) s’annule, il s’introduit effectivement
un nouveau zéro de y(x, λ). Autrement dit, il suffit de vérifier que
∂y ∂y
(b, λ) · (b, λ) > 0
∂λ ∂x
au moment où y(b, λ) = 0. Or, en dérivant par rapport à λ l’équation différentielle y 00 =
λQ(x)y, on obtient :
d2
 
∂y ∂y
+ Qy + λQ = 0,
dx2 ∂λ ∂x
d’où :
∂y d2 y d2
 
∂y
−y 2 = y 2 Q,
∂λ dx2 dx ∂λ
et en intégrant de a à b :
  b
∂y dy d ∂y
−y > 0.
∂λ dx dx ∂λ a
∂y
Puisque y(a) = y(b) = 0 et ∂λ (a, λ) = 0, on a bien l’inégalité stricte recherchée.

Avec les notations précédentes, on a les relations d’orthogonalité :


Z b
yn (x)ym (x) dx = 0
a
dès que m 6= n.

En effet, de :
yn00 + λn Qyn = 0 et ym
00
+ λm Qym = 0,
126 ÉQUATIONS DE STURM-LIOUVILLE § 8

avec yn (a) = yn (b) = ym (a) = ym (b) = 0, on déduit que :


Z b
0 0 b
0 = [ym yn − yn ym ]a = (λm − λn ) Qyn ym dx.
a
À partir de ces remarques, on pourrait développer pour les fonctions f sur [a; b] une
analyse harmonique en série de fonctions orthogonales :

X
f (x) ∼ cn (f )yn (x),
n=1
Rb
avec cn (f ) = a f (x)yn (x)Q(x) dx, qui généraliserait la théorie classique des séries Fourier.
appendice premier

Appendices

§ 1. APPENDICE 1 : SUR QUELQUES ESPACES DE SUITES

Ce qui va suivre dans cet appendice a été normalement vu en tronc commun. Néan-
moins, il a paru utile d’en faire un rappel détaillé, avec les démonstrations, car c’est un
réservoir d’exemples classiques d’espaces de Banach, où nous allons largement puiser tout
au long du cours.
On introduit les espaces vectoriels, sur le corps K valant R ou C, suivants :
l’espace c00 des suites (xn )n>0 nulles à partir d’un certain rang ;
l’espace c0 des suites x = (xn )n>0 qui tendent vers 0, normé par kxk∞ = supn∈N |xn | ;
l’espace `1 (N) des suites x = (xn )n>0 telles que kxk1 = n∈N |xn | < +∞, normé
P

par k·k1 ;
l’espace `∞ (N) des suites bornées x = (xn )n>0 , normé par k·k∞ comme ci-dessus.
On note ek la suite dont toutes les coordonnées d’indice 6= k valent 0 et dont la k-ième
valeur vaut 1. Si x = (xn )n>1 ∈ `1 (N) et si y = (yn )n>1 ∈ `∞ (N), on note :
X
hx, yi = xn yn ,
n∈N

série absolument convergente car


X X
|hx, yi| = | x n yn | 6 |xn yn | 6 kxk1 kyk∞ .
n∈N n∈N

Lemme 1. — L’espace vectoriel c0 est un sous-espace fermé de `∞ (N).

Preuve. Soit en effet (xk )k>0 une suite de vecteurs de c0 et soit x ∈ `∞ (N) telle que
lim kx − xk k∞ = 0. Soit ε > 0. Il existe un entier K tel que kxK − xk∞ 6 2ε . Puisque
k→∞
ε
xK ∈ c0 , il existe Nε tel que n > Nε implique |(xK )n | 6 2. Ainsi, n > Nε implique
|xn | 6 |(xK )n | + kxK − xk∞ 6 2ε + 2ε = ε, et donc x ∈ c0 . 
TS I.128 APPENDICE 1 : SUR QUELQUES ESPACES DE SUITES § 1

Lemme 2. — L’espace vectoriel c00 est engendré par les vecteurs ek . Il est dense dans c0
et dans `1 (N).

Preuve. L’assertion algébrique est évidente.

Soit maintenant x ∈ c0 et soit ε > 0. Il existe N tel que |xn | 6 ε pour tout n > N.
Posons xε = (x0 , x1 , x2 , . . . , xN−1 , 0, 0, . . . ). Par construction c’est une suite dans c00 telle
que kx − xε k∞ 6 ε.

De même, si y ∈ `1 (N) et si ε > 0 sont donnés, il existe N tel que ∞


P
n=N |xn | 6 ε.
Posons yε = (y0 , y1 , y2 , . . . , yN−1 , 0, 0, . . . ). Il est clair que yε ∈ c00 et que kx − xε k 6 ε. 

Théorème 1. — Pour tout y ∈ `1 (N) fixé, l’application x 7→ hx, yi = n>0 xn yn est une
P

forme linéaire continue sur l’espace normé (c0 , k·k∞ ) ; elle a pour norme kyk1 . Réciproque-
ment, pour toute ϕ ∈ (c0 )0 il existe un unique y ∈ `1 (N) tel que ϕ(x) = hx, yi pour tout
x ∈ c0 . Ainsi le dual topologique de l’espace normé c0 s’identifie à l’espace normé `1 (N).

Corollaire 1. — Comme `1 (N) est un dual topologique, il est complet et c’est donc un
espace de Banach.

Preuve. Notons ϕy (x) = hx, yi. Soit y ∈ `1 (N) fixé. On a déjà vu en préambule que
|ϕy (x)| 6 kyk1 kxk∞ , donc ϕy ∈ (c0 )0 et |||ϕy ||| 6 kyk1 . Prouvons que |||ϕy ||| > kyk1 . Soit
|yn |
ε > 0. Soit N tel que ∞
P 
n=N |xn | 6 ε. Soit la suite xε = (xε )n n>0 où (xε )n vaut yn si
1 6 n < N et yn 6= 0, et vaut 0 sinon. Alors xε ∈ c00 et kxε k∞ 6 1. De plus, on a :
N−1 N−1
X |yn | X
ϕy (xε ) = hy, xε i = yn = |yn | > kyk1 − ε.
yn
n=1,yn 6=0 n=1

Ainsi |||ϕy ||| > kyk1 − ε, et comme ε est arbitraire on en déduit |||ϕy ||| > kyk1 et finalement
l’égalité.

Réciproquement, soit ϕ ∈ (c0 )0 . Posons yn = ϕ(en ) pour tout n ∈ N. Alors pour tout
entier N, on a :
 
XN N−1
X |yn | N−1
X |yn | N−1
X |yn |
|yn | = yn = ϕ  en  6 |||ϕ||| · k k∞ 6 |||ϕ|||.
yn yn yn
n=1 n=1,yn 6=0 n=1,yn 6=0 n=1,yn 6=0

Ceci prouve que y est dans `1 (N). Par construction, la forme ϕ−ϕy est nulle sur chaque en ,
donc nulle d’abord sur c00 par linéarité, puis sur c0 par densité. Ceci prouve que ϕ = ϕy .
Enfin, y est bien unique car ϕy = ϕy0 implique yn = ϕy (en ) = ϕy0 (en ) = yn0 pour tout
entier n. 

Théorème 2. — Pour tout y ∈ `∞ (N) fixé, l’application x 7→ hx, yi = n>0 xn yn est une
P

forme linéaire continue sur l’espace normé `1 (N) ; elle a pour norme kyk∞ . Réciproque-
ment, pour toute ϕ ∈ `1 (N)0 il existe un unique y ∈ `∞ (N) tel que ϕ(x) = hx, yi pour tout
x ∈ `1 (N). Ainsi le dual topologique de l’espace normé `1 (N) s’identifie à l’espace normé
`∞ (N).
§ 1 APPENDICE 1 : SUR QUELQUES ESPACES DE SUITES TS I.129

Corollaire 1. — Les espaces normés `∞ (N) et c0 sont des espaces de Banach, car `∞ (N)
est un dual topologique d’espace normé et c0 en est un sous-espace fermé.

Preuve. Notons ϕy (x) = hx, yi où y ∈ `∞ (N) est fixé. On a vu en préambule que


ϕy ∈ `1 (N)0 et que |||ϕy ||| 6 kyk∞ . On suppose que y 6= 0. Soit ε > 0 plus petit que
kyk∞ . Soit N tel que |yN | > kyk∞ − ε. La suite xε = (xε )n n>0 où (xε )n = 0 si n 6= N et
|yN |
(xε )N = yN , est dans `1 (N) et kxε k1 = 1. De plus, on a :

|yN |
ϕy (xε ) = yN = |yN | > kyk∞ − ε,
yN

donc |||ϕy ||| > kyk∞ car ε est arbitrairement petit. Ainsi |||ϕy ||| = kyk∞ .

Réciproquement, soit ϕ ∈ `1 (N)0 . Posons yn = ϕ(en ) pour tout n ∈ N. Alors pour


tout entier n, si yn 6= 0, on a :
 
|yn | |yn | |yn |
|yn | = yn = ϕ en 6 |||ϕ||| · k en k1 = |||ϕ|||,
yn yn yn

donc supn∈N |yn | 6 |||ϕ||| ; ainsi y ∈ `∞ (N). Par construction, la forme linéaire ϕ − ϕy est
nulle sur chaque en , donc nulle d’abord sur c00 par linéarité, puis sur `1 (N) par densité.
Ainsi ϕ = ϕy . Enfin, y est unique car ϕy = ϕy0 implique yn = ϕy (en ) = ϕy0 (en ) = yn0 pour
tout entier n. 

Passons maintenant à quelques rappels sur les inégalités de Hölder et Minkowski, de


façon à pouvoir généraliser ce qui préceède aux espaces `p (N) que nous allons définir plus
loin.

En utilisant la convexité de la fonction x 7→ ax (pour a > 1), on démontre que si p est


un nombre réel > 1 et si q est défini par p1 + 1q = 1, alors pour tous nombres réels positifs
x1 , x2 ; . . . , xn et y1 , y2 , . . . , yn , on a :
n n
!1 n
!1
p q
p q
X X X
l’inégalité de Hölder : x k yk 6 xk · yk ,
k=1 k=1 k=1
n
!1 n
!1 n
!1
p p p

xpk ykp
X X X
l’inégalité de Minkowski : (xk + yk )p 6 + ,
k=1 k=1 k=1
l’égalité n’ayant lieu que si (y1 , y2 , . . . , yn ) est proportionnel à (x1 , x2 , . . . , xn ). Bien en-
tendu, ces inégalités restent valables quand on suppose nuls certains xk ou yk .

Étudions maintentant les espaces de suites `p (N). Soit p un nombre réel > 1 et soit
p
q = p−1 l’exposant conjugué de p. On note `p (N) l’ensemble des suites x = (xn )n>0 où les
!1
X p

xn ∈ K satisfont n∈N |xn |p < +∞. Pour un tel x ∈ `p (N), posons kxkp = |xn |p .
P
n∈N
Si x = (xn )n>0 et y = (yn )n>0 sont toutes les deux dans `p (N), d’après l’inégalité de
TS I.130 APPENDICE 1 : SUR QUELQUES ESPACES DE SUITES § 1

Minkowski :
n
!1 n
!1 n
!1
X p X p X p

|xk + yk |p 6 |xk |p + |yk |p 6 kxkp + kykp ,


k=1 k=1 k=1

pour tout indice n, d’où il résulte que nk=1 |xk + yk |p < +∞. Ceci, et des remarques
P

évidentes, prouve que `p (N) est un espace vectoriel sur K et que k·kp est une norme pour
cet espace. De la même façon que pour p = 1, on prouve que c00 est dense dans chaque
`p (N). Si x = (xn )n>0 est dans `p (N) et si y = (yn )n>0 est dans `q (N), on a d’après
l’inégalité de Hölder :
n n n
!1 n
!1
X X X p X q
p q
| xk yk | 6 |xk yk | 6 |xk | · |yk | ,
k=1 k=1 k=1 k=1

pour tout indice n, ce qui prouve que la série


X
hx, yi = xn yn
n>0

converge absolument et que


|hx, yi| 6 kxkp · kykq .

Théorème 3. — Pour tout y ∈ `q (N) fixé, l’application x 7→ hx, yi = n>0 xn yn est une
P

forme linéaire sur l’espace normé `p (N) ; elle a pour norme kykq . Réciproquement, pour
toute ϕ ∈ `p (N)0 , il existe un unique y ∈ `q (N) tel que ϕ(x) = hx, yi pour tout x ∈ `p (N).
Ainsi, le dual topologique de l’espace normé `p (N) s’identifie à l’espace normé `q (N).

Corollaire 1. — De même, le dual de `q (N) s’identifie à `p (N), et donc `p (N) est un


espace de Banach, égal à son bidual.

Attention, la dernière assertion sur la bidualité est propre au cas où p > 1.

Preuve. Notons ϕy (x) = hx, yi. Soit y ∈ `p (N) fixé. On vient de prouver que l’on a
ϕy ∈ `p (N)0 et que |||ϕy ||| 6 kykq . Pour démontrer l’inégalité inverse, on peut supposer
y 6= 0 puis, par homogénéité, se ramener à kykq = 1. Soit ε > 0 suffisamment petit. Soit
q
N un indice tel que n>N |yn |q 6 ε. Soit xε = (xε )n n>0 la suite où (xε )n vaut |yynn| si
P 

1 6 n < N et yn 6= 0, et vaut 0 sinon. Alors :


N−1
X N−1
X
kxkpp = |yn |p(q−1) = |yn |q 6 kykqq = 1.
n=1 n=1

De plus, on a :
N−1 N−1
X |yn |q X
ϕy xε ) = hxε , yi = yn = |yn |q > 1 − ε = kykq − ε.
yn
n=1,yn 6=0 n=1

Ainsi |||ϕy ||| > kykq − ε, et comme ε est arbitrarire cela prouve l’égalité cherchée.
§ 2 APPENDICE 2 : SUR LE LEMME DE ZORN TS I.131

Réciproquement, soit ϕ ∈ `p (N)0 . Posons yn = ϕ(en ) pour tout n ∈ N. Alors pour


tout entier N, on a :
 
XN N−1
X |yn |q N−1
X |yn |q
|yn |q = yn = ϕ  en 
yn yn
n=0 n=0,yn 6=0 n=0,yn 6=0

N N
! p1 N
! p1
X |yn |q X X
6 |||ϕ||| · k en kp = |||ϕ||| · |yn |p(q−1) = |||ϕ||| · |yn |q .
yn
n=0,yn 6=0 n=0 n=0
P 1
N q p
En divisant par n=0 |yn | les extrémités de la ligne précédente, ceci permet de voir
que :
N
! p−1
p N
! 1q
X X
|yn |q = |yn |q 6 |||ϕ|||,
n=0 n=0
et finalement que y est dans `q (N).
Par construction, la forme ϕ − ϕy est nulle sur chaque
en , donc nulle d’abord sur c00 par linéarité, puis sur `p (N) par densité. Ceci prouve que
ϕ = ϕy . Enfin, y est unique car ϕy = ϕy0 implique yn = ϕy (en ) = ϕy0 (en ) = yn0 pour tout
entier n. 

Bien entendu, pour p = 2 (et donc q = 2) l’espace `2 (N) est un espace de Hilbert,
l’unique espace de Hilbert séparable de dimension infinie (à isomorphisme près).

§ 2. APPENDICE 2 : SUR LE LEMME DE ZORN

Soit E un ensemble. Une relation sur E est le choix d’un ensemble de couples (x, y)
d’éléments de E qu’on décide d’appeler reliés, ce qu’on note xRy. Autrement, une relation
(sous-entendue binaire) dans E est la donnée d’une partie de E × E.
On dit qu’une relation R sur un ensemble E est une relation d’ordre sur E si elle
satisfait les trois conditions suivantes :

(i) quel que soit x ∈ E, on a xRx (réflexivité) ;


(i) quels que soient x ∈ E et y ∈ E, si xRy et yRx alors x = y (antisymétrie) ;
(i) quels que soient x, y et z and E, si xRy et yRz, alors xRz (transitivité).

Un ensemble ordonné est la donnée d’un ensemble muni d’une relation d’ordre.
Exemple 1. — La relation d’ordre usuelle sur l’ensemble R des nombres réels.
Exemple 2. — L’ensemble P(E) des parties d’un ensemble E est ordonné par la relation
d’inclusion.
Exemple 3. — Soit X un ensemble et soit E l’ensemble des applications de X dans R. Pour
f et g dans E, on pose f 6 g si et seulement si pour tout x ∈ X on a f (x) 6 g(x).
TS I.132 APPENDICE 2 : SUR LE LEMME DE ZORN § 2

Exemple 4. — Dans l’ensemble des entiers > 0, la relation de divisibilité est une relation
d’ordre.
En termes de notations, on remplacera souvent la notation xRy par x 6 y (auquel
cas x > y signifiera yRx).

Soit X une partie d’un ensemble ordonné E. On appelle majorant de X tout élément
y de E tel que pour tout x ∈ X on ait : x 6 y. Alors tout y 0 dans E tel que y 0 > y est
encore un majorant de X. Si l’ensemble des majorants de X n’est pas vide, on dit que X
est majoré dans E.

Soit X une partie majorée d’un ensemble ordonné E. On appelle borne supérieure de
X, s’il existe, un élément M de E, non nécessairement dans X tel que :

(i) l’élément M de E est un majorant de X ;


(ii) pour tout majorant y de X, on a M 6 y.

Noter que si la borne supérieure M existe, elle est unique.

Soit X une partie d’un ensemble ordonné E.


Définition 1. — On dit que X est totalement ordonnée si, quels que soient x ∈ X et
y ∈ X, on a x 6 y ou y 6 x.
Dans le premier exemple ci-dessous toute partie est totalement ordonnée, alors qu’ils
n’en est pas de même dans les trois exemples suivants (ordres partiels).

Dans un ensemble E, un élément a est dit maximal si les condtions x ∈ E et x > a


entraînent x = a.

Une des bases de la théorie des ensembles, équivalente à l’axiome du choix, et qui per-
met de faire des raisonnements de récurrence sur des ensembles ordonnés non dénombrables
(récurrences transfinies) est l’énoncé suivant.

Lemme 1 (lemme de Zorn). — Soit E un ensemble ordonné non vide. Supposons que toute
partie totalement ordonnée non vide de X de E admette dans E une borne supérieure. Alors
il existe dans E au moins un élément maximal.
Nous utiliserons librement l’axiome de Zorn dans ce cours, notamment dans la démons-
tration du cas général du théorème de Hahn-Banach, et aussi dans l’étude des algèbres de
Banach, à travers l’énoncé suivant.
Théorème 1 (Krull). — Soit A un anneau commutatif avec élément neutre, noté e. Soit
I un idéal strictement inclus dans A. Alors I est contenu dans au moins un idéal maximal
de A.
Rappelons qu’un idéal maximal de A est par définition un idéal maximal pour la
propriété d’être strictement inclus dans A. Si I est un idéal dans A et si π : A → A/I est
l’homomorphisme d’anneaux associé, alors la prise d’image réciproque par π établit une
bijection entre les idéaux de A/I et les idéaux de A contenant I. Cette bijection permet de
§ 3APPENDICE 3 : SUR L’ESPACE VECTORIEL RÉEL SOUS-JACENT À UN ESPACE COMPLEXETS I.133

voir qu’une façon de caractériser les idéaux maximaux parmi les idéaux est de dire qu’il
s’agit des idéaux dont l’anneau quotient associé est un corps.

Preuve. Pour prouver le théorème de Krull, il suffit d’appliquer le lemme de Zorn à


l’ensemble E des idéaux propres de A contenant I, ordonné par l’inclusion. Une partie
totalement ordonnée de E est une famille (Iλ )λ∈Λ d’idéaux propres (i.e. stricts) contenant
S
I et emboîtés les uns dans les autres. Elle a pour borne supérieure λ∈Λ Iλ . 

§ 3. APPENDICE 3 : SUR L’ESPACE VECTORIEL RÉEL SOUS-JACENT À


UN ESPACE COMPLEXE

Étant donné un espace vectoriel complexe E, on peut considérer le même ensemble


de vecteurs, avec la même addition, comme un espace vectoriel réel, en ne tenant compte
que de la multiplication par les scalaires réels ; cela revient à restreindre à R × E l’action
des scalaires initiale C × E → E. L’espace vectoriel ainsi obtenu, noté ER , sera appelé
espace vectoriel réel sous-jacent à E. Si E est normé, on munit ER de la même norme. La
proposition suivante établit les relations entre les formes linéaires (continues) complexes
(sur E) et réelles (i.e. sur ER ).
Proposition 1. — Soit E un espace vectoriel complexe.
(i) Soit f une forme linéaire complexe sur E, et soit u la partie réelle de f définie
par u(x) = Re f (x) pour tout x ∈ E. Alors u est une forme linéaire sur ER et pour tout
x ∈ E on a : f (x) = u(x) − iu(ix).
(ii) Soit u une forme linéaire sur ER . Définissons f : E → C par f (x) = u(x)−iu(ix).
Alors f est une forme C-linéaire sur E et u = Re(f ) au sens ci-dessus.
(iii) Si E est normé et si f et u sont reliées comme ci-dessus, alors elles ont même
norme.
Preuve. Pour obtenir (i), il suffit d’appliquer à z = f (x) ∈ C l’identité valable pour
tout nombre complexe : z = Re(z) − iRe(iz).

Passons à (ii). Il est clair que l’on a f (x + y) = f (x) + f (y) pour tous x, y ∈ E (f est
additive) et que f (λx) = λf (x) pour tous x ∈ E et λ ∈ R (compatibilité à l’action des
scalaires réels). Mais on a aussi :
f (ix) = u(ix) − iu(−x) = u(ix) + iu(x) = if (x).
Ceci implique la compatibilité à l’action de tous les scalaires dans C, et donc la C-linéarité
de f ainsi définie ; il est clair que u = Re(f ). On a prouvé (ii)

Finissons avec (iii). Puisque |u(x)| = |Re(f )(x)| 6 |f (x)|, on a déjà : |||u||| 6 |||f |||.
D’autre part, si x ∈ E il existe λ ∈ C de module 1 et tel que λf (x) = |f (x)|. On a alors :
|f (x)| = λf (x) = f (λx) = u(λx) 6 |||u||| · kλxk = |||u||| · kxk,
ce qui prouve que |||f ||| 6 |||u|||. 
TS I.134APPENDICE 3 : SUR L’ESPACE VECTORIEL RÉEL SOUS-JACENT À UN ESPACE COMPLEXE§ 3

Nous utiliserons cette proposition pour prouver le théorème de Hahn-Banach complexe


à partir du théorème de Hahn-Banach réel.
Exercices

§1


1) Soit A convexe avec A◦ 6= ∅. Montrer que A = A◦ et A◦ = A .

2) Soit A un sous-ensemble convexe compact de Rn tel que le point 0 soit dans l’intérieur de A.
Soit S = {x ∈ Rn : kxk = 1} la sphère unité.
(i) Montrer que, pour tout y ∈ S, la demi-droite d’origine 0 passant par y coupe la frontière
Fr(A) = A A◦ de A en un point et un seul, noté δ(y).
(ii) Montrer que l’application y 7→ δ(y) est une application continue de S sur Fr(A).

3) Soit A une partie d’un espace vectoriel réel normé E.


(i) Si A est fermée, est-il toujours vrai que conv(A) soit fermée ?
(ii) Si A est ouverte, est-il toujours vrai que conv(A) soit ouverte ?

4) Soit P(z) un polynôme à coefficients complexes et soit P0 (z) son polynôme dérivé. Montrer
que dans C ' R2 , toute racine de P0 est dans l’enveloppe convexe de l’ensemble des racines de P.

5) Dans l’espace de suites `∞ (N), montrer que l’ensemble enn n>1 ∪ {0} est compact mais que


son enveloppe convexe n’est pas fermée. Ici, en (k) = δn (k) est la suite qui vaut 0 pour tout k > 0,
sauf pour k = n où on a en (k) = 1.

6) [Une application du théorème de Helly] Soit F une partie finie de Rd . Montrer qu’il existe un
point x tel que tout hyperplan passant par x et ne rencontrant pas F, sépare F en deux parties F1
et F2 contenant chacune au moins |F|/(d + 2) points de F.

7) [Moyenne de Banach]
(i) Montrer qu’il existe une forme linéaire continue F, de norme égale à 1, invariante par
translations sur `∞ (Z) et qui vaut 1 sur la fonction constante égale à 1.
(ii) Soit eN la suite définie par eN (n) = δN (n). Montrer que F(eN ) = 0 pour tout N ∈ Z et en
déduire que F est nulle sur c0 (Z) (l’esapce des suites qui tendent vers 0 en ±∞).
TS I.136 EXERCICES

(iii) En déduite l’existence d’une probabilité “finiment additive", invariante par translations
sur Z, c’est à dire une application P : P(Z) → [0, 1] où P(Z) l’ensemble des parties de Z vérifiant :
• P(A ∪ B) = P(A) + P(B) si A ∩ B = ∅ ;
• P(A) > 0 pour tout A ⊂ Z ;
• P(Z) = 1 ;
• P(A) = 0 si A est fini.

8)
(i) Quel est le bidual de l’espace c0 (N) des suites réelles qui tendent vers 0 à l’infini, muni de
la norme sup ?
(ii) Citer des espaces vectoriels normés égaux à leur bidual (ces espaces vectoriels normés sont
dits réflexifs).
(iii) On considère le sous-espace vectoriel V de `∞ (N), formé des suites réelles qui admettent
une limite quand n → ∞. Sur V on définit la forme linéaire
x = (xn )n∈N 7→ lim xn .
n→∞
Montrer que cette forme linéaire est continue sur V et non nulle, mais qu’elle est identiquement
nulle sur c0 . En déduire que l’espace `1 (N) n’est pas réflexif.

9) Montrer que tout sous-espace affine fermé est l’intersection des hyperplans affines qui le
contiennent.

10) Soit C un convexe fermé et A une partie d’un espace réel normé E. Montrer que pour que C
contienne A, il faut et il suffit que pour tout f ∈ E0 , on ait f (A) ⊂ f (C).

11) Dans `2 (N) soit A l’enveloppe convexe fermée de l’ensemble ± enn n>1 . Montrer que A est


compact, que 0 ∈ Fr(A) mais que par 0 ne passe aucun hyperplan d’appui de A.

12)
(i) Montrer que les points extrémaux de la boule unité fermée de `∞ (N) sont les suites
(xn )n∈N telles que |xn | = 1 pour tout n ∈ N.
(ii) Montrer que la boule unité fermée de c0 (N) (les suites qui tendent vers 0 à l’infini) n’a
pas de point extrémal.

13) Dans l’espace euclidien R3 soit A l’enveloppe convexe de la réunion du cercle {x3 = 0 ; x21 +
x22 − 2x2 = 0} et des deux points (0, 0, 1) et (0, 0, −1). Montrer que A est convexe compact.
Déterminer Extr(A) et constater que cet ensemble n’est pas fermé.

14) Soit A un ensemble convexe compact non vide dans Rn . Soit f : A → R une fonction continue
et convexe sur A, ce qui signifie que

f λx + (1 − λ)y 6 λf (x) + (1 − λ)f (y)
pour tous x, y ∈ A et λ ∈ [0; 1]. Montrer que le maximum de f est atteint sur Extr(A) ; en
particulier, si A est un polyèdre il suffit de tester un nombre fini de points.

15) Dans l’espace Sn (R) de dimension n(n+1)/2 des matrices symétriques réelles S = [Sij ]16i,j6n
avec Sij = Sji , déterminer les points extrémaux des ensembles convexes suivants :
• K1 formé des matrices vérifiant S > 0 (c’est-à-dire dont le spectre est inclus dans R+ ) et
tr (S) = 1 ;
• KN formé des matrices vérifiant 0 6 S 6 1 (c’est-à-dire dont le spectre est inclus dans [0, 1])
et tr (S) = N, pour N = 2, ..., n.
EXERCICES TS I.137

Soit A une matrice symétrique réelle quelconque. Que vaut min tr (AS) ?
S∈KN

16) Soit E un espace vectoriel de dimension finie p sur R. Dans E soit K un polyèdre convexe
plein défini par le système d’équations
f1 (x) > 0, f2 (x) > 0, ... fN (x) > 0,
où N > p et où les fi sont des fonctions linéaires affines sur E (i.e. de la forme fi = ϕi + αi
avec ϕi ∈ E0 et αi ∈ R). Soit a un point extrémal de K. Montrer que le nombre des indices
i ∈ {1; 2; . . . N} tels que fi (a) = 0 est supérieur ou égal à p. Autrement dit, tout sommet de d’un
polyèdre convexe dans Rp est dans l’intersection d’au moins p faces dudit polyèdre.

17) Dans l’espace Mn (R) de dimension n2 des matrices réelles [Mij ]16i,j6n , on considère l’en-
semble convexe :

C = M = [Mij ]16i,j6n ∈ Mn (R) telles que Mij > 0, ∀1 6 i, j 6 n
n
X n
X 
et Mik = Mkj = 1, ∀1 6 k 6 n. .
i=1 j=1

Les matrices de C sont appelées bistochastiques. Soit P l’ensemble des matrices de permutation,
c’est-à-dire qui ont un seul coefficient égal à 1 sur chaque ligne et sur chaque colonne, les autres
coefficients étant nuls.
(i) Montrer que P = Extr(C ).
(ii) En déduire un théorème de Birkhoff : toute matrice bistochastique est combinaison linéaire
convexes de matrices de permutations, et même d’au plus (n − 1)2 + 1 d’entre elles.

§2

1) Soit U un ouvert de C. Soit H un ensemble de fonctions holomorphes dans U tel que, pour
tout disque D fermé de rayon > 0 et contenu dans U, il existe une constante MD telle que pour
toute f ∈ H et tout z ∈ D on ait |f (z)| 6 MD .
(i) Montrer que pour tout disque D comme ci-dessus, il existe une constante M0D telle que
pour toute f ∈ H on ait |f 0 (z)| 6 M0D .
(ii) En déduire que l’ensemble H est équicontinu sur U.

2) Soit (fn ) une suite de fonctions sur positives sur un intervalle I ⊂ R (borné ou non). On
suppose que x 7→ fn (x) est croissante pour tout n > 1 et que 0 6 fn (x) 6 M, c’est-à-dire que (fn )
est uniformément bornée. Montrer que fn admet une sous-suite qui converge simplement sur I.
Si les fn sont toutes continues, la limite est-elle nécessairement continue ? En supposant la limite
continue, montrer que la convergence est uniforme sur les compacts.

3) Si k est un nombre réel > 0, on note Hk l’ensemble des fonctions définies sur [0; 1], à valeurs
réelles, telles que f (0) = 0 et qui sont k-Lipschitz, c’est-à-dire telles que
|f (x) − f (y)| 6 k|x − y|, pour tous x, y ∈ [0; 1].
[
On pose alors E = Hk et, pour f ∈ E , on note N(f ) = inf{k > 0 : f ∈ Hk }.
k>0
TS I.138 EXERCICES

(i) Justifier que E est un R-espace vectoriel et que N est une norme sur E .
(ii) Prouver que l’on a kf k∞ 6 N(f ) pour toute f ∈ E mais que k · k∞ et N ne sont pas des
normes équivalentes sur Hk .
(iii) On fixe k > 0. Discuter la compacité de Hk dans (E , k · k∞ ) et dans E , N(·) .


4) On pose, pour tout z ∈ C :


z zn
exp(z) = 1 + z + + · · · + + ...
2 n!
 z n

Montrer que exp(z) = lim 1 + en procédant comme suit.
n→∞ n
(i) Vérifier que c’est vrai pour tous les z réels > 0 en passant au logarithme.
(ii) Montrer que la suite (fn )n>0 , où fn (z) = (1 + nz )n , est bornée dans O(C).
(iii) En déduire, par le théorème de Vitali, que (fn )n>0 converge dans O(C), disons vers g.
(iv) Constater que g(z) = exp(z) car c’est vrai pour z réel > 0.

5) Soit C = C0 ([− 21 ; 12 ], R), et soit H le sous-ensemble de C formé des fonctions polynomiales


dont les coefficients sont réels et tous dans [−1, 1]. Soit H l’adhérence de H dans C .
(i) Montrer que, pour toute f ∈ H , la dérivé df dx est bornée en valeur absolue par 4 sur
1 1
[− 2 ; 2 ].
(ii) En déduire que H est équicontinu dans [− 12 ; 12 ].
(iii) Montrer que H est un sous-ensemble convexe et compact dans C .
(iv) En appliquant le théorème de Vitali, montrer que toute f ∈ H est la restriction au
segment [− 21 ; 12 ] d’une fonction holomorphe dans le disque unité ouvert de C, notée fe.
(v) Caractériser les fonctions fe où f ∈ H , par une propriété de leurs coefficients de Taylor à
l’origine.

Z 2πutiliser la formule, pour n > 0 et 0 6 r < 1, donnant ces coefficients


Indication : on pourra
1 iθ e−inθ dθ.
an , à savoir : an rn = re
g
2π 0
(vi) Déterminer l’ensemble des points extrémaux de H .

6) Soit X un sous-ensemble compact de C.


(i) Montrer que toute fonction f ∈ C (X, C) peut être approchée uniformément sur X par des
fonctions polynomiales en les variables z et z, à coefficients complexes.
(ii) Soit X le disque unité {z ∈ C : |z| 6 1}. Soit H l’adhérence dans C (X, C) de l’ensemble
des polynômes à coefficients complexes en la seule variable z. Montrer que pour toute f ∈ H on
a la formule : Z 2π
1
f (0) = f (eiθ ) dθ,
2π 0
et que, en revanche, la fonction continue f (z) = |z| ne possède pas cette propriété.
(iii) En déduire que H est différent de C (X, C).

7) [Théorème de Müntz] Soit 0 = λ0 < λ1 < · · · une suite croissante de nombres positifs.
On appelle H l’espace engendré par les xλn dans C0 ([0, 1], C). Montrer que H est dense dans
C0 ([0, 1], C) pour la norme sup si et seulement si
X 1
= +∞.
λn
Montrer le même résultat pour les fonctions sous la forme e−λn r dans C00 (R+ , C) (l’espace des
fonctions continues qui tendent vers 0 à l’infini).
EXERCICES TS I.139

8) [Partitions de l’unité] Soit X un espace topologique compact, K un compact de X et U1 , . . . , Un


est un recouvrement ouvert de K dans X. Montrer qu’il existe une famille d’applications continues
P
ϕi : X → [0, 1], i = 1, . . . , n telles que (i) ϕi |X Ui = 0, i = 1, . . . , n et (ii) 16i6n ϕi |K = 1.

§3

1) [Fonctions continues nulle-part dérivables] Montrer que l’ensemble des fonctions continues
nulle-part dérivables est dense dans C0 ([0, 1]). On pourra considérer pour tout entier n > 1,
l’ensemble
 
|f (x) − f (y)|
Un = f ∈ C0 ([0, 1]); ∀x ∈ [0, 1], ∃y tel que 0 < |x − y| < 1/n, >n .
|x − y|

2) [Caractérisations de `p par l’inégalité de Hölder] Soit 1 6 p, q 6 ∞ tels que 1/p + 1/q = 1


Montrer que l’ensemble des suites réelles x = (xn ) telles que

X
xn yn converge pour tout y = (yn ) ∈ `q (R),
n=0
p
s’identifie à ` (R). On traitera d’abord les cas (plus faciles) de p = 1 et p = ∞.

3) [Première classe de Baire] Soit f : R → R dans la première classe de Baire. Montrer que, pour
tout intervalle ouvert non vide I, il existe un sous-intervalle ouvert non vide J de I sur lequel f est
bornée.

4) [Graphe fermé et dimension] Soit E ⊂ L2 (]0, 1[) un sous espace fermé contenu dans L∞ (]0, 1[).
(i) Montrer qu’il existe une constante C > 0 telle que kf k∞ 6 Ckf k2 , pour tout f ∈ E.
(ii) En déduire que E est de dimension finie.

5) [Graphe fermé et spectre] Soit H un espace de Hilbert complexe séparable et D un sous-espace


quelconque de H . On se donne un opérateur linéaire A : D → H . On appelle
%(A) := {z ∈ C tel que A − z : D → H est inversible d’inverse borné}
ensemble résolvant de A et σ(A) := C %(A) le spectre de A. Ici “(A − z)−1 borné” signifie qu’il
existe une constante C telle que
∀x ∈ H , k(A − z)−1 xkH 6 CkxkH
(on utilise la norme de H , même si (A − z)−1 x ∈ D).
(i) Montrer que si σ(A) 6= C, alors le graphe de A doit être fermé dans H × H .
(ii) On prend
H = L2 (]0, 1[, C), D1 = C1 ([0, 1], C) et A1 f = f 0 .
(a) Montrer que le graphe de A1 n’est pas fermé et que σ(A1 ) = C.
(b) On considère le sous-espace de L2 (]0, 1[)
De1 = f ∈ C0 ([0, 1], C) : f 0 ∈ L2 (]0, 1[, C)


où f 0 est entendue au sens des distributions sur ]0, 1[, et l’opérateur B1 f = f 0 sur D
e1 . Montrer
que le graphe de B1 est fermé et que c’est la fermeture du graphe de A1 dans H × H .
(c) Déterminer le spectre de B1 .
TS I.140 EXERCICES

(iii) On prend
H = L2 (]0, 1[, C), D2 = {f ∈ C1 ([0, 1], C), f (0) = f (1)} et A2 f = f 0 .
(a) Montrer que le graphe de A2 n’est pas fermé et que σ(A2 ) = C.
(b) On considère le sous-espace de L2 (]0, 1[)
e 2 = f ∈ C0 ([0, 1], C) : f 0 ∈ L2 (]0, 1[, C), f (0) = f (1)

D

et l’opérateur B2 f = f 0 sur D
e 2 . Montrer que le graphe de B2 est fermé et que c’est la fermeture
du graphe de A2 .
(c) Montrer que D e est aussi l’espace des fonctions f ∈ C0 ([0, 1], C) dont les coefficients
R 1 2 −2iπkt
de Fourier ck (f ) = 0 f (t)e dt vérifient
X
|k|2 |ck (f )|2 < ∞
k∈2πZ

et exprimer B2 dans la base de Fourier. En déduire le spectre de B2 .

§4

1) [Densité des inversibles] Soit A une algèbre de Banach. On dit que a ∈ A est topologiquement
un diviseur de zéro (à gauche) dans A s’il existe une suite α = (αn )n>1 de A telle que α ne converge
pas vers 0 dans A mais aαn → 0.
(i) Montrer que les éléments de ∂A× (la frontière du groupe des inversibles A× de A) sont
topologiquement des diviseurs de zéro.
(ii) Soit A = L (`2 (N)) et S : A → A l’opérateur de décalage (x0 , x1 , . . . ) → (0, x0 , x1 , . . . ).
Montrer que S n’est pas dans l’adhérence de A× . Ce qui montre que A× n’est pas dense dans A.
(iii) Montrer que si A est de C-dimension finie alors A× est toujours dense dans A. (On pourra
commencer par traiter le cas A = Mn (C)).

2) [Quelques calculs de spectre]


(i) Soit χ : A → C un caractère (i.e. morphisme de C-algèbres) et a ∈ A, rappeler pourquoi
χ(a) ∈ spec(a).
(ii) Calculer le spectre de l’opérateur de décalage de l’exercice 1 (2).
(iii) Soit A := (C (S1 , C), k · k∞ ) où S1 est le cercle unité, et D = {|z| ≤ 1} est le disque unité
fermé. Soit également B ⊂ A la sous-C-algèbre de A constituée des fonctions qui s’étendent en des
fonctions continues sur D, holomorphes sur D = {|z| < 1}.
Calculer le spectre de f (z) = z dans A puis dans B.
(iv) Soit A = `1 (Z), que l’on munit du produit de convolution (x ∗ y)n = p+q=n xp yq et de
P
P
la norme kxk1 = n>0 |xn |.
(a) On note en la fonction qui vaut 1 en n et 0 partout ailleurs. Calculer en ∗ em et e−1 n .
∗n
P
Vérifier que tout x ∈ A est limite de −N6n6N xn (e1 ) .
(b) Calculer le spectre de e1 .
(c) Même question mais en considérant e1 comme un élément de la sous-algèbre de
Banach fermée B = `1 (N) ⊂ A.
EXERCICES TS I.141

3) [Idéaux fermés de C (X, C)] Soit (X, d) un espace métrique compact et A = (C (X, C), k · k∞ )
l’algèbre de Banach commutative unitaire des fonctions continues sur X munie de la norme sup.
Pour x ∈ X on note ex : A → C ∈ A 0 l’évaluation en x. Pour toute partie Y ⊂ X et B ⊂ A on
note
\ \
I(Y) := Ker(ey ) ⊂ A , V(B) := b−1 (0)
y∈Y b∈B

(i) Vérifier que I(Y) est un idéal fermé de A et que I(Y) = I(Y) et que V(B) est un
sous-ensemble compact de X et V(B) = V(hBi), où hBi désigne le sous-idéal de A engendré par B.

On note I (A ) l’ensemble des idéaux fermés de A et F (X) l’ensemble des parties fermées de X.
On dispose donc de deux applications qui inversent l’inclusion :
V I
I (A ) → F (X), F (X) → I (A )
et telles que V ◦ I(F) ⊃ F, I ◦ V(J) ⊃ J.

(ii) Soit J ∈ I (A) et pour tout entier n > 1,


 
1
V(J)n := x ∈ X | d(x, V(J)) <
n
(a) Montrer qu’il existe an ∈ J qui est strictement positive sur X V(J)n .
(b) En déduire que I(V(J)n ) ⊂ J puis que I(V(J)) = J.
(c) En déduire que V et I sont inverses l’une de l’autre. Quels sont les idéaux maximaux
fermés de A ? Quel est le spectre de Gelfand de A ?

4) [Un critère de commutativité] Soit A une algèbre de Banach unitaire. Pour a ∈ A, on note
%(a) le rayon spectral.
(i) Montrer que s’il existe N > 0 tel que Nkak2 6 ka2 k, a ∈ A alors Nkak 6 %(a), a ∈ A.
(ii) Soit a, b ∈ A et supposons qu’il existe M > 0 tel que k exp(λa)b exp(−λa)k 6 M, λ ∈ C.
Montrer que ab = ba.
(iii) En déduire que si s’il existe N > 0 tel que Nkak2 6 ka2 k pour tout a ∈ A alors A est
commutative.

5) [Fonction exponentielle] Soit A une algèbre de Banach avec unité et


X xn
exp(x) := .
n!
n>0

(i) Montrer que si x et y commutent (c’est-à-dire xy = yx), alors c exp(x+y) = exp(x) exp(y).
(ii) Montrer la formule de Trotter
 x  y n
exp(x + y) = lim exp exp .
n→∞ n n
(iii) On prend A = M2 (C) et
   
0 1 0 0
x= , y= .
0 0 1 0
Calculer exp(x), exp(y), exp(x + y) et constater que exp(x) exp(y) 6= exp(x + y).
(iv) Soient A = A et B = B∗ deux matrices hermitiennes de taille n. Montrer que
 
det exp(A + B) = det exp(A) exp(B) .
TS I.142 EXERCICES

(v) (a) Soient A1 , A2 ∈ Mn (C) deux matrices de taille n (pas forcément hermi-
tiennes). Montrer que
q q
|tr (A1 A2 )| 6 tr (A∗1 A1 ) tr (A∗2 A2 ).

(b) Montrer par récurrence que pour p = 2k et A1 , ..., Ap ∈ Mn (C), on a


 p
 p1  p
 p1
|tr (A1 A2 · · · Ap )| 6 tr (A∗1 A1 ) 2 · · · tr (A∗p Ap ) 2 .

(c) En prenant Aj = AB avec maintenant A = A∗ et B = B∗ , en déduire que


p
tr (AB)p 6 tr (A2 B2 ) 2

puis par une nouvelle récurrence sur p que

tr (AB)p 6 tr (Ap Bp ).

(d) En utilisant la formule de Trotter, en déduire l’inégalité de Golden-Thompson

tr eA+B 6 tr eA eB ,
 

pour toutes matrices hermitiennes A, B ∈ Mn (C).

6) Soit A l’algèbre des sommes de séries de Taylor absolument convergentes f = f (z) =


P n
P∞
n>0 an z , munie de la norme kf k = n=0 |an | < +∞.
(i) Montrer que les caractères de A sont exactement les χz0 : f 7→ f (z0 ) où z0 ∈ C avec
|z0 | 6 1. Ceci permet d’identifier A
b au disque unité fermé de rayon 1 de C.
(ii) Montrer que si f ∈ A n’est jamais nulle sur ce disque, alors il existe des nombres complexes
bn tels que

1 X X
= bn z n et |bn | < +∞.
f (z) n=0
n>0

(iii) Soient f1 , f2 , . . . , fp des fonctions appartenant à A et n’ayant aucun zéro commun dans
Pp
{z ∈ C : |z| 6 1}. Montrer qu’il existe g1 , g2 , . . . , gp ∈ A telles que i=1 fi gi = 1.

§5

1) Soit S l’opérateur de décalage défini sur `2 (N) par S(x) = (0, x0 , x1 , ...). On a déjà vu que le
spectre de S est le disque unité fermé de C. Montrer que S n’a pas de valeur propre et que le cercle
unité est l’ensemble des valeurs propres généralisées de S.

2) Soit 1 6 p 6 +∞ et l’espace de Banach E = `p (Z). Soit a = (an )n∈Z une suite bornée de
nombres complexes et T l’opérateur défini par (xn ) 7→ (yn ) avec yn = an xn pour tout n ∈ Z.
(i) Montrer que T est borné. Quelle est sa norme ?
(ii) Montrer que T est compact si et seulement si |an | → 0.

3)
EXERCICES TS I.143

(i) Soit (an )n∈N une suite de nombres réels strictement positifs tels que an → +∞ et soit H
l’espace de Hilbert composé des suites x = (xn )n>0 telles que
X
kxk2H = an |xn |2 < ∞.
n>0

Montrer que H ⊂ ` (N) et que l’injection est compacte.


2

(ii) Soit V : [0, +∞[→]0, +∞[ une fonction continue strictement positive telle que V(x) → +∞
quand x → +∞. Soit V l’espace de Hilbert composé des fonctions f ∈ L1loc (]0, +∞[) telles que
Z ∞
kf k2V = V(x)|f (x)|2 dx < ∞.
0

Montrer que V ⊂ L (R+ ). L’injection est-elle compacte ?


2

4) Soit Ω un ouvert borné de Rd . Rappeler pourquoi on a l’injection continue Lp (Ω) ⊂ Lq (Ω)


lorsque 1 6 q 6 p 6 ∞. Cette injection est-elle compacte ?

5) Soit T : E → F un opérateur compact, avec E et F des espaces de Banach. Montrer que l’image
de T est fermée si et seulement si T est de rang fini.

6) Soit E un espace de Banach et T : E → E un opérateur compact.


(i) Montrer que le noyau de l’opérateur Id − T est de dimension finie.
(ii) Montrer qu’il existe un sous-espace fermé F ⊂ E tel que E = F ⊕ Ker(Id − T).
(iii) Montrer qu’il existe c > 0 tel que k(Id − T)(x)k ≥ ckxk pour tout x ∈ F. En déduire que
l’image de Id − T est fermée.
(iv) Soit M un sous-espace de E tel que M ( E. Montrer que pour tout ε > 0, il existe x ∈ E
tel que kxk = 1 et d(x, M) ≥ 1 − ε.
(v) En déduire que l’image de Id − T est de codimension finie dans E.

7) Soit E = C ([0; 1], C) (muni de la norme sup) et K(x, y) = min{x; y}. Si f ∈ E, on pose :
Z 1 Z x Z 1
(Tf )(x) = K(x, y)f (y) dy = f (y)y dy + x f (y) dy.
0 0 x
(i) Montrer que T est un opérateur continu sur E et calculer sa norme.
(ii) Montrer que pour tout f ∈ E, g = Tf est de classe C2 sur [0; 1], que g 00 (x) = −f (x), et
que g(0) = 0 et g 0 (1) = 0. En d’autres termes,
Im (T) ⊂ F := g ∈ C 2 ([0; 1], C) : g(0) = 0, g 0 (1) = 0 .


En déduire que 0 ∈ σ(T). Quelle est l’interprétation de T ?


(iii) Montrer que T établit une bijection de E sur F. Préciser l’application T−1 : F → E.
(iv) Montrer que T : E → E est compact, mais que T : E → F n’est pas compact (F est un
Banach lorsqu’il est muni de la norme de C 2 ([0, 1], C)).
(v) On considère le produit scalaire :
Z 1
(f |g) = f (x)g(x) dx.
0
Montrer que (Tf |g) = (f |Tg) pour tous f, g ∈ E et en déduire que les valeurs propres de T dans
E sont réelles positives.
(vi) Montrer que les valeurs propres de T sont les nombres λn = ( π2 + nπ)−2 pour n entier
> 0. Déterminer le sous-espace vectoriel Vλn = Ker(T − λn idE ).
(vii) En déduire que kTk ∈/ σ(T).
(viii) Étudier le même opérateur sur l’espace de Hilbert H = L2 (]0, 1[).
TS I.144 EXERCICES

8) [Opérateurs Hilbert-Schmidt] On introduit une sous-algèbre particulière de L (H) où H est un


espace de Hilbert séparable quelconque.
1. Soit A un opérateur borné sur H. Soient (en ) et (fn ) deux bases orthonormées quelconques de
H. Montrer l’égalité
X X X
(1) kAen k2 = |hfm , Aen i|2 = kA∗ fm k2 ,
n>1 n,m>1 m>1

où les termes peuvent être finis ou infinis. En déduire en particulier que


X X
kAen k2 = kAfm k2 .
n>1 m>1

On appelle S2 (H) l’ensemble des opérateurs A ∈ L (H) tels que les séries (1) sont finies (appelés
opérateurs Hilbert-Schmidt), et on note kAk2S2 (H) := n>1 kAen k2 la norme associée.
P

2. Montrer que si A ∈ S2 (H), alors A est compact.


3. Si A ∈ S2 (H), on appelle µn (A) les valeurs singulières de A (qui sont les racines des valeurs
propres de l’opérateur auto-adjoint compact A∗ A). Montrer que
X
kAk2S2 (H) = µn (A)2 .
n>1

En déduire que
kAk 6 kAkS2 (H) .

4. Montrer que si A ∈ S2 (H) et B ∈ L (H) alors AB ∈ S2 (H) et BA ∈ S2 (H), avec


kABkS2 (H) 6 kAkS2 (H) kBk, kBAkS2 (H) 6 kAkS2 (H) kBk.
En déduire que S2 (H) est un idéal bilatère de L (H).
5. Montrer que k·kS2 (H) est une norme et que S2 (H) est une algèbre de Banach.
6. On suppose que H = L2 (M, dµ) pour M ⊂ Rd où µ est une mesure quelconque sur M. Montrer
que A ∈ S2 (H) si et seulement s’il existe une fonction a ∈ L2 (M × M, dµ⊗2 ) telle que
Z
(Af )(x) = a(x, y)f (y) dµ(y)
M
2
pour tout f ∈ L (M, dµ). Montrer aussi que
Z Z
2
kAkS2 (H) = |a(x, y)|2 dµ(x) dµ(y).
M M

La fonction a est appelée noyau de l’opérateur Hilbert-Schmidt A.

9) [Opérateurs à trace] On définit ici une autre sous-algèbre S1 (H) de L (H) et la trace sur cette
algèbre. Ceci permettra en particulier de voir que l’algèbre S2 (H) construite à l’exercice précédent
est en fait un espace de Hilbert.
1. Soit A = A∗ > 0 un opérateur compact auto-adjoint positif sur H. On appelle
X
tr (A) := hen , Aen i
n>1

la trace de A, où (en ) est une base orthonormée quelconque de H (la trace peut être finie ou infinie).
Vérifier que cette définition ne dépend pas de la base choisie et donner une expression en fonction
des valeurs propres de A.
EXERCICES TS I.145

On appelle S1 (H) l’ensemble des opérateurs compacts A (non√nécessairement auto-adjoints)


tels que kAkS1 (H) := tr (|A|) est fini, où on rappelle que |A| = A∗ A. De tels A sont appelés
opérateurs à trace.
2. Exprimer tr (|A|) en fonction des valeurs singulières de A. Montrer que S1 (H) ⊂ S2 (H) avec
kAkS2 (H) 6 kAkS1 (H) .
Montrer aussi que A ∈ S (H) équivaut à A∗ ∈ S1 (H) et que kAkS1 (H) = kA∗ kS1 (H) .
1

3. Soit A un opérateur compact quelconque. Montrer que


 
X 
(2) tr (|A|) = inf kAen k
(en ) base  
orthonormée n>1

et que
 
X 
(3) tr (|A|) = sup |hfn , Aen i| .
(en ), (fn ) 
n>1

systèmes orthonormés

Dans cette dernière inégalité, les en et fn peuvent être en nombre fini ou infini.
4. Montrer que si A ∈ S1 (H), alors la série
X
tr (A) := hen , Aen i
n>1

converge absolument pour toute base orthonormée (en ) et ne dépend pas de la base choisie. Montrer
également que
tr (A) 6 tr (|A|),
c’est-à-dire que la trace A ∈ S1 (H) 7→ tr (A) est une forme linéaire continue.
5. Soit A l’opérateur de multiplication
√ par la fonction a(t) = t sur H = L2 (] − 1, 1[). Calculer
iπnt
hen , Aen i où en (t) = e / 2 est la base de Fourier et en déduire que
X
|hen , Aen i| < ∞,
n
1
mais que A ∈
/ S (H).
6. Montrer que si A, B ∈ S2 (H), alors AB et BA appartiennent à S1 (H ), avec
kABkS1 6 kAkS2 (H) kBkS2 (H) , kBAkS1 6 kAkS2 (H) kBkS2 (H) .
Montrer aussi que
tr (AB) = tr (BA).
2
En déduire que S (H) est un espace de Hilbert, lorsqu’il est muni du produit scalaire hA, BiS2 :=
tr (A∗ B).
7. Montrer que si A ∈ S1 (H) et B ∈ L (H), alors AB et BA appartiennent à S1 (H ), avec
kABkS1 (H) 6 kAkS1 (H) kBk, kBAkS1 (H) 6 kAkS1 (H) kBk,
c’est-à-dire que S1 (H) est un idéal bilatère de L (H). Montrer ensuite que
tr (AB) = tr (BA).

8. Montrer que k · kS1 (H) est une norme, et que S1 (H) est une algèbre de Banach.
9. Montrer que K (H )0 ' S1 (H ), que S1 (H )0 ' L (H ) et que S2 (H )0 ' S2 (H ) (ici K (H )
est l’algèbre des opérateurs compacts et L (H ) celle des opérateurs continus).
TS I.146 EXERCICES

10. Soit (An ) une suite bornée dans S1 . Montrer qu’il existe une sous-suite telle que tr (Ank K) →
tr (AK) pour tout K compact.

10) [Quelques opérateurs compacts] On se place dans H = L2 (Rd ) et on note f (−i∇) l’opérateur
qui consiste à multiplier par la fonction f (k) en Fourier, c’est-à-dire
 
f (−i∇)u = F −1 f (k)b u(k) .

Ici on utilise la convention Z


1
fb(k) = f (x)e−ik·x dx
(2π)d/2 Rd
pour la transformée de Fourier.
(i) Montrer que si f ∈ L∞ (Rd ), alors f (−i∇) est un opérateur borné vérifiant kf (−i∇)k 6
kf kL∞ (Rd ) .
(ii) On suppose que f, g ∈ L2 (Rd ). Montrer que les opérateurs g(x)f (−i∇) et f (−i∇)g(x)
sont compacts, avec
kf kL2 (Rd ) kgkL2 (Rd )
kg(x)f (−i∇)kS2 = kf (−i∇)g(x)kS2 = .
(2π)d/2
(iii) On suppose que f, g ∈ L∞ (Rd ) et tendent vers 0 à l’infini. Montrer que g(x)f (−i∇) et
f (−i∇)g(x) sont des opérateurs compacts.
(iv) Soit fn une suite de L2 (Rd ) telle que fn * f faiblement dans L2 (Rd ) et
Z Z
2
|∇fn (x)| dx = |k|2 |fc 2
n (k)| dk 6 C.
Rd Rd

Montrer que fn 1Ω → f 1Ω fortement dans L2 (Ω), pour tout ouvert borné Ω ⊂ Rd (théorème de
Rellich).

11) [Paires de projecteurs] Soient P et Q deux projecteurs orthogonaux (de rang quelconque,
possiblement infini), sur un espace de Hilbert H . C’est-à-dire on a P = P∗ = P2 et Q = Q∗ = Q2 .
On pose
A=P−Q et B = 1 − P − Q.
Dans tout l’exercice on suppose que A est un opérateur compact.
(i) Montrer que A2 + B2 = 1 et que AB + BA = 0.
(ii) Montrer que σ(A) ⊂ [−1, 1].
(iii) Montrer que Ker(A − 1) = Ker(Q) ∩ Ker(1 − P) et que Ker(A + 1) = Ker(1 − Q) ∩ Ker(P).
En déduire que A peut s’écrire
A = Π+ − Π− + P0 − Q0
où Π± sont des projecteurs orthogonaux de rang fini et P0 , Q0 sont des nouveaux projecteurs
orthogonaux tels que kP0 − Q0 k < 1.
(iv) On suppose ici que kAk = kP − Qk < 1.
(a) Montrer que B est inversible.
(b) On admet que√B peut s’écrire sous la forme B = |B|U (décomposition polaire), où
• |B| = 1 − A2 est inversible et commute avec A et B ;
• U est unitaire et commute avec A et B ;
(le montrer en exercice pour un opérateur compact). Montrer que U∗ AU = −A et que U∗ BU =
B.
(c) Déduire que le spectre de A est symétrique par rapport à 0, et que U∗ PU = Q,

U QU = P.
EXERCICES TS I.147

(v) Quelle est la forme du spectre de l’opérateur compact A = P − Q lorsque P et Q sont


quelconques ?
(vi) On pose Ind(P, Q) = dim Ker(A − 1) − dim Ker(A + 1) (indice de Fredholm d’une paire
de projecteurs orthogonaux). Montrer que si P − Q et Q − R sont de rang fini,

(4) Ind(P, R) = Ind(P, Q) + Ind(Q, R).

(vii) Cette formule est en fait vraie pour tous P, Q, R tels que P − Q et Q − R sont compacts.
Quelles conséquences peut-on en tirer ?

12) [Krein-Rutman dans le cas auto-adjoint] Soit A = A∗ un opérateur Hilbert-Schmidt auto-


adjoint sur H = L2 (Ω) (Exercice 8), où Ω est un ouvert quelconque de Rd . On note a(x, y) =
a(x, y) = a(x, y) ∈ L2 (Ω2 ) le noyau intégral de A que l’on suppose réel et strictement posi-
tif. Ceci signifie que pour tout x, y ∈ Ω et tout ε > 0, il existe c > 0 tel que a(x0 , y 0 ) >
c1B(x,ε)∩Ω (x0 )1B(y,ε)∩Ω (y 0 ), presque partout. L’objectif est de montrer que kAk est une valeur
propre simple dont l’unique fonction propre est strictement positive.
(i) Soit f > 0 une fonction positive non nulle. Montrer que Af > 0.
(ii) Montrer que si Af = λf alors AR(f ) = λR(f ) et AI(f ) = λI(f ).
(iii) Rappeler pourquoi σ(A) ∩ {±kAk} = 6 ∅.
(iv) Rappeler pourquoi
Z Z
kAk = sup f (x)f (y)a(x, y) dx dy .
R f ∈H Ω Ω

|f |2 =1

Soit f à valeurs réelles non nulle, telle que Af = τ kAkf avec τ = ±1. Montrer que A|f | = kAk |f |,
que f = ±|f | et que |f | > 0. Conclure en particulier que −kAk ∈ / σ(A).
Indice : on pourra écrire f = f+ − f− où f+ = max(f, 0).
(v) Montrer que la valeur propre kAk est simple.
(vi) Soit h > 0 une fonction positive non nulle quelconque dans L2 (Ω). Calculer la limite
1
lim h, AN h N
.
N→∞

13) [Régularité des valeurs propres] Soit A une application continue d’un ouvert Ω ⊂ Rd dans
L (H ), telle que A(x) est auto-adjoint compact pour tout x.
(i) On appelle λ(x) la plus grande valeur propre de A(x). Montrer que

|λ(x) − λ(x0 )| 6 kA(x) − A(x0 )k

et en déduire que λ est une fonction continue.


(ii) Si x 7→ A(x) est C1 , est-ce que λ est forcément de classe C1 ?
(iii) On rappelle que la plus grande valeur propre µ(x) inférieure à λ(x) est donnée par la
formule de Courant-Fischer
µ(x) = sup inf hv, A(x)vi.
V⊂H v∈V
dim(V)=2 kvk=1

On a par ailleurs µ(x) = λ(x) si λ(x) est de multiplicité > 2. Montrer que µ(x) est également une
fonction continue.
(iv) On suppose que λ(x0 ) est simple. En déduire que λ(x) reste simple sur un voisinage de
x0 .
TS I.148 EXERCICES

(v) Soit C le cercle dans le plan complexe centré en λ(x0 ) et de rayon (λ(x0 ) − µ(x0 ))/2.
Calculer I
1 −1
z z − A(x) dz
2iπ
pour x assez proche de x0 . Soit en une base orthonormée quelconque de H . En déduire que
I D
1 X −1 E
λ(x) = z en , z − A(x) en dz.
2iπ n H

(vi) Montrer que si x 7→ A(x) est C∞ (resp. analytique réelle) alors λ est aussi C∞ (resp.
analytique réelle) au voisinage de x0 .

14) [Absence de transitions de phases en 1D] N’importe quel matériau est soumis à des transitions
de phase lorsque la température et la pression varient. Nous sommes par exemple habitués à ce
que l’eau se transforme en glace à 0 C et s’évapore à 100 C, dans les conditions normales de
pression. Ces changements de phase ont lieu pour des valeurs particulières de la température et de
la pression, que l’on peut représenter par des courbes dans le plan (T, P), appelé diagramme de
phase. En dehors de ces courbes, les observables du système sont toutes des fonctions très lisses de
T et P.
Il est assez surprenant que les transitions de phase sont un phénomène typique de la dimension
3 (pour les potentiels d’interaction à courte portée). Nous allons démontrer ici un théorème de 1950
dû à Van Hove (dans un cas simplifié), qui précise que l’enthalpie libre est une fonction analytique
réelle pour un système unidimensionnel. Ainsi, il n’y a pas de transitions de phase usuelles en
dimension 1. Un résultat similaire (quoique plus faible) a été démontré par Mermin et Wagner
pour la dimension 2.
On considère donc N particules classiques qui interagissent par l’intermédiaire d’un potentiel
w. On suppose que

= +∞

 si |x| < R1
w(|x|) ∈ (−C, C) si R1 6 |x| 6 R2

si |x| > R .

= 0
2

Le lecteur peut penser à une fonction continue sur [R1 , R2 ] qui admet une limite en R+ 1 et qui

tend vers 0 en R2 . L’hypothèse que w est infini pour |x| < R1 sert à assurer que les particules ne
sont jamais trop proches les unes des autres (on parle de cœur dur). L’énergie de N + 1 particules
localisées en x0 , ..., xN ∈ R est donnée par
X X N
X
w(|xj − xk |) = w(|xj − xk |) + w(|xj − x0 |).
06j<k6N 16j<k6N j=1

Comme cette énergie est invariante par translation, on va supposer pour simplifier que 0 = x0 6
x1 6 · · · 6 xN . On place les particules dans un segment de taille L > NR1 , c’est-à-dire on ajoute
la contrainte que xN 6 L. À température T = 1/β > 0, l’état du système est décrit par la mesure
de Gibbs
 
X XN
µβ,L,N (x1 , ..., xN ) = Z(β, L, N)−1 exp −β w(xk − xj ) − β w(xj )
16j<k6N j=1


Z L Z xN Z x2 P PN
Z(β, L, N) = dxN dxN−1 · · · dx1 e−β 16j<k6N w(xk −xj )−β j=1 w(xj )
0 0 0
EXERCICES TS I.149

est un facteur de normalisation, appelé fonction de partition. À cause du cœur dur, la mesure
µβ,L,N est à support dans l’ensemble des (x1 , ..., xN ) tels que xj > R1 + xj−1 . Par contre Z(β, L, N)
fait sens pour tout L et s’annule juste quand L 6 NR1 .
Dans l’ensemble isotherme-isobare, nous devons considérer la transformée de Laplace de
Z(β, L, N) par rapport à L Z ∞
∆(β, p, N) = e−pL Z(β, L, N) dL,
0
où p est la pression. Le but est d’étudier la limite
log ∆(β, p, N)
δ(β, p) = lim
N→∞ N
et sa régularité en β, p.
(i) On suppose que R2 < 2R1 , de sorte que chaque particule n’interagit qu’avec ses plus
proches voisins. Calculer ∆(β, p, N) et la limite δ(β, p), puis conclure que cette dernière est une
fonction analytique réelle sur le quart de plan {β > 0, p > 0}. On introduira les nouvelles variables
y1 = x1 , y2 = x2 − x1 ,..., yN = xN − xN−1 .
(ii) On introduit la fonction
 
β β px py
aβp (x, y) = exp −βw(x + y) − w(x) − w(y) − −
2 2 2 2
et l’opérateur Aβ,p dont le noyau est égal à aβ,p (x, y), sur H = L2 (]R1 , ∞[). Montrer que Aβ,p est
auto-adjoint et Hilbert-Schmidt.
(iii) On suppose maintenant que R2 < 3R1 de sorte que chaque particule n’interagit qu’avec
son plus proche voisin et le suivant (à sa droite et sa gauche). On pose également
 
w(x) x
hβ,p (x) = exp −β −p
2 2
qui est dans L2 (R1 , ∞). Montrer que
1D N E
∆(β, p, N) = hβ,p , Aβ,p hβ,p .
p
En utilisant l’exercice 12, montrer que
log ∆(β, p, N)
lim = log kAβ,p k.
N→∞ N
(iv) En utilisant maintenant l’exercice 13, montrer que (β, p) 7→ log kAβ,p k est analytique
réelle sur le quart de plan {β > 0, p > 0}.

Référence : Léon van Hove. Sur l’intégrale de configuration pour les systèmes de particules à une dimension.
Physica, 1950, 16, 137-143

Vous aimerez peut-être aussi