Théorie physique des distributions/Introduction des distributions

Début de la boite de navigation du chapitre

Ce deuxième chapitre introduit la notion de distribution tout en justifiant les motivations qui sont à l'origine de cette introduction.

Introduction des distributions
Icône de la faculté
Chapitre no 2
Leçon : Théorie physique des distributions
Chap. préc. :Espaces fondamentaux
Chap. suiv. :Dérivation

Exercices :

Espaces des distributions
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Théorie physique des distributions : Introduction des distributions
Théorie physique des distributions/Introduction des distributions
 », n'a pu être restituée correctement ci-dessus.

Position du problème

modifier

Soit ℘ l’ensemble des fonctions physiques. Ces fonctions sont censées représenter la plupart des fonctions que l’on rencontre en physique. Si l’on considère, par exemple, les circuits électriques, nous savons que l’on peut décrire le comportement d'une tension ou d'un courant dans une partie d'un circuit électrique par une équation différentielle. En fait, des considérations sur le circuit électrique amènent à établir une équation différentielle dont la résolution est censée nous donner toutes les possibilités d'évolution de la tension ou du courant considéré. En réalité, on se heurte ici à un problème que nous allons exposer :

Les équations différentielles, que l’on établit dans un circuit électrique, sont la plupart du temps, pour les circuits les plus simples, des équations du premier ordre ou du second ordre. Ce qui entraîne que les fonctions, solutions de ces équations, admettent respectivement une dérivée première ou une dérivée seconde. Nous savons pourtant que les intensités dans les condensateurs ou les tensions aux bornes des bobines peuvent être discontinues et, par conséquent, sont des fonctions non dérivables en certains points. Nous sommes donc amenés à penser que les équations différentielles, qui décrivent un circuit, ne nous permettent de trouver que les fonctions qui sont dérivables et passent sous silence toutes les fonctions qui ne le sont pas.

En fait, ce que l’on reproche à l’ensemble ℘, c’est de contenir des fonctions qui ne sont pas dérivables, car ces fonctions ne peuvent pas être solutions d'une équation différentielle. Si nous réfléchissons à ce problème, nous ne pouvons pas nous empêcher de penser que, dans l'évolution historique des mathématiques, nous nous sommes déjà trouvés dans des situations similaires. Par exemple, certaines équations numériques ne pouvaient pas être résolues parce que, dans l’ensemble des nombres réels, les nombres négatifs n'ont pas de racine carrée. Nous savons que ce problème a été résolu en introduisant un ensemble plus vaste que l’ensemble des nombres réels et dont un de ses sous-ensembles pouvait être identifié à l’ensemble des nombres réels. Cet ensemble, que l’on a nommé ensemble des nombres complexes, permettait aux nombres négatifs d’avoir des racines carrées en dehors de ℝ et permettait ainsi de résoudre des équations qui n'avaient pas, jusqu'alors, de solutions.

Pour en revenir à notre ensemble ℘, le problème qui se pose est donc le suivant : Cet ensemble contient des fonctions qui ne sont pas dérivables. Ne peut-on pas définir un ensemble plus vaste dont une partie pourrait être identifiée à ℘ et qui permettrait de rendre toutes les fonctions de ℘ dérivables, quitte à ce que ses dérivées soient en dehors de ℘ ?

Résolution du problème

modifier

On rappelle qu'une application linéaire d'un espace vectoriel dans l’ensemble des nombres réels est appelée forme linéaire.

On rappelle aussi que l’ensemble des formes linéaires sur un espace vectoriel V, est un espace vectoriel que l’on notera V'. V' est appelé dual de V.

Si u est un vecteur de V et f une forme linéaire de V'. Plutôt que de désigner par f(u) l'image du u par f, on préférera utiliser le crochet de dualité en posant :

 .

Début d’un théorème
Fin du théorème

Nous avons défini au chapitre précédent trois espaces vectoriels  ,  ,  ,

vérifiant :

 

D'après le théorème précédent, nous aurons donc :

«   ».


Nous voyons que   est le plus grand dual au sens de l'inclusion. C'est donc lui que nous choisirons pour résoudre le problème, exposé dans le paragraphe précédent. Nous poserons donc la définition suivante :


Il nous reste à vérifier que cet espace répond bien à ce que l’on attendait. Nous devons donc vérifier deux choses :

  • d’abord qu’il existe bien un isomorphisme de l'espace ℘ des fonctions physiques vers un sous-espace P des distributions  ;
  • ensuite, il faut définir une dérivation dans   telle que les distributions dans P soient toutes dérivables et prolongent bien la dérivation dans ℘.

Nous réservons le chapitre suivant au deuxième point et nous nous contenterons, dans la fin de ce chapitre, de vérifier le premier point.

Morphisme injectif de ℘ dans l’ensemble des distributions

modifier

Soit ψ une fonction de ℘ dans   ainsi défini :

Soit p une fonction physique de ℘. L'image de p par ψ sera la forme linéaire Tp de   qui a tout φ de   associe le réel :

 

L'intégrale précédente est bien définie puisque φ est à support compact.

 

Pour simplifier l'écriture, nous avons noté Tp la forme linéaire (distribution) qui est l'image de p par ψ. Toutes les distributions ne pourront pas se noter ainsi car nous verrons qu’il existe dans   des distributions (forme linéaire) qui n'ont pas d'antécédent par ψ. Ces distributions seront alors la plupart du temps notée simplement T.

Parmi les distributions de  , celles qui ont un antécédent par ψ seront appelées distributions régulières.

Montrons que la fonction ψ est bien un morphisme injectif de ℘ dans  .


Nous devons montrer, tout d’abord, que : ∀ p, q ∈ ℘, ψ(p + q) = ψ(p) + ψ(q)

Calculons ψ(p + q) : L'image par ψ de p+q est la forme linéaire qui a toute fonction φ de   associe le réel :

 

Qui peut s'écrire par linéarité de l'intégrale :

 

Où l’on voit apparaître la somme des images de la forme linéaire, image de p par ψ avec la forme linéaire image de q par ψ.

On a donc bien : ∀ p, q ∈ ℘, ψ(p + q) = ψ(p) + ψ(q)


Nous devons montrer ensuite que : ∀ p ∈ ℘, ∀ λ ∈ ℝ, ψ(λp) = λψ(p)

Calculons ψ(λp) : L'image par ψ de λp est la forme linéaire qui a toute fonction φ de   associe le réel :

 

Qui peut s'écrire par linéarité de l'intégrale :

 

Où l’on voit apparaître le produit du scalaire λ par l'image de la forme linéaire, image de p par ψ.

On a donc bien : ∀ p ∈ ℘, ∀ λ ∈ ℝ, ψ(λp) = λψ(p)


Montrons ensuite que ψ est injective. Pour cela, nous devons montrer que, si pour deux fonctions physiques p et q, nous avons ψ(p) = ψ(q), alors nous avons nécessairement p = q.

Nous voyons que cela revient à montrer que :

 

Nous admettrons ce résultat qui est un peu fastidieux à démontrer.


notons au passage que ce résultat est faux dans la théorie des distributions générales où l’on ne se limite pas aux fonctions physiques. Pour les connaisseurs, on devra remplacer « p = q » par « p diffère de q sur un ensemble de mesure nulle ».

C'est d'ailleurs là, le principal intérêt d’avoir introduit l'espace physique des fonctions continues à droite en tout point. Pour d'autres ensembles de fonctions, le morphisme ψ n'aurait pas été injectif. Si nous étions parti de l’ensemble des fonctions continues sur ℝ, ψ aurait aussi été injectif, mais cet ensemble aurait été moins satisfaisant, car ne rendant pas compte des discontinuités que l’on peut observer en physique.


Soit maintenant P l'espace image par ψ de l'espace vectoriel ℘ des fonctions physiques. D'après ce qui précède, nous voyons que ψ est un isomorphisme de ℘ dans P. Nous pouvons donc identifier ℘ à P et nous dirons, par abus de langage, que l’ensemble des fonctions physiques est un sous-espace vectoriel des distributions. Nous pourrons donc parler indifféremment de fonctions ou de distributions lorsque nous envisagerons un élément de P.

Nous rappelons qu'une distribution de P sera dite régulière. P est le sous-ensemble des distributions régulières de  .

Toujours par abus de langage, comme la valeur en un point d'une fonction f se note f(x), on pourra rencontrer pour les distributions non régulières la notation T(x) qui, bien sûr, n'a aucun sens et ne sert qu’à rappeler le type de variable sur lequel on travaille. Ce sera souvent le cas pour la distribution de Dirac (définie plus loin) que l’on notera quelquefois δ(x) ou δ(t) si la variable est le temps.


Nous voyons que nous avons réalisé pour ℘ et   une démarche similaire à celle qui avait été réalisée avec les ensembles des nombres réels et des nombres complexes.

Distributions à support compact

modifier

Dans un paragraphe précédent, nous avons nommé l’ensemble   comme étant l’ensemble des distributions à support compact. Dans ce paragraphe, nous allons donner une définition équivalente en se basant sur l'espace   et les fonctions-test de   pour mieux expliciter ce que l’on entends par distribution à support compact. Nous admettrons que le sous-espace de   obtenu coïncide avec le sous-espace  .

nous définirons, tout d’abord, le support d'une fonction-test.


On définira une distribution à support compact de   ainsi :


F étant fermé et borné par [a;b] sera, par conséquent, un ensemble compact. Ceci justifie l'appellation de distribution à support compact.


On démontre et nous admettrons que le sous-espace des fonctions à support compact de   résultant de la définition ci-dessus coïncide avec  .


Opérateur de translation

modifier

Pour une simple fonction, si l’on souhaite faire une translation de sa courbe représentative dans un repère, d'une valeur a, nous savons qu’il nous suffit d'enlever la valeur a, à sa variable x. Autrement dit, si une fonction est définie par :

 

La translatée de la valeur a sera défini par :

 

Si a est positif, la courbe représentative sera translatée vers la droite. Si a est négatif, la courbe représentative sera translatée vers la gauche.

Par commodité d'écriture, nous pouvons définir un opérateur de translation que l’on notera τa et nous noterons τa.f la fonction qui a pour courbe représentative, la translatée de la courbe représentative de f, de la valeur a.

On peut donc écrire :

 


Nous nous proposons de généraliser à une distribution T, l'opérateur de translation et de donner un sens à τa.T.

Commençons donc par les distributions régulières.

Soit f une fonction physique et soit Tf, la distribution régulière associée. Essayons alors d'exprimer la distribution régulière Tτa.f associé à τa.f. On a :

 

Nous pouvons faire un changement de variable en posant y = x- a, on obtient :

 

Nous généraliserons donc l'opérateur de translation aux distributions ainsi :


Suite de distributions et convergence au sens des distributions

modifier

Lorsque l’on étudie les fonctions, nous sommes amené à définir des suites de fonctions. Ces suites de fonctions étant définis, nous nous posons la question de savoir si celles-ci convergent vers une fonction limite. Nous définissons même plusieurs types de convergences comme la convergence simple ou la convergence uniforme. Bien souvent, nous avons vu qu'une suite de fonctions ne converge pas vers une limite.

Sur ce point , une idée s'élève peu à peu dans notre esprit. Maintenant que nous avons agrandi notre ensemble de fonction physique en créant l'espace des distributions, dans lequel l’ensemble des fonctions physiques a été immergé, est-ce que les suites de fonctions qui ne convergeaient pas avant, ne vont-elles pas converger vers une distribution en dehors de l'espace des distributions régulières. C'est ce que nous allons étudier dans ce paragraphe !


Nous commencerons par donner une définition de la convergence des distributions.


Pour mettre en application cette définition, nous allons donner un exemple de suite de fonctions physiques qui ne converge pas dans l’ensemble des fonctions, mais qui va converger, dans  , vers une distribution qui n’est pas régulière.

Soit la suite de fonctions (fn)n∈ℕ, définie par :

 

Nous voyons que cette suite de fonctions ne converge pas dans l’ensemble des fonctions puisque l’on a :

 

Calculons toutefois la limite de cette suite en les considérant comme des distributions. Nous appellerons Tn la distribution régulière correspondant à fn

Nous avons alors :

 

La deuxième intégrale est plus délicate à calculer. Calculons donc à part :

 


En introduisant les valeurs absolues, nous avons :

 


φ étant une fonction continue, nous avons :

 


Nous voyons qu’à partir d'une certaine valeur de n, nous aurons :

 

Compte-tenu des bornes d'intégration de l'intégrale, nos avons alors :

 

Nous en déduisons que :

 

On a obtenu :

 

Ce qui nous permet de conclure que :

 


Nous pouvons finir le calcul commencé plus haut :

 


Nous voyons que la suite de distributions (Tn) convergerait vers une distribution T qui serait définie par :

 

On vérifie que cette définition correspond bien à la définition d'une forme linéaire sur   et par conséquent T est bien une distribution que l’on nomme « distribution de Dirac » et que l’on notera δ0 ou simplement δ par la suite.



Nous avons donc bien constaté qu'une suite de fonctions qui ne convergeaient pas dans l’ensemble des fonctions peut très bien converger dans l’ensemble des distributions.


Notons que nous pouvons généraliser la définition de la distribution de Dirac en 0 en un point quelconque a :


 

Une application au circuit électrique, de ce qui précède, est celle-ci :

Supposons que l’on applique, à l'instant a, une tension aux bornes d'un circuit durant un temps très court. Si notre intention est d'appliquer cette tension durant le temps le plus court possible, on pourra alors, pour simplifier les calculs, remplacer cette action par une distribution de Dirac en a, affectée d'un facteur égal au produit de la tension appliquée par le temps d'application de la tension. On dira alors que l’on a appliqué une impulsion au circuit à l'instant a.


Produit de distributions

modifier

Nous allons aborder, dans ce paragraphe, la question concernant le produit des distributions. La somme de deux distributions découle naturellement du fait que l’ensemble des distributions est un espace vectoriel, mais peut-on définir le produit de deux distributions.

Pour cela, nous commencerons à raisonner sur les distributions régulières pour essayer de voir si l’on peut en déduire une première formule, quitte à voir si cette formule peut se généraliser à toutes les distributions. Si nous considérons deux fonctions physiques p et q, nous savons, de façon classique, que :

 

En notant • le produit hypothétique de deux distributions, nous devrions alors avoir :

 

Il nous faut donc trouver une définition du produit de deux distributions qui soit compatible avec cette formule. Nous voyons que nous avons successivement :

 

 

 

Une longue réflexion nous montre qu'aucune relation ne semble émerger pour lier ces trois formules. Il semble donc que l’on doivent abandonner tout espoir de définir un produit entre deux distributions d'une façon générale.

Pourtant, si nous observons la troisième relation, nous voyons qu'elle peut se mettre sous la forme :

 

Et là, un faible espoir commence à naître. Il faudrait pour poursuivre les calculs que p.φ soit une fonction-test. Et cela ne peut se produire que si p est indéfiniment dérivable. Par conséquent, si p est infiniment dérivable, nous voyons que nous avons :

 

Ce qui est déjà mieux que rien !


En faisant abstraction des intégrales, nous retiendrons :

 

Et en combinant avec la relation :

 

que l’on espérait avoir, nous obtenons :

 

Si nous essayons de généraliser, nous voyons que nous ne pouvons faire aucun compromis sur p qui doit être indéfiniment dérivable. Par contre, nous n'avons aucune contrainte sur la fonction q de Tq et donc nous généraliserons à ce niveau-là, en remplaçant Tq par T, fonction quelconque de  . Nous obtenons donc :

 

Et nous voyons que nous avons réussit à définir le produit de deux distributions dans le cas très particulier, où l'une des deux est la distribution associée à une fonction indéfiniment dérivable.

Par abus de langage, nous identifierons Tp avec p et laisserons tomber la notation •. Nous poserons alors la définition suivante :


Étudions, à titre d'exemple, le produit de la distribution de Diras en a par une fonction indéfiniment dérivable g.

Nous avons :

 

On retiendra :