Un peu de physique...

Accueil

Equivalence matière énergie : E = mc2

 

Ce site a été entièrement refondu. Retrouvez la version mise à jour en cliquant sur le lien ci-dessous.

 

La transformation de Lorentz n’a plus de secret pour nous et nous nous sommes initiés aux arcanes de l’espace-temps de Minkowski… Mais il ne s’agit là que de la partie cinématique de la relativité restreinte. L’essentiel reste à venir. Le noyau dur. Une révélation qui a changé le cours de l’histoire de l’Humanité toute entière. L’équivalence entre matière et énergie. Dans ce chapitre, nous allons introduire ce principe d’équivalence en étudiant les propriétés du vecteur énergie-impulsion. Nous nous intéresserons ensuite à la forme relativiste des équations de Maxwell. Nous verrons à cette occasion que le champ magnétique peut être considéré comme une manifestation du caractère relativiste de l’espace-temps.

Quadrivitesse

L’équivalence entre matière et énergie est une conséquence de l’application de la relativité restreinte à la dynamique des corps. Nous allons montrer comment.

En mécanique classique, les équations du mouvement agissent sur des quantités que l’on appelle vitesse et impulsion. Il convient de voir ce que ces quantités deviennent dans l’espace-temps de Minkowski. Commençons par la vitesse.

Considérons une particule de masse m dans un référentiel inertiel donné. Supposons qu’elle se trouve au point défini par les coordonnées à l’instant . En mécanique classique, sa vitesse est définie comme suit :

 

(1)

Dans l’espace-temps de Minkowski sa position est repérée par les quatre coordonnées . La trajectoire spatio-temporelle de cette particule dans l’espace-temps est appelée sa ligne d’univers. Elle est représentée par la courbe de toutes les valeurs successives de .

L’extension de la notion de vitesse à l’espace-temps de Minkowski s’appelle la quadrivitesse. La première formulation qui vient à l’esprit est la suivante :

 

(2)

Ce quadrivecteur n’a en fait aucune propriété intéressante. Il est totalement dépendant du choix du référentiel. En fait, il est plus judicieux d’utiliser le temps propre de la particule pour effectuer les opérations de dérivation :

 

(3)

peut s’écrire aussi de la manière suivante :

 

puisque :

(4)

Le choix du temps propre est facilement compréhensible : c’est un invariant par la transformation de Lorentz. Comme par ailleurs :

 

(5)

Il vient :

 

(6)

On voit que la norme du quadrivecteur vitesse est invariante et toujours égale à la vitesse de la lumière. Voilà qui en fait un candidat idéal pour construire la dynamique relativiste des particules. Un changement de référentiel se traduit par une simple rotation hyperbolique de la quadrivitesse dans l’espace-temps de Minkowski. Le retour à la forme classique de la vitesse est très simple. Il suffit en effet d’écrire :

 

(7)

Quadrivecteur énergie-impulsion

En mécanique classique, le vecteur impulsion d'un corps de masse s'écrit :

 

(8)

Par analogie avec la quadrivitesse, il est logique de construire un quadrivecteur en multipliant par :

 

(9)

La première composante du quadrivecteur a la dimension d'une énergie divisée par une vitesse. On peut l’écrire sous la forme :

 

(10)

Ce qui conduit à écrire :

 

(11)

Le quadrivecteur est appelé quadrivecteur énergie-impulsion. Sa norme est bien évidemment invariante tout comme celle du quadrivecteur vitesse. Ceci permet d’écrire :

 

(12)

C’est la forme la plus générale de l’équation d’Einstein :

 

(13)

... qui s'écrit :

 

(13-bis)

dans le référentiel de la particule considérée.

Illustrons cette équation par un exemple simple en reprenant l’espace-temps « à 2 dimensions » que nous avons utilisé dans le chapitre précédent. Considérons un corps de masse m au repos dans un référentiel que nous appellerons référentiel noir. Le quadrivecteur énergie-impulsion de ce corps n’a qu’une composante sur l’axe énergie du référentiel des quadrivitesses associé au référentiel noir :

 

(14)

Changeons de référentiel : passons dans un référentiel en translation avec une vitesse par rapport au référentiel noir. Ce nouveau référentiel est appelé référentiel rouge. Pour passer de l'un à l'autre, il suffit d'appliquer la transformation de Lorentz. Il est facile de constater que le quadrivecteur énergie-impulsion se transforme en un quadrivecteur ayant une composante énergie et une composante impulsion. C'est tout à fait logique : le corps se déplace à la vitesse dans le référentiel rouge.

 

(14-bis)

Si l’on se souvient que , il est facile de voir que :

 

(15)

On retrouve bien l'équation d'Einstein ! Elle est en fait une simple conséquence de l'invariance de la quadrivitesse par la transformation de Lorentz.

Figure 1 : Quadrivecteur énergie-impulsion.

Dans ce qui précède, nous avons introduit le terme d’énergie de manière quelque peu artificielle. Nous nous sommes en effet basés sur l’équation aux dimensions de la première composante du quadrivecteur énergie-impulsion pour écrire :

 

(10-bis)

Si a bien les dimensions d’une énergie, quelle est sa signification physique ? Pour mieux comprendre de quoi il s’agit nous allons nous intéresser à la limite classique de l’équation (10-bis) :

 

(16)

La signification de apparaît cette fois beaucoup plus clairement : il s’agit bien d’un terme d’énergie qui combine de manière indissociable la masse de la particule et son énergie cinétique. Le terme de masse est sans effet sur les corps non relativistes : il n’apparaît donc pas dans les équations de la mécanique classique. Il ne peut par contre pas être négligé lorsqu’on s’intéresse à la dynamique relativiste. Dans ce cas, masse et énergie sont indissociables tout comme le sont l’espace et le temps.

Quadrivecteur énergie-impulsion d'un photon

Dans le cas d'un photon, le quadrivecteur énergie-impulsion prend une forme tout à fait particulière. Pour une particule de masse nulle, l’équation (13) nous indique que :

 

(17)

... ce qui est précisément ce que nous enseigne la théorie de l’électromagnétisme de Maxwell.

Figure 1 : Quadrivecteur énergie-impulsion d’un photon.

On peut donc attribuer à ce photon un vecteur énergie-impulsion tel que représenté par la figure 2 ci-dessus : sa composante énergie vaut et sa valeur est égale à celle de son impulsion. La figure montre comment ce vecteur est affecté par une transformation de Lorentz. Elle confirme bien que la vitesse d'un photon est la même dans tous les référentiels. Elle montre aussi que son énergie et son impulsion sont différentes selon le référentiel dans lequel on se place. Nous étudierons cette particularité plus loin dans le chapitre consacré à l’effet Doppler relativiste.

Principe de moindre action

Le principe de moindre action est une formulation très générale des lois de la mécanique newtonienne qui a été introduite au milieu du XVIIIème siècle par Pierre Louis de Maupertuis et Joseph Louis Lagrange. Il stipule que la dynamique d’un corps en mouvement peut être déterminée en recherchant la trajectoire qui minimise l’intégrale d’action. L’intégrale d’action se calcule en intégrant le lagrangien de ce corps tout au long de la trajectoire. L’équation d’Euler-Lagrange permet de trouver le minimum de l’intégrale d’action1 :

 

 

Le lagrangien « classique » est obtenu en faisant la différence entre l’énergie cinétique du corps (on utilise aussi le terme de lagrangien libre) et son énergie potentielle :

 

 

Le principe de moindre action s’applique également en relativité restreinte mais le lagrangien relativiste « libre » fait cette fois référence à la quadrivitesse. Il s’écrit comme suit :

 

(18)

Dans l’équation qui précède, les coefficients représentent les termes diagonaux du tenseur de Minkowski, les termes sont les composantes du quadrivecteur vitesse et est le module de la vitesse au sens classique du terme.

Sachant que on peut écrire :

 

(18-bis)

En l’absence de potentiel extérieur, l’intégrale d’action se résume au terme « libre ». On voit dans ce cas que l’optimum correspond à la trajectoire qui maximise le temps propre (le signe appliqué à est négatif).

Lorsque est petit devant , on peut faire un développement limité de :

 

 

Le terme étant constant n’a pas d’impact sur la recherche de l’optimum. On retrouve sans difficulté la formulation classique du lagrangien.

 

Notes

1 : Voir à ce sujet le chapitre sur les principes généraux de la mécanique newtonienne dans la section consacrée à la relativité générale.

 

  Equations de Maxwell relativistes

Note : ce paragraphe a pour seul but de montrer comment les lois de l’électromagnétisme trouvent leur place dans la théorie de la relativité restreinte. Il est assez « technique ». Comme on ne reviendra pas par la suite sur ce sujet, le lecteur impatient et peu inspiré par les notions de divergence et de rotationnel peut passer directement au chapitre suivant.

Einstein a conçu la relativité restreinte dans le but d’éliminer l’incompatibilité entre la mécanique newtonienne et l’invariance de la vitesse de propagation des ondes électromagnétiques. Nous avons montré quelles étaient les conséquences de la relativité sur l’énergie et le temps. Il nous reste à vérifier son impact sur les lois de l’électromagnétisme. La théorie a-t-elle atteint son objectif ?

Les lois physiques qui déterminent le comportement des ondes électromagnétiques sont les équations de Maxwell. Elles sont au nombre de 4 :

 

(19)

 

(19-bis)

avec :

 

 

E et B sont respectivement le champ électrique et le champ magnétique, j est le vecteur courant et les charges électriques sont représentées par . (Dans ce chapitre, on représente les vecteurs par des lettres en caractère gras.) La quantité est appelée permittivité diélectrique et la quantité perméabilité magnétique. La première et la troisième équation sont dites sans terme de source, la seconde et la quatrième avec termes de source. Si E et B respectent ces équations, on peut montrer que :

 

et

(20)

est un potentiel électrique scalaire et A un potentiel vecteur. On dit que E et B dérivent des potentiels A et . Notons par ailleurs que nous avons utilisé les notations et pour représenter respectivement le gradient et la dérivée partielle.

La mauvaise nouvelle est que le couple de potentiels (, A) n’est pas défini de manière unique. Toute transformation définie par :

 

et

(21)

conduit aux mêmes valeurs de champ E et B.

La bonne nouvelle est qu’on peut choisir un couple de potentiels qui simplifie les écritures en imposant une condition judicieuse sur A et . Une telle condition s’appelle une jauge. La jauge que l’on choisit généralement est la jauge de Lorentz qui s’exprime comme suit :

 

(22)

Elle présente l’énorme avantage de conduire à des équations de propagation des potentiels facilement interprétables :

 

et

(23)

Ces équations sont caractéristiques d’un champ se déplaçant à la vitesse .

Jusqu’à présent, nous sommes restés dans un cadre tout ce qu’il y a de plus classique. Comment passer au formalisme de la relativité restreinte ? Nous allons travailler dans un espace de Minkowski de signature . Construisons tout d’abord le quadrivecteur courant :

 

(24)

La formule qui précède utilise le formalisme des indices covariants1.

La raison pour laquelle on définit de la sorte s’éclaire si on fait l’analogie avec le quadrivecteur énergie-impulsion. D’une certaine manière le courant est à la charge électrique ce que l’impulsion est à la masse. Ceci nous conduit à construire de manière similaire le quadripotentiel :

 

(25)

Par définition des vecteurs covariants et contravariants on peut écrire :

 

et

 

étant le tenseur associé à la métrique de Minkowski avec la signature 2. Ceci permet de reformuler la jauge de Lorentz sous la forme suivante :

 

(26)

De leur côté, les équations de propagation de ces potentiels s’écrivent comme suit :

 

(27)

 

(28)

Soit, de manière beaucoup plus condensée :

 

(29)

On reconnaît dans cette équation l’opérateur D’alembertien :

 

 

On peut donc réécrire ces équations de propagation comme suit :

 

(29-bis)

Cette équation est la forme caractéristique d’une équation de propagation à vitesse constante, cette vitesse étant égale au terme intervenant dans la définition du d’alembertien. On démontre en effet que toute solution de l’équation ci-dessus peut être décomposée sous la forme d’une somme de termes tels que :

 

(30)

Revenons au quadripotentiel. Par construction, on peut lui appliquer la transformée de Lorentz pour passer d’un référentiel inertiel à un autre :

 

(31)

expression dans laquelle est le tenseur de Minkowski (voir chapitre précédent). L’équation de propagation du quadripotentiel respectera donc elle aussi l’équation du D’alembertien. L’équation (29-bis) est donc conservée lors d’un changement de référentiel inertiel : on a bien construit une théorie de l’électromagnétisme dans laquelle la vitesse de propagation des champs est invariante et égale à , ce qui était le but recherché.

Si les axes des deux référentiels sont parallèles et que la vitesse de translation d’un référentiel par rapport à l’autre est dirigée suivant l’axe on peut écrire :

 

et

(32)

avec :

 

et

(32-bis)

Ce qui donne :

 

(33)

 

(33-bis)

Examinons le cas d’une particule chargée se déplaçant à vitesse constante. Dans le référentiel de la particule au repos, seul le champ électrostatique est perceptible. Le champ magnétique est nul. Par contre, dans le référentiel où la particule est en mouvement il apparaît automatiquement un champ magnétique B'.

Ceci conduit certains auteurs à dire que le champ magnétique B est un effet de la relativité restreinte dans la mesure où il découle directement de la transformation de Lorentz du champ électrique généré par une charge électrique dans le référentiel où elle est au repos. Ceci peut d’ailleurs s’expliquer de la manière suivante. Dans le référentiel de la charge au repos, le champ E est à symétrie sphérique. Dans un référentiel en mouvement par rapport à la charge, cette symétrie est brisée (équation 33). Le rotationnel du potentiel vecteur A' n’est plus nul, ce qui engendre le champ magnétique B'.

Il est cependant plus correct de dire que le champ électrique et le champ magnétique sont la manifestation d’un seul et même phénomène physique, ce dont Maxwell avait eu l’intuition. Ce phénomène peut être représenté par un objet mathématique appelé tenseur. Le tenseur électromagnétique se déduit comme suit du quadripotentiel :

 

(34)

avec :

 

(35)

Lors d’un changement de référentiel, la formule qui permet d’exprimer le nouveau tenseur en fonction de l’ancien est la suivante (c’est la formule générale de transformation des tenseurs lors d’un changement de référentiel) :

 

(36)

Dans ce qui précède et ce qui suit on utilise la convention de sommation d’Einstein :

 

 

Les équations de Maxwell s’écrivent dès lors comme suit :

 

pour les équations sans terme de source

(37)

 

pour les équations avec termes de source

(37-bis)

Ces équations sont bien conservées dans toute transformation de Lorentz.

Pour résumer ce qui précède, on peut donc dire les choses suivantes :

  • Les équations (29-bis) et (31) montrent que le quadripotentiel et le quadrivecteur courant se propagent à la vitesse de la lumière dans tous les référentiels inertiels.
  • La formulation relativiste des lois de l’électromagnétisme est donnée par les équations (37) et (37-bis).
  • Lors du passage d’un référentiel inertiel à un autre référentiel inertiel, il suffit d’appliquer la transformation de Lorentz au tenseur représentant le champ électromagnétique pour obtenir sa valeur dans le nouveau référentiel (équation 36).
  • Le champ magnétique est, d’une certaine façon, une manifestation des effets de la relativité restreinte (équations 33 et 33-bis). La transformation de Lorentz transforme le champ électrique en champ magnétique (et réciproquement) tout comme elle transforme le temps en espace et l’espace en temps.

 

Notes

1 : Indices covariants : le terme μ en exposant ne correspond pas à une élévation à la puissance μ mais à un indice contravariant, conformément à la notation utilisée par Einstein. On abordera les notions d’indice covariants et contravariants ainsi que l’algèbre tensorielle dans le chapitre consacré aux espaces courbes. De manière plus prosaïque, on peut dire qu’il s’agit de la μième composante du quadrivecteur considéré.

2 : Certains auteurs font le choix de la signature inverse. Il suffit dans ce cas d’inverser le signe des équations qui font intervenir l'opérateur D’alembertien.