Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».
La physique classique est également géométrisée, et ce depuis Isaac Newton, voire avant ; l'intérêt de cette géométrisation de la relativité restreinte est dans le fait que le temps lui-même y est représenté comme indissociablement lié à l'espace matériel, que les propriétés abstraites de la relativité restreinte y trouvent une représentation proche de la géométrie euclidienne, et que cela a aidé à la formulation de la relativité générale.
Cet espace a été introduit par Henri Poincaré dans un long article, connu comme le Mémoire de Palerme, soumis le aux Rendiconti del Circolo matematico di Palermo et publié en [8],[9], soit deux ans avant les publications de Hermann Minkowski sur ce sujet. La primeur de la découverte est un sujet à débats, mais il semble, d'après certains historiens des sciences, que l'interprétation moderne de cet espace comme espace-temps physique, et non pas convention calculatoire, est une idée de Minkowski, qui abandonna l'éther électromagnétique, à la suite d'Einstein, alors que Poincaré n'y renonça jamais vraiment, considérant que dans un référentiel quelconque les quantités mesurées sont toujours « apparentes », alors que les quantités « réelles » sont mesurées dans le référentiel de l’éther[10].
Poincaré aurait proposé cet espace comme une présentation algébrique et géométrique possible, pratique d'un point de vue calculatoire, mais axiomatique, c'est-à-dire conventionnelle, des propriétés mathématiques liées au principe de relativité et à l'invariance des équations de Maxwell par changement de référentiel inertiel, en privilégiant de manière conventionnelle comme réel le référentiel de l'éther, c'est-à-dire un espace réel qui serait classique. Seul Hermann Minkowski aurait vu dès 1907 que cet espace était un modèle expérimentable (et pas seulement conventionnel) d'un espace-temps où espace et temps sont liés dans les lois de la mécanique et y développa, entre autres, les conditions de la causalité et de la simultanéité suivant le référentiel de l'observateur. Poincaré se rapprochera de ce point de vue en 1912, dans sa dernière conférence intitulée L'espace et le temps prononcée à Londres, où il exprimera que l'on peut définir un espace-temps à partir du groupe de symétrie des lois de la physique, en posant cette fois le principe de relativité comme une convention[10].
Structure algébrique
L'espace-temps de Minkowski peut être défini[11],[12] comme le quadruplet où :
L'espace-temps de Minkowski, noté , est un espace affine[13] réel[11] de dimension quatre[13]. Il correspond à la donnée d'un point O (l'origine du repère) et d'un espace vectoriel (dit associé) de dimension quatre (sur ).
Cette structure est complétée par la donnée, sur l'espace vectoriel associé, d'une forme bilinéaire, notée , qui est symétrique et non dégénérée[14]. Également notée ou , qui n'est pas un produit scalaire car elle n'est pas définie positive (ni définie négative) : on suppose qu'il existe une base vectorielle telle que [15], où .
Comme pour toute forme bilinéaire, il lui correspond une forme quadratique (qui est le carré de la pseudo-norme) :
La matrice associée à cette forme bilinéaire, dans la base considérée ci-dessus, est , on a donc , en écriture matricielle.
L'écriture tensorielle permet d'introduire la convention de sommation d'Einstein : en définissant les « coordonnées contravariantes » et les « coordonnées covariantes » , on écrit alors
Dans l'espace affine, les coordonnées d'un point M sont notées . Il est doté d'une distance particulière[16] souvent appelée pseudo-métrique, définie dans le repère par . Ce que l'on note plus simplement quand il n'y a pas de risque de confusion entre cette forme bilinéaire et le produit scalaire euclidien. Dans cette écriture, le carré est conventionnel car la forme quadratique admet aussi des résultats de signe négatif, et n'est bien défini que si . Cette « distance » fait de l'espace de Minkowski un espace pseudo-euclidien.
La géométrie dans l'espace de Minkowski présente un certain nombre de différences avec la géométrie dans un espace euclidien. Elle possède également des significations physiques précises.
Orthogonalité
Un espace de Minkowski possède une notion d'orthogonalité définie par la forme bilinéaire . Deux vecteurs sont dits orthogonaux dans l'espace de Minkowski si et seulement si La notion d'orthogonalité étant une notion générale associée à n'importe quel espace muni d'une forme quadratique (par exemple, un produit scalaire dans un espace de Hilbert), deux vecteurs peuvent être orthogonaux dans un espace de Minkowski même si leurs composantes spatiales ne forment pas une base orthogonale dans l'espace euclidien usuel.
Dans la représentation qu'est un diagramme de Minkowski, l'orthogonalité minkowskienne possède une propriété que ne possède pas l'orthogonalité euclidienne : l'angle entre un vecteur et son orthogonal varie en fonction de l'inclinaison du vecteur (en géométrie euclidienne, l'angle est fixe et égal à 90°). Quand le vecteur est de « genre lumière », ce vecteur est alors son propre orthogonal : la ligne d'univers est contenue dans le plan de simultanéité. Pour un photon, le temps ne s'écoule pas quand il progresse sur sa ligne d'univers.
Détails mathématiques
Dans le référentiel tangent à la ligne d'univers du mobile qui se déplace (son référentiel propre), les coordonnées du quadrivecteur de position (et non pas "de vitesse") du mobile sont . C'est le quadrivecteur temps propre ou encore le quadrivecteur tangent à la ligne d'univers par le fait qu'il n'indique aucune séparation spatiale avec le référentiel, tout en reflétant une évolution temporelle car (par hypothèse).
Si un quadrivecteur est perpendiculaire à , on a :
, soit (puisque ). Donc un point joint à l'origine de ce référentiel par un quadrivecteur orthogonal à la ligne d'univers représente un événement simultané avec celui de l'origine du référentiel (le décalage de temps est ).
Comme la forme bilinéaire est invariante par changement de référentiel, l'orthogonalité est assurée quel que soit le référentiel d'où l'on considère les quadrivecteurs, et ainsi dans les diagrammes de Minkowski, si l'angle dessiné entre et dépend du référentiel choisi, leur orthogonalité minkowskienne est conservée.
Les calculs des carrés des pseudo-normes de et , à l'aide des coordonnées dans le référentiel galiléen tangent, donnent : et . Donc est à l'intérieur du cône de lumière et est à l'extérieur. Par ailleurs, on sait que le carré de la pseudo-norme est conservé par changement de référentiel, donc ces caractéristiques restent vraies pour tout référentiel, et y compris dans les diagrammes de Minkowski.
Inégalité triangulaire
Dans un plan euclidien, l'inégalité triangulaire est la relation selon laquelle, quel que soit un triangle ABC, alors les longueurs AB, BC et AC vérifient l'inégalité : , l'égalité ayant lieu quand le point B appartient au segment [AC]. Cette inégalité signifie que dans l'espace euclidien, le trajet le plus court entre deux points est la ligne droite.
Dans l'espace minkowskien, il existe un équivalent de l'inégalité triangulaire, établissant les relations entre les longueurs des côtés d'un triangle. Toutefois, celle-ci n'est cohérente que si le triangle est entièrement compris dans un cône de lumière (c'est-à-dire si le carré de leur pseudo-norme est strictement positif), et si , et sont orientés vers le futur.
Pour un triangle ABC vérifiant ces conditions, on a alors l'inégalité dans l'espace minkowskien :
.
Cette inégalité est l'inverse de celle de l'espace euclidien. Dans l'espace minkowskien, un chemin faisant un détour (dans l'espace-temps) est toujours plus « court » (en termes d'intervalle espace-temps) que la « ligne droite ». Une « ligne droite » dans l'espace minkowskien est la ligne d'univers d'une particule qui n'est soumise à aucune force, donc à vitesse constante ou stationnaire.
Cette propriété permet d'illustrer et d'expliquer le paradoxe des jumeaux en relativité restreinte. Le « jumeau » restant sur terre parcourt une « ligne droite » dans l'espace-temps AC. Le jumeau qui voyage parcourt deux segments de droites AB et BC (il fait demi-tour en B pour rejoindre son jumeau en C). Les lignes d'univers des deux jumeaux forment un triangle ABC, dont les côtés sont de genre temps (vitesse des jumeaux inférieure à celle de la lumière) et orientés vers le futur.
L'intervalle espace-temps du jumeau qui voyage est donc inférieur, selon l'inégalité triangulaire minkowskienne, à celui du jumeau stationnaire. Le temps propre du jumeau qui voyage est donc inférieur, et il est donc plus jeune au terme de son voyage que son jumeau resté sur Terre.
Ébauche de justification de l'inégalité triangulaire[réf. nécessaire]
Plaçons-nous dans une situation physiquement réaliste : en allant de l'événement A à l'événement C par un mouvement inertiel, un observateur va en ligne droite, alors qu'un deuxième observateur va en ligne droite de A vers B puis de B vers C. Dans un référentiel inertiel (à deux dimensions pour simplifier) du premier observateur, les coordonnées des événements sont : A(0,0) , C(ct,0) et B(ct',x). Pour que le deuxième observateur puisse aller de B vers C, il faut que t>t', et autres petites précautions sur lesquelles il n'est pas utile d'insister.
Calcul des pseudo-distances : et avec car
On remarque qu'alors ce qui est l'inégalité triangulaire (stricte) cherchée. L'égalité a lieu pour , c'est-à-dire dans le cas où les trois points sont alignés.
Remarquons que cette justification dans une situation particulière permet de justifier le cas général : ce dernier peut toujours se ramener au précédent par un changement de référentiel (transformation de Poincaré) qui ne change pas les valeurs obtenues par la forme quadratique.
Considérons trois événements chronologiques situés dans le cône de lumière.
Sans restreindre la généralité, supposons .
Notons le quadrivecteur de la différence entre les événements 2 et 1, celui de la différence entre le 3e et le 2e, donc celui de la différence entre le 3e et le 1er.
Par hypothèse et , ce qui implique par l’inégalité triangulaire de la norme euclidienne classique .
L’inégalité triangulaire classique, puis la convexité de la fonction (à nouveau l’inégalité de Jensen) impliquent
, soit
pour tous vecteurs et .
En choisissant et , on a , et ainsi
.
Conditions d’égalité :
Par « stricte » concavité de et convexité de , l’égalité implique parallèle à (et de même direction). puis , soit .
Si l’inégalité triangulaire est une égalité, alors les quadrivecteurs des 3 événements sont alignés.
La réciproque se vérifie facilement.
Les points géométriques représentent les événements physiques et sont repérés par quatre coordonnées (ct,x,y,z) : la coordonnée de temps et les trois coordonnées d'espace. Les repères mathématiques y représentent les référentiels galiléens, et l'obligation en mathématiques de choisir un repère, pour désigner les points par des coordonnées, correspond à celle, en physique, de choisir un référentiel pour l'observateur, y compris pour le choix de la mesure du temps.
Du point de vue du réalisme intuitif, la particularité mathématique de cet espace affine tient à sa distance entre deux points, appelée pseudo-métrique, qui a été construite par Hermann Minkowski pour être invariante par les changements de repère que sont les transformations de Lorentz. La pseudo-métrique est aussi appelée pseudo-norme quand on n'utilise que l'espace vectoriel sous-jacent à l'espace affine. Cette pseudo-métrique correspond au temps propre entre deux événements qui peuvent être causalement joints, ou correspond à la distance propre entre eux s'ils ne le peuvent pas.
Un événement étant donné, l'ensemble des événements physiquement joignables dans le futur et de ceux du passé à partir desquels on pouvait joindre l'événement donné, forme un cône dans l'espace de Minkowski, appelé cône de lumière, et permettant des raisonnements purement géométriques par des dessins appelés diagrammes de Minkowski.
Cet espace est pseudo-euclidien : bien que la métrique ne soit qu'une pseudo-métrique, les géodésiques y sont les droites, ce qui fait dire que cet espace est plat comme dans un espace euclidien. Les inégalités triangulaires qui y sont valables montrent qu'un segment est le chemin le plus long entre deux points, ce qui est une nette différence avec la géométrie euclidienne.
Dans cet espace, la dimension relative au temps peut être considérée comme un nombre imaginaire, alors que les trois autres coordonnées (spatiales) sont toujours des nombres réels : ce choix modifie l'écriture de la pseudo-norme et la présentation des calculs, sans apporter plus de simplicité.
Un référentiel de l'espace (affine) de Minkowski est un référentiel galiléen pour un observateur : choix d'un lieu et moment de référence, choix d'axes tridimensionnels et d'un temps. Un observateur, et son référentiel, étant plongé dans cet espace, il repère un événement (point de l'espace-temps) par ses coordonnées temporelle (t) et spatiales (x;y;z) : un point M est noté , ou , en posant .
Orienter l'espace et le temps
La structure algébrique seule ne permet pas de faire de la physique, il faut pour cela au moins : introduire le principe de causalité qui impose que l'on ne peut physiquement rebrousser le cours du temps ; postuler qu'un changement physique de référentiel galiléen ne peut changer l'orientation de l'espace tridimensionnel.
Changer de référentiel physique, en respectant la relativité, c'est utiliser un changement de référentiel mathématique qui laisse invariante la pseudo-norme, c'est-à-dire le carré de l'intervalle d'espace-temps : on doit donc se limiter aux éléments du groupe de Poincaré. Mais les contraintes physiques d'orientation de l'espace et du temps obligent à écarter 75 % des éléments du groupe de Poincaré pour ne garder que ceux qui représentent un changement de référentiel réaliste : les translations, les rotations de l'espace physique à trois dimensions et les transformations de Lorentz propres et orthochrones.
La trajectoire spatio-temporelle d'un corps ponctuel massif, appelée sa ligne d'univers, est une courbe dans l'espace de Minkowski ; mais toute courbe ne peut pas prétendre être une trajectoire réaliste (ligne d'univers) : elle doit pour cela toujours aller dans le sens croissant du temps et être entièrement contenue à l'intérieur de chacun des cônes de lumière centrés en chacun de ses points successifs (on dit alors qu'elle est de « genre temps ») ; sinon cela signifie que la vitesse de la lumière est atteinte ou dépassée au point où cette condition n'est pas respectée. La trajectoire d'un corps ponctuel de masse nulle (un photon par exemple) est une ligne d'univers contenue dans le bord du cône de lumière, cette trajectoire étant rectiligne en général.
Comme toute courbe, une ligne d'univers peut être paramétrée, le paramètre n'étant pas obligatoirement doté d'un sens physique, mais tout observateur plongé dans cet espace-temps doit y avoir accès : n'oublions pas que l'espace de Minkowski représente notre espace dans lequel le physicien se trouve. Les coordonnées du corps M s'écrivent alors , où est le paramètre.
Pour l'observateur, le choix du temps de son référentiel comme paramètre est le plus naturel : les coordonnées du corps M s'écrivent alors . Avec ce choix, qui est le plus accessible à l'observateur et utilisé en physique classique, la vitesse s'exprime , et n'est pas un quadrivecteur : sa pseudo-norme est variable par changement de référentiel (sauf si ce qui n'est possible que si la masse est nulle) et les propriétés qu'elle vérifie ne sont peut-être pas valables dans d'autres référentiels. Par ce choix d'un paramètre propre à son référentiel, l'observateur accède difficilement à des propriétés générales concernant le corps en mouvement.
La notion d'orthogonalité est importante dans l'espace de Minkowski, car le complément orthogonal de la direction (tangente) d'une ligne d'univers en un point p est un « plan » tridimensionnel contenant tous les événements simultanés à l'événement p.
En effet, par définition de l'orthogonalité, le « complément orthogonal du temps propre de cette ligne d'univers » au point p est l'ensemble des événements qui, dans le référentiel galiléen tangent à la ligne d'univers, n'ont aucune composante temporelle (). Ces événements se déroulent donc « au même instant » que l'événement p sur cette ligne d'univers. Cet espace tridimensionnel est nommé plan de simultanéité pour cet événement sur cette ligne d'univers[19].
Il n'est pas possible de prendre le complément orthogonal d'un simple point (événement) p sans lui associer sa ligne d'univers et donc sa vitesse. Cela illustre bien que — en relativité restreinte — la notion de simultanéité dépend de la vitesse.
Un quadrivecteur est un vecteur ayant quatre coordonnées liées au référentiel choisi, mais dont la pseudo-norme est indépendante du référentiel. On dit que la pseudo-norme d'un quadrivecteur est un invariant relativiste.
La quadrivitesse est un quadrivecteur, prolongeant la notion de vecteur vitesse dans l'espace de Minkowski. Ce vecteur est tangent à la ligne d'univers au point de l'espace-temps considéré, et dirigé vers le futur, sa pseudo-norme ne dépend pas du référentiel choisi pour en exprimer les coordonnées.
Cas d'un corps massif
Pour déterminer des propriétés du mouvement du corps massif qui restent valables dans d'autres référentiels que le sien, l'observateur doit choisir un paramètre qui reste inchangé d'un référentiel à l'autre : le temps propre du corps en mouvement. Il n'est pas facilement accessible à l'observateur, toutefois sa définition permet d'écrire où est la vitesse spatiale calculée de manière classique, d'où Ce qui montre que le temps propre peut être obtenu dans n'importe quel référentiel, par des mesures classiques et quelques calculs.
En paramétrant par , on a , et . On remarque qu'ainsi définies les ont la dimension d'une vitesse[20].
L'égalité , amène à , c'est-à-dire . La vitesse ainsi considérée est de pseudo-norme invariante par changement de référentiel : c'est un quadrivecteur.
Par la relation entre et , on montre que [21], donc sachant que dans un référentiel inertiel un corps libre est doté d'une vitesse (classique : ) constante par rapport au temps t, il en est de même pour sa quadri-vitesse par rapport au temps propre .
Cas d'un corps de masse nulle
Une particule de masse nulle est dotée d'une vitesse (classique) égale à la vitesse de la lumière : Dans ce cas la pseudo-norme de est égale à , c'est donc un quadri-vecteur : les égalités établies pour un corps massif n'ont pas besoin de l'être pour un corps de masse nulle, et d'ailleurs ne le peuvent pas, le temps propre de ce corps étant nul ().
De manière générale, l'égalité montre que tout paramètre peut être choisi pour paramétrer la trajectoire du corps car la « vitesse » ainsi obtenue a une pseudo-norme constante (nulle), et est donc un quadrivecteur : .
À l'image de l'impulsion ou quantité de mouvement classique, on définit la quadri-impulsion , qui est un quadrivecteur car proportionnelle à la quadri-vitesse par un coefficient invariant par changement de référentiel (m, la masse). Si le corps est libre, sa quadri-impulsion est constante, comme sa quadri-vitesse.
On note qui a la dimension d'une énergie, et . On a , d'où on déduit , ce que l'on peut écrire . Cette égalité montre que n'a pas de maximum, mais a comme minimum , l'énergie au repos ou énergie de masse. De plus, l'approximation aux petites vitesses devant c donnant cela montre que tient le rôle de l'énergie totale[22] du corps en relativité restreinte (énergie au repos + énergie cinétique), relativement au référentiel de l'observateur, comme l'indique la présence de la vitesse classique dans l'égalité de .
À partir des définitions et égalités exposées, on peut montrer que . Cette égalité indépendante de la masse (bien que jusqu'ici supposée non nulle), montre que si alors , ce qui assure que la masse du corps est nulle : un corps ayant la vitesse de la lumière est nécessairement de masse nulle.
Cas d'un corps de masse nulle
Si on multiplie la quadri-vitesse d'un corps de masse nulle par sa masse (nulle), on obtient une quadri-impulsion nulle : l'énergie d'un tel corps serait nulle, ainsi que sa quantité de mouvement. Or l'expérience la plus simple (se faire chauffer au soleil) montre que la lumière transporte de l'énergie : une quadri-impulsion non-nulle doit être définissable. Supposons cette quadri-impulsion connue : . Pour que ce quadrivecteur soit cohérent avec le reste de la théorie, il faut que sa pseudo-norme donne l'égalité , donc , ce qui est l'égalité pour . Un corps de masse nulle doit donc nécessairement être doté de la vitesse de la lumière. Pour ce qui est de la lumière, sa connaissance nécessite un travail plus approfondi la concernant, comme onde électromagnétique en physique relativiste, ou comme photon en physique quantique. Les autres particules de masse nulle relèvent de cette dernière théorie.
Quadri-force
La quadri-force est définie par . Elle est égale à , où est la quadri-accélération définie par .
L'égalité amène, par dérivation par , les deux quadrivecteurs sont orthogonaux. Cela permet d'écrire, après quelques manipulations algébriques, En définissant et en utilisant la relation entre et et celle entre et on obtient la relation qui est interprétée comme étant l'expression relativiste du théorème de l'énergie cinétique.
Un tenseur d'ordre n de l'espace de Minkowski est une quantité localisée par ses coordonnées et ayant composantes dépendant linéairement des coordonnées lors d'un changement de référentiel. Cette dépendance linéaire fait qu'une égalité tensorielle établie dans un référentiel particulier est une égalité vraie dans tout référentiel.
Les tenseurs d'ordre 0 sont les constantes telles que la masse du corps, sa charge électrique, la vitesse de lumière, la pseudo-norme d'un quadrivecteur. Les tenseurs d'ordre 1 sont les quadrivecteurs. Les tenseurs d'ordre 2 sont, par exemple, le tenseur métrique, le tenseur électromagnétique.
L'utilisation du tenseur électromagnétique dans l'espace de Minkowski est la méthode la plus synthétique pour exprimer les propriétés du champ électromagnétique en relativité restreinte.
Généralisation à une dimension quelconque
Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?
Dans le cadre de la géométrie lorentzienne, on définit un espace de Minkowski de dimension n comme un espace affine muni d'une forme quadratique de signature (+,-,-,...,-).
Notes et références
↑ a et bRoger Penrose, The road to reality, Vintage books edition, 2007. p404-412.
↑Elle ne répond pas à la définition mathématique de distance, mais joue un rôle similaire à la distance dans un espace affine euclidien.
↑Parmi la pseudo-métrique, la forme bilinéaire et la pseudo-norme, si l'une est laissée invariante par une transformation de l'espace alors les deux autres aussi sont invariantes.
↑La convention correspond au choix fait dans les textes anglo-saxons ; la convention correspond au choix fait dans les célèbres textes pédagogiques de Lev Landau, par exemple. Ce dernier choix est considéré comme « plus physique » par Roger Penrose car la métrique est positive pour les lignes d'univers de genre temps, qui sont les seules admises pour des particules massives.
↑Jean Parizot, La géométrie de la relativité restreinte, éditions Ellipse, 2008, (ISBN978-2-7298-3902-4). § 2.3.3 Causalité, simultanéité, page 34.
↑Certains auteurs préfèrent paramétrer par , au lieu de , et la quadri-vitesse est alors sans dimension.
↑Cette égalité peut être prise comme la définition de la quadri-vitesse : la pseudo-norme de étant , la pseudo-norme de est égale à c, donc est une constante indépendante du référentiel, on a alors un quadri-vecteur.
↑En l'absence de champ électromagnétique et de charge électrique dans le corps : dans le cas contraire, un terme s'ajoute dans la définition de
[Bracco et Provost 2009] Christian Bracco et Jean-Pierre Provost, « De l'électromagnétisme à la mécanique : le rôle de l'action dans le Mémoire de Poincaré de », Revue d'histoire des sciences, t. 62, no 2, , p. 457-493 (DOI10.3917/rhs.622.0457, résumé, lire en ligne, consulté le ).
[Sokolov 1995] (en) D. D. Sokolov, « Minkowski space », dans M. Hazewinkel, Encyclopaedia of mathematics [« Encyclopédie des mathématiques »], t. III : Hea – Mom, Dordrecht et Boston, Kluwer Academic, , 1 vol., 950, ill., 30 cm (OCLC36916612, SUDOC030252288, lire en ligne), p. 904-905