Le théorème de Cantor-Bernstein, également appelé théorème de Cantor-Schröder-Bernstein, est le théorème de la théorie des ensembles qui affirme l’existence d'une bijection entre deux ensembles dès lors qu'il existe deux injections, l'une du second vers le premier l'autre du premier vers le second.
Théorème — S'il existe une injection d'un ensemble E vers un ensemble F et une injection de F vers E, alors il existe une bijection de E sur F.
Georg Cantor énonce ce théorème sans démonstration en 1887[3]. En 1895, Cantor remarque dans la première partie de Beiträge zur Begründung der transfiniten Mengenlehre (« Sur les fondements de la théorie des ensembles transfinis ») que le théorème se déduit de la propriété de trichotomie pour les cardinaux (Cantor considère en effet que tout ensemble peut être bien ordonné, ce qui équivaut à l'axiome du choix), mais renvoie a une publication ultérieure la démonstration de cette propriété[4].
Felix Bernstein, élève de celui-ci, produit une démonstration qui n'utilise pas les bons ordres (et ne nécessite pas l'axiome du choix) dès 1896 à l'âge de 18 ans. Elle est publiée en 1898 sur proposition de Cantor dans Leçons sur la théorie des fonctions sous la plume d'Émile Borel[5],[6].
Ernst Schröder publie lui aussi une démonstration en 1898[7], mais celle-ci s'avère erronée[8]. L'erreur est repérée en 1902 par Alwin Korselt qui en fait part à Schröder début [9]. Celui-ci reconnaît que la paternité de la démonstration du théorème revient entièrement à Bernstein, dans une réponse envoyée quinze jours plus tard[9] (un mois avant sa mort). Il ajoute s'être lui-même rendu compte du problème en 1901 et en avoir fait part alors à son ami Max Dehn[10].
Korselt soumet fin un article aux Mathematische Annalen, où il expose l'erreur de Schröder et propose une autre démonstration, mais celui-ci n'est publié qu'en 1911. Pendant tout ce temps la preuve de Schröder est considérée comme correcte, en particulier par Cantor, Peano et Schönflies[11].
Richard Dedekind avait rédigé une preuve du théorème de Cantor-Bernstein dès 1887, pour laquelle il utilise sa théorie des chaînes publiée dans son ouvrage Was sind und was sollen die Zahlen ? (1888). Elle a été retrouvée après sa mort et publiée seulement en 1930[12].
Ignorant alors cette démonstration[13], Ernst Zermelo publie deux démonstrations du théorème en 1901 puis en 1908, toutes deux fondées sur la théorie des chaînes de Dedekind, dont la seconde s'avère très similaire à celle de Dedekind[14]. Zermelo avait déjà envoyé sa seconde preuve à Poincaré début 1906, en réponse à une critique de Poincaré sur l'usage de l'induction complète (définition par récurrence et raisonnement par récurrence) dans les preuves alors connues du théorème de Cantor-Bernstein. Cette critique est accompagnée d'une version détaillée de la preuve de Bernstein-Borel qui met en évidence l'usage de l'induction complète. Elle avait été publiée dans la Revue de métaphysique et de morale en . La preuve de Zermelo n'utilise pas les entiers, et donc manifestement pas de récurrence. En réponse, Poincaré publie dans la même revue en mai de la même année une adaptation en français de la démonstration de Zermelo, dont il critique l'usage de l'imprédicativité, critiques auxquelles répond Zermelo en 1908[15].
Trois démonstrations
Première démonstration
Lemme préliminaire
On commence par montrer que si est une application injective d'un ensemble vers une de ses parties, , alors il existe une bijection de sur .
Soit la suite définie par :
Soit la réunion de tous les ensembles : .
Soit alors l'application de dans définie par :
est bien définie à valeurs dans , car est à valeurs dans , et si alors et donc .
envoie injectivement dans ; et le complémentaire de identiquement dans lui-même. C'est donc une injection.
Montrons que est surjective. Soit . Montrons qu'il existe un tel que .
Si : alors il existe tel que ( est strictement positif car , donc ). Il existe donc tel que .
Si : alors
Ainsi, est bijective, ce qui démontre la première proposition.
Interprétation
On peut donner une interprétation du résultat montré ci-dessus. A est l'ensemble (infini) des spectateurs d'un théâtre (infini). Chaque spectateur a réservé une place, et initialement, on suppose que chaque place est occupée par un spectateur, mais pas forcément par le spectateur qui a réservé cette place. B est alors l'ensemble des spectateurs assis. Par ailleurs, les ensembles étant infinis, il peut rester des spectateurs debout. L'application u est l'application qui associe, à un spectateur x, le spectateur y = u(x) assis à la place de x.
est l'ensemble des spectateurs initialement debout. Ces spectateurs se rendent à leur place et en délogent les occupants. Ceux-ci forment alors l'ensemble . Ces derniers procèdent de même. désigne les spectateurs debout à la n-ème étape. Ils vont aux places qu'ils ont réservées et en chassent leurs occupants. On itère une infinité de fois. C désigne l'ensemble des spectateurs qui se sont levés au moins une fois (y compris ceux qui étaient debout initialement).
L'application v désigne l'application qui associe, à un spectateur x qui doit se lever, le spectateur y qu'il va déloger, ou bien qui, à un spectateur x qui reste toujours assis, associe x lui-même. L'application réciproque de v est l'application qui, à un spectateur y qui est dérangé, associe le spectateur x qui vient prendre sa place, ou bien qui associe, à un spectateur y jamais dérangé, y lui-même.
Démonstration finale du théorème
Montrons alors le théorème initial.
Soit B = g(F) l'image de F par l'injection g. L'application u = g o f est une injection de E dans B, avec . Donc il existe une bijection v de E sur B.
Comme g est une injection et g(F) = B, elle définit par restriction une bijection h de F sur B. La composée h-1∘v est une bijection de E sur F, ce qui démontre le théorème de Cantor-Bernstein[16].
Soit un ensemble, l'ensemble de ses parties et une application croissante, c'est-à-dire telle que . Alors admet un point fixe, c'est-à-dire qu'il existe une partie de telle que .
Démonstration finale
Soient maintenant injective de dans et injective de dans . Pour toute partie de , on pose , c'est-à-dire que s'obtient en prenant l'image directe, puis le complémentaire dans de cette image, puis l'image directe par de ce complémentaire, et enfin le complémentaire dans de cette image. Il n'est pas difficile de vérifier que est croissante.
On introduit alors la partie du lemme préliminaire. Cette partie est invariante par , ce qui signifie que est le complémentaire de dans .
On définit une bijection en posant :
si ;
si .
joue un rôle comparable à la partie dans la première démonstration ou à dans la démonstration qui suit.
Troisième démonstration
Cette démonstration est essentiellement celle publiée par Julius König en 1906[17], et souvent reprise depuis[18].
À élément de , on associe une suite finie ou infinie définie par récurrence de la façon suivante. La valeur initiale est . Supposons défini (sinon n'est pas défini), alors :
si possède un antécédent par g, alors est cet (unique) antécédent (remarque : dans ce cas n est pair) ;
si possède un antécédent par f, alors est cet (unique) antécédent (remarque : dans ce cas n est impair) ;
dans les autres cas n'est pas défini.
Trois cas sont alors possibles pour la suite qui permettent de partitionner en trois ensembles :
est l'ensemble des tels que la suite correspondante est finie et s'arrête sur un élément de (de façon équivalente, l'indice du dernier élément est pair) ;
est l'ensemble des tels que la suite correspondante est finie et s'arrête sur un élément de (de façon équivalente, l'indice du dernier élément est impair) ;
est l'ensemble des tels que la suite correspondante est infinie.
On partitionne de façon analogue en , et . Alors :
est une bijection de sur , ainsi que de sur ;
est une bijection de sur , et sa réciproque est donc une bijection de sur .
↑(de) Ernst Schröder, « Ueber zwei Definitionen der Endlichkeit und G. Cantor’sche Sätze », Johann Ambrosius Barth Verlag, Halle a. S., Kaiserliche Leopoldino-Carolinische Deutsche Akademie der Naturforscher, vol. 71, no 6, , p. 303–362 (336-344) (lire en ligne).
↑« … the question why Schröder’s name is so often associated with a result towards which his sole contribution was to provide a fallacious proof. », (en) William W. Tait(en), « Michael Potter, Set Theory and its Philosophy (Book Review) », History and Philosophy of Logic, vol. 26, no 2, , p. 162-166 (lire en ligne), p. 164.
↑« … Daß ich Herrn F. Bernstein die Ehre, den G. Cantorschen Satz bewiesen zu haben, allein überlasse, hatte ich einstweilen einem Freunde desselben, Herrn Dr. Max Dehn (jetzt in Münster) schon vorigen Herbst resp. Sommer — natürlich zum Weitergeben — gesagt », extrait d'une lettre de Schröder à Körselt du 23 mai 1902, cité par Korselt 1911.
↑(en) Gregory H. Moore, Zermelo's Axiom of Choice Its Origins, Development, and Influence, Springer, coll. « Studies in the History of Mathematics and Physical Sciences » (no 8), (ISBN978-0-387-90670-6), p. 48.
↑Cette démonstration suit de près Kolmogorov et Fomine 1977, p. 22 et Cori et Lascar 1993, p. 148-149, qui simplifient légèrement König 1906 et explicitent l'utilisation de la définition par récurrence, et donc des entiers. La preuve de Kelley 1955 qui n'explicite pas la définition des suites récurrente est incorrecte, car le partitionnement est défini selon le caractère fini et la parité du nombre d'éléments de l'ensemble image des suites et . Or cet ensemble peut être fini, si la suite correspondante est infinie mais présente un cycle. Ceci a été remarqué par Leslie Lamport, How to Write a Proof, 1993, p. 8, qui prend cette preuve comme exemple d'une preuve informelle fausse, dont l'erreur apparaît quand il essaye de la présenter de façon structurée, mais qui est difficile sinon à déceler.