La théorie des valeurs extrêmes est une branche des statistiques qui s'intéresse aux valeurs extrêmes des distributions de probabilité. Elle a été développée par Émil Julius Gumbel.
Méthodes
La théorie des valeurs extrêmes permet de connaître le comportement asymptotique des maxima de valeurs prises par les valeurs de variables aléatoires identiquement distribuées et indépendantes[1]. Cette loi comporte des paramètres que l'on peut estimer soit en se basant sur les valeurs extrêmes prises dans des blocs de taille fixe des données à disposition (méthode des maxima), soit en s'intéressant à la distribution des données supérieures à un certain seuil (méthode des excès)[1].
Pour pouvoir être appliquée, la théorie des valeurs extrêmes doit donc disposer de beaucoup de données[1].
Distribution limite
Soient des variables aléatoires indépendantes et identiquement distribuées. La théorie des valeurs extrêmes s'intéresse au comportement limite des extrêmes de l'échantillon, c'est-à-dire ou, de manière équivalente, lorsque approche l'infini. Une certaine intuition peut être construite en faisant le rapprochement avec le théorème central limite. Ce dernier s'intéresse au comportement limite de la somme des variables aléatoires de l'échantillon.
Soit la distribution ayant générée . Alors, en posant comme étant la borne supérieure pouvant être générée par , on a,
qui converge lorsque à pour et à pour . Or, nous souhaitons avoir un comportement limite qui tend vers une distribution non-dégénérée. Pour cela, il est nécessaire de standardiser l'extrême de l'échantillon. Supposons qu'il existe une séquence et une séquence si bien que, a une distribution limite non-dégénérée,
.
Domaine d'attraction
Il est nécessaire de poser une série de conditions nécessaires et suffisantes sur afin de pouvoir garantir la convergence en limite des extrêmes vers . Le domaine d'attraction maximal ou domaine d'attraction est la classe de distribution satisfaisant les conditions nécessaires et suffisantes. Il existe trois types de distributions limites. A eux trois, ils comprennent toutes les distributions limites de variables aléatoire indépendantes et identiquement distribuées qui convergent vers une distribution limite non-dégénérée:
↑ abc et dJacques Barnouin, Ivan Sache et al. (préf. Marion Guillou), Les maladies émergentes : Épidémiologie chez le végétal, l'animal et l'homme, Versailles, Quæ, coll. « Synthèses », , 444 p. (ISBN978-2-7592-0510-3, ISSN1777-4624, lire en ligne), III. Détection statistique et modélisation de la dynamique des émergences, chap. 12 (« Modélisation statistique des événements rares : le cas des valeurs extrêmes et de l'étude des émergences »), p. 112-117, accès libre.
↑Michel Olagnon (ill. Janette Kerr(en)), Anatomie curieuse des vagues scélérates, Quæ, coll. « Carnets de sciences », , 176 p. (ISBN978-2-7592-2967-3, présentation en ligne), VII. Statistiques scélérates, « Extrapoler hardiment mais scientifiquement », p. 103-104.
E.J. Gumbel, « Les valeurs extrêmes des distributions statistiques », Ann. Inst. Henri Poincaré, vol. 5, no 2, , p. 115–158 (lire en ligne [PDF], consulté le )
Bechir Raggad, « Fondements de la théorie des valeurs extrêmes, ses principales applications et son apport à la gestion des risques du marché pétrolier », Mathématiques et sciences humaines, no 186, (lire en ligne, consulté le )