En estadístiques, un algorismede maximització d'expectativa (EM) és un mètode iteratiu per trobar estimacions de màxima probabilitat (local) o màxim a posteriori (MAP) de paràmetres en models estadístics, on el model depèn de variables latents no observades.[1] La iteració EM alterna entre la realització d'un pas d'expectativa (E), que crea una funció per a l'expectativa de la probabilitat logarítmica avaluada utilitzant l'estimació actual dels paràmetres, i un pas de maximització (M), que calcula els paràmetres maximitzant el logaritme esperat. probabilitat que es troba al pas E. Aquestes estimacions de paràmetres s'utilitzen llavors per determinar la distribució de les variables latents en el següent pas E.
Història
L'algoritme EM va ser explicat i donat el seu nom en un article clàssic de 1977 d' Arthur Dempster, Nan Laird i Donald Rubin.[2] Van assenyalar que el mètode havia estat "proposat moltes vegades en circumstàncies especials" per autors anteriors. Un dels primers és el mètode de recompte de gens per estimar les freqüències d'al·lels de Cedric Smith.[3] Un altre va ser proposat per HO Hartley el 1958, i Hartley i Hocking el 1977, d'on es van originar moltes de les idees del document Dempster–Laird–Rubin.[4] Un altre de SK Ng, Thriyambakam Krishnan i GJ McLachlan el 1977. Les idees de Hartley es poden ampliar a qualsevol distribució discreta agrupada. Un tractament molt detallat del mètode EM per a famílies exponencials va ser publicat per Rolf Sundberg en la seva tesi i diversos articles,[5][6] després de la seva col·laboració amb Per Martin-Löf i Anders Martin-Löf.[7] El document Dempster–Laird–Rubin de 1977 va generalitzar el mètode i va esbossar una anàlisi de convergència per a una classe més àmplia de problemes. El document Dempster-Laird-Rubin va establir el mètode EM com una eina important d'anàlisi estadística. Vegeu també Meng i van Dyk (1997).
L'anàlisi de convergència de l'algoritme Dempster–Laird–Rubin va ser errònia i CF Jeff Wu va publicar una anàlisi de convergència correcta el 1983.[8] La prova de Wu va establir la convergència del mètode EM també fora de la família exponencial, tal com afirma Dempster–Laird–Rubin.[8]
Introducció
L'algorisme EM s'utilitza per trobar paràmetres de màxima versemblança (local) d'un model estadístic en els casos en què les equacions no es poden resoldre directament. Normalment, aquests models impliquen variables latents, a més de paràmetres desconeguts i observacions de dades conegudes. És a dir, o bé existeixen valors que falten entre les dades, o el model es pot formular de manera més senzilla assumint l'existència de punts de dades addicionals no observats. Per exemple, un model de barreja es pot descriure de manera més senzilla assumint que cada punt de dades observat té un punt de dades no observat corresponent, o variable latent, especificant el component de la barreja al qual pertany cada punt de dades.
Amb la capacitat de fer front a les dades que falten i d'observar variables no identificades, EM s'està convertint en una eina útil per valorar i gestionar el risc d'una cartera.
En enginyeria estructural, l'algoritme d'identificació estructural mitjançant la maximització de les expectatives (STRIDE) és un mètode només de sortida per identificar les propietats de vibració natural d'un sistema estructural mitjançant dades de sensors (vegeu Anàlisi modal operativa).
En l'anàlisi dels temps d'espera entre operacions, és a dir, el temps entre les operacions posteriors d'accions en una borsa de valors, l'algorisme EM ha demostrat ser molt útil.[12]
Referències
↑Meng, X.-L.; van Dyk, D. J. Royal Statist. Soc. B, 59, 3, 1997, pàg. 511–567. DOI: 10.1111/1467-9868.00082 [Consulta: free].
↑Lindstrom, Mary J; Bates, Douglas M Journal of the American Statistical Association, 83, 404, 1988, pàg. 1014. DOI: 10.1080/01621459.1988.10478693.
↑Van Dyk, David A Journal of Computational and Graphical Statistics, 9, 1, 2000, pàg. 78–98. DOI: 10.2307/1390614. JSTOR: 1390614.
↑Diffey, S. M; Smith, A. B; Welsh, A. H; Cullis, B. R Australian & New Zealand Journal of Statistics, 59, 4, 2017, pàg. 433. DOI: 10.1111/anzs.12208 [Consulta: free].