В линейной алгебре обобщенное сингулярное разложение (ОСР) или обобщенное разложение по сингулярным значениям (GSVD - generalized singular value decomposition) — это разбиение прямоугольной матрицы с учетом ограничений, накладываемых на строки и столбцы матрицы. ОСР дает взвешенную обобщенную оценку наименьших квадратов данной матрицы с помощью матрицы более низкого ранга и, следовательно, при адекватном выборе ограничений ОСР реализует все линейные многомерные методы (например, каноническую корреляцию, линейный дискриминантный анализ, анализ соответствия, частичную регрессию наименьших квадратов (PLS-regression)).
Определение
Для данной матрицы M размером m×n, обобщающей разложение по сингулярным числам, подразумевается использование двух положительно определенных квадратных матриц U и V с размерами i×i и j×j соответственно. Эти две матрицы выражают ограничения (Wu и Wv), накладываемые соответственно на строки и столбцы матрицы M. Кроме того, Wu и Wv являются положительно определенными матрицами (часто, диагональными весовыми матрицами). Формально, если U – это матрица размером i×i, выражающая ограничения для строк M, то V – это матрица размером j×j, выражающая ограничения для столбцов M. Матрица M теперь разлагается на:
M = UΣV*,
где U*WuU = V*WvV = I,
где I – единичная матрица.
Другими словами, обобщенные сингулярные векторы ортогональны при ограничениях, наложенных U и V. Это разложение получается в результате стандартного СР.
Эта форма ОСР является основой определенных методов, таких как обобщенный МГК и анализ соответствий.
Взвешенный метод ОСР так называется, потому адекватный выбор матриц U и V делает ОСР очень универсальным инструментом, который может реализовать множество методов линейного многомерного анализа[1]. Например, анализ соответствия может быть реализован с использованием матрицы вероятностей (т. е. состоящей из положительных и нулевых чисел, сумма которых равна 1) вместе с двумя диагональными матрицами Wu и Wv, представляющими соответственно относительные частоты из строк и столбцов матрицы данных. Другие многовариантные методы (например, дискриминантный анализ, канонический корреляционный анализ) могут быть реализованы с правильным выбором матриц Wu и Wv[2].
Приложения
ОСР успешно применяется для обработки сигналов и больших объемов данных, например, для обработки геномных сигналов.[3][4][5]
Примечания
Ссылки
- ↑ Singular and Generalized Singular Value Decomposition // Encyclopedia of Measurement and Statistics. — 2455 Teller Road, Thousand Oaks California 91320 United States of America: Sage Publications, Inc.. — ISBN 9781412916110, 9781412952644.
- ↑ Greenacre, M. J. Theory and applications of correspondence analysis.. — Academic Press, 1984. — ISBN 0122990501, 9780122990502.
- ↑ O. Alter, P. O. Brown, D. Botstein. Generalized singular value decomposition for comparative analysis of genome-scale expression data sets of two different organisms // Proceedings of the National Academy of Sciences. — 2003-03-11. — Т. 100, вып. 6. — С. 3351–3356. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.0530258100.
- ↑ Cheng H. Lee, Benjamin O. Alpert, Preethi Sankaranarayanan, Orly Alter. GSVD Comparison of Patient-Matched Normal and Tumor aCGH Profiles Reveals Global Copy-Number Alterations Predicting Glioblastoma Multiforme Survival // PLoS ONE. — 2012-01-23. — Т. 7, вып. 1. — С. e30098. — ISSN 1932-6203. — doi:10.1371/journal.pone.0030098.
- ↑ Katherine A. Aiello, Orly Alter. Platform-Independent Genome-Wide Pattern of DNA Copy-Number Alterations Predicting Astrocytoma Survival and Response to Treatment Revealed by the GSVD Formulated as a Comparative Spectral Decomposition // PLOS ONE. — 2016-10-31. — Т. 11, вып. 10. — С. e0164546. — ISSN 1932-6203. — doi:10.1371/journal.pone.0164546.