Градиентный спуск

Градиентный спуск, метод градиентного спуска — численный метод нахождения локального минимума или максимума функции с помощью движения вдоль градиента, один из основных численных методов современной оптимизации.

Активно используется в вычислительной математике не только для непосредственного решения задач оптимизации (минимизации), но и для задач, которые могут быть переписаны на языке оптимизации (решение нелинейных уравнений, поиск равновесий, обратные задачи и т. д.). Метод градиентного спуска можно использовать для задач оптимизации в бесконечномерных пространствах, например, для численного решения задач оптимального управления.

Особенно большой интерес к градиентным методам в последние годы связан с тем, что градиентные спуски и их стохастические / рандомизированные варианты лежат в основе почти всех современных алгоритмов обучения, разрабатываемых в анализе данных.

Описание

Иллюстрация последовательных приближений к точке экстремума в направлении наискорейшего спуска (красн.) в случае дробного шага. Синим отмечены линии уровня.

Пусть целевая функция имеет вид:

.

И задача оптимизации задана следующим образом:

В случае, когда требуется найти максимум, вместо используется

Основная идея метода заключается в том, чтобы идти в направлении наискорейшего спуска, а это направление задаётся антиградиентом :

где задает скорость градиентного спуска и может быть выбрана

  • постоянной (в этом случае метод может расходиться);
  • убывающей в процессе градиентного спуска;
  • гарантирующей наискорейший спуск:
    1. Для поиска минимума получаем
    2. Для поиска максимума получаем

Алгоритм

  1. Задают начальное приближение и точность расчёта
  2. Рассчитывают , где
  3. Проверяют условие остановки:
    • Если , или (выбирают одно из условий), то и переход к шагу 2.
    • Иначе и остановка.

Соотношение Канторовича

Для квадратичной функции вида метод наискорейшего градиентного поиска сходится из любой начальной точки со скоростью геометрической прогрессии (линейно) со знаменателем, не превосходящим значение . При этом справедливы следующие оценки:

,
,
,

где и  — минимальное и максимальное собственные числа матрицы вторых производных .

Таким образом, поскольку функция близка в малом к своей квадратичной аппроксимации, скорость сходимости, в окрестности точки минимума, зависит от отношения собственных чисел. Чем больше это отношение, тем хуже сходимость метода.

Пример

Применим градиентный метод к функции . Тогда последовательные приближения будут выглядеть так:

Градиентный метод в действии. Иллюстрация для линий равного уровня.Градиентный метод в действии. Иллюстрация для поверхности.

Это типичный пример овражной функции. Градиентный метод «прыгает» с одного склона оврага на другой и обратно, иногда почти не двигаясь в нужном направлении, что существенно замедляет сходимость. Другим примером тестовой овражной функции является функция Розенброка.

Усовершенствования, модификации

Для минимизации функции в направлении градиента используются методы одномерной оптимизации, например, метод золотого сечения. Также можно искать не наилучшую точку в направлении градиента, а какую-либо лучше текущей.

Метод градиентного спуска наиболее простой в реализации из всех методов локальной оптимизации. Имеет довольно слабые условия сходимости, но при этом скорость сходимости достаточно мала (линейна). Шаг градиентного метода часто используется как часть других методов оптимизации, например, метод Флетчера — Ривса.

Метод градиентного спуска оказывается очень медленным при движении по оврагу, причём при увеличении числа переменных целевой функции такое поведение метода становится типичным. Для борьбы с этим явлением используется метод оврагов, суть которого очень проста. Сделав два шага градиентного спуска и получив три точки, третий шаг следует сделать в направлении вектора, соединяющего первую и третью точку, вдоль дна оврага.

Для функций, близких к квадратичным, эффективным является метод сопряжённых градиентов.

Применение в искусственных нейронных сетях

Метод градиентного спуска с некоторой модификацией широко применяется для обучения перцептрона и в теории искусственных нейронных сетей известен как метод обратного распространения ошибки. При обучении нейросети типа «персептрон» требуется изменять весовые коэффициенты сети так, чтобы минимизировать среднюю ошибку на выходе нейронной сети при подаче на вход последовательности обучающих входных данных. Формально, чтобы сделать всего один шаг по методу градиентного спуска (сделать всего одно изменение параметров сети), необходимо подать на вход сети последовательно абсолютно весь набор обучающих данных, для каждого объекта обучающих данных вычислить ошибку и рассчитать необходимую коррекцию коэффициентов сети (но не делать эту коррекцию), и уже после подачи всех данных рассчитать сумму в корректировке каждого коэффициента сети (сумма градиентов) и произвести коррекцию коэффициентов «на один шаг». Очевидно, что при большом наборе обучающих данных алгоритм будет работать крайне медленно, поэтому на практике часто производят корректировку коэффициентов сети после каждого элемента обучения, где значение градиента аппроксимируются градиентом функции стоимости, вычисленном только на одном элементе обучения. Такой метод называют стохастическим градиентным спуском или оперативным градиентным спуском. Стохастический градиентный спуск является одной из форм стохастического приближения. Теория стохастических приближений даёт условия сходимости метода стохастического градиентного спуска.

Ссылки

Литература

  • Поляк Б. Т. Введение в оптимизацию. — М.: Наука. Главная редакция физико-математической литературы, 1983. — 384 с.
  • Нестеров Ю. Е. Методы выпуклой оптимизации. — М.: Издательство МЦНМО, 2010. — 281 с.
  • Гасников А. В. Современные численные методы оптимизации. Метод универсального градиентного спуска : учебное пособие. — М.: МФТИ, 2018. — 291 с. — ISBN 978-5-7417-0667-1.
  • Акулич И. Л. Математическое программирование в примерах и задачах. — М.: Высшая школа, 1986. — С. 298-310.
  • Гилл Ф., Мюррей У., Райт М. Практическая оптимизация = Practical Optimization. — М.: Мир, 1985.
  • Коршунов Ю. М., Коршунов Ю. М. Математические основы кибернетики. — М.: Энергоатомиздат, 1972.
  • Максимов Ю. А., Филлиповская Е. А. Алгоритмы решения задач нелинейного программирования. — М.: МИФИ, 1982.
  • Максимов Ю. А. Алгоритмы линейного и дискретного программирования. — М.: МИФИ, 1980.
  • Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. — М.: Наука, 1970. — С. 575-576.
  • Городецкий С. Ю., Гришагин В. А. Нелинейное программирование и многоэкстремальная оптимизация. — Нижний Новгород: Издательство Нижегородского Университета, 2007. — С. 357-363.

Read other articles:

أسهر الاسم العلميvas deferens رسم يوضح تشريح الجهاز التناسلي الذكري قطع عمودي للخصية، وتظهر ترتيب القنوات.قطع عمودي للخصية، وتظهر ترتيب القنوات. تفاصيل الشريان المغذي شريان مثاني علوي، شريان الأسهر تصريف اللمف عقد لمفية حرقفية ظاهرة، عقد لمفية حرقفية غائرة سلف قناة وولف نوع من

 

Stephen Wooldridge Zur Person Vollständiger Name Stephen Brian Wooldridge Geburtsdatum 17. Oktober 1977 Sterbedatum 14. August 2017 Nation Australien Australien Disziplin Bahn (Ausdauer) / Straße Karriereende 2007 Wichtigste Erfolge Olympische Spiele 2004 – Mannschaftsverfolgung Letzte Aktualisierung: 2. Januar 2019 Stephen Brian Wooldridge, OAM (* 17. Oktober 1977 in Sydney; † 14. August 2017[1][2]) war ein australischer Radrennfahrer. Sportliche Laufbahn...

 

Nama ini menggunakan aturan penamaan Slavia Timur; nama patronimiknya adalah Vladimirovna dan nama keluarganya adalah Poklonskaya. Natalia PoklonskayaDeputi Duma Negara RusiaPetahanaMulai menjabat 5 Oktober 2016Jaksa Agung Republik KrimeaMasa jabatan2014 – 4 Oktober 2016PresidenVladimir PutinPerdana MenteriSergey AksyonovPendahuluBaru terbentukPenggantiOleg Kamshylov Informasi pribadiLahir18 Maret 1980 (umur 43)ProfesiPengacara, Jaksa AgungSunting kotak info • L...

Swedish musical instrument company Elektron Music MachinesTypePrivateIndustryMusical instrumentsFounded1998; 25 years ago (1998)HeadquartersGothenburg, SwedenArea servedWorldwideKey peopleJonas Hillman (Owner)ProductsMusical instrumentsEffects unitsMusic softwareWebsiteelektron.seThis article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources:...

 

Kongres Amerika Serikat ke-52Gedung Capitol (1906)Periode4 Maret 1891 – 4 Maret 1893Anggota88 senator332 anggota dewan4 delegasi tanpa suaraMayoritas SenatPartai RepublikPresiden SenatLevi P. Morton (R)Mayoritas DPRPartai DemokratKetua DPRCharles F. Crisp (D)Pres. Senat Pro TemporeCharles F. Manderson (R)Sesike-1: 7 Desember 1891 – 5 Agustus 1892ke-2: 5 Desember 1892 – 3 Maret 1893ke-51 ←→ ke-53 Kongres Amerika Serikat ke-52 adalah sebuah pertemuan cabang legislatif p...

 

NBR D Class LNER Class J83Condemned No 68470 in a dump at Bathgate Locomotive Depot 19 September 1962Type and originPower typeSteamDesignerMatthew HolmesBuilderNeilson and Company, Sharp, Stewart and CompanyBuild date1900-1901Total produced40SpecificationsConfiguration:​ • Whyte0-6-0Gauge4 ft 8+1⁄2 in (1,435 mm)Driver dia.4 ft 6 in (1.372 m)Loco weight45 LT 5 cwt (46.0 t)Fuel typeCoalBoiler pressure150 lbf/in2 (1....

Die NachtLied by Richard StraussThe Starry Night by Vincent van Gogh, 1889EnglishThe NightCatalogueTrV 141Opus10TextPoem by Hermann von GilmLanguageGermanComposed1885DedicationHeinrich VoglScoringVoice and piano Die Nacht (The Night) is an art song composed by Richard Strauss in 1885, setting a poem by the Austrian poet Hermann von Gilm. It was included in the first collection of songs Strauss ever published, as Op. 10 in 1885 (which included also Zueignung). The song is written for voice and...

 

Fabien Lemoine Lemoine berseragamRennesInformasi pribadiTanggal lahir 16 Maret 1987 (umur 36)Tempat lahir Fougères, PrancisTinggi 1,75 m (5 ft 9 in)Posisi bermain GelandangInformasi klubKlub saat ini Saint-ÉtienneNomor 18Karier junior2003–2007 RennesKarier senior*Tahun Tim Tampil (Gol)2007–2011 Rennes 105 (1)2011– Saint-Étienne 4 (0) * Penampilan dan gol di klub senior hanya dihitung dari liga domestik dan akurat per 29 Mei 2011 Fabien Lemoine (lahir 16 Maret...

 

Pekan Olahraga Nasional XI 1985Tuan rumah JakartaUpacara pembukaan9 September 1985Upacara penutupan20 September 1985Dibuka olehSoehartoPresiden Republik Indonesia← Jakarta X Jakarta XII → PON XI diselenggarakan di Jakarta pada tanggal 9 September sampai dengan 20 September 1985. Ketua Penyelenggara: -- Cabang olahraga Bola basket Peserta  Daerah Istimewa Aceh  Sumatera Utara  Sumatera Barat  Riau  Jambi  Sumatera Selatan  Bengkulu  Lampung &...

This article relies largely or entirely on a single source. Please help improve this article by introducing citations to additional sources.Find sources: Kiribati at the 2023 World Athletics Championships – news · newspapers · books · scholar · JSTOR (August 2023) Sporting event delegationKiribati at the2023 World Athletics ChampionshipsFlag of KiribatiWA codeKIRin Budapest, Hungary19 August 2023 (2023-08-19) – 27 August ...

 

Battle of the American Civil War Not to be confused with the 1862 Battle of Booneville in Mississippi. This article has an unclear citation style. The references used may be made clearer with a different or consistent style of citation and footnoting. (January 2013) (Learn how and when to remove this template message) First Battle of BoonvillePart of the Trans-Mississippi Theater of theAmerican Civil WarThe Battle of Boonville, Mo. by Orlando C. RichardsonDateJune 17, 1861LocationBoonville, M...

 

Indian script Gujaratiગુજરાતી લિપિScript type Abugida Time periodc. 1592–presentDirectionleft-to-right LanguagesGujarati, Kutchi, Bhili, Dungra Bhil, Gamit, Kukna, Rajput Garasia, Vaghri, Varli, Vasavi, Avestan (Indian Zoroastrians)[1]Related scriptsParent systemsEgyptianProto-SinaiticPhoenicianAramaicBrahmiGuptaSiddhaṃNāgarī[2]GujaratiSister systemsDevanagari[3]ModiKaithiNandinagariISO 15924ISO 15924Gujr (320), ​Gujarat...

For the animation studio in Mexico City, Mexico, see Ánima (company). For the animation studio in Czech, see Anima sro. ANIMAFormerlyGlobe Studios (2016–2022)TypeDivisionIndustryFilm, podcast and television productionFounded2016HeadquartersBonifacio Global City, Taguig, PhilippinesKey peopleQuark HenaresParentKroma Entertainment(Globe Telecom Group Retirement Fund)Websiteanima.ph Anima (stylized in uppercase), formerly known as Globe Studios, is a Filipino entertainment production company....

 

Village in West Yorkshire, England Human settlement in EnglandLaycockLooking eastwards with Laycock Lane on the left and Green Scar Lane on the rightLaycockLocation within West YorkshireOS grid referenceSE0340Metropolitan boroughCity of BradfordMetropolitan countyWest YorkshireRegionYorkshire and the HumberCountryEnglandSovereign stateUnited KingdomPost townKeighleyPostcode districtBD22Dialling code01535PoliceWest YorkshireFireWest YorkshireAmbulanceYorkshir...

 

Housing estate in East London Houses on Saracen Street, built in 1951–52, form the north site of the Lansbury Estate The Lansbury Estate is a large, historic council housing estate in Poplar and Bromley-by-Bow in the London Borough of Tower Hamlets. It is named after George Lansbury, a Poplar councillor and Labour Party MP. History Lansbury Estate is one of the largest such estates in London. It occupies an area bounded by the East India Dock Road to the south, the Docklands Light Railway t...

Sesuatu yang TertundaAlbum studio karya PadiDirilis2 Juli 2001Direkam15 Januari 2001 – 26 Februari 2001Studio Gins Studio (Rekaman Trek Dasar) Ara Studio (Sesi Rekaman) Musica Mastering Studio (Mastering) GenreRock alternatifDurasi47:07LabelSonyProduserPiyu & Jan DjuhanaKronologi Padi Lain Dunia(1999)Lain Dunia1999 Sesuatu yang Tertunda (2001) Save My Soul(2003)Save My Soul2003 Singel dalam album Sesuatu yang Tertunda Semua Tak SamaDirilis: 2 Maret 2001 Sesuatu yang IndahDirilis: 10...

 

У этого термина существуют и другие значения, см. Аэробус. Airbus Главные производственные мощности Airbus в Тулузе, Франция Тип Дочерняя компания Основание 1970 Основатели Roger Béteille[d], Felix Kracht[d], Henri Ziegler[d] и Франц Йозеф Штраус Расположение  Франция: Тулуза Ключевые фигу...

 

Este artigo carece de reciclagem de acordo com o livro de estilo. Sinta-se livre para editá-lo(a) para que este(a) possa atingir um nível de qualidade superior. (Setembro de 2020) História da Loucura Autor(es) Michel Foucault Idioma francês País França Assunto loucura e razão Gênero ensaio Editora Perspectiva (edição brasileira) Lançamento 1961 (edição francesa) ISBN 978-85-273-0109-1 Cronologia Doença mental e psicologia O Nascimento da Clínica História da Loucura na Idade Cl...

Mountainous region in central Eritrea Sunset on the road between Keren and Agordat in the highland Anseba Region of Eritrea. The Eritrean Highlands are a mountainous region in central Eritrea. Bordered to the south by the Mareb River, it is a northern continuation of the Ethiopian Highlands. The region has seen tremendous deforestation since the colonial period, which began in the late 19th century. The Highlands are at particular risk of deforestation and associated soil erosion. Furthermore...

 

Medical conditionTerminal complement pathway deficiencycomplement membrane attack complex Terminal complement pathway deficiency is a genetic condition affecting the complement membrane attack complex (MAC). It involves deficiencies of C5, C6, C7, and C8. (While C9 is part of the MAC, and deficiencies have been identified,[1] it is not required for cell lysis.[2]) People with this condition are prone to meningococcal infection.[3] Vaccination may be recommended.[4&...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!