Функция активации

Логистическая функция активации

В искусственных нейронных сетях функция активации нейрона определяет выходной сигнал, который определяется входным сигналом или набором входных сигналов. Стандартная компьютерная микросхема может рассматриваться как цифровая сеть функций активации, которые могут принимать значения «ON» (1) или «OFF» (0) в зависимости от входа. Это похоже на поведение линейного перцептрона в нейронных сетях. Однако только нелинейные функции активации позволяют таким сетям решать нетривиальные задачи с использованием малого числа узлов. В искусственных нейронных сетях эта функция также называется передаточной функцией.

Функции

В биологических нейронных сетях функция активации обычно является абстракцией, представляющей скорость возбуждения потенциала действия в клетке [1]. В наиболее простой форме эта функция является двоичной — то есть нейрон либо возбуждается, либо нет. Функция выглядит как , где ступенчатая функция Хевисайда. В этом случае нужно использовать много нейронов для вычислений за пределами линейного разделения категорий.

Прямая с положительным угловым коэффициентом может быть использована для отражения увеличения скорости возбуждения по мере увеличения входного сигнала. Такая функция имела бы вид , где наклон прямой. Эта функция активации линейна, а потому имеет те же проблемы, что и двоичная функция. Кроме того, сети, построенные с использованием такой модели, имеют нестабильную сходимость[англ.], поскольку возбуждение приоритетных входов нейронов стремится к безграничному увеличению, так как эта функция не нормализуема.

Все проблемы, упомянутые выше, можно решить с помощью нормализуемой сигмоидной функции активации. Одна из реалистичных моделей остаётся в нулевом состоянии, пока не придёт входной сигнал, в этот момент скорость возбуждения сначала быстро возрастает, но постепенно достигает асимптоты в 100 % скорости возбуждения. Математически, это выглядит как , где гиперболический тангенс можно заменить любой сигмоидой. Такое поведение реально имеет место в биологическом нейроне, поскольку нейроны не могут физически возбуждаться быстрее некоторой определённой скорости. Эта модель, однако, имеет несколько проблем в вычислительных сетях, поскольку функция не дифференцируема, что нужно для вычисления обратной передачи ошибки обучения.

Последняя модель, которая используется в многослойных перцептронах — сигмоидная функция активации в форме гиперболического тангенса. Обычно используются два вида этой функции: , образ которой нормализован к интервалу [-1, 1], и , сдвинутая по вертикали для нормализации от 0 до 1. Последняя модель считается более биологически реалистичной, но имеет теоретические и экспериментальные трудности с вычислительными ошибками некоторых типов.

Альтернативные структуры

Специальный класс функций активации, известный как радиальные базисные функции (РБФ) используются в РБФ сетях, которые крайне эффективны в качестве универсальных аппроксиматоров функций. Эти функции активации могут принимать множество форм, но обычно берётся одна из следующих трёх функций:

  • Гауссова:
  • Мультиквадратичная (англ. Multiquadratics):
  • Обратная мультиквадратичная (англ. Inverse Multiquadratics):

где является вектором, представляющим центр функции, а и являются параметрами, влияющими на расходимость радиуса.

Методы опорных векторов (SVM) могут эффективно использовать класс функций активации, который включает как сигмоиды, так и РБФ. В этом случае вход преобразуется для отражения гиперплоскости границы решений основываясь на нескольких обучающих входных данных, называемых опорными векторами . О функции активации для закрытого уровня этих машин говорят как о ядре скалярного произведения (англ. inner product kernel), . Опорные вектора представляются как центры в РБФ с ядром, равным функции активации, но они принимают единственный вид в перцептроне

,

где для сходимости и должны удовлетворять некоторым условиям. Эти машины могут принимать полиномиальные функции активации любого порядка

[2].

Функции активации бывают следующих типов:

  • Тождественная функция
  • Двоичная ступенчатая функция
  • Биполярная[3] ступенчатая функция
  • Cигмоидная функция
    • Двоичная cигмоидальная функция
    • Биполярная сигмоидная функция
  • Функция подъёма[4]

Сравнение функций активации

Некоторые желательные свойства функций активации:

  • Нелинейность – Если функция активации нелинейна, можно доказать, что двухуровневая нейронная сеть будет универсальным аппроксиматором функции [5]. Тождественная функция активации не удовлетворяет этому свойству. Если несколько уровней используют тождественную функцию активации, вся сеть эквивалентна одноуровневой модели.
  • Непрерывная дифференцируемость – Это свойство желательно (RELU не является непрерывно дифференцируемой и имеет некоторые проблемы с оптимизацией, основанной на градиентном спуске, но остаётся допустимой возможностью) для обеспечения методов оптимизации на основе градиентного спуска. Двоичная ступенчатая функция активации не дифференцируема в точке 0 и её производная равна 0 во всех других точках, так что методы градиентного спуска не дают никакого успеха для неё[6].
  • Область значений – Если множество значений функции активации ограничено, методы обучения на основе градиента более стабильны, поскольку представления эталонов существенно влияют лишь на ограниченный набор весов связей. Если область значений бесконечна, обучение, как правило, более эффективно, поскольку представления эталонов существенно влияют на большинство весов. В последнем случае обычно необходим меньший темп обучения.
  • Монотонность – Если функция активации монотонна, поверхность ошибок, ассоциированная с одноуровневой моделью, гарантированно будет выпуклой [7].
  • Гладкие функции с монотонной производной – Показано, что в некоторых случаях они обеспечивают более высокую степень общности.
  • Аппроксимирует тождественную функцию около начала координат – Если функции активации имеют это свойство, нейронная сеть будет обучаться эффективно, если её веса инициализированы малыми случайными значениями. Если функция активации не аппроксимирует тождество около начала координат, нужно быть осторожным при инициализации весов[8]. В таблице ниже функции активации, у которых , и непрерывна в точке 0, помечены как имеющие это свойство.

Следующая таблица сравнивает свойства некоторых функций активации, которые являются функциями одной свёртки x от предыдущего уровня или уровней:

Название График Уравнение Производная (по x) Область значений Порядок гладкости Монотонная Монотонная производная Аппроксимирует тождественную
функцию около начала координат
Тождественная Да Да Да
Единичная ступенька Да Нет Нет
Логистическая (сигмоида или Гладкая ступенька) [1] Да Нет Нет
th Да Нет Да
arctg Да Нет Да
Softsign[9][10] Да Нет Да
Обратный квадратный корень (англ. Inverse square root unit, ISRU)[11] Да Нет Да
Линейный выпрямитель[англ.] (или Полулинейный элемент)

(англ. Rectified linear unit, ReLU) [12][13]

Да Да Нет
Линейный выпрямитель с «утечкой» (англ. Leaky rectified linear unit, Leaky ReLU)[14] Да Да Нет
Параметрический линейный выпрямитель (англ. Parameteric rectified linear unit, PReLU)[15] [2] Да,
когда
Да Да,
когда
Рандомизированный линейный выпрямитель с «утечкой» (англ. Randomized leaky rectified linear unit, RReLU)[16] [3] Да Да Нет
Экспоненциальная линейная функция (англ. Exponential linear unit, ELU)[17] Да,
когда
Да,
когда
Да,
когда
Масштабированная экспоненциальная линейная функция (англ. Scaled exponential linear unit, SELU)[18]

с и

Да Нет Нет
Линейный S-выпрямитель (англ. S-shaped rectified linear activation unit, SReLU)[19]
являются параметрами.
Нет Нет Нет
Обратный квадратный линейный корень (англ. Inverse square root linear unit, ISRLU)[11] Да Да Да
Адаптивная кусочно-линейная функция (англ. Adaptive piecewise linear, APL)[20] [4] Нет Нет Нет
SoftPlus[21] Да Да Нет
Выгнутая тождественная функция (англ. Bent identity) Да Да Да
Cигмоидно-взвешенная линейная функция (англ. Sigmoid-weighted linear unit, SiLU)[22] [5] [6] Нет Нет Нет
SoftExponential[23] Да Да Да,
когда
Синусоида[24] Нет Нет Да
Sinc Нет Нет Нет
Гауссова Нет Нет Нет
 Здесь, H является ступенчатой функцией Хевисайда.
 α является стохастической переменной, берущейся из равномерного распределения в момент обучения, значение которой фиксируется равным математическому ожиданию распределения в момент тестирования.
   Здесь является логистической функцией.

Следующая таблица перечисляет функции активации, которые не являются функциями от одной свёртки x от предыдущего уровня или уровней:

Название Уравнение Производные Область значений Степень гладкости
Softmax    для i = 1, …, J [7]
Maxout[25]

  Здесь обозначает символ Кронекера.

См. также

Примечания

  1. Hodgkin, Huxley, 1952, с. 500–544.
  2. Haykin, 1999.
  3. Биполярная – принимающая значение -1 до начала координат и 1 после, в отличие от двоичной ступенчатой функции, которая принимает до начала координат значения 0.)
  4. Функция подъёма принимает значение 0 до начала координат и линейна после.
  5. Cybenko, 2006, с. 303.
  6. Snyman, 2005.
  7. Wu, 2009, с. 3432–3441.
  8. Sussillo, David; Abbott, L. F. (19 декабря 2014). "Random Walk Initialization for Training Very Deep Feedforward Networks". arXiv:1412.6558 [cs.NE].
  9. James Bergstra, Guillaume Desjardins, Pascal Lamblin, Yoshua Bengio. Quadratic polynomials learn better image features". Technical Report 1337. Département d’Informatique et de Recherche Opérationnelle, Université de Montréal (2009). Дата обращения: 30 сентября 2018. Архивировано из оригинала 25 сентября 2018 года.
  10. Glorot, Bengio, 2010.
  11. 1 2 Carlile, Brad; Delamarter, Guy; Kinney, Paul; Marti, Akiko; Whitney, Brian (9 ноября 2017). "Improving Deep Learning by Inverse Square Root Linear Units (ISRLUs)". arXiv:1710.09967 [cs.LG].
  12. По аналогии с диодом – пропускает ток (не меняя его) в одну сторону, и не пропускает в другую.
  13. Nair, Hinton, 2010, с. 807–814.
  14. Maas, Hannun, Ng, 2013.
  15. He, Zhang, Ren, Sun, 2015.
  16. Xu, Wang, Chen, Li, 2015.
  17. Clevert, Djork-Arné; Unterthiner, Thomas; Hochreiter, Sepp (23 ноября 2015). "Fast and Accurate Deep Network Learning by Exponential Linear Units (ELUs)". arXiv:1511.07289 [cs.LG].
  18. Klambauer, Unterthiner, Mayr, Hochreiter, 2017.
  19. Jin, Xiaojie; Xu, Chunyan; Feng, Jiashi; Wei, Yunchao; Xiong, Junjun; Yan, Shuicheng (22 декабря 2015). "Deep Learning with S-shaped Rectified Linear Activation Units". arXiv:1512.07030 [cs.CV].
  20. Forest Agostinelli; Matthew Hoffman; Peter Sadowski; Pierre Baldi (2014-12-21). "Learning Activation Functions to Improve Deep Neural Networks". arXiv:1412.6830 [cs.NE].
  21. Xavier Glorot, Antoine Bordes, Yoshua Bengio. Deep sparse rectifier neural networks. International Conference on Artificial Intelligence and Statistics (2011). Дата обращения: 30 сентября 2018. Архивировано 19 июня 2018 года.
  22. Elfwing, Uchibe, Doya, 2018.
  23. Godfrey, Gashler, 2016, с. 481–486.
  24. Gashler, Ashmore, 2014.
  25. Goodfellow, Warde-Farley, Mirza, Courville, Bengio, 2013, с. 1319–1327.

Литература

Read other articles:

Siswono Yudo HusodoMenteri Transmigrasi dan Pemukiman Perambah Hutan Indonesia ke-8Masa jabatan17 Maret 1993 – 14 Maret 1998PresidenSoehartoPendahuluSoegiartoPenggantiA.M. HendropriyonoMenteri Negara Perumahan Rakyat Indonesia ke-2Masa jabatan21 Maret 1988 – 17 Maret 1993PresidenSoehartoPendahuluCosmas BatubaraPenggantiAkbar TanjungAnggota Dewan Perwakilan RakyatMasa jabatan1 Oktober 2009 – 1 Oktober 2014Daerah pemilihanJawa Tengah IAnggota Majelis Per...

 

Kementerian Pendidikan, Kebudayaan, dan Ilmu PengetahuanMinisterie van Onderwijs, Cultuur en WetenschapLambang BelandaKementerian Pendidikan, Budaya dan Ilmu PengetahuanInformasi KementerianDibentuk9 September 1918; 105 tahun lalu (1918-09-09)Wilayah hukumKerajaan BelandaKantor pusatRijnstraat 50, Den Haag, BelandaAnggaran tahunan€31,4 miliar (2013)[1]MenteriRobbert Dijkgraaf, Menteri Pendidikan, Kebudayaan, dan Ilmu PengetahuanMariëlle Paul, MenteriWakil Menterilowong, Sekret...

 

KaengSemangkuk kaeng phet pet yang,bebek panggang kari merahNama lainKari ThaiJenisKariTempat asalThailandBahan utamaBumbu kari, santan, air, daging, boga bahari, sayuran, rempah Kaeng adalah sebutan yang merujuk kepada hidangan kari ala Thailand, maka dapat juga disebut Kari Thai. Kari Thai ini dibuat dari bahan bumbu kari yang dihaluskan, santan, air, daging, ikan atau boga bahari, sayuran atau buah serta rempah-rempah. Kari di Thailand pada umumnya berbeda dari kari India, terutama dalam p...

Sir Henry KeppelLaksamana Sir Henry KeppelLahir(1809-06-14)14 Juni 1809Kensington, LondonMeninggal17 Januari 1904(1904-01-17) (umur 94)Piccadilly, LondonDikebumikanSt Mary the Virgin, WinkfieldPengabdianUnited KingdomDinas/cabangRoyal NavyLama dinas1822–1879PangkatLaksamana, Panglima ArmadaKomandanHMS Childers (1827)HMS Maeander (1840)HMS St Jean d'Acre (1853)HMS Rodney (1833)HMS Colossus (1848)Panglima Tertinggi, AfrikaPanglima Tertinggi, Pangkalan Pantai Tenggara AmerikaPangkala...

 

Halaman ini berisi artikel tentang Filmnya. Untuk novel aslinya, lihat The Trench (novel). Meg 2: The TrenchPoster rilis teaterSutradara Ben Wheatley Produser Lorenzo di Bonaventura Belle Avery Ditulis oleh Jon Hoeber Erich Hoeber Dean Georgaris Skenario Jon Hoeber Erich Hoeber Dean Georgaris Cerita Dean Georgaris Jon Hoeber Erich Hoeber BerdasarkanThe Trencholeh Steve AltenPemeran Jason Statham Wu Jing Sophia Cai Page Kennedy Sergio Peris-Mencheta Skyler Samuels Cliff Curtis Penata mus...

 

Pfarrkirche hl. Martin in Aschach an der Steyr Die Pfarrkirche Aschach an der Steyr steht im Ort Aschach an der Steyr in der Gemeinde Aschach an der Steyr in Oberösterreich. Die römisch-katholische Pfarrkirche hl. Martin gehört zum Dekanat Steyrtal in der Diözese Linz. Die Kirche steht unter Denkmalschutz. Inhaltsverzeichnis 1 Geschichte 2 Architektur 3 Ausstattung 4 Literatur Geschichte Eine Kirche wurde 1108 urkundlich genannt. Der Chor aus 1471 und das Langhaus aus 1513 wurden 1892 res...

Uang kertas 5 pound Australia (£5) adalah nilai uang kertas yang pertama kali dikeluarkan di Australia pada tahun 1913 sampai desimalisasi di mata uang Australia untuk penggantinya oleh uang kertas 10 dolar Australia pada tahun 1966. Uang kertas ini menampilkan gambar di mantel lengan dan Hawkesbury River. Pranala luar (Inggris) Museum of Australian Currency Notes Diarsipkan 2011-03-12 di Wayback Machine. (Inggris) Australian stamp Diarsipkan 2007-12-22 di Wayback Machine. lbsMata uang Austr...

 

اللغة الإنجليزية القديمة Old English الاسم الذاتي Ænglisc spræc لفظ الاسم ‎/ˈɪŋɡlɪʃ/‏[1] تفاصيل من الصفحة الأولى من مخطوطة بيوولف، تظهر عبارة ofer hron rade، أي على طريق الحوت (البحر). وهو مثال على الشكل الأنيق القديم الإنجليزية. الاختراع المستوطنين الأنجلوسكسونيين في القرن الخامس...

 

Мапа розташування Франції До списку лускокрилих Франції віднесені метелики, зареєстровані в континентальній Франції та Корсиці. Зміст 1 Денні метелики 1.1 Hesperiidae 1.2 Lycaenidae 1.3 Nymphalidae 1.4 Papilionidae 1.5 Pieridae 2 Молі 2.1 Adelidae 2.2 Alucitidae 2.3 Argyresthiidae 2.4 Autostichidae 2.5 Batrachedridae 2.6 Bedelliidae 2.7 Blastobasidae 2.8 Brachod...

2014 Indian filmAryanTheatrical release posterDirected byD. Rajendra BabuChi Guru DuttScreenplay byD. Rajendra BabuStory byD. Rajendra BabuProduced byDhruv DasStarringShiva RajkumarRamyaNarrated bySudeepCinematographyChandrashekarMusic byJassie GiftProductioncompanyDreamweaver EntertainmentDistributed byDreamweaver EntertainmentRelease date 1 August 2014 (2014-08-01) Running time117 minutesCountryIndiaLanguageKannada Aryan is a 2014 Indian Kannada-language sports drama film. In...

 

  لمعانٍ أخرى، طالع حرب (توضيح).   هذه المقالة عن نزاع عسكري. لمعانٍ أخرى، طالع قبيلة حرب. جزء من سلسلة عليالحرب التاريخ ما قبل التاريخ الحروب القديمة ما بعد الكلاسيكية أوائل العصر الحديث أواخر العصر الحديث الصناعية الجيل الرابع ساحة المعركة الجوية الإلكترونية ال...

 

Firma de Pedro Tafur.[1]​ Andanzas y viajes de Pedro Tafur (originalmente Tractado de las andanças e viajes de Pero Tafur o Itinerario) es un libro de viajes medieval escrito hacia 1454 por el caballero, escritor y viajero castellano Pedro Tafur. En él relata su periplo realizado entre 1436 y 1439 por lugares del Mediterráneo (Creta, Rodas, Chipre, Quíos o Egipto), de Oriente Próximo (Tierra Santa, Esmirna, Trebisonda y Crimea) y gran parte de Europa (Estrasburgo, Bruselas, Magunci...

ألكسندر ستيرلينغ معلومات شخصية تاريخ الميلاد 20 أكتوبر 1927(1927-10-20) تاريخ الوفاة 16 يوليو 2014 (86 سنة) مواطنة المملكة المتحدة  مناصب سفير المملكة المتحدة لدى العراق   في المنصب1977  – 1980  سفير المملكة المتحدة لدى تونس   في المنصب1981  – 1984  سفير المملكة المتحدة لدى ال...

 

Universitas Lancang Kuning (Unilak)Lambang Universitas Lancang KuningMotoThe Best University With Melayu Culture In the WorldMoto dalam bahasa IndonesiaUniversitas Unggul Dengan SDM Berdasarkan Budaya Melayu Di DuniaJenisUniversitasDidirikan9 Juni 1982RektorProf. Dr. Junaidi, S.S., M.Hum.LokasiPekanbaru, Riau, Indonesia0°34'34N 101°25'30EWarnaKuningAfiliasiYayasan Raja Ali HajiSitus webhttps://www.unilak.ac.id/ Gedung Universitas Lancang Kuning di Pekanbaru Universitas Lancang Kuning a...

 

此條目需要补充更多来源。 (2019年12月12日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:少数民族 — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源(判定指引)。   提示:此条目的主题不是少数群体。 少数民族,是主体民族与少数民...

1515 painting by Titian This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Vanity Titian – news · newspapers · books · scholar · JSTOR (July 2017) (Learn how and when to remove this template message) VanityArtistTitianYearc. 1515[1]MediumOil on canvasDimensions97 cm × 81.2 cm...

 

Для улучшения этой статьи желательно: Проставить сноски, внести более точные указания на источники.После исправления проблемы исключите её из списка. Удалите шаблон, если устранены все недостатки. Квантовое сверхплотное кодирование — метод, позволяющий передать два...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada November 2022. Summer Love LoveNama lainTradisional夏日戀神馬Sederhana夏日恋神马MandarinXiàrì Liàn Shénmǎ Sutradara Wilson Kwok-wai Chin Produser Chen Chaoji Chen Kewu Ditulis oleh He Xin PemeranAlex FongOwodogViann ZhangCarol Yeung Terence Siuf...

May 2003 Montenegrin presidential election ← February 2003 11 May 2003 2008 → Registered458,888Turnout48.32%   Candidate Filip Vujanović Miodrag Živković Party DPS LSCG Popular vote 139,574 68,169 Percentage 64.25% 31.38% President before election Filip Vujanović (acting) DPS Elected President Filip Vujanović DPS Presidential elections were held in Montenegro on 11 May 2003.[1] They were the third such elections in six months, as those held in...

 

El 18 Brumario de Luis Bonaparte de Karl Marx Publicación del 18 Brumario en la revista Die RevolutionGénero Ensayo Filosofía políticaTema(s) Materialismo históricoEdición original en alemánTítulo original Der 18te Brumaire des Louis FILIPH Napoleon Ciudad Nueva York Fecha de publicación 1852Edición traducida al españolTítulo El 18 brumario de Luis Bonaparte[editar datos en Wikidata] El 18 de brumario de Luis Bonaparte es una obra escrita por Karl Marx entre diciemb...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!