مدل‌‌های انتشاری

مدل‌های انتشاری (به انگلیسی: Diffusion Models) در یادگیری ماشینی، دسته‌ای از مدل‌های متغیر پنهان (به انگلیسی: Latent Variable Models) هستند. این مدل‌ها نوعی زنجیره مارکوف هستند که با استفاده از استنباط بیزی تغییراتی آموزش داده می‌شوند.[۱] هدف مدل‌های انتشاری، یادگیری ساختار پنهان یک مجموعه داده با مدل‌سازی روشی است که در آن نقاط داده در فضای پنهان (به انگلیسی: latent space) منتشر می‌شوند. در بینایی ماشین، این یعنی یک شبکه عصبی آموزش داده می‌شود تا با یادگیری معکوس فرایند انتشاری، با شروع از نویز گاوسی به تصاویر اصلی برسد.[۲][۳]

تاریخچه

مدل‌های انتشاری در سال ۲۰۱۵ با ایده‌گرفتن از ترمودینامیک غیرتعادلی معرفی شدند.

ایده

مدل‌های انتشاری خانواده‌ای از مدل‌های مولد احتمالی هستند که به تدریج داده‌ها را با اضافه‌کردن نویز تخریب می‌کنند، سپس یادمی‌گیرند که این فرایند را برای تولید نمونه معکوس کنند. یک مدل انتشاری از دو زنجیره مارکوف استفاده می‌کند: یک زنجیره مستقیم که داده‌ها را به‌تدریج به نویز تبدیل می‌کند و یک زنجیره معکوس که نویز را به داده تبدیل می‌کند. اولی معمولاً با هدف تبدیل هر توزیع داده‌ای به یک توزیع پیشین ساده (مثلاً گاوسی استاندارد) به صورت دستی طراحی می‌شود، در حالی که زنجیره مارکوف دوم با یادگیری هسته‌های انتقال توسط شبکه‌های عصبی عمیق، اولی را معکوس می‌کند.[۴]

جزئیات

فرایند انتشار مستقیم

با داشتن یک نقطه داده نمونه‌برداری‌شده از یک توزیع داده واقعی ، فرایند انتشار مستقیم (به انگلیسی: forward diffusion process) را این‌گونه تعریف می‌کنیم که در آن مقدار کمی نویز گاوسی را در گام به نمونه ورودی اضافه می‌کنیم تا نمونه‌های نویزدار تولید شود. اندازه گام‌ها توسط یک برنامه واریانس کنترل می‌شود.

نمونه داده به تدریج ویژگی‌های قابل مشاهده خود را با بزرگتر شدن گام از دست می‌دهد. درنهایت وقتی ، معادل یک توزیع گاوسی همسان‌گرد خواهد شد.


یک ویژگی خوب فرایند فوق این است که می‌توانیم را در هر گام دلخواه به صورت فرم بسته زیر با فرض و محاسبه کنیم:[۵]

توجه کنید که وقتی دو توزیع نرمال با واریانس‌های مختلف، و ادغام می‌کنیم، توزیع جدید خواهد بود. در رابطه بالا انحراف معیار برابر خواهد بود با:

فرایند انتشار معکوس

اگر بتوانیم فرایند بالا را معکوس کنیم و از نمونه‌برداری کنیم، می‌توانیم نمونه واقعی را از ورودی نویز گاوسی دوباره ایجاد کنیم. توجه کنید که اگر به اندازه کافی کوچک باشد، نیز گوسی خواهد بود. متأسفانه، ما نمی‌توانیم را به راحتی تخمین بزنیم زیرا برای این کار باید از کل مجموعه‌داده استفاده کنیم، بنابراین باید مدلِ را برای تقریب این احتمالات شرطی به منظور اجرای فرایند انتشار معکوس یاد بگیریم.

احتمال شرطی معکوس زمانی قابل حل است که روی شرط شود:

با اعمال قاعده بیز داریم:

با توجه به تابع چگالی توزیع گاوسی، میانگین و واریانس را می‌توان به صورت زیر به‌دست‌آورد:

می‌دانیم که و با جایگذاری در عبارات بالا خواهیم داشت:

تابع هزینه برای آموزش فرایند انتشاری

برای تقریب توزیع احتمال شرطی در فرایند انتشار معکوس نیاز به یادگیری یک شبکه عصبی داریم. درواقع می‌خواهیم را آموزش دهیم که را پیش‌بینی کند. از آن‌جایی که به‌عنوان ورودی مدل هنگام آموزش داده می‌شود، می‌توانیم با تغییر عبارت نویز گاوسی را از ورودی در گام پیش‌بینی کنیم:

پس تابع هزینه برای کمینه کردن اختلاف از به صورت زیر خواهد بود:

در مقاله[۱] نشان داده شده‌است که آموزش مدل انتشاری با تابع هزینه زیر بهتر انجام می‌شود:

و تابع هزینه نهایی به صورت خواهد بود ( یک مقدار ثابت مستقل از است).

محدودیت‌ها

فرایند نمونه‌گیری از DDPM با دنبال‌کردن زنجیره مارکوف فرایند انتشار معکوس بسیار کند است، زیرا تعداد گام‌ها می‌تواند تا یک یا چند هزار مرحله باشد. در[۶] گفته شده «به عنوان مثال، نمونه‌گیری ۵۰ هزار عکس با اندازه ۳۲ × ۳۲ از یک DDPM حدود ۲۰ ساعت طول می‌کشد، اما انجام این کار با یک GAN روی یک پردازنده گرافیکی Nvidia 2080 Ti کمتر از یک دقیقه زمان می‌برد.»

کاربرد

مدل‌هایی انتشاری برای تولید[۶][۷][۸]، بخش‌بندی[۹][۱۰]، فراتفکیک‌پذیری[۱۱]، تغییر[۱۲][۱۳][۱۴][۱۵] و تعمیر[۱۲][۱۶] (به انگلیسی: inpainting) تصاویر به کار می‌روند. همچنین در تولید ویدئو[۱۷]، تشخیص ناهنجاری[۱۸]، تحلیل تصاویر پزشکی[۱۹] و بینایی سه‌بعدی[۲۰] کاربرد دارد.

مدل‌های انتشاری همچنین برای تولید و ترجمه متن[۲۱][۲۲] استفاده می‌شوند.

جستارهای وابسته

منابع

  1. ۱٫۰ ۱٫۱ Ho, Jonathan; Jain, Ajay; Abbeel, Pieter (19 June 2020). "Denoising Diffusion Probabilistic Models". Advances in Neural Information Processing Systems. arXiv:2006.11239.
  2. Song, Yang; Ermon, Stefano (2020). "Improved Techniques for Training Score-Based Generative Models". Advances in Neural Information Processing Systems. arXiv:2006.09011.
  3. Gu, Shuyang; Chen, Dong; Bao, Jianmin; Wen, Fang; Zhang, Bo; Chen, Dongdong; Yuan, Lu; Guo, Baining (2021). "Vector Quantized Diffusion Model for Text-to-Image Synthesis". Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. arXiv:2111.14822.
  4. Yang, Ling; Zhang, Zhilong (2022). "Diffusion models: A comprehensive survey of methods and applications". arXiv.
  5. Weng, Lilian (Jul 2021). "What are diffusion models?". lilianweng.github.io.
  6. ۶٫۰ ۶٫۱ Song, Jiaming; Meng, Chenlin; Ermon, Stefano (2020). "Denoising diffusion implicit models". arxiv. arXiv:2010.02502.
  7. Nichol, Alexander Quinn; Dhariwal, Prafulla (2021). "Improved denoising diffusion probabilistic models". International Conference on Machine Learning Systems.
  8. Prafulla, Dhariwal; Nichol, Alexander (2021). "Diffusion models beat gans on image synthesisDiffusion models beat gans on image synthesis". Advances in Neural Information Processing Systems.
  9. Amit, Tomer; Nachmani, Eliya (2021). "Segdiff: Image segmentation with diffusion probabilistic models". arXiv.
  10. Wang, Weilun; Bao, Jianmin (2022). "Semantic image synthesis via diffusion models". arXiv.
  11. Saharia, Chitwan; Ho, Jonathan (2022). "Image super-resolution via iterative refinement". IEEE Transactions on Pattern Analysis and Machine Intelligence.
  12. ۱۲٫۰ ۱۲٫۱ Batzolis, Georgios; Stanczuk, Jan (2021). "Conditional image generation with score-based diffusion models". arXiv. arXiv:2111.13606.
  13. Kawar, Bahjat; Elad, Michael (2022). "Denoising Diffusion Restoration Models". ICLR Workshop on Deep Generative Models for Highly Structured Data.
  14. Kim, Gwanghyun; Kwon, Taesung (2022). "DiffusionCLIP: Text-Guided Diffusion Models for Robust Image Manipulation". Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.
  15. Avrahami, Omri; Lischinski, Dani (2021). "Improved denoising diffusion probabilistic models". Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.
  16. Lugmayr, Andreas; Danelljan, Martin (2022). "Repaint: Inpainting using denoising diffusion probabilistic models". Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.
  17. He, Yingqing; Yang, Tianyu (2022). "Latent Video Diffusion Models for High-Fidelity Video Generation with Arbitrary Lengths". arXiv.
  18. Wolleb, Julia; Bieder, Florentin (2022). "Diffusion Models for Medical Anomaly Detection". arXiv. arXiv:2203.04306.
  19. Dar, Salman UH; Öztürk, Şaban (2022). "Adaptive diffusion priors for accelerated mri reconstruction". arXiv. arXiv:2207.05876.
  20. Saadatnejad, Saeed; Rasekh, Ali; Mofayezi, Mohammadreza; Medghalchi, Yasamin; Rajabzadeh, Sara; Mordan, Taylor; Alahi, Alexandre (2022). "A generic diffusion-based approach for 3D human pose prediction in the wild". arXiv. arXiv:2210.05669.
  21. Nachmani, Eliya; Dovrat, Shaked (2021). "Zero-Shot Translation using Diffusion Models". arXiv.
  22. Lovelace, Justin; Kishore, Varsha (2022). "Latent Diffusion for Language Generation". arXiv.

Read other articles:

Laut TireniaPeta Laut TirrheniaLetakPerancis, ItaliJenis perairanLautPanjang maksimal275.000 kilometer (171.000 mi) Laut Tirenia (English: The Tyrrhenian Sea (dibaca /tɪˈriːniən/ or /tɪˈreɪniən/); Italian: Mar Tirreno (dibaca: [mar tirˈrɛːno]), French: Mer Tyrrhénienne (dibaca [mɛʁ tiʁenjɛn]), Sardinian: Mare Tirrenu, Corsican: Mari Tirrenu, Sicilian: Mari Tirrenu, Neapolitan: Mare Tirreno) merupakan sebuah laut marjinal terbesar ketiga di Laut Mediterania, yang terletak ...

 

Sancho V kan verwijzen naar: Sancho I van Aragón (1034-1094), als Sancho V ook koning van Navarra Sancho V van Gascogne (?-955), hertog van Gascogne Bekijk alle artikelen waarvan de titel begint met Sancho V of met Sancho V in de titel. Dit is een doorverwijspagina, bedoeld om de verschillen in betekenis of gebruik van Sancho V inzichtelijk te maken. Op deze pagina staat een uitleg van de verschillende betekenissen van Sancho V en verwijzingen daarnaartoe. Bent u hie...

 

この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)出典検索?: <Infinite Dendrogram>-インフィニット・デンドログラム- – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2020年9月) この

اضغط هنا للاطلاع على كيفية قراءة التصنيف حجريات الترصعالعصر: الطباشيري المبكر إلى الطباشيري المتأخر, 120–66 مليون سنة قك ك أ س د ف بر ث ج ط ب ن   حالة الحفظ أنواع منقرضة التصنيف العلمي النطاق: حقيقيات النوى المملكة: حيوانات الشعبة: الحبليات الشعيبة: الفقاريات غير مصنف: الدي

 

Rusa Thorold Cervus albirostris Status konservasiRentanIUCN4256 TaksonomiKerajaanAnimaliaFilumChordataKelasMammaliaOrdoArtiodactylaFamiliCervidaeTribusCerviniGenusCervusSpesiesCervus albirostris Przew., 1883 Tata namaSinonim takson Przewalskium albirostris Przewalskium albirostre DistribusiEndemikRepublik Rakyat Tiongkok lbs Rusa Thorold ( Przewalskium albirostris)[1] adalah spesies terancam dari rusa yang ditermukan di padang rumput, semak, dan hutan di dataran tinggi di Dataran Ting...

 

هذه المقالة تحتاج للمزيد من الوصلات للمقالات الأخرى للمساعدة في ترابط مقالات الموسوعة. فضلًا ساعد في تحسين هذه المقالة بإضافة وصلات إلى المقالات المتعلقة بها الموجودة في النص الحالي. (يناير 2019) جلبي مصطفى باشا معلومات شخصية الميلاد سنة 1811  مكان الوفاة أيدين  مناصب الصد

Notable parkway in Philadelphia Benjamin Franklin ParkwayPlan for the Fairmount Parkway, published in 1917 by Jacques GréberNamesakeBenjamin FranklinMaintained byCity of PhiladelphiaLength1.0 mi (1.6 km)[1]LocationPhiladelphia, Pennsylvania, U.S.West endEakins Oval in Fairmount ParkEast end16th and Arch Streets in Logan Square Benjamin Franklin Parkway, commonly abbreviated to Ben Franklin Parkway and colloquially called the Parkway, is a boulevard that runs throu...

 

Building in Uganda Nakivubo War Memorial GroundsFormer namesNakivubo War Memorial StadiumLocationKampala, UgandaCoordinates0°18′42″N 32°34′25″E / 0.311667°N 32.573611°E / 0.311667; 32.573611OwnerGovernment of UgandaOperatorHamis Kiggundu[2][1]Capacity35,000[3]ConstructionOpened1 April 1926 (1926-04-01)Renovated1954, 2013, 2017Closed2015Demolished28 February 2017[1]Construction costUS$200,000,000ArchitectChristo...

 

60th New Brunswick LegislatureMajority parliament28 September 2020 – presentParliament leadersPremierHon. Blaine HiggsNovember 9, 2018 – presentLeader of theOppositionRoger MelansonSeptember 28, 2020 – September 21, 2022Rob McKeeSeptember 21, 2022 – May 9, 2023Susan HoltMay 9, 2023 – presentParty caucusesGovernmentProgressive Conservative PartyOppositionLiberal PartyRecognizedGreen PartyLegislative AssemblySpeaker of theAssemblyHon. Bill OliverOctober 7, 2020 –...

Ми минор Нотация тонического аккорда e, Em Параллельная тональность G-dur Тональность доминанты h-moll Тональность субдоминанты a-moll Натуральная минорная гамма e - fis ^ g - a - h ^ c - d - e Гармоническая минорная гамма e - fis ^ g - a - h ^ c -- dis ^ e Мелодическая минорная гамма e - fis ^ g - a - h - cis - dis ^ e М...

 

Main articles: The Bronx and Demographics of New York City Historical population CensusPop.Note%± 186023,593—187037,39358.5%188051,98039.0%189088,90871.0%1900200,507125.5%1910430,980114.9%1920732,01669.8%19301,265,25872.8%19401,394,71110.2%19501,451,2774.1%19601,424,815−1.8%19701,471,7013.3%19801,168,972−20.6%19901,203,7893.0%20001,332,65010.7%20101,385,1083.9%Sources below.[1] The demographics of the Bronx are characterized by a Hispanic majority (unique among New York City's ...

 

Sumatera Barat pada Pekan Olahraga Nasional 2021 Jumlah atlet TBD Pembawa bendera TBD Total medali Emas1 Perak2 Perunggu8 11 (Urutan ke- ) Sumatera Barat akan berkompetisi pada Pekan Olahraga Nasional 2021 di Jayapura, Papua. Sebenarnya kontingen ini dijadwalkan untuk bertanding pada 20 Oktober sampai 2 November 2020 namun ditunda ke tanggal 2 sampai 15 Oktober 2021 karena Pandemi COVID-19.[1] Medali Artikel utama: Pekan Olahraga Nasional 2021 Medali Atlet Cabang olahraga Nomor T...

1988 demo album by KontrolStariyat dubDemo album by KontrolReleased1988Recorded1988GenrePunk rockLength28:48LabelPrivate releaseProducerKontrolKontrol chronology Stariyat dub(1988) BG Rock I(1989) Stariyat dub (Bulgarian: Старият дъб, The Old Tree) is the first release by the Bulgarian punk band Kontrol. It was released in 1988. In 1989, the first 6 songs were released on BG Rock I. The whole tape later appeared on The Punk Years 1988-1991. Track list Програма (Progr...

 

German actor (1904–1972) Gerard HeinzHeinz in The Saint (1966)Born2 January 1904Hamburg, German EmpireDied20 November 1972(1972-11-20) (aged 68)London, United KingdomOccupationActorYears active1942–1972 (film & TV) Gerard Heinz (born Gerhard Hinze; 2 January 1904 – 20 November 1972) was a German actor. Heinz was born in Hamburg, Germany and later moved to Britain, where he changed his name. He appeared in almost 60 films (including Caravan), and a number of stage productio...

 

GranmaTipeSurat kabar harianFormatLembar lebarPemilikPemerintah KubaDidirikan4 Oktober 1965Pandangan politikPartai Komunis KubaBahasaSpanyol, InggrisPusatHavana, CubaSitus webgranma.cu Granma adalah surat kabar resmi Komite Pusat Partai Komunis Kuba. Surat kabar tersebut dibentuk pada 1965 dengan penggabungan dua surat kabar sebelumnya, Revolución dan Hoy.[1] Namanya datang dari yacht Granma yang mengangkut Fidel Castro dan 81 pemberontak lainnya ke pesisir Kuba pada 1956, dalam rang...

This article is about the piece of music. For the recreational activity, see sledding. For the 'Fear the Walking Dead' episode, see Sleigh Ride (Fear the Walking Dead). Winter song Sleigh RideSongLanguageEnglishPublished1948 (1948) by Mills MusicGenreLightComposer(s)Leroy AndersonLyricist(s)Mitchell Parish Sleigh Ride is a light orchestra standard composed by Leroy Anderson. The composer had formed the original idea for the piece during a heat wave in July 1946, and he finished the work ...

 

Ушиб Ушиб верхней части ноги, вызванный тупым предметом МКБ-11 XJ9NV МКБ-10 T14.0 и T00.9 МКБ-9 xxx DiseasesDB 31998 MedlinePlus 007213 MeSH D003288 Уши́б (лат. contusio) — закрытое повреждение тканей и органов без существенного нарушения их структуры. Чаще повреждаются поверхностно расположенные тк...

 

Mecklenburg Elbe Valley Nature ParkMecklenburgisches ElbetalLocationLocationLudwigslust-Parchim, Mecklenburg-Vorpommern, GermanyCoordinates53°20′10″N 11°01′12″E / 53.336°N 11.02°E / 53.336; 11.02[1]Area426 km2 (164 sq mi)Established1990 The Mecklenburg Elbe Valley Nature Park (German: Mecklenburgisches Elbetal) is part of the UNESCO biosphere reserve of Elbe River Landscape. At over 400 river kilometres long, the Elbe River Landscape ...

LBA awards and honours Individual awards MVP Finals MVP Top Scorer All-Star Game Basket Oscar Italian Hall of Fame vte The Lega Basket Serie A (LBA) Finals Most Valuable Player (MVP) is an annual award given by the 1st-tier of Italian professional basketball, the Lega Basket Serie A (LBA). It has been awarded since the 2003–04 season to the league's most valuable player in the league's deciding Finals series of the playoffs. Winners Bo McCalebb (2010; 2011) Alessandro Gentile (2014) K...

 

This article needs a plot summary. Please add one in your own words. (August 2021) (Learn how and when to remove this template message) 2008 Indian filmBulletDirected byNizarProduced byNazim VellilaStarringSuresh GopiKalabhavan ManiRajan P. DevDevanPavithraCinematographyAnil GopinathProductioncompanyMalayil Movie InternationalRelease date 2008 (2008) CountryIndiaLanguageMalayalam Bullet is a Malayalam language film directed by Nizar and produced by Nazim Vellila under the banner of Malay...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!