Modèle de fondation

Un modèle de fondation est un modèle d'intelligence artificielle de grande taille, entraîné sur une grande quantité de données non étiquetées (généralement par apprentissage auto-supervisé). Le modèle résultant peut être adapté à un large éventail de tâches en aval (downstream tasks en anglais)[1],[2]. Depuis leur introduction en 2018, les modèles de fondation ont induit une transformation majeure dans la manière de construire les systèmes d'IA. Les premiers modèles de fondation étaient de grands modèles de langage basés sur le système des "Transformeurs", notamment BERT[3] et GPT-3. Par la suite, des modèles de fondation multimodaux, tels DALL-E, Flamingo[4], et Florence[5], qui intègrent image et texte, ont fait leur apparition. Plus récemment, les modèles de fondation peuvent utiliser les LNN à la place des transformeurs. Ce terme a été popularisé par le centre de recherche sur les modèles de fondation (CRFM) du Stanford Institute for Human-Centered Artificial Intelligence (HAI)[1].

Définitions

Le centre de recherche sur les modèles de base (CRFM) du Stanford Institute for Human-Centered Artificial Intelligence (HAI) a inventé le terme de modèle de fondation pour désigner « tout modèle entraîné sur un gros volume de données (généralement en utilisant l'apprentissage auto-supervisé à grande échelle sur des données non annotées) qui peut être adapté (par exemple, affiné) à un large éventail de tâches en aval »[6]. La technique n'est en soi pas nouvelle, étant basée sur des réseaux de neurones profonds et un apprentissage auto-supervisé, mais son échelle d'entraînement, sur un large volume de données, et le potentiel d'utilisation d'un même modèle pour de nombreuses tâches en aval justifie l'introduction d'un nouveau concept, affirme le groupe de Stanford[6].

De par sa capacité à s'adapter à de nombreuses tâches en aval, un modèle de fondation est un « paradigme pour la construction de systèmes d'IA », dans lequel un modèle pré-entraîné sur une grande quantité de données non étiquetées peut être adapté à de nombreuses applications[7],[8],[9].

Les principales caractéristiques des modèles de fondation sont l'émergence et l'homogénéisation[6]. Dans le cas de l'apprentissage auto-supervisé, les données d'entraînement n'étant pas étiquetées, la structuration de la représentation de l'information par le modèle est émergente plutôt que d'être explicitement encodée. Des propriétés qui n'étaient pas prévues peuvent alors apparaître. Par exemple, un modèle entraîné sur un grand ensemble de données linguistiques peut apprendre à générer ses propres histoires ou à faire de l'arithmétique, sans être explicitement entraîné pour le faire[10]. Par ailleurs, l'homogénéisation signifie que la même méthode est utilisée dans de nombreux domaines, ce qui permet des avancées mutualisées, mais aussi la possibilité de « points uniques de défaillance »[6].

Opportunités et risques

La publication du CRFM[6] a répertorié les capacités des modèles de fondation en ce qui concerne « le langage, la vision, la robotique, le raisonnement et l'interaction humaine » et ses principes techniques, tels que « les architectures de modèles, les algorithmes d'entraînement, la gestion des données, la sécurité, leur évaluation », leurs applications, par exemple dans « le droit, les soins de santé, l'éducation » et enfin leur impact potentiel sur la société, y compris « l'iniquité, l'utilisation abusive, l'impact économique et environnemental, les considérations juridiques et éthiques ».

Un article sur les modèles de fondation dans The Economist note que « pour certaines personnes, le développement sans précaution de la technologie risque de concentrer davantage le pouvoir économique et politique »[10],[11].

Références

  1. a et b (en) « Introducing the Center for Research on Foundation Models (CRFM) », Stanford HAI (consulté le ).
  2. (en-US) Goldman, « Foundation models: 2022’s AI paradigm shift », VentureBeat, (consulté le ).
  3. (en) Anna Rogers, Olga Kovaleva et Anna Rumshisky, « A Primer in BERTology: What we know about how BERT works », arXiv:2002.12327 [cs],‎ (lire en ligne, consulté le ).
  4. (en) « Tackling multiple tasks with a single visual language model », sur www.deepmind.com (consulté le ).
  5. (en) Lu Yuan, Dongdong Chen, Yi-Ling Chen et Noel Codella, « Florence: A New Foundation Model for Computer Vision », arXiv:2111.11432 [cs],‎ (lire en ligne, consulté le ).
  6. a b c d et e (en) Rishi Bommasani, Drew A. Hudson, Ehsan Adeli et Russ Altman, « On the Opportunities and Risks of Foundation Models », arXiv:2108.07258 [cs],‎ (lire en ligne Accès libre, consulté le ).
  7. « Stanford CRFM » (consulté le ).
  8. (en) « What are foundation models? », IBM Research Blog, (consulté le ).
  9. (en) Fei, Lu, Gao et Yang, « Towards artificial general intelligence via a multimodal foundation model », Nature Communications, vol. 13, no 1,‎ , p. 3094 (ISSN 2041-1723, PMID 35655064, PMCID 9163040, DOI 10.1038/s41467-022-30761-2, lire en ligne).
  10. a et b (en) « Huge “foundation models” are turbo-charging AI progress », The Economist,‎ (ISSN 0013-0613, lire en ligne, consulté le ).
  11. Texte original : Some worry that the technology’s heedless spread will further concentrate economic and political power […].

Read other articles:

Canon in the 1983 Code of Canon Law Part of a series on theCanon law of theCatholic Church Ius vigens (current law) 1983 Code of Canon Law Omnium in mentem Magnum principium Code of Canons of the Eastern Churches Ad tuendam fidem Ex corde Ecclesiae Indulgentiarum Doctrina Praedicate evangelium Veritatis gaudium Custom Matrimonial nullity trial reforms of Pope Francis Documents of the Second Vatican Council Christus Dominus Lumen gentium Optatam totius Orientalium ecclesiarum Presbyterorum ord...

 

1959 studio album by Sonny StittSonny Stitt Plays Jimmy Giuffre ArrangementsStudio album by Sonny StittReleased1959RecordedFebruary 16, 1959Los Angeles, CAGenreJazzLength43:47LabelVerveMGV 8309 Sonny Stitt chronology The Hard Swing(1959) Sonny Stitt Plays Jimmy Giuffre Arrangements(1959) A Little Bit of Stitt(1959) Sonny Stitt Plays Jimmy Giuffre Arrangements is an album by saxophonist Sonny Stitt performing music arranged by Jimmy Giuffre recorded in 1959 and originally released on t...

 

Capa do livro A Ilha de Sacalina, de Anton Pavlovitch Tchekhov, em sua primeira edição na Rússia (1895). Ostrov Sakhalin (em russo: Остров Сахалин e em português: A Ilha de Sacalina) é um livro de autoria do escritor russo Anton Tchekhov publicado em 1895[1]. Origem da obra Em 21 de abril de 1890 Tchekhov inicia uma viagem de aventura pela Rússia e ao deparar-se com uma coluna de prisioneiros tártaros, ucranianos, poloneses e judeus deportados caminhando e arrastando pesad...

Theo Tupetz (um 1955) Theo Tupetz (* 17. August 1923 in Hohenelbe, Tschechoslowakei; † 26. Mai 1980 in Bonn) war ein deutscher Studentenfunktionär und Sozialpolitiker. Als langjähriger Leiter des Sozialamts des Bundesstudentenrings initiierte er Hilfsprogramme für Flüchtlingsstudenten aus der DDR und Osteuropa, später auch aus afrikanischen Staaten. Außerdem hatte er maßgeblichen Anteil an der Entwicklung der Studienförderung nach dem Honnefer Modell, einem Vorläufer des heutigen Baf

 

1983 studio album by Jon and VangelisPrivate CollectionStudio album by Jon and VangelisReleasedMay 1983GenreElectronic musicLength47:26LabelPolydor, 813 174-1ProducerVangelisJon and Vangelis chronology The Friends of Mr Cairo(1981) Private Collection(1983) The Best of Jon and Vangelis(1984) Professional ratingsReview scoresSourceRatingAllmusic[1] Private Collection is the third album released by Jon and Vangelis, released in May 1983 on Polydor Records.[2] Track listin...

 

Imágenes de muestra del conjunto de datos de prueba MNIST La base de datos MNIST (por sus siglas en inglés, Modified National Institute of Standards and Technology database)[1]​ es una extensa colección de base de datos que se utiliza ampliamente para el entrenamiento de diversos sistemas de procesamiento de imágenes.[2]​[3]​ También se emplea con frecuencia en el campo del aprendizaje automático para tareas de entrenamiento y prueba.[4]​[5]​ Esta base de d...

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (سبتمبر 2022) تشنغدو وينغ لونغ-10معلومات عامةالنوع مركبة جوية التطوير والتصنيعالصانع مجموعة تشنغدو لصناعة الطائرات تعديل - تعديل مصدري - تعديل ويكي بيانات تشنغدو وينغ لو...

 

تنورة داخليةتنورة داخلية عصريةمعلوماتالنوع لباس داخليتعديل - تعديل مصدري - تعديل ويكي بيانات التنورة الداخلية[1] أو الغِلالَة[2] (بالإنجليزية: Petticoat)‏ (نقحرة: بيتيكوت) هي تنورة تُلبَس تحت فستان أو تنورة أخرى.[3][4][5] طالع المزيد إعظامة المراجع ^ منير البعلب...

 

Baseball at the 2006 Asian GamesVenueAl-Rayyan Baseball & Softball VenueDates29 November – 7 December 2006Competitors125 from 6 nations← 20022010 → Baseball was one of the many sports which was held at the 2006 Asian Games in Al-Rayyan, Qatar beginning on November 29, 2006. Six East and Southeast Asian nations participated in the tournament. Chinese Taipei won its first ever baseball gold medal in the Asian Games when they mounted a ninth inning...

Soundtracks for the 2013–19 Cartoon Network television series The following are the list of soundtracks for the animated television series Steven Universe created by Rebecca Sugar for Cartoon Network. Sugar also wrote the songs and musical numbers for the series, which are produced by the musician duo Aivi & Surasshu and jointly composed the title and ending themes for the series. The original soundtrack for the series, featuring a collection of songs were released in two volumes: Vol.1...

 

American weekly magazine since 1925 For other uses, see New Yorker (disambiguation). Not to be confused with New York (magazine). The New YorkerCover of the first issue, with the figure of dandy Eustace Tilley, created by Rea Irvin[a]EditorDavid RemnickCategoriesPoliticssocial issuesarthumorcultureFrequency47 issues/yearFormat7+7⁄8 by 10+3⁄4 inches (200 mm × 273 mm)[3]PublisherCondé NastTotal circulation(December 2019)1,231,715[4]First issu...

 

This article may require cleanup to meet Wikipedia's quality standards. The specific problem is: poorly written English. Please help improve this article if you can. (September 2018) (Learn how and when to remove this template message) 2008 German adventure video game 2008 video gameEdna & Harvey: The BreakoutDeveloper(s)Daedalic EntertainmentPublisher(s)Lace Mamba Global (Windows)Application Systems Heidelberg (Mac OS X)Daedalic Entertainment (Anniversary Edition)Platform(s)WindowsmacOSi...

Puteri Indonesia Papua BaratLogo Puteri IndonesiaPembuatMooryati SoedibyoNegara asal Papua Barat, IndonesiaRilis asliRilis2005 –Sekarang Puteri Indonesia Papua Barat adalah sebuah kontes kecantikan yang ada di provinsi Papua Barat, yang diadakan sejak tahun 2005 dengan nama provinsi Irian Jaya Barat, dan pada tahun berikutnya berubah menjadi Papua Barat. Setelah provinsi Papua Barat dimekarkan dari provinsi Papua, wilayah ini mengadakan kontes regional terpisah di mana pemenangnya...

 

Former award in theoretical physics This article is about the award. For the similarly named medal, see Albert Einstein Medal. Albert Einstein in his later years. The Albert Einstein Award (sometimes mistakenly called the Albert Einstein Medal because it was accompanied with a gold medal) was an award in theoretical physics, given periodically from 1951 to 1979, that was established to recognize high achievement in the natural sciences. It was endowed by the Lewis and Rosa Strauss Memorial Fu...

 

National flag See also: List of Bahamian flags Commonwealth of The BahamasUseNational flag Proportion1:2AdoptedJuly 10, 1973; 50 years ago (1973-07-10)DesignA horizontal triband of aquamarine (top and bottom) and gold with the black chevron aligned to the hoist-side.Designed byHervis Bain[1][2] UseCivil ensign Proportion1:2DesignA white cross on a red field, the national flag in the canton UseState ensign Proportion1:2DesignA blue cross on a white field,...

Overview of minorities in Greece Part of a series on theCulture of Greece History Ancient regions and tribes Byzantine and Ottoman Greeks Christianization Colonization Coups d'état Demographic (Modern) Economic Geographical name changes Greek countries and regions Greek Muslims Renaissance scholars Hellenic languages and Proto-Greek Inventions and discoveries Language question Military Monarchy (Kings and royal family) Phanariotes Polis Population exchange of 1923 People Languages Mythology ...

 

Montedio Yamagataモンテディオ山形Datos generalesNombre Montedio YamagataApodo(s) MontedioMonteFundación 1984 (39 años) como NEC Yamagata SCPropietario(s) Development Association for Sports in Yamagata through the 21st Century ABeam ConsultingPresidente Kentaro AidaEntrenador Takashi KiyamaInstalacionesEstadio ND Soft StadiumUbicación Tendo, Yamagata, JapónCapacidad 20.784 espectadoresInauguración Junio de 1991 (32 años)Uniforme Titular Alternativo Tercero   &...

 

Swedish Championship league in women's ice hockey Swedish Women's Hockey LeagueSvenska damhockeyligan (Swedish) Current season, competition or edition: 2023–24 SDHL seasonFormerlyRiksserien (2007–2016)SportIce hockeyFounded2007 (2007)FounderSwedish Ice Hockey AssociationInaugural season2007–08PresidentAgne BengtssonNo. of teams10Country SwedenMost recentchampion(s)Luleå HF/MSSK (2022–23)Most titlesLuleå HF/MSSK (6)TV partner(s)C More Sport, SVTRelegation toNDHLRelated...

Microsoft Office LiveThe homepage of Office Live WorkspaceDeveloper(s)MicrosoftStable releaseOffice Live Small Business Preview releaseOffice Live Workspace Operating systemMicrosoft Windows, Mac OS XTypeWeb application, Web developmentLicenseProprietaryWebsiteArchived official website at the Wayback Machine (archive index) Microsoft Office Live is a discontinued web-based service providing document sharing and website creation tools for consumers and small businesses. Its successor was b...

 

Painting by Pablo Picasso La GommeuseArtistPablo PicassoYear1901 (1901)MediumOil on canvasMovementBlue PeriodDimensions81.3 cm × 54 cm (32.0 in × 21 in) Caricature of Pere Mañach on the reverse Pere Mañach, 1901, National Gallery of Art La Gommeuse [la ɡɔmøz] is a 1901 oil-on-canvas painting by the Spanish artist Pablo Picasso. It dates from his Blue Period and is noted for its caricature of Picasso's friend Pere Mañach painted on...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!