Lingua Libre

Lingua Libre
Logo de Lingua Libre

Aperçu de la page d’accueilde Lingua Libre en dĂ©cembre 2020
Aperçu de la page d’accueil
de Lingua Libre en décembre 2020

Adresse lingualibre.org
Description Projet d’enregistrement de langues
Slogan La médiathÚque linguistique participative de Wikimédia France
Commercial  Non
Écrit en PHP, VueJS, JS[1]
PublicitĂ©  Non
Type de site Outil d’enregistrement de langues,
MĂ©diathĂšque linguistique en ligne
Langue Multilingue
Inscription facultative, nécessaire pour enregistrer
Propriétaire Wikimédia France
Créé par Wikimédia France et la communauté Wikimédia
Nicolas Vion (v1)
Antoine Lamielle (v2)
Lancement Voir et modifier les données sur Wikidata
État actuel  En activitĂ©

Lingua Libre est un outil et un projet collaboratif en ligne visant à constituer un corpus audiovisuel multilingue. Développé par l'association Wikimédia France, les codes et fichiers téléchargeables par langues[2] sont placés sous licence libre, comme les autres projets du mouvement Wikimédia. 230 langues et 1,2 million de fichiers audios sont téléchargeables avec différentes quantités de mots enregistrés.

Description

Lingua Libre permet d'enregistrer des mots, des locutions ou des phrases de toutes les langues, orales (enregistrement audio) ou signĂ©es (enregistrement vidĂ©o). Les mots sont prĂ©sentĂ©s au locuteur sous la forme d’une liste, crĂ©Ă©e en direct ou Ă  l’avance, ou rĂ©utilisant une catĂ©gorie WikimĂ©dia existante. Le locuteur lit simplement le mot affichĂ© Ă  l'Ă©cran, et le logiciel passe au mot suivant lorsqu’il dĂ©tecte un silence aprĂšs le mot lu[3]. Ce principe, repris du logiciel open source Shtooka recorder avec l'aide de son crĂ©ateur, Nicolas Vion, permet d'enregistrer plusieurs centaines de mots par heure. Les enregistrements sont ensuite tĂ©lĂ©versĂ©s automatiquement depuis le client web vers la mĂ©diathĂšque libre Wikimedia Commons. Le projet est intĂ©grĂ© Ă  et soutenu par la communautĂ© wikimĂ©dienne.

Utilisation des enregistrements

Les enregistrements sont consultables à la fois sur Lingua Libre et sur Commons. Ils sont principalement utilisés sur d'autres projets Wikimédia, afin par exemple d'illustrer des entrées sur le Wiktionnaire ou des noms propres dans des articles Wikipédia[3]. Ils sont également produits et utilisés par le Dico des Ados.

La réutilisation des enregistrements dans un cadre d'enseignement des langues est envisagée.

Les enregistrements sont également librement téléchargeables par langue[2], réutilisés dans des projets de traitement automatique des langues, notamment pour entraßner les moteurs de reconnaissance vocale DeepSpeech de Mozilla[4].

Versions

Lingua Libre est lancé le 23 janvier 2015[5]. Lingua Libre a connu trois versions principales.

Lingua Libre v.1 (2016)

Session d'enregistrement du vocabulaire basque lors de la Wikiconvention francophone 2016, mené par Nicolas Vion (gauche).

Dans le cadre du projet Langues de France, ayant pour objectif de documenter et valoriser les langues rĂ©gionales de France sur les projets WikimĂ©dia et internet de maniĂšre gĂ©nĂ©rale, la conception de Lingua Libre dĂ©marre en novembre 2015, en partie subventionnĂ©e par la DĂ©lĂ©gation gĂ©nĂ©rale Ă  la langue française et aux langues de France (DGLFLF). La premiĂšre version du projet est lancĂ©e en aoĂ»t 2016. Seulement adaptĂ©e Ă  l’enregistrement audio, Lingua Libre est montrĂ© lors d’un atelier autour de l’occitan en dĂ©cembre 2016[6],[7] puis est prĂ©sentĂ© Ă  la communautĂ© WikimĂ©dia en ligne[8] et lors d’évĂ©nements internationaux en 2017.

Lingua Libre v.2 (2018)

Une reconstruction complĂšte est lancĂ©e fin 2017. La nouvelle version de Lingua Libre est basĂ©e sur MediaWiki, utilise Wikibase et OAuth pour mieux s’intĂ©grer Ă  l’environnement WikimĂ©dia. L’interface est traduite via Translatewiki afin que le projet puisse ĂȘtre utilisĂ© par un grand nombre de communautĂ©s. La nouvelle version du site est prĂȘte en juin 2018[9] et ouverte au public en aoĂ»t 2018.

Lingua Libre v.2.2 (2020)

En 2020, d’importants changements sont apportĂ©s Ă  la plateforme ; une nouvelle apparence est dĂ©veloppĂ©e pour le site et le domaine en .org remplace le domaine en .fr utilisĂ© jusque-lĂ [10]. Lingua Libre prend en charge les langues signĂ©es grĂące Ă  l'enregistrement vidĂ©o.

Évolution

Statistiques

Une session d’enregistrement avec une locutrice de la langue atikamekw en 2017 Ă  MontrĂ©al.

Durant les deux premiĂšres annĂ©es de lancement du projet, environ 10 000 enregistrements ont Ă©tĂ© rĂ©alisĂ©s. Le passage Ă  la v.2 est accompagnĂ© d’une forte augmentation de la contribution. Le nombre d’enregistrements est multipliĂ© par 10 en moins d’un an, dĂ©passant le seuil de 100 000 en mai 2019. Ces enregistrements ont Ă©tĂ© rĂ©alisĂ©s par 127 locuteurs, dans prĂšs de 50 langues[11]. Le cap des 500 000 enregistrements est dĂ©passĂ© au cours du mois de juin 2021. En avril 2023, la plateforme comptabilise plus de 800 000 enregistrements, dans 170 langues et grĂące Ă  plus de 1400 locuteurs[12]. Le 5 octobre 2023, Lingua Libre a atteint plus d‘un million de contributions avec l‘enregistrement du mot â€œà°•à°‚à°Ÿà°€à°źà±â€œ qui veut dire Ă©pineux en tĂ©lougou, (Inde du Sud)[13].

Notes et références

  1. ↑ (en) « LinguaLibre.org Â», sur GitHub (consultĂ© le ).
  2. ↑ a et b « Lingualibre Languages Gallery Â», sur lingualibre.org (consultĂ© le )
  3. ↑ a et b (de) Sabine Buchwald, « Wie Wikipedia Bairisch lernt Â», sur SĂŒddeutsche Zeitung,
  4. ↑ Forum de Mozilla mentionnant Lingua Libre comme source de donnĂ©es d’entraĂźnement
  5. ↑ RĂ©my Gerbet, « Lingua Libre : un nouvel outil collaboratif pour le public et les chercheurs Â», Culture et recherche, no 137,‎ printemps-Ă©tĂ© 2018, p. 52 (ISSN 1950-6295, lire en ligne)
  6. ↑ « Oc-a-thon 2016 : deux journĂ©es contributives sur l'occitan les 9 et 10 dĂ©cembre Â», sur MinistĂšre de la Culture - DGLFLF,
  7. ↑ Mathieu Denel, « L’oc-a-thon, un edit-a-thon pour enrichir les projets Wikimedia et Lingua Libre en langue occitane Â», sur Blog de WikimĂ©dia France, (consultĂ© le )
  8. ↑ « Lingua Libre Â», sur fr.wiktionary.org, ActualitĂ©s du Wiktionnaire, (consultĂ© le )
  9. ↑ « Lingua Libre Â», sur fr.wiktionary.org, ActualitĂ©s du Wiktionnaire, (consultĂ© le )
  10. ↑ Sarah Krichen, « Lingua Libre fait peau neuve ! Â», sur WikimĂ©dia France, (consultĂ© le )
  11. ↑ (en) Miguel Trancozo Trevino, « The many languages missing from the internet Â», sur BBC.com, (consultĂ© le )
  12. ↑ « Statistiques — Lingua Libre Â», sur lingualibre.org (consultĂ© le )
  13. ↑ Wikimedia Fance, « CommuniquĂ© de presse Â» [PDF] (consultĂ© le )

Annexes

Sur les autres projets Wikimedia :

Articles connexes

Bibliographie

  • Mathilde Hutin et Marc AllassonniĂšre-Tang, « Crowd-sourcing for Less-resourced Languages: Lingua Libre for Polish Â», Proceedings of the 1st Annual Meeting of the ELRA/ISCA Special Interest Group on Under-Resourced Languages, European Language Resources Association,‎ , p. 41–47 (lire en ligne, consultĂ© le )
  • Mathilde Hutin et Marc AllassonniĂšre-Tang, « Investigating phonological theories with crowd-sourced data: The Inventory Size Hypothesis in the light of Lingua Libre Â», 19th SIGMORPHON Workshop on Computational Research in Phonetics, Phonology, and Morphology, Association for Computational Linguistics,‎ , p. 23–28 (DOI 10.18653/v1/2022.sigmorphon-1.3, lire en ligne, consultĂ© le )

Liens externes

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!