Riconoscimento ottico della musica

Prima scansione digitale pubblicata di spartiti musicali da David Prerau nel 1971

Il riconoscimento ottico della musica, detto anche OMR (dall'inglese optical music recognition), è un campo di ricerca che studia come leggere la notazione musicale presente nei documenti attraverso il computer.[1] L'obiettivo dell'OMR è insegnare al computer a leggere e interpretare gli spartiti musicali e produrre una versione leggibile dalla macchina della partitura scritta. Una volta catturata digitalmente, la musica può essere salvata in formati di file comunemente usati, come ad esempio MIDI per la riproduzione e MusicXML per la rappresentazione.

In passato, in modo fuorviante, è stato chiamato "riconoscimento ottico dei caratteri musicali". A causa delle differenze significative, questo termine non dovrebbe più essere utilizzato.[2]

Storia

Il riconoscimento ottico della musica su spartiti stampati ha avuto inizio alla fine degli anni '60 al Massachusetts Institute of Technology, quando i primi scanner divennero disponibili per gli istituti di ricerca.[3][4][5] Nel 1984, un gruppo di ricerca giapponese dell'Università di Waseda sviluppò un robot specializzato, chiamato WABOT (WAseda roBOT), in grado di leggere lo spartito musicale di fronte a sé e accompagnare un cantante su un organo elettronico.[6][7]

La ricerca iniziale nel campo dell'OMR è stata condotta da Ichiro Fujinaga, Nicholas Carter, Kia Ng, David Bainbridge e Tim Bell. Questi ricercatori hanno sviluppato molte delle tecniche che sono ancora utilizzate oggi. La prima applicazione commerciale di OMR, MIDISCAN (oggi SmartScore), è stata lanciata nel 1991 dalla Musitek Corporation.

La disponibilità di smartphone dotati di buone fotocamere e di sufficiente potenza di calcolo ha aperto la strada allo sviluppo di app, attraverso le quali l'utente scatta una foto con lo smartphone e il dispositivo elabora direttamente l'immagine.

Relazione con altri campi

Relazione tra il riconoscimento ottico della musica con altri campi di ricerca

Il riconoscimento ottico della musica è correlato ad altri ambiti di ricerca, tra cui la visione artificiale, l'analisi dei documenti e il recupero delle informazioni musicali. È rilevante per musicisti e compositori praticanti, che potrebbero utilizzare i sistemi OMR come mezzo per inserire la musica nel computer, facilitando così il processo di composizione musicale, trascrizione musicale e modifica della musica. In una biblioteca, un sistema OMR potrebbe consentire di effettuare operazioni di ricerca tra gli spartiti musicali[8], mentre per i musicologi consentirebbe di condurre studi musicologici quantitativi su larga scala.[9]

Confronto tra OMR e OCR

Il riconoscimento ottico della musica è stato frequentemente confrontato con il riconoscimento ottico dei caratteri (OCR).[2][10] La principale differenza è che la notazione musicale è un sistema di scrittura caratterizzato da elementi distintivi.

La seconda distinzione principale è che, mentre un sistema OCR si limita a riconoscere lettere e parole, un sistema OMR è finalizzato a recuperare anche il significato musicale: l'utente si aspetta che la posizione verticale di una nota (concetto grafico) venga tradotta in altezza tonale (concetto musicale) applicando le regole della notazione musicale. Si noti che non esiste un equivalente diretto nel riconoscimento del testo. Per analogia, recuperare la musica da un'immagine di uno spartito può essere altrettanto difficile quanto recuperare il codice sorgente HTML da uno screenshot di un sito web.

La terza differenza riguarda l'insieme di caratteri utilizzato. Sebbene sistemi di scrittura come il cinese abbiano insiemi di caratteri straordinariamente complessi, l'insieme di primitivi per l'OMR comprende una gamma di dimensioni molto più ampia, che va da elementi minuscoli come un punto a elementi grandi che possono coprire un'intera pagina, come una parentesi. Alcuni simboli hanno un aspetto quasi illimitato, come le legature, che sono definite solo come curve più o meno morbide che possono essere interrotte in qualsiasi punto.

Infine, la notazione musicale implica relazioni spaziali bidimensionali onnipresenti, mentre il testo può essere letto come un flusso di informazioni unidimensionale, una volta stabilita la linea di base.

Approcci all'OMR

Il processo di riconoscimento delle partiture musicali è tipicamente suddiviso in passaggi più piccoli gestiti da algoritmi di riconoscimento di pattern specializzati.

Sono stati proposti molti approcci concorrenti, la maggior parte dei quali condivide un'architettura a pipeline, in cui ogni passaggio esegue una certa operazione, come la rilevazione e la rimozione delle linee del pentagramma prima di passare alla fase successiva. Un problema comune di questo approccio è che errori e artefatti creati in una fase si propagano attraverso il sistema, influenzando pesantemente le prestazioni. Ad esempio, se la fase di rilevamento delle linee del pentagramma non riesce a identificare correttamente la presenza degli stessi, i passaggi successivi probabilmente ignoreranno quella regione dell'immagine, portando a informazioni mancanti nell'output.

Il riconoscimento ottico della musica è frequentemente sottovalutato a causa della natura apparentemente semplice del problema: se viene fornita una scansione perfetta di musica composta, il riconoscimento visivo può essere risolto con una sequenza di algoritmi relativamente semplici. Tuttavia, il processo diventa significativamente più difficile per scansioni di bassa qualità o musica scritta a mano, che molti sistemi non riescono a riconoscere affatto. E anche se tutti i simboli fossero stati rilevati perfettamente, è comunque complesso recuperare il significato musicale a causa delle ambiguità e delle frequenti violazioni delle regole della notazione musicale. Donald Byrd e Jakob Simonsen sostengono che l'OMR sia difficile perché la notazione musicale moderna è estremamente complessa.[11]

Donald Byrd ha anche raccolto una serie di esempi interessanti[12] così come esempi estremi[13] di notazione musicale che ne dimostrano la complessità intrinseca.

Output dei sistemi OMR

Le applicazioni tipiche per i sistemi OMR includono la creazione di una versione udibile della partitura (nota come riproducibilità). Un modo comune per creare tale versione è generare un file MIDI, che può essere sintetizzato in un file audio. Tuttavia, i file MIDI non sono in grado di memorizzare informazioni di incisione (come erano disposte le note) o la scrittura enarmonica.

Se le partiture musicali vengono riconosciute con l'obiettivo della leggibilità umana (nota come ristampabilità), è necessario recuperare la codifica strutturata, che include informazioni precise sul layout e sull'incisione. Formati adatti per memorizzare queste informazioni includono MEI (Music Encoding Initiative) e MusicXML.

Oltre a queste due applicazioni, potrebbe anche essere interessante estrarre metadati dall'immagine o abilitare la ricerca. A differenza delle prime due applicazioni, un livello di analisi minore della partitura musicale potrebbe essere sufficiente per eseguire questi compiti.

Deep learning (dal 2016)

Con l'avvento dell'apprendimento profondo, molti problemi di visione artificiale sono passati dalla programmazione imperativa con euristiche create a mano e ingegneria delle caratteristiche all'apprendimento automatico. Nel riconoscimento ottico della musica, le fasi di elaborazione del pentagramma,[14][15] la fase di rilevamento degli oggetti musicali,[16][17][18][19] e la fase di ricostruzione della notazione musicale[20] hanno visto tentativi di successo nel risolverli con l'apprendimento profondo.

Sono stati proposti anche approcci completamente nuovi, tra cui la risoluzione dell'OMR in modo end-to-end con modelli sequenza-sequenza, che prendono un'immagine di spartiti musicali e producono direttamente la musica riconosciuta in un formato semplificato.[21][22][23][24]

Note

  1. ^ Alexander Pacha, Self-Learning Optical Music Recognition, TU Wien, Austria, 2019, DOI:10.13140/RG.2.2.18467.40484.
  2. ^ a b Jorge Calvo-Zaragoza, Jan jr. Hajič e Alexander Pacha, Understanding Optical Music Recognition, in ACM Computing Surveys, vol. 53, n. 4, 2020, pp. 1–35, DOI:10.1145/3397499, arXiv:1908.03608.
  3. ^ Filmato audio (EN) Optical Music Recognition Research, Optical Music Recognition for Dummies - Part 2 - Introduction and History, su YouTube, 3 ottobre 2018.
  4. ^ Dennis Howard Pruslin, Automatic Recognition of Sheet Music, Massachusetts Institute of Technology, Cambridge, Massachusetts, USA, 1966.
  5. ^ David S. Prerau, Computer pattern recognition of printed music, Fall Joint Computer Conference, 1971, pp. 153–162.
  6. ^ WABOT – WAseda roBOT, su waseda.ac.jp, Università di Waseda. URL consultato il 14 luglio 2019.
  7. ^ Wabot 2, su IEEE, IEEE. URL consultato il 14 luglio 2019.
  8. ^ Audrey Laplante e Ichiro Fujinaga, Digitizing Musical Scores: Challenges and Opportunities for Libraries, 3rd International Workshop on Digital Libraries for Musicology, 2016, pp. 45–48.
  9. ^ Jan jr. Hajič, Marta Kolárová, Alexander Pacha e Jorge Calvo-Zaragoza, How Current Optical Music Recognition Systems Are Becoming Useful for Digital Libraries, 5th International Conference on Digital Libraries for Musicology, Parigi, 2018, pp. 57–61.
  10. ^ David Bainbridge e Tim Bell, The challenge of optical music recognition, in Computers and the Humanities, vol. 35, n. 2, 2001, pp. 95–121, DOI:10.1023/A:1002485918032.
  11. ^ Donald Byrd e Jakob Grue Simonsen, Towards a Standard Testbed for Optical Music Recognition: Definitions, Metrics, and Page Images, in Journal of New Music Research, vol. 44, n. 3, 2015, pp. 169–195, DOI:10.1080/09298215.2015.1045424.
  12. ^ Donald Byrd, Gallery of Interesting Music Notation, su indiana.edu, novembre 2017. URL consultato il 14 luglio 2019.
  13. ^ Donald Byrd, Extremes of Conventional Music Notation, su indiana.edu, ottobre 2018. URL consultato il 14 luglio 2019.
  14. ^ Antonio-Javier Gallego e Jorge Calvo-Zaragoza, Staff-line removal with selectional auto-encoders, in Expert Systems with Applications, vol. 89, 2017, pp. 138–148, DOI:10.1016/j.eswa.2017.07.002.
  15. ^ Fancisco J. Castellanos, Jorge Calvo-Zaragoza, Gabriel Vigliensoni e Ichiro Fujinaga, Document Analysis of Music Score Images with Selectional Auto-Encoders (PDF), 19th International Society for Music Information Retrieval Conference, Parigi, 2018, pp. 256–263.
  16. ^ Lukas Tuggener, Ismail Elezi, Jürgen Schmidhuber e Thilo Stadelmann, Deep Watershed Detector for Music Object Recognition (PDF), 19th International Society for Music Information Retrieval Conference, Parigi, 2018, pp. 271–278.
  17. ^ Jan jr. Hajič, Matthias Dorfer, Widmer Gerhard e Pecina Pavel, Towards Full-Pipeline Handwritten OMR with Musical Symbol Detection by U-Nets (PDF), 19th International Society for Music Information Retrieval Conference, Parigi, 2018, pp. 225–232.
  18. ^ Alexander Pacha, Jan jr. Hajič e Jorge Calvo-Zaragoza, A Baseline for General Music Object Detection with Deep Learning, in Applied Sciences, vol. 8, n. 9, 2018, pp. 1488–1508, DOI:10.3390/app8091488.
  19. ^ Alexander Pacha, Kwon-Young Choi, Bertrand Coüasnon, Yann Ricquebourg, Richard Zanibbi e Horst Eidenberger, Handwritten Music Object Detection: Open Issues and Baseline Results (PDF), 13th International Workshop on Document Analysis Systems, 2018, pp. 163–168, DOI:10.1109/DAS.2018.51.
  20. ^ Alexander Pacha, Jorge Calvo-Zaragoza e Jan jr. Hajič, Learning Notation Graph Construction for Full-Pipeline Optical Music Recognition (PDF), 20th International Society for Music Information Retrieval Conference, 2019.
  21. ^ Eelco van der Wel e Karen Ullrich, Optical Music Recognition with Convolutional Sequence-to-Sequence Models (PDF), 18th International Society for Music Information Retrieval Conference, Suzhou, 2017.
  22. ^ Jorge Calvo-Zaragoza e David Rizo, End-to-End Neural Optical Music Recognition of Monophonic Scores, in Applied Sciences, vol. 8, n. 4, 2018, pp. 606, DOI:10.3390/app8040606.
  23. ^ Arnau Baró, Pau Riba, Jorge Calvo-Zaragoza e Alicia Fornés, Optical Music Recognition by Recurrent Neural Networks, 14th International Conference on Document Analysis and Recognition, 2017, pp. 25–26, DOI:10.1109/ICDAR.2017.260.
  24. ^ Arnau Baró, Pau Riba, Jorge Calvo-Zaragoza e Alicia Fornés, From Optical Music Recognition to Handwritten Music Recognition: A baseline, in Pattern Recognition Letters, vol. 123, 2019, pp. 1–8, DOI:10.1016/j.patrec.2019.02.029.

Altri progetti

  Portale Musica: accedi alle voci di Wikipedia che trattano di musica

Read other articles:

この存命人物の記事には検証可能な出典が不足しています。信頼できる情報源の提供に協力をお願いします。存命人物に関する出典の無い、もしくは不完全な情報に基づいた論争の材料、特に潜在的に中傷・誹謗・名誉毀損あるいは有害となるものはすぐに除去する必要があります。出典検索?: いとうせいこう – ニュース · 書籍 · スカラー · CiN...

 

اضغط هنا للاطلاع على كيفية قراءة التصنيف متصلبات اللسان   المرتبة التصنيفية رتيبة  التصنيف العلمي النطاق: حقيقيات النوى المملكة: حيوانات الشعبة: الحبليات الشعيبة: الفقاريات غير مصنف: الفكيات غير مصنف: رباعيات الأطراف الطائفة: الزواحف غير مصنف: العظائيات غير مصنف: الحرش

 

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Dassault Super Mystère – news · newspapers · books · scholar · JSTOR (March 2013) (Learn how and when to remove this template message) Super Mystère Role Fighter-bomberType of aircraft National origin France Manufacturer Dassault Aviation First flight 2 March...

البازار الكبير   تقديم البلد تركيا  مدينة الفاتح  إحداثيات 41°00′38″N 28°58′05″E / 41.010580555556°N 28.967933333333°E / 41.010580555556; 28.967933333333  الموقع الرسمي الموقع الرسمي  الموقع الجغرافي تعديل مصدري - تعديل   بوابة نور عثمانية. السوق الكبير 2004 البازار الكبير أو السوق ال

 

Ancient northeast European culture Not to be confused with Pitted Ware culture in Scandinavia. This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (December 2021) (Learn how and when to remove this template message) Comb Ceramic cultureGeographical rangeNorth-Eastern EuropePeriodMesolithic Europe, Neolithic EuropeDatesc. 4200 – 2000 BCEPreceded byNarva cultu...

 

Symphonic poem by Sergei Rachmaninoff A black and white reproduction of Isle of the Dead by Arnold Böcklin was the inspiration for the piece. Isle of the Dead (Russian: Остров мёртвых), Op. 29, is a symphonic poem composed by Sergei Rachmaninoff, written in the key of A minor. The piece was inspired by a black and white reproduction of Arnold Böcklin's painting Isle of the Dead, which he saw in Paris in 1907. He composed the work from January to March of 1909, and later made nu...

Submarine of the United States For other ships with the same name, see USS Narwhal. USS Narwhal (SS-167) at sea, 1931 History United States NameUSS Narwhal BuilderPortsmouth Naval Shipyard, Kittery, Maine[1]: 285–304  Laid down10 May 1927[1]: 285–304  Launched17 December 1928[1]: 285–304  Commissioned15 May 1930[1]: 285–304  Decommissioned23 April 1945[1]: 285–304 ...

 

Asmaa Boujibar Información personalNombre en árabe أسماء بوجيبار Nacimiento 1984 Casablanca (Marruecos) Nacionalidad Francesa y marroquíEducaciónEducada en Universidad de Rennes 1 (Lic. en Ciencias de la Tierra; 2004-2008)Universidad de La Reunión (Maestría en Geosciences; 2008-2009)Universidad Blaise Pascal (Maestría en Geosciences; 2009-2010)Universidad Blaise Pascal (Doc. en Petrología; 2010-2014) Supervisor doctoral Denis Andrault Información profe...

 

2023 Senate elections in Sokoto 2023 Nigerian Senate elections in Sokoto State ← 2019 25 February 2023 2027 → All 3 Sokoto State seats in the Senate of Nigeria   Majority party Minority party   Party APC PDP Last election 2 1 Seats before 3 0      APC incumbent retiring     APC incumbent running for re-election The 2023 Nigerian Senate elections in Sokoto State will be held on 25 February 2023, to elec...

Edmonton Huskies Established1954 (1954)Based inEdmonton, AlbertaHome stadiumClarke StadiumHead coachJeff TobertGeneral managerJason LorrimerLeagueCanadian Junior Football LeagueDivisionPrairie Football ConferenceColoursBlack, Gold, WhiteLeague titles5 (1962, 1963, 1964, 2004, 2005)WebsiteOfficial website The Edmonton Huskies are a Canadian Junior Football team based in Edmonton, Alberta. The Huskies play in the six-team Prairie Football Conference, which itself is part of the Canadian Ju...

 

Sulistyo Pudjo HartonoKepala Biro Humas dan Protokol BNN Informasi pribadiLahir22 Agustus 1969 (umur 54)Makassar, Sulawesi SelatanAlma materAkademi Kepolisian (1991)Karier militerPihak IndonesiaDinas/cabang Badan Narkotika NasionalMasa dinas1991—sekarangPangkat Brigadir Jenderal PolisiNRP69080356SatuanReserseSunting kotak info • L • B Brigjen. Pol. Sulistyo Pudjo Hartono, S.I.K., M.Si. (lahir 22 Agustus 1969) adalah seorang perwira tinggi Polri yang sejak 20 Jun...

 

Radio station in Rollingwood, TexasKJCERollingwood, TexasBroadcast areaGreater AustinFrequency1370 kHzBrandingTalk 1370ProgrammingLanguage(s)EnglishFormatTalk radioAffiliationsCBS News RadioCompass Media NetworksPremiere NetworksRadio AmericaWestwood OneOwnershipOwnerAudacy, Inc.(Audacy License, LLC)Sister stationsKAMXKKMJ-FMHistoryFirst air date1948; 75 years ago (1948)Former call signsKTXN (1947–58)KOKE (1958–91)KKMJ (1991–92)KFGI (1992–93)Call sign meaningK-JuiCE ...

2015 American filmThe RumperbuttsTheatrical PosterDirected byMarc BrenerWritten byMarc BrenerProduced by Marc Brener Dena Hysell Starring Kori Gardner Jason Hammel Josh Brener Vanessa Ray Arian Moayed Music byMates of StateDistributed byMance MediaRelease date May 22, 2015 (2015-05-22) Running time91 minutesCountryUnited StatesLanguageEnglish The Rumperbutts is a 2015 American musical comedy written and directed by Marc Brener, starring Kori Gardner and Jason Hammel of the indi...

 

Anatomical composition of the Neanderthal body Reconstructed Neanderthal skeleton, American Museum of Natural History Neanderthal anatomy differed from modern humans in that they had a more robust build and distinctive morphological features, especially on the cranium, which gradually accumulated more derived aspects, particularly in certain isolated geographic regions. This robust build was an effective adaptation for Neanderthals, as they lived in the cold environments of Europe. In which t...

 

Untuk penulis dan cendekiawan sastra, lihat Michael Wilding (penulis). Michael WildingDari trailer untuk Stage Fright (1950)LahirMichael Charles Gauntlet Wilding(1912-07-23)23 Juli 1912Leigh-on-Sea, InggrisMeninggal8 Juli 1979(1979-07-08) (umur 66)Chichester, InggrisTahun aktif1933–1979Suami/istriKay Young ​ ​(m. 1937; bercerai 1951)​ Elizabeth Taylor ​ ​(m. 1952; bercerai 1957)​ Susan ...

Untuk penggunaan dan akibat dari hukum ini, lihat Induksi elektromagnetik. Artikel ini merupakan bagain dari seriListrik dan MagnetMichael Faraday. Bapak kelistrikan dunia, dan sosok penting pada ilmu kemagnetan. Buku rujukan Statika listrik Muatan listrik Medan listrik Insulator Konduktor Ketribolistrikan Induksi Listrik Statis Hukum Coulomb Hukum Gauss Fluks listrik / energi potensial Momen polaritas listirk Statika magnet Hukum Ampere Medan magnet Magnetisasi Fluks magnetik Kaidah tan...

 

У этого термина существуют и другие значения, см. Ролевая игра (значения). Возможно, эта статья содержит оригинальное исследование. Добавьте ссылки на источники, в противном случае она может быть выставлена на удаление. (25 мая 2011) Компьютерная ролевая игра (англ. Computer Role-...

 

1939 film by David Butler That's Right – You're WrongTheatrical posterDirected byDavid ButlerWritten byDavid ButlerWilliam M. ConselmanProduced byDavid ButlerFred Fleck (assistant)StarringKay KyserAdolphe MenjouLucille BallDennis O'KeefeCinematographyRussell MettyEdited byIrene MorraMusic byRoy WebbDistributed byRKO Radio PicturesRelease date November 24, 1939 (1939-11-24) (U.S.) Running time94 minutesCountryUnited StatesLanguageEnglishBudget$271,000[1]Box office$...

1999 American filmDeep Blue SeaOfficial film series logoBased onDeep Blue Seaby Duncan Kennedy, Donna Powers & Wayne PowersDistributed byWarner Bros.Release date1999–2020CountryUnited StatesLanguageEnglish The Deep Blue Sea film series consists of American science fiction natural-horror films, centered around genetically enhanced-sharks. The overall plot of the series centers around scientific studies conducted by marine biologists. These experiments provide the predatory animals with h...

 

Islet in the Caribbean East Seal Dog IslandEast Seal Dog IslandThe location of East Seal Dog Island within the British Virgin IslandsShow map of British Virgin IslandsEast Seal Dog IslandEast Seal Dog Island (Caribbean)Show map of CaribbeanGeographyLocationCaribbean SeaCoordinates18°30′24″N 64°25′56″W / 18.5067°N 64.4323°W / 18.5067; -64.4323ArchipelagoVirgin IslandsAdministrationUnited KingdomBritish Overseas TerritoryBritish Virgin IslandsDemographicsPopu...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!