تعرف الكلام

التعرف على الكلام أو تمييز الكلام (ويعرف أيضا بتمييز الكلام التلقائي أو تمييز الكلام أو حاسب تمييز الكلام) وهو عبارة عن تحويل الكلمات المنطوقة إلى نص.[1][2][3] إن مصطلح «تمييز الصوت» في بعض الأحيان يطلق على أنظمة التمييز التي يجب أن تدرب على متحدث معين، كما هو الحال بالنسبة لمعظم برامج تمييز سطح المكتب. التعرف على المتحدث يستطيع تبسيط مهمة ترجمة الكلام. تمييز الكلام يعتبر حل أوسع يشير إلى تكنولوجيا بإمكانها التعرف على الكلام بدون أن تستهدف متحدث واحد – مثل نظام الاتصال الذي يستطيع التعرف على جميع الأصوات. تطبيقات تمييز الكلام تتضمن: واجهة المستخدم الصوتية مثل الطلب الصوتي (على سبيل المثال: اتصل بالمنزل)؛ توجيه المكالمات (على سبيل المثال: أريد عمل مكالمة تليفونية على حساب المتلقي)، التحكم بتطبيق أتمتة المنزل، البحث (على سبيل المثال: أوجد البودكاست حيث الكلمات كانت منطوقة) إدخال بيانات بسيطة (على سبيل المثال: ادخل رقم البطاقة الائتمانية)، إعداد وثائق منظمة (مثل: تقرير الأشعة)، خطاب معالجة النصوص (مثل: معالج الكلمات " Word " أو رسائل البريد الإلكتروني) والمركبة الجوية (مثل: أجهزة الإدخال المباشر).

نبذة تاريخيه

أول جهاز يعرف على الصوت ظهر عام 1952 م، يتكون من جهاز يتعرف على الأرقام المنطوقة. كما ظهر مبكرا جهاز آخر يدعى IBM Shoebox، وقد عرضت في معرض عالم نيويورك عام 1964م. واحدة من أهم المجالات التي استخدمت تطبيقات التمييز الكلامي بشكل ملحوظ هي الرعاية الصحية والنسخ الطبي في الولايات المتحدة الأمريكية. من خلال ما قاله خبراء الصناعة في بدايتها، أن تمييز الكلام يباع كوسيلة للقضاء على النسخ بدلا من جعل النسخ خطوة أكثر فاعلية، والتالي لم يكن مقبولا، ولذلك السبب أيضا كان التمييز الصوتي في ذلك الوقت ناقص من الناحية الفنية. وكما أن استخدامه بفاعلية يتطلب تغييرات إلى طرق لعمل الأطباء وتوثيق اللقاء الإكلينيكي، وهذا يجعل العديد بل الكل يترددون في استخدامه. إن أكبر مقيد للتمييز الصوتي كان النسخ الآلي، ومع ذلك كان يعد برنامجا. إن طبيعة السرد الإملائي يحتاج تفسير عالي وأحيانا يتطلب رأي مستمد من كائن بشري وهذا لم يوفر حتى الآن في الأنظمة الآلية. كما أن كمية الوقت الذي يحتاجه المستخدم أو مزود النظام لتدريب الجهاز كبيرة وهذا يعتبر مقيد ثاني للتمييز الصوتي. كثيرا ما ينشأ التمييز في ASR بين أنظمة صناعة الجملة التي عادة ما تكون محددة المجال، ومعالجة طبيعة الجمل والتي عادة ما تكون لغة معينة. كل نوع من هذه التطبيقات يعرض أهدافه وتحدياته الخاصة.

التطبيقات

الرعاية الصحية

في مجال الرعاية الصحية، وحتى بعد تحسين تقنيات تمييز الكلام، النسخ الطبي لم يتقادم حاليا، فالخدمات المقدمة يتم إعادة توزيعها بدلا من استبدالها. يمكن تطبيق التعرف على الكلام في الواجهة الأمامية أو الخلفية لعملية التوثيق الطبي. في واجهة جهاز تمييز الكلام الأمامية يقوم المزود بالتملية إلى محرك تمييز الكلام، ثم يتم عرض الكلمات المنطوقة ويكون المملي مسؤول عن التعديل والتوقيع على المستند، لا تمر على محرر النسخ الطبي أبدا. جهة جهاز تمييز الكلام الأمامية أو مؤجل تمييز الكلام، يملي المزود إلى نظام إملاء رقمي، ويتم توجيه الصوت من خلال جهاز يميز الكلام ويوجه مسودة وثيقة معترف بها جنبا إلى جنب مع ملف الصوت الأصلي إلى محرر النسخ الطبي، الذي يعدل المسودة وينهي التقرير. جهاز مؤجل تمييز الكلام أصبح يستخدم حاليا على نطاق واسع في الصناعة. كثير من تطبيقات السجلات الصحية الالكترونية (EMR)، يمكن أن تكون أكثر فعالية ويتم أداؤها بسهولة أكبر عندما يتم نشرها بالاقتران مع محرك يميز الحديث. كل من عمليات البحث والاستعلامات، وملء الاستمارة تكون أسرع إذا تمت بالصوت بدلا من لوحة المفاتيح. حلول الرعاية الصحية عادة ما تكون حالة محددة، لكن بعض الشركات تعدل حلولها لتلبية احتياجات الأسواق (على سبيل المثال: مركز تكنولوجيا الكلام في روسيا مع شريك فنلندي يدعى فيتيم أوي في مشروع Terve Elama).

الحروب

الطائرات المقاتلة ذات الأداء العالي

في العقد الماضي كرست جهود كبيرة لاختبار وتقييم التعرف على الكلام في الطائرات المقاتلة، وتجدر الإشارة إلى برنامج الولايات المتحدة في التعرف على الكلام لإدماج التكنولوجيا المقاتلة المتقدمة ويرمز له (AFTI)/طائرة (F -16(F-16 VISTA، وبرنامج في فرنسا لتركيب أنظمة التعرف على الكلام على طائرات ميراج، وأيضا برامج في المملكة المتحدة في التعامل مع تشكيلة من الأنظمة الأساسية للطائرة.

الهيليكوبتر

المشاكل لتحقيق المميز درجة عالية من الدقة تحت الضغط والضوضاء تتعلق بقوة على بيئة الهليكوبتر كما في بيئة الطائرة المقاتلة، مشكلة الضجيج هي في الواقع أكثر حدة في بيئة الهليكوبتر، ليس فقط بسبب ارتفاع مستويات الضوضاء ولكن أيضا لأن قائد المروحية لا يرتدي قناع؛ ليقلل الضجيج في الميكروفون.وقد أجريت تجارب كثيرة وبرامج تقييم خلال العقد الماضي على التعرف على الكلام في تطبيقات نظم طائرات الهليكوبتر، لا سيما من قبل أنشطة الولايات المتحدة لبحث وتطوير الكترونيات الطائرات الحربية (AVRADA)، ومؤسسة علم الفضاء الملكي (RAE) في المملكة المتحدة، وكما أن العمل في فرنسا أضاف جهاز التعرف على الكلام في الهليكوبتر من طراز بوما، بالإضافة إلى أن هناك الكثير من الأعمال المفيدة في كندا. نظرا لأن النتائج كانت مشجعة. شملت تطبيقات الصوت: السيطرة على أجهزة الاتصالات اللاسلكية، ووضع نظم الملاحة، والسيطرة على النظام بهدف التسليم الآلي.

إدارة الحروب

مراكز أوامر إدارة المعارك بشكل عام تتطلب الوصول السريع إلى مراقبة واسعة، وتغيير قواعد المعلومات بسرعة، فالقادة العسكريون ومشغلي نظام الاستعلام بحاجة إلى قواعد البيانات هذه بشكل ملائم قدر الإمكان، في بيئة العين- المشغولة يتم تقديم الكثير من المعلومات في شكل العرض، غلإنسالة آلة يتفاعل بالصوت لديه القدرة على أن يكون مفيد في هذه البيئات. وقد كان هناك الكثير من الجهود لإضافة جهاز التعرف على الكلام إلى إدارة بيئات الحروب، ففي أحد دراسة جدوى التعرف على الكلام قد تم اختبار المعدات بالاقتران مع عرض معلومات متكاملة لتطبيقات إدارة المعركة البحرية. المستخدمين كانوا متفائلين جدا حول إمكانيات النظام، على الرغم من محدودية قدراته.

تدريب وحدات تحكم الحركة الجوية

تدريب مراقبي الحركة الجوية (برج المراقبة) يمثل تطبيق ممتاز لأنظمة التعرف على الكلام. كثير من نظم التدريب على المراقبة الجوية حاليا تتطلب شخص ليكون بمثابة «شبه قائد»، والانخراط في حوار مع وحدة تحكم التدريب، الذي يحاكي حوار وحدة التحكم مع القادة من برج المراقبة في الحقيقية.التعرف على الكلام وتوليف تقنيات تتيح إمكانية القضاء على الحاجة لشخص للعمل كطيار زائف، وبالتالي يحد من تدريب ودعم الأفراد. من الناحية النظرية، تتميز مهام المراقب الجوي بالتنظيم العالي للكلام كمخرجات تحكم أساسية، الذي بدوره يقوم بالحد من صعوبة مهام تمميز الكلام ولكن حقيقة هذا نادرا ما يحدث. ففي وثيقة القوات المسلحة الأنغولية 7110,65 تفاصيل العبارات التي يجب استخدامها من قبل مراقبي الحركة الجوية. بينما هذه الوثيقة تعطي أقل من 150 من أمثلة هذه العبارات، وعدد من العبارات التي يدعمها أحد أنظمة محاكاة أجهزة التعرف على الكلام ما يزيد على 500,000.

الاتصالات الهاتفية وغيرها من المجالات

أصبح شائعا الآن استخدامه في مجال الاتصالات الهاتفية في ألعاب الكمبيوتر والمحاكاة، على الرغم من المستوى العالي في معالجة النصوص في الحوسبة التي وصل إليها إلا أنه لم ير الزيادات المتوقعة في استخدامه. .

مزيد من التطبيقات

  • الترجمة الآلية.
  • سيارات التعرف على الكلام (على سبيل المثال، فورد سينك).
  • تقارير المحاكم (كتابة الصوت الحقيقي).
  • الحوسبة حرة اليدين: تمييز آوامر طلب مستخدم الكمبيوتر الصوتي، التشغيل الآلي للصفحة الرئيسية.
  • الرد الصوتي التفاعلي.
  • الهواتف النقالة، بما في ذلك البريد الإلكتروني الصوتي.
  • التفاعل لمتعدد الوسائط.
  • تقييم النطق في اللغة بمساعدة الحاسوب، الروبوتات.
  • خطاب إلى النص.
  • التليماتية (مثل نظم الملاحة المركبة).
  • النسخ الرقمي (خطاب إلى النص).
  • ألعاب الفيديو.

مراجع

  1. ^ Assael، Yannis؛ Shillingford، Brendan؛ Whiteson، Shimon؛ de Freitas، Nando (5 نوفمبر 2016). "LipNet: End-to-End Sentence-level Lipreading". arXiv:1611.01599 [cs.CV]. {{استشهاد بأرخايف}}: الوسيط |arxiv= مطلوب (مساعدة)
  2. ^ Mohri، M. (2002). "Edit-Distance of Weighted Automata: General Definitions and Algorithms" (PDF). International Journal of Foundations of Computer Science. ج. 14 ع. 6: 957–982. DOI:10.1142/S0129054103002114. مؤرشف من الأصل (PDF) في 2017-08-10. اطلع عليه بتاريخ 2011-03-28.
  3. ^ An application of recurrent neural networks to discriminative keyword spotting[وصلة مكسورة]. Proceedings of ICANN (2), pp. 220–229. "نسخة مؤرشفة" (PDF). مؤرشف من الأصل في 2020-04-26. اطلع عليه بتاريخ 2020-05-26.{{استشهاد ويب}}: صيانة الاستشهاد: BOT: original URL status unknown (link)

Read other articles:

British early music conductor and keyboard player Julian Perkins in rehearsal, 2012 Julian Perkins is a British conductor and keyboard player (harpsichord, fortepiano and clavichord).[1] Shortlisted for the Gramophone Award in 2021, he is Artistic Director of the Portland Baroque Orchestra in the USA. He lives in London, England and is also Founder Director of the early music ensemble Sounds Baroque and Artistic Director of Cambridge Handel Opera Company.[2] As a conductor, Ju...

 

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article is missing information about Yemen's economy during the civil war and in recent years. Please expand the article to include this information. Further details may exist on the talk page. (September 2018) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sour...

 

アラビア語パレスチナ方言 فلسطيني話される国 パレスチナ ヨルダン イスラエル言語系統 アフロ・アジア語族 セム語派西方セム語中央セム語アラビア語アラビア語レヴァント方言アラビア語パレスチナ方言表記体系 アラビア文字言語コードISO 639-1 arISO 639-2 araISO 639-3 —テンプレートを表示 アラビア語パレスチナ方言(英: Palestinian Arabic)は、アラビア語の口語(ア

Elmer WachtelPotret artis Elmer Wachtel oleh sesama artis Rob Wagner, Los Angeles, 1909.Lahir(1864-01-21)21 Januari 1864Baltimore, Maryland, Amerika Serikat[1]Meninggal31 Agustus 1929(1929-08-31) (umur 65)Guadalajara, Mexico[1]KebangsaanAmerikaSuami/istriMarion Wachtel Elmer Wachtel (21 Januari 1864 – 31 Agustus 1929) adalah seorang pelukis Amerika yang tinggal dan bekerja di California Selatan.[1][2][3][4][5][6&...

 

Laure CalamyCalamy, 2018Lahir22 Maret 1975 (umur 48)Orléans, Prancis[1]PekerjaanAktrisTahun aktif2001–sekarangKarya terkenalUn monde sans femmesMademoiselle de JoncquièresSeules les bêtesMy Donkey, My Lover & ICall My Agent! (Dix pour cent) Laure Calamy (lahir 22 Maret 1975)[2] adalah seorang aktris film, televisi, dan teater sekaligus pemenang Penghargaan César berkebangsaan Prancis yang terkenal karena perannya dalam Call My Agent! dan My Donkey, My Lover...

 

مسييه 32   جزء من المجموعة المحلية  الكوكبة المرأة المسلسلة[1]  رمز الفهرس M 32 (فهرس مسييه)PGC 2555 (فهرس المجرات الرئيسية)[2]UGC 452 (فهرس أوبسالا العام)2MASX J00424182+4051546 (Two Micron All Sky Survey, Extended source catalogue)MCG+07-02-015 (فهرس المجرات الموروفولوجي)IRAS 00399+4035 (IRAS)NGC 221 (الفهرس العام الجديد)AP...

Iglesia de Santiago Apóstol Bien de Interés Cultural 8 de octubre de 1964 RI-51-0001625Monumento Histórico-Artístico LocalizaciónPaís España EspañaComunidad Castilla y León Castilla y LeónProvincia Valladolid ValladolidLocalidad Medina de RiosecoCoordenadas 41°53′04″N 5°02′25″O / 41.8844, -5.04028Información religiosaCulto Iglesia católicaDiócesis ValladolidOrden Clero secularAdvocación Santiago el MayorPatrono Santiago el MayorHistoria d...

 

Diglycidyl resorcinol ether Names IUPAC name 2-[[3-(oxiran-2-ylmethoxy)phenoxy]methyl]oxirane Other names 1,3-Bis(2,3-epoxypropoxy)benzene; 1,3-Diglycidyloxybenzene; 2,2'-(1,3-Phenylenebis(oxymethylene))bisoxirane; Araldite ERE 1359; m-bis(2,3-epoxypropoxy)-Benzene ; Diglycidyl ether of resorcinol; Diglycidylresorcinol ether; m-Bis(2,3-epoxypropoxy)benzene; m-Bis(glycidyloxy)benzene; Resorcinol bis(2,3-epoxypropyl) ether; Resorcinol diglycidyl ether; Oxirane, 2,2'-(1,3-phenylenebis(oxyme...

 

Las calles de Barcelona de Víctor Balaguer Idioma Español Ciudad Barcelona [editar datos en Wikidata] Las calles de Barcelona es una obra del escritor y periodista español Víctor Balaguer, publicada por primera vez entre 1865 y 1866, en dos tomos.[1]​[2]​[a]​ Descripción «Verdadero emporio del comercio esta poblacion, en su puerto se balanceaban naves llegadas de todas las partes del mundo y tenia cónsules en todas las plazas de conocida importancia mar...

2009 soundtrack album by Various ArtistsThe Princess and the Frog (Original Motion Picture Soundtrack)Soundtrack album by Various ArtistsReleasedNovember 23, 2009Recorded2009GenreJazz, blues, soul, gospel, R&B, zydecoLabelWalt DisneyProducerRandy NewmanWalt Disney Animation Studios chronology Bolt (Original Motion Picture Soundtrack)(2008) ''The Princess and the Frog (Original Motion Picture Soundtrack)''(2009) Tangled (Original Motion Picture Soundtrack)(2010) Randy Newman chrono...

 

Protein-coding gene in the species Homo sapiens DYRK1AAvailable structuresPDBOrtholog search: PDBe RCSB List of PDB id codes2VX3, 2WO6, 3ANQ, 3ANR, 4AZE, 4MQ1, 4MQ2, 4NCT, 4YLJ, 4YLK, 4YLL, 4YU2, 5AIK, 5A4Q, 5A4E, 5A3X, 5A4T, 5A54, 5A4LIdentifiersAliasesDYRK1A, DYRK, DYRK1, HP86, MNB, MNBH, MRD7, dual specificity tyrosine phosphorylation regulated kinase 1AExternal IDsOMIM: 600855 MGI: 1330299 HomoloGene: 55576 GeneCards: DYRK1A Gene location (Human)Chr.Chromosome 21 (human)[1]Band21q...

 

Easter-time Christian ritual Judas hung in effigy, Mexico City, early 20th century Shooting at the gallows of the effigy of Judas Iscariot, Santorini, Greece, April 2010 The burning of Judas is an Easter-time ritual that originated in European[1] Christian communities where an effigy of Judas Iscariot is burned. Other related mistreatment of Judas effigies include hanging, flogging, and exploding with fireworks.[2][3] A similar ritual in Jewish tradition would be the h...

This article may have been created or edited in return for undisclosed payments, a violation of Wikipedia's terms of use. It may require cleanup to comply with Wikipedia's content policies, particularly neutral point of view. (March 2021) The topic of this article may not meet Wikipedia's notability guidelines for products and services. Please help to demonstrate the notability of the topic by citing reliable secondary sources that are independent of the topic and provide significant coverage...

 

Down County CouncilHistoryFounded18 April 1899Disbanded1 October 1973Succeeded byArds Borough CouncilBanbridge District CouncilBelfast City CouncilCastlereagh Borough CouncilCraigavon Borough CouncilDown District CouncilLisburn City CouncilNewry and Mourne District CouncilNorth Down Borough CouncilMeeting placeDownpatrick Courthouse Down County Council was the authority responsible for local government in County Down, Northern Ireland. History Down County Council was formed under orders ...

 

Final round of the 2021 Formula One season 2021 Abu Dhabi Grand Prix Race 22 of 22[1] in the 2021 Formula One World Championship← Previous race Race detailsDate 12 December 2021Official name Formula 1 Etihad Airways Abu Dhabi Grand Prix 2021Location Yas Marina Circuit, Abu Dhabi, United Arab EmiratesCourse Permanent racing facilityCourse length 5.281 km (3.281 miles)Distance 58 laps, 306.183 km (190.253 miles)Weather ClearAttendance 153,000[2]Pole positionDriver Ma...

2003 Indian filmEnnai Thalatta VaruvalaPosterDirected byK. S. RavindranStory byP. M. VedimuthuProduced byP. M. VedimuthuStarringAjithVigneshReshmaCinematographyMagi NateshEdited byV. M. UthayasankarMusic byAshokaProductioncompanyMuthalaya FilmsRelease date 21 March 2003 (2003-03-21) CountryIndiaLanguageTamil Ennai Thalatta Varuvala (transl. Will She Come to Cradle Me?) is 2003 Indian Tamil-language thriller film directed by K. S. Ravindran and produced by P. M. Vedimuthu,...

 

Cet article est une ébauche concernant une boisson tunisienne. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Bouteilles de thibarine et de boukha La thibarine est une marque de liqueur qui titre 40°. Elle est préparée à base d'alcool, de sucre et de plantes aromatiques. Elle est souvent présentée comme un alcool ou une liqueur de datte, sans que cela apparaisse sur l'étiquette. Ce digestif est produit a...

 

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article contains content that is written like an advertisement. Please help improve it by removing promotional content and inappropriate external links, and by adding encyclopedic content written from a neutral point of view. (August 2016) (Learn how and when to remove this template message) The topic of this article may not meet Wikipe...

Die Präsidentschaftswahlen in Ghana 1992 wurden am 3. November 1992 abgehalten. Es war die erste Direktwahl des Präsidenten seit 1979. Ergebnis der Wahl nach Regionen Ergebnis der Präsidentschaftswahl[1] Kandidaten Nominierende Parteien Stimmen % Jerry John Rawlings National Democratic CongressNational Convention PartyEvery Ghanaian Living Everywhere 2.327.600 58,3 Albert Adu Boahen New Patriotic Party 1.213.073 30,4 Hilla Limann People’s National Convention 266.728 6,7 Kwabena D...

 

Israeli businessman Amos YudanAmos YudanBorn (1936-11-05) November 5, 1936 (age 87)Haifa, IsraelNationalityIsraeliEducationMaster of Science in economicsAlma materConcordia UniversityTechnion – Israel Institute of TechnologyOccupationChair & ceo of comodanYears active1956–presentSpouse(s)Marriage, Carmela YudanChildrenAmit Yudan, Galit Ganor, Nitzan YudanRelativesQuirin Yudan, Gefen Ganor, Iris Yudan, Dekel Ganor, Dagan Ganor, Nadav Yudan, Roni Yudan Amos Yudan (born No...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!