موتورهای جستجو برای افزایش کیفیت نتایج جستجوی کاربر، از گسترش پرسش استفاده میکنند. فرض بر این است که کاربران همیشه پرسشها را با استفاده از بهترین عبارات فرموله نمیکنند. بهترین دلیل برای این کار میتواند این باشد که پایگاه داده شامل عبارات وارد شده کاربر نیست.
با ریشهیابی یک عبارت وارد شده توسط کاربر، اسناد بیشتری با عبارت وارد شده مطابقت داده می شود، زیرا صرفهای دیگر عبارت وارد شده توسط کاربر نیز مطابقت داده می شود و باعث افزایش بازیابی کل میشود. این کار به قیمت کاهش دقت تمام می شود. با گسترش یک پرسش برای جستجوی مترادف های عبارت وارد شده توسط کاربر، افزایس بازیابی به قیمت کاهش دقت است. این به دلیل ماهیت عبارت محاسبه دقت است، به این ترتیب که یک معیار بازیابی بزرگتر به طور ضمنی باعث کاهش دقت می شود، زیرا عوامل بازیابی بخشی از مخرج عبارت محاسبهی دقت هستند. همچنین نتیجه میشود که معیار بازیابی بزرگتر بر کیفیت کلی نتیجه جستجو تأثیر منفی میگذارد، با توجه به اینکه بسیاری از کاربران بدون توجه به دقت، نمیخواهند در میان انبوهی از نتایج به دنبال نتیجهی مطلوب بگردند.
هدف از بسط پرسش این است که در این صورت، با افزایش معیار بازیابی، دقت نیز میتواند به طور بالقوه افزایش یابد (به جای کاهش که از عبارت محاسبهی دقت میتوان نتیجه گرفت)، با افزودن صفحاتی در مجموعه نتایج که مرتبطتر (با کیفیت بالاتر)، یا حداقل به همان اندازه مرتبط هستند . صفحاتی که پتانسیل مرتبطتر بودن با عبارت پرسش کاربر را دارند اما بدون بسط پرسش در مجموعه نتایج قرار نمیگیرند، علیرغم ارتباط آنها. در عین حال، بسیاری از موتورهای جستجوی تجاری فعلی از فراوانی کلمه ( tf-idf ) برای کمک به رتبه بندی استفاده می کنند.[نیازمند منبع] با رتبهبندی کلمات عبارت وارد شده توسط کابر، و صرفهای دیگر آن کلمات، اسنادی با تراکم بالاتر (فرکانس بالا و تقریبی نزدیک) در نتایج جستجو به قسمت اول لیست نتایج منتقل شوند که منجر به کیفیت بالاترنتایج جستجو در اوایل لیست نتایج میشود، علیرغم بزرگتر بودن معیار بازیابی در این رویکرد.
روشهای گسترش پرسش
روشهای خودکار برای بسط پرسش در سال 1960 توسط Maron و Kuhns پیشنهاد شد. [۲] روشهای گسترش پرسش مدرن یا مبتنی بر تجزیه و تحلیل مجموعه اسناد (سراسری یا محلی) [۳] یا مبتنی بر فرهنگ لغت یا هستی شناسی هستند. [۴] تحلیل سراسری مجموعه اسناد برای جستجوی روابط بین کلمات استفاده می شود. تحلیل محلی به بازخورد ارتباط معرفی شده توسط Rocchio اشاره دارد. [۵] Rocchio پیشنهاد داد که برخی از اسناد بازیابی شده را به صورت دستی قضاوت کنند و از این اطلاعات بازخورد، برای گسترش پرسش استفاده کنند. از آنجایی که جمع آوری قضاوت کاربران میتواند چالش برانگیز باشد، تنها اولین اسناد بازیابی شده مرتبط در نظر گرفته می شوند. به این بازخورد شبه-مرتبط (PRF) گفته می شود. [۶] بازخورد شبه-مرتبط به طور متوسط کارآمد است، اما می تواند به نتایج برخی از پرسشها، [۷] به ویژه موارد دشوار آسیب برساند، زیرا اسناد برتر بازیابی شده احتمالاً نامربوط هستند. اسناد شبه-مرتبط برای یافتن عبارات کاندید برای بسط، که با بسیاری از کلمات پرسش قابلیت ظهور همزمان را داردند، استفاده می شود. [۸] این ایده بیشتر در مدلهای زبانی فرمالسازی شده در ارتباط موقعیتی [۹] و مدلهای نزدیکی ارتباط [۱۰] که فاصله تا کلمات پرسش را در اسناد شبه-مرتبط در نظر میگیرد، توسعه یافت. رویکردی دیگر در گسترش پرسش، استفاده از دگرنمایی واژگان است. [۱۱]
جایگزینی برای بسط پرسش، گسترش سند است که متن اسناد مورد جستجو را به جای متن پرسش دوباره فرموله می کند. [۱۲]
QueryTermAnalyzer منبع باز، #C. بر پایه یادگیری ماشین وزن عبارات پرسش و آنالیز مترادف برای بسط پرسش
LucQE - منبع باز، جاوا. یک چارچوب همراه با چندین پیاده سازی را ارائه می دهد که امکان انجام بسط پرسش را با استفاده از Apache Lucene فراهم می کند.
Xapian یک کتابخانه جستجوی منبع باز است که شامل پشتیبانی از گسترش پرسش است
ReQue منبع باز، پایتون. یک چارچوب نرمافزاری قابل تنظیم و مجموعهای از مجموعه دادههای استاندارد طلا برای آموزش و ارزیابی روشهای تحت نظارت برای گسترش پرسش. [۱۳][۱۴]
↑Maron, M. E. and Kuhns, J. L. 1960. On Relevance, Probabilistic Indexing and Information Retrieval. Journal of the ACM 7, 3, 216–244.
↑C. Carpineto and G. Romano. A survey of automatic query expansion in information retrieval. ACM Computing Surveys, 44(1):1-50, Jan. 2012.
↑J. Bhogal, A. Macfarlane, and P. Smith. A review of ontology based query expansion. Inf. Process. Manage., 43(4):866-886, July 2007.
↑J. Rocchio. Relevance feedback in information retrieval. In The SMART Retrieval System, p. 313-323. 1971.
↑C. Buckley. Automatic query expansion using SMART: TREC 3. In Proceedings of The third Text REtrieval Conference (TREC-3). NIST Special Publication, p. 69-80. National Institute of Standards and Technology, 1995.
↑G. Amati, C. Carpineto, and G. Romano. Query difficulty, robustness, and selective application of query expansion. Advances in Information Retrieval, p. 127-137, 2004.
↑J. Xu and W. B. Croft. Query expansion using local and global document analysis. In Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval, pages 4-11. ACM, 1996.
↑Y. Lv and C. Zhai. Positional relevance model for pseudo-relevance feedback. In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval, page 579-586.
ACM, 2010.
↑L. Ermakova, J. Mothe, and E. Nikitina. 2016. Proximity relevance model for query expansion. In Proceedings of the 31st Annual ACM Symposium on Applied Computing (SAC '16). ACM, New York, NY, USA, 1054-1059. DOI: https://doi.org/10.1145/2851613.2851696
↑S. Kuzi, A. Shtok, and O. Kurland. 2016. Query Expansion Using Word Embeddings. In Proceedings of the 25th ACM International on Conference on Information and Knowledge Management (CIKM '16). ACM, New York, NY, USA, 1929-1932. DOI: https://doi.org/10.1145/2983323.2983876
↑Lin. "Pretrained Transformers for Text Ranking: BERT and Beyond". {{cite arxiv}}: |arxiv= required (help)
↑Mahtab Tamannaee, Hossein Fani, Fattane Zarrinkalam, Jamil Samouh, Samad Paydar, Ebrahim Bagheri:
ReQue: A Configurable Workflow and Dataset Collection for Query Refinement. CIKM 2020: 3165-3172
↑Hossein Fani, Mahtab Tamannaee, Fattane Zarrinkalam, Jamil Samouh, Samad Paydar, Ebrahim Bagheri; An Extensible Toolkit of Query Refinement Methods and Gold Standard Dataset Generation. In Advances in Information Retrieval: 43rd European Conference on IR Research (ECIR'21), 2021.
منابع
D. Abberley، D. Kirby، S. Renals، و T. Robinson، سیستم بازیابی اخبار پخش THISL. در Proc.کارگاه آموزشی ESCA ETRW دسترسی به اطلاعات در صوتی گفتاری ، (کمبریج)، ص. 14-19، 1999. بخش گسترش پرسش و جو - مختصر و مروری ریاضی.
R. Navigli، P. Velardi. تجزیه و تحلیل استراتژی های گسترش پرسش مبتنی بر هستی شناسی . Proc. کارگاه آموزشی استخراج متن تطبیقی (ATEM 2003) ، در چهاردهمین کنفرانس اروپایی در مورد یادگیری ماشین (ECML 2003) ، Cavtat-Dubrovnik، کرواسی، 22-26 سپتامبر 2003، pp. 42-49 - تجزیه و تحلیل روش های بسط پرسش با تکیه بر WordNet به عنوان هستی شناسی مرجع.
Y. Qiu و HP Frei. بسط پرسش مبتنی بر مفهوم در مجموعه مقالات SIGIR-93، شانزدهمین کنفرانس بین المللی ACM در مورد تحقیق و توسعه در بازیابی اطلاعات ، پیتسبورگ، انجمن SIGIR، ACM Press، ژوئن 1993 - سند آکادمیک در مورد یک روش خاص برای گسترش پرسش
Efthimis N. Efthimiadis. گسترش پرسش در: مارتا ای. ویلیامز (ویرایش. ), بررسی سالانه سیستمهای اطلاعات و فناوری (ARIST), v31, pp 121–187, 1996 - مقدمهای برای مراجعان غیرحرفهای.
Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!