Semantic Scholar починався як база даних, присвячена темам інформатики, геонауки та нейронауки.[6] Однак у 2017 році система почала включати до свого корпусу біомедичну літературу[en].[6] Станом на вересень 2022 року вони налічували понад 200 мільйонів публікацій з усіх галузей науки.[7]
Технології
Semantic Scholar надає короткий виклад наукової літератури(Scientific literature) одним реченням. Однією з його цілей було вирішення проблеми читання численних заголовків і довгих анотацій на мобільних пристроях.[8] Цей інструмент також сприяє тому, щоб три мільйони наукових робіт, які публікуються щорічно, досягли читачів, оскільки, за оцінками, лише половина цієї літератури коли-небуть читається.[9]
На відміну від Google Scholar і PubMed, Semantic Scholar призначено для виділення найважливіших і впливових елементів публікації.[12] Технологія ШІ має виявляти, приховані зв'язки і зв'язки між темами досліджень.[13] Як і раніше, цитовані пошукові системи, Semantic Scholar також використовує графові структури, які включають Microsoft Academic Knowledge Graph, Springer Nature's SciGraph і Semantic Scholar Corpus.[14]
Кожній статті, розміщеній у Semantic Scholar, присвоюється унікальний ідентифікатор під назвою Semantic Scholar Corpus ID (скорочено S2CID). Наступний запис є прикладом:
Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (March 2020). The reproductive number of COVID-19 is higher compared to SARS coronavirus. Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID32052846. {{S2CID|211099356}}.
Semantic Scholar є безкоштовним у використанні та на відміну від подібних пошукових систем (тобто Google Scholar) не шукає матеріали, які знаходяться «за стіною» платного доступу.[15][6]
Одне дослідження порівнювало пошукові можливості Semantic Scholar за допомогою систематичного підходу та виявило, що пошукова система була точною на 98,88 % при спробі розкрити дані.[15] У цьому ж дослідженні вивчалися інші функції Semantic Scholar, включно з інструменти для опитування метаданих, а також кілька інструментів цитування.[15]
Кількість користувачів і публікацій
Станом на січень 2018 року, після проєкту 2017 року, який додав біомедичні статті та резюме тем, корпус Semantic Scholar включав понад 40 мільйонів робіт з інформатики та біомедицини.[16] У березні 2018 року Даг Реймонд, який розробляв ініціативи машинного навчання для платформи Amazon Alexa, був найнятий для керівництва проектом Semantic Scholar.[17] Станом на серпень 2019 року кількість включених метаданих статей (не фактичних PDF-файлів) зросла до понад 173 мільйонів[18] після додавання записів Microsoft Academic Graph.[19] У 2020 році партнерство між Semantic Scholar і University of Chicago Press Journals зробило всі статті, опубліковані в University of Chicago Press, доступними в корпусі Semantic Scholar.[20] Наприкінці 2020 року Semantic Scholar проіндексувало 190 мільйонів документів.[21]
У 2020 році кількість користувачів Semantic Scholar досягла семи мільйонів на місяць.[8]
Див. також
Citation analysis – Examination of the frequency, patterns, and graphs of citations in documents
Citation index — Index of citations between publications
Knowledge extraction — Creation of knowledge from structured and unstructured sources
List of academic databases and search engines
Scientometrics — Study of measuring and analysing science, technology and innovation
↑Matthews, David (1 вересня 2021). Drowning in the literature? These smart software tools can help. Nature. Процитовано 5 вересня 2022. ...the publicly available corpus compiled by Semantic Scholar — a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington — amounting to around 200 million articles, including preprints.
↑Semantic Scholar. International Journal of Language and Literary Studies. Процитовано 9 листопада 2021.
↑Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age(англ.). Chandos Publishing. с. 91. ISBN978-0-12-823724-3.
↑Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I(англ.). Cham, Switzerland: Springer Nature. с. 254. ISBN978-3-030-45438-8.