Preskočiť na obsah
  • O nás
    • Kto sme a ako sa stať naším členom?
    • Stanovy spoločnosti
    • Predseda a správna rada
    • Kontakt
  • Oznamy
  • Politika
  • Kultúra a veda
    • Kultúrne novinky v slovenskom jazyku
    • Vedecké novinky v ruskom jazyku
  • Pel-mel
  • Kluby Arbat
  • Komentáre
  • O nás
    • Kto sme a ako sa stať naším členom?
    • Stanovy spoločnosti
    • Predseda a správna rada
    • Kontakt
  • Oznamy
  • Politika
  • Kultúra a veda
    • Kultúrne novinky v slovenskom jazyku
    • Vedecké novinky v ruskom jazyku
  • Pel-mel
  • Kluby Arbat
  • Komentáre
Источник фото: ru.123rf.com

Správa z oblasti ruskej vedy v pôvodnom znení (scientificrussia.ru)

  • srspol
  • 14. mája, 2024
  • 9:20 pm

Мультиязычную нейросеть МГУ для обработки научных текстов внедрили в библиотеки


Научная электронная библиотека elibrary.ru открыла для пользователей портала поиск близких по тематике публикаций с применением нейросети SciRus-tiny, разработанной в МГУ для анализа научных текстов в рамках проекта «Математические методы анализа сложных систем», проект «Разработка математических методов машинного обучения для обработки текстовой научной информации большого объема» Междисциплинарной научно-образовательной школы МГУ.

«Российские ученые теперь могут с помощью нейросетевой модели МГУ пополнять коллекции своих статей. Это оказалось очень удобно, – прокомментировал руководитель междисциплинарной группы проекта, заведующий кафедрой физического факультета МГУ академик Алексей Хохлов. – Традиционно поиск в базах данных научной информации производится путем указания ключевых слов. Количество найденных документов и их состав сильно зависят от того, насколько точно подобраны ключевые слова. Нейросетевой поиск позволяет задать в качестве условия запроса аннотацию, полный текст научной статьи или даже подборки статей по интересующей тематике. Система автоматически подберет документы, максимально близкие по своей тематической направленности».

На портале elibrary.ru такой поиск реализован на странице с описанием публикации (пункт «Найти близкие по тематике публикации» в панели «Инструменты»). Кроме поиска с помощью нейросети, на выбор пользователя предоставляется несколько вариантов поиска — на основе совместного цитирования, просмотра публикаций пользователями и включения в подборки, соавторства и совпадения ключевых слов. Также есть возможность ограничить поиск путем указания периода выпуска научной статьи, типа публикации, ее вхождения в РИНЦ или ядро РИНЦ, а также даты размещения на портале elibrary.ru. Последнее условие удобно использовать для поиска среди свежих поступлений в Научную электронную библиотеку.

«Разработанная в рамках данного проекта модель уже широко используется в Научной электронной библиотеке для решения целого ряда задач, связанных с оценкой тематической близости научных документов. Уже протестирован специалистами полезный сервис для ученых, позволяющий для заданной статьи или подборки статей найти тематически похожие документы как среди всего массива elibrary.ru (более 55 млн научных публикаций), так и только среди новых поступлений, — прокомментировал генеральный директор НЭБ Геннадий Еременко. — Важной для нас особенностью данной модели является ее мультиязычность, поскольку Научная электронная библиотека содержит документы на различных языках. Также тестирование подтвердило высокую эффективность модели, что расширяет круг задач и приложений, где она может быть использована. В стадии разработки — применение нейросети для идентификации авторов в публикациях, тематической классификации научных статей, а также в новом интерфейсе расширенного поиска на elibrary.ru».

Напомним, что в декабре 2023 года сотрудники лаборатории машинного обучения и семантического анализа Института ИИ МГУ при поддержке портала eLibrary обучили и опубликовали в открытом доступе нейронную сеть для получения семантических векторных представлений (эмбеддингов) научных текстов на русском языке SciRus-tiny. С ее помощью можно решать множество прикладных задач, начиная с поиска и классификации и заканчивая извлечением научных терминов.

Информация предоставлена пресс-службой МГУ

Источник фото: ru.123rf.com

Разместила: Ирина Усик

Информация взята с портала «Научная Россия» (scientificrussia.ru)
PrevPredchádzajúca správaIvo Strejček: Absence historické paměti
Ďalšia správaPoslali byste na smrt svoje děti? Šichtařové je zleĎalšie
  • Kto sme a ako sa stať naším členom?
  • Stanovy občianskeho združenia
  • Predseda a správna rada
  • Kontakt
  • Oznamy
  • Politika
  • Kultúra a veda
  • Kultúrne novinky v slovenskom jazyku
  • Vedecké novinky v ruskom jazyku
  • Pel-mel
  • Kluby Arbat
  • Komentáre

© Slovensko-ruská spoločnosť. Všetky práva vyhradené.

Spravujte súhlas so súbormi cookie
Na poskytovanie tých najlepších skúseností používame technológie, ako sú súbory cookie na ukladanie a/alebo prístup k informáciám o zariadení. Súhlas s týmito technológiami nám umožní spracovávať údaje, ako je správanie pri prehliadaní alebo jedinečné ID na tejto stránke. Nesúhlas alebo odvolanie súhlasu môže nepriaznivo ovplyvniť určité vlastnosti a funkcie.
Funkčné Vždy aktívny
Technické uloženie alebo prístup sú nevyhnutne potrebné na legitímny účel umožnenia použitia konkrétnej služby, ktorú si účastník alebo používateľ výslovne vyžiadal, alebo na jediný účel vykonania prenosu komunikácie cez elektronickú komunikačnú sieť.
Predvoľby
Technické uloženie alebo prístup je potrebný na legitímny účel ukladania preferencií, ktoré si účastník alebo používateľ nepožaduje.
Štatistiky
Technické úložisko alebo prístup, ktorý sa používa výlučne na štatistické účely. Technické úložisko alebo prístup, ktorý sa používa výlučne na anonymné štatistické účely. Bez predvolania, dobrovoľného plnenia zo strany vášho poskytovateľa internetových služieb alebo dodatočných záznamov od tretej strany, informácie uložené alebo získané len na tento účel sa zvyčajne nedajú použiť na vašu identifikáciu.
Marketing
Technické úložisko alebo prístup sú potrebné na vytvorenie používateľských profilov na odosielanie reklamy alebo sledovanie používateľa na webovej stránke alebo na viacerých webových stránkach na podobné marketingové účely.
Spravovať možnosti Správa služieb Spravovať predajcov Prečítajte si viac o týchto účeloch
Zobraziť predvoľby
{title} {title} {title}