Sistemnì Doslìdženâ ta Informacìjnì Tehnologìï (Sep 2021)

Тематичне моделювання науковців на основі їх інтересів у Google Scholar

  • Serhiy Shtovba,
  • Mykola Petrychko

DOI
https://doi.org/10.20535/SRIT.2308-8893.2021.2.09
Journal volume & issue
no. 2

Abstract

Read online

Запропоновано алгоритм тематичного моделювання науковців за науковими спеціальностям на основі їх інтересів у профілях у Google Scholar. Алгоритм використовує перелік наукових спеціальностей із системи класифікації наук ANZSRC. Інформаційним ресурсом для тематичного моделювання є база категоризованих наукових публікацій із системи Dimensions. Інтереси з профілів науковців використовуються як пошукові запити для Dimensions, сервіси якої видають розподіли релевантних документів за спеціальностями. Для зменшення інформаційного шуму ці розподіли проходять декілька етапів оброблення. Порівнюються результати тематичного моделювання на основі профільних інтересів у Google Scholar і категоризованого списку авторських публікацій у Dimensions за метрикою Чекановського з урахуванням спорідненості спеціальностей. Для тестових науковців виявлено високу узгодженість результатів тематичного моделювання за різної початкової інформації.

Keywords