Iranian Journal of Information Processing & Management (Dec 2022)

شناسایی موضوعات داغ و روندها در علم اطلاعات و دانش‌شناسی با استفاده از تکنیک‌های متن-کاوی

  • الهه اخوان حریری,
  • علی منصوری,
  • حسین کارشناس نجف‌آبادی

DOI
https://doi.org/10.35050/JIPM010.2022.028
Journal volume & issue
Vol. 38, no. 2
pp. 35 – 62

Abstract

Read online

شناسایی موضوعات داغ در حوزه­‌های پژوهشی همواره موردتوجه بوده است؛ تصمیم­‌گیری هوشمندانه در مورد آنچه باید مورد مطالعه و قرار بگیرد، همواره عاملی اساسی برای محققان بوده و می­‌تواند برای پژوهشگران موضوعی چالش‌­برانگیز باشد. هدف پژوهش حاضر، شناسایی موضوعات داغ در مقالات نمایه­‌شده در پایگاه اسکوپوس در حوزه علم اطلاعات و دانش‌­شناسی در سال­های 2010 تا 2019 با استفاده از تکنیک­‌های متن­‌کاوی است. جامعه آماری، شامل 50995 مقاله منتشرشده در 249 عنوان مجله نمایه­شده در پایگاه اسکوپوس در این حوزه در بازه زمانی 2010 تا 2019 است. برای شناسایی خوشه­‌های موضوعی این حوزه، از الگوریتم­‌های تکنیک تخصیص دیریکلت پنهان (LDA) استفاده شد و داده‌­ها با استفاده از کتابخانه‌های متن‌کاوی در نرم­افزار پایتون مورد تحلیل قرار گرفت. برای این کار، با اجرای الگوریتم وزن­دهی لغات به روش TF-IDF و تشکیل ماتریس متنی، موضوعات در پیکره اسناد تعیین و ضرایب اختصاص هر سند به هر موضوع (تتا) مشخص شد. خروجی اجرای الگوریتم LDA، منجر به شناسایی تعداد 260 موضوع شد. تخصیص برچسب به هریک از خوشه‌های موضوعی، بر اساس کلمات با بالاترین وزن اختصاص‌یافته به هر موضوع و با نظر کارشناسان حوزه موضوعی، انجام گرفت. با انجام محاسبات با ضریب اطمینان 95%، تعداد 63 موضوع از بین 260 موضوع اصلی انتخاب شد. با محاسبه میانگین تتا برحسب سال، تعداد 24 موضوع دارای روند مثبت (موضوع داغ) و تعداد 39 موضوع دارای روند منفی (موضوع سرد) تعیین شد. بر اساس نتایج، موضوعات مطالعات سنجشی، مدیریت الکترونیکی/ بازاریابی الکترونیکی، بازیابی محتوا، تحلیل داده و مهارت الکترونیکی، ازجمله موضوعات داغ بود و موضوعات آموزش، آرشیو، مدیریت دانش، سازمان‌دهی و سلامت کتابداران ازجمله موضوعات سرد در حوزه علم اطلاعات و دانش­‌شناسی در بازه زمانی 2010 تا 2019 شناسایی شد. تحلیل یافته­‌ها نشانگر آن است که به دلیل رویکرد اغلب پژوهشگران در 10 سال گذشته به استفاده از فنّاوری‌های نوظهور، موضوعات مبتنی بر فنّاوری بیشتر باعث جذب آنان شده و در مقابل، موضوعات پایه‌­ای­ این حوزه، کمتر موردتوجه قرارگرفته‌اند.

Keywords