Iranian Journal of Information Processing & Management (Dec 2022)
شناسایی موضوعات داغ و روندها در علم اطلاعات و دانششناسی با استفاده از تکنیکهای متن-کاوی
Abstract
شناسایی موضوعات داغ در حوزههای پژوهشی همواره موردتوجه بوده است؛ تصمیمگیری هوشمندانه در مورد آنچه باید مورد مطالعه و قرار بگیرد، همواره عاملی اساسی برای محققان بوده و میتواند برای پژوهشگران موضوعی چالشبرانگیز باشد. هدف پژوهش حاضر، شناسایی موضوعات داغ در مقالات نمایهشده در پایگاه اسکوپوس در حوزه علم اطلاعات و دانششناسی در سالهای 2010 تا 2019 با استفاده از تکنیکهای متنکاوی است. جامعه آماری، شامل 50995 مقاله منتشرشده در 249 عنوان مجله نمایهشده در پایگاه اسکوپوس در این حوزه در بازه زمانی 2010 تا 2019 است. برای شناسایی خوشههای موضوعی این حوزه، از الگوریتمهای تکنیک تخصیص دیریکلت پنهان (LDA) استفاده شد و دادهها با استفاده از کتابخانههای متنکاوی در نرمافزار پایتون مورد تحلیل قرار گرفت. برای این کار، با اجرای الگوریتم وزندهی لغات به روش TF-IDF و تشکیل ماتریس متنی، موضوعات در پیکره اسناد تعیین و ضرایب اختصاص هر سند به هر موضوع (تتا) مشخص شد. خروجی اجرای الگوریتم LDA، منجر به شناسایی تعداد 260 موضوع شد. تخصیص برچسب به هریک از خوشههای موضوعی، بر اساس کلمات با بالاترین وزن اختصاصیافته به هر موضوع و با نظر کارشناسان حوزه موضوعی، انجام گرفت. با انجام محاسبات با ضریب اطمینان 95%، تعداد 63 موضوع از بین 260 موضوع اصلی انتخاب شد. با محاسبه میانگین تتا برحسب سال، تعداد 24 موضوع دارای روند مثبت (موضوع داغ) و تعداد 39 موضوع دارای روند منفی (موضوع سرد) تعیین شد. بر اساس نتایج، موضوعات مطالعات سنجشی، مدیریت الکترونیکی/ بازاریابی الکترونیکی، بازیابی محتوا، تحلیل داده و مهارت الکترونیکی، ازجمله موضوعات داغ بود و موضوعات آموزش، آرشیو، مدیریت دانش، سازماندهی و سلامت کتابداران ازجمله موضوعات سرد در حوزه علم اطلاعات و دانششناسی در بازه زمانی 2010 تا 2019 شناسایی شد. تحلیل یافتهها نشانگر آن است که به دلیل رویکرد اغلب پژوهشگران در 10 سال گذشته به استفاده از فنّاوریهای نوظهور، موضوعات مبتنی بر فنّاوری بیشتر باعث جذب آنان شده و در مقابل، موضوعات پایهای این حوزه، کمتر موردتوجه قرارگرفتهاند.
Keywords