Iranian Journal of Information Processing & Management (Dec 2022)
تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنالیاب رایسست: مطالعه موردی حوزه فنی و مهندسی
Abstract
عوامل متعددی از مجموعه عناصر تشکیلدهنده سامانههای پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تأثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنالیاب «رایسست» انجام شده است. بدین منظور، بیش از 15000 مقاله از نشریههای فنی و مهندسی در بازه زمانی 1392 تا 1396 از وبسایت نشریهها گردآوری شد. در مرحله بعد عناصر متنی این مقالهها شامل عنوان، چکیده و واژههای کلیدی استخراج، نرمالسازی و پردازش شد و پایگاه دادهپیکره پژوهش ایجاد گردید. بر اساس تعداد مقالههای گردآوریشده، با استفاده از فرمول «کوکران» تعداد 400 مقاله پایه، که پیش از این در نشریههای مرتبط با موضوع منتشر شده بودند، به روش تصادفی-تناسبی انتخاب شد. عنوان و چکیده این مقالهها، بهمنظور دریافت نشریههای پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده بهعنوان پرسمان وارد سامانه شد. سپس، نتایج پیشنهادی در هر مرحله در قالب فایل «اکسل» ذخیره گردید. سرانجام، میزان اثربخشی نتایج سامانه در هر مرحله به روش اعتبارسنجی یکطرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی ردهها نشان داد که در وضعیت موجود، نشریه هدف تنها در 26 درصد از پرسمانها در 3 رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنیسازی، نرمالسازی و پردازش دادهها اثربخشی نتایج در 3 رتبه نخست به میزان 15 درصد افزایش یافت. اما همچنان در بیش از 30 درصد پرسمانها، نشریه هدف در رتبه 10 و بالاتر پیشنهاد شده بود. بنابراین، در مرحله بعد، بهمنظور بهبود چالش پراکندگی، دستهبندی موضوعی دادهها انجام و افزایش 30 درصدی اثربخشی نتایج نسبت به مرحله پیشین در 3 رتبه نخست حاصل گردید. بر این اساس، یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنالیاب «رایسست» میشود، کمبود و پراکندگی دادههاست که با غنیسازی پایگاه داده، بهبود فرایند پردازش، و دستهبندی موضوعی دادهها میتوان با این دو چالش به میزان قابل توجهی مقابله کرد و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.
Keywords