Iranian Journal of Information Processing & Management (Dec 2022)

تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنال‌یاب رایسست: مطالعه موردی حوزه فنی و مهندسی

  • نرجس ورع,
  • مهدیه میرزابیگی,
  • هاجر ستوده,
  • سیدمصطفی فخراحمد,
  • نیلوفر مظفری

DOI
https://doi.org/10.35050/JIPM010.2022.011
Journal volume & issue
Vol. 37, no. 4
pp. 1293 – 1318

Abstract

Read online

عوامل متعددی از مجموعه‌ عناصر تشکیل‌دهنده سامانه‌های پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تأثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنال‌یاب «رایسست» انجام شده است. بدین منظور، بیش از 15000 مقاله از نشریه‌های فنی و مهندسی در بازه زمانی 1392 تا 1396 از وب‌سایت نشریه‌ها گردآوری شد. در مرحله بعد عناصر متنی این مقاله‌ها شامل عنوان، چکیده و واژه‌های کلیدی استخراج، نرمال‏سازی و پردازش شد و پایگاه داده‌پیکره پژوهش ایجاد گردید. بر اساس تعداد مقاله‌های گردآوری‌شده، با استفاده از فرمول «کوکران» تعداد 400 مقاله پایه، که پیش از این در نشریه‌های مرتبط با موضوع منتشر شده بودند، به ‌روش تصادفی-تناسبی انتخاب شد. عنوان و چکیده این مقاله‌ها، به‌منظور دریافت نشریه‌های پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده به‌عنوان پرسمان وارد سامانه شد. سپس، نتایج پیشنهادی در هر مرحله در قالب فایل «اکسل» ذخیره گردید. سرانجام، ‌میزان اثربخشی نتایج سامانه در هر مرحله به‌ روش اعتبارسنجی یک‌طرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی رده‌ها نشان داد که در وضعیت موجود، نشریه هدف تنها در 26 درصد از پرسمان‌ها در 3 رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنی‌سازی، نرمال‌سازی و پردازش داده‌ها اثربخشی نتایج در 3 رتبه نخست به ‌میزان 15 درصد افزایش یافت. اما همچنان در بیش از 30 درصد پرسمان‌ها، نشریه هدف در رتبه 10 و بالاتر پیشنهاد شده بود. بنابراین، در مرحله بعد، به‌منظور بهبود چالش پراکندگی، دسته‌بندی موضوعی داده‌ها انجام و افزایش 30 درصدی اثربخشی نتایج نسبت به مرحله پیشین در 3 رتبه نخست حاصل گردید. بر این اساس، یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنال‌یاب «رایسست» می‌شود، کمبود و پراکندگی داده‌هاست که با غنی‌سازی پایگاه داده، بهبود فرایند پردازش، و دسته‌بندی موضوعی داده‌ها می‌توان با این دو چالش به ‌میزان قابل توجهی مقابله کرد و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.

Keywords