مهندسی صنایع و مدیریت شریف (Aug 2017)
ارائهی الگوریتمی بهمنظور خوشهبندی صفحات وب براساس محتوا و لینک
Abstract
وجود یک موتور جستوجوی کارا میتواند سبب افزایش رضایت کاربران از خدمات تحت وب باشد. چالش اصلی موتورهای جستوجو، انتخاب مناسبترین صفحات در مواجهه با پرسشهای چندوجهی کاربران است. «خوشهبندی صفحات براساس محتوا و لینک» رویکردی است که برای حل چنین مسائلی در ادبیات پیشنهاد شده است. در این نوشتار، بر یکی از الگوریتمهای موجود، بهنام CohsMix، تمرکز شده و این الگوریتم برای ارتقای کیفیت پاسخها و افزایش سرعت حل بهبود داده شده است. تعیین نقطهی شروع مناسب، استفاده از خواص شبکههای پیچیده بهمنظور سادهسازی محاسبات، و محاسبهی مقدار واقعی انحراف استاندارد از جمله تغییرات پیشنهادی برای بهبود الگوریتم است. نتایج تجربی نشان میدهد که الگوریتم بهبودیافته، کیفیت جوابها را ارتقا داده و باعث افزایش سرعت حل میشود. همچنین، بهعنوان مطالعهی موردی، دادههای مربوط به وبلاگهای فارسی استخراج و الگوریتم بهبودیافته روی این دادهها اجرا خواهد شد.
Keywords