علوم رایانش و فناوری اطلاعات (Sep 2021)
شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه
Abstract
یادگیری عمیق به عنوان یکی از تکنیکهای یادگیری ماشین، از پیشرفتهای فناوری واحدهای پردازش گرافیکی استفاده کرده و این امر به نوبه خود استفاده گسترده از آن را فراهم آورده است. تکنیکهای یادگیری عمیق به نتایج بسیار خوبی در بسیاری از مسائل مهم از جمله شناسایی و تشخیص رویداد در ویدیوی ورزش فوتبال، در مقایسه با روشهای سنتی دست یافتهاند. یکی از چالش های عمده استفاده از شبکههای عصبی عمیق برای مدیریت و طبقه بندی تصاویر، تعداد بسیار زیاد پارامترهای قابل آموزش در این نوع شبکهها میباشد که منجر به بار محاسباتی بالا و زمان طولانی برای آموزش شبکه عصبی عمیق میشود. شبکه عصبی Dense Net یکی از آخرین شبکههای ارائه شده برای اهداف شناسایی و تشخیص اشیاء میباشد. ما در این مقاله از شبکه عصبی عمیق دنسنت برای شناسایی و تشخیص رویدادهای کارت زرد و قرمز، پنالتی و ضربه آزاد در ویدیوی ورزش فوتبال به عنوان یک معماری پایه استفاده کردهایم. تعداد و اندازه بلوکهای شبکه دنسنت در تعداد پارامترهای قابل آموزش و همچنین دقت شبکه تاثیر گذار میباشند. در این مقاله ما سعی کردهایم با ایجاد تغییر در معماری پایه شبکه عصبی عمیق دنسنت با حفظ دقت، تعداد پارامترهای قابل آموزش این شبکه را کاهش دهیم. برای این منظور با بررسی حالتهای ممکن برای قرار گیری بلوکهای با سایز مختلف شبکه دنسنت اقدام به ارائه یک معماری پیشنهادی برای شبکه عصبی عمیق کردهایم. نتایج ارزیابیها، نشاندهنده کاهش قابل توجه تعداد پارامترهای قابل آموزش شبکه عصبی عمیق و در عین حال افزایش دقت معماری پیشنهادی برای شناسایی و تشخیص رویدادهای مهم در ورزش فوتبال دارد.