علوم رایانش و فناوری اطلاعات (Sep 2021)

شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه

  • امیرحسین زنگنه

Journal volume & issue
Vol. 18, no. 2

Abstract

Read online

یادگیری عمیق به عنوان یکی از تکنیک‌های یادگیری ماشین، از پیشرفت‌های فناوری واحدهای پردازش گرافیکی استفاده کرده و این امر به نوبه خود استفاده گسترده از آن را فراهم آورده ‌است. تکنیک‌های یادگیری عمیق به نتایج بسیار خوبی در بسیاری از مسائل مهم از جمله شناسایی و تشخیص رویداد در ویدیوی ورزش فوتبال، در مقایسه با روش­های سنتی دست یافته‌اند. یکی از چالش های عمده استفاده از شبکه­های عصبی عمیق برای مدیریت و طبقه بندی تصاویر، تعداد بسیار زیاد پارامترهای قابل آموزش در این نوع شبکه­ها می­باشد که منجر به بار محاسباتی بالا و زمان طولانی برای آموزش شبکه عصبی عمیق می­شود. شبکه عصبی Dense Net یکی از آخرین شبکه­های ارائه شده برای اهداف شناسایی و تشخیص اشیاء می­باشد. ما در این مقاله از شبکه عصبی عمیق دنس­نت برای شناسایی و تشخیص رویدادهای کارت زرد و قرمز، پنالتی و ضربه آزاد در ویدیوی ورزش فوتبال به عنوان یک معماری پایه استفاده کرده­ایم. تعداد و اندازه بلوک­های شبکه دنس­نت در تعداد پارامترهای قابل آموزش و همچنین دقت شبکه تاثیر گذار می­باشند. در این مقاله ما سعی کرده­ایم با ایجاد تغییر در معماری پایه شبکه عصبی عمیق دنس­نت با حفظ دقت، تعداد پارامترهای قابل آموزش این شبکه را کاهش دهیم. برای این منظور با بررسی حالت­های ممکن برای قرار گیری بلوک­های با سایز مختلف شبکه دنس­نت اقدام به ارائه یک معماری پیشنهادی برای شبکه عصبی عمیق کرده­ایم. نتایج ارزیابی‌ها، نشان­دهنده کاهش قابل توجه تعداد پارامترهای قابل آموزش شبکه عصبی عمیق و در عین حال افزایش دقت معماری پیشنهادی برای شناسایی و تشخیص رویدادهای مهم در ورزش فوتبال دارد.

Keywords