علوم رایانش و فناوری اطلاعات (Sep 2021)

(مقاله برتر کنفرانس) بهبود سیستم‏های تصدیق هویت گوینده براي گفتارهای آلوده به نویز با استفاده از بردارهای هویت موزون

  • حمیدرضا صادق محمدی,
  • محسن محمدی

Journal volume & issue
Vol. 17, no. 2

Abstract

Read online

کاربرپسند بودن، پیچیدگی محاسباتي کم و هزینه پياده‌سازي پایین از مزایای تصدیق هویت مبتنی بر گفتار است. اما کارایی این شيوه در محیط‌های واقعی به دلیل حضور نویزهای متفاوت صوتی و عوارض كانال به شدت افت می‏کند. روش i-vector PLDA شيوه‌ای موفق در بهبود عملکرد سیستم‌های تصدیق هویت گوینده است. استفاده از ویژگی‌های آماری بردارهای ثبت‌نام گویندگان هدف برای وزن‌دهی به بردارهای مدل و تست، دقت امتیازدهی و در نتیجه کل سیستم تصدیق هویت را در شرایط آزمون با گفتار تمیز ‌افزایش می‌دهد. در این مقاله تاثیر استفاده از بردارهای هویت موزون بر عملکرد سیستم در محیط‌های نویزی مورد ارزیابی قرار گرفته است. آزمایش‌ها با استفاده از دادگان TIMIT، بردارهای ویژگی MFCCو PNCCو روش امتیازدهی PLDA انجام شده است. همچنین برای بهبود عملکرد سیستم در شرایط عدم تطبیق نویزی از آموزش چند-شرطی برای LDA و PLDA استفاده شده است. نتایج آزمون‌ها مبین آن است که استفاده از بردارهای موزون دقت سیستم تصدیق هویت گوینده را براي گفتار‌های نویزی نیز افزایش می‌دهد.

Keywords