علوم رایانش و فناوری اطلاعات (Sep 2021)
(مقاله برتر کنفرانس) بهبود سیستمهای تصدیق هویت گوینده براي گفتارهای آلوده به نویز با استفاده از بردارهای هویت موزون
Abstract
کاربرپسند بودن، پیچیدگی محاسباتي کم و هزینه پيادهسازي پایین از مزایای تصدیق هویت مبتنی بر گفتار است. اما کارایی این شيوه در محیطهای واقعی به دلیل حضور نویزهای متفاوت صوتی و عوارض كانال به شدت افت میکند. روش i-vector PLDA شيوهای موفق در بهبود عملکرد سیستمهای تصدیق هویت گوینده است. استفاده از ویژگیهای آماری بردارهای ثبتنام گویندگان هدف برای وزندهی به بردارهای مدل و تست، دقت امتیازدهی و در نتیجه کل سیستم تصدیق هویت را در شرایط آزمون با گفتار تمیز افزایش میدهد. در این مقاله تاثیر استفاده از بردارهای هویت موزون بر عملکرد سیستم در محیطهای نویزی مورد ارزیابی قرار گرفته است. آزمایشها با استفاده از دادگان TIMIT، بردارهای ویژگی MFCCو PNCCو روش امتیازدهی PLDA انجام شده است. همچنین برای بهبود عملکرد سیستم در شرایط عدم تطبیق نویزی از آموزش چند-شرطی برای LDA و PLDA استفاده شده است. نتایج آزمونها مبین آن است که استفاده از بردارهای موزون دقت سیستم تصدیق هویت گوینده را براي گفتارهای نویزی نیز افزایش میدهد.