مجلة جامعة دمشق للعلوم الهندسية (Oct 2022)
توليد تحريك لِوجه يتزامن مع كلام مُدخَل باللغة العربية
Abstract
يهدف البحث إلى توليد تحريك لنموذج وجه بشريّ ثلاثي الأبعاد يتزامن مع إشارة كلاميّة بالّلغة العربيّة، يختصّ بمنطقة الشّفاه والفكّ. ينقسم البحث إلى قسمين: 1- معالجة الإشارة الكلاميّة لتعرُّف الصّوتيمات (الفونيمات) ومُدَدها، 2- مقابلة الصّوتيمات مع الفيزيمات المناسبة والتّنقل بين الفيزيمات حسب مدّة كل صوتيم. تمَّ الاعتماد في القسم الأوّل على نموذج ماركوف المخفي ذي ثلاث حالات لكل صوتيم، مع نموذج خليط غاوسي، بحيث يكون دخل النّموذج تصنيفات سمات ميل كيبستروم MFCCs، وخرجه صوتيمات الكلام مقسّمة زمنيّاً. وتمَّ الاعتماد في القسم الثّاني على نموذج استيفاء الأشكال مع مراعاة التّداخل الزمنيّ بين الفيزيمات لتحقيق التّرابط النّطقيّ، وتمَّ وضع صيغة جديدة لحساب شدّة ظهور الفيزيم والفترة الّتي يبقى فيها محافظاً على شكله، تعتمد على مدّة الصّوتيم ومتوسّط مُدَدَه. كانت دقّة تعرُّف الصّوتيمات 86.09% على مستوى الإطار حسب صيغة مُعدّل الخطأ في تعرُّف الصّوتيمات، وتمَّ إجراء تقييم فردي لنتائج التّحريك بواسطة 75 مستخدم، وكانت النّتيجة أنَّ 56% من المستخدمين كان تقييمهم 80% وما فوق لجودة مطابقة الكلام مع حركات الشّفاه، و57% من المستخدمين كان تقييمهم 80% وما فوق لواقعيّة التّحريك. كما تمَّت المقارنة مع طريقة أخرى لحساب شدّة الفيزيم تعتمد على تردُّد الصوت Frequency والشّدّة Intensity، وكانت النّتيجة أنَّ 65% من المستخدمين كان تقييمهم لصالح التّحريك النّاتج عن الطّريقة المُطبَّقة في هذا البحث. نستنتج أنه إذا كانت دقّة التّحريك عالية فإن دقّة تعرُّف الصّوتيمات حتماً عالية، لكنَّ العكس ليس بالضّرورة صحيحاً، فلعمليّة التّحريك محدّداتها الخاصّة الّتي من شأنها إنتاج مزامنة دقيقة بين الحركة والكلام، مثل معرفة شدّة الفيزيم وتحقيق التّرابط النّطقيّ والفترة التي يبقى فيها الفيزيم محافظاً على شكله، إذاً عمليّة الانتقال من صوتيمات الكلام إلى التّحريك ليست عمليّة تقابل بحتة.