انتقل إلى المحتوى الرئيسي

دليل معالجة الصوت

يغطي هذا الدليل كيفية إعداد طرق إدخال صوتية مختلفة لتغذية بيانات الصوت إلى مولدات مزامنة الشفاه الخاصة بك. تأكد من إكمال دليل الإعداد قبل المتابعة.

معالجة إدخال الصوت

تحتاج إلى إعداد طريقة لمعالجة إدخال الصوت. هناك عدة طرق للقيام بذلك اعتمادًا على مصدر الصوت الخاص بك.

يقوم هذا النهج بمزامنة الشفاه في الوقت الفعلي أثناء التحدث في الميكروفون:

  1. أنشئ Capturable Sound Wave باستخدام Runtime Audio Importer
  2. قبل البدء في التقاط الصوت، قم بالربط مع المفوض OnPopulateAudioData
  3. في الوظيفة المرتبطة، استدعِ ProcessAudioData من Runtime Viseme Generator الخاص بك
  4. ابدأ في التقاط الصوت من الميكروفون

عُقد قابلة للنسخ.

مزامنة الشفاه أثناء التقاط الصوت

نصائح أداء المعالجة

  • حجم القطعة: إذا كنت تريد معالجة بيانات الصوت في قطع أصغر لمزامنة الشفاه الأكثر استجابة، فاضبط الحساب في دالة SetNumSamplesPerChunk. على سبيل المثال، قسمة معدل العينات على 150 (تدفق كل ~6.67 مللي ثانية) بدلاً من 100 (تدفق كل 10 مللي ثانية) سيوفر تحديثات أكثر تواترًا لمزامنة الشفاه.

  • إدارة المخزن المؤقت: يعالج النموذج المدعوم بالمزاج الصوت في إطارات مكونة من 320 عينة (20 مللي ثانية عند 16 كيلو هرتز). تأكد من محاذاة توقيت إدخال الصوت مع هذا للأداء الأمثل.

  • إعادة إنشاء المولد: للتشغيل الموثوق مع النماذج الواقعية، أعد إنشاء المولد في كل مرة تريد فيها تغذية بيانات صوتية جديدة بعد فترة من عدم النشاط.

الخطوات التالية

بمجرد إعداد معالجة الصوت، قد ترغب في:

  • التعرف على خيارات التكوين لضبط سلوك مزامنة الشفاه بدقة
  • إضافة رسوم متحركة للضحك لتحسين التعبير
  • دمج مزامنة الشفاه مع الرسوم المتحركة للوجه الحالية باستخدام تقنيات الطبقة الموضحة في دليل التكوين