انتقل إلى المحتوى الرئيسي

دليل معالجة الصوت

يغطي هذا الدليل كيفية إعداد طرق إدخال صوتية مختلفة لتغذية بيانات الصوت إلى مولدات مزامنة الشفاه. تأكد من إكمال دليل الإعداد قبل المتابعة.

معالجة إدخال الصوت

تحتاج إلى إعداد طريقة لمعالجة إدخال الصوت. هناك عدة طرق للقيام بذلك اعتمادًا على مصدر الصوت الخاص بك.

يقوم هذا النهج بمزامنة الشفاه في الوقت الحقيقي أثناء التحدث في الميكروفون:

  1. أنشئ Capturable Sound Wave باستخدام Runtime Audio Importer
  2. قبل البدء في التقاط الصوت، قم بربط مندوب OnPopulateAudioData
  3. في الوظيفة المقيدة، استدعِ ProcessAudioData من Runtime Viseme Generator الخاص بك
  4. ابدأ في التقاط الصوت من الميكروفون

عقد قابلة للنسخ.

مزامنة الشفاه أثناء التقاط الصوت

نصائح أداء المعالجة

  • حجم المقطع: يمكن أن يؤدي زيادة خيار التكوين ProcessingChunkSize (على سبيل المثال إلى 320 أو 480 أو 640 عينة) إلى تحسين زمن الوصول بشكل ملحوظ مع تأثير ضئيل على الجودة أو الاستجابة.

  • نوع النموذج: عند استخدام النماذج الواقعية، يمكن أن يؤدي التبديل إلى نوع النموذج المُحسَّن للغاية (المحدد افتراضيًا) إلى تحسين الأداء. لاحظ أن النموذج الأصلي قد ينتج جودة أفضل قليلاً، خاصة مع الصوت المشوش.

  • إدارة المخزن المؤقت: يعالج النموذج المدعوم بالمزاج الصوت في إطارات من 320 عينة (20 مللي ثانية عند 16 كيلو هرتز). تأكد من محاذاة توقيت إدخال الصوت الخاص بك مع هذا للحصول على أداء مثالي.

  • إعادة إنشاء المولد: للتشغيل الموثوق مع النماذج الواقعية، أعد إنشاء المولد في كل مرة تريد فيها تغذية بيانات صوت جديدة بعد فترة من الخمول.

الخطوات التالية

بمجرد إعداد معالجة الصوت، قد ترغب في:

  • التعرف على خيارات التكوين لضبط سلوك مزامنة الشفاه الخاص بك
  • إضافة حركة الضحك لتحسين التعبير
  • دمج مزامنة الشفاه مع حركات الوجه الحالية باستخدام تقنيات الطبقة الموضحة في دليل التكوين