نظرة عامة

Runtime MetaHuman Lip Sync هو مكون إضافي يمكّن من مزامنة الشفاه في الوقت الفعلي، دون اتصال، وعبر المنصات لكل من شخصيات MetaHuman والشخصيات المخصصة. يسمح لك برسم حركة شفاه الشخصية استجابةً لإدخال صوتي من مصادر متنوعة، بما في ذلك:
- إدخال الميكروفون عبر موجة الصوت القابلة للتسجيل الخاصة بـ Runtime Audio Importer
- كلام مُركّب من Runtime Text To Speech أو Runtime AI Chatbot Integrator
- بيانات صوتية مُدفوعة أو مستوردة بتنسيقات متعددة عبر Runtime Audio Importer
- أي بيانات صوتية بتنسيق PCM عائم (مصفوفة من عينات النقطة العائمة)
يقوم المكون الإضافي داخليًا بتوليد فيزيمات (تمثيلات مرئية للفونيمات) بناءً على الإدخال الصوتي. نظرًا لأنه يعمل مباشرةً مع بيانات الصوت بدلاً من النص، يدعم المكون الإضافي الإدخال متعدد اللغات بما في ذلك على سبيل المثال لا الحصر الإنجليزية، والإسبانية، والفرنسية، والألمانية، واليابانية، والصينية، والكورية، والروسية، والإيطالية، والبرتغالية، والعربية، والهندية. أي لغة مدعومة حرفيًا حيث يتم توليد مزامنة الشفاه من فونيمات الصوت بدلاً من معالجة نصية خاصة بلغة.
ينتج النموذج القياسي 14 فيزيماً ويقوم برسم حركة مزامنة الشفاه باستخدام أصل وضعية مسبقة التعريف. في المقابل، تولد النماذج الواقعية (الحصرية لشخصيات MetaHuman) 81 تغييرًا في التحكم الوجهي دون الاعتماد على أصل وضعية مسبقة التعريف، مما يؤدي إلى رسوم وجهية أكثر واقعية بشكل ملحوظ.
توافق الشخصيات
على الرغم من اسمه، يعمل Runtime MetaHuman Lip Sync مع مجموعة واسعة من الشخصيات تتجاوز مجرد شخصيات MetaHuman:
أنظمة الشخصيات التجارية الشائعة
- شخصيات Daz Genesis 8/9
- شخصيات Reallusion Character Creator 3/4 (CC3/CC4)
- شخصيات Mixamo
- أفاتار ReadyPlayerMe
دعم معايير الرسوم المتحركة
- أنظمة أشكال المزج القائمة على FACS
- معيار أشكال المزج Apple ARKit
- مجموعات فونيمات Preston Blair
- أنظمة فونيمات 3ds Max
- أي شخصية ذات أهداف تشكيل مخصصة للتعبيرات الوجهية
للحصول على تعليمات مفصلة حول استخدام المكون الإضافي مع شخصيات غير MetaHuman، راجع دليل إعداد الشخصية المخصصة.
معاينة الرسوم المتحركة
تحقق من هذه الرسوم المتحركة القصيرة لترى جودة رسوم مزامنة الشفاه التي ينتجها المكون الإضافي عبر أنواع الشخصيات والنماذج المختلفة:
الميزات الرئيسية
- مزامنة الشفاه في الوقت الفعلي من مدخل الميكروفون
- دعم معالجة الصوت بلا اتصال
- توافق عبر المنصات مع دعم منصة محدد للنموذج
- دعم لأنظمة الشخصيات المتعددة ومعايير الرسوم المتحركة
- تعيين مرن للوحدات الصوتية المرئية (visemes) للشخصيات المخصصة
- دعم لغوي عالمي - يعمل مع أي لغة منطوقة من خلال تحليل الصوت
- رسوم متحركة للوجه واعية بالمزاج لتعزيز التعبير
- أنواع مخرجات قابلة للتكوين (الوجه الكامل أو عناصر التحكم للفم فقط)
نماذج مزامنة الشفاه
يقدم البرنامج المساعد نماذج متعددة لمزامنة الشفاه لتناسب احتياجات المشروع المختلفة:
- Standard Model
- Realistic Model
- Mood-Enabled Realistic Model
يوفر نموذج مزامنة الشفاه القياسي أداءً فعالاً عبر المنصات مع توافق واسع مع الشخصيات:
- يعمل مع MetaHumans وجميع أنواع الشخصيات المخصصة
- محسن لأداء الوقت الفعلي
- متطلبات موارد أقل
- دعم المنصة: Windows, Android, Android-based platforms (including Meta Quest)
لاستخدام Standard Model، تحتاج إلى تثبيت برنامج مساعد إضافي. راجع قسم المتطلبات الأساسية للحصول على تعليمات التثبيت.
يقدم نموذج مزامنة الشفاه الواقعي دقة بصرية محسنة مصممة خصيصًا لشخصيات MetaHuman:
- متوافق مع MetaHuman والشخصيات القائمة على ARKit مع رسوم متحركة وجهية متقدمة (81 عنصر تحكم وجهي)
- جودة بصرية أعلى مع حركات فم أكثر طبيعية
- متطلبات أداء أعلى قليلاً
- معالجة صوتية متدفقة للتطبيقات في الوقت الفعلي
- مثالي للتجارب السينمائية وتفاعلات الشخصيات عن قرب
- ثلاثة مستويات تحسين: Original، و Semi-Optimized، و Highly Optimized
- مجموعات أهداف التشكيل (morph targets) قابلة للتكوين (انظر اختيار مجموعة أهداف التشكيل)
- دعم المنصة: Windows, Mac, iOS, Linux, Android, Android-based platforms (including Meta Quest)
Realistic Model مدرج في البرنامج المساعد الرئيسي ولا يتطلب أي إضافات لاستخدامه.
يوفر نموذج مزامنة الشفاه الواقعي المدعوم بالمزاج رسومًا متحركة للوجه واعية بالعاطفة لشخصيات MetaHuman:
- متوافق مع MetaHuman والشخصيات القائمة على ARKit مع رسوم متحركة وجهية تستجيب للمزاج (81 عنصر تحكم وجهي)
- 12 نوعًا مختلفًا من المزاج (محايد، سعيد، حزين، واثق، إلخ)
- شدة مزاج قابلة للتكوين (من 0.0 إلى 1.0)
- توقيت استباقي قابل للتعديل لتحسين المزامنة (من 20 مللي ثانية إلى 200 مللي ثانية)
- أنواع مخرجات قابلة للاختيار: عناصر تحكم للوجه الكامل أو للفم فقط
- معالجة صوتية متدفقة للتطبيقات في الوقت الفعلي
- مجموعات أهداف التشكيل (morph targets) قابلة للتكوين (انظر اختيار مجموعة أهداف التشكيل)
- دعم المنصة: Windows, Mac, iOS, Linux, Android, Android-based platforms (including Meta Quest)
Mood-Enabled Realistic Model مدرج في البرنامج المساعد الرئيسي ولا يتطلب أي إضافات لاستخدامه.
يمكنك اختيار النموذج المناسب بناءً على متطلبات مشروعك للأداء، وتوافق الشخصية، والجودة البصرية، والمنصة المستهدفة، واحتياجات الميزات.
آلية العمل
يعالج البرنامج المساعد مدخلات الصوت بالطريقة التالية:
- يتم استقبال بيانات الصوت بتنسيق PCM عائم مع قنوات و معدل عينة محددين
- يعالج البرنامج المساعد الصوت لتوليد بيانات تحكم وجهية أو وحدات صوتية مرئية (visemes) اعتمادًا على النموذج
- بالنسبة للنماذج المدعومة بالمزاج، يتم تطبيق السياق العاطفي على الرسوم المتحركة للوجه
- تقوم بيانات الرسوم المتحركة بتحريك حركات وجه الشخصية في الوقت الفعلي
بنية الأداء
يستخدم Runtime MetaHuman Lip Sync الاستدلال على وحدة المعالجة المركزية (CPU) فقط لتقديم نتائج مزامنة شفاه متسقة ومنخفضة الكمون مناسبة للتطبيقات في الوقت الفعلي. بشكل افتراضي، يقوم البرنامج المساعد بمعالجة مزامنة الشفاه كل 10 مللي ثانية (قابل للتعديل - انظر تكوين البرنامج المساعد لجميع الإعدادات المتاحة بما في ذلك حجم جزء المعالجة، وعدد الخيوط، ومعلمات الأداء الأخرى).
نظرة عامة على بنية النموذج
تستخدم نماذج مزامنة الشفاه شبكة عصبية مدمجة قائمة على المحولات (transformer) تعالج الصوت من خلال تحليل مخطط الطيف الميل (mel-spectrogram). تم تصميم هذه البنية خفيفة الوزن خصيصًا لأداء الوقت الفعلي مع استدلال فعال لوحدة المعالجة المركزية وبصمة ذاكرة دنيا.
لماذا الاستدلال على وحدة المعالجة المركزية؟
للعمليات الاستدلالية الصغيرة والمتكررة مثل مزامنة الشفاه في الوقت الفعلي، تقدم معالجة وحدة المعالجة المركزية خصائص كمون أفضل من وحدة معالجة الرسومات (GPU). عند حجم دفعة 1 مع فترات استدلال تتراوح بين 10-100 مللي ثانية، غالبًا ما يتجاوز النفقات العامة لوحدة معالجة الرسومات الناتجة عن عمليات نقل PCIe وإطلاق النواة وقت الحوسبة الفعلي. بالإضافة إلى ذلك، في محركات الألعاب تكون وحدة معالجة الرسومات مشبعة بالفعل بالتقديم، والظلال، والفيزياء، مما يخلق تنافسًا على الموارد يؤدي إلى حدوث طفرات كمون غير متوقعة.
توافق الأجهزة
يعمل البرنامج المساعد بكفاءة على معظم وحدات المعالجة المركزية من المستوى المتوسط وما فوق دون الحاجة إلى أجهزة رسومات مخصصة، مما يوفر أداءً في الوقت الفعلي عبر منصات سطح المكتب، والهواتف المحمولة، والواقع الافتراضي. بالنسبة للأجهزة الأضعف، يمكنك ضبط نوع النموذج إلى Semi-Optimized أو Highly Optimized، أو زيادة حجم جزء المعالجة للحفاظ على أداء الوقت الفعلي مع استجابة أقل قليلاً.
البدء السريع
إليك الإعداد الأساسي لتمكين مزامنة الشفاه على شخصيتك:
- لشخصيات MetaHuman، اتبع دليل الإعداد
- للشخصيات المخصصة، اتبع دليل إعداد الشخصية المخصصة
- اختر وقم بتكوين نموذج مزامنة الشفاه المفضل لديك
- قم بإعداد معالجة مدخلات الصوت في مخططك الأزرق (Blueprint)
- قم بتوصيل عقدة مزامنة الشفاه المناسبة في مخطط الرسوم المتحركة الأزرق (Animation Blueprint)
- شغل الصوت وشاهد شخصيتك تتحدث بعاطفة!
موارد إضافية
📦 التحميلات والروابط
مشاريع تجريبية:
- تجربة الكلام إلى كلام (سير عمل الذكاء الاصطناعي الكامل):
- تحميل التجربة المعبأة (Windows) ⭐ جديد
- تحميل الملفات المصدرية (UE 5.6+) ⭐ جديد
- سير عمل كامل للتعرف على الكلام + روبوت محادثة ذكي + تحويل النص إلى كلام + مزامنة الشفاه
- المتطلبات: هذا البرنامج المساعد + Runtime Audio Importer + Runtime Speech Recognizer + Runtime AI Chatbot Integrator، اختياري: Runtime Text To Speech
- تجربة مزامنة الشفاه الأساسية:
- تحميل التجربة المعبأة (Windows)
- تحميل الملفات المصدرية (UE 5.6+)
- مسارات عمل أساسية: مدخل الميكروفون، ملفات الصوت، تحويل النص إلى كلام
- المتطلبات: هذا البرنامج المساعد + Runtime Audio Importer، اختياري: Text To Speech / AI Chatbot
- يتطلب النموذج القياسي برنامجًا مساعدًا إضافيًا صغيرًا (انظر هنا)
🎥 دروس الفيديو
عروض مميزة:
دروس Realistic Model (عالية الجودة):
- مزامنة شفاه عالية الجودة مع تحكم بالمزاج وتحويل نص إلى كلام محلي
- مزامنة شفاه عالية الجودة مع ElevenLabs و OpenAI TTS
- مزامنة شفاه مباشرة عالية الجودة باستخدام الميكروفون
دروس Standard Model:
- مزامنة شفاه مباشرة قياسية باستخدام الميكروفون
- مزامنة شفاه قياسية مع تحويل نص إلى كلام محلي
- مزامنة شفاه قياسية مع ElevenLabs و OpenAI TTS
الإعداد العام:
- إضافة شخصية MetaHuman مخصصة إلى مشروع التجربة ⭐ جديد
- فيديو تعليمي للإعداد
- جولة في مشروع التجربة (أقدم)
💬 الدعم
- التطوير المخصص: [email protected] (حلول مخصصة للفرق والمنظمات)