نظرة عامة
Runtime MetaHuman Lip Sync هو إضافة تمكن مزامنة الشفاه في الوقت الفعلي، دون اتصال بالإنترنت وعبر المنصات لكل من شخصيات MetaHuman والشخصيات المخصصة. تتيح لك تحريك شفاه الشخصية استجابةً لإدخال صوتي من مصادر متنوعة، بما في ذلك:
- إدخال الميكروفون عبر موجة الصوت القابلة للتسجيل الخاصة بـ Runtime Audio Importer
- الكلام المُركّب من Runtime Text To Speech أو Runtime AI Chatbot Integrator
- أي بيانات صوتية بتنسيق PCM عائم (مصفوفة من العينات ذات النقطة العائمة)
تقوم الإضافة داخليًا بتوليد visemes (تمثيلات بصرية للفونيمات) بناءً على الإدخال الصوتي. نظرًا لأنها تعمل مباشرة مع البيانات الصوتية بدلاً من النص، تدعم الإضافة الإدخال متعدد اللغات بما في ذلك على سبيل المثال لا الحصر الإنجليزية، الإسبانية، الفرنسية، الألمانية، اليابانية، الصينية، الكورية، الروسية، الإيطالية، البرتغالية، العربية، والهندية. أي لغة مدعومة حرفيًا حيث يتم إنشاء مزامنة الشفاه من الفونيمات الصوتية بدلاً من معالجة نصية خاصة باللغة.
ينتج النموذج القياسي 14 viseme ويقوم بتحريك مزامنة الشفاه باستخدام أصل وضعية مسبق التعريف. في المقابل، يولد النموذج الواقعي (الحصري لشخصيات MetaHuman) 250 تغييرًا في morph target دون الاعتماد على أصل وضعية مسبق التعريف، مما يؤدي إلى رسوميات وجهية أكثر واقعية بشكل ملحوظ.
توافق الشخصيات
على الرغم من اسمها، يعمل Runtime MetaHuman Lip Sync مع مجموعة واسعة من الشخصيات تتجاوز MetaHumans فقط:
أنظمة الشخصيات التجارية الشهيرة
- شخصيات Daz Genesis 8/9
- شخصيات Reallusion Character Creator 3/4 (CC3/CC4)
- شخصيات Mixamo
- أفاتار ReadyPlayerMe
دعم معايير التحريك
- أنظمة blendshape القائمة على FACS
- معيار Apple ARKit blendshape
- مجموعات Preston Blair phoneme
- أنظمة phoneme الخاصة بـ 3ds Max
- أي شخصية تحتوي على morph targets مخصصة لتعبيرات الوجه
للحصول على تعليمات مفصلة حول استخدام الإضافة مع شخصيات غير MetaHuman، راجع دليل إعداد الشخصيات المخصصة.
معاينة التحريك
تحقق من مقاطع التحريك القصيرة هذه لترى جودة تحريك مزامنة الشفاه التي تنتجها الإضافة عبر أنواع الشخصيات والنماذج المختلفة:




الميزات الرئيسية
- مزامنة الشفاه في الوقت الفعلي من مدخل الميكروفون
- دعم معالجة الصوت دون اتصال بالإنترنت
- توافق عبر المنصات مع دعم منصة محدد للنموذج
- دعم أنظمة الشخصيات المتعددة ومعايير الرسوم المتحركة
- تعيين مرن للوحدات البصرية (visemes) للشخصيات المخصصة
- دعم عالمي للغات - يعمل مع أي لغة منطوقة من خلال تحليل الصوت
نماذج مزامنة الشفاه
يقدم الإضافة نموذجين لمزامنة الشفاه ليناسبا احتياجات المشروع المختلفة:
- النموذج القياسي
- النموذج الواقعي
يوفر نموذج مزامنة الشفاه القياسي أداءً فعالاً عبر المنصات مع توافق واسع للشخصيات:
- يعمل مع MetaHumans وجميع أنواع الشخصيات المخصصة
- مُحسّن لأداء الوقت الفعلي
- متطلبات موارد أقل
- توافق كامل مع TTS المحلي (إضافة Runtime Text To Speech)
- دعم المنصة: Windows, Android, المنصات القائمة على Android (بما في ذلك Meta Quest)
لاستخدام النموذج القياسي (الأسرع)، تحتاج إلى تثبيت إضافة تمديد إضافية. راجع قسم المتطلبات الأساسية لتعليمات التثبيت.
يقدم نموذج مزامنة الشفاه الواقعي دقة بصرية محسنة مخصصة لشخصيات MetaHuman:
- حصري لـ MetaHuman مع رسوم متحركة متقدمة للوجه
- جودة بصرية أعلى مع حركات فم أكثر طبيعية
- متطلبات أداء أعلى قليلاً
- دعم محدود لـ TTS المحلي (يُوصى بخدمات TTS خارجية)
- مثالي للتجارب السينمائية وتفاعلات الشخصية عن قرب
- دعم المنصة: Windows, Mac, iOS, Linux
النموذج الواقعي مضمن في الإضافة الرئيسية ولا يتطلب أي إضافات تمديد إضافية لاستخدامه.
يمكنك اختيار النموذج المناسب بناءً على متطلبات مشروعك للأداء، وتوافق الشخصية، والجودة البصرية، والمنصة المستهدفة.
بينما يدعم كلا النموذجين طرق إدخال صوتية متنوعة، فإن النموذج الواقعي لديه توافق محدود مع TTS المحلي بسبب تعارضات وقت تشغيل ONNX. لوظيفة تحويل النص إلى كلام مع النموذج الواقعي، يُوصى بخدمات TTS الخارجية (OpenAI, ElevenLabs).
آلية العمل
تعالج الإضافة مدخلات الصوت بالطريقة التالية:
- يتم استقبال بيانات الصوت كـ تنسيق PCM عائم مع قنوات و معدل عينة محدد
- تعالج الإضافة الصوت لتوليد وحدات بصرية (visemes) (phonemes)
- تقود هذه الوحدات البصرية رسوم مزامنة الشفاه المتحركة باستخدام أصل وضعية (pose) الشخصية
- يتم تطبيق الرسوم المتحركة على الشخصية في الوقت الفعلي
البدء السريع
إليك الإعداد الأساسي لتمكين مزامنة الشفاه على شخصيتك:
- بالنسبة لشخصيات MetaHuman، اتبع دليل إعداد MetaHuman
- بالنسبة للشخصيات المخصصة، اتبع دليل إعداد الشخصية المخصصة
- قم بإعداد معالجة إدخال الصوت (مثلًا في Event Graph)
- وصِّل عقدة Blend Runtime MetaHuman Lip Sync في Anim Graph
- شغِّل الصوت وشاهد شخصيتك تتحدث!
موارد إضافية
📦 التحميلات والروابط
- احصل عليه من Fab
- الموقع الإلكتروني للمنتج
- تحميل التجربة التوضيحية (Windows)
- تحميل ملفات مصدر التجربة التوضيحية (UE 5.6) – يتطلب هذا الملحق + Runtime Audio Importer، اختياري: Text To Speech / AI Chatbot. النموذج القياسي يتطلب ملحقًا إضافيًا صغيرًا (انظر هنا)
🎥 الدروس التعليمية المصورة
التجربة التوضيحية المميزة:
دروس النموذج الواقعي (عالي الجودة):
- مزامنة شفاه عالية الجودة مع ElevenLabs و OpenAI TTS ⭐ جديد
- مزامنة شفاه عالية الجودة مع الميكروفون المباشر ⭐ جديد
دروس النموذج القياسي:
- مزامنة شفاه قياسية مع الميكروفون المباشر
- مزامنة شفاه قياسية مع تحويل النص إلى كلام محلي
- مزامنة شفاه قياسية مع ElevenLabs و OpenAI TTS
الإعداد العام:
💬 الدعم
- خادم الدعم على Discord
- التطوير المخصص: [email protected] (حلول مخصصة للفرق والمؤسسات)