نظرة عامة
Runtime MetaHuman Lip Sync هو مكوّن إضافي يمكّن مزامنة الشفاه في الوقت الفعلي دون اتصال وعبر المنصات لكل من شخصيات MetaHuman والشخصيات المخصصة. يسمح لك بتحريك شفاه الشخصية استجابةً لمدخلات صوتية من مصادر مختلفة، بما في ذلك:
- مدخلات الميكروفون عبر موجة صوت قابلة للالتقاط من Runtime Audio Importer
- كلام مُصنّع من Runtime Text To Speech أو Runtime AI Chatbot Integrator
- أي بيانات صوتية بتنسيق float PCM (مصفوفة من العينات ذات النقاط العائمة)
يولد المكوّن داخليًا visemes (تمثيلات بصرية للفونيمات) بناءً على المدخلات الصوتية. نظرًا لأنه يعمل مباشرة مع بيانات الصوت بدلاً من النص، يدعم المكوّن مدخلات متعددة اللغات بما في ذلك على سبيل المثال لا الحصر الإنجليزية، الإسبانية، الفرنسية، الألمانية، اليابانية، الصينية، الكورية، الروسية، الإيطالية، البرتغالية، العربية، والهندية. أي لغة مدعومة حرفيًا حيث يتم إنشاء مزامنة الشفاه من فونيمات الصوت بدلاً من معالجة النص الخاصة بلغة معينة.
يُنتج النموذج القياسي 14 viseme ويقوم بتحريك مزامنة الشفاه باستخدام أصل وضع مسبق التعريف. في المقابل، يُنتج النموذج الواقعي (حصري لشخصيات MetaHuman) 250 تغييرًا في morph target دون الاعتماد على أصل وضع مسبق التعريف، مما يؤدي إلى حركات وجهية أكثر واقعية بشكل ملحوظ.
توافق الشخصيات
على الرغم من اسمه، يعمل Runtime MetaHuman Lip Sync مع مجموعة واسعة من الشخصيات إلى جانب MetaHumans:
أنظمة الشخصيات التجارية الشهيرة
- شخصيات Daz Genesis 8/9
- شخصيات Reallusion Character Creator 3/4 (CC3/CC4)
- شخصيات Mixamo
- أفاتار ReadyPlayerMe
دعم معايير التحريك
- أنظمة blendshape القائمة على FACS
- معيار Apple ARKit blendshape
- مجموعات فونيم Preston Blair
- أنظمة فونيم 3ds Max
- أي شخصية بها morph targets مخصصة لتعبيرات الوجه
للحصول على تعليمات مفصلة حول استخدام المكوّن مع شخصيات غير MetaHuman، راجع دليل إعداد الشخصيات المخصصة.
معاينة التحريك
تحقق من هذه التحريكات القصيرة لرؤية جودة تحريك مزامنة الشفاه التي ينتجها المكوّن عبر أنواع الشخصيات والنماذج المختلفة:




الميزات الرئيسية
- مزامنة الشفاه في الوقت الحقيقي من مدخل الميكروفون
- دعم معالجة الصوت دون اتصال بالإنترنت
- التوافق عبر المنصات: Windows، Android، Meta Quest
- دعم لأنظمة الشخصيات المتعددة ومعايير التحريك
- تعيين مرن لحركات الفم (visemes) للشخصيات المخصصة
- دعم عالمي للغات - يعمل مع أي لغة منطوقة من خلال تحليل الصوت
نماذج مزامنة الشفاه
يقدم الملحق نموذجين لمزامنة الشفاه ليناسبا احتياجات المشاريع المختلفة:
- النموذج القياسي
- النموذج الواقعي
يوفر النموذج القياسي لمزامنة الشفاه أداءً فعالاً عبر المنصات مع توافق واسع مع أنواع الشخصيات:
- يعمل مع MetaHumans وجميع أنواع الشخصيات المخصصة
- مُحسّن لأداء الوقت الحقيقي على جميع المنصات
- متطلبات موارد أقل
- توافق كامل مع TTS المحلي (ملحق Runtime Text To Speech)
- مناسب لتطبيقات الهواتف المحمولة والواقع الافتراضي/المعزز
يقدم النموذج الواقعي لمزامنة الشفاه دقة بصرية محسنة مخصصة لشخصيات MetaHuman:
- حصري لـ MetaHuman مع تحريك وجهي متقدم
- جودة بصرية أعلى مع حركات فم أكثر طبيعية
- متطلبات أداء أعلى قليلاً
- دعم محدود لـ TTS المحلي (يُوصى بخدمات TTS الخارجية)
- مثالي للتجارب السينمائية وتفاعلات الشخصيات القريبة
يمكنك اختيار النموذج المناسب بناءً على متطلبات مشروعك للأداء وتوافق الشخصيات والجودة البصرية.
:::ملاحظة حول توافق TTS بينما يدعم كلا النموذجين طرق إدخال صوتية متنوعة، فإن النموذج الواقعي له توافق محدود مع TTS المحلي بسبب تعارضات وقت تشغيل ONNX. لوظيفة تحويل النص إلى كلام مع النموذج الواقعي، يُوصى بخدمات TTS الخارجية (OpenAI، ElevenLabs). :::
كيفية العمل
يعالج الملحق مدخلات الصوت بالطريقة التالية:
- يتم استقبال بيانات الصوت بتنسيق PCM كقيم عشرية مع تحديد القنوات ومعدل العينة
- يعالج الملحق الصوت لتوليد حركات الفم (visemes) (أصوات الكلام)
- تقود هذه الحركات تحريك مزامنة الشفاه باستخدام أصول وضعية الشخصية
- يتم تطبيق التحريك على الشخصية في الوقت الحقيقي
البدء السريع
إليك الإعداد الأساسي لتمكين مزامنة الشفاه على شخصيتك:
- لشخصيات MetaHuman، اتبع دليل إعداد MetaHuman
- للشخصيات المخصصة، اتبع دليل إعداد الشخصيات المخصصة
- قم بإعداد معالجة مدخلات الصوت (مثل في Event Graph)
- وصّل عقدة Blend Runtime MetaHuman Lip Sync في Anim Graph
- شغّل الصوت وشاهد شخصيتك تتحدث!
موارد إضافية
📦 التحميلات والروابط
- احصل عليه على Fab
- موقع المنتج
- تحميل النسخة التجريبية (Windows)
- تحميل ملفات مصدر النسخة التجريبية (UE 5.6)
🎥 فيديوهات تعليمية
عرض تجريبي مميز:
دروس النموذج الواقعي (عالي الجودة):
- مزامنة شفاه عالية الجودة مع ElevenLabs و OpenAI TTS ⭐ جديد
- مزامنة شفاه مباشرة عالية الجودة بالميكروفون ⭐ جديد
دروس النموذج القياسي:
- مزامنة شفاه قياسية مباشرة بالميكروفون
- مزامنة شفاه قياسية مع تحويل النص إلى كلام محلي
- مزامنة شفاه قياسية م ع ElevenLabs و OpenAI TTS
إعداد عام:
💬 الدعم
- سيرفر دعم Discord
- تطوير مخصص: [email protected] (حلول مخصصة للفرق والمنظمات)