تكوين الإضافة
تكوين النموذج
التكوين القياسي للنموذج
تستخدم عقدة Create Runtime Viseme Generator الإعدادات الافتراضية التي تعمل بشكل جيد في معظم السيناريوهات. يتم التعامل مع التكوين من خلال خصائص عقدة المزج في مخطط الحركة.
للاطلاع على خيارات تكوين مخطط الحركة، راجع قسم تكوين مزامنة الشفاه أدناه.
تكوين النموذج الواقعي
تقبل عقدة Create Realistic MetaHuman Lip Sync Generator معامل Configuration اختياريًا يسمح لك بتخصيص سلوك المولد:
نوع النموذج
يحدد إعداد Model Type أي إصدار من النموذج الواقعي سيتم استخدامه:
| نوع النموذج | الأداء | الجودة البصرية | التعامل مع الضوضاء | حالات الاستخدام الموصى بها |
|---|---|---|---|---|
| مُحسَّن للغاية (افتراضي) | أعلى أداء، أقل استخدام لوحدة المعالجة المركزية | جودة جيدة | قد يُظهر حركات فم ملحوظة مع ضوضاء الخلفية أو الأصوات غير الصوتية | بيئات صوتية نظيفة، سيناريوهات حساسة للأداء |
| شبه مُحسَّن | أداء جيد، استخدام معتدل لوحدة المعالجة المركزية | جودة عالية | استقرار أفضل مع الصوت المشوش | توازن بين الأداء والجودة، ظروف صوتية مختلطة |
| الأصلي | مناسب للاستخدام في الوقت الفعلي على وحدات المعالجة المركزية الحديثة | أعلى جودة | الأكثر استقرارًا مع ضوضاء الخلفية والأصوات غير الصوتية | الإنتاجات عالية الجودة، بيئات صوتية صاخبة، عندما تكون الدقة القصوى مطلوبة |
إعدادات الأداء
Intra Op Threads: يتحكم في عدد الخيوط المستخدمة لعمليات معالجة النموذج الداخلية.
- 0 (افتراضي/تلقائي): يستخدم الكشف التلقائي (عادةً 1/4 من نوى وحدة المعالجة المركزية المتاحة، بحد أقصى 4)
- 1-16: حدد عدد الخيوط يدويًا. قد تحسن القيم الأعلى الأداء على الأنظمة متعددة النواة ولكنها تستخدم وحدة معالجة مركزية أكثر
Inter Op Threads: يتحكم في عدد الخيوط المستخدمة للتنفيذ المتوازي لعمليات النموذج المختلفة.
- 0 (افتراضي/تلقائي): يستخدم الكشف التلقائي (عادةً 1/8 من نوى وحدة المعالجة المركزية المتاحة، بحد أقصى 2)
- 1-8: حدد عدد الخيوط يدويًا. عادةً ما يُحتفظ به منخفضًا للمعالجة في الوقت الفعلي
حجم قطعة المعالجة
يحدد Processing Chunk Size عدد العينات التي تتم معالجتها في كل خطوة استدلال. القيمة الافتراضية هي 160 عينة (10 مللي ثانية من الصوت بتردد 16 كيلو هرتز):
- توفر القيم الأصغر تحديثات أكثر تكرارًا ولكنها تزيد من استخدام وحدة المعالجة المركزية
- تقلل القيم الأكبر من حمل وحدة المعالجة المركزية ولكنها قد تقلل من استجابة مزامنة الشفاه
- يُوصى باستخدام مضاعفات العدد 160 للحصول على محاذاة مثالية

تكوين النموذج المدعوم بالمزاج
توفر عقدة Create Realistic MetaHuman Lip Sync With Mood Generator خيارات تكوين إضافية تتجاوز النموذج الواقعي الأساسي:
التكوين الأساسي
Lookahead Ms: توقيت التطلع المسبق بالمللي ثانية لتحسين دقة مزامنة الشفاه.
- الافتراضي: 80 مللي ثانية
- النطاق: 20 مللي ثانية إلى 200 مللي ثانية (يجب أن يكون قابلاً للقسمة على 20)
- توفر القيم الأعلى تزامنًا أفضل ولكنها تزيد من زمن الوصول
Output Type: يتحكم في عناصر التحكم في الوجه التي يتم إنشاؤها.
- Full Face: جميع عناصر التحكم الـ 81 في الوجه (الحواجب، العيون، الأنف، الفم، الفك، اللسان)
- Mouth Only: فقط عناصر التحكم المتعلقة بالفم والفك واللسان
Performance Settings: يستخدم نفس إعدادات Intra Op Threads و Inter Op Threads الخاصة بالنموذج الواقعي العادي.
إعدادات المزاج
الأمزجة المتاحة:
- محايد، سعيد، حزين، اشمئزاز، غضب، مفاجأة، خوف
- واثق، متحمس، ملل، مرح، مرتبك
شدة المزاج: يتحكم في مدى قوة تأثير المزاج على الرسوم المتحركة (من 0.0 إلى 1.0)
التحكم في المزاج أثناء التشغيل
يمكنك ضبط إعدادات المزاج أثناء التشغيل باستخدام الوظائف التالية:
- Set Mood: تغيير نوع المزاج الحالي
- Set Mood Intensity: ضبط مدى قوة تأثير المزاج على الرسوم المتحركة (من 0.0 إلى 1.0)
- Set Lookahead Ms: تعديل توقيت التطلع المسبق للتزامن
- Set Output Type: التبديل بين عناصر التحكم Full Face و Mouth Only

دليل اختيار المزاج
اختر الأمزجة المناسبة بناءً على محتواك:
| المزاج | الأفضل لـ | نطاق الشدة النموذجي |
|---|---|---|
| محايد | المحادثة العامة، السرد، الحالة الافتراضية | 0.5 - 1.0 |
| سعيد | المحتوى الإيجابي، الحوار المرح، الاحتفالات | 0.6 - 1.0 |
| حزين | المحتوى الكئيب، المشاهد العاطفية، اللحظات الكئيبة | 0.5 - 0.9 |
| اشمئزاز | ردود الفعل السلبية، المحتوى المقزز، الرفض | 0.4 - 0.8 |
| غضب | الحوار العدواني، المشاهد المواجهة، الإحباط | 0.6 - 1.0 |
| مفاجأة | الأحداث غير المتوقعة، الكشف، ردود الفعل الصادمة | 0.7 - 1.0 |
| خوف | المواقف المهددة، القلق، الحوار العصبي | 0.5 - 0.9 |
| واثق | العروض التقديمية المهنية، حوار القيادة، الكلام الحازم | 0.7 - 1.0 |
| متحمس | المحتوى النشط، الإعلانات، الحوار المتحمس | 0.8 - 1.0 |
| ملل | المحتوى الرتيب، الحوار غير المهتم، الكلام المتعب | 0.3 - 0.7 |
| مرح | المحادثة العادية، الفكاهة، التفاعلات الخفيفة | 0.6 - 0.9 |
| مرتبك | الحوار الغني بالأسئلة، عدم اليقين، الحيرة | 0.4 - 0.8 |
تكوين مخطط الحركة
تكوين مزامنة الشفاه
- Standard Model
- Realistic Models
تحتوي عقدة Blend Runtime MetaHuman Lip Sync على خيارات تكوين في لوحة الخصائص الخاصة بها:
| الخاصية | الافتراضي | الوصف |
|---|---|---|
| Interpolation Speed | 25 | يتحكم في سرعة انتقال حركات الشفاه بين الفيزيمات. تؤدي القيم الأعلى إلى انتقالات أسرع وأكثر فجائية. |
| Reset Time | 0.2 | المدة بالثواني التي بعدها يتم إعادة تعيين مزامنة الشفاه. هذا مفيد لمنع استمرار مزامنة الشفاه بعد توقف الصوت. |
رسوم متحركة للضحك
يمكنك أيضًا إضافة رسوم متحركة للضحك ستستجيب ديناميكيًا للضحك المكتشف في الصوت:
- أضف عقدة
Blend Runtime MetaHuman Laughter - قم بتوصيل متغير
RuntimeVisemeGeneratorالخاص بك بدبوسViseme Generator - إذا كنت تستخدم بالفعل مزامنة الشفاه:
- قم بتوصيل المخرج من عقدة
Blend Runtime MetaHuman Lip SyncبـSource PoseلعقدةBlend Runtime MetaHuman Laughter - قم بتوصيل مخرج عقدة
Blend Runtime MetaHuman LaughterبدبوسResultالخاص بـOutput Pose
- قم بتوصيل المخرج من عقدة
- إذا كنت تستخدم الضحك فقط بدون مزامنة الشفاه:
- قم بتوصيل وضعيتك المصدر مباشرة بـ
Source PoseلعقدةBlend Runtime MetaHuman Laughter - قم بتوصيل المخرج بدبوس
Result
- قم بتوصيل وضعيتك المصدر مباشرة بـ

عند اكتشاف ضحك في الصوت، سيتحرك شخصيتك ديناميكيًا وفقًا لذلك:

تكوين الضحك
تحتوي عقدة Blend Runtime MetaHuman Laughter على خيارات التكوين الخاصة بها:
| الخاصية | الافتراضي | الوصف |
|---|---|---|
| Interpolation Speed | 25 | يتحكم في سرعة انتقال حركات الشفاه بين الرسوم المتحركة للضحك. تؤدي القيم الأعلى إلى انتقالات أسرع وأكثر فجائية. |
| Reset Time | 0.2 | المدة بالثواني التي بعدها يتم إعادة تعيين الضحك. هذا مفيد لمنع استمرار الضحك بعد توقف الصوت. |
| Max Laughter Weight | 0.7 | يقيس أقصى شدة للرسوم المتحركة للضحك (0.0 - 1.0). |
ملاحظة: اكتشاف الضحك متاح حاليًا فقط مع النموذج القياسي.
تحتوي عقدة Blend Realistic MetaHuman Lip Sync على خيارات تكوين في لوحة الخصائص الخاصة بها:
| الخاصية | الافتراضي | الوصف |
|---|---|---|
| Interpolation Speed | 30 | يتحكم في سرعة انتقال تعابير الوجه أثناء الكلام النشط. تؤدي القيم الأعلى إلى انتقالات أسرع وأكثر فجائية. |
| Idle Interpolation Speed | 15 | يتحكم في سرعة انتقال تعابير الوجه إلى حالة الخمول/المحايدة. تؤدي القيم الأقل إلى عودة أكثر سلاسة وتدريجية إلى وضعية الراحة. |
| Reset Time | 0.2 | المدة بالثواني التي بعدها يتم إعادة تعيين مزامنة الشفاه إلى حالة الخمول. مفيد لمنع استمرار التعابير بعد توقف الصوت. |
| Preserve Idle State | false | عند التمكين، يحفظ الحالة العاطفية الأخيرة خلال فترات الخمول بدلاً من إعادة التعيين إلى المحايد. |
| Preserve Eye Expressions | true | يتحكم فيما إذا كان سيتم الحفاظ على عناصر التحكم في الوجه المتعلقة بالعين أثناء حالة الخمول. فعال فقط عند تمكين Preserve Idle State. |
| Preserve Brow Expressions | true | يتحكم فيما إذا كان سيتم الحفاظ على عناصر التحكم في الوجه المتعلقة بالحاجب أثناء حالة الخمول. فعال فقط عند تمكين Preserve Idle State. |
| Preserve Mouth Shape | false | يتحكم فيما إذا كان سيتم الحفاظ على عناصر التحكم في شكل الفم (باستثناء الحركات الخاصة بالكلام مثل اللسان والفك) أثناء حالة الخمول. فعال فقط عند تمكين Preserve Idle State. |
الحفاظ على حالة الخمول
تتعامل ميزة Preserve Idle State مع كيفية تعامل النموذج الواقعي مع فترات الصمت. على عكس النموذج القياسي الذي يستخدم فيزيمات منفصلة ويعود باستمرار إلى قيم صفرية أثناء الصمت، قد يحتفظ الشبكة العصبية للنموذج الواقعي بوضعية وجه دقيقة تختلف عن وضعية الراحة الافتراضية لـ MetaHuman.
متى يتم التمكين:
- الحفاظ على التعابير العاطفية بين مقاطع الكلام
- الحفاظ على سمات شخصية الشخصية
- ضمان الاستمرارية البصرية في التسلسلات السينمائية
خيارات التحكم الإقليمية:
- Eye Expressions: يحافظ على تضييق العين، اتساعها، ووضعية الجفن
- Brow Expressions: يحافظ على وضعية الحاجب والجبهة
- Mouth Shape: يحافظ على انحناء الفم العام مع السماح لحركات الكلام (اللسان، الفك) بإعادة التعيين
الجمع مع الرسوم المتحركة الحالية
لتطبيق مزامنة الشفاه والضحك جنبًا إلى جنب مع الرسوم المتحركة للجسم الحالية والرسوم المتحركة للوجه المخصصة دون تجاوزها:
- أضف عقدة
Layered blend per boneبين رسومك المتحركة للجسم والمخرج النهائي. تأكد من أنUse Attached Parentصحيح. - قم بتكوين إعداد الطبقة:
- أضف 1 عنصر إلى مصفوفة
Layer Setup - أضف 3 عناصر إلى
Branch Filtersللطبقة، معBone Nameالتالية:FACIAL_C_FacialRootFACIAL_C_Neck2RootFACIAL_C_Neck1Root
- أضف 1 عنصر إلى مصفوفة
- مهم للرسوم المتحركة للوجه المخصصة: في
Curve Blend Option، اختر "Use Max Value". هذا يسمح للرسوم المتحركة للوجه المخصصة (التعابير، المشاعر، إلخ) بأن تكون مركبة بشكل صحيح فوق مزامنة الشفاه. - قم بعمل الاتصالات:
- الرسوم المتحركة الحالية (مثل
BodyPose) → إدخالBase Pose - مخرج الرسوم المتحركة للوجه (من عقد مزامنة الشفاه و/أو الضحك) → إدخال
Blend Poses 0 - عقدة المزج الطبقي → الوضعية النهائية
Result
- الرسوم المتحركة الحالية (مثل

اختيار مجموعة Morph Target
- Standard Model
- Realistic Models
يستخدم النموذج القياسي أصول وضعية تدعم بشكل أساسي أي اصطلاح تسمية لـ morph target من خلال إعداد أصول الوضعية المخصصة. لا حاجة لتكوين إضافي.
تتضمن عقدة Blend Realistic MetaHuman Lip Sync خاصية Morph Target Set التي تحدد اصطلاح تسمية morph target الذي سيتم استخدامه للرسوم المتحركة للوجه:
| مجموعة Morph Target | الوصف | حالات الاستخدام |
|---|---|---|
| MetaHuman (افتراضي) | أسماء morph target القياسية لـ MetaHuman (مثل CTRL_expressions_jawOpen) | شخصيات MetaHuman |
| ARKit | أسماء متوافقة مع Apple ARKit (مثل JawOpen, MouthSmileLeft) | الشخصيات القائمة على ARKit |
ضبط دقيق لسلوك مزامنة الشفاه
التحكم في بروز اللسان
في نموذج مزامنة الشفاه القياسي، قد تلاحظ حركة لسان مفرطة للأمام أثناء بعض الفونيمات. للتحكم في بروز اللسان:
- بعد عقدة مزج مزامنة الشفاه الخاصة بك، أضف عقدة
Modify Curve - انقر بزر الماوس الأيمن على عقدة
Modify Curveواختر Add Curve Pin - أضف دبوس منحنى بالاسم
CTRL_expressions_tongueOut - عيّن خاصية Apply Mode للعقدة إلى Scale
- اضبط معامل Value للتحكم في امتداد اللسان (مثل 0.8 لتقليل البروز بنسبة 20%)
التحكم في فتح الفك
قد تنتج مزامنة الشفاه الواقعية حركات فك شديدة الاستجابة اعتمادًا على محتوى الصوت ومتطلباتك البصرية. لضبط شدة فتح الفك:
- بعد عقدة مزج مزامنة الشفاه الخاصة بك، أضف عقدة
Modify Curve - انقر بزر الماوس الأيمن على عقدة
Modify Curveواختر Add Curve Pin - أضف دبوس منحنى بالاسم
CTRL_expressions_jawOpen - عيّن خاصية Apply Mode للعقدة إلى Scale
- اضبط معامل Value للتحكم في نطاق فتح الفك (مثل 0.9 لتقليل حركة الفك بنسبة 10%)
الضبط الدقيق الخاص بالمزاج
للنماذج المدعومة بالمزاج، يمكنك ضبط تعابير عاطفية محددة بدقة:
التحكم في الحاجب:
CTRL_expressions_browRaiseInL/CTRL_expressions_browRaiseInR- رفع الحاجب الداخليCTRL_expressions_browRaiseOuterL/CTRL_expressions_browRaiseOuterR- رفع الحاجب الخارجيCTRL_expressions_browDownL/CTRL_expressions_browDownR- خفض الحاجب
التحكم في تعبير العين:
CTRL_expressions_eyeSquintInnerL/CTRL_expressions_eyeSquintInnerR- تضييق العينCTRL_expressions_eyeCheekRaiseL/CTRL_expressions_eyeCheekRaiseR- رفع الخد
مقارنة النماذج واختيارها
الاختيار بين النماذج
عند اتخاذ قرار بشأن نموذج مزامنة الشفاه الذي ستستخدمه في مشروعك، ضع في اعتبارك هذه العوامل:
| الاعتبار | النموذج القياسي | النموذج الواقعي | النموذج الواقعي المدعوم بالمزاج |
|---|---|---|---|
| توافق الشخصية | MetaHumans وجميع أنواع الشخصيات المخصصة | شخصيات MetaHumans (و ARKit) | شخصيات MetaHumans (و ARKit) |
| الجودة البصرية | مزامنة شفاه جيدة بأداء فعال | واقعية محسنة مع حركات فم أكثر طبيعية | واقعية محسنة مع تعابير عاطفية |
| الأداء | مُحسَّن لجميع المنصات بما في ذلك الهاتف المحمول/VR | متطلبات موارد أعلى | متطلبات موارد أعلى |
| الميزات | 14 فيزيماً، اكتشاف ضحك | 81 عنصر تحكم في الوجه، 3 مستويات تحسين | 81 عنصر تحكم في الوجه، 12 مزاجًا، مخرج قابل للتكوين |
| دعم المنصة | Windows، Android، Quest | Windows، Mac، iOS، Linux، Android، Quest | Windows، Mac، iOS، Linux، Android، Quest |
| حالات الاستخدام | التطبيقات العامة، الألعاب، VR/AR، الهاتف المحمول | التجارب السينمائية، التفاعلات القريبة | سرد القصص العاطفي، تفاعل الشخصيات المتقدم |
توافق إصدار المحرك
إذا كنت تستخدم Unreal Engine 5.2، فقد لا تعمل النماذج الواقعية بشكل صحيح بسبب خطأ في مكتبة إعادة أخذ العينات في UE. لمستخدمي UE 5.2 الذين يحتاجون إلى وظيفة مزامنة شفاه موثوقة، يرجى استخدام النموذج القياسي بدلاً من ذلك.
هذه المشكلة خاصة بـ UE 5.2 ولا تؤثر على إصدارات المحرك الأخرى.
توصيات الأداء
- بالنسبة لمعظم المشاريع، يوفر النموذج القياسي توازنًا ممتازًا بين الجودة والأداء
- استخدم النموذج الواقعي عندما تحتاج إلى أعلى دقة بصرية لشخصيات MetaHuman
- استخدم النموذج الواقعي المدعوم بالمزاج عندما يكون التحكم في التعبير العاطفي مهمًا لتطبيقك
- ضع في اعتبارك قدرات أداء المنصة المستهدفة عند الاختيار بين النماذج
- اختبر مستويات التحسين المختلفة للعثور على أفضل توازن لحالة استخدامك المحددة
توافق TTS
| نوع النموذج | دعم TTS المحلي (عبر Runtime Text To Speech) | دعم TTS الخارجي | ملاحظات |
|---|---|---|---|
| النموذج القياسي | ✅ دعم كامل | ✅ دعم كامل | متوافق مع جميع خيارات TTS |
| النموذج الواقعي | ❌ دعم محدود | ✅ دعم كامل | تعارضات وقت تشغيل ONNX مع TTS المحلي |
| النموذج الواقعي المدعوم بالمزاج | ✅ دعم كامل | ✅ دعم كامل | متوافق مع جميع خيارات TTS |
استكشاف الأخطاء وإصلاحها
المشكلات الشائعة
إعادة إنشاء المولد للنماذج الواقعية: للتشغيل الموثوق والمتسق مع النماذج الواقعية، يُوصى بإعادة إنشاء المولد في كل مرة تريد فيها تغذية بيانات صوتية جديدة بعد فترة من الخمول. هذا بسبب سلوك وقت تشغيل ONNX الذي يمكن أن يتسبب في توقف مزامنة الشفاه عند إعادة استخدام المولدات بعد فترات من الصمت.
على سبيل المثال، يمكنك إعادة إنشاء مولد مزامنة الشفاه في كل بدء تشغيل، مثل كلما استدعيت Play Sound 2D أو استخدمت أي طريقة أخرى لبدء تشغيل موجة الصوت ومزامنة الشفاه:

توافق TTS المحلي: TTS المحلي المقدم بواسطة إضافة Runtime Text To Speech غير مدعوم حاليًا مع النموذج الواقعي العادي بسبب تعارضات وقت تشغيل ONNX. ومع ذلك، فهو متوافق تمامًا مع كل من النموذج القياسي والنموذج الواقعي المدعوم بالمزاج. استخدم خدمات TTS الخارجية إذا كنت تحتاج تحديدًا إلى النموذج الواقعي العادي مع وظيفة TTS.
تدهور استجابة مزامنة الشفاه: إذا واجهت أن مزامنة الشفاه تصبح أقل استجابة بمرور الوقت عند استخدام Streaming Sound Wave أو Capturable Sound Wave، فقد يكون هذا ناتجًا عن تراكم الذاكرة. افتراضيًا، يتم إعادة تخصيص الذاكرة في كل مرة يتم فيها إلحاق صوت جديد. لمنع هذه المشكلة، استدعِ وظيفة ReleaseMemory بشكل دوري لتحرير الذاكرة المتراكمة، مثل كل 30 ثانية تقريبًا.
تحسين الأداء:
- اضبط Processing Chunk Size للنماذج الواقعية بناءً على متطلبات أدائك
- استخدم أعداد الخيوط المناسبة لأجهزتك المستهدفة
- ضع في اعتبارك استخدام نوع المخرج Mouth Only للنماذج المدعومة بالمزاج عندما لا تكون الرسوم المتحركة الكاملة للوجه مطلوبة