انتقل إلى المحتوى الرئيسي

تكوين الإضافة

تكوين النموذج

التكوين القياسي للنموذج

تستخدم عقدة Create Runtime Viseme Generator الإعدادات الافتراضية التي تعمل بشكل جيد في معظم السيناريوهات. يتم التعامل مع التكوين من خلال خصائص عقدة المزج في مخطط الحركة.

للاطلاع على خيارات تكوين مخطط الحركة، راجع قسم تكوين مزامنة الشفاه أدناه.

تكوين النموذج الواقعي

تقبل عقدة Create Realistic MetaHuman Lip Sync Generator معامل Configuration اختياريًا يسمح لك بتخصيص سلوك المولد:

نوع النموذج

يحدد إعداد Model Type أي إصدار من النموذج الواقعي سيتم استخدامه:

نوع النموذجالأداءالجودة البصريةالتعامل مع الضوضاءحالات الاستخدام الموصى بها
Highly Optimized (الافتراضي)أعلى أداء، أقل استخدام لوحدة المعالجة المركزيةجودة جيدةقد يُظهر حركات ملحوظة للفم مع ضوضاء الخلفية أو الأصوات غير الصوتيةبيئات صوتية نظيفة، سيناريوهات حساسة للأداء
Semi-Optimizedأداء جيد، استخدام معتدل لوحدة المعالجة المركزيةجودة عاليةاستقرار أفضل مع الصوت المشوشتوازن بين الأداء والجودة، ظروف صوتية مختلطة
Originalمناسب للاستخدام في الوقت الفعلي على وحدات المعالجة المركزية الحديثةأعلى جودةالأكثر استقرارًا مع ضوضاء الخلفية والأصوات غير الصوتيةالإنتاجات عالية الجودة، بيئات صوتية صاخبة، عندما تكون الدقة القصوى مطلوبة

إعدادات الأداء

Intra Op Threads: يتحكم في عدد الخيوط المستخدمة لعمليات معالجة النموذج الداخلية.

  • 0 (الافتراضي/تلقائي): يستخدم الكشف التلقائي (عادةً 1/4 من نوى وحدة المعالجة المركزية المتاحة، بحد أقصى 4)
  • 1-16: حدد عدد الخيوط يدويًا. قد تحسن القيم الأعلى الأداء على الأنظمة متعددة النواة ولكنها تستخدم وحدة معالجة مركزية أكثر

Inter Op Threads: يتحكم في عدد الخيوط المستخدمة للتنفيذ المتوازي لعمليات النموذج المختلفة.

  • 0 (الافتراضي/تلقائي): يستخدم الكشف التلقائي (عادةً 1/8 من نوى وحدة المعالجة المركزية المتاحة، بحد أقصى 2)
  • 1-8: حدد عدد الخيوط يدويًا. عادةً ما يُحتفظ به منخفضًا للمعالجة في الوقت الفعلي

حجم قطعة المعالجة

يحدد Processing Chunk Size عدد العينات التي تتم معالجتها في كل خطوة استدلال. القيمة الافتراضية هي 160 عينة (10 مللي ثانية من الصوت بتردد 16 كيلو هرتز):

  • توفر القيم الأصغر تحديثات أكثر تكرارًا ولكنها تزيد من استخدام وحدة المعالجة المركزية
  • تقلل القيم الأكبر من حمل وحدة المعالجة المركزية ولكنها قد تقلل من استجابة مزامنة الشفاه
  • يُوصى باستخدام مضاعفات 160 للحصول على محاذاة مثالية

إعداد حجم قطعة المعالجة

تكوين النموذج المدعوم بالمزاج

توفر عقدة Create Realistic MetaHuman Lip Sync With Mood Generator خيارات تكوين إضافية تتجاوز النموذج الواقعي الأساسي:

التكوين الأساسي

Lookahead Ms: توقيت التطلع للأمام بالمللي ثانية لتحسين دقة مزامنة الشفاه.

  • الافتراضي: 80 مللي ثانية
  • النطاق: من 20 مللي ثانية إلى 200 مللي ثانية (يجب أن يكون قابلاً للقسمة على 20)
  • توفر القيم الأعلى تزامنًا أفضل ولكنها تزيد من زمن الانتقال

Output Type: يتحكم في عناصر التحكم في الوجه التي يتم إنشاؤها.

  • Full Face: جميع عناصر التحكم الـ 81 في الوجه (الحواجب، العيون، الأنف، الفم، الفك، اللسان)
  • Mouth Only: فقط عناصر التحكم المتعلقة بالفم والفك واللسان

Performance Settings: يستخدم نفس إعدادات Intra Op Threads و Inter Op Threads الخاصة بالنموذج الواقعي العادي.

إعدادات المزاج

الأمزجة المتاحة:

  • محايد، سعيد، حزين، اشمئزاز، غضب، مفاجأة، خوف
  • واثق، متحمس، ملل، مرح، مرتبك

شدة المزاج: تتحكم في مدى قوة تأثير المزاج على الرسوم المتحركة (من 0.0 إلى 1.0)

التحكم في المزاج أثناء التشغيل

يمكنك ضبط إعدادات المزاج أثناء التشغيل باستخدام الوظائف التالية:

  • Set Mood: تغيير نوع المزاج الحالي
  • Set Mood Intensity: ضبط مدى قوة تأثير المزاج على الرسوم المتحركة (من 0.0 إلى 1.0)
  • Set Lookahead Ms: تعديل توقيت التطلع للأمام للتزامن
  • Set Output Type: التبديل بين عناصر التحكم Full Face و Mouth Only

تكوين المزاج

دليل اختيار المزاج

اختر الأمزجة المناسبة بناءً على محتواك:

المزاجالأفضل لـنطاق الشدة النموذجي
محايدالمحادثة العامة، السرد، الحالة الافتراضية0.5 - 1.0
سعيدالمحتوى الإيجابي، الحوار المرح، الاحتفالات0.6 - 1.0
حزينالمحتوى الكئيب، المشاهد العاطفية، اللحظات الكئيبة0.5 - 0.9
اشمئزازردود الفعل السلبية، المحتوى البغيض، الرفض0.4 - 0.8
غضبالحوار العدواني، المشاهد المواجهة، الإحباط0.6 - 1.0
مفاجأةالأحداث غير المتوقعة، الكشف عن الحقائق، ردود الفعل الصادمة0.7 - 1.0
خوفالمواقف المهددة، القلق، الحوار العصبي0.5 - 0.9
واثقالعروض التقديمية المهنية، حوار القيادة، الكلام الحازم0.7 - 1.0
متحمسالمحتوى النشط، الإعلانات، الحوار المتحمس0.8 - 1.0
مللالمحتوى الرتيب، الحوار غير المهتم، الكلام المتعب0.3 - 0.7
مرحالمحادثة العادية، الفكاهة، التفاعلات الخفيفة0.6 - 0.9
مرتبكالحوار الغني بالأسئلة، عدم اليقين، الحيرة0.4 - 0.8

تكوين مخطط الحركة

تكوين مزامنة الشفاه

تحتوي عقدة Blend Runtime MetaHuman Lip Sync على خيارات تكوين في لوحة الخصائص الخاصة بها:

الخاصيةالافتراضيالوصف
Interpolation Speed25يتحكم في سرعة انتقال حركات الشفاه بين الفونيمات المرئية. تؤدي القيم الأعلى إلى انتقالات أسرع وأكثر حدة.
Reset Time0.2المدة بالثواني التي يتم بعدها إعادة تعيين مزامنة الشفاه. يكون هذا مفيدًا لمنع استمرار مزامنة الشفاه بعد توقف الصوت.

رسوم متحركة للضحك

يمكنك أيضًا إضافة رسوم متحركة للضحك ستستجيب ديناميكيًا للضحك المكتشف في الصوت:

  1. أضف عقدة Blend Runtime MetaHuman Laughter
  2. قم بتوصيل متغير RuntimeVisemeGenerator الخاص بك بدبوس Viseme Generator
  3. إذا كنت تستخدم بالفعل مزامنة الشفاه:
    • قم بتوصيل المخرج من عقدة Blend Runtime MetaHuman Lip Sync إلى Source Pose لعقدة Blend Runtime MetaHuman Laughter
    • قم بتوصيل مخرج عقدة Blend Runtime MetaHuman Laughter إلى دبوس Result الخاص بـ Output Pose
  4. إذا كنت تستخدم الضحك فقط بدون مزامنة الشفاه:
    • قم بتوصيل وضعية المصدر الخاصة بك مباشرةً بـ Source Pose لعقدة Blend Runtime MetaHuman Laughter
    • قم بتوصيل المخرج بدبوس Result

Blend Runtime MetaHuman Laughter

عند اكتشاف ضحك في الصوت، سيتحرك شخصيتك ديناميكيًا وفقًا لذلك:

تكوين الضحك

عقدة Blend Runtime MetaHuman Laughter لها خيارات التكوين الخاصة بها:

الخاصيةالافتراضيالوصف
سرعة الاستيفاء25تتحكم في سرعة انتقال حركات الشفاه بين رسوميات الضحك. القيم الأعلى تؤدي إلى انتقالات أسرع وأكثر فجائية.
وقت إعادة التعيين0.2المدة بالثواني التي بعدها يتم إعادة تعيين الضحك. هذا مفيد لمنع استمرار الضحك بعد توقف الصوت.
أقصى وزن للضحك0.7يتحكم في أقصى شدة لرسوميات الضحك (0.0 - 1.0).

ملاحظة: كشف الضحك متاح حاليًا فقط مع النموذج القياسي.

الجمع مع الرسوميات الحالية

لتطبيق مزامنة الشفاه والضحك إلى جانب رسوميات الجسم الحالية ورسوميات الوجه المخصصة دون تجاوزها:

  1. أضف عقدة Layered blend per bone بين رسوميات الجسم والإخراج النهائي. تأكد من أن Use Attached Parent مضبوط على true.
  2. قم بتكوين إعداد الطبقة:
    • أضف عنصرًا واحدًا إلى مصفوفة Layer Setup
    • أضف 3 عناصر إلى Branch Filters للطبقة، بأسماء العظام التالية Bone Names:
      • FACIAL_C_FacialRoot
      • FACIAL_C_Neck2Root
      • FACIAL_C_Neck1Root
  3. هام لرسوميات الوجه المخصصة: في Curve Blend Option، اختر "Use Max Value". هذا يسمح لرسوميات الوجه المخصصة (التعابير، المشاعر، إلخ) بأن تكون مركبة بشكل صحيح فوق مزامنة الشفاه.
  4. قم بعمل الاتصالات:
    • الرسوميات الحالية (مثل BodyPose) → إدخال Base Pose
    • إخراج رسوميات الوجه (من عقد مزامنة الشفاه و/أو الضحك) → إدخال Blend Poses 0
    • عقدة الدمج الطبقي → وضع Result النهائي

Layered Blend Per Bone

اختيار مجموعة Morph Target

يستخدم النموذج القياسي أصول الوضع التي تدعم بشكل أساسي أي اصطلاح تسمية لـ morph target من خلال إعداد أصول الوضع المخصصة. لا حاجة لتكوين إضافي.

ضبط سلوك مزامنة الشفاه بدقة

التحكم في بروز اللسان

في نموذج مزامنة الشفاه القياسي، قد تلاحظ حركة لسان مفرطة للأمام أثناء بعض الفونيمات. للتحكم في بروز اللسان:

  1. بعد عقدة الدمج الخاصة بمزامنة الشفاه، أضف عقدة Modify Curve
  2. انقر بزر الماوس الأيمن على عقدة Modify Curve واختر Add Curve Pin
  3. أضف دبوس منحنى بالاسم CTRL_expressions_tongueOut
  4. اضبط خاصية Apply Mode للعقدة على Scale
  5. اضبط معامل Value للتحكم في امتداد اللسان (مثل 0.8 لتقليل البروز بنسبة 20%)

التحكم في فتح الفك

قد تنتج مزامنة الشفاه الواقعية حركات فك مفرطة الاستجابة اعتمادًا على محتوى الصوت ومتطلباتك البصرية. لضبط شدة فتح الفك:

  1. بعد عقدة الدمج الخاصة بمزامنة الشفاه، أضف عقدة Modify Curve
  2. انقر بزر الماوس الأيمن على عقدة Modify Curve واختر Add Curve Pin
  3. أضف دبوس منحنى بالاسم CTRL_expressions_jawOpen
  4. اضبط خاصية Apply Mode للعقدة على Scale
  5. اضبط معامل Value للتحكم في مدى فتح الفك (مثل 0.9 لتقليل حركة الفك بنسبة 10%)

الضبط الدقيق الخاص بالمزاج

للنماذج المدعومة بالمزاج، يمكنك ضبط تعابير عاطفية محددة بدقة:

التحكم في الحاجب:

  • CTRL_expressions_browRaiseInL / CTRL_expressions_browRaiseInR - رفع الحاجب الداخلي
  • CTRL_expressions_browRaiseOuterL / CTRL_expressions_browRaiseOuterR - رفع الحاجب الخارجي
  • CTRL_expressions_browDownL / CTRL_expressions_browDownR - خفض الحاجب

التحكم في تعبير العين:

  • CTRL_expressions_eyeSquintInnerL / CTRL_expressions_eyeSquintInnerR - تضييق العين
  • CTRL_expressions_eyeCheekRaiseL / CTRL_expressions_eyeCheekRaiseR - رفع الخد

مقارنة النماذج واختيارها

الاختيار بين النماذج

عند اتخاذ قرار بشأن نموذج مزامنة الشفاه الذي ستستخدمه لمشروعك، ضع في اعتبارك هذه العوامل:

الاعتبارالنموذج القياسيالنموذج الواقعيالنموذج الواقعي المدعوم بالمزاج
التوافق مع الشخصيةشخصيات MetaHuman وجميع أنواع الشخصيات المخصصةشخصيات MetaHuman (و ARKit)شخصيات MetaHuman (و ARKit)
الجودة البصريةمزامنة شفاه جيدة مع أداء فعالواقعية محسنة مع حركات فم أكثر طبيعيةواقعية محسنة مع تعابير عاطفية
الأداءمُحسّن لجميع المنصات بما في ذلك الهاتف المحمول/VRمتطلبات موارد أعلىمتطلبات موارد أعلى
الميزات14 وحدة صوتية مرئية، كشف الضحك81 عنصر تحكم في الوجه، 3 مستويات تحسين81 عنصر تحكم في الوجه، 12 مزاج، إخراج قابل للتكوين
دعم المنصةWindows, Android, QuestWindows, Mac, iOS, Linux, Android, QuestWindows, Mac, iOS, Linux, Android, Quest
حالات الاستخدامالتطبيقات العامة، الألعاب، VR/AR، الهاتف المحمولالتجارب السينمائية، التفاعلات عن قربسرد القصص العاطفي، تفاعل الشخصيات المتقدم

توافق إصدار المحرك

مشكلة توافق UE 5.2

إذا كنت تستخدم Unreal Engine 5.2، فقد لا تعمل النماذج الواقعية بشكل صحيح بسبب خطأ في مكتبة إعادة أخذ العينات في UE. لمستخدمي UE 5.2 الذين يحتاجون إلى وظيفة مزامنة شفاه موثوقة، يرجى استخدام النموذج القياسي بدلاً من ذلك.

هذه المشكلة خاصة بـ UE 5.2 ولا تؤثر على إصدارات المحرك الأخرى.

توصيات الأداء

  • بالنسبة لمعظم المشاريع، يوفر النموذج القياسي توازنًا ممتازًا بين الجودة والأداء
  • استخدم النموذج الواقعي عندما تحتاج إلى أعلى دقة بصرية لشخصيات MetaHuman
  • استخدم النموذج الواقعي المدعوم بالمزاج عندما يكون التحكم في التعبير العاطفي مهمًا لتطبيقك
  • ضع في اعتبارك قدرات الأداء لمنصتك المستهدفة عند الاختيار بين النماذج
  • اختبر مستويات التحسين المختلفة للعثور على أفضل توازن لحالة استخدامك المحددة

استكشاف الأخطاء وإصلاحها

المشكلات الشائعة

إعادة إنشاء المولد للنماذج الواقعية: للتشغيل الموثوق والمتسق مع النماذج الواقعية، يوصى بإعادة إنشاء المولد في كل مرة تريد فيها تغذية بيانات صوتية جديدة بعد فترة من الخمول. هذا بسبب سلوك وقت تشغيل ONNX الذي يمكن أن يتسبب في توقف مزامنة الشفاه عن العمل عند إعادة استخدام المولدات بعد فترات من الصمت.

على سبيل المثال، يمكنك إعادة إنشاء مولد مزامنة الشفاه عند بدء كل تشغيل، مثل كلما استدعيت Play Sound 2D أو استخدمت أي طريقة أخرى لبدء تشغيل موجة صوتية ومزامنة الشفاه:

Recreate Lip Sync Generator On Play Sound

موقع الإضافة للتكامل مع Runtime Text To Speech: عند استخدام Runtime MetaHuman Lip Sync مع Runtime Text To Speech (كلتا الإضافتين تستخدمان ONNX Runtime)، قد تواجه مشكلات في الحزم المبنية إذا تم تثبيت الإضافات في مجلد Marketplace الخاص بالمحرك. لإصلاح هذا:

  1. حدد موقع كلا الإضافتين في مجلد تثبيت UE الخاص بك تحت \Engine\Plugins\Marketplace (مثل C:\Program Files\Epic Games\UE_5.6\Engine\Plugins\Marketplace)
  2. انقل كلًا من مجلدات RuntimeMetaHumanLipSync و RuntimeTextToSpeech إلى مجلد Plugins الخاص بمشروعك
  3. إذا لم يكن لمشروعك مجلد Plugins، فأنشئ واحدًا في نفس الدليل الذي يوجد به ملف .uproject الخاص بك
  4. أعد تشغيل محرر Unreal

يعالج هذا مشكلات التوافق التي يمكن أن تحدث عند تحميل إضافات متعددة قائمة على ONNX Runtime من دليل Marketplace الخاص بالمحرك.

تكوين التغليف (Windows): إذا لم تكن مزامنة الشفاه تعمل بشكل صحيح في مشروعك المغلف على Windows، تأكد من أنك تستخدم تكوين بناء Shipping بدلاً من Development. يمكن أن يتسبب تكوين Development في حدوث مشكلات مع وقت تشغيل ONRX للنماذج الواقعية في الحزم المبنية.

لإصلاح هذا:

  1. في إعدادات مشروعك → Packaging، اضبط Build Configuration على Shipping
  2. أعد تغليف مشروعك

Shipping Configuration

المشاريع القائمة على Blueprint فقط

في بعض المشاريع القائمة على Blueprint فقط، قد لا يزال Unreal Engine يبني في تكوين Development حتى عند اختيار Shipping. إذا حدث هذا، قم بتحويل مشروعك إلى مشروع C++ عن طريق إضافة فصل C++ واحد على الأقل (يمكن أن يكون فارغًا). للقيام بذلك، انتقل إلى Tools → New C++ Class في قائمة محرر UE وأنشئ فصلًا فارغًا. هذا سيجبر المشروع على البناء بشكل صحيح في تكوين Shipping. يمكن أن يظل مشروعك قائمًا على Blueprint فقط من حيث الوظيفة، فصل C++ مطلوب فقط لتكوين بناء صحيح.

تدهور استجابة مزامنة الشفاه: إذا واجهت أن مزامنة الشفاه تصبح أقل استجابة بمرور الوقت عند استخدام Streaming Sound Wave أو Capturable Sound Wave، فقد يكون هذا بسبب تراكم الذاكرة. افتراضيًا، يتم إعادة تخصيص الذاكرة في كل مرة يتم فيها إلحاق صوت جديد. لمنع هذه المشكلة، استدع دالة ReleaseMemory بشكل دوري لتحرير الذاكرة المتراكمة، مثل كل 30 ثانية تقريبًا.

تحسين الأداء:

  • اضبط حجم جزء المعالجة للنماذج الواقعية بناءً على متطلبات الأداء الخاصة بك
  • استخدم أعداد الخيوط المناسبة لأجهزتك المستهدفة
  • فكر في استخدام نوع الإخراج Mouth Only للنماذج المدعومة بالمزاج عندما لا تكون هناك حاجة لرسوميات الوجه الكاملة