Aller au contenu principal

Comment utiliser le plugin

Ce guide vous explique comment configurer Runtime MetaHuman Lip Sync pour vos personnages MetaHuman.

Remarque : Runtime MetaHuman Lip Sync fonctionne à la fois avec les MetaHuman et les personnages personnalisés. Le plugin prend en charge divers types de personnages, notamment :

  • Les personnages commerciaux populaires (Daz Genesis 8/9, Reallusion CC3/CC4, Mixamo, ReadyPlayerMe, etc.)
  • Les personnages avec des blendshapes basés sur FACS
  • Les modèles utilisant les standards de blendshape ARKit
  • Les personnages avec des ensembles de phonèmes Preston Blair
  • Les systèmes de phonèmes 3ds Max
  • Tout personnage avec des morph targets personnalisés pour les expressions faciales

Pour des instructions détaillées sur la configuration de personnages personnalisés, y compris les références de mappage des visèmes pour tous les standards ci-dessus, consultez le Guide de configuration des personnages personnalisés.

Prérequis

Avant de commencer, assurez-vous que :

  1. Le plugin MetaHuman est activé dans votre projet
  2. Vous avez au moins un personnage MetaHuman téléchargé et disponible dans votre projet
  3. Le plugin Runtime MetaHuman Lip Sync est installé

Plugins supplémentaires :

  • Si vous prévoyez d'utiliser la capture audio (par exemple, l'entrée microphone), installez le plugin Runtime Audio Importer.
  • Si vous prévoyez d'utiliser la fonctionnalité synthèse vocale, installez le plugin Runtime Text To Speech.

Configuration spécifique à la plateforme

Configuration Android / Meta Quest

Si vous ciblez les plateformes Android ou Meta Quest et que vous rencontrez des erreurs de compilation avec ce plugin, vous devrez désactiver l'architecture Android x86_64 (x64) dans les paramètres de votre projet :

  1. Allez dans Edit > Project Settings
  2. Naviguez vers Platforms > Android
  3. Sous Platforms - Android, section Build, trouvez Support x86_64 [aka x64] et assurez-vous qu'il est désactivé, comme indiqué ci-dessous

Désactiver l'architecture Android x64

Cela est dû au fait que le plugin ne prend actuellement en charge que les architectures arm64-v8a et armeabi-v7a pour les plateformes Android / Meta Quest.

Processus de configuration

Étape 1 : Localiser et modifier le Blueprint d'animation faciale

Vous devez modifier un Animation Blueprint qui sera utilisé pour les animations faciales de votre personnage MetaHuman. Le Animation Blueprint facial par défaut de MetaHuman se trouve à l'emplacement :

Content/MetaHumans/Common/Face/Face_AnimBP

Face Animation Blueprint

Vous avez plusieurs options pour implémenter la fonctionnalité de lip sync :

Ouvrez directement le Face_AnimBP par défaut et effectuez vos modifications. Tous les changements affecteront tous les personnages MetaHuman utilisant ce Animation Blueprint.

Note : Cette approche est pratique mais impactera tous les personnages utilisant le Animation Blueprint par défaut.

Important : Le blending Runtime MetaHuman Lip Sync peut être implémenté dans n'importe quel asset Animation Blueprint ayant accès à une pose contenant les os faciaux présents dans le Face_Archetype_Skeleton par défaut des MetaHumans. Vous n'êtes pas limité aux options ci-dessus - ce sont juste des approches d'implémentation courantes.

Étape 2 : Configuration du Event Graph

Ouvrez votre Face Animation Blueprint et basculez vers le Event Graph. Vous devrez créer un Runtime Viseme Generator qui traitera les données audio et générera des visèmes.

  1. Ajoutez le node Event Blueprint Begin Play s'il n'existe pas déjà
  2. Ajoutez le node Create Runtime Viseme Generator et connectez-le à l'événement Begin Play
  3. Sauvegardez la sortie dans une variable (par exemple "VisemeGenerator") pour utilisation dans d'autres parties du graphe

Creating Runtime Viseme Generator

Étape 3 : Configuration du traitement de l'entrée audio

Vous devez configurer une méthode pour traiter l'entrée audio. Il existe plusieurs façons de faire cela selon votre source audio.

Cette approche effectue le lip sync en temps réel pendant la prise de parole via le microphone :

  1. Créez un Capturable Sound Wave en utilisant Runtime Audio Importer
  2. Avant de commencer la capture audio, liez-vous au delegate OnPopulateAudioData
  3. Dans la fonction liée, appelez ProcessAudioData depuis votre Runtime Viseme Generator
  4. Commencez la capture audio depuis le microphone

Copyable nodes.

Lip Sync During Audio Capture

Étape 4 : Configuration de l'Anim Graph

Après avoir configuré le Event Graph, basculez vers l'Anim Graph pour connecter le viseme generator à l'animation du personnage :

Lip Sync

  1. Localisez la pose contenant le visage MetaHuman (typiquement depuis Use cached pose 'Body Pose')
  2. Ajoutez le node Blend Runtime MetaHuman Lip Sync
  3. Connectez la pose au Source Pose du node Blend Runtime MetaHuman Lip Sync
  4. Connectez votre variable RuntimeVisemeGenerator au pin Viseme Generator
  5. Connectez la sortie du node Blend Runtime MetaHuman Lip Sync au pin Result de l'Output Pose

Blend Runtime MetaHuman Lip Sync

Quand un lip sync est détecté dans l'audio, votre personnage s'animera dynamiquement en conséquence :

Lip Sync

Animation de rire

Vous pouvez aussi ajouter des animations de rire qui répondront dynamiquement au rire détecté dans l'audio :

  1. Ajoutez le node Blend Runtime MetaHuman Laughter
  2. Connectez votre variable RuntimeVisemeGenerator au pin Viseme Generator
  3. Si vous utilisez déjà le lip sync :
    • Connectez la sortie du node Blend Runtime MetaHuman Lip Sync au Source Pose du node Blend Runtime MetaHuman Laughter
    • Connectez la sortie du node Blend Runtime MetaHuman Laughter au pin Result de l'Output Pose
  4. Si vous utilisez seulement le rire sans lip sync :
    • Connectez votre source pose directement au Source Pose du node Blend Runtime MetaHuman Laughter
    • Connectez la sortie au pin Result

Blend Runtime MetaHuman Laughter

Quand un rire est détecté dans l'audio, votre personnage s'animera dynamiquement en conséquence :

Laughter

Combinaison avec les animations corporelles

Pour appliquer le lip sync et le rire avec des animations corporelles existantes sans les écraser :

  1. Ajoutez un node Layered blend per bone entre vos animations corporelles et la sortie finale. Assurez-vous que Use Attached Parent est vrai.
  2. Configurez le setup des layers :
    • Ajoutez 1 item au tableau Layer Setup
    • Ajoutez 3 items aux Branch Filters pour le layer, avec les Bone Name suivants :
      • FACIAL_C_FacialRoot
      • FACIAL_C_Neck2Root
      • FACIAL_C_Neck1Root
  3. Faites les connections :
    • Animations existantes (comme BodyPose) → entrée Base Pose
    • Sortie d'animation faciale (depuis les nodes lip sync et/ou rire) → entrée Blend Poses 0
    • Node Layered blend → pose Result finale

Layered Blend Per Bone

Pourquoi cela fonctionne : Les branch filters isolent les os d'animation faciale, permettant au lip sync et au rire de se blend uniquement avec les mouvements faciaux tout en préservant les animations corporelles originales. Cela correspond à la structure du rig facial MetaHuman, assurant une intégration naturelle.

Note : Les fonctionnalités de lip sync et de rire sont conçues pour fonctionner de manière non destructive avec votre setup d'animation existant. Elles n'affectent que les os faciaux spécifiques nécessaires aux mouvements de la bouche, laissant intactes les autres animations faciales. Cela signifie que vous pouvez les intégrer en toute sécurité à n'importe quel point de votre chaîne d'animation - soit avant d'autres animations faciales (permettant à ces animations d'écraser le lip sync/rire) soit après elles (laissant le lip sync/rire se blend par dessus vos animations existantes). Cette flexibilité vous permet de combiner lip sync et rire avec des clignements d'yeux, des mouvements de sourcils, des expressions émotionnelles et d'autres animations faciales sans conflits.

Configuration

Configuration du Lip Sync

Le node Blend Runtime MetaHuman Lip Sync a des options de configuration dans son panneau de propriétés :

PropriétéDéfautDescription
Interpolation Speed25Contrôle la rapidité des transitions entre visèmes. Des valeurs plus élevées donnent des transitions plus rapides et abruptes.
Reset Time0.2La durée