Aperçu
Runtime MetaHuman Lip Sync est un plugin qui permet la synchronisation labiale en temps réel, hors ligne et multiplateforme pour les personnages MetaHuman et les personnages personnalisés. Il vous permet d'animer les lèvres d'un personnage en réponse à une entrée audio provenant de diverses sources, notamment :
- L'entrée microphone via la onde sonore capturable de Runtime Audio Importer
- La parole synthétisée depuis Runtime Text To Speech ou Runtime AI Chatbot Integrator
- Toute donnée audio au format PCM float (un tableau d'échantillons en virgule flottante)
Le plugin génère en interne des visèmes (représentations visuelles des phonèmes) basés sur l'entrée audio. Comme il fonctionne directement avec les données audio plutôt qu'avec du texte, le plugin prend en charge l'entrée multilingue, y compris, mais sans s'y limiter, l'anglais, l'espagnol, le français, l'allemand, le japonais, le chinois, le coréen, le russe, l'italien, le portugais, l'arabe et le hindi. Littéralement, toute langue est prise en charge car la synchronisation labiale est générée à partir des phonèmes audio plutôt qu'à partir d'un traitement de texte spécifique à une langue.
Le Modèle Standard produit 14 visèmes et effectue l'animation de synchronisation labiale en utilisant un asset de pose prédéfini. En revanche, les Modèles Réalistes (exclusifs aux personnages MetaHuman) génèrent 81 changements de contrôle facial sans s'appuyer sur un asset de pose prédéfini, ce qui donne des animations faciales nettement plus réalistes.
Compatibilité des Personnages
Malgré son nom, Runtime MetaHuman Lip Sync fonctionne avec un large éventail de personnages au-delà des simples MetaHumans :
Systèmes de Personnages Commerciaux Populaires
- Personnages Daz Genesis 8/9
- Personnages Reallusion Character Creator 3/4 (CC3/CC4)
- Personnages Mixamo
- Avatars ReadyPlayerMe
Prise en charge des Normes d'Animation
- Systèmes de blendshapes basés sur FACS
- Norme de blendshapes Apple ARKit
- Ensembles de phonèmes Preston Blair
- Systèmes de phonèmes 3ds Max
- Tout personnage avec des morph targets personnalisés pour les expressions faciales
Pour des instructions détaillées sur l'utilisation du plugin avec des personnages non MetaHuman, consultez le Guide de Configuration des Personnages Personnalisés.
Aperçu de l'Animation
Regardez ces courtes animations pour voir la qualité de l'animation de synchronisation labiale produite par le plugin sur différents types de personnages et modèles :




Fonctionnalités Clés
- Synchronisation labiale en temps réel à partir de l'entrée microphone
- Prise en charge du traitement audio hors ligne
- Compatibilité multiplateforme avec support spécifique à la plateforme du modèle
- Prise en charge de multiples systèmes de personnages et standards d'animation
- Mappage de visèmes flexible pour les personnages personnalisés
- Support universel des langues - fonctionne avec toute langue parlée via l'analyse audio
- Animation faciale sensible à l'humeur pour une expressivité accrue
- Types de sortie configurables (contrôles du visage complet ou de la bouche uniquement)
Modèles de Synchronisation Labiale
Le plugin propose plusieurs modèles de synchronisation labiale pour répondre aux différents besoins du projet :
- Modèle Standard
- Modèle Réaliste
- Modèle Réaliste avec Humeur
Le modèle de synchronisation labiale standard offre des performances efficaces et multiplateformes avec une large compatibilité des personnages :
- Fonctionne avec les MetaHumans et tous les types de personnages personnalisés
- Optimisé pour les performances en temps réel
- Exigences en ressources plus faibles
- Compatibilité totale avec la TTS locale (plugin Runtime Text To Speech)
- Support des Plateformes : Windows, Android, plateformes basées sur Android (y compris Meta Quest)
- Trois niveaux d'optimisation : Original, Semi-Optimisé et Hautement Optimisé
Pour utiliser le Modèle Standard, vous devez installer un plugin d'extension supplémentaire. Voir la section Prérequis pour les instructions d'installation.
Le modèle de synchronisation labiale réaliste offre une fidélité visuelle améliorée spécifiquement pour les personnages MetaHuman :
- Exclusif aux MetaHumans avec une animation faciale avancée (81 contrôles faciaux)
- Qualité visuelle supérieure avec des mouvements de bouche plus naturels
- Exigences de performances légèrement plus élevées
- Support TTS local limité (services TTS externes recommandés)
- Idéal pour les expériences cinématiques et les interactions rapprochées avec les personnages
- Support des Plateformes : Windows, Mac, iOS, Linux
- Trois niveaux d'optimisation : Original, Semi-Optimisé et Hautement Optimisé
Le Modèle Réaliste est inclus dans le plugin principal et ne nécessite aucune extension supplémentaire pour être utilisé.
Le modèle réaliste avec humeur fournit une animation faciale sensible aux émotions pour les personnages MetaHuman :
- Exclusif aux MetaHumans avec animation faciale réactive à l'humeur
- 12 types d'humeur différents (Neutre, Heureux, Triste, Confiant, etc.)
- Intensité d'humeur configurable (0.0 à 1.0)
- Timing d'anticipation ajustable pour une meilleure synchronisation (20ms à 200ms)
- Types de sortie sélectionnables : contrôles du Visage Complet ou de la Bouche Uniquement
- Traitement audio en flux pour les applications en temps réel
- Support des Plateformes : Windows, Mac, iOS, Linux
Le * Modèle avec Émotions* inclut des fonctionnalités avancées comme le timing configurable de prévision et le contrôle sélectif de sortie, le rendant idéal pour les applications nécessitant un contrôle de l'expression émotionnelle.
Vous pouvez choisir le modèle approprié en fonction des exigences de votre projet en matière de performance, de compatibilité des personnages, de qualité visuelle, de plateforme cible et de besoins fonctionnels.
Bien que tous les modèles prennent en charge diverses méthodes d'entrée audio, le modèle Réaliste standard a une compatibilité limitée avec la TTS locale en raison de conflits du runtime ONNX. Le modèle Réaliste avec Émotions, cependant, est entièrement compatible avec la TTS locale. Pour la fonctionnalité de synthèse vocale :
- Modèle Standard : Compatible avec toutes les options TTS (locale et externe)
- Modèle Réaliste : Services TTS externes recommandés (OpenAI, ElevenLabs)
- Modèle Réaliste avec Émotions : Compatible avec toutes les options TTS (locale et externe)
Fonctionnement
Le plugin traite l'entrée audio de la manière suivante :
- Les données audio sont reçues au format PCM en virgule flottante avec des canaux et une fréquence d'échantillonnage spécifiés
- Le plugin traite l'audio pour générer des données de contrôle facial ou des visèmes selon le modèle
- Pour les modèles avec émotions, le contexte émotionnel est appliqué à l'animation faciale
- Les données d'animation animent les mouvements du visage du personnage en temps réel
Démarrage Rapide
Voici une configuration de base pour activer la synchronisation labiale sur votre personnage :
- Pour les personnages MetaHuman, suivez le Guide de Configuration
- Pour les personnages personnalisés, suivez le Guide de Configuration pour Personnages Personnalisés
- Choisissez et configurez votre modèle de synchronisation labiale préféré
- Configurez le traitement de l'entrée audio dans votre Blueprint
- Connectez le nœud de synchronisation labiale approprié dans l'Animation Blueprint
- Jouez l'audio et voyez votre personnage parler avec émotion !
Ressources Supplémentaires
📦 Téléchargements & Liens
- Obtenez-le sur Fab
- Site web du produit
- Télécharger la Démo (Windows)
- Télécharger les fichiers source de la Démo (UE 5.6) – Requiert ce plugin + Runtime Audio Importer, optionnel : Text To Speech / AI Chatbot. Le modèle standard nécessite un petit plugin d'extension (voir ici)
🎥 Tutoriels Vidéo
Démo en Vedette :
Tutoriels Modèle Réaliste (Haute Qualité) :
- Synchronisation labiale de haute qualité avec contrôle de l'humeur et TTS local ⭐ NOUVEAU
- Synchronisation labiale de haute qualité avec ElevenLabs et OpenAI TTS
- Synchronisation labiale en direct par microphone de haute qualité
Tutoriels Modèle Standard :
- Synchronisation labiale en direct par microphone standard
- Synchronisation labiale standard avec synthèse vocale locale
- Synchronisation labiale standard avec ElevenLabs et OpenAI TTS
Configuration Générale :
💬 Support
- Serveur de support Discord
- Développement Personnalisé : [email protected] (solutions sur mesure pour les équipes et organisations)