Обзор
Runtime MetaHuman Lip Sync — это плагин, который обеспечивает синхронизацию губ в реальном времени, оффлайн и кросс-платформенно как для MetaHuman, так и для пользовательских персонажей. Он позволяет анимировать губы персонажа в ответ на аудиовход из различных источников, включая:
- Вход с микрофона через захватываемую звуковую волну Runtime Audio Importer
- Синтезированную речь из Runtime Text To Speech или Runtime AI Chatbot Integrator
- Любые аудиоданные в формате float PCM (массив сэмплов с плавающей запятой)
Плагин внутренне генерирует виземы (визуальные представления фонем) на основе аудиовхода. Поскольку он работает напрямую с аудиоданными, а не с текстом, плагин поддерживает многоязычный ввод, включая, но не ограничиваясь английским, испанским, французским, немецким, японским, китайским, корей ским, русским, итальянским, португальским, арабским и хинди. Фактически поддерживается любой язык, так как синхронизация губ генерируется из аудиофонем, а не из обработки текста, специфичной для языка.
Стандартная модель производит 14 визем и выполняет анимацию синхронизации губ с использованием предопределенного ассета поз. В отличие от этого, Реалистичная модель (эксклюзивно для персонажей MetaHuman) генерирует 250 изменений морф-таргетов без использования предопределенного ассета поз, что приводит к значительно более реалистичной анимации лица.
Совместимость с персонажами
Несмотря на название, Runtime MetaHuman Lip Sync работает с широким спектром персонажей, не только с MetaHuman: