Обзор
Runtime MetaHuman Lip Sync — это плагин, который обеспечивает синхронизацию губ в реальном времени, офлайн и кроссплатформенно как для MetaHuman, так и для пользовательских персонажей. Он позволяет анимировать губы персонажа в ответ на аудиовход из различных источников, включая:
- Вход с микрофона через захватываемую звуковую волну от Runtime Audio Importer
- Синтезированную речь от Runtime Text To Speech или Runtime AI Chatbot Integrator
- Любые аудиоданные в формате float PCM (массив семплов с плавающей запятой)
Плагин внутренне генерирует висемы (визуальные представления фонем) на основе аудиовхода. Поскольку он работает напрямую с аудиоданными, а не с текстом, плагин поддерживает многоязычный ввод, включая, но не ограничиваясь: английским, испанским, французским, немецким, японским, китайским, корейским, русским, итальянским, португальским, арабским и хинди. Фактически, поддерживается любой язык, так как синхронизация губ генерируется из аудиофонем, а не из языко-специфичной обработки текста.
Стандартная модель производит 14 висем и выполняет анимацию синхронизации губ с использованием предопределенного ассета поз. В отличие от нее, Реалистичная модель (эксклюзивно для персонажей MetaHuman) генерирует 250 изменений морф-таргетов без использования предопределенного ассета поз, что приводит к значительно более реалистичной мимике.
Совместимость с персонажами
Несмотря на название, Runtime MetaHuman Lip Sync работает с широким спектром персонажей, а не только с MetaHumans:
Популярные коммерческие системы персонажей
- Персонажи Daz Genesis 8/9
- Персонажи Reallusion Character Creator 3/4 (CC3/CC4)
- Персонажи Mixamo
- Аватары ReadyPlayerMe
Поддержка стандартов анимации
- Системы блендшейпов на основе FACS
- Стандарт блендшейпов Apple ARKit
- Наборы фонем Preston Blair
- Фонемные системы 3ds Max
- Любые персонажи с пользовательскими морф-таргетами для мимики
Подробные инструкции по использованию плагина с персонажами, отличными от MetaHuman, смотрите в Руководстве по настройке пользовательских персонажей.
Предпросмотр анимации
Ознакомьтесь с этими короткими анимациями, чтобы увидеть качество синхронизации губ, создаваемое плагином для различных типов персонажей и моделей:




Ключевые особенности
- Реализация синхронизации губ в реальном времени с входного сигнала микрофона
- Поддержка офлайн-обработки аудио
- Кросс-платформенная совместимость с поддержкой специфичных для модели платформ
- Поддержка нескольких систем персонажей и стандартов анимации
- Гибкое сопоставление визем для пользовательских персонажей
- Универсальная поддержка языков - работает с любым разговорным языком через анализ аудио
Модели синхронизации губ
Плагин предлагает две модели синхронизации губ для различных потребностей проекта:
- Стандартная модель
- Реалистичная модель
Стандартная модель синхронизации губ обеспечивает эффективную кросс-платформенную производительность с широкой совместимостью персонажей:
- Работает с MetaHumans и всеми типами пользовательских персонажей
- Оптимизирована для производительности в реальном времени
- Меньшие требования к ресурсам
- Полная совместимость с локальным TTS (плагин Runtime Text To Speech)
- Поддерживаемые платформы: Windows, Android, платформы на базе Android (включая Meta Quest)
Для использования Стандартной (Более быстрой) Модели необходимо установить дополнительный плагин-расширение. Смотрите раздел Предварительные требования для инструкций по установке.
Реалистичная модель синхронизации губ обеспечивает улучшенную визуальную точность, специально для персонажей MetaHuman:
- Эксклюзивно для MetaHuman с продвинутой лицевой анимацией
- Более высокое визуальное качество с более естественными движениями рта
- Несколько более высокие требования к производительности
- Ограниченная поддержка локального TTS (рекомендуются внешние TTS-сервисы)
- Идеальна для кинематографичных сцен и взаимодействий с персонажами крупным планом
- Поддерживаемые платформы: Windows, Mac, iOS, Linux
Реалистичная Модель включена в основной плагин и не требует каких-либо дополнительных расширений для использования.
Вы можете выбрать подходящую модель в зависимости от требований вашего проекта к производительности, совместимости персонажей, визуальному качеству и целевой платформе.
Хотя обе модели поддерживают различные методы ввода аудио, у Реалистичной модели ограниченная совместимость с локальным TTS из-за конфликтов с рантаймом ONNX. Для функциональности преобразования текста в речь с Реалистичной моделью рекомендуются внешние TTS-сервисы (OpenAI, ElevenLabs).
Как это работает
Плагин обрабатывает входной аудиосигнал следующим образом:
- Аудиоданные принимаются в формате PCM с плавающей точкой с указанными каналами и частотой дискретизации
- Плагин обрабатывает аудио для генерации визем (фонем)
- Эти виземы управляют анимацией синхронизации губ с использованием Pose Asset персонажа
- Анимация применяется к персонажу в реальном времени
Быстрый старт
Вот базовая настройка для включения синхронизации губ на вашем персонаже:
- Для персонажей MetaHuman следуйте Руководству по настройке MetaHuman
- Для пользовательских персонажей следуйте Руководству по настройке пользовательских персонажей
- Настройте обработку аудиовхода (например, в Event Graph)
- Подключите ноду Blend Runtime MetaHuman Lip Sync в Anim Graph
- Воспроизведите аудио и наблюдайте, как ваш персонаж говорит!
Дополнительные ресурсы
📦 Загрузки и ссылки
- Приобрести на Fab
- Веб-сайт продукта
- Скачать демо (Windows)
- Скачать исходные файлы демо (UE 5.6) – Требуется этот плагин + Runtime Audio Importer, опционально: Text To Speech / AI Chatbot. Стандартная модель требует небольшой плагин-расширение (см. здесь)
🎥 Видеоуроки
Рекомендуемое демо:
Уроки по реалистичной модели (высокое качество):
- Синхронизация губ высокого качества с ElevenLabs и OpenAI TTS ⭐ НОВОЕ
- Синхронизация губ высокого качества с живым микрофоном ⭐ НОВОЕ
Уроки по стандартной модели:
- Стандартная синхронизация губ с живым микрофоном
- Стандартная синхронизация губ с локальным преобразованием текста в речь
- Стандартная синхронизация губ с ElevenLabs и OpenAI TTS
Общая настройка:
💬 Поддержка
- Discord сервер поддержки
- Кастомная разработка: [email protected] (индивидуальные решения для команд и организаций)