Обзор
Runtime MetaHuman Lip Sync — это плагин, обеспечивающий синхронизацию губ в реальном времени, оффлайн и кросс-платформенно как для MetaHuman, так и для пользовательских персонажей. Он позволяет анимировать губы персонажа в ответ на аудиовход из различных источников, включая:
- Вход с микрофона через захватываемую звуковую волну от Runtime Audio Importer
- Синтезированную речь от Runtime Text To Speech или Runtime AI Chatbot Integrator
- Любые аудиоданные в формате float PCM (массив сэмплов с плавающей точкой)
Плагин внутренне генерирует виземы (визуальные представления фонем) на основе аудиовхода и выполняет анимацию синхронизации губ с использованием предопределенного ассета поз.
Совместимость с персонажами
Несмотря на название, Runtime MetaHuman Lip Sync работает с широким спектром персонажей, не ограничиваясь только MetaHumans:
Популярные коммерческие системы персонажей
- Персонажи Daz Genesis 8/9
- Персонажи Reallusion Character Creator 3/4 (CC3/CC4)
- Персонажи Mixamo
- Аватары ReadyPlayerMe
Поддержка стандартов анимации
- Системы блендшейпов на основе FACS
- Стандарт блендшейпов Apple ARKit
- Наборы фонем Preston Blair
- Системы фонем 3ds Max
- Любые персонажи с пользовательскими морф-таргетами для мимики
Подробные инструкции по использованию плагина с не-MetaHuman персонажами см. в Руководстве по настройке пользовательских персонажей.
Предпросмотр анимации
Оцените качество анимации синхронизации губ, создаваемой плагином, на примере различных типов персонажей и моделей:




Ключевые особенности
- Реализация синхронизации губ (Lip Sync) в реальном времени с микрофонного ввода
- Поддержка обработки аудио в оффлайн-режиме
- Кросс-платформенная совместимость: Windows, Android, Meta Quest
- Поддержка различных систем персонажей и стандартов анимации
- Гибкое сопоставление виземов (viseme mapping) для пользовательских персонажей
Модели синхронизации губ
Плагин предлагает две модели Lip Sync для различных потребностей проекта:
- Стандартная модель
- Реалистичная модель
Стандартная модель Lip Sync обеспечивает эффективную кросс-платформенную работу с широкой совместимостью персонажей:
- Работает с MetaHumans и всеми типами пользовательских персонажей
- Оптимизирована для работы в реальном времени на всех платформах
- Меньшие требования к ресурсам
- Полная совместимость с локальным TTS (плагин Runtime Text To Speech)
- Подходит для мобильных и VR/AR приложений
Реалистичная модель Lip Sync обеспечивает повышенную визуальную точность, специально для персонажей MetaHuman:
- Эксклюзивно для MetaHumans с продвинутой лицевой анимацией
- Более высокое визуальное качество с естественными движениями рта
- Несколько более высокие требования к производительности
- Ограниченная поддержка локального TTS (рекомендуются внешние TTS-сервисы)
- Идеально для кинематографичных сцен и близких взаимодействий с персонажами
Вы можете выбрать подходящую модель в зависимости от требований вашего проекта к производительности, совместимости персонажей и визуальному качеству.
Хотя обе модели поддерживают различные методы аудиоввода, Реалистичная модель имеет ограниченную совместимость с локальным TTS из-за конфликтов с ONNX runtime. Для работы с текстом в речь (TTS) в Реалистичной модели рекомендуются внешние TTS-сервисы (OpenAI, ElevenLabs).
Как это работает
Плагин обрабатывает аудиоввод следующим образом:
- Аудиоданные принимаются в формате PCM (float) с указанными каналами и частотой дискретизации
- Плагин обрабатывает аудио для генерации виземов (фонем)
- Эти виземы управляют анимацией синхронизации губ с использованием pose-ассета персонажа
- Анимация применяется к персонажу в реальном времени
Быстрый старт
Базовая настройка для включения Lip Sync на вашем персонаже:
- Для персонажей MetaHuman следуйте Руководству по настройке MetaHuman
- Для пользовательских персонажей следуйте Руководству по настройке пользовательских персонажей
- Настройте обработку аудиоввода (например, в Event Graph)
- Подключите ноду Blend Runtime MetaHuman Lip Sync в Anim Graph
- Воспроизведите аудио и наблюдайте, как ваш персонаж говорит!
Дополнительные ресурсы
📦 Загрузки и ссылки
- Приобрести на Fab
- Официальный сайт продукта
- Скачать демо (Windows)
- Скачать исходные файлы демо (UE 5.5)
🎥 Видеоуроки
Уроки по Реалистичной модели (высокое качество):
- Высококачественная Lip Sync с ElevenLabs & OpenAI TTS в UE 5.6+ ⭐ НОВОЕ
- Высококачественная Lip Sync с микрофоном в реальном времени для UE 5.6+ ⭐ НОВОЕ
Уроки по Стандартной модели:
- Стандартная Lip Sync с микрофоном в реальном времени для UE 5.6+
- Стандартная Lip Sync с локальным текстом в речь (TTS) в UE 5.6+
- Стандартная Lip Sync с ElevenLabs & OpenAI TTS в UE 5.6+
Общая настройка:
💬 Поддержка
- Discord сервер поддержки
- Кастомизация: [email protected] (индивидуальные решения для команд и организаций)