Обзор

Runtime MetaHuman Lip Sync — это плагин, который обеспечивает синхронизацию губ в реальном времени, офлайн и кроссплатформенно как для MetaHuman, так и для пользовательских персонажей. Он позволяет анимировать губы персонажа в ответ на аудиовход из различных источников, включая:

Вход с микрофона через захватываемую звуковую волну от Runtime Audio Importer
Синтезированную речь от Runtime Text To Speech или Runtime AI Chatbot Integrator
Любые аудиоданные в формате float PCM (массив сэмплов с плавающей запятой)

Плагин внутренне генерирует виземы (визуальные представления фонем) на основе аудиовхода. Поскольку он работает напрямую с аудиоданными, а не с текстом, плагин поддерживает многоязычный ввод, включая, но не ограничиваясь: английским, испанским, французским, немецким, японским, китайским, корейским, русским, итальянским, португальским, арабским и хинди. Фактически поддерживается любой язык, так как синхронизация губ генерируется из аудиофонем, а не из обработки специфичного для языка текста.

Стандартная модель производит 14 визем и выполняет анимацию синхронизации губ, используя предопределенный ассет поз. В отличие от нее, Реалистичные модели (эксклюзивно для персонажей MetaHuman) генерируют 81 изменение лицевого контроля без использования предопределенного ассета поз, что приводит к значительно более реалистичной лицевой анимации.

Совместимость персонажей

Несмотря на название, Runtime MetaHuman Lip Sync работает с широким спектром персонажей, а не только с MetaHumans:

Поддержка стандартов анимации

Системы блендшейпов на основе FACS
Стандарт блендшейпов Apple ARKit
Наборы фонем Preston Blair
Фонемные системы 3ds Max
Любой персонаж с пользовательскими морф-таргетами для лицевых выражений

Подробные инструкции по использованию плагина с персонажами, не являющимися MetaHuman, смотрите в Руководстве по настройке пользовательских персонажей.

Предпросмотр анимации

Ознакомьтесь с этими короткими анимациями, чтобы увидеть качество анимации синхронизации губ, создаваемой плагином для различных типов персонажей и моделей:

Realistic Lip Sync Example — *Реалистичная модель с персонажем MetaHuman*

Standard Lip Sync Example — *Стандартная модель с персонажем MetaHuman*

Custom Character Lip Sync Example — *Стандартная модель с пользовательским персонажем*

Ключевые особенности

Синхронизация губ в реальном времени с входного сигнала микрофона
Поддержка обработки аудио в офлайн-режиме
Кросс-платформенная совместимость с поддержкой специфичных для модели платформ
Поддержка нескольких систем персонажей и стандартов анимации
Гибкое сопоставление визем для пользовательских персонажей
Универсальная поддержка языков - работает с любым разговорным языком через анализ аудио
Мимическая анимация с учетом настроения для улучшенной выразительности
Настраиваемые типы вывода (полное лицо или только управление ртом)

Модели синхронизации губ

Плагин предлагает несколько моделей синхронизации губ для различных потребностей проекта:

Стандартная модель
Реалистичная модель
Реалистичная модель с поддержкой настроения

Стандартная модель синхронизации губ обеспечивает эффективную, кросс-платформенную производительность с широкой совместимостью персонажей:

Работает с MetaHumans и всеми типами пользовательских персонажей
Оптимизирована для производительности в реальном времени
Меньшие требования к ресурсам
Полная совместимость с локальным TTS (плагин Runtime Text To Speech)
Поддерживаемые платформы: Windows, Android, платформы на базе Android (включая Meta Quest)

Требуется плагин-расширение

Для использования Стандартной модели необходимо установить дополнительный плагин-расширение. См. инструкции по установке в разделе Предварительные требования.

Вы можете выбрать подходящую модель в зависимости от требований вашего проекта к производительности, совместимости с персонажами, визуальному качеству, целевой платформе и необходимым функциям.

Примечание о совместимости с TTS

Хотя все модели поддерживают различные методы аудиоввода, обычная модель Realistic имеет ограниченную совместимость с локальным TTS из-за конфликтов с рантаймом ONNX. Однако модель Mood-Enabled Realistic полностью совместима с локальным TTS. Для функциональности преобразования текста в речь:

Standard Model: Совместима со всеми вариантами TTS (локальными и внешними)
Realistic Model: Рекомендуются внешние сервисы TTS (OpenAI, ElevenLabs)
Mood-Enabled Realistic Model: Совместима со всеми вариантами TTS (локальными и внешними)

Как это работает

Плагин обрабатывает аудиоввод следующим образом:

Аудиоданные принимаются в формате PCM с плавающей запятой с указанными каналами и частотой дискретизации
Плагин обрабатывает аудио для генерации данных управления лицевой мимикой или визем в зависимости от модели
Для моделей с поддержкой настроения эмоциональный контекст применяется к лицевой анимации
Данные анимации управляют движениями лица персонажа в реальном времени

Быстрый старт

Вот базовая настройка для включения lip sync на вашем персонаже:

Для персонажей MetaHuman следуйте Руководству по настройке
Для пользовательских персонажей следуйте Руководству по настройке пользовательских персонажей
Выберите и настройте предпочитаемую модель lip sync
Настройте обработку аудиоввода в вашем Blueprint
Подключите соответствующий узел lip sync в Animation Blueprint
Воспроизведите аудио и увидите, как ваш персонаж говорит с эмоциями!

Дополнительные ресурсы

📦 Загрузки и ссылки

Получить на Fab
Веб-сайт продукта
Скачать демо (Windows)
Скачать исходные файлы демо (UE 5.6) – Требуется этот плагин + Runtime Audio Importer, опционально: Text To Speech / AI Chatbot. Стандартная модель требует небольшой плагин-расширение (см. здесь)

🎥 Видеоуроки

Уроки по Реалистичной Модели (Высокое Качество):

Уроки по Стандартной Модели:

Общая Настройка:

💬 Поддержка

Discord сервер поддержки
Кастомная разработка: [email protected] (индивидуальные решения для команд и организаций)

Обзор

Совместимость персонажей

Популярные коммерческие системы персонажей

Поддержка стандартов анимации

Предпросмотр анимации

Ключевые особенности

Модели синхронизации губ

Как это работает

Быстрый старт

Дополнительные ресурсы

📦 Загрузки и ссылки

🎥 Видеоуроки

Рекомендуемое демо:

Уроки по Реалистичной Модели (Высокое Качество):

Уроки по Стандартной Модели:

Общая Настройка:

💬 Поддержка

Совместимость персонажей​

Популярные коммерческие системы персонажей​

Поддержка стандартов анимации​

Предпросмотр анимации​

Ключевые особенности​

Модели синхронизации губ​

Как это работает​

Быстрый старт​

Дополнительные ресурсы​

📦 Загрузки и ссылки​

🎥 Видеоуроки​

Рекомендуемое демо:​

Уроки по Реалистичной Модели (Высокое Качество):​

Уроки по Стандартной Модели:​

Общая Настройка:​

💬 Поддержка​

Совместимость персонажей

Популярные коммерческие системы персонажей

Поддержка стандартов анимации

Предпросмотр анимации

Ключевые особенности

Модели синхронизации губ

Как это работает

Быстрый старт

Дополнительные ресурсы

📦 Загрузки и ссылки

🎥 Видеоуроки

Рекомендуемое демо:

Уроки по Реалистичной Модели (Высокое Качество):

Уроки по Стандартной Модели:

Общая Настройка:

💬 Поддержка