Руководство по обработке аудио

Это руководство охватывает настройку различных методов ввода аудио для передачи аудиоданных вашим генераторам синхронизации губ. Убедитесь, что вы завершили Руководство по настройке перед продолжением.

Обработка аудиовхода

Вам необходимо настроить метод обработки аудиовхода. Существует несколько способов сделать это в зависимости от вашего источника аудио.

Этот подход выполняет синхронизацию губ в реальном времени во время разговора в микрофон:

Стандартная модель
Реалистичная модель
Реалистичная модель с поддержкой настроения

Создайте Capturable Sound Wave используя Runtime Audio Importer
Перед началом захвата аудио привяжитесь к делегату OnPopulateAudioData
В привязанной функции вызовите ProcessAudioData из вашего Runtime Viseme Generator
Начните захват аудио с микрофона

Копируемые ноды.

Синхронизация губ во время захвата аудио

Реалистичная модель использует тот же рабочий процесс обработки аудио, что и Стандартная модель, но с переменной RealisticLipSyncGenerator вместо VisemeGenerator.

Копируемые ноды.

Реалистичная синхронизация губ во время захвата аудио

Модель с поддержкой настроения использует тот же рабочий процесс обработки аудио, но с переменной MoodMetaHumanLipSyncGenerator и дополнительными возможностями настройки настроения.

Копируемые ноды.

Синхронизация губ с поддержкой настроения во время захвата аудио

Этот подход захватывает аудио с микрофона, затем воспроизводит его с синхронизацией губ:

Стандартная Модель
Реалистичная Модель
Реалистичная Модель с Настроением

Создайте Capturable Sound Wave используя Runtime Audio Importer
Начните захват аудио с микрофона
Перед воспроизведением capturable sound wave, привяжитесь к его делегату OnGeneratePCMData
В привязанной функции вызовите ProcessAudioData из вашего Runtime Viseme Generator

Копируемые ноды.

Синхронизация губ во время воспроизведения аудио

Реалистичная Модель использует тот же рабочий процесс обработки аудио, что и Стандартная Модель, но с переменной RealisticLipSyncGenerator вместо VisemeGenerator.

Копируемые ноды.

Реалистичная синхронизация губ во время воспроизведения аудио

Копируемые ноды.

Синхронизация губ с настроением во время воспроизведения аудио

Regular
Streaming

Этот подход синтезирует речь из текста с использованием локального TTS и выполняет синхронизацию губ:

Standard Model
Realistic Model
Mood-Enabled Realistic Model

Используйте Runtime Text To Speech для генерации речи из текста
Используйте Runtime Audio Importer для импорта синтезированного аудио
Перед воспроизведением импортированной звуковой волны привяжитесь к её делегату OnGeneratePCMData
В привязанной функции вызовите ProcessAudioData из вашего Runtime Viseme Generator

Обработка аудиовхода​

Советы по производительности обработки​

Следующие шаги​

Обработка аудиовхода

Советы по производительности обработки

Следующие шаги