Перейти к основному содержимому

Руководство по обработке аудио

В этом руководстве описано, как настроить различные методы ввода аудио для передачи аудиоданных вашим генераторам липсинка. Убедитесь, что вы выполнили Руководство по настройке перед продолжением.

Обработка аудиовхода

Вам необходимо настроить метод обработки аудиовхода. Существует несколько способов сделать это в зависимости от вашего источника аудио.

Этот подход выполняет липсинк в реальном времени во время разговора в микрофон:

  1. Создайте Capturable Sound Wave с помощью Runtime Audio Importer
  2. Перед началом захвата аудио привяжитесь к делегату OnPopulateAudioData
  3. В привязанной функции вызовите ProcessAudioData из вашего Runtime Viseme Generator
  4. Начните захват аудио с микрофона

Копируемые ноды.

Липсинк во время захвата аудио

Советы по производительности обработки

  • Размер чанка: Увеличение ProcessingChunkSize параметра конфигурации (например, до 320, 480 или 640 семплов) может заметно улучшить задержку с минимальным влиянием на качество или отзывчивость.

  • Тип модели: При использовании реалистичных моделей переключение на Высоко оптимизированный тип модели (выбран по умолчанию) может улучшить производительность. Обратите внимание, что оригинальная модель может давать немного лучшее качество, особенно с зашумленным аудио.

  • Управление буфером: Модель с поддержкой настроения обрабатывает аудио кадрами по 320 семплов (20 мс при 16 кГц). Убедитесь, что временные характеристики вашего аудиовхода соответствуют этому для оптимальной производительности.

  • Пересоздание генератора: Для надежной работы с реалистичными моделями пересоздавайте генератор каждый раз, когда вы хотите подать новые аудиоданные после периода бездействия. См. Пересоздание генератора в разделе Устранение неполадок для объяснения.

Следующие шаги

После настройки обработки аудио вы можете:

  • Узнать о параметрах конфигурации для точной настройки поведения липсинка
  • Добавить анимацию смеха для повышения выразительности
  • Объединить липсинк с существующими анимациями лица, используя техники наложения слоев, описанные в руководстве по конфигурации