Перейти к основному содержимому

Руководство по обработке аудио

Это руководство охватывает настройку различных методов ввода аудио для передачи аудиоданных вашим генераторам синхронизации губ. Убедитесь, что вы завершили Руководство по настройке перед продолжением.

Обработка аудиовхода

Вам необходимо настроить метод обработки аудиовхода. Существует несколько способов сделать это в зависимости от вашего источника аудио.

Этот подход выполняет синхронизацию губ в реальном времени во время разговора в микрофон:

  1. Создайте Capturable Sound Wave используя Runtime Audio Importer
  2. Перед началом захвата аудио привяжитесь к делегату OnPopulateAudioData
  3. В привязанной функции вызовите ProcessAudioData из вашего Runtime Viseme Generator
  4. Начните захват аудио с микрофона

Копируемые ноды.

Синхронизация губ во время захвата аудио

Советы по производительности обработки

  • Размер чанка: Если вы хотите обрабатывать аудиоданные меньшими порциями для более отзывчивой синхронизации губ, скорректируйте расчет в функции SetNumSamplesPerChunk. Например, деление частоты дискретизации на 150 (потоковая передача каждые ~6,67 мс) вместо 100 (потоковая передача каждые 10 мс) обеспечит более частые обновления синхронизации губ.

  • Управление буфером: Модель с поддержкой настроения обрабатывает аудио кадрами по 320 сэмплов (20 мс при 16 кГц). Убедитесь, что время вашего аудиовхода соответствует этому для оптимальной производительности.

  • Пересоздание генератора: Для надежной работы с Realistic моделями пересоздавайте генератор каждый раз, когда вы хотите подать новые аудиоданные после периода бездействия.

Следующие шаги

После настройки обработки аудио вы можете:

  • Ознакомиться с параметрами конфигурации для тонкой настройки поведения синхронизации губ
  • Добавить анимацию смеха для повышения выразительности
  • Комбинировать синхронизацию губ с существующими лицевыми анимациями, используя методы наслоения, описанные в руководстве по конфигурации