Перейти к основному содержимому

Руководство по обработке аудио

Это руководство охватывает настройку различных методов ввода аудио для передачи аудиоданных вашим генераторам Lip Sync. Убедитесь, что вы завершили Руководство по настройке, прежде чем продолжить.

Обработка ввода аудио

Вам необходимо настроить метод обработки аудиовхода. Существует несколько способов сделать это в зависимости от вашего источника аудио.

Этот подход выполняет Lip Sync в реальном времени во время разговора в микрофон:

  1. Создайте Capturable Sound Wave с помощью Runtime Audio Importer
  2. Перед началом захвата аудио привяжитесь к делегату OnPopulateAudioData
  3. В привязанной функции вызовите ProcessAudioData из вашего Runtime Viseme Generator
  4. Начните захват аудио с микрофона

Копируемые ноды.

Lip Sync During Audio Capture

Советы по производительности обработки

  • Размер чанка: Если вы хотите обрабатывать аудиоданные меньшими порциями для более отзывчивой Lip Sync, скорректируйте расчет в функции SetNumSamplesPerChunk. Например, деление частоты дискретизации на 150 (потоковая передача каждые ~6,67 мс) вместо 100 (потоковая передача каждые 10 мс) обеспечит более частые обновления Lip Sync.

  • Управление буфером: Модель с поддержкой настроения обрабатывает аудио кадрами по 320 сэмплов (20 мс при 16 кГц). Убедитесь, что время вашего аудиовхода синхронизировано с этим для оптимальной производительности.

  • Пересоздание генератора: Для надежной работы с Realistic моделями пересоздавайте генератор каждый раз, когда вы хотите подать новые аудиоданные после периода бездействия.

Следующие шаги

После настройки обработки аудио вы можете:

  • Изучить параметры конфигурации для тонкой настройки поведения Lip Sync
  • Добавить анимацию смеха для повышения выразительности
  • Комбинировать Lip Sync с существующими лицевыми анимациями, используя методы наслоения, описанные в руководстве по конфигурации