Saltar al contenido principal

Guía de Procesamiento de Audio

Esta guía cubre cómo configurar diferentes métodos de entrada de audio para alimentar datos de audio a tus generadores de sincronización labial. Asegúrate de haber completado la Guía de Configuración antes de continuar.

Procesamiento de Entrada de Audio

Necesitas configurar un método para procesar la entrada de audio. Hay varias formas de hacerlo dependiendo de tu fuente de audio.

Este enfoque realiza la sincronización labial en tiempo real mientras se habla al micrófono:

  1. Crea una Capturable Sound Wave usando Runtime Audio Importer
  2. Antes de comenzar a capturar audio, enlázate al delegado OnPopulateAudioData
  3. En la función enlazada, llama a ProcessAudioData desde tu Runtime Viseme Generator
  4. Comienza a capturar audio desde el micrófono

Nodos copiables.

Sincronización Labial Durante la Captura de Audio

Consejos de Rendimiento de Procesamiento

  • Tamaño del Fragmento: Aumentar la opción de configuración ProcessingChunkSize (por ejemplo, a 320, 480 o 640 muestras) puede mejorar notablemente la latencia con un impacto mínimo en la calidad o la capacidad de respuesta.

  • Tipo de Modelo: Al usar modelos realistas, cambiar al tipo de modelo Altamente Optimizado (seleccionado por defecto) puede mejorar el rendimiento. Ten en cuenta que el modelo original puede producir una calidad ligeramente mejor, particularmente con audio ruidoso.

  • Gestión del Búfer: El modelo con estado de ánimo procesa audio en tramas de 320 muestras (20ms a 16kHz). Asegúrate de que el tiempo de tu entrada de audio se alinee con esto para un rendimiento óptimo.

  • Recreación del Generador: Para una operación confiable con modelos realistas, recrea el generador cada vez que quieras alimentar nuevos datos de audio después de un período de inactividad.

Próximos Pasos

Una vez que tengas configurado el procesamiento de audio, es posible que desees:

  • Aprender sobre las opciones de Configuración para ajustar el comportamiento de tu sincronización labial
  • Añadir animación de risa para una mayor expresividad
  • Combinar la sincronización labial con animaciones faciales existentes usando las técnicas de capas descritas en la guía de Configuración