Passa al contenuto principale

Guida all'Elaborazione Audio

Questa guida copre come impostare diversi metodi di input audio per fornire dati audio ai tuoi generatori di lip sync. Assicurati di aver completato la Guida di Configurazione prima di procedere.

Elaborazione dell'Input Audio

Devi impostare un metodo per elaborare l'input audio. Ci sono diversi modi per farlo a seconda della tua sorgente audio.

Questo approccio esegue il lip sync in tempo reale mentre si parla nel microfono:

  1. Crea una Capturable Sound Wave usando Runtime Audio Importer
  2. Prima di iniziare a catturare l'audio, collegati al delegato OnPopulateAudioData
  3. Nella funzione collegata, chiama ProcessAudioData dal tuo Runtime Viseme Generator
  4. Inizia a catturare l'audio dal microfono

Nodi copiabili.

Lip Sync Durante la Cattura Audio

Suggerimenti sulle Prestazioni di Elaborazione

  • Dimensione del Chunk: Se vuoi elaborare i dati audio in chunk più piccoli per un lip sync più reattivo, regola il calcolo nella funzione SetNumSamplesPerChunk. Ad esempio, dividendo la frequenza di campionamento per 150 (streaming ogni ~6,67 ms) invece di 100 (streaming ogni 10 ms) fornirà aggiornamenti del lip sync più frequenti.

  • Gestione del Buffer: Il modello con umore elabora l'audio in frame di 320 campioni (20ms a 16kHz). Assicurati che la tempistica del tuo input audio sia allineata a questo per prestazioni ottimali.

  • Ricreazione del Generatore: Per un funzionamento affidabile con i modelli Realistic, ricrea il generatore ogni volta che vuoi fornire nuovi dati audio dopo un periodo di inattività.

Prossimi Passi

Una volta impostata l'elaborazione audio, potresti voler:

  • Informarti sulle opzioni di Configurazione per ottimizzare il comportamento del tuo lip sync
  • Aggiungere animazione della risata per una maggiore espressività
  • Combinare il lip sync con animazioni facciali esistenti usando le tecniche di stratificazione descritte nella guida di Configurazione