Passa al contenuto principale

Guida all'Elaborazione Audio

Questa guida spiega come configurare diversi metodi di input audio per fornire dati audio ai tuoi generatori di lip sync. Assicurati di aver completato la Guida di Configurazione prima di procedere.

Elaborazione dell'Input Audio

Devi configurare un metodo per elaborare l'input audio. Ci sono diversi modi per farlo a seconda della tua sorgente audio.

Questo approccio esegue il lip sync in tempo reale mentre si parla nel microfono:

  1. Crea una Capturable Sound Wave utilizzando Runtime Audio Importer
  2. Prima di iniziare a catturare l'audio, collega il delegato OnPopulateAudioData
  3. Nella funzione collegata, chiama ProcessAudioData dal tuo Runtime Viseme Generator
  4. Inizia a catturare l'audio dal microfono

Nodi copiabili.

Lip Sync Durante la Cattura Audio

Suggerimenti per le Prestazioni di Elaborazione

  • Dimensione del Chunk: Aumentare l'opzione di configurazione ProcessingChunkSize configuration option (es. a 320, 480, o 640 campioni) può migliorare notevolmente la latenza con un impatto minimo sulla qualità o sulla reattività.

  • Tipo di Modello: Quando si utilizzano modelli Realistic, passare al tipo di modello Altamente Ottimizzato (selezionato di default) può migliorare le prestazioni. Nota che il modello originale può produrre una qualità leggermente migliore, specialmente con audio rumoroso.

  • Gestione del Buffer: Il modello con mood elabora l'audio in frame da 320 campioni (20ms a 16kHz). Assicurati che la tempistica del tuo input audio sia allineata a questo per prestazioni ottimali.

  • Ricreazione del Generatore: Per un funzionamento affidabile con i modelli Realistic, ricrea il generatore ogni volta che vuoi fornire nuovi dati audio dopo un periodo di inattività.

Prossimi Passi

Una volta configurata l'elaborazione audio, potresti voler:

  • Informarti sulle opzioni di Configurazione per ottimizzare il comportamento del tuo lip sync
  • Aggiungere animazione della risata per una maggiore espressività
  • Combinare il lip sync con animazioni facciali esistenti utilizzando le tecniche di stratificazione descritte nella guida di Configurazione