Przejdź do głównej zawartości

Przewodnik przetwarzania audio

Ten przewodnik obejmuje konfigurację różnych metod wprowadzania danych audio, które będą zasilać generatory synchronizacji ust. Upewnij się, że ukończyłeś Przewodnik konfiguracji przed kontynuacją.

Przetwarzanie wejścia audio

Musisz skonfigurować metodę przetwarzania wejścia audio. Istnieje kilka sposobów, w zależności od źródła dźwięku.

To podejście wykonuje synchronizację ust w czasie rzeczywistym podczas mówienia do mikrofonu:

  1. Utwórz Capturable Sound Wave za pomocą Runtime Audio Importer
  2. Przed rozpoczęciem przechwytywania dźwięku, podłącz się do delegata OnPopulateAudioData
  3. W powiązanej funkcji, wywołaj ProcessAudioData z twojego Runtime Viseme Generator
  4. Rozpocznij przechwytywanie dźwięku z mikrofonu

Kopiowalne węzły.

Synchronizacja ust podczas przechwytywania audio

Wskazówki dotyczące wydajności przetwarzania

  • Rozmiar fragmentu: Zwiększenie opcji konfiguracyjnej ProcessingChunkSize configuration option (np. do 320, 480 lub 640 próbek) może zauważalnie poprawić opóźnienie przy minimalnym wpływie na jakość lub responsywność.

  • Typ modelu: Podczas używania modeli Realistycznych, przełączenie na typ modelu Highly Optimized (wybrany domyślnie) może poprawić wydajność. Należy pamiętać, że oryginalny model może dawać nieco lepszą jakość, szczególnie przy hałaśliwym dźwięku.

  • Zarządzanie buforem: Model z obsługą nastroju przetwarza dźwięk w klatkach 320-próbkowych (20ms przy 16kHz). Upewnij się, że czasowanie twojego wejścia audio jest z tym zsynchronizowane dla optymalnej wydajności.

  • Ponowne tworzenie generatora: Dla niezawodnej pracy z modelami Realistycznymi, odtwórz generator za każdym razem, gdy chcesz podać nowe dane audio po okresie bezczynności.

Następne kroki

Po skonfigurowaniu przetwarzania audio, możesz chcieć:

  • Dowiedzieć się o opcjach konfiguracji, aby dostroić zachowanie synchronizacji ust
  • Dodać animację śmiechu dla zwiększonej ekspresyjności
  • Połączyć synchronizację ust z istniejącymi animacjami twarzy przy użyciu technik warstwowania opisanych w przewodniku konfiguracji