Zum Hauptinhalt springen

Audio-Verarbeitungsleitfaden

Dieser Leitfaden behandelt die Einrichtung verschiedener Audioeingabemethoden, um Audiodaten an Ihre Lippen-Sync-Generatoren zu liefern. Stellen Sie sicher, dass Sie den Setup Guide abgeschlossen haben, bevor Sie fortfahren.

Audioeingabeverarbeitung

Sie müssen eine Methode zur Verarbeitung der Audioeingabe einrichten. Es gibt mehrere Möglichkeiten, je nach Ihrer Audioquelle.

Dieser Ansatz führt den Lippen-Sync in Echtzeit durch, während Sie in das Mikrofon sprechen:

  1. Erstellen Sie eine Capturable Sound Wave mit Runtime Audio Importer
  2. Binden Sie sich an den OnPopulateAudioData-Delegaten, bevor Sie mit der Audioaufnahme beginnen
  3. Rufen Sie in der gebundenen Funktion ProcessAudioData von Ihrem Runtime Viseme Generator auf
  4. Starten Sie die Audioaufnahme vom Mikrofon

Kopierbare Nodes.

Lip Sync During Audio Capture

Verarbeitungsleistungs-Tipps

  • Chunk-Größe: Das Erhöhen der ProcessingChunkSize-Konfigurationsoption (z.B. auf 320, 480 oder 640 Samples) kann die Latenz spürbar verbessern, mit minimalen Auswirkungen auf Qualität oder Reaktionsfähigkeit.

  • Modelltyp: Bei Verwendung von Realistic Models kann das Umschalten auf den Highly Optimized model type (standardmäßig ausgewählt) die Leistung verbessern. Beachten Sie, dass das Originalmodell möglicherweise eine etwas bessere Qualität liefert, insbesondere bei verrauschtem Audio.

  • Pufferverwaltung: Das mood-enabled model verarbeitet Audio in 320-Sample-Frames (20ms bei 16kHz). Stellen Sie sicher, dass Ihr Audioeingabe-Timing dafür optimiert ist.

  • Generator-Neuerstellung: Für einen zuverlässigen Betrieb mit Realistic Models erstellen Sie den Generator jedes Mal neu, wenn Sie nach einer Inaktivitätsphase neue Audiodaten zuführen möchten.

Nächste Schritte

Sobald Sie die Audioverarbeitung eingerichtet haben, möchten Sie vielleicht:

  • Erfahren Sie mehr über Konfigurationsoptionen, um Ihr Lippen-Sync-Verhalten fein abzustimmen
  • Lach-Animation für mehr Ausdruckskraft hinzufügen
  • Lippen-Sync mit bestehenden Gesichtsanimationen kombinieren, indem Sie die im Konfigurationsleitfaden beschriebenen Layering-Techniken verwenden