Zum Hauptinhalt springen

Audio-Verarbeitungsleitfaden

Diese Anleitung beschreibt, wie Sie verschiedene Audioeingabemethoden einrichten, um Audiodaten an Ihre Lippen-Synchronisations-Generatoren zu übermitteln. Stellen Sie sicher, dass Sie die Einrichtungsanleitung abgeschlossen haben, bevor Sie fortfahren.

Audio-Eingabeverarbeitung

Sie müssen eine Methode zur Verarbeitung von Audioeingaben einrichten. Es gibt mehrere Möglichkeiten, dies zu tun, abhängig von Ihrer Audioquelle.

Dieser Ansatz führt die Lippensynchronisation in Echtzeit durch, während Sie ins Mikrofon sprechen:

  1. Erstellen Sie eine aufnehmbare Schallwelle mit dem Runtime Audio Importer.
  2. Bevor Sie mit der Audioaufnahme beginnen, binden Sie sich an den OnPopulateAudioData-Delegaten
  3. Rufen Sie in der gebundenen Funktion ProcessAudioData von Ihrem Runtime Viseme Generator auf
  4. Starten Sie die Audioaufnahme über das Mikrofon

Kopierbare Knoten.

Lip Sync During Audio Capture

Leistungstipps zur Verarbeitung

  • Chunk-Größe: Eine Erhöhung der ProcessingChunkSize Konfigurationsoption (z. B. auf 320, 480 oder 640 Samples) kann die Latenz spürbar verbessern, bei minimalen Auswirkungen auf Qualität oder Reaktionsfähigkeit.

  • Modelltyp: Bei Verwendung realistischer Modelle kann der Wechsel zum hochoptimierten Modelltyp (standardmäßig ausgewählt) die Leistung verbessern. Beachten Sie, dass das ursprüngliche Modell möglicherweise eine etwas bessere Qualität liefert, insbesondere bei verrauschten Audiodaten.

  • Puffer-Verwaltung: Das stimmungsfähige Modell verarbeitet Audio in 320-Sample-Frames (20 ms bei 16 kHz). Stellen Sie sicher, dass Ihr Audio-Eingabe-Timing für eine optimale Leistung darauf abgestimmt ist.

  • Generator-Neuerstellung: Für einen zuverlässigen Betrieb mit realistischen Modellen erstellen Sie den Generator jedes Mal neu, wenn Sie nach einer Phase der Inaktivität neue Audiodaten zuführen möchten. Siehe Generator-Neuerstellung im Abschnitt zur Fehlerbehebung für die Erklärung.

Nächste Schritte

Sobald Sie die Audioverarbeitung eingerichtet haben, möchten Sie vielleicht:

  • Erfahren Sie mehr über Konfigurationsoptionen, um Ihr Lippensynchronisationsverhalten fein abzustimmen
  • Fügen Sie Lachanimationen für eine verbesserte Ausdruckskraft hinzu
  • Kombinieren Sie die Lippensynchronisation mit vorhandenen Gesichtsanimationen mithilfe der im Konfigurationsleitfaden beschriebenen Schichtungstechniken