Zum Hauptinhalt springen

Leitfaden zur Audioverarbeitung

Dieser Leitfaden erklärt, wie Sie verschiedene Audio-Eingabemethoden einrichten, um Audiodaten an Ihre Lip-Sync-Generatoren zu liefern. Stellen Sie sicher, dass Sie den Setup-Leitfaden abgeschlossen haben, bevor Sie fortfahren.

Audio-Eingabeverarbeitung

Sie müssen eine Methode zur Verarbeitung von Audio-Eingaben einrichten. Es gibt mehrere Möglichkeiten, dies je nach Ihrer Audioquelle zu tun.

Dieser Ansatz führt Lip Sync in Echtzeit während des Sprechens in das Mikrofon durch:

  1. Erstellen Sie eine Capturable Sound Wave mit Runtime Audio Importer
  2. Binden Sie vor dem Starten der Audioaufnahme den OnPopulateAudioData-Delegate
  3. Rufen Sie in der gebundenen Funktion ProcessAudioData von Ihrem Runtime Viseme Generator auf
  4. Starten Sie die Audioaufnahme vom Mikrofon

Kopierbare Nodes.

Lip Sync während der Audioaufnahme

Tipps zur Verarbeitungsleistung

  • Chunk-Größe: Eine Erhöhung der ProcessingChunkSize Konfigurationsoption (z. B. auf 320, 480 oder 640 Abtastwerte) kann die Latenz merklich verbessern, bei minimalen Auswirkungen auf Qualität oder Reaktionsfähigkeit.

  • Modelltyp: Bei Verwendung von Realistic-Modellen kann ein Wechsel zum Hochoptimierten Modelltyp (standardmäßig ausgewählt) die Leistung verbessern. Beachten Sie, dass das ursprüngliche Modell möglicherweise eine etwas bessere Qualität liefert, insbesondere bei verrauschtem Audio.

  • Pufferverwaltung: Das stimmungsfähige Modell verarbeitet Audio in 320-Abtastwert-Frames (20 ms bei 16 kHz). Stellen Sie sicher, dass Ihr Audio-Eingabe-Timing für optimale Leistung damit übereinstimmt.

  • Generator-Neuerstellung: Für einen zuverlässigen Betrieb mit Realistic-Modellen erstellen Sie den Generator jedes Mal neu, wenn Sie nach einer Phase der Inaktivität neue Audiodaten zuführen möchten. Siehe Generator-Neuerstellung in der Fehlerbehebung für die Erklärung.

Nächste Schritte

Sobald Sie die Audioverarbeitung eingerichtet haben, möchten Sie vielleicht:

  • Mehr über Konfigurationsoptionen erfahren, um Ihr Lip-Sync-Verhalten fein abzustimmen
  • Lach-Animation für mehr Ausdruckskraft hinzufügen
  • Lip Sync mit vorhandenen Gesichtsanimationen kombinieren, indem Sie die im Konfigurationsleitfaden beschriebenen Schichtungstechniken verwenden