メインコンテンツまでスキップ

オーディオ処理ガイド

このガイドでは、リップシンクジェネレーターにオーディオデータを供給するための、さまざまなオーディオ入力方法の設定方法について説明します。先にセットアップガイドを完了していることを確認してください。

音声入力処理

音声入力を処理する方法を設定する必要があります。音声ソースに応じて、いくつかの方法があります。

このアプローチは、マイクに向かって話している間、リアルタイムでリップシンクを実行します。

  1. Runtime Audio Importerを使用してキャプチャ可能なサウンドウェーブを作成する
  2. オーディオのキャプチャを開始する前に、OnPopulateAudioData デリゲートにバインドします
  3. バインドされた関数内で、ランタイムビジームジェネレーターから ProcessAudioData を呼び出します
  4. マイクからのオーディオキャプチャを開始します

コピー可能なノード

Lip Sync During Audio Capture

処理パフォーマンスのヒント

  • チャンクサイズ: ProcessingChunkSize 設定オプション を増やす(例:320、480、640サンプル)ことで、品質や応答性への影響を最小限に抑えつつ、レイテンシを顕著に改善できます。

  • モデルタイプ: リアリスティックモデルを使用する場合、高度に最適化されたモデルタイプ(デフォルトで選択)に切り替えるとパフォーマンスが向上します。元のモデルは、特にノイズの多いオーディオにおいて、わずかに品質が優れる場合があることに注意してください。

  • バッファ管理: ムード対応モデルは、オーディオを320サンプルのフレーム(16kHzで20ms)で処理します。最適なパフォーマンスを得るために、オーディオ入力のタイミングをこれに合わせてください。

  • ジェネレーターの再作成: Realisticモデルで確実に動作させるには、非アクティブ期間後に新しいオーディオデータを入力するたびにジェネレーターを再作成してください。説明については、トラブルシューティングのジェネレーターの再作成を参照してください。

次のステップ

オーディオ処理の設定が完了したら、以下のことを行いたい場合があります。

  • 設定オプションについて学び、リップシンクの動作を微調整しましょう
  • 表現力を高めるために笑いアニメーションを追加する
  • 設定ガイドで説明されているレイヤリング手法を使用して、リップシンクを既存のフェイシャルアニメーションと組み合わせる