メインコンテンツまでスキップ

オーディオ処理ガイド

このガイドでは、リップシンクジェネレーターにオーディオデータを供給するための、さまざまなオーディオ入力方法の設定方法について説明します。先にセットアップガイドを完了していることを確認してください。

オーディオ入力処理

オーディオ入力を処理する方法を設定する必要があります。オーディオソースに応じていくつかの方法があります。

このアプローチでは、マイクに向かって話しながらリアルタイムでリップシンクを実行します:

  1. Runtime Audio Importerを使用してCapturable Sound Waveを作成します
  2. オーディオのキャプチャを開始する前に、OnPopulateAudioDataデリゲートにバインドします
  3. バインドされた関数内で、Runtime Viseme GeneratorからProcessAudioDataを呼び出します
  4. マイクからのオーディオキャプチャを開始します

コピー可能なノード.

オーディオキャプチャ中のリップシンク

処理パフォーマンスのヒント

  • チャンクサイズProcessingChunkSize 設定オプションを増やすと(例:320、480、または640サンプルに)、品質や応答性への影響を最小限に抑えながら、レイテンシーを顕著に改善できます。

  • モデルタイプ:Realisticモデルを使用する場合、Highly Optimizedモデルタイプ(デフォルトで選択)に切り替えるとパフォーマンスが向上します。元のモデルは、特にノイズの多いオーディオで、わずかに品質が向上する場合があることに注意してください。

  • バッファ管理:ムード対応モデルは、320サンプルフレーム(16kHzで20ms)でオーディオを処理します。最適なパフォーマンスを得るために、オーディオ入力のタイミングがこれに合っていることを確認してください。

  • ジェネレーターの再作成:Realisticモデルで信頼性の高い動作を実現するには、非アクティブ期間の後に新しいオーディオデータを供給するたびにジェネレーターを再作成してください。説明については、トラブルシューティングのジェネレーターの再作成を参照してください。

次のステップ

オーディオ処理の設定が完了したら、次のことを行うとよいでしょう:

  • 設定オプションについて学び、リップシンクの動作を微調整する
  • 笑いアニメーションを追加して表現力を高める
  • 設定ガイドで説明されているレイヤリング技術を使用して、リップシンクを既存のフェイシャルアニメーションと組み合わせる