メインコンテンツまでスキップ

オーディオ処理ガイド

このガイドでは、リップシンクジェネレーターにオーディオデータを供給するためのさまざまなオーディオ入力方法の設定方法について説明します。先にセットアップガイドを完了していることを確認してください。

オーディオ入力処理

オーディオ入力を処理する方法を設定する必要があります。オーディオソースに応じて、いくつかの方法があります。

このアプローチでは、マイクに向かって話しながらリアルタイムでリップシンクを実行します:

  1. Runtime Audio Importerを使用してキャプチャ可能なサウンドウェーブを作成します
  2. オーディオのキャプチャを開始する前に、OnPopulateAudioDataデリゲートにバインドします
  3. バインドされた関数内で、Runtime Viseme GeneratorからProcessAudioDataを呼び出します
  4. マイクからのオーディオキャプチャを開始します

コピー可能なノード.

オーディオキャプチャ中のリップシンク

処理パフォーマンスのヒント

  • チャンクサイズ: より応答性の高いリップシンクのためにオーディオデータを小さなチャンクで処理したい場合は、SetNumSamplesPerChunk関数の計算を調整してください。例えば、サンプルレートを100で割る(10msごとにストリーミング)代わりに150で割る(約6.67msごとにストリーミング)と、より頻繁なリップシンクの更新が行われます。

  • バッファ管理: ムード対応モデルは320サンプルのフレーム(16kHzで20ms)でオーディオを処理します。最適なパフォーマンスを得るために、オーディオ入力のタイミングがこれに合うようにしてください。

  • ジェネレーターの再作成: リアリスティックモデルで信頼性の高い操作を行うためには、非アクティブ期間の後に新しいオーディオデータを供給したい場合、毎回ジェネレーターを再作成してください。

次のステップ

オーディオ処理の設定が完了したら、以下のことも検討してください:

  • リップシンクの動作を微調整するための設定オプションについて学ぶ
  • 表現力を高めるために笑いアニメーションを追加する
  • 設定ガイドで説明されているレイヤリング技術を使用して、既存の顔面アニメーションとリップシンクを組み合わせる