メインコンテンツまでスキップ

オーディオ処理ガイド

このガイドでは、リップシンクジェネレーターにオーディオデータを供給するためのさまざまなオーディオ入力方法の設定方法について説明します。先にセットアップガイドを完了していることを確認してください。

オーディオ入力処理

オーディオ入力を処理する方法を設定する必要があります。オーディオソースに応じて、いくつかの方法があります。

このアプローチでは、マイクに向かって話しながらリアルタイムでリップシンクを実行します:

  1. Runtime Audio Importerを使用してキャプチャ可能なサウンドウェーブを作成します
  2. オーディオキャプチャを開始する前に、OnPopulateAudioDataデリゲートにバインドします
  3. バインドされた関数内で、Runtime Viseme GeneratorからProcessAudioDataを呼び出します
  4. マイクからのオーディオキャプチャを開始します

コピー可能なノード

オーディオキャプチャ中のリップシンク

処理パフォーマンスのヒント

  • チャンクサイズ:より応答性の高いリップシンクのために、より小さなチャンクでオーディオデータを処理したい場合は、SetNumSamplesPerChunk関数の計算を調整してください。例えば、サンプルレートを100(10ミリ秒ごとにストリーミング)ではなく150(約6.67ミリ秒ごとにストリーミング)で割ると、より頻繁なリップシンク更新が提供されます。

  • バッファ管理:ムード対応モデルは320サンプルのフレーム(16kHzで20ミリ秒)でオーディオを処理します。最適なパフォーマンスのために、オーディオ入力のタイミングがこれに合うようにしてください。

  • ジェネレーターの再作成:リアリスティックモデルで信頼性の高い操作を行うには、非アクティブ期間の後に新しいオーディオデータを供給したい場合は、ジェネレーターを再作成してください。

次のステップ

オーディオ処理を設定したら、以下を行うことができます:

  • リップシンクの動作を微調整するための設定オプションについて学ぶ
  • 表現力を高めるために笑いアニメーションを追加する
  • 設定ガイドで説明されているレイヤリング技術を使用して、既存の顔面アニメーションとリップシンクを組み合わせる