メインコンテンツまでスキップ

オーディオ処理ガイド

このガイドでは、Lip Sync ジェネレーターにオーディオデータを供給するためのさまざまなオーディオ入力方法の設定方法について説明します。先にセットアップガイドを完了していることを確認してください。

オーディオ入力処理

オーディオ入力を処理する方法を設定する必要があります。オーディオソースに応じて、いくつかの方法があります。

このアプローチは、マイクに向かって話しながらリアルタイムで Lip Sync を実行します:

  1. Runtime Audio Importer を使用して Capturable Sound Wave を作成します
  2. オーディオキャプチャを開始する前に、OnPopulateAudioData デリゲートにバインドします
  3. バインドされた関数内で、Runtime Viseme Generator から ProcessAudioData を呼び出します
  4. マイクからのオーディオキャプチャを開始します

コピー可能なノード.

オーディオキャプチャ中の Lip Sync

処理パフォーマンスのヒント

  • チャンクサイズ: より応答性の高いリップシンクのためにオーディオデータを小さなチャンクで処理したい場合は、SetNumSamplesPerChunk関数の計算を調整してください。例えば、サンプルレートを100で割る(10msごとにストリーミング)代わりに150で割る(約6.67msごとにストリーミング)と、より頻繁なリップシンクの更新が行われます。

  • バッファ管理: ムード対応モデルは320サンプルのフレーム(16kHzで20ms)でオーディオを処理します。最適なパフォーマンスのために、オーディオ入力のタイミングがこれに合うようにしてください。

  • ジェネレーターの再作成: リアリスティックモデルで信頼性の高い操作を行うためには、非アクティブ期間後に新しいオーディオデータを供給したい場合に毎回ジェネレーターを再作成してください。

次のステップ

オーディオ処理の設定が完了したら、以下のことも検討してください:

  • リップシンクの動作を微調整するための設定オプションについて学ぶ
  • 表現力を高めるために笑いアニメーションを追加する
  • 設定ガイドで説明されているレイヤリング技術を使用して、既存の顔面アニメーションとリップシンクを組み合わせる