跳到主要内容

音频处理指南

本指南涵盖如何设置不同的音频输入方法,以将音频数据馈送到您的唇形同步生成器。请确保在继续之前已完成设置指南

音频输入处理

您需要设置一种方法来处理音频输入。根据您的音频源,有几种方法可以实现。

此方法在对着麦克风说话时实时执行唇形同步:

  1. 使用 Runtime Audio Importer 创建一个 Capturable Sound Wave
  2. 在开始捕获音频之前,绑定到 OnPopulateAudioData 委托
  3. 在绑定的函数中,从您的 Runtime Viseme Generator 调用 ProcessAudioData
  4. 开始从麦克风捕获音频

可复制的节点

音频捕获期间的唇形同步

处理性能提示

  • 块大小:如果您希望以更小的块处理音频数据以获得更响应的唇形同步,请调整 SetNumSamplesPerChunk 函数中的计算。例如,将采样率除以 150(约每 6.67 毫秒流式传输一次)而不是 100(每 10 毫秒流式传输一次)将提供更频繁的唇形同步更新。

  • 缓冲区管理:情绪启用模型以 320 样本帧(16kHz 下为 20 毫秒)处理音频。确保您的音频输入时序与此对齐以获得最佳性能。

  • 生成器重建:对于 Realistic 模型的可靠操作,在每次希望在一段不活动期后输入新音频数据时,重新创建生成器。

后续步骤

设置好音频处理后,您可能希望:

  • 了解配置选项以微调唇形同步行为
  • 添加笑声动画以增强表现力
  • 使用配置指南中描述的分层技术将唇形同步与现有面部动画相结合