본문으로 건너뛰기

오디오 처리 가이드

이 가이드는 입형 생성기에 오디오 데이터를 공급하기 위한 다양한 오디오 입력 방법을 설정하는 방법을 다룹니다. 진행하기 전에 설정 가이드를 완료했는지 확인하세요.

오디오 입력 처리

오디오 입력을 처리할 방법을 설정해야 합니다. 오디오 소스에 따라 여러 가지 방법이 있습니다.

이 접근 방식은 마이크에 말하는 동안 실시간으로 입형을 수행합니다:

  1. Runtime Audio Importer를 사용하여 캡처 가능 사운드 웨이브 생성
  2. 오디오 캡처를 시작하기 전에 OnPopulateAudioData 델리게이트에 바인딩
  3. 바인딩된 함수에서 Runtime Viseme Generator의 ProcessAudioData 호출
  4. 마이크에서 오디오 캡처 시작

복사 가능 노드.

오디오 캡처 중 입형

처리 성능 팁

  • 청크 크기: 더 반응적인 립싱크를 위해 더 작은 청크로 오디오 데이터를 처리하려면 SetNumSamplesPerChunk 함수의 계산을 조정하세요. 예를 들어, 샘플 레이트를 100으로 나누는 것(10ms마다 스트리밍) 대신 150으로 나누면(약 6.67ms마다 스트리밍) 더 빈번한 립싱크 업데이트를 제공합니다.

  • 버퍼 관리: 기분 지원 모델은 320-샘플 프레임(16kHz에서 20ms)으로 오디오를 처리합니다. 최적의 성능을 위해 오디오 입력 타이밍이 이와 일치하는지 확인하세요.

  • 제너레이터 재생성: Realistic 모델을 사용할 때 신뢰할 수 있는 작동을 위해, 비활성 기간 후 새로운 오디오 데이터를 공급하려고 할 때마다 제너레이터를 재생성하세요.

다음 단계

오디오 처리를 설정한 후에는 다음을 고려해 볼 수 있습니다:

  • 립싱크 동작을 미세 조정하기 위한 구성 옵션에 대해 알아보기
  • 표현력 향상을 위한 웃음 애니메이션 추가하기
  • 구성 가이드에 설명된 레이어링 기술을 사용하여 기존 얼굴 애니메이션과 립싱크 결합하기