플러그인 사용 방법
이 가이드는 MetaHuman 캐릭터에 Runtime MetaHuman Lip Sync를 설정하는 과정을 안내합니다.
참고: Runtime MetaHuman Lip Sync는 MetaHuman과 커스텀 캐릭터 모두와 호환됩 니다. 이 플러그인은 다음과 같은 다양한 캐릭터 유형을 지원합니다:
- 인기 있는 상용 캐릭터 (Daz Genesis 8/9, Reallusion CC3/CC4, Mixamo, ReadyPlayerMe 등)
- FACS 기반 blendshapes를 가진 캐릭터
- ARKit blendshape 표준을 사용하는 모델
- Preston Blair 포네임 세트를 가진 캐릭터
- 3ds Max 포네임 시스템
- 얼굴 표정을 위한 커스텀 morph targets가 있는 모든 캐릭터
위의 모든 표준에 대한 비젼 매핑 참조를 포함한 커스텀 캐릭터 설정에 대한 자세한 지침은 커스텀 캐릭터 설정 가이드를 참조하세요.
필수 조건
시작하기 전에 다음 사항을 확인하세요:
- 프로젝트에서 MetaHuman 플러그인이 활성화되어 있는지
- 최소 한 명의 MetaHuman 캐릭터가 다운로드되어 프로젝트에서 사용 가능한지
- Runtime MetaHuman Lip Sync 플러그인이 설치되어 있는지
추가 플러그인:
- 오디오 캡처(예: 마이크 입력)를 사용할 계획이라면 Runtime Audio Importer 플러그인을 설치하세요.
- 텍스트 음성 변환 기능을 사용할 계획이라면 Runtime Text To Speech 플러그인을 설치하세요.
설정 과정
단계 1: 얼굴 애니메이션 Blueprint 찾기 및 수정
MetaHuman 캐릭터의 얼굴 애니메이션에 사용될 Animation Blueprint를 수정해야 합니다. 기본 MetaHuman 얼굴 Animation Blueprint는 다음 위치에 있습니다:
Content/MetaHumans/Common/Face/Face_AnimBP
Lip Sync 기능을 구현하기 위한 여러 옵션이 있습니다:
- 기본 애셋 직접 편집 (가장 간단한 옵션)
- 복제본 생성
- 커스텀 Animation Blueprint 사용
기본 Face_AnimBP
를 직접 열어 수정합니다. 변경 사항은 이 Animation Blueprint를 사용하는 모든 MetaHuman 캐릭터에 영향을 미칩니다.
참고: 이 방법은 편리하지만 기본 Animation Blueprint를 사용하는 모든 캐릭터에 영향을 줍니다.
Face_AnimBP
를 복제하고 설명이 포함된 이름을 지정합니다- 캐릭터의 Blueprint 클래스를 찾습니다 (예: "Bryan" 캐릭터의 경우
Content/MetaHumans/Bryan/BP_Bryan
) - 캐릭터 Blueprint를 열고 Face 컴포넌트를 찾습니다
- Anim Class 속성을 새로 복제한 Animation Blueprint로 변경합니다
참고: 이 방법을 사용하면 특정 캐릭터에 대해 Lip Sync를 커스터마이징하면서 다른 캐릭터는 변경하지 않을 수 있습니다.
필요한 얼굴 뼈에 접근할 수 있는 모든 Animation Blueprint에서 Lip Sync 블렌딩을 구현할 수 있습니다:
- 커스텀 Animation Blueprint를 생성하거나 기존 것을 사용합니다
- Animation Blueprint가 기본 MetaHuman의
Face_Archetype_Skeleton
(모든 MetaHuman 캐릭터에 사용되는 표준 스켈레톤)과 동일한 얼굴 뼈를 가진 스켈레톤과 작동하는지 확인합니다
참고: 이 방법은 커스텀 애니메이션 시스템과의 통합을 위한 최대 유연성을 제공합니다.
중요: Runtime MetaHuman Lip Sync 블렌딩은 기본 MetaHuman의 Face_Archetype_Skeleton
에 있는 얼굴 뼈를 포함하는 포즈에 접근할 수 있는 모든 Animation Blueprint 애셋에서 구현할 수 있습니다. 위의 옵션에 제한되지 않으며, 이들은 단지 일반적인 구현 접근 방식입니다.
단계 2: 이벤트 그래프 설정
Face Animation Blueprint를 열고 Event Graph
로 전환합니다. 오디오 데이터를 처리하고 비짐을 생성할 Runtime Viseme Generator를 생성해야 합니다.
- 아직 없는 경우
Event Blueprint Begin Play
노드를 추가합니다 Create Runtime Viseme Generator
노드를 추가하고 Begin Play 이벤트에 연결합니다- 출력을 변수(예: "VisemeGenerator")로 저장하여 그래프의 다른 부분에서 사용합니다
단계 3: 오디오 입력 처리 설정
오디오 소스에 따라 오디오 입력을 처리할 방법을 설정해야 합니다.
- 마이크 (실시간)
- 마이크 (재생)
- 텍스트 음성 변환 (로컬)
- 텍스트 음성 변환 (외부 API)
- 오디오 파일/버퍼에서
- 커스텀 오디오 소스
이 방법은 마이크에 말하는 동안 실시간으로 Lip Sync를 수행합니다:
- Runtime Audio Importer를 사용하여 Capturable Sound Wave 생성
- 오디오 캡처를 시작하기 전에
OnPopulateAudioData
델리게이트에 바인딩합니다 - 바인딩된 함수에서 Runtime Viseme Generator의
ProcessAudioData
를 호출합니다 - 마이크에서 오디오 캡처를 시작합니다
이 방법은 마이크에서 오디오를 캡처한 후 Lip Sync와 함께 재생합니다:
- Runtime Audio Importer를 사용하여 Capturable Sound Wave 생성
- 마이크에서 오디오 캡처를 시작합니다
- 캡처 가능한 사운드 웨이브를 재생하기 전에
OnGeneratePCMData
델리게이트에 바인딩합니다 - 바인딩된 함수에서 Runtime Viseme Generator의
ProcessAudioData
를 호출합니다
이 방법은 텍스트에서 음성을 합성하고 Lip Sync를 수행합니다:
- Runtime Text To Speech를 사용하여 텍스트에서 음성 생성
- Runtime Audio Importer를 사용하여 합성된 오디오 임포트
- 임포트된 사운드 웨이브를 재생하기 전에
OnGeneratePCMData
델리게이트에 바인딩합니다 - 바인딩된 함수에서 Runtime Viseme Generator의
ProcessAudioData
를 호출합니다
이 방법은 Runtime AI Chatbot Integrator 플러그인을 사용하여 AI 서비스에서 합성된 음성을 생성하고 Lip Sync를 수행합니다:
- Runtime AI Chatbot Integrator를 사용하여 외부 API(OpenAI, ElevenLabs 등)로 텍스트에서 음성 생성
- Runtime Audio Importer를 사용하여 합성된 오디오 데이터 임포트
- 임포트된 사운드 웨이브를 재생하기 전에
OnGeneratePCMData
델리게이트에 바인딩합니다 - 바인딩된 함수에서 Runtime Viseme Generator의
ProcessAudioData
를 호출합니다
이 방법은 사전 녹음된 오디오 파일 또는 오디오 버퍼를 사용하여 Lip Sync를 수행합니다:
- Runtime Audio Importer를 사용하여 디스크 또는 메모리에서 오디오 파일 임포트
- 임포트된 사운드 웨이브를 재생하기 전에
OnGeneratePCMData
델리게이트에 바인딩합니다 - 바인딩된 함수에서 Runtime Viseme Generator의
ProcessAudioData
를 호출합니다 - 임포트된 사운드 웨이브를 재생하고 Lip Sync 애니메이션을 관찰합니다
커스텀 오디오 소스의 경우 다음이 필요합니다:
- float PCM 형식의 오디오 데이터(부동 소수점 샘플 배열)
- 샘플 레이트와 채널 수
- Runtime Viseme Generator의
ProcessAudioData
를 이 매개변수와 함께 호출합니다
스트리밍 소스에서 오디오를 처리하는 예시:
단계 4: 애님 그래프 설정
이벤트 그래프 설정 후 Anim Graph
로 전환하여 비짐 생성기를 캐릭터 애니메이션에 연결합니다:
Lip Sync
- MetaHuman 얼굴을 포함하는 포즈를 찾습니다(일반적으로
Use cached pose 'Body Pose'
에서) Blend Runtime MetaHuman Lip Sync
노드를 추가합니다- 포즈를
Blend Runtime MetaHuman Lip Sync
노드의Source Pose
에 연결합니다 RuntimeVisemeGenerator
변수를Viseme Generator
핀에 연결합니다Blend Runtime MetaHuman Lip Sync
노드의 출력을Output Pose
의Result
핀에 연결합니다
오디오에서 Lip Sync가 감지되면 캐릭터가 동적으로 애니메이션됩니다:
웃음 애니메이션
오디오에서 감지된 웃음에 동적으로 반응하는 웃음 애니메이션을 추가할 수도 있습니다:
Blend Runtime MetaHuman Laughter
노드를 추가합니다RuntimeVisemeGenerator
변수를Viseme Generator
핀에 연결합니다- 이미 Lip Sync를 사용 중인 경우:
Blend Runtime MetaHuman Lip Sync
노드의 출력을Blend Runtime MetaHuman Laughter
노드의Source Pose
에 연결합니다Blend Runtime MetaHuman Laughter
노드의 출력을Output Pose
의Result
핀에 연결합니다
- Lip Sync 없이 웃음만 사용하는 경우:
- 소스 포즈를 직접
Blend Runtime MetaHuman Laughter
노드의Source Pose
에 연결합니다 - 출력을
Result
핀에 연결합니다
- 소스 포즈를 직접
오디오에서 웃음이 감지되면 캐릭터가 동적으로 애니메이션됩니다:
바디 애니메이션과 결합
기존 바디 애니메이션을 덮어쓰지 않고 Lip Sync와 웃음을 적용하려면:
- 바디 애니메이션과 최종 출력 사이에
Layered blend per bone
노드를 추가합니다.Use Attached Parent
가 true인지 확인합니다. - 레이어 설정 구성:
Layer Setup
배열에 1 항목 추가- 레이어에 대해
Branch Filters
에 다음Bone Name
으로 3 항목 추가:FACIAL_C_FacialRoot
FACIAL_C_Neck2Root
FACIAL_C_Neck1Root
- 연결:
- 기존 애니메이션(예:
BodyPose
) →Base Pose
입력 - 얼굴 애니메이션 출력(Lip Sync 및/또는 웃음 노드에서) →
Blend Poses 0
입력 - Layered blend 노드 → 최종
Result
포즈
- 기존 애니메이션(예:
동작 원리: 분기 필터는 얼굴 애니메이션 뼈를 분리하여 Lip Sync와 웃음이 얼굴 움직임과만 블렌딩되도록 하면서 원본 바디 애니메이션을 보존합니다. 이는 MetaHuman 얼굴 리그 구조와 일치하여 자연스러운 통합을 보장합니다.
참고: Lip Sync와 웃음 기능은 기존 애니메이션 설정과 비파괴적으로 작동하도록 설계되었습니다. 이들은 입 움직임에 필요한 특정 얼굴 뼈만 영향을 미치며 다른 얼굴 애니메이션은 그대로 유지합니다. 즉, 애니메이션 체인의 어느 지점에서든 안전하게 통합할 수 있습니다 - 다른 얼굴 애니메이션 전(Lip Sync/웃음이 해당 애니메이션에 의해 재정의되도록 허용) 또는 후(기존 애니메이션 위에 Lip Sync/웃음이 블렌딩되도록)에 통합할 수 있습니다. 이러한 유연성으로 인해 Lip Sync와 웃음을 눈 깜빡임, 눈썹 움직임, 감정 표현 및 기타 얼굴 애니메이션과 충돌 없이 결합할 수 있습니다.
구성
Lip Sync 구성
Blend Runtime MetaHuman Lip Sync
노드에는 속성 패널에 구성 옵션이 있습니다:
속성 | 기본값 | 설명 |
---|---|---|
Interpolation Speed | 25 | 비짐 간 입 움직임 전환 속도를 제어합니다. 값이 높을수록 더 빠르고 급격한 전환이 발생합니다. |
Reset Time | 0.2 | Lip Sync가 재설정되기까지의 시간(초)입니다. 오디오가 중지된 후 Lip Sync가 계속되는 것을 방지하는 데 유용합니다. |
웃음 구성
Blend Runtime MetaHuman Laughter
노드에는 자체 구성 옵션이 있습니다:
속성 | 기본값 | 설명 |
---|---|---|
Interpolation Speed | 25 | 웃음 애니메이션 간 입 움직임 전환 속도를 제어합니다. 값이 높을수록 더 빠르고 급격한 전환이 발생합니다. |
Reset Time | 0.2 | 웃음이 재설정되기까지의 시간(초)입니다. 오디오가 중지된 후 웃음이 계속되는 것을 방지하는 데 유용합니다. |
Max Laughter Weight | 0.7 | 웃음 애니메이션의 최대 강도를 조절합니다(0.0 - 1.0). |