Как использовать плагин с пользовательскими персонажами
Это руководство проведет вас через процесс настройки Runtime MetaHuman Lip Sync для персонажей, не являющихся MetaHuman. Этот процесс требует знакомства с концепциями анимации и риггинга. Если вам нужна помощь во внедрении этого для вашего конкретного персонажа, вы можете обратиться за профессиональной поддержкой по адресу [email protected].
Важное примечание о моделях синхронизации губ
Пользовательские персонажи поддерживаются только в стандартной (более быстрой) модели.
Модель Realistic (Higher Quality) предназначена для персонажей MetaHuman и ARKit и не может использоваться с другими пользовательскими персонажами. На протяжении этого руководства при ссылках следуйте инструкциям для Standard model из основного руководства по настройке.
Требуется дополнительный плагин: Для использования стандартной модели с пользовательскими персонажами необходимо установить дополнительный плагин Standard Lip Sync Extension, как описано в разделе «Предварительные требования» основного руководства по настройке.
Это расширение обязательно для всех реализаций пользовательских персонажей, описанных в данном руководстве.
Предварительные требования
Прежде чем начать, убедитесь, что ваш персонаж соответствует следующим требованиям:
- Имеет корректный скелет
- Содержит морф-цели (формы смешивания) для мимики лица
- Желательно наличие 10+ морф-целей, определяющих виземы (чем больше визем, тем выше качество синхронизации губ)
Плагин требует сопоставления морф-таргетов вашего персонажа со следующими стандартными виземами:
Sil -> Silence
PP -> Bilabial plosives (p, b, m)
FF -> Labiodental fricatives (f, v)
TH -> Dental fricatives (th)
DD -> Alveolar plosives (t, d)
KK -> Velar plosives (k, g)
CH -> Postalveolar affricates (ch, j)
SS -> Sibilants (s, z)
NN -> Nasal (n)
RR -> Approximant (r)
AA -> Open vowel (aa)
E -> Mid vowel (e)
IH -> Close front vowel (ih)
OH -> Close-mid back vowel (oh)
OU -> Close back vowel (ou)
Примечание: Если у вашего персонажа другой набор визем (что вполне вероятно), вам не нужны точные совпадения для каждой виземы. Часто достаточно приблизительных соответствий — например, сопоставление виземы SH вашего персонажа с виземой CH плагина будет работать эффективно, поскольку это близкие постувулярные звуки.
Справочная таблица соответствия визем
Вот соответствия между распространенными системами визем и виземами, необходимыми для плагина:
- Apple ARKit
- Системы на основе FACS
- Система Престона Блэра
- Система фонем 3ds Max
- Пользовательские персонажи (Daz Genesis 8/9, Reallusion CC3/CC4, Mixamo, ReadyPlayerMe)
ARKit предоставляет полный набор блендшейпов для анимации лица, включая несколько форм рта. Вот как сопоставить их с виземами RuntimeMetaHumanLipSync:
| RuntimeMetaHumanLipSync Viseme | Эквивалент ARKit | Заметки |
|---|---|---|
| Sil | mouthClose | Нейтральное/исходное положение |
| PP | mouthPressLeft + mouthPressRight | Для билабиальных звуков используйте обе формы сжатия вместе. |
| FF | lowerLipBiteLeft + lowerLipBiteRight (или mouthRollLower) | Нижняя губа касается верхних зубов, как при произнесении звуков «ф» и «в». |
| TH | tongueOut | ARKit имеет прямое управление языком. |
| DD | jawOpen (mild) + tongueUp (if you have tongue rig) | Язык касается альвеолярного гребня; небольшое опускание челюсти |
| KK | mouthLeft or mouthRight (mild) | Легкое подтягивание уголка рта аппроксимирует велярные звуки |
| CH | jawOpen (mild) + mouthFunnel (mild) | Комбинируйте для постальвеолярных звуков |
| SS | mouthFrown | Используйте легкое нахмуривание для сибилянтов. |
| NN | jawOpen (very mild) + mouthClose | Почти закрытый рот с легким открытием челюсти |
| RR | mouthPucker (mild) | Легкое округление для звуков "р" |
| AA | jawOpen + mouthStretchLeft + mouthStretchRight (или jawOpen + mouthOpen) | Широко открытый рот для звука "а" |
| E | jawOpen (mild) + mouthSmile | Среднеоткрытое положение с легкой улыбкой |
| IH | mouthSmile (mild) | Небольшое растягивание губ |
| OH | mouthFunnel | Округлая открытая форма |
| OU | mouthPucker | Плотно округленные губы |
FACS (Система кодирования лицевых движений) использует Единицы действия (AUs) для описания мимических движений. Многие профессиональные анимационные системы применяют подходы, основанные на FACS:
| RuntimeMetaHumanLipSync Viseme | FACS Action Units | Заметки |
|---|---|---|
| Sil | Нейтральный | Нет активных АУ |
| PP | AU23 + AU24 | Прижиматель губ + стягиватель губ |
| FF | AU22 + AU28 | Губы-воронка + втягивание губ |
| TH | AU25 (mild) + AU27 | Губы разомкнуты + растяжение рта |
| DD | AU25 + AU16 | Губы разомкнуты + депрессор нижней губы |
| KK | AU26 + AU14 | Опускание челюсти + ямочка |
| CH | AU18 + AU25 | Губы сжаты + губы разомкнуты |
| SS | AU20 | Растягиватель губ |
| NN | AU25 (very mild) | Губы слегка приоткрыты |
| RR | AU18 (mild) | Легкое поджатие губ |
| AA | AU27 + AU26 | Растяжение рта + опускание челюсти |
| E | AU25 + AU12 | Губы разомкнуты + уголки губ растянуты |
| IH | AU12 + AU25 (mild) | Подтяжка уголков губ + легкое размыкание губ |
| OH | AU27 (mild) + AU18 | Легкое растяжение рта + поджатие губ |
| OU | AU18 + AU26 (mild) | Губы вытянуты в трубочку + лёгкое опускание челюсти |
Система Престона Блэра — это классический анимационный стандарт, в котором используются описательные названия для форм рта:
| RuntimeMetaHumanLipSync Viseme | Престон Блэр | Заметки |
|---|---|---|
| Sil | Rest | Нейтральное положение рта (закрытый рот) |
| PP | MBP | Классическая форма рта "MBP" |
| FF | FV | Положение "FV" с зубами на нижней губе |
| TH | TH | Язык касается передних зубов |
| DD | D/T/N | Аналогичное положение для этих согласных |
| KK | CKG | Твердая согласная позиция |
| CH | CH/J/SH | Легкая надутость для этих звуков |
| SS | S/Z | Слегка приоткрытое положение зубов |
| NN | N/NG/L | Похоже на Д/Т, но другое положение языка. |
| RR | R | Округленные губы для звука R |
| AA | AI | Широко открытый рот |
| E | EH | Средне открытый рот |
| IH | EE | Растянуть губы |
| OH | OH | Среднее закругленное отверстие |
| OU | OO | Плотно округленные губы |
3ds Max использует фонемную систему для своего character studio.
| RuntimeMetaHumanLipSync Viseme | 3ds Max Фонема | Заметки |
|---|---|---|
| Sil | rest | Положение рта по умолчанию |
| PP | p_b_m | Прямой эквивалент |
| FF | f_v | Прямой эквивалент |
| TH | th | Прямой эквивалент |
| DD | t_d | Прямой эквивалент |
| KK | k_g | Прямой эквивалент |
| CH | sh_zh_ch | Комбинированная форма |
| SS | s_z | Прямой эквивалент |
| NN | n_l | Комбинировано для этих звуков |
| RR | r | Прямой эквивалент |
| AA | ah | Открытый гласный звук |
| E | eh | Средний гласный |
| IH | ee | Закрытый гласный переднего ряда |
| OH | oh | Огубленный гласный заднего ряда |
| OU | oo | Закрытый гласный заднего ряда |
Пользовательские персонажи с виземами или бленд-шейпами/морф-таргетами рта (Daz Genesis 8/9, Reallusion CC3/CC4, Mixamo, ReadyPlayerMe и т.д.) обычно могут быть сопоставлены с системой визем плагина с приемлемой степенью приближения.
Создание пользовательского ассета позы
Выполните следующие шаги, чтобы создать собственный ассет позы для вашего персонажа, который будет использоваться с нодой Blend Runtime MetaHuman Lip Sync:
1. Найдите Skeletal Mesh вашего персонажа
Найдите скелетную сетку, содержащую целевые морфы (формы смешивания), которые вы хотите использовать для анимации синхронизации губ. Это может быть сетка всего тела или только сетка лица, в зависимости от дизайна вашего персонажа.
2. Проверьте морф-цели и кривые
Прежде чем продолжить, убедитесь, что ваша скелетная сетка имеет соответствующие морф-цели и соответствующие кривые для анимации синхронизации губ.
Проверка морф-таргетов: Убедитесь, что ваша скелетная сетка содержит морф-таргеты (бленд-шейпы), которые можно использовать в качестве визем для анимации синхронизации губ. Большинство персонажей с поддержкой лицевой анимации должны иметь несколько морф-таргетов для фонем/визем.

Важно: Проверьте вкладку «Кривые» Этот шаг особенно важен для персонажей, экспортированных из Blender или другого стороннего программного обеспечения:
- Откройте вкладку Кривые в редакторе скелетного меша
- Проверьте, видны ли кривые, соответствующие вашим морф-таргетам
- Если вкладка «Кривые» пуста, но морф-таргеты существуют, вручную добавьте новые кривые, используя точно такие же имена, как у ваших морф-таргетов
Примечание: Эта проблема часто возникает при экспорте из Blender, когда морф-таргеты импортируются успешно, но анимационные кривые не создаются автоматически. Без соответствующих кривых анимация не будет корректно заполняться после запекания в Control Rig.
Альтернативное решение: Чтобы предотвратить эту проблему при экспорте из Blender, попробуйте включить Custom Properties и Animation в настройках экспорта FBX — это может помочь включить анимационные кривые вместе с morph targets.
3. Создайте анимацию референсной позы
- Перейдите в
Create Asset -> Create Animation -> Reference Pose - Введите описательное имя для анимационной последовательности и сохраните её в подходящем месте
- Созданная анимационная последовательность откроется автоматически, показывая пустую анимацию, воспроизводящуюся в цикле

- Нажмите кнопку
Pause, чтобы остановить воспроизведение анимации для более удобного редактирования.

4. Редактировать анимационную последовательность
- Нажмите
Edit in Sequencer->Edit with FK Control Rig - В диалоговом окне
Bake to Control Rigнажмите кнопкуBake to Control Rig, не изменяя никаких настроек

- Редактор переключится в
Animation Modeс открытой вкладкойSequencer - Установите
View Range End Timeна 0016 (это автоматически установитWorking Range Endтакже на 0016) - Перетащите правый край ползунка к правому концу окна секвенсора
5. Подготовьте анимационные кривые
- Вернитесь к ассету «Animation Sequence» и найдите морф-таргеты в списке
Curves(если они не отображаются, закройте и снова откройте ассет «Animation Sequence») - Удалите все морф-таргеты, не связанные с виземами или движениями рта, которые вы хотите использовать для синхронизации губ.
6. Спланируйте сопоставление визем
Создайте план сопоставления, чтобы привести виземы вашего персонажа к требуемому набору плагина. Например:
Sil -> Sil
PP -> FV
FF -> FV
TH -> TH
DD -> TD
KK -> KG
CH -> CH
SS -> SZ
NN -> NL
RR -> RR
AA -> AA
E -> E
IH -> IH
OH -> O
OU -> U
Обратите внимание, что допустимо иметь повторяющиеся сопоставления, если набор визем вашего персонажа не содержит точных соответствий для каждой требуемой виземы.
7. Анимируйте каждую визему
- Для каждого виземы анимируйте соответствующие кривые целевых морфов от 0.0 до 1.0
- Начинайте анимацию каждой виземы на разных кадрах
- Настройте дополнительные кривые по мере необходимости (открытие челюсти/рта, положение языка и т.д.), чтобы создать естественные формы визем
8. Создайте ассет позы
- Перейдите в
Create Asset->Pose Asset->Current Animation - Введите описательное имя для ассета поз и сохраните его в подходящем месте
- Созданный ассет поз откроется автоматически, отображая позы, такие как
Pose_0,Pose_1и т. д., каждая из которых соответствует визему - Просмотрите веса визем, чтобы убедиться, что они работают как ожидается

9. Завершите ассет позы
- Переименуйте каждую позу в соответствии с названиями визем из раздела Предварительные требования
- Удалите все неиспользуемые позы
Настройка обработки и смешивания аудио
Как только ваш ассет позы будет готов, необходимо настроить узлы обработки аудио и смешивания:
- Найдите или создайте Animation Blueprint вашего персонажа
- Настройте обработку аудио и смешивание, следуя тем же шагам, что описаны в стандартном руководстве по настройке плагина
- В узле
Blend Runtime MetaHuman Lip Syncвыберите свой собственный Pose Asset вместо стандартного ассета поз MetaHuman

Комбинирование с анимациями тела
Если вы хотите выполнять синхронизацию губ вместе с другими анимациями тела:
- Выполните те же шаги, что описаны в стандартном руководстве по плагину
- Убедитесь, что вы указали правильные названия костей для скелета шеи вашего персонажа, а не используете названия костей MetaHuman
Результаты
Вот примеры пользовательских персонажей, использующих эту настройку:



Качество синхронизации губ во многом зависит от конкретного персонажа и того, насколько хорошо настроены его виземы. Приведенные выше примеры демонстрируют работу плагина с различными типами пользовательских персонажей, имеющих разные системы визем.