Ana içeriğe geç

Genel Bakış

Runtime MetaHuman Lip Sync Dokümantasyonu

Runtime MetaHuman Lip Sync, hem MetaHuman hem de özel karakterler için gerçek zamanlı, çevrimdışı ve çapraz platform dudak senkronizasyonu sağlayan bir eklentidir. Bir karakterin dudaklarını, aşağıdakiler de dahil olmak üzere çeşitli kaynaklardan gelen ses girişine yanıt olarak canlandırmanıza olanak tanır:

Eklenti, ses girişine dayalı olarak dahili olarak visemler (fonemlerin görsel temsilleri) oluşturur. Metin yerine doğrudan ses verisiyle çalıştığı için, eklenti İngilizce, İspanyolca, Fransızca, Almanca, Japonca, Çince, Korece, Rusça, İtalyanca, Portekizce, Arapça ve Hintçe ile sınırlı olmamak üzere çok dilli girişi destekler. Kelimenin tam anlamıyla her dil desteklenir çünkü dudak senkronizasyonu, dile özgü metin işleme yerine ses fonemlerinden üretilir.

Standart Model, 14 visem üretir ve önceden tanımlanmış bir poz varlığı kullanarak dudak senkronizasyonu animasyonu gerçekleştirir. Buna karşılık, Gerçekçi Modeller (yalnızca MetaHuman karakterleri için) önceden tanımlanmış bir poz varlığına güvenmeden 81 yüz kontrol değişikliği oluşturarak önemli ölçüde daha gerçekçi yüz animasyonları sağlar.

Karakter Uyumluluğu

Adına rağmen, Runtime MetaHuman Lip Sync yalnızca MetaHuman'larla sınırlı kalmayan, geniş bir karakter yelpazesiyle çalışır:

Popüler Ticari Karakter Sistemleri

  • Daz Genesis 8/9 karakterleri
  • Reallusion Character Creator 3/4 (CC3/CC4) karakterleri
  • Mixamo karakterleri
  • ReadyPlayerMe avatar'ları

Animasyon Standartları Desteği

  • FACS tabanlı blendshape sistemleri
  • Apple ARKit blendshape standardı
  • Preston Blair fonem setleri
  • 3ds Max fonem sistemleri
  • Yüz ifadeleri için özel morf hedeflerine sahip herhangi bir karakter

MetaHuman olmayan karakterlerle eklentiyi kullanma konusunda ayrıntılı talimatlar için Özel Karakter Kurulum Kılavuzu'na bakın.

Animasyon Önizleme

Eklenti tarafından üretilen dudak senkronizasyonu animasyonunun kalitesini, farklı karakter türleri ve modeller arasında görmek için bu kısa animasyonları kontrol edin:

Realistic Lip Sync Example
Gerçekçi model ile MetaHuman karakteri
Standard Lip Sync Example
MetaHuman karakter ile standart model
Custom Character Lip Sync Example
Özel karakterli standart model
Custom Character Lip Sync Example
Özel karakter ile standart model

Temel Özellikler

  • Mikrofon girişinden gerçek zamanlı dudak senkronizasyonu
  • Çevrimdışı ses işleme desteği
  • Model özel platform desteği ile çapraz platform uyumluluğu
  • Birden fazla karakter sistemi ve animasyon standardı desteği
  • Özel karakterler için esnek visem haritalama
  • Evrensel dil desteği - ses analizi yoluyla herhangi bir konuşulan dilde çalışır
  • Gelişmiş ifade gücü için ruh haline duyarlı yüz animasyonu
  • Yapılandırılabilir çıktı türleri (tüm yüz veya sadece ağız kontrolleri)

Dudak Senkronizasyon Modelleri

Eklenti, farklı proje ihtiyaçlarına uygun birden fazla dudak senkronizasyon modeli sunar:

Standart dudak senkronizasyon modeli, geniş karakter uyumluluğu ile verimli, çapraz platform performansı sağlar:

  • MetaHumans ve tüm özel karakter türleri ile çalışır
  • Gerçek zamanlı performans için optimize edilmiştir
  • Daha düşük kaynak gereksinimleri
  • Yerel TTS (Runtime Text To Speech eklentisi) ile tam uyumluluk
  • Platform Desteği: Windows, Android, Android tabanlı platformlar (Meta Quest dahil)
Uzantı Eklentisi Gerekli

Standart Model'i kullanmak için ek bir uzantı eklentisi yüklemeniz gerekir. Kurulum talimatları için Önkoşullar bölümüne bakın.

Performans, karakter uyumluluğu, görsel kalite, hedef platform ve özellik ihtiyaçlarınıza göre projeniz için uygun modeli seçebilirsiniz.

TTS Uyumluluk Notu

Tüm modeller çeşitli ses giriş yöntemlerini desteklerken, normal Gerçekçi model ONNX çalışma zamanı çakışmaları nedeniyle yerel TTS ile sınırlı uyumluluğa sahiptir. Ancak, Ruh Haline Duyarlı Gerçekçi model yerel TTS ile tamamen uyumludur. Metinden sese işlevselliği için:

  • Standart Model: Tüm TTS seçenekleriyle (yerel ve harici) uyumlu
  • Gerçekçi Model: Harici TTS servisleri önerilir (OpenAI, ElevenLabs)
  • Ruh Haline Duyarlı Gerçekçi Model: Tüm TTS seçenekleriyle (yerel ve harici) uyumlu

Nasıl Çalışır

Eklenti, ses girişini aşağıdaki şekilde işler:

  1. Ses verisi, belirtilen kanallar ve örnekleme hızı ile PCM formatında float olarak alınır
  2. Eklenti, modele bağlı olarak yüz kontrol verisi veya visemler oluşturmak için sesi işler
  3. Ruh haline duyarlı modeller için, duygusal bağlam yüz animasyonuna uygulanır
  4. Animasyon verisi, karakterin yüz hareketlerini gerçek zamanlı olarak yönlendirir

Performans Mimarisi

Runtime MetaHuman Lip Sync, gerçek zamanlı uygulamalar için uygun tutarlı, düşük gecikmeli dudak senkronizasyonu sonuçları sunmak için yalnızca CPU çıkarımı kullanır. Varsayılan olarak, eklenti dudak senkronizasyonu işlemini her 10 milisaniyede bir gerçekleştirir (ayarlanabilir - tüm mevcut ayarlar için bkz. Eklenti Yapılandırması İşleme Parça Boyutu, iş parçacığı sayısı ve diğer performans parametreleri dahil).

Model Mimarisi Genel Bakış

Dudak senkronizasyonu modelleri, sesi mel-spektrogram analizi yoluyla işleyen kompakt bir transformer tabanlı sinir ağı kullanır. Bu hafif mimari, özellikle verimli CPU çıkarımı ve minimum bellek ayak izi ile gerçek zamanlı performans için tasarlanmıştır.

Neden CPU Çıkarımı?

Gerçek zamanlı dudak senkronizasyonu gibi küçük, sık çıkarım işlemleri için, CPU işleme GPU'dan daha iyi gecikme özellikleri sunar. 10-100ms çıkarım aralıklarıyla toplu iş boyutu 1'de, PCIe transferlerinden ve çekirdek başlatmalarından kaynaklanan GPU ek yükü genellikle gerçek hesaplama süresini aşar. Ayrıca, oyun motorlarında GPU zaten render, gölgelendirici ve fizik ile doymuş durumdadır, bu da öngörülemeyen gecikme artışlarına neden olan kaynak çekişmesi yaratır.

Donanım Uyumluluğu

Eklenti, özel grafik donanımı gerektirmeden masaüstü, mobil ve VR platformlarında gerçek zamanlı performans sağlayarak, çoğu orta ve üst seviye CPU'da verimli bir şekilde çalışır. Daha zayıf donanımlar için, Model Türünü Yarı Optimize veya Yüksek Optimize olarak ayarlayabilir veya İşleme Parça Boyutunu biraz azaltılmış yanıt verme süresi ile gerçek zamanlı performansı korumak için artırabilirsiniz.

Hızlı Başlangıç

Karakterinizde dudak senkronizasyonunu etkinleştirmek için temel bir kurulum:

  1. MetaHuman karakterleri için Kurulum Kılavuzunu izleyin
  2. Özel karakterler için Özel Karakter Kurulum Kılavuzunu izleyin
  3. Tercih ettiğiniz dudak senkronizasyon modelini seçin ve yapılandırın
  4. Blueprint'inizde ses girişi işlemeyi kurun
  5. Animation Blueprint'te uygun dudak senkronizasyon düğümünü bağlayın
  6. Sesi çalın ve karakterinizin duyguyla konuştuğunu görün!

Ek Kaynaklar

📦 İndirmeler ve Bağlantılar

🎥 Video Eğitimleri

Öne Çıkan Demo:

Gerçekçi Model (Yüksek Kalite) Eğitimleri:

Standart Model Eğitimleri:

Genel Kurulum:

💬 Destek