Genel Bakış

Runtime MetaHuman Lip Sync, hem MetaHuman hem de özel karakterler için gerçek zamanlı, çevrimdışı ve çapraz platform dudak senkronizasyonu sağlayan bir eklentidir. Bir karakterin dudaklarını, aşağıdakiler de dahil olmak üzere çeşitli kaynaklardan gelen ses girişine yanıt olarak canlandırmanıza olanak tanır:
- Runtime Audio Importer'ın yakalanabilir ses dalgası aracılığıyla mikrofon girişi
- Runtime Text To Speech veya Runtime AI Chatbot Integrator'dan sentezlenmiş konuşma
- Runtime Audio Importer aracılığıyla birden fazla formatta akışlanan veya içe aktarılan ses verisi
- Float PCM formatındaki (kayan noktalı örneklerden oluşan bir dizi) herhangi bir ses verisi
Eklenti dahili olarak, ses girişine dayalı olarak visemleri (fonemlerin görsel temsilleri) oluşturur. Metin yerine doğrudan ses verisiyle çalıştığı için, eklenti İngilizce, İspanyolca, Fransızca, Almanca, Japonca, Çince, Korece, Rusça, İtalyanca, Portekizce, Arapça ve Hintçe dahil olmak üzere çok dilli girişi destekler. Kelimenin tam anlamıyla her dil desteklenir çünkü dudak senkronizasyonu, dile özgü metin işleme yerine ses fonemlerinden üretilir.
Standart Model, 14 visem üretir ve önceden tanımlanmış bir poz varlığı kullanarak dudak senkronizasyonu animasyonu gerçekleştirir. Buna karşılık, Gerçekçi Modeller (yalnızca MetaHuman karakterleri için) önceden tanımlanmış bir poz varlığına güvenmeden 81 yüz kontrol değişikliği oluşturarak önemli ölçüde daha gerçekçi yüz animasyonları sağlar.
Karakter Uyumluluğu
Adına rağmen, Runtime MetaHuman Lip Sync yalnızca MetaHuman'ların ötesinde geniş bir karakter yelpazesiyle çalışır:
Popüler Ticari Karakter Sistemleri
- Daz Genesis 8/9 karakterleri
- Reallusion Character Creator 3/4 (CC3/CC4) karakterleri
- Mixamo karakterleri
- ReadyPlayerMe avatar'ları
Animasyon Standartları Desteği
- FACS tabanlı blendshape sistemleri
- Apple ARKit blendshape standardı
- Preston Blair fonem setleri
- 3ds Max fonem sistemleri
- Yüz ifadeleri için özel morf hedeflerine sahip herhangi bir karakter
MetaHuman olmayan karakterlerle eklentiyi kullanma hakkında ayrıntılı talimatlar için Özel Karakter Kurulum Kılavuzu'na bakın.
Animasyon Önizlemesi
Eklenti tarafından üretilen dudak senkronizasyonu animasyonunun kalitesini farklı karakter türleri ve modeller arasında görmek için bu kısa animasyonları kontrol edin:




Temel Özellikler
- Mikrofon girişinden gerçek zamanlı dudak senkronizasyonu
- Çevrimdışı ses işleme desteği
- Model özel platform desteği ile çapraz platform uyumluluğu
- Birden fazla karakter sistemi ve animasyon standardı desteği
- Özel karakterler için esnek visem haritalama
- Evrensel dil desteği - ses analizi yoluyla herhangi bir konuşulan dilde çalışır
- Gelişmiş ifade gücü için ruh hali farkında yüz animasyonu
- Yapılandırılabilir çıktı türleri (tam yüz veya sadece ağız kontrolleri)
Dudak Senkronizasyon Modelleri
Eklenti, farklı proje ihtiyaçlarına uygun birden fazla dudak senkronizasyon modeli sunar:
- Standart Model
- Gerçekçi Model
- Ruh Hati Etkin Gerçekçi Model
Standart dudak senkronizasyon modeli, geniş karakter uyumluluğu ile verimli, çapraz platform performansı sağlar:
- MetaHumans ve tüm özel karakter türleriyle çalışır
- Gerçek zamanlı performans için optimize edilmiştir
- Daha düşük kaynak gereksinimleri
- Yerel TTS (Runtime Text To Speech eklentisi) ile tam uyumluluk
- Platform Desteği: Windows, Android, Android tabanlı platformlar (Meta Quest dahil)
Standart Model'i kullanmak için ek bir uzantı eklentisi yüklemeniz gerekir. Kurulum talimatları için Önkoşullar bölümüne bakın.
Gerçekçi dudak senkronizasyon modeli, özellikle MetaHuman karakterleri için gelişmiş görsel kalite sunar:
- Gelişmiş yüz animasyonuna sahip MetaHuman ve ARKit tabanlı karakterlerle uyumlu (81 yüz kontrolü)
- Daha doğal ağız hareketleriyle daha yüksek görsel kalite
- Biraz daha yüksek performans gereksinimleri
- Sınırlı yerel TTS desteği (harici TTS servisleri önerilir)
- Sinematik deneyimler ve yakın plan karakter etkileşimleri için ideal
- Platform Desteği: Windows, Mac, iOS, Linux, Android, Android tabanlı platformlar (Meta Quest dahil)
- Üç optimizasyon seviyesi: Orijinal, Yarı Optimize ve Yüksek Optimize
- Yapılandırılabilir morf hedef setleri (bkz. Morf Hedef Seti Seçimi)
Gerçekçi Model ana eklentiye dahildir ve kullanmak için herhangi bir ek uzantı gerektirmez.
Ruh hali etkin gerçekçi model, MetaHuman karakterleri için duygu farkında yüz animasyonu sağlar:
- Ruh hali duyarlı yüz animasyonuna sahip MetaHuman ve ARKit tabanlı karakterlerle uyumlu
- 12 farklı ruh hali türü (Nötr, Mutlu, Üzgün, Kendinden Emin, vb.)
- Yapılandırılabilir ruh hali yoğunluğu (0.0 ila 1.0)
- Gelişmiş senkronizasyon için ayarlanabilir öngörü zamanlaması (20ms ila 200ms)
- Seçilebilir çıktı türleri: Tam Yüz veya Sadece Ağız kontrolleri
- Gerçek zamanlı uygulamalar için akış ses işleme
- Yapılandırılabilir morf hedef setleri (bkz. Morf Hedef Seti Seçimi)
- Platform Desteği: Windows, Mac, iOS, Linux, Android, Android tabanlı platformlar (Meta Quest dahil)
Ruh Hati Etkin Model, duygusal ifade kontrolü gerektiren uygulamalar için ideal olan, ayarlanabilir öngörü zamanlaması ve seçici kontrol çıktısı gibi gelişmiş özellikler içerir.
Performans, karakter uyumluluğu, görsel kalite, hedef platform ve özellik ihtiyaçlarınıza göre projeniz için uygun modeli seçebilirsiniz.
Tüm modeller çeşitli ses giriş yöntemlerini desteklerken, normal Gerçekçi model ONNX çalışma zamanı çakışmaları nedeniyle yerel TTS ile sınırlı uyumluluğa sahiptir. Ancak, Ruh Hati Etkin Gerçekçi model yerel TTS ile tamamen uyumludur. Metinden sese işlevselliği için:
- Standart Model: Tüm TTS seçenekleriyle uyumlu (yerel ve harici)
- Gerçekçi Model: Harici TTS servisleri önerilir (OpenAI, ElevenLabs)
- Ruh Hati Etkin Gerçekçi Model: Tüm TTS seçenekleriyle uyumlu (yerel ve harici)
Nasıl Çalışır
Eklenti, ses girişini aşağıdaki şekilde işler:
- Ses verisi, belirtilen kanallar ve örnekleme hızı ile PCM formatında float olarak alınır
- Eklenti, modele bağlı olarak yüz kontrol verisi veya visemler üretmek için sesi işler
- Ruh hali etkin modeller için, duygusal bağlam yüz animasyonuna uygulanır
- Animasyon verisi, karakterin yüz hareketlerini gerçek zamanlı olarak yönlendirir
Performans Mimarisi
Runtime MetaHuman Lip Sync, gerçek zamanlı uygulamalar için uygun tutarlı, düşük gecikmeli dudak senkronizasyonu sonuçları sunmak için yalnızca CPU çıkarımı kullanır. Varsayılan olarak, eklenti dudak senkronizasyonu işlemini her 10 milisaniyede bir gerçekleştirir (ayarlanabilir - tüm mevcut ayarlar için İşleme Parça Boyutu, iş parçacığı sayısı ve diğer performans parametreleri dahil Eklenti Yapılandırmasına bakın).
Model Mimarisi Genel Bakış
Dudak senkronizasyon modelleri, sesi mel-spektrogram analizi yoluyla işleyen kompakt bir transformer tabanlı sinir ağı kullanır. Bu hafif mimari, özellikle verimli CPU çıkarımı ve minimum bellek ayak izi ile gerçek zamanlı performans için tasarlanmıştır.
Neden CPU Çıkarımı?
Gerçek zamanlı dudak senkronizasyonu gibi küçük, sık çıkarım işlemleri için, CPU işleme GPU'dan daha iyi gecikme özellikleri sunar. Toplu iş boyutu 1 ve 10-100ms çıkarım aralıklarında, PCIe transferlerinden ve çekirdek başlatmalarından kaynaklanan GPU ek yükü genellikle gerçek hesaplama süresini aşar. Ayrıca, oyun motorlarında GPU zaten render, gölgelendirici ve fizik ile doymuş durumdadır, bu da öngörülemeyen gecikme artışlarına neden olan kaynak çekişmesi yaratır.
Donanım Uyumluluğu
Eklenti, masaüstü, mobil ve VR platformları arasında gerçek zamanlı performans sağlayarak, özel grafik donanımı gerektirmeden çoğu orta ve üst seviye CPU'da verimli bir şekilde çalışır. Daha zayıf donanımlar için, Model Türünü Yarı Optimize veya Yüksek Optimize olarak ayarlayabilir veya biraz azaltılmış yanıt hızıyla gerçek zamanlı performansı korumak için İşleme Parça Boyutunu artırabilirsiniz.
Hızlı Başlangıç
Karakterinizde dudak senkronizasyonunu etkinleştirmek için temel bir kurulum:
- MetaHuman karakterleri için Kurulum Kılavuzunu izleyin
- Özel karakterler için Özel Karakter Kurulum Kılavuzunu izleyin
- Tercih ettiğiniz dudak senkronizasyon modelini seçin ve yapılandırın
- Blueprint'inizde ses girişi işlemeyi kurun
- Animation Blueprint'te uygun dudak senkronizasyon düğümünü bağlayın
- Ses çalın ve karakterinizin duyguyla konuştuğunu görün!
Ek Kaynaklar
📦 İndirmeler ve Bağlantılar
Demo Projeler:
- Konuşmadan Konuşmaya Demo (Tam AI İş Akışı):
- Paketlenmiş demo indir (Windows) ⭐ YENİ
- Kaynak dosyaları indir (UE 5.6) ⭐ YENİ
- Tam konuşma tanıma + AI sohbet botu + TTS + dudak senkronizasyonu iş akışı
- Gerektirir: Bu eklenti + Runtime Audio Importer + Runtime Speech Recognizer + Runtime AI Chatbot Integrator, isteğe bağlı: Runtime Text To Speech
- Temel Dudak Senkronizasyonu Demo:
- Paketlenmiş demo indir (Windows)
- Kaynak dosyaları indir (UE 5.6)
- Temel iş akışları: mikrofon girişi, ses dosyaları, TTS
- Gerektirir: Bu eklenti + Runtime Audio Importer, isteğe bağlı: Text To Speech / AI Chatbot
- Standart model küçük bir uzantı eklentisi gerektirir (bkz. burada)
🎥 Video Eğitimleri
Öne Çıkan Demolar:
Gerçekçi Model (Yüksek Kalite) Eğitimleri:
- Ruh Hati Kontrolü ve Yerel TTS ile Yüksek Kaliteli Dudak Senkronizasyonu
- ElevenLabs ve OpenAI TTS ile Yüksek Kaliteli Dudak Senkronizasyonu
- Yüksek Kaliteli Canlı Mikrofon Dudak Senkronizasyonu
Standart Model Eğitimleri:
- Standart Canlı Mikrofon Dudak Senkronizasyonu
- Yerel Metinden Sese ile Standart Dudak Senkronizasyonu
- ElevenLabs ve OpenAI TTS ile Standart Dudak Senkronizasyonu
Genel Kurulum:
💬 Destek
- Discord destek sunucusu
- Özel Geliştirme: [email protected] (ekip ve organizasyonlar için özel çözümler)