Genel Bakış

Runtime MetaHuman Lip Sync, hem MetaHuman hem de özel karakterler için gerçek zamanlı, çevrimdışı ve platformlar arası dudak senkronizasyonu sağlayan bir eklentidir. Çeşitli kaynaklardan gelen ses girdilerine yanıt olarak bir karakterin dudaklarını canlandırmanıza olanak tanır; bu kaynaklar şunları içerir:
- Runtime Audio Importer's üzerinden mikrofon girişi yakalanabilir ses dalgası
- Runtime Text To Speech veya Runtime AI Chatbot Integrator'den sentezlenmiş konuşma
- Runtime Audio Importer aracılığıyla birden çok formatta akış veya içe aktarma yoluyla alınan ses verisi
- Float PCM formatında (kayan noktalı örneklerden oluşan bir dizi) herhangi bir ses verisi
Eklenti, ses girişine dayalı olarak dahili olarak vizemler (fonemlerin görsel temsilleri) oluşturur. Metin yerine doğrudan ses verileriyle çalıştığı için eklenti, İngilizce, İspanyolca, Fransızca, Almanca, Japonca, Çince, Korece, Rusça, İtalyanca, Portekizce, Arapça ve Hintçe dahil ancak bunlarla sınırlı olmamak üzere çok dilli girdiyi destekler. Kelimenin tam anlamıyla her dil desteklenir, çünkü dudak senkronizasyonu, dile özgü metin işleme yerine ses fonemlerinden oluşturulur.
Standart Model, önceden tanımlanmış bir poz varlığı kullanarak 14 visem üretir ve dudak senkronizasyonu animasyonu gerçekleştirir. Buna karşılık, Gerçekçi Modeller (yalnızca MetaHuman ve ARKit tabanlı karakterlere özgüdür), önceden tanımlanmış bir poz varlığına dayanmadan 81 yüz kontrol değişikliği oluşturur ve bu da önemli ölçüde daha gerçekçi yüz animasyonları sağlar.
Karakter Uyumluluğu
Adına rağmen, Runtime MetaHuman Lip Sync yalnızca MetaHuman'ların ötesinde geniş bir karakter yelpazesiyle çalışır:
Popüler Ticari Karakter Sistemleri
- Daz Genesis 8/9 karakterleri
- Reallusion Character Creator 3/4 (CC3/CC4) karakterleri
- Mixamo karakterleri
- ReadyPlayerMe avatarları
Animasyon Standartları Desteği
- FACS tabanlı karışım şekil sistemleri
- Apple ARKit karışım şekil standardı
- Preston Blair fonem setleri
- 3ds Max fonem sistemleri
- Yüz ifadeleri için özel morf hedeflerine sahip herhangi bir karakter
MetaHuman olmayan karakterler için Standart Model kullanıyorsanız, Özel Karakter Kurulum Kılavuzu sayfasına bakın. ARKit tabanlı karakterler için Gerçekçi Modeller kullanıyorsanız, Morf Hedefi Seti Seçimi sayfasına bakın.
Animasyon Önizlemesi
Farklı karakter türleri ve modellerde eklenti tarafından üretilen dudak senkronizasyonu animasyonunun kalitesini görmek için bu kısa animasyonlara göz atın:
Temel Özellikler
- Mikrofon girişinden gerçek zamanlı dudak senkronizasyonu
- Çevrimdışı ses işleme desteği
- Modele özgü platform desteği ile çapraz platform uyumluluğu
- Birden çok karakter sistemi ve animasyon standardı desteği
- Özel karakterler için esnek visem eşleme
- Evrensel dil desteği - ses analizi yoluyla herhangi bir konuşulan dil ile çalışır
- Gelişmiş ifade gücü için ruh haline duyarlı yüz animasyonu
- Yapılandırılabilir çıktı türleri (tam yüz veya sadece ağız kontrolleri)
- Göz kırpma ve bakış takibi için isteğe bağlı göz animasyon yardımcıları
Dudak Senkronizasyonu Modelleri
Eklenti, farklı proje ihtiyaçlarına uygun birden fazla dudak senkronizasyonu modeli sunar:
- Standart Model
- Gerçekçi Model
- Ruh Hali Etkinleştirilmiş Gerçekçi Model
Standart dudak senkronizasyon modeli, geniş karakter uyumluluğu ile verimli ve platformlar arası performans sunar:
- MetaHuman'lar ve tüm özel karakter türleriyle çalışır
- Gerçek zamanlı performans için optimize edilmiştir
- Daha düşük kaynak gereksinimleri
- Platform Desteği: Windows, Android, Android tabanlı platformlar (Meta Quest dahil)
Standart Model'i kullanmak için ek bir eklenti kurmanız gerekir. Kurulum talimatları için Ön Koşullar bölümüne bakın.
Gerçekçi dudak senkronizasyonu modeli, özellikle MetaHuman karakterleri için gelişmiş görsel doğruluk sunar:
- MetaHuman ve ARKit tabanlı karakterlerle uyumlu, gelişmiş yüz animasyonu (81 yüz kontrolü)
- Daha doğal ağız hareketleriyle yüksek görsel kalite
- Biraz daha yüksek performans gereksinimleri
- Gerçek zamanlı uygulamalar için akış ses işleme
- Sinematik deneyimler ve yakın çekim karakter etkileşimleri için idealdir
- Üç optimizasyon seviyesi: Orijinal, Yarı Optimize ve Yüksek Düzeyde Optimize
- Yapılandırılabilir morf hedef setleri (bkz. Morf Hedef Seti Seçimi)
- Platform Desteği: Windows, Mac, iOS, Linux, Android, Android tabanlı platformlar (Meta Quest dahil)
Gerçekçi Model, ana eklentiye dahildir ve kullanmak için herhangi bir ek uzantı gerektirmez.
Ruh hali destekli gerçekçi model, MetaHuman karakterleri için duyguya duyarlı yüz animasyonu sağlar:
- MetaHuman ve ARKit tabanlı karakterlerle uyumlu, ruh haline duyarlı yüz animasyonu (81 yüz kontrolü)
- 12 farklı ruh hali türü (Nötr, Mutlu, Üzgün, Kendine Güvenen vb.)
- Yapılandırılabilir ruh hali yoğunluğu (0.0 ile 1.0 arası)
- Gelişmiş senkronizasyon için ayarlanabilir ileri bakma süresi (20ms ile 200ms arası)
- Seçilebilir çıktı türleri: Tam Yüz veya Sadece Ağız kontrolleri
- Gerçek zamanlı uygulamalar için akış ses işleme
- Yapılandırılabilir morf hedef setleri (bkz. Morf Hedef Seti Seçimi)
- Platform Desteği: Windows, Mac, iOS, Linux, Android, Android tabanlı platformlar (Meta Quest dahil)
Mood-Enabled Realistic Model ana eklentiye dahildir ve kullanmak için herhangi bir ek uzantı gerektirmez.
Projenizin gereksinimlerine bağlı olarak performans, karakter uyumluluğu, görsel kalite, hedef platform ve özellik ihtiyaçlarına göre uygun modeli seçebilirsiniz.
Nasıl Çalışır
Eklenti, ses girişini aşağıdaki şekilde işler:
- Ses verisi, belirtilen kanallar ve örnekleme hızı ile float PCM formatında alınır
- Eklenti, sesi işleyerek modele bağlı olarak yüz kontrol verisi veya visemeler üretir
- Ruh hali destekli modellerde, yüz animasyonuna duygusal bağlam uygulanır
- Animasyon verisi, karakterin yüz hareketlerini gerçek zamanlı olarak yönlendirir
Performans Mimarisi
Runtime MetaHuman Lip Sync, yalnızca CPU çıkarımı kullanarak gerçek zamanlı uygulamalar için uygun, tutarlı ve düşük gecikmeli dudak senkronizasyonu sonuçları sunar. Varsayılan olarak eklenti, dudak senkronizasyonu işlemini her 10 milisaniyede bir gerçekleştirir (ayarlanabilir - tüm mevcut ayarlar için Eklenti Yapılandırması bölümüne bakın; İşleme Parça Boyutu, iş parçacığı sayısı ve diğer performans parametreleri dahil).
Model Mimarisi Genel Bakış
Dudak senkronizasyon modelleri, sesi mel-spektrogram analizi yoluyla işleyen kompakt bir transformatör tabanlı sinir ağı kullanır. Bu hafif mimari, verimli CPU çıkarımı ve minimum bellek ayak izi ile gerçek zamanlı performans için özel olarak tasarlanmıştır.
Neden CPU Çıkarımı?
Gerçek zamanlı dudak senkronizasyonu gibi küçük, sık çıkarım işlemleri için CPU işleme, GPU'ya kıyasla daha iyi gecikme özellikleri sunar. 1'lik parti boyutunda ve 10-100ms'lik çıkarım aralıklarında, PCIe aktarımları ve çekirdek başlatmalarından kaynaklanan GPU yükü, genellikle gerçek hesaplama süresini aşar. Ayrıca, oyun motorlarında GPU zaten render, gölgelendiriciler ve fizik ile doymuş durumdadır; bu da kaynak rekabeti yaratarak öngörülemeyen gecikme artışlarına neden olur.
Donanım Uyumluluğu
Eklenti, özel bir grafik donanımı gerektirmeden çoğu orta ve üst seviye CPU'da verimli bir şekilde çalışır ve masaüstü, mobil ile VR platformlarında gerçek zamanlı performans sağlar. Daha zayıf donanımlar için, Model Türü ayarını Yarı Optimize veya Yüksek Düzeyde Optimize olarak değiştirebilir veya İşleme Parça Boyutunu artırarak biraz azalan tepki süresiyle gerçek zamanlı performansı koruyabilirsiniz.
Hızlı Başlangıç
İşte karakterinizde dudak senkronizasyonunu etkinleştirmek için temel bir kurulum:
- MetaHuman karakterleri için Kurulum Kılavuzu'nu takip edin
- Özel karakterler için Özel Karakter Kurulum Kılavuzu'nu takip edin
- Tercih ettiğiniz dudak senkronizasyonu modelini seçin ve yapılandırın
- Blueprint'inizde ses giriş işlemeyi ayarlayın
- Animation Blueprint'te uygun dudak senkronizasyonu düğümünü bağlayın
- Sesi oynatın ve karakterinizin senkronize şekilde hareket ettiğini görün
Opsiyonel Göz Animasyonu
Eklenti ayrıca MetaHuman'lar için otomatik göz kırpma ve bakış takibi için isteğe bağlı yardımcılar içerir. Bunlar dudak senkronizasyonundan bağımsızdır ve tek başına veya üzerine katmanlanarak kullanılabilir. Bkz. Göz Animasyonu Yardımcıları.
Ek Kaynaklar
📦 İndirmeler ve Bağlantılar
Demo Projeleri:
İki adet kullanıma hazır demo projesi mevcuttur - ayrıntılı bilgi, indirme ve anlatımlar için özel Demo Projeleri sayfasına bakın:
- Tam AI Konuşmalı NPC İş Akışı - konuşma tanıma + LLM sohbet botu + TTS + dudak senkronizasyonu
- Temel Dudak Senkronizasyonu Demo - mikrofon girişi, ses dosyaları, TTS
Her iki demo da çapraz platformdur (Windows, Mac, Linux, iOS, Android, Meta Quest) ve paketlenmiş yapılar ile tam UE 5.6+ kaynak projeleri olarak sunulur.
🎥 Video Eğitimleri
Öne Çıkan Demolar:
Gerçekçi Model (Yüksek Kalite) Eğitimleri:
- Ses Dosyası/Tamponundan Yüksek Kaliteli Dudak Senkronizasyonu
- Ruh Hali Kontrolü ve Yerel TTS ile Yüksek Kaliteli Dudak Senkronizasyonu
- ElevenLabs ve OpenAI TTS ile Yüksek Kaliteli Dudak Senkronizasyonu
- Canlı Mikrofon ile Yüksek Kaliteli Dudak Senkronizasyonu
- ARKit Karakterleri için Yüksek Kaliteli Dudak Senkronizasyonu
Standart Model Eğitimleri:
- Standart Canlı Mikrofon Dudak Senkronizasyonu
- Yerel Metin-Konuşma ile Standart Dudak Senkronizasyonu
- ElevenLabs ve OpenAI TTS ile Standart Dudak Senkronizasyonu
Genel Kurulum:
- Demo Projesine Özel Bir MetaHuman Karakteri Ekleme
- Kurulum eğitim videosu
- MetaHuman Göz Kırpma ve Kamera Takibi
- Demo projesi tanıtımı (eski)
💬 Destek
- Özel Geliştirme: [email protected] (ekipler ve kuruluşlar için özelleştirilmiş çözümler)