Ana içeriğe geç

Eklenti Yapılandırması

Model Yapılandırması

Standart Model Yapılandırması

Create Runtime Viseme Generator düğümü, çoğu senaryo için iyi çalışan varsayılan ayarları kullanır. Yapılandırma, Animation Blueprint karıştırma düğümü özellikleri aracılığıyla ele alınır.

Animation Blueprint yapılandırma seçenekleri için aşağıdaki Lip Sync Yapılandırması bölümüne bakın.

Gerçekçi Model Yapılandırması

Create Realistic MetaHuman Lip Sync Generator düğümü, oluşturucunun davranışını özelleştirmenize izin veren isteğe bağlı bir Configuration parametresi kabul eder:

Model Türü

Model Type ayarı, gerçekçi modelin hangi sürümünün kullanılacağını belirler:

Model TürüPerformansGörsel KaliteGürültü İşlemeÖnerilen Kullanım Senaryoları
Highly Optimized (Varsayılan)En yüksek performans, en düşük CPU kullanımıİyi kaliteArka plan gürültüsü veya ses olmayan seslerle fark edilebilir ağız hareketleri gösterebilirTemiz ses ortamları, performans kritik senaryolar
Semi-Optimizedİyi performans, orta düzeyde CPU kullanımıYüksek kaliteGürültülü sesle daha iyi kararlılıkDengeli performans ve kalite, karışık ses koşulları
OriginalModern CPU'lar üzerinde gerçek zamanlı kullanım için uygunEn yüksek kaliteArka plan gürültüsü ve ses olmayan seslerle en kararlıYüksek kaliteli prodüksiyonlar, gürültülü ses ortamları, maksimum doğruluk gerektiğinde

Performans Ayarları

Intra Op Threads: Dahili model işleme operasyonları için kullanılan iş parçacığı sayısını kontrol eder.

  • 0 (Varsayılan/Otomatik): Otomatik algılama kullanır (tipik olarak mevcut CPU çekirdeklerinin 1/4'ü, maksimum 4)
  • 1-16: Manuel olarak iş parçacığı sayısını belirtin. Daha yüksek değerler çok çekirdekli sistemlerde performansı iyileştirebilir ancak daha fazla CPU kullanır

Inter Op Threads: Farklı model operasyonlarının paralel yürütülmesi için kullanılan iş parçacığı sayısını kontrol eder.

  • 0 (Varsayılan/Otomatik): Otomatik algılama kullanır (tipik olarak mevcut CPU çekirdeklerinin 1/8'i, maksimum 2)
  • 1-8: Manuel olarak iş parçacığı sayısını belirtin. Genellikle gerçek zamanlı işleme için düşük tutulur

İşleme Parça Boyutu

Processing Chunk Size, her çıkarım adımında kaç örneğin işlendiğini belirler. Varsayılan değer 160 örnektir (16kHz'de 10ms ses):

  • Daha küçük değerler daha sık güncellemeler sağlar ancak CPU kullanımını artırır
  • Daha büyük değerler CPU yükünü azaltır ancak lip sync tepkiselliğini azaltabilir
  • Optimal hizalama için 160'ın katlarının kullanılması önerilir

İşleme Parça Boyutu Ayarlama

Mood Etkin Model Yapılandırması

Create Realistic MetaHuman Lip Sync With Mood Generator düğümü, temel gerçekçi modelin ötesinde ek yapılandırma seçenekleri sağlar:

Temel Yapılandırma

İleri Bakış Ms: Geliştirilmiş dudak senkronizasyonu doğruluğu için ileri bakış zamanlaması (milisaniye cinsinden).

  • Varsayılan: 80ms
  • Aralık: 20ms ila 200ms (20'ye bölünebilir olmalı)
  • Daha yüksek değerler daha iyi senkronizasyon sağlar ancak gecikmeyi artırır

Çıktı Türü: Hangi yüz kontrollerinin üretileceğini kontrol eder.

  • Tam Yüz: Tüm 81 yüz kontrolü (kaşlar, gözler, burun, ağız, çene, dil)
  • Sadece Ağız: Sadece ağız, çene ve dil ile ilgili kontroller

Performans Ayarları: Normal gerçekçi model ile aynı Intra Op Threads ve Inter Op Threads ayarlarını kullanır.

Ruh Hali Ayarları

Mevcut Ruh Halleri:

  • Nötr, Mutlu, Üzgün, İğrenme, Öfke, Şaşkınlık, Korku
  • Kendinden Emin, Heyecanlı, Sıkılmış, Oyunbaz, Kafası Karışmış

Ruh Hali Yoğunluğu: Ruh halinin animasyonu ne kadar güçlü etkilediğini kontrol eder (0.0 ila 1.0)

Çalışma Zamanı Ruh Hali Kontrolü

Çalışma zamanında ruh hali ayarlarını aşağıdaki fonksiyonları kullanarak ayarlayabilirsiniz:

  • Ruh Halini Ayarla: Mevcut ruh hali türünü değiştir
  • Ruh Hali Yoğunluğunu Ayarla: Ruh halinin animasyonu ne kadar güçlü etkilediğini ayarla (0.0 ila 1.0)
  • İleri Bakış Ms'yi Ayarla: Senkronizasyon için ileri bakış zamanlamasını değiştir
  • Çıktı Türünü Ayarla: Tam Yüz ve Sadece Ağız kontrolleri arasında geçiş yap

Ruh Hali Yapılandırması

Ruh Hali Seçim Kılavuzu

İçeriğinize göre uygun ruh hallerini seçin:

Ruh HaliEn İyi KullanımTipik Yoğunluk Aralığı
NötrGenel konuşma, anlatım, varsayılan durum0.5 - 1.0
MutluOlumlu içerik, neşeli diyalog, kutlamalar0.6 - 1.0
ÜzgünMelankolik içerik, duygusal sahneler, hüzünlü anlar0.5 - 0.9
İğrenmeOlumsuz tepkiler, tatsız içerik, reddetme0.4 - 0.8
ÖfkeAgresif diyalog, çatışma sahneleri, hayal kırıklığı0.6 - 1.0
ŞaşkınlıkBeklenmedik olaylar, açıklamalar, şok tepkileri0.7 - 1.0
KorkuTehdit edici durumlar, kaygı, gergin diyalog0.5 - 0.9
Kendinden EminProfesyonel sunumlar, liderlik diyaloğu, iddialı konuşma0.7 - 1.0
HeyecanlıEnerjik içerik, duyurular, coşkulu diyalog0.8 - 1.0
SıkılmışMonoton içerik, ilgisiz diyalog, yorgun konuşma0.3 - 0.7
OyunbazGündelik konuşma, mizah, hafif etkileşimler0.6 - 0.9
Kafası KarışmışSoru ağırlıklı diyalog, belirsizlik, şaşkınlık0.4 - 0.8

Animasyon Blueprint Yapılandırması

Lip Sync Yapılandırması

Blend Runtime MetaHuman Lip Sync düğümünün özellikler panelinde yapılandırma seçenekleri bulunur:

ÖzellikVarsayılanAçıklama
Interpolation Speed25Dudak hareketlerinin visemler arasında geçiş yapma hızını kontrol eder. Daha yüksek değerler daha hızlı ve ani geçişlere neden olur.
Reset Time0.2Lip Sync'in sıfırlanacağı saniye cinsinden süre. Ses durduktan sonra Lip Sync'in devam etmesini önlemek için kullanışlıdır.

Kahkaha Animasyonu

Ses içinde tespit edilen kahkahalara dinamik olarak yanıt verecek kahkaha animasyonları da ekleyebilirsiniz:

  1. Blend Runtime MetaHuman Laughter düğümünü ekleyin
  2. RuntimeVisemeGenerator değişkeninizi Viseme Generator pin'ine bağlayın
  3. Zaten lip sync kullanıyorsanız:
    • Blend Runtime MetaHuman Lip Sync düğümünün çıktısını Blend Runtime MetaHuman Laughter düğümünün Source Pose pin'ine bağlayın
    • Blend Runtime MetaHuman Laughter düğümünün çıktısını Output Pose'un Result pin'ine bağlayın
  4. Sadece kahkaha kullanıyorsanız (lip sync olmadan):
    • Kaynak pozunuzu doğrudan Blend Runtime MetaHuman Laughter düğümünün Source Pose pin'ine bağlayın
    • Çıktıyı Result pin'ine bağlayın

Blend Runtime MetaHuman Laughter

Ses içinde kahkaha tespit edildiğinde, karakteriniz buna uygun şekilde dinamik olarak animasyon yapacaktır:

Laughter

Kahkaha Yapılandırması

Blend Runtime MetaHuman Laughter düğümünün kendi yapılandırma seçenekleri bulunur:

ÖzellikVarsayılanAçıklama
Interpolation Speed25Dudak hareketlerinin kahkaha animasyonları arasında geçiş yapma hızını kontrol eder. Daha yüksek değerler daha hızlı ve ani geçişlere neden olur.
Reset Time0.2Kahkahanın sıfırlanacağı saniye cinsinden süre. Ses durduktan sonra kahkahanın devam etmesini önlemek için kullanışlıdır.
Max Laughter Weight0.7Kahkaha animasyonunun maksimum yoğunluğunu ölçeklendirir (0.0 - 1.0).
Not: Kahkaha tespiti şu anda yalnızca Standart Model ile kullanılabilir.

Mevcut Animasyonlarla Birleştirme

Lip senkronizasyonu ve kahkahayı, mevcut vücut animasyonlarını ve özel yüz animasyonlarını geçersiz kılmadan uygulamak için:

  1. Vücut animasyonlarınız ile son çıktı arasına bir Layered blend per bone düğümü ekleyin. Use Attached Parent özelliğinin true olduğundan emin olun.
  2. Katman kurulumunu yapılandırın:
    • Layer Setup dizisine 1 öğe ekleyin
    • Katman için Branch Filters'a 3 öğe ekleyin, aşağıdaki Bone Name değerleriyle:
      • FACIAL_C_FacialRoot
      • FACIAL_C_Neck2Root
      • FACIAL_C_Neck1Root
  3. Özel yüz animasyonları için önemli: Curve Blend Option'da "Use Max Value" seçin. Bu, özel yüz animasyonlarının (ifadeler, duygular vb.) lip senkronizasyonunun üzerine düzgün şekilde katmanlanmasına olanak tanır.
  4. Bağlantıları yapın:
    • Mevcut animasyonlar (örneğin BodyPose) → Base Pose girişi
    • Yüz animasyonu çıktısı (lip senkronizasyonu ve/veya kahkaha düğümlerinden) → Blend Poses 0 girişi
    • Katmanlı karıştırma düğümü → Son Result pozu

Layered Blend Per Bone

Lip Senkronizasyonu Davranışını İnce Ayarlama

Dil Çıkıntısı Kontrolü

Standart lip senkronizasyonu modelinde, belirli fonemler sırasında aşırı ileri dil hareketi fark edebilirsiniz. Dil çıkıntısını kontrol etmek için:

  1. Lip senkronizasyonu blend düğümünüzden sonra bir Modify Curve düğümü ekleyin
  2. Modify Curve düğümüne sağ tıklayın ve Add Curve Pin seçin
  3. CTRL_expressions_tongueOut adında bir curve pin ekleyin
  4. Düğümün Apply Mode özelliğini Scale olarak ayarlayın
  5. Dil uzantısını kontrol etmek için Value parametresini ayarlayın (örneğin, çıkıntıyı %20 azaltmak için 0.8)

Çene Açma Kontrolü

Gerçekçi lip senkronizasyonu, ses içeriğinize ve görsel gereksinimlerinize bağlı olarak aşırı duyarlı çene hareketleri üretebilir. Çene açma yoğunluğunu ayarlamak için:

  1. Lip senkronizasyonu blend düğümünüzden sonra bir Modify Curve düğümü ekleyin
  2. Modify Curve düğümüne sağ tıklayın ve Add Curve Pin seçin
  3. CTRL_expressions_jawOpen adında bir curve pin ekleyin
  4. Düğümün Apply Mode özelliğini Scale olarak ayarlayın
  5. Çene açma aralığını kontrol etmek için Value parametresini ayarlayın (örneğin, çene hareketini %10 azaltmak için 0.9)

Ruh Haline Özel İnce Ayarlama

Ruh hali etkin modeller için belirli duygusal ifadeleri ince ayarlayabilirsiniz:

Kaş Kontrolü:

  • CTRL_L_brow_raiseIn.ty / CTRL_R_brow_raiseIn.ty - İç kaş kaldırma
  • CTRL_L_brow_raiseOut.ty / CTRL_R_brow_raiseOut.ty - Dış kaş kaldırma
  • CTRL_L_brow_down.ty / CTRL_R_brow_down.ty - Kaş indirme

Göz İfadesi Kontrolü:

  • CTRL_L_eye_squintInner.ty / CTRL_R_eye_squintInner.ty - Göz kısma
  • CTRL_L_eye_cheekRaise.ty / CTRL_R_eye_cheekRaise.ty - Yanak kaldırma

Model Karşılaştırması ve Seçimi

Modeller Arasında Seçim Yapma

Projeniz için hangi dudak senkronizasyonu modelini kullanacağınıza karar verirken bu faktörleri göz önünde bulundurun:

DeğerlendirmeStandart ModelGerçekçi ModelDuygu Etkin Gerçekçi Model
Karakter UyumluluğuMetaHuman'lar ve tüm özel karakter türleriSadece MetaHuman'larSadece MetaHuman'lar
Görsel KaliteVerimli performansla iyi dudak senkronizasyonuDaha doğal ağız hareketleriyle geliştirilmiş gerçekçilikDuygusal ifadelerle geliştirilmiş gerçekçilik
PerformansMobil/VR dahil tüm platformlar için optimize edilmişDaha yüksek kaynak gereksinimleriDaha yüksek kaynak gereksinimleri
Özellikler14 visem, kahkaha tespiti81 yüz kontrolü, 3 optimizasyon seviyesi81 yüz kontrolü, 12 duygu durumu, yapılandırılabilir çıktı
Platform DesteğiWindows, Android, QuestWindows, Mac, iOS, LinuxWindows, Mac, iOS, Linux
Kullanım SenaryolarıGenel uygulamalar, oyunlar, VR/AR, mobilSinematik deneyimler, yakın plan etkileşimlerDuygusal hikaye anlatımı, gelişmiş karakter etkileşimi

Motor Sürümü Uyumluluğu

UE 5.2 Uyumluluk Sorunu

Unreal Engine 5.2 kullanıyorsanız, UE'nin yeniden örnekleme kütüphanesindeki bir hata nedeniyle Gerçekçi Modeller doğru çalışmayabilir. Güvenilir dudak senkronizasyonu işlevselliğine ihtiyaç duyan UE 5.2 kullanıcıları için lütfen bunun yerine Standart Model'i kullanın.

Bu sorun özellikle UE 5.2'ye özgüdür ve diğer motor sürümlerini etkilemez.

Performans Önerileri

  • Çoğu proje için, Standart Model kalite ve performans arasında mükemmel bir denge sağlar
  • MetaHuman karakterler için en yüksek görsel kaliteye ihtiyaç duyduğunuzda Gerçekçi Model'i kullanın
  • Uygulamanız için duygusal ifade kontrolü önemli olduğunda Duygu Etkin Gerçekçi Model'i kullanın
  • Modeller arasında seçim yaparken hedef platformunuzun performans kapasitelerini göz önünde bulundurun
  • Belirli kullanım durumunuz için en iyi dengeyi bulmak için farklı optimizasyon seviyelerini test edin

TTS Uyumluluğu

Model TürüYerel TTS Desteği (Runtime Text To Speech üzerinden)Harici TTS DesteğiNotlar
Standart Model✅ Tam destek✅ Tam destekTüm TTS seçenekleriyle uyumlu
Gerçekçi Model❌ Sınırlı destek✅ Tam destekONNX runtime, yerel TTS ile çakışıyor
Duygu Etkin Gerçekçi Model✅ Tam destek✅ Tam destekTüm TTS seçenekleriyle uyumlu

Sorun Giderme

Yaygın Sorunlar

Gerçekçi Modeller için Jeneratörün Yeniden Oluşturulması: Gerçekçi Modellerle güvenilir ve tutarlı çalışma için, bir hareketsizlik döneminden sonra yeni ses verisi beslemek istediğinizde jeneratörü her seferinde yeniden oluşturmanız önerilir. Bunun nedeni, sessizlik dönemlerinden sonra jeneratörlerin yeniden kullanılması durumunda dudak senkronizasyonunun çalışmayı durdurmasına neden olabilen ONNX runtime davranışıdır. Yerel TTS Uyumluluğu: Runtime Text To Speech eklentisi tarafından sağlanan Yerel TTS, ONNX çalışma zamanı çakışmaları nedeniyle şu anda düzenli Realistic modeli ile desteklenmemektedir. Ancak, hem Standard model hem de Mood-Enabled Realistic model ile tamamen uyumludur. TTS işlevselliği ile özellikle düzenli Realistic modeli kullanmanız gerekiyorsa harici TTS servislerini kullanın.

Performans Optimizasyonu:

  • Performans gereksinimlerinize bağlı olarak Realistic modeller için İşleme Parça Boyutu'nu ayarlayın
  • Hedef donanımınız için uygun iş parçacığı sayılarını kullanın
  • Tam yüz animasyonuna ihtiyaç duyulmadığında, mood-özellikli modeller için Sadece Ağız çıktı türünü kullanmayı düşünün