Ana içeriğe geç

Eklenti Yapılandırması

Model Yapılandırması

Standart Model Yapılandırması

Create Runtime Viseme Generator düğümü, çoğu senaryo için iyi çalışan varsayılan ayarları kullanır. Yapılandırma, Animation Blueprint karıştırma düğümü özellikleri aracılığıyla ele alınır.

Animation Blueprint yapılandırma seçenekleri için aşağıdaki Lip Sync Configuration bölümüne bakın.

Gerçekçi Model Yapılandırması

Create Realistic MetaHuman Lip Sync Generator düğümü, oluşturucunun davranışını özelleştirmenize olanak tanıyan isteğe bağlı bir Configuration parametresi kabul eder:

Model Türü

Model Type ayarı, gerçekçi modelin hangi sürümünün kullanılacağını belirler:

Model TürüPerformansGörsel KaliteGürültü İşlemeÖnerilen Kullanım Senaryoları
Highly Optimized (Varsayılan)En yüksek performans, en düşük CPU kullanımıİyi kaliteArka plan gürültüsü veya ses dışı seslerle fark edilebilir ağız hareketleri gösterebilirTemiz ses ortamları, performans kritik senaryolar
Semi-Optimizedİyi performans, orta düzeyde CPU kullanımıYüksek kaliteGürültülü sesle daha iyi kararlılıkDengeli performans ve kalite, karışık ses koşulları
OriginalModern CPU'lar için gerçek zamanlı kullanıma uygunEn yüksek kaliteArka plan gürültüsü ve ses dışı seslerle en kararlıYüksek kaliteli prodüksiyonlar, gürültülü ses ortamları, maksimum doğruluk gerektiğinde

Performans Ayarları

Intra Op Threads: Dahili model işleme işlemleri için kullanılan iş parçacığı sayısını kontrol eder.

  • 0 (Varsayılan/Otomatik): Otomatik algılama kullanır (tipik olarak mevcut CPU çekirdeklerinin 1/4'ü, maksimum 4)
  • 1-16: Manuel olarak iş parçacığı sayısını belirtin. Daha yüksek değerler çok çekirdekli sistemlerde performansı iyileştirebilir ancak daha fazla CPU kullanır

Inter Op Threads: Farklı model işlemlerinin paralel yürütülmesi için kullanılan iş parçacığı sayısını kontrol eder.

  • 0 (Varsayılan/Otomatik): Otomatik algılama kullanır (tipik olarak mevcut CPU çekirdeklerinin 1/8'i, maksimum 2)
  • 1-8: Manuel olarak iş parçacığı sayısını belirtin. Genellikle gerçek zamanlı işleme için düşük tutulur

İşleme Parça Boyutu

Processing Chunk Size, her bir çıkarım adımında kaç örneğin işlendiğini belirler. Varsayılan değer 160 örnektir (16kHz'de 10ms ses):

  • Daha küçük değerler daha sık güncellemeler sağlar ancak CPU kullanımını artırır
  • Daha büyük değerler CPU yükünü azaltır ancak dudak senkronizasyonu yanıt hızını azaltabilir
  • Optimal hizalama için 160'ın katlarının kullanılması önerilir

Setting Processing Chunk Size

Ruh Hali Etkin Model Yapılandırması

Create Realistic MetaHuman Lip Sync With Mood Generator düğümü, temel gerçekçi modelin ötesinde ek yapılandırma seçenekleri sağlar:

Temel Yapılandırma

İleri Bakış Ms: Geliştirilmiş dudak senkronizasyonu doğruluğu için ileri bakış zamanlaması.

  • Varsayılan: 80ms
  • Aralık: 20ms ila 200ms (20'ye bölünebilir olmalı)
  • Daha yüksek değerler daha iyi senkronizasyon sağlar ancak gecikmeyi artırır

Çıktı Türü: Hangi yüz kontrollerinin üretildiğini kontrol eder.

  • Tam Yüz: Tüm 81 yüz kontrolü (kaşlar, gözler, burun, ağız, çene, dil)
  • Sadece Ağız: Sadece ağız, çene ve dil ile ilgili kontroller

Performans Ayarları: Normal gerçekçi modelle aynı Intra Op Threads ve Inter Op Threads ayarlarını kullanır.

Ruh Hali Ayarları

Mevcut Ruh Halleri:

  • Nötr, Mutlu, Üzgün, İğrenme, Öfke, Şaşkınlık, Korku
  • Kendinden Emin, Heyecanlı, Sıkılmış, Oyunbaz, Kafası Karışmış

Ruh Hali Yoğunluğu: Ruh halinin animasyonu ne kadar güçlü etkilediğini kontrol eder (0.0 ila 1.0)

Çalışma Zamanı Ruh Hali Kontrolü

Çalışma zamanında ruh hali ayarlarını aşağıdaki işlevleri kullanarak ayarlayabilirsiniz:

  • Ruh Halini Ayarla: Mevcut ruh hali türünü değiştir
  • Ruh Hali Yoğunluğunu Ayarla: Ruh halinin animasyonu ne kadar güçlü etkilediğini ayarla (0.0 ila 1.0)
  • İleri Bakış Ms'yi Ayarla: Senkronizasyon için ileri bakış zamanlamasını değiştir
  • Çıktı Türünü Ayarla: Tam Yüz ve Sadece Ağız kontrolleri arasında geçiş yap

Ruh Hali Yapılandırması

Ruh Hali Seçim Rehberi

İçeriğinize göre uygun ruh hallerini seçin:

Ruh HaliEn İyi KullanımTipik Yoğunluk Aralığı
NötrGenel konuşma, anlatım, varsayılan durum0.5 - 1.0
MutluOlumlu içerik, neşeli diyalog, kutlamalar0.6 - 1.0
ÜzgünMelankolik içerik, duygusal sahneler, kasvetli anlar0.5 - 0.9
İğrenmeOlumsuz tepkiler, tatsız içerik, reddetme0.4 - 0.8
ÖfkeAgresif diyalog, çatışma sahneleri, hayal kırıklığı0.6 - 1.0
ŞaşkınlıkBeklenmedik olaylar, açıklamalar, şok tepkileri0.7 - 1.0
KorkuTehdit edici durumlar, kaygı, gergin diyalog0.5 - 0.9
Kendinden EminProfesyonel sunumlar, liderlik diyaloğu, iddialı konuşma0.7 - 1.0
HeyecanlıEnerjik içerik, duyurular, coşkulu diyalog0.8 - 1.0
SıkılmışMonoton içerik, ilgisiz diyalog, yorgun konuşma0.3 - 0.7
OyunbazGündelik konuşma, mizah, hafif etkileşimler0.6 - 0.9
Kafası KarışmışSoru ağırlıklı diyalog, belirsizlik, şaşkınlık0.4 - 0.8

Animation Blueprint Yapılandırması

Lip Sync Yapılandırması

Blend Runtime MetaHuman Lip Sync düğümünün özellikler panelinde yapılandırma seçenekleri bulunur:

ÖzellikVarsayılanAçıklama
Enterpolasyon Hızı25Dudak hareketlerinin visemler arasında geçiş yapma hızını kontrol eder. Daha yüksek değerler daha hızlı ve ani geçişlere neden olur.
Sıfırlama Süresi0.2Dudak senkronizasyonunun sıfırlandığı saniye cinsinden süre. Bu, ses durduktan sonra dudak senkronizasyonunun devam etmesini önlemek için kullanışlıdır.

Kahkaha Animasyonu

Ayrıca ses içinde tespit edilen kahkahalara dinamik olarak yanıt verecek kahkaha animasyonları da ekleyebilirsiniz:

  1. Blend Runtime MetaHuman Laughter düğümünü ekleyin
  2. RuntimeVisemeGenerator değişkeninizi Viseme Generator pin'ine bağlayın
  3. Eğer zaten dudak senkronizasyonu kullanıyorsanız:
    • Blend Runtime MetaHuman Lip Sync düğümünün çıkışını Blend Runtime MetaHuman Laughter düğümünün Source Pose pin'ine bağlayın
    • Blend Runtime MetaHuman Laughter düğümünün çıkışını Output Pose'un Result pin'ine bağlayın
  4. Eğer sadece kahkaha kullanıyorsanız (dudak senkronizasyonu olmadan):
    • Kaynak pozunuzu doğrudan Blend Runtime MetaHuman Laughter düğümünün Source Pose pin'ine bağlayın
    • Çıkışı Result pin'ine bağlayın

Blend Runtime MetaHuman Laughter

Ses içinde kahkaha tespit edildiğinde, karakteriniz buna göre dinamik olarak animasyonlanacaktır:

Laughter

Kahkaha Yapılandırması

Blend Runtime MetaHuman Laughter düğümünün kendi yapılandırma seçenekleri vardır:

ÖzellikVarsayılanAçıklama
İnterpolasyon Hızı25Dudak hareketlerinin kahkaha animasyonları arasında ne kadar hızlı geçiş yaptığını kontrol eder. Daha yüksek değerler daha hızlı ve ani geçişlere neden olur.
Sıfırlama Süresi0.2Kahkahanın sıfırlandığı saniye cinsinden süre. Bu, ses durduktan sonra kahkahanın devam etmesini önlemek için kullanışlıdır.
Maksimum Kahkaha Ağırlığı0.7Kahkaha animasyonunun maksimum yoğunluğunu ölçeklendirir (0.0 - 1.0).

Not: Kahkaha tespiti şu anda yalnızca Standart Model ile kullanılabilir.

Mevcut Animasyonlarla Birleştirme

Dudak senkronizasyonu ve kahkahayı mevcut vücut animasyonları ve özel yüz animasyonlarıyla birlikte, onları geçersiz kılmadan uygulamak için:

  1. Vücut animasyonlarınız ile son çıkış arasına bir Layered blend per bone düğümü ekleyin. Use Attached Parent seçeneğinin true olduğundan emin olun.
  2. Katman kurulumunu yapılandırın:
    • Layer Setup dizisine 1 öğe ekleyin
    • Katman için Branch Filters'a aşağıdaki Bone Name değerleriyle 3 öğe ekleyin:
      • FACIAL_C_FacialRoot
      • FACIAL_C_Neck2Root
      • FACIAL_C_Neck1Root
  3. Özel yüz animasyonları için önemli: Curve Blend Option'da "Use Max Value" seçin. Bu, özel yüz animasyonlarının (ifadeler, duygular vb.) dudak senkronizasyonunun üzerine düzgün şekilde katmanlanmasına olanak tanır.
  4. Bağlantıları yapın:
    • Mevcut animasyonlar (örneğin BodyPose) → Base Pose girişi
    • Yüz animasyon çıkışı (dudak senkronizasyonu ve/veya kahkaha düğümlerinden) → Blend Poses 0 girişi
    • Katmanlı karıştırma düğümü → Son Result poz

Layered Blend Per Bone

Dudak Senkronizasyonu Davranışını İnce Ayarlama

Dil Çıkıntısı Kontrolü

Standart dudak senkronizasyonu modelinde, belirli fonemler sırasında aşırı dil ileri hareketi fark edebilirsiniz. Dil çıkıntısını kontrol etmek için:

  1. Dudak senkronizasyonu blend node'unuzdan sonra bir Modify Curve node'u ekleyin
  2. Modify Curve node'una sağ tıklayın ve Add Curve Pin seçeneğini seçin
  3. CTRL_expressions_tongueOut adında bir curve pin ekleyin
  4. Node'un Apply Mode özelliğini Scale olarak ayarlayın
  5. Dil uzantısını kontrol etmek için Value parametresini ayarlayın (örneğin, çıkıntıyı %20 azaltmak için 0.8)

Çene Açma Kontrolü

Gerçekçi dudak senkronizasyonu, ses içeriğinize ve görsel gereksinimlerinize bağlı olarak aşırı duyarlı çene hareketleri üretebilir. Çene açma yoğunluğunu ayarlamak için:

  1. Dudak senkronizasyonu blend node'unuzdan sonra bir Modify Curve node'u ekleyin
  2. Modify Curve node'una sağ tıklayın ve Add Curve Pin seçeneğini seçin
  3. CTRL_expressions_jawOpen adında bir curve pin ekleyin
  4. Node'un Apply Mode özelliğini Scale olarak ayarlayın
  5. Çene açma aralığını kontrol etmek için Value parametresini ayarlayın (örneğin, çene hareketini %10 azaltmak için 0.9)

Ruh Haline Özel İnce Ayarlar

Ruh hali etkin modeller için belirli duygusal ifadeleri ince ayar yapabilirsiniz:

Kaş Kontrolü:

  • CTRL_expressions_browRaiseInL / CTRL_expressions_browRaiseInR - İç kaş kaldırma
  • CTRL_expressions_browRaiseOuterL / CTRL_expressions_browRaiseOuterR - Dış kaş kaldırma
  • CTRL_expressions_browDownL / CTRL_expressions_browDownR - Kaş indirme

Göz İfadesi Kontrolü:

  • CTRL_expressions_eyeSquintInnerL / CTRL_expressions_eyeSquintInnerR - Göz kısma
  • CTRL_expressions_eyeCheekRaiseL / CTRL_expressions_eyeCheekRaiseR - Yanak kaldırma

Model Karşılaştırması ve Seçimi

Modeller Arasında Seçim Yapma

Projeniz için hangi dudak senkronizasyonu modelini kullanacağınıza karar verirken bu faktörleri göz önünde bulundurun:

DeğerlendirmeStandart ModelGerçekçi ModelRuh Hali Etkin Gerçekçi Model
Karakter UyumluluğuMetaHumans ve tüm özel karakter türleriSadece MetaHumansSadece MetaHumans
Görsel KaliteVerimli performansla iyi dudak senkronizasyonuDaha doğal ağız hareketleriyle geliştirilmiş gerçekçilikDuygusal ifadelerle geliştirilmiş gerçekçilik
PerformansMobil/VR dahil tüm platformlar için optimize edilmişDaha yüksek kaynak gereksinimleriDaha yüksek kaynak gereksinimleri
Özellikler14 visem, kahkaha tespiti81 yüz kontrolü, 3 optimizasyon seviyesi81 yüz kontrolü, 12 ruh hali, yapılandırılabilir çıktı
Platform DesteğiWindows, Android, QuestWindows, Mac, iOS, LinuxWindows, Mac, iOS, Linux
Kullanım SenaryolarıGenel uygulamalar, oyunlar, VR/AR, mobilSinematik deneyimler, yakın plan etkileşimlerDuygusal hikaye anlatımı, gelişmiş karakter etkileşimi

Motor Sürüm Uyumluluğu

UE 5.2 Uyumluluk Sorunu

Unreal Engine 5.2 kullanıyorsanız, UE'nin yeniden örnekleme kütüphanesindeki bir hata nedeniyle Gerçekçi Modeller doğru çalışmayabilir. UE 5.2 kullanıcıları için güvenilir dudak senkronizasyonu işlevselliğine ihtiyaç duyuyorsanız, lütfen Standart Model'i kullanın.

Bu sorun yalnızca UE 5.2'ye özgüdür ve diğer motor sürümlerini etkilemez.

Performans Önerileri

  • Çoğu proje için, Standart Model kalite ve performans arasında mükemmel bir denge sağlar
  • MetaHuman karakterleriniz için en yüksek görsel kaliteye ihtiyaç duyduğunuzda Gerçekçi Model'i kullanın
  • Uygulamanız için duygusal ifade kontrolü önemli olduğunda Duygu Etkin Gerçekçi Model'i kullanın
  • Modeller arasında seçim yaparken hedef platformunuzun performans kapasitelerini göz önünde bulundurun
  • Belirli kullanım durumunuz için en iyi dengeyi bulmak için farklı optimizasyon seviyelerini test edin

TTS Uyumluluğu

Model TürüYerel TTS Desteği (Runtime Text To Speech aracılığıyla)Harici TTS DesteğiNotlar
Standart Model✅ Tam destek✅ Tam destekTüm TTS seçenekleriyle uyumlu
Gerçekçi Model❌ Sınırlı destek✅ Tam destekONNX çalışma zamanı yerel TTS ile çakışıyor
Duygu Etkin Gerçekçi Model✅ Tam destek✅ Tam destekTüm TTS seçenekleriyle uyumlu

Sorun Giderme

Yaygın Sorunlar

Gerçekçi Modeller için Üreteç Yeniden Oluşturma: Gerçekçi Modellerle güvenilir ve tutarlı çalışma için, bir hareketsizlik döneminden sonra yeni ses verisi beslemek istediğinizde üreteci her seferinde yeniden oluşturmanız önerilir. Bunun nedeni, sessizlik dönemlerinden sonra üreteçleri yeniden kullanırken dudak senkronizasyonunun çalışmayı durdurmasına neden olabilen ONNX çalışma zamanı davranışıdır.

Yerel TTS Uyumluluğu: Runtime Text To Speech eklentisi tarafından sağlanan Yerel TTS, ONNX çalışma zamanı çakışmaları nedeniyle şu anda normal Gerçekçi model ile desteklenmemektedir. Ancak, hem Standart model hem de Duygu Etkin Gerçekçi model ile tamamen uyumludur. TTS işlevselliği ile özellikle normal Gerçekçi modele ihtiyacınız varsa harici TTS hizmetlerini kullanın.

Bozulmuş Dudak Senkronizasyonu Tepkiselliği: Streaming Sound Wave veya Capturable Sound Wave kullanırken dudak senkronizasyonunun zamanla daha az tepkili hale geldiğini yaşarsanız, bu bellek birikiminden kaynaklanıyor olabilir. Varsayılan olarak, bellek her yeni ses eklendiğinde yeniden tahsis edilir. Bu sorunu önlemek için, biriken belleği serbest bırakmak üzere ReleaseMemory işlevini periyodik olarak, örneğin her 30 saniyede bir çağırın.

Performans Optimizasyonu:

  • Performans gereksinimlerinize bağlı olarak Gerçekçi modeller için İşleme Parça Boyutunu ayarlayın
  • Hedef donanımınız için uygun iş parçacığı sayılarını kullanın
  • Tam yüz animasyonuna ihtiyaç duyulmadığında, duyu etkin modeller için Yalnızca Ağız çıktı türünü kullanmayı düşünün