Ses İşleme Kılavuzu

Bu kılavuz, dudak senkronizasyonu jeneratörlerinize ses verisi beslemek için farklı ses giriş yöntemlerini nasıl kuracağınızı kapsar. Devam etmeden önce Kurulum Kılavuzu'nu tamamladığınızdan emin olun.

Ses Giriş İşleme

Ses girişini işlemek için bir yöntem kurmanız gerekmektedir. Bunu yapmanın ses kaynağınıza bağlı olarak birkaç yolu vardır.

Bu yaklaşım, mikrofonla konuşurken dudak senkronizasyonunu gerçek zamanlı olarak gerçekleştirir:

Standart Model
Gerçekçi Model
Ruh Hali Etkinleştirilmiş Gerçekçi Model

Runtime Audio Importer kullanarak bir Capturable Sound Wave oluşturun
Ses yakalamaya başlamadan önce, OnPopulateAudioData temsilcisine bağlanın
Bağlanan fonksiyon içinde, Runtime Viseme Generator'ınızdan ProcessAudioData fonksiyonunu çağırın
Mikrofondan ses yakalamaya başlayın

Kopyalanabilir düğümler.

Ses Yakalama Sırasında Dudak Senkronizasyonu

Gerçekçi Model, Standart Model ile aynı ses işleme iş akışını kullanır, ancak VisemeGenerator yerine RealisticLipSyncGenerator değişkeni ile çalışır.

Kopyalanabilir düğümler.

Ses Yakalama Sırasında Gerçekçi Dudak Senkronizasyonu

Ruh Hali Etkinleştirilmiş Model aynı ses işleme iş akışını kullanır, ancak MoodMetaHumanLipSyncGenerator değişkeni ve ek ruh hali yapılandırma yetenekleri ile birlikte gelir.

Kopyalanabilir düğümler.

Ses Yakalama Sırasında Ruh Hali Etkinleştirilmiş Dudak Senkronizasyonu

Bu yaklaşım, bir mikrofondan ses yakalar, ardından dudak senkronizasyonu ile geri oynatır:

Standart Model
Gerçekçi Model
Duygu Etkin Gerçekçi Model

Runtime Audio Importer kullanarak Capturable Sound Wave oluşturun
Mikrofondan ses yakalamayı başlatın
Yakalanabilir ses dalgasını oynatmadan önce, onun OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyonda, Runtime Viseme Generator'ınızdan ProcessAudioData'yı çağırın

Kopyalanabilir düğümler.

Ses Oynatma Sırasında Dudak Senkronizasyonu

Gerçekçi Model, Standart Model ile aynı ses işleme iş akışını kullanır, ancak VisemeGenerator yerine RealisticLipSyncGenerator değişkeni ile.

Kopyalanabilir düğümler.

Ses Oynatma Sırasında Gerçekçi Dudak Senkronizasyonu

Duygu Etkin Model aynı ses işleme iş akışını kullanır, ancak MoodMetaHumanLipSyncGenerator değişkeni ve ek duygu yapılandırma yetenekleri ile.

Kopyalanabilir düğümler.

Ses Oynatma Sırasında Duygu Etkin Dudak Senkronizasyonu

Normal
Streaming

Bu yaklaşım, yerel TTS kullanarak metinden konuşma sentezler ve dudak senkronizasyonu gerçekleştirir:

Standart Model
Gerçekçi Model
Duygu Etkin Gerçekçi Model

Metinden konuşma oluşturmak için Runtime Text To Speech kullanın
Sentezlenen sesi içe aktarmak için Runtime Audio Importer kullanın
İçe aktarılan ses dalgasını oynatmadan önce, OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyonda, Runtime Viseme Generator'ınızdan ProcessAudioData işlevini çağırın

Kopyalanabilir düğümler.

Sentezlenen Konuşmadan Dudak Senkronizasyonu

Metinden konuşma oluşturmak için Runtime Text To Speech kullanın
Sentezlenen sesi içe aktarmak için Runtime Audio Importer kullanın
İçe aktarılan ses dalgasını oynatmadan önce, OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyonda, Duygu Etkin Dudak Senkronizasyonu Oluşturucunuzdan ProcessAudioData işlevini çağırın
Metin içeriğine veya istenen duygusal ifadeye dayalı olarak duygu ayarlarını yapılandırın

Kopyalanabilir düğümler.

Yerel TTS'den Duygu Etkin Dudak Senkronizasyonu

Duygu Entegrasyonlu TTS:

TTS oluşturmadan önce veya sırasında uygun duyguları ayarlayın
Metnin duygusal tonuyla eşleşecek şekilde duygu yoğunluğunu ayarlayın
Daha uzun metin içeriğinin farklı bölümleri için farklı duygular kullanın

Bu yaklaşım, gerçek zamanlı dudak senkronizasyonu ile akışlı metinden sese sentez kullanır:

Standard Model
Realistic Model
Mood-Enabled Realistic Model

Metinden akışlı konuşma oluşturmak için Runtime Text To Speech kullanın
Sentezlenen sesi içe aktarmak için Runtime Audio Importer kullanın
Akışlı ses dalgasını oynatmadan önce, onun OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyonda, Runtime Viseme Generator'ınızdan ProcessAudioData fonksiyonunu çağırın

Kopyalanabilir düğümler.

Lip Sync From Synthesized Streaming Speech

Metinden akışlı konuşma oluşturmak için Runtime Text To Speech kullanın
Sentezlenen sesi içe aktarmak için Runtime Audio Importer kullanın
Akışlı ses dalgasını oynatmadan önce, onun OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyonda, Mood-Enabled Lip Sync Generator'ınızdan ProcessAudioData fonksiyonunu çağırın
Gerekirse akış sırasında ruh hali ayarlarını dinamik olarak ayarlayın

Kopyalanabilir düğümler.

Mood-Enabled Lip Sync From Streaming Local TTS

Normal
Akış

Bu yaklaşım, AI servislerinden (OpenAI veya ElevenLabs) sentezlenmiş konuşma oluşturmak ve dudak senkronizasyonu gerçekleştirmek için Runtime AI Chatbot Integrator eklentisini kullanır:

Standart Model
Gerçekçi Model
Duygu Etkin Gerçekçi Model

Harici API'ler (OpenAI, ElevenLabs, vb.) kullanarak metinden konuşma oluşturmak için Runtime AI Chatbot Integrator kullanın
Sentezlenmiş ses verilerini içe aktarmak için Runtime Audio Importer kullanın
İçe aktarılan ses dalgasını oynatmadan önce, OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyonda, Runtime Viseme Generator'ınızdan ProcessAudioData çağırın

Kopyalanabilir düğümler.

Harici Olarak Sentezlenmiş Konuşmadan Dudak Senkronizasyonu

Gerçekçi Model, Standart Model ile aynı ses işleme iş akışını kullanır, ancak VisemeGenerator yerine RealisticLipSyncGenerator değişkeni ile.

Kopyalanabilir düğümler.

Harici Olarak Sentezlenmiş Konuşmadan Gerçekçi Dudak Senkronizasyonu

Duygu Etkin Model aynı ses işleme iş akışını kullanır, ancak MoodMetaHumanLipSyncGenerator değişkeni ve ek duygu yapılandırma yetenekleri ile.

Kopyalanabilir düğümler.

Harici Olarak Sentezlenmiş Konuşmadan Duygu Etkin Dudak Senkronizasyonu

Bu yaklaşım, AI servislerinden (OpenAI veya ElevenLabs) sentezlenmiş akış konuşması üretmek ve dudak senkronizasyonu gerçekleştirmek için Runtime AI Chatbot Integrator eklentisini kullanır:

Standart Model
Gerçekçi Model
Ruh Durumu Etkin Gerçekçi Model

Akış TTS API'lerine (ElevenLabs Streaming API gibi) bağlanmak için Runtime AI Chatbot Integrator kullanın
Sentezlenmiş ses verilerini içe aktarmak için Runtime Audio Importer kullanın
Akış ses dalgasını oynatmadan önce, onun OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyon içinde, Runtime Viseme Generator'ınızdan ProcessAudioData çağırın

Kopyalanabilir düğümler.

Harici Olarak Sentezlenmiş Akış Konuşmasından Dudak Senkronizasyonu

Gerçekçi Model, Standart Model ile aynı ses işleme iş akışını kullanır, ancak VisemeGenerator yerine RealisticLipSyncGenerator değişkeni ile.

Kopyalanabilir düğümler.

Harici Olarak Sentezlenmiş Akış Konuşmasından Gerçekçi Dudak Senkronizasyonu

Ruh Durumu Etkin Model aynı ses işleme iş akışını kullanır, ancak MoodMetaHumanLipSyncGenerator değişkeni ve ek ruh durumu yapılandırma yetenekleri ile.

Kopyalanabilir düğümler.

Harici Olarak Sentezlenmiş Akış Konuşmasından Ruh Durumu Etkin Dudak Senkronizasyonu

Bu yaklaşım, dudak senkronizasyonu için önceden kaydedilmiş ses dosyalarını veya ses arabelleklerini kullanır:

Standart Model
Gerçekçi Model
Duygu Etkin Gerçekçi Model

Diskten veya bellekten bir ses dosyasını içe aktarmak için Runtime Audio Importer kullanın
İçe aktarılan ses dalgasını oynatmadan önce, onun OnGeneratePCMData temsilcisine bağlanın
Bağlanan fonksiyon içinde, Runtime Viseme Generator'ınızdan ProcessAudioData'yı çağırın
İçe aktarılan ses dalgasını oynatın ve dudak senkronizasyon animasyonunu gözlemleyin

Kopyalanabilir düğümler.

Ses Dosyasından Dudak Senkronizasyonu

Gerçekçi Model, Standart Model ile aynı ses işleme iş akışını kullanır, ancak VisemeGenerator yerine RealisticLipSyncGenerator değişkeni ile.

Kopyalanabilir düğümler.

Ses Dosyasından Gerçekçi Dudak Senkronizasyonu

Duygu Etkin Model aynı ses işleme iş akışını kullanır, ancak MoodMetaHumanLipSyncGenerator değişkeni ve ek duygu yapılandırma yetenekleri ile.

Kopyalanabilir düğümler.

Ses Dosyasından Duygu Etkin Dudak Senkronizasyonu

Bir arabellekten akış ses verisi için şunlara ihtiyacınız var:

Standart Model
Realistic Model
Mood-Enabled Realistic Model

Akış kaynağınızdan float PCM formatında ses verisi (kayan noktalı örneklerden oluşan bir dizi) mevcut olmalı (veya daha fazla formatı desteklemek için Runtime Audio Importer kullanın)
Örnekleme hızı ve kanal sayısı
Ses parçaları mevcut oldukça, Runtime Viseme Generator'ınızdan ProcessAudioData'yı bu parametrelerle çağırın

Kopyalanabilir düğümler.

Akış Kaynağından Dudak Senkronizasyonu

Gerçekçi Model, Standart Model ile aynı ses işleme iş akışını kullanır, ancak VisemeGenerator yerine RealisticLipSyncGenerator değişkeni ile çalışır.

Kopyalanabilir düğümler.

Realistic Lip Sync From Streaming Source

Duygu Etkin Model aynı ses işleme iş akışını kullanır, ancak MoodMetaHumanLipSyncGenerator değişkeni ve ek duygu yapılandırma yetenekleri ile geliştirilmiştir.

Kopyalanabilir düğümler.

Mood-Enabled Lip Sync From Streaming Source

Not: Akış ses kaynakları kullanırken, bozuk ses oynatmayı önlemek için ses oynatma zamanlamasını uygun şekilde yönettiğinizden emin olun. Daha fazla bilgi için Streaming Sound Wave dokümantasyonuna bakın.

İşleme Performans İpuçları

Yığın Boyutu: Daha duyarlı dudak senkronizasyonu için ses verilerini daha küçük yığınlarda işlemek isterseniz, SetNumSamplesPerChunk fonksiyonundaki hesaplamayı ayarlayın. Örneğin, örnekleme hızını 100'e bölmek (her ~10 ms'de akış) yerine 150'ye bölmek (her ~6.67 ms'de akış) daha sık dudak senkronizasyonu güncellemeleri sağlayacaktır.
Tampon Yönetimi: Duygu etkin model, sesi 320-örnek karelerde işler (16kHz'de 20ms). Optimum performans için ses giriş zamanlamanızın buna uyumlu olduğundan emin olun.
Üreteç Yeniden Oluşturma: Gerçekçi modellerle güvenilir çalışma için, bir hareketsizlik döneminden sonra yeni ses verisi beslemek istediğinizde üreteci her seferinde yeniden oluşturun.

Sonraki Adımlar

Ses işlemenizi kurduktan sonra şunları yapmak isteyebilirsiniz:

Dudak senkronizasyonu davranışınızı hassas şekilde ayarlamak için Yapılandırma seçenekleri hakkında bilgi edinin
Gelişmiş ifade gücü için kahkaha animasyonu ekleyin
Yapılandırma kılavuzunda açıklanan katmanlama tekniklerini kullanarak dudak senkronizasyonunu mevcut yüz animasyonlarıyla birleştirin

Ses Giriş İşleme​

İşleme Performans İpuçları​

Sonraki Adımlar​

Ses Giriş İşleme

İşleme Performans İpuçları

Sonraki Adımlar