Ana içeriğe geç

Eklentiyi kullanma

Runtime AI Chatbot Integrator iki ana işlevsellik sağlar: Metinden Metne sohbet ve Metinden Sese (TTS). Her iki özellik de benzer bir iş akışı izler:

  1. API sağlayıcı token'ınızı kaydedin
  2. Özelliğe özgü ayarları yapılandırın
  3. İstekleri gönderin ve yanıtları işleyin

Sağlayıcı Token'ını Kaydet

Herhangi bir istek göndermeden önce, API sağlayıcı token'ınızı RegisterProviderToken işlevini kullanarak kaydedin.

Blueprint'te Sağlayıcı Token'ını Kaydet

Metinden Metine Sohbet İşlevselliği

Eklenti, her sağlayıcı için iki sohbet isteği modunu destekler:

Akışsız Sohbet İstekleri

Tam yanıtı tek bir çağrıda alın.

OpenAI Sohbet İsteği Gönder

Akış Sohbet İstekleri

Daha dinamik bir etkileşim için yanıt parçalarını gerçek zamanlı olarak alın.

OpenAI Akış Sohbet İsteği Gönder

Metinden Sese (TTS) İşlevselliği

Önde gelen TTS sağlayıcılarını kullanarak metni yüksek kaliteli konuşma sesine dönüştürün. Eklenti, projenizin ihtiyaçlarına göre işleyebileceğiniz ham ses verilerini (TArray<uint8>) döndürür.

Aşağıdaki örnekler, Runtime Audio Importer eklentisi kullanılarak ses işleme ve oynatmayı gösterse de (bkz. ses içe aktarma belgeleri), Runtime AI Chatbot Integrator esnek olacak şekilde tasarlanmıştır. Eklenti yalnızca ham ses verisini döndürür ve bu veriyi ses oynatma, dosyaya kaydetme, ileri ses işleme, diğer sistemlere iletme, özel görselleştirmeler ve daha fazlası gibi özel kullanım durumunuz için nasıl işleyeceğiniz konusunda size tam özgürlük tanır.

Akışsız TTS İstekleri

Akışsız TTS istekleri, tüm metin işlendikten sonra tam ses verisini tek bir yanıt olarak döndürür. Bu yaklaşım, tam sesin beklenmesinin sorun oluşturmadığı daha kısa metinler için uygundur.

OpenAI TTS İsteği Gönder

Akış TTS İstekleri

Akış TTS, ses parçalarını oluşturuldukları gibi teslim eder, bu da tüm sesin sentezlenmesini beklemek yerine verileri artımlı olarak işlemenize olanak tanır. Bu, daha uzun metinler için algılanan gecikmeyi önemli ölçüde azaltır ve gerçek zamanlı uygulamalara olanak sağlar. ElevenLabs Akış TTS ayrıca dinamik metin oluşturma senaryoları için gelişmiş parçalı akış işlevlerini destekler.

OpenAI Akış TTS İsteği Gönder

Mevcut Sesleri Alma

Bazı TTS sağlayıcıları, mevcut sesleri programlı olarak keşfetmek için ses listeleme API'leri sunar.

Google Cloud Seslerini Al

Hata Yönetimi

Herhangi bir istek gönderirken, geri çağırmanızda potansiyel hataları ele almak için ErrorStatus'u kontrol etmek çok önemlidir. ErrorStatus, istek sırasında oluşabilecek herhangi bir sorun hakkında bilgi sağlar.

Hata Yönetimi

İstekleri İptal Etme

Eklenti, hem metinden-metne hem de TTS isteklerini devam ederken iptal etmenize olanak tanır. Bu, uzun süren bir isteği kesmek veya konuşma akışını dinamik olarak değiştirmek istediğinizde kullanışlı olabilir.

İsteği İptal Et

En İyi Uygulamalar

  1. Callback'lerinizde ErrorStatus'u kontrol ederek potansiyel hataları her zaman ele alın
  2. Her sağlayıcı için API oran limitlerinin ve maliyetlerinin farkında olun
  3. Uzun formlu veya etkileşimli konuşmalar için streaming modunu kullanın
  4. Kaynakları verimli yönetmek için artık gerekli olmayan istekleri iptal etmeyi düşünün
  5. Algılanan gecikmeyi azaltmak için daha uzun metinlerde streaming TTS kullanın
  6. Ses işleme için, Runtime Audio Importer eklentisi kullanışlı bir çözüm sunar, ancak proje ihtiyaçlarınıza göre özel işleme uygulayabilirsiniz
  7. Akıl yürütme modellerini (DeepSeek Reasoner, Grok) kullanırken, hem akıl yürütme hem de içerik çıktılarını uygun şekilde ele alın
  8. TTS özelliklerini uygulamadan önce, ses listeleme API'larını kullanarak mevcut sesleri keşfedin
  9. ElevenLabs chunked streaming için: Metin artımlı olarak oluşturulduğunda (AI yanıtları gibi) sürekli modu, önceden oluşturulmuş metin parçaları için anında modu kullanın
  10. Sürekli mod için, duyarlılık ile doğal konuşma akışı arasında denge kurmak amacıyla uygun flush zaman aşımlarını yapılandırın
  11. Uygulamanızın gerçek zamanlı gereksinimlerine göre optimal parça boyutlarını ve gönderme gecikmelerini seçin

Sorun Giderme

  • Her sağlayıcı için API kimlik bilgilerinizin doğru olduğunu doğrulayın
  • İnternet bağlantınızı kontrol edin
  • TTS özellikleriyle çalışırken kullandığınız ses işleme kütüphanelerinin (Runtime Audio Importer gibi) düzgün şekilde kurulduğundan emin olun
  • TTS yanıt verilerini işlerken doğru ses formatını kullandığınızı doğrulayın
  • Streaming TTS için, ses parçalarını doğru şekilde ele aldığınızdan emin olun
  • Akıl yürütme modelleri için, hem akıl yürütme hem de içerik çıktılarını işlediğinizden emin olun
  • Model kullanılabilirliği ve yetenekleri için sağlayıcıya özgü belgeleri kontrol edin
  • ElevenLabs chunked streaming için: Oturumu düzgün şekilde kapatmak için işiniz bittiğinde FinishChunkedStreaming'i çağırdığınızdan emin olun
  • Sürekli mod sorunları için: Metninizdeki cümle sınırlarının doğru şekilde tespit edildiğini kontrol edin
  • Gerçek zamanlı uygulamalar için: Gecikme gereksinimlerinize göre parça gönderme gecikmelerini ve flush zaman aşımlarını ayarlayın