Przejdź do głównej zawartości

Jak korzystać z wtyczki

Runtime AI Chatbot Integrator oferuje dwie główne funkcjonalności: czat Tekst-do-Tekstu oraz Tekst-na-Mowę (TTS). Obie funkcje działają według podobnego schematu:

  1. Zarejestruj token dostawcy API
  2. Skonfiguruj ustawienia specyficzne dla funkcji
  3. Wysyłaj żądania i przetwarzaj odpowiedzi

Rejestracja tokena dostawcy

Przed wysłaniem jakichkolwiek żądań, zarejestruj token dostawcy API za pomocą funkcji RegisterProviderToken.

Register Provider Token in Blueprint

Funkcjonalność czatu tekst-tekst

Wtyczka obsługuje dwa tryby żądań czatu dla każdego dostawcy:

Niestrumieniowe żądania czatu

Pobierz pełną odpowiedź w jednym wywołaniu.

Wyślij żądanie czatu OpenAI

Żądania Czatu w Strumieniu

Otrzymuj fragmenty odpowiedzi w czasie rzeczywistym dla bardziej dynamicznej interakcji.

Wyślij Żądanie Czatu w Strumieniu OpenAI

Funkcjonalność Text-to-Speech (TTS)

Konwertuj tekst na wysokiej jakości dźwięk mowy, korzystając z wiodących dostawców TTS. Wtyczka zwraca surowe dane audio (TArray<uint8>), które możesz przetworzyć zgodnie z potrzebami swojego projektu.

Podczas gdy poniższe przykłady demonstrują przetwarzanie audio do odtwarzania przy użyciu wtyczki Runtime Audio Importer (zobacz dokumentację importowania audio), Runtime AI Chatbot Integrator jest zaprojektowany tak, aby był elastyczny. Wtyczka po prostu zwraca surowe dane audio, dając Ci pełną swobodę w ich przetwarzaniu dla konkretnego przypadku użycia, co może obejmować odtwarzanie dźwięku, zapisywanie do pliku, dalsze przetwarzanie audio, przesyłanie do innych systemów, niestandardowe wizualizacje i wiele więcej.

Niestrumieniowe żądania TTS

Niestrumieniowe żądania TTS zwracają kompletne dane audio w jednej odpowiedzi po całkowitym przetworzeniu tekstu. To podejście jest odpowiednie dla krótszych tekstów, gdzie oczekiwanie na kompletny dźwięk nie stanowi problemu.

Wyślij żądanie OpenAI TTS

Żądania TTS w trybie strumieniowym

Streaming TTS dostarcza fragmenty audio w miarę ich generowania, pozwalając na przetwarzanie danych przyrostowo zamiast czekać na syntezę całego audio. Znacząco redukuje to postrzegane opóźnienie dla dłuższych tekstów i umożliwia aplikacje działające w czasie rzeczywistym.

Wyślij żądanie OpenAI Streaming TTS

Obsługa błędów

Podczas wysyłania jakichkolwiek żądań, kluczowe jest obsługiwanie potencjalnych błędów poprzez sprawdzanie ErrorStatus w twoim wywołaniu zwrotnym. ErrorStatus dostarcza informacji o wszelkich problemach, które mogą wystąpić podczas żądania.

Obsługa błędów

Anulowanie żądań

Wtyczka pozwala na anulowanie zarówno żądań tekst-na-tekst, jak i TTS, gdy są one w trakcie przetwarzania. Może to być przydatne, gdy chcesz przerwać długotrwałe żądanie lub dynamicznie zmienić przebieg rozmowy.

Anuluj żądanie

Najlepsze praktyki

  1. Zawsze obsługuj potencjalne błędy, sprawdzając ErrorStatus w swoim callbacku
  2. Zwracaj uwagę na limity szybkości API i koszty
  3. Używaj trybu strumieniowania dla długich lub interaktywnych konwersacji
  4. Rozważ anulowanie żądań, które nie są już potrzebne, aby efektywnie zarządzać zasobami
  5. Używaj strumieniowego TTS dla dłuższych tekstów, aby zmniejszyć postrzegane opóźnienie
  6. Do przetwarzania audio, wtyczka Runtime Audio Importer oferuje wygodne rozwiązanie, ale możesz zaimplementować własne przetwarzanie w oparciu o potrzeby projektu

Rozwiązywanie problemów

  • Sprawdź, czy Twoje dane uwierzytelniające API są poprawne
  • Sprawdź swoje połączenie internetowe
  • Upewnij się, że wszystkie używane biblioteki do przetwarzania audio (takie jak Runtime Audio Importer) są poprawnie zainstalowane podczas pracy z funkcjami TTS
  • Sprawdź, czy używasz poprawnego formatu audio podczas przetwarzania danych odpowiedzi TTS
  • W przypadku strumieniowego TTS upewnij się, że poprawnie obsługujesz fragmenty audio