Pular para o conteúdo principal

Como usar o plugin

O Runtime AI Chatbot Integrator oferece duas funcionalidades principais: chat Texto-para-Texto e Texto-para-Voz (TTS). Ambos os recursos seguem um fluxo de trabalho similar:

  1. Registrar seu token de provedor de API
  2. Configurar definições específicas do recurso
  3. Enviar solicitações e processar respostas

Registrar Token do Provedor

Antes de enviar qualquer solicitação, registre seu token de provedor de API usando a função RegisterProviderToken.

Registrar Token do Provedor em Blueprint

Funcionalidade de Chat Texto-para-Texto

O plugin suporta dois modos de requisição de chat para cada provedor:

Requisições de Chat Não-Streaming

Recupera a resposta completa em uma única chamada.

Enviar Requisição de Chat OpenAI

Solicitações de Chat em Streaming

Receba partes da resposta em tempo real para uma interação mais dinâmica.

Enviar Solicitação de Chat em Streaming OpenAI

Funcionalidade Text-to-Speech (TTS)

Converta texto em áudio de fala de alta qualidade usando os principais provedores de TTS. O plugin retorna dados de áudio brutos (TArray<uint8>) que você pode processar de acordo com as necessidades do seu projeto.

Enquanto os exemplos abaixo demonstram o processamento de áudio para reprodução usando o plugin Runtime Audio Importer (veja a documentação de importação de áudio), o Runtime AI Chatbot Integrator foi projetado para ser flexível. O plugin simplesmente retorna os dados de áudio brutos, dando a você total liberdade em como processá-los para seu caso de uso específico, o que pode incluir reprodução de áudio, salvamento em arquivo, processamento adicional de áudio, transmissão para outros sistemas, visualizações personalizadas e mais.

Requisições TTS Não-Streaming

Requisições TTS não-streaming retornam os dados de áudio completos em uma única resposta após todo o texto ter sido processado. Essa abordagem é adequada para textos mais curtos onde esperar pelo áudio completo não é problemático.

Enviar Requisição OpenAI TTS

Solicitações de TTS em Streaming

O TTS em Streaming entrega partes do áudio conforme são geradas, permitindo que você processe os dados incrementalmente em vez de esperar pela síntese completa do áudio. Isso reduz significativamente a latência percebida para textos longos e possibilita aplicações em tempo real.

Enviar Solicitação de TTS em Streaming da OpenAI

Tratamento de Erros

Ao enviar qualquer solicitação, é crucial lidar com possíveis erros verificando o ErrorStatus em seu callback. O ErrorStatus fornece informações sobre quaisquer problemas que possam ocorrer durante a solicitação.

Tratamento de Erros

Cancelando Solicitações

O plugin permite que você cancele solicitações de texto-para-texto e TTS enquanto elas estão em andamento. Isso pode ser útil quando você deseja interromper uma solicitação de longa duração ou alterar o fluxo da conversa dinamicamente.

Cancel Request

Melhores Práticas

  1. Sempre trate possíveis erros verificando o ErrorStatus em seu callback
  2. Esteja atento aos limites de taxa e custos da API
  3. Use o modo de streaming para conversas longas ou interativas
  4. Considere cancelar requisições que não são mais necessárias para gerenciar recursos eficientemente
  5. Utilize TTS com streaming para textos longos e reduzir a latência percebida
  6. Para processamento de áudio, o plugin Runtime Audio Importer oferece uma solução conveniente, mas você pode implementar processamento personalizado conforme as necessidades do seu projeto

Solução de Problemas

  • Verifique se suas credenciais de API estão corretas
  • Verifique sua conexão com a internet
  • Certifique-se que quaisquer bibliotecas de processamento de áudio (como Runtime Audio Importer) estejam corretamente instaladas ao trabalhar com recursos TTS
  • Confirme que você está usando o formato de áudio correto ao processar dados de resposta TTS
  • Para TTS com streaming, garanta que você está manipulando os chunks de áudio corretamente