Saltar al contenido principal

Cómo usar el plugin

El Runtime AI Chatbot Integrator ofrece dos funcionalidades principales: chat de Texto-a-Texto y Texto-a-Voz (TTS). Ambas características siguen un flujo de trabajo similar:

  1. Registrar tu token de proveedor de API
  2. Configurar ajustes específicos de cada característica
  3. Enviar solicitudes y procesar respuestas

Registrar Token del Proveedor

Antes de enviar cualquier solicitud, registra tu token de proveedor de API usando la función RegisterProviderToken.

Register Provider Token in Blueprint

Funcionalidad de Chat de Texto a Texto

El plugin admite dos modos de solicitud de chat para cada proveedor:

Solicitudes de Chat No Continuas (Non-Streaming)

Obtén la respuesta completa en una sola llamada.

Send OpenAI Chat Request

Solicitudes de Chat en Tiempo Real

Recibe fragmentos de respuesta en tiempo real para una interacción más dinámica.

Enviar Solicitud de Chat en Tiempo Real de OpenAI

Funcionalidad de Texto a Voz (TTS)

Convierte texto en audio de voz de alta calidad utilizando los principales proveedores de TTS. El plugin devuelve datos de audio en bruto (TArray<uint8>) que puedes procesar según las necesidades de tu proyecto.

Si bien los ejemplos a continuación demuestran el procesamiento de audio para reproducción utilizando el plugin Runtime Audio Importer (consulta la documentación de importación de audio), el Runtime AI Chatbot Integrator está diseñado para ser flexible. El plugin simplemente devuelve los datos de audio en bruto, dándote completa libertad en cómo procesarlos para tu caso de uso específico, lo que podría incluir reproducción de audio, guardar en archivo, procesamiento adicional de audio, transmisión a otros sistemas, visualizaciones personalizadas y más.

Solicitudes TTS No Continuas (Non-Streaming)

Las solicitudes TTS no continuas devuelven los datos de audio completos en una única respuesta después de que se haya procesado todo el texto. Este enfoque es adecuado para textos más cortos donde esperar el audio completo no es problemático.

Enviar Solicitud TTS de OpenAI

Solicitudes de TTS en Streaming

El TTS en streaming entrega fragmentos de audio a medida que se generan, permitiéndote procesar los datos incrementalmente en lugar de esperar a que se sintetice todo el audio. Esto reduce significativamente la latencia percibida para textos largos y habilita aplicaciones en tiempo real.

Enviar Solicitud de TTS en Streaming de OpenAI

Manejo de Errores

Al enviar cualquier solicitud, es crucial manejar posibles errores verificando el ErrorStatus en tu callback. El ErrorStatus proporciona información sobre cualquier problema que pueda ocurrir durante la solicitud.

Manejo de Errores

Cancelación de Solicitudes

El plugin te permite cancelar tanto solicitudes de texto a texto como de TTS mientras están en progreso. Esto puede ser útil cuando deseas interrumpir una solicitud de larga duración o cambiar el flujo de la conversación dinámicamente.

Cancel Request

Mejores prácticas

  1. Siempre maneja posibles errores verificando el ErrorStatus en tu callback
  2. Ten en cuenta los límites de tasa y costos de la API
  3. Usa el modo de streaming para conversaciones largas o interactivas
  4. Considera cancelar solicitudes que ya no sean necesarias para gestionar recursos eficientemente
  5. Usa TTS con streaming para textos largos y reducir la latencia percibida
  6. Para procesamiento de audio, el plugin Runtime Audio Importer ofrece una solución conveniente, pero puedes implementar procesamiento personalizado según las necesidades de tu proyecto

Solución de problemas

  • Verifica que tus credenciales de API sean correctas
  • Revisa tu conexión a internet
  • Asegúrate que cualquier biblioteca de procesamiento de audio que uses (como Runtime Audio Importer) esté correctamente instalada al trabajar con funciones TTS
  • Confirma que estés usando el formato de audio correcto al procesar datos de respuesta TTS
  • Para TTS con streaming, asegúrate de manejar correctamente los fragmentos de audio