Saltar al contenido principal

Resumen

Documentación de Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator es un plugin multiplataforma para Unreal Engine que permite la integración fluida de chatbots de IA y servicios de texto a voz directamente en tus proyectos. El plugin soporta múltiples proveedores líderes de IA, ofreciendo interacciones de chat flexibles con modos de respuesta en streaming y no streaming, así como conversión de texto a voz de alta calidad con capacidades de streaming.

Características soportadas

Chat de Texto a Texto

Integra capacidades conversacionales impulsadas por IA con múltiples proveedores líderes.

OpenAI

  • GPT-3.5 Turbo
  • GPT-4o
  • GPT-4o Mini
  • GPT-4-32k
  • GPT-4 Turbo
  • GPT-4-1
  • ChatGPT-4o Latest
  • O1 Pro
  • O1
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 3.7 Sonnet
  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (con salida de razonamiento dedicada)

Texto a Voz (TTS)

Convierte texto a voz de sonido natural usando proveedores líderes de TTS, con opciones estándar y en streaming.

OpenAI TTS

Múltiples opciones de voz con soporte regular y en streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

ElevenLabs TTS

Múltiples modelos con soporte regular y en streaming:

  • Eleven V3 (Modelo más reciente con generación de voz expresiva y humana, soporta 70+ idiomas)
  • Eleven TTV V3 (Modelo de diseño de texto a voz con voz expresiva y humana, soporta 70+ idiomas)
  • Eleven Multilingual V2 (Modelo más realista con rica expresión emocional)
  • Eleven Turbo V2 (Modelo de alta calidad y baja latencia optimizado para inglés)
  • Eleven Turbo V2.5 (Modelo de alta calidad y baja latencia con soporte multilingüe)
  • Eleven Flash V2 (Modelo ultrarrápido optimizado para uso en tiempo real en inglés)
  • Eleven Flash V2.5 (Modelo ultrarrápido optimizado para uso en tiempo real con soporte multilingüe)

Características clave

  • Compatibilidad multiplataforma (Windows, Mac, Android, etc.)
  • Soporte para múltiples proveedores de IA y TTS
  • Respuestas de chat en streaming y no streaming
  • TTS en streaming para síntesis y procesamiento de audio en tiempo real
  • Síntesis de voz de alta calidad con latencia mínima
  • Fácil integración con Blueprints de Unreal Engine y C++
  • Opciones de configuración flexibles
  • Soporte para 70+ idiomas con modelos ElevenLabs V3

Requisitos previos

Para usar el plugin, necesitarás credenciales de acceso API de uno de los proveedores soportados:

Para el procesamiento de audio, puedes implementar tu propia solución o usar el plugin Runtime Audio Importer, que puede importar datos de audio en varios formatos (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Para más información, consulta aquí.

Recursos adicionales