Saltar al contenido principal

Resumen

Documentación de Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator es un plugin multiplataforma para Unreal Engine que permite la integración perfecta de chatbots de IA y servicios de texto a voz directamente en tus proyectos. El plugin es compatible con múltiples proveedores líderes de IA y ofrece interacciones de chat flexibles con modos de respuesta en streaming y no streaming, así como conversión de texto a voz de alta calidad con capacidades de streaming.

Características Compatibles

Chat de Texto a Texto

Integra capacidades conversacionales impulsadas por IA con múltiples proveedores líderes.

OpenAI

  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-3.5 Turbo
  • GPT-4o
  • GPT-4o Mini
  • GPT-4-32k
  • GPT-4 Turbo
  • GPT-4-1
  • ChatGPT-4o Latest
  • O1 Pro
  • O1
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.5 Sonnet
  • Claude 4 Sonnet
  • Claude 4.1 Opus
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (con salida de razonamiento dedicada)

Gemini (Google)

  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212
  • Grok 2 1212
  • Grok Vision Beta

Texto a Voz (TTS)

Convierte texto a voz de sonido natural utilizando proveedores líderes de TTS, con opciones estándar y de streaming.

OpenAI TTS

Múltiples opciones de voz con soporte regular y en streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelos:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Múltiples modelos con soporte regular y en streaming:

  • Eleven V3 (Modelo más reciente con generación de voz similar a humana y expresiva, compatible con más de 70 idiomas)
  • Eleven TTV V3 (Modelo de diseño de texto a voz con voz similar a humana y expresiva, compatible con más de 70 idiomas)
  • Eleven Multilingual V2 (Modelo más realista con rica expresión emocional)
  • Eleven Turbo V2 (Modelo de alta calidad y baja latencia optimizado para inglés)
  • Eleven Turbo V2.5 (Modelo de alta calidad y baja latencia con soporte multilingüe)
  • Eleven Flash V2 (Modelo ultrarrápido optimizado para uso en tiempo real en inglés)
  • Eleven Flash V2.5 (Modelo ultrarrápido optimizado para uso en tiempo real con soporte multilingüe)
  • Eleven Monolingual V1

Google Cloud TTS

Voces neuronales de alta calidad con amplio soporte de idiomas:

  • Voces Neural2
  • Voces Studio
  • Voces Wavenet
  • Voces estándar
  • Soporte para Voz Personalizada
  • Múltiples idiomas y configuraciones regionales
  • Soporte para SSML para control detallado

Azure TTS

Servicio de voz cognitiva de Microsoft con amplias opciones de voz:

  • Voces neuronales en múltiples idiomas
  • Estilos de voz y emociones
  • Soporte para voz personalizada
  • Soporte para marcado SSML
  • Múltiples formatos de salida incluyendo streaming

Características Principales

  • Compatibilidad multiplataforma (Windows, Mac, Android, iOS, Linux, Meta Quest y más)
  • Soporte para múltiples proveedores de IA y TTS
  • Respuestas de chat en streaming y no streaming
  • TTS en streaming para síntesis y procesamiento de audio en tiempo real
  • Soporte para modelos de razonamiento con salidas separadas de razonamiento y contenido (DeepSeek, Grok)
  • Síntesis de voz de alta calidad con latencia mínima
  • Fácil integración con Unreal Engine Blueprints y C++
  • Opciones de configuración flexibles
  • Soporte para 70+ idiomas con modelos ElevenLabs V3
  • Listado y descubrimiento de voces para Google Cloud y Azure TTS

Prerrequisitos

Para usar el plugin, necesitarás credenciales de acceso a la API de uno de los proveedores soportados:

Para el procesamiento de audio, puedes implementar tu propia solución o usar el plugin Runtime Audio Importer, que puede importar datos de audio en varios formatos (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Para más información, consulta aquí.

Recursos Adicionales