Saltar al contenido principal

Resumen

Documentación de Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator es un plugin multiplataforma para Unreal Engine que permite la integración fluida de chatbots de IA y servicios de texto a voz directamente en tus proyectos. El plugin es compatible con múltiples proveedores líderes de IA y ofrece interacciones de chat flexibles con modos de respuesta tanto en streaming como sin streaming, así como conversión de texto a voz de alta calidad con capacidades de streaming.

Funcionalidades Compatibles

Chat de Texto a Texto

Integra capacidades conversacionales impulsadas por IA con múltiples proveedores líderes.

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (con salida de razonamiento dedicada)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Ejecuta modelos de IA locales con total privacidad y sin necesidad de clave API:

  • Cualquier modelo disponible en la biblioteca de Ollama (por ejemplo, Llama 3, Mistral, Gemma, Phi, Qwen y más)
  • Modelos personalizados y ajustados alojados localmente

Texto a Voz (TTS)

Convierte texto en voz de sonido natural utilizando proveedores líderes de TTS, con opciones tanto estándar como en streaming.

OpenAI TTS

Múltiples opciones de voz con soporte regular y en streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelos:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Múltiples modelos con soporte regular y en streaming:

  • Eleven V3 (Modelo más reciente con generación de voz humana y expresiva, compatible con más de 70 idiomas)
  • Eleven TTV V3 (Modelo de diseño Texto a Voz con voz humana y expresiva, compatible con más de 70 idiomas)
  • Eleven Multilingual V2 (Modelo más realista con rica expresión emocional)
  • Eleven Turbo V2 (Modelo de alta calidad y baja latencia optimizado para inglés)
  • Eleven Turbo V2.5 (Modelo de alta calidad y baja latencia con soporte multilingüe)
  • Eleven Flash V2 (Modelo ultrarrápido optimizado para uso en tiempo real en inglés)
  • Eleven Flash V2.5 (Modelo ultrarrápido optimizado para uso en tiempo real con soporte multilingüe)
  • Eleven Monolingual V1

Google Cloud TTS

Voces neuronales de alta calidad con amplio soporte de idiomas:

  • Voces Neural2
  • Voces Studio
  • Voces Wavenet
  • Voces estándar
  • Soporte de Voz Personalizada
  • Múltiples idiomas y configuraciones regionales
  • Soporte SSML para control detallado

Azure TTS

Servicio de voz cognitivo de Microsoft con amplias opciones de voz:

  • Voces neuronales en múltiples idiomas
  • Estilos de voz y emociones
  • Soporte de voz personalizada
  • Soporte de marcado SSML

Características Clave

  • Compatibilidad multiplataforma (Windows, Mac, Android, iOS, Linux, Meta Quest y más)
  • Soporte para múltiples proveedores de IA y TTS
  • Soporte de modelos locales mediante Ollama (sin necesidad de clave API, privacidad total)
  • Respuestas de chat en streaming y sin streaming
  • TTS en streaming para síntesis y procesamiento de audio en tiempo real
  • Soporte de modelos de razonamiento con salidas separadas de razonamiento y contenido (DeepSeek, Grok)
  • Síntesis de voz de alta calidad con latencia mínima
  • Integración sencilla con Blueprints y C++ de Unreal Engine
  • Opciones de configuración flexibles
  • Soporte para más de 70 idiomas con modelos ElevenLabs V3
  • Descubrimiento y listado de voces para Google Cloud y Azure TTS

Requisitos Previos

Para usar el plugin, necesitarás credenciales de acceso a la API de uno de los proveedores compatibles:

Para el procesamiento de audio, puedes implementar tu propia solución o usar el plugin Runtime Audio Importer, que puede importar datos de audio en varios formatos (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Para más información, consulta aquí.

Recursos Adicionales

Join our Discord
online · support