Pular para o conteúdo principal

Visão Geral

Documentação do Runtime AI Chatbot Integrator

O Runtime AI Chatbot Integrator é um plugin multiplataforma para Unreal Engine que permite a integração perfeita de chatbots de IA e serviços de conversão de texto em fala diretamente em seus projetos. O plugin suporta vários provedores líderes de IA e oferece interações de chat flexíveis com modos de resposta em streaming e não-streaming, bem como conversão de texto em fala de alta qualidade com capacidades de streaming.

Funcionalidades Suportadas

Chat de Texto para Texto

Integre capacidades conversacionais alimentadas por IA com vários provedores líderes.

OpenAI

  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (com saída de raciocínio dedicada)

Gemini (Google)

  • Gemini 3.1 Pro Preview
  • Gemini 3 Pro Preview
  • Gemini 3 Flash Preview
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Execute modelos de IA locais com total privacidade e sem necessidade de chave de API:

  • Qualquer modelo disponível na biblioteca Ollama (ex.: Llama 3, Mistral, Gemma, Phi, Qwen, e mais)
  • Modelos personalizados e ajustados hospedados localmente

Texto para Fala (TTS)

Converta texto em fala com som natural usando provedores líderes de TTS, com opções padrão e de streaming.

OpenAI TTS

Múltiplas opções de voz com suporte regular e em streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelos:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Múltiplos modelos com suporte regular e em streaming:

  • Eleven V3 (Modelo mais recente com geração de fala expressiva e humana, suporta 70+ idiomas)
  • Eleven TTV V3 (Modelo de design Texto para Voz com fala humana e expressiva, suporta 70+ idiomas)
  • Eleven Multilingual V2 (Modelo mais realista com rica expressão emocional)
  • Eleven Turbo V2 (Modelo de alta qualidade e baixa latência otimizado para inglês)
  • Eleven Turbo V2.5 (Modelo de alta qualidade e baixa latência com suporte multilíngue)
  • Eleven Flash V2 (Modelo ultrarrápido otimizado para uso em tempo real em inglês)
  • Eleven Flash V2.5 (Modelo ultrarrápido otimizado para uso em tempo real com suporte multilíngue)
  • Eleven Monolingual V1

Google Cloud TTS

Vozes neurais de alta qualidade com amplo suporte a idiomas:

  • Vozes Neural2
  • Vozes Studio
  • Vozes Wavenet
  • Vozes Standard
  • Suporte a Voz Personalizada (Custom Voice)
  • Múltiplos idiomas e localidades
  • Suporte a SSML para controle refinado

Azure TTS

Serviço de fala cognitiva da Microsoft com amplas opções de voz:

  • Vozes neurais em vários idiomas
  • Estilos de voz e emoções
  • Suporte a voz personalizada
  • Suporte a marcação SSML

Principais Funcionalidades

  • Compatibilidade multiplataforma (Windows, Mac, Android, iOS, Linux, Meta Quest, e mais)
  • Suporte a múltiplos provedores de IA e TTS
  • Suporte a modelos locais via Ollama (sem chave de API necessária, privacidade total)
  • Respostas de chat em streaming e não-streaming
  • TTS em streaming para síntese e processamento de áudio em tempo real
  • Suporte a modelos de raciocínio com saídas separadas de raciocínio e conteúdo (DeepSeek, Grok)
  • Síntese de voz de alta qualidade com latência mínima
  • Integração fácil com Blueprints e C++ do Unreal Engine
  • Opções de configuração flexíveis
  • Suporte a 70+ idiomas com modelos ElevenLabs V3
  • Listagem e descoberta de vozes para Google Cloud e Azure TTS

Pré-requisitos

Para usar o plugin, você precisará de credenciais de acesso à API de um dos provedores suportados:

Para processamento de áudio, você pode implementar sua própria solução ou usar o plugin Runtime Audio Importer, que pode importar dados de áudio em vários formatos (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Para mais informações, veja aqui.

Recursos Adicionais