Pular para o conteúdo principal

Visão Geral

Documentação do Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator é um plugin Unreal Engine multiplataforma que permite a integração perfeita de chatbots de IA e serviços de texto-para-fala diretamente em seus projetos. O plugin suporta múltiplos provedores de IA líderes e oferece interações de chat flexíveis com modos de resposta streaming e não-streaming, além de conversão de texto-para-fala de alta qualidade com capacidades de streaming.

Recursos Suportados

Chat Texto-para-Texto

Integre capacidades conversacionais alimentadas por IA com múltiplos provedores líderes.

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (com saída de raciocínio dedicada)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Execute modelos de IA locais com privacidade total e sem necessidade de chave de API:

  • Qualquer modelo disponível na biblioteca Ollama (ex.: Llama 3, Mistral, Gemma, Phi, Qwen e mais)
  • Modelos personalizados e ajustados hospedados localmente

Texto-para-Fala (TTS)

Converta texto em fala com som natural usando provedores TTS líderes, com opções padrão e streaming.

OpenAI TTS

Múltiplas opções de voz com suporte regular e streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelos:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Múltiplos modelos com suporte regular e streaming:

  • Eleven V3 (Modelo mais recente com geração de fala expressiva e semelhante à humana, suporta 70+ idiomas)
  • Eleven TTV V3 (Modelo de design Texto para Voz com fala expressiva e semelhante à humana, suporta 70+ idiomas)
  • Eleven Multilingual V2 (Modelo mais realista com rica expressão emocional)
  • Eleven Turbo V2 (Modelo de alta qualidade e baixa latência otimizado para inglês)
  • Eleven Turbo V2.5 (Modelo de alta qualidade e baixa latência com suporte multilíngue)
  • Eleven Flash V2 (Modelo ultrarrápido otimizado para uso em tempo real em inglês)
  • Eleven Flash V2.5 (Modelo ultrarrápido otimizado para uso em tempo real com suporte multilíngue)
  • Eleven Monolingual V1

Google Cloud TTS

Vozes neurais de alta qualidade com amplo suporte a idiomas:

  • Vozes Neural2
  • Vozes Studio
  • Vozes Wavenet
  • Vozes Padrão
  • Suporte a Voz Personalizada
  • Múltiplos idiomas e localidades
  • Suporte SSML para controle refinado

Azure TTS

Serviço de fala cognitiva da Microsoft com amplas opções de voz:

  • Vozes neurais em múltiplos idiomas
  • Estilos e emoções de voz
  • Suporte a voz personalizada
  • Suporte a marcação SSML

Principais Recursos

  • Compatibilidade multiplataforma (Windows, Mac, Android, iOS, Linux, Meta Quest e mais)
  • Suporte a múltiplos provedores de IA e TTS
  • Suporte a modelo local via Ollama (sem necessidade de chave de API, privacidade total)
  • Respostas de chat streaming e não-streaming
  • TTS streaming para síntese e processamento de áudio em tempo real
  • Suporte a modelo de raciocínio com saídas separadas de raciocínio e conteúdo (DeepSeek, Grok)
  • Síntese de voz de alta qualidade com latência mínima
  • Integração fácil com Blueprints e C++ do Unreal Engine
  • Opções de configuração flexíveis
  • Suporte a 70+ idiomas com modelos ElevenLabs V3
  • Descoberta e listagem de vozes para Google Cloud e Azure TTS

Pré-requisitos

Para usar o plugin, você precisará de credenciais de acesso à API de um dos provedores suportados:

Para processamento de áudio, você pode implementar sua própria solução ou usar o plugin Runtime Audio Importer, que pode importar dados de áudio em vários formatos (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Para mais informações, veja aqui.

Recursos Adicionais

Join our Discord
online · support