Passa al contenuto principale

Panoramica

Documentazione di Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator è un plugin Unreal Engine multipiattaforma che consente l'integrazione diretta di chatbot AI e servizi di sintesi vocale nei tuoi progetti. Il plugin supporta molteplici provider AI leader e offre interazioni chat flessibili con modalità di risposta sia in streaming che non in streaming, oltre alla conversione testo-voce di alta qualità con capacità di streaming.

Funzionalità Supportate

Chat Testo-Testo

Integra funzionalità conversazionali basate sull'AI con molteplici provider leader.

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (con output di ragionamento dedicato)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Esegui modelli AI locali con piena privacy e senza necessità di chiave API:

  • Qualsiasi modello disponibile nella libreria Ollama (ad es., Llama 3, Mistral, Gemma, Phi, Qwen e altri)
  • Modelli personalizzati e ottimizzati ospitati localmente

Sintesi Vocale (TTS)

Converti il testo in parlato dal suono naturale utilizzando provider TTS leader, con opzioni sia standard che in streaming.

OpenAI TTS

Molteplici opzioni vocali con supporto regolare e in streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelli:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Molteplici modelli con supporto regolare e in streaming:

  • Eleven V3 (Modello più recente con generazione vocale umana ed espressiva, supporta 70+ lingue)
  • Eleven TTV V3 (Modello Text to Voice design con parlato umano ed espressivo, supporta 70+ lingue)
  • Eleven Multilingual V2 (Modello più realistico con ricca espressione emotiva)
  • Eleven Turbo V2 (Modello di alta qualità e bassa latenza ottimizzato per l'inglese)
  • Eleven Turbo V2.5 (Modello di alta qualità e bassa latenza con supporto multilingua)
  • Eleven Flash V2 (Modello ultraveloce ottimizzato per l'uso in tempo reale in inglese)
  • Eleven Flash V2.5 (Modello ultraveloce ottimizzato per l'uso in tempo reale con supporto multilingua)
  • Eleven Monolingual V1

Google Cloud TTS

Voci neurali di alta qualità con ampio supporto linguistico:

  • Voci Neural2
  • Voci Studio
  • Voci Wavenet
  • Voci Standard
  • Supporto per voci personalizzate
  • Molteplici lingue e impostazioni locali
  • Supporto SSML per un controllo granulare

Azure TTS

Servizio vocale cognitivo di Microsoft con ampie opzioni vocali:

  • Voci neurali in molteplici lingue
  • Stili vocali ed emozioni
  • Supporto per voci personalizzate
  • Supporto markup SSML

Caratteristiche Principali

  • Compatibilità multipiattaforma (Windows, Mac, Android, iOS, Linux, Meta Quest e altri)
  • Supporto per molteplici provider AI e TTS
  • Supporto per modelli locali tramite Ollama (nessuna chiave API richiesta, piena privacy)
  • Risposte chat in streaming e non in streaming
  • TTS in streaming per sintesi audio ed elaborazione in tempo reale
  • Supporto per modelli di ragionamento con output di ragionamento e contenuto separati (DeepSeek, Grok)
  • Sintesi vocale di alta qualità con latenza minima
  • Integrazione semplice con Blueprints e C++ di Unreal Engine
  • Opzioni di configurazione flessibili
  • Supporto per 70+ lingue con i modelli ElevenLabs V3
  • Elenco e scoperta delle voci per Google Cloud e Azure TTS

Prerequisiti

Per utilizzare il plugin, avrai bisogno di credenziali di accesso API da uno dei provider supportati:

Per l'elaborazione audio, puoi implementare la tua soluzione o utilizzare il plugin Runtime Audio Importer, che può importare dati audio in vari formati (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Per maggiori informazioni, consulta qui.

Risorse Aggiuntive

Join our Discord
online · support