Passa al contenuto principale

Panoramica

Documentazione di Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator è un plugin multipiattaforma per Unreal Engine che consente l'integrazione diretta di chatbot AI e servizi di sintesi vocale nei tuoi progetti. Il plugin supporta molteplici fornitori AI leader e offre interazioni di chat flessibili con modalità di risposta in streaming e non, oltre a conversioni di testo in parlato di alta qualità con capacità di streaming.

Funzionalità Supportate

Chat da Testo a Testo

Integra capacità conversazionali alimentate da AI con molteplici fornitori leader.

OpenAI

  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (con output di ragionamento dedicato)

Gemini (Google)

  • Gemini 3.1 Pro Preview
  • Gemini 3 Pro Preview
  • Gemini 3 Flash Preview
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Esegui modelli AI locali con piena privacy e senza necessità di chiave API:

  • Qualsiasi modello disponibile nella libreria Ollama (es. Llama 3, Mistral, Gemma, Phi, Qwen e altri)
  • Modelli personalizzati e ottimizzati ospitati localmente

Sintesi Vocale (TTS)

Converti testo in parlato dal suono naturale utilizzando fornitori TTS leader, con opzioni standard e in streaming.

OpenAI TTS

Multiple opzioni vocali con supporto regolare e in streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelli:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Molteplici modelli con supporto regolare e in streaming:

  • Eleven V3 (Modello più recente con generazione vocale espressiva e simile all'umano, supporta 70+ lingue)
  • Eleven TTV V3 (Modello di progettazione Text to Voice con parlato espressivo e simile all'umano, supporta 70+ lingue)
  • Eleven Multilingual V2 (Modello più realistico con ricca espressione emotiva)
  • Eleven Turbo V2 (Modello di alta qualità, bassa latenza ottimizzato per l'inglese)
  • Eleven Turbo V2.5 (Modello di alta qualità, bassa latenza con supporto multilingue)
  • Eleven Flash V2 (Modello ultra-veloce ottimizzato per l'uso in tempo reale in inglese)
  • Eleven Flash V2.5 (Modello ultra-veloce ottimizzato per l'uso in tempo reale con supporto multilingue)
  • Eleven Monolingual V1

Google Cloud TTS

Voci neurali di alta qualità con ampio supporto linguistico:

  • Voci Neural2
  • Voci Studio
  • Voci Wavenet
  • Voci Standard
  • Supporto per Voci Personalizzate
  • Molteplici lingue e localizzazioni
  • Supporto SSML per controllo granulare

Azure TTS

Servizio vocale cognitivo di Microsoft con ampie opzioni vocali:

  • Voci neurali in molteplici lingue
  • Stili vocali ed emozioni
  • Supporto per voci personalizzate
  • Supporto per markup SSML

Caratteristiche Principali

  • Compatibilità multipiattaforma (Windows, Mac, Android, iOS, Linux, Meta Quest e altro)
  • Supporto per molteplici fornitori AI e TTS
  • Supporto per modelli locali tramite Ollama (nessuna chiave API richiesta, piena privacy)
  • Risposte di chat in streaming e non in streaming
  • TTS in streaming per sintesi ed elaborazione audio in tempo reale
  • Supporto per modelli di ragionamento con output di ragionamento e contenuto separati (DeepSeek, Grok)
  • Sintesi vocale di alta qualità con latenza minima
  • Integrazione facile con Blueprints e C++ di Unreal Engine
  • Opzioni di configurazione flessibili
  • Supporto per 70+ lingue con i modelli ElevenLabs V3
  • Elenco e scoperta voci per Google Cloud e Azure TTS

Prerequisiti

Per utilizzare il plugin, avrai bisogno di credenziali di accesso API da uno dei fornitori supportati:

Per l'elaborazione audio, puoi implementare la tua soluzione o utilizzare il plugin Runtime Audio Importer, che può importare dati audio in vari formati (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Per maggiori informazioni, vedi qui.

Risorse Aggiuntive