Panoramica

Runtime AI Chatbot Integrator è un plugin multipiattaforma per Unreal Engine che consente l'integrazione diretta di chatbot AI e servizi di sintesi vocale nei tuoi progetti. Il plugin supporta molteplici fornitori AI leader e offre interazioni di chat flessibili con modalità di risposta in streaming e non, oltre a conversioni di testo in parlato di alta qualità con capacità di streaming.
Funzionalità Supportate
Chat da Testo a Testo
Integra capacità conversazionali alimentate da AI con molteplici fornitori leader.
OpenAI
- GPT-5.2
- GPT-5.1
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-4-1
- GPT-4-1 Mini
- GPT-4-1 Nano
- GPT-4o
- GPT-4o Mini
- GPT-4
- GPT-4 Turbo
- GPT-4-32k
- GPT-3.5 Turbo
- GPT-3.5 Turbo 16k
- ChatGPT-4o Latest
- O1
- O1 Pro
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.6 Opus
- Claude 4.6 Sonnet
- Claude 4.5 Haiku
- Claude 4.5 Sonnet
- Claude 4.5 Opus
- Claude 4.1 Opus
- Claude 4 Sonnet
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek Chat
- DeepSeek Reasoner (con output di ragionamento dedicato)
Gemini (Google)
- Gemini 3.1 Pro Preview
- Gemini 3 Pro Preview
- Gemini 3 Flash Preview
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4.1 Fast Reasoning
- Grok 4.1 Fast Non-Reasoning
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4 0709
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
Ollama
Esegui modelli AI locali con piena privacy e senza necessità di chiave API:
- Qualsiasi modello disponibile nella libreria Ollama (es. Llama 3, Mistral, Gemma, Phi, Qwen e altri)
- Modelli personalizzati e ottimizzati ospitati localmente
Sintesi Vocale (TTS)
Converti testo in parlato dal suono naturale utilizzando fornitori TTS leader, con opzioni standard e in streaming.
OpenAI TTS
Multiple opzioni vocali con supporto regolare e in streaming:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
Modelli:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
Molteplici modelli con supporto regolare e in streaming:
- Eleven V3 (Modello più recente con generazione vocale espressiva e simile all'umano, supporta 70+ lingue)
- Eleven TTV V3 (Modello di progettazione Text to Voice con parlato espressivo e simile all'umano, supporta 70+ lingue)
- Eleven Multilingual V2 (Modello più realistico con ricca espressione emotiva)
- Eleven Turbo V2 (Modello di alta qualità, bassa latenza ottimizzato per l'inglese)
- Eleven Turbo V2.5 (Modello di alta qualità, bassa latenza con supporto multilingue)
- Eleven Flash V2 (Modello ultra-veloce ottimizzato per l'uso in tempo reale in inglese)
- Eleven Flash V2.5 (Modello ultra-veloce ottimizzato per l'uso in tempo reale con supporto multilingue)
- Eleven Monolingual V1
Google Cloud TTS
Voci neurali di alta qualità con ampio supporto linguistico:
- Voci Neural2
- Voci Studio
- Voci Wavenet
- Voci Standard
- Supporto per Voci Personalizzate
- Molteplici lingue e localizzazioni
- Supporto SSML per controllo granulare
Azure TTS
Servizio vocale cognitivo di Microsoft con ampie opzioni vocali:
- Voci neurali in molteplici lingue
- Stili vocali ed emozioni
- Supporto per voci personalizzate
- Supporto per markup SSML
Caratteristiche Principali
- Compatibilità multipiattaforma (Windows, Mac, Android, iOS, Linux, Meta Quest e altro)
- Supporto per molteplici fornitori AI e TTS
- Supporto per modelli locali tramite Ollama (nessuna chiave API richiesta, piena privacy)
- Risposte di chat in streaming e non in streaming
- TTS in streaming per sintesi ed elaborazione audio in tempo reale
- Supporto per modelli di ragionamento con output di ragionamento e contenuto separati (DeepSeek, Grok)
- Sintesi vocale di alta qualità con latenza minima
- Integrazione facile con Blueprints e C++ di Unreal Engine
- Opzioni di configurazione flessibili
- Supporto per 70+ lingue con i modelli ElevenLabs V3
- Elenco e scoperta voci per Google Cloud e Azure TTS
Prerequisiti
Per utilizzare il plugin, avrai bisogno di credenziali di accesso API da uno dei fornitori supportati:
- API OpenAI
- API Anthropic
- API DeepSeek
- API Google Gemini
- API xAI Grok
- API ElevenLabs
- API Google Cloud Text-to-Speech
- API Azure Cognitive Services Speech
- Ollama (locale, nessuna chiave API richiesta)
Per l'elaborazione audio, puoi implementare la tua soluzione o utilizzare il plugin Runtime Audio Importer, che può importare dati audio in vari formati (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Per maggiori informazioni, vedi qui.
Risorse Aggiuntive
- Acquistalo su Fab
- Sito web del prodotto
- Scarica Demo (Windows)
- Scarica file sorgente demo (UE 5.6)
- Server di supporto Discord
- Video dimostrativo del progetto ⭐ NUOVO
- Supporto Plugin & Sviluppo Personalizzato: [email protected] (soluzioni su misura per team e organizzazioni)