Panoramica

Runtime AI Chatbot Integrator è un plugin multipiattaforma per Unreal Engine che consente l'integrazione diretta di chatbot AI e servizi di sintesi vocale nei tuoi progetti. Il plugin supporta molteplici fornitori AI leader e offre interazioni di chat flessibili con modalità di risposta sia in streaming che non, oltre a una conversione di testo in parlato di alta qualità con capacità di streaming.
Funzionalità Supportate
Chat da Testo a Testo
Integra capacità conversazionali alimentate dall'IA con molteplici fornitori leader.
OpenAI
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-3.5 Turbo
- GPT-4o
- GPT-4o Mini
- GPT-4-32k
- GPT-4 Turbo
- GPT-4-1
- ChatGPT-4o Latest
- O1 Pro
- O1
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.5 Sonnet
- Claude 4 Sonnet
- Claude 4.1 Opus
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek Chat
- DeepSeek Reasoner (con output di ragionamento dedicato)
Gemini (Google)
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
- Grok 2 1212
- Grok Vision Beta
Sintesi Vocale (TTS)
Converti il testo in parlato dal suono naturale utilizzando i principali fornitori TTS, con opzioni sia standard che in streaming.
OpenAI TTS
Multiple opzioni di voce con supporto regolare e in streaming:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
Modelli:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
Multiple modelli con supporto regolare e in streaming:
- Eleven V3 (Modello più recente con generazione di parlato umano ed espressivo, supporta 70+ lingue)
- Eleven TTV V3 (Modello di progettazione Text to Voice con parlato umano ed espressivo, supporta 70+ lingue)
- Eleven Multilingual V2 (Modello più realistico con ricca espressione emotiva)
- Eleven Turbo V2 (Modello di alta qualità e bassa latenza ottimizzato per l'inglese)
- Eleven Turbo V2.5 (Modello di alta qualità e bassa latenza con supporto multilingue)
- Eleven Flash V2 (Modello ultra-veloce ottimizzato per l'uso in tempo reale in inglese)
- Eleven Flash V2.5 (Modello ultra-veloce ottimizzato per l'uso in tempo reale con supporto multilingue)
- Eleven Monolingual V1
Google Cloud TTS
Voci neurali di alta qualità con ampio supporto linguistico:
- Voci Neural2
- Voci Studio
- Voci Wavenet
- Voci Standard
- Supporto Voice personalizzate
- Multiple lingue e localizzazioni
- Supporto SSML per un controllo granulare
Azure TTS
Servizio di sintesi vocale cognitiva di Microsoft con ampie opzioni vocali:
- Voci neurali in multiple lingue
- Stili vocali ed emozioni
- Supporto per voci personalizzate
- Supporto per markup SSML
- Multiple formati di output incluso lo streaming
Caratteristiche Principali
- Compatibilité multiplateforme (Windows, Mac, Android, iOS, Linux, Meta Quest, et plus)
- Prise en charge de plusieurs fournisseurs d'IA et de TTS
- Réponses de chat en streaming et non-streaming
- TTS en streaming pour la synthèse et le traitement audio en temps réel
- Prise en charge des modèles de raisonnement avec des sorties de raisonnement et de contenu distinctes (DeepSeek, Grok)
- Synthèse vocale de haute qualité avec une latence minimale
- Intégration facile avec les Blueprints et le C++ d'Unreal Engine
- Options de configuration flexibles
- Prise en charge de plus de 70 langues avec les modèles ElevenLabs V3
- Liste des voix et découverte pour Google Cloud et Azure TTS
Prérequis
Pour utiliser le plugin, vous aurez besoin des informations d'accès à l'API d'un des fournisseurs pris en charge :
- API OpenAI
- API Anthropic
- API DeepSeek
- API Google Gemini
- API xAI Grok
- API ElevenLabs
- API Google Cloud Text-to-Speech
- API Azure Cognitive Services Speech
Pour le traitement audio, vous pouvez implémenter votre propre solution ou utiliser le plugin Runtime Audio Importer, qui peut importer des données audio dans divers formats (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Pour plus d'informations, voir ici.
Ressources supplémentaires
- Obtenez-le sur Fab
- Site web du produit
- Télécharger la démo (Windows)
- Télécharger les fichiers sources de la démo (UE 5.6)
- Serveur de support Discord
- Démonstration vidéo du projet ⭐ NOUVEAU
- Développement personnalisé : [email protected] (solutions sur mesure pour les équipes et organisations)