Aperçu

Runtime AI Chatbot Integrator est un plugin Unreal Engine multiplateforme qui permet l'intégration transparente de chatbots IA et de services de synthèse vocale directement dans vos projets. Le plugin prend en charge plusieurs fournisseurs d'IA leaders et offre des interactions de chat flexibles avec des modes de réponse en streaming et non-streaming, ainsi qu'une conversion texte-parole de haute qualité avec capacités de streaming.
Fonctionnalités prises en charge
Chat Texte-à-Texte
Intégrez des capacités conversationnelles alimentées par l'IA avec plusieurs fournisseurs leaders.
OpenAI
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-3.5 Turbo
- GPT-4o
- GPT-4o Mini
- GPT-4-32k
- GPT-4 Turbo
- GPT-4-1
- ChatGPT-4o Latest
- O1 Pro
- O1
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.5 Sonnet
- Claude 4 Sonnet
- Claude 4.1 Opus
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek Chat
- DeepSeek Reasoner (avec sortie de raisonnement dédiée)
Gemini (Google)
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
- Grok 2 1212
- Grok Vision Beta
Synthèse Vocale (TTS)
Convertissez le texte en parole naturelle en utilisant les principaux fournisseurs de TTS, avec des options standard et de streaming.
OpenAI TTS
Plusieurs options de voix avec support régulier et streaming :
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
Modèles :
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
Plusieurs modèles avec support régulier et streaming :
- Eleven V3 (Dernier modèle avec génération de parole humaine et expressive, prend en charge 70+ langues)
- Eleven TTV V3 (Modèle de conception Texte vers Voix avec parole humaine et expressive, prend en charge 70+ langues)
- Eleven Multilingual V2 (Modèle le plus réaliste avec une riche expression émotionnelle)
- Eleven Turbo V2 (Modèle haute qualité, faible latence optimisé pour l'anglais)
- Eleven Turbo V2.5 (Modèle haute qualité, faible latence avec support multilingue)
- Eleven Flash V2 (Modèle ultra-rapide optimisé pour une utilisation en temps réel en anglais)
- Eleven Flash V2.5 (Modèle ultra-rapide optimisé pour une utilisation en temps réel avec support multilingue)
- Eleven Monolingual V1
Google Cloud TTS
Voix neuronales de haute qualité avec un support linguistique étendu :
- Voix Neural2
- Voix Studio
- Voix Wavenet
- Voix Standard
- Support de Voix Personnalisée
- Multiples langues et paramètres régionaux
- Support SSML pour un contrôle granulaire
Azure TTS
Service de parole cognitif de Microsoft avec un vaste choix de voix :
- Voix neuronales dans plusieurs langues
- Styles vocaux et émotions
- Support de voix personnalisée
- Support de balisage SSML
- Multiples formats de sortie incluant le streaming
Fonctionnalités principales
- Compatibilité multiplateforme (Windows, Mac, Android, iOS, Linux, Meta Quest, et plus)
- Prise en charge de plusieurs fournisseurs d'IA et de TTS
- Réponses de chat en streaming et non-streaming
- TTS en streaming pour la synthèse et le traitement audio en temps réel
- Prise en charge des modèles de raisonnement avec des sorties de raisonnement et de contenu distinctes (DeepSeek, Grok)
- Synthèse vocale de haute qualité avec une latence minimale
- Intégration facile avec les Blueprints et le C++ d'Unreal Engine
- Options de configuration flexibles
- Prise en charge de plus de 70 langues avec les modèles ElevenLabs V3
- Liste et découverte des voix pour Google Cloud et Azure TTS
Prérequis
Pour utiliser le plugin, vous aurez besoin des identifiants d'accès à l'API d'un des fournisseurs pris en charge :
- API OpenAI
- API Anthropic
- API DeepSeek
- API Google Gemini
- API xAI Grok
- API ElevenLabs
- API Google Cloud Text-to-Speech
- API Azure Cognitive Services Speech
Pour le traitement audio, vous pouvez implémenter votre propre solution ou utiliser le plugin Runtime Audio Importer, qui peut importer des données audio dans divers formats (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Pour plus d'informations, consultez ici.
Ressources supplémentaires
- Obtenez-le sur Fab
- Site web du produit
- Télécharger la Démo (Windows)
- Télécharger les fichiers sources de la démo (UE 5.6)
- Serveur d'assistance Discord
- Démo vidéo de présentation du projet ⭐ NOUVEAU
- Développement personnalisé : [email protected] (solutions sur mesure pour les équipes et organisations)