Aller au contenu principal

Aperçu

Documentation de Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator est un plugin Unreal Engine multiplateforme qui permet une intégration transparente de chatbots IA et de services de synthèse vocale directement dans vos projets. Le plugin prend en charge plusieurs fournisseurs d'IA leaders et offre des interactions de chat flexibles avec des modes de réponse en streaming et non-streaming, ainsi qu'une conversion texte-parole de haute qualité avec des capacités de streaming.

Fonctionnalités prises en charge

Chat Texte-à-Texte

Intégrez des capacités conversationnelles basées sur l'IA avec plusieurs fournisseurs leaders.

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (avec sortie de raisonnement dédiée)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Exécutez des modèles d'IA locaux avec une confidentialité totale et sans clé API requise :

  • Tout modèle disponible dans la bibliothèque Ollama (par exemple, Llama 3, Mistral, Gemma, Phi, Qwen, et plus)
  • Modèles personnalisés et affinés hébergés localement

Synthèse Vocale (TTS)

Convertissez du texte en parole naturelle en utilisant des fournisseurs TTS leaders, avec des options standard et en streaming.

OpenAI TTS

Plusieurs options vocales avec prise en charge standard et en streaming :

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modèles :

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Plusieurs modèles avec prise en charge standard et en streaming :

  • Eleven V3 (Dernier modèle avec génération de parole humaine et expressive, prend en charge 70+ langues)
  • Eleven TTV V3 (Modèle de conception Texte vers Voix avec parole humaine et expressive, prend en charge 70+ langues)
  • Eleven Multilingual V2 (Modèle le plus réaliste avec une riche expression émotionnelle)
  • Eleven Turbo V2 (Modèle haute qualité et faible latence optimisé pour l'anglais)
  • Eleven Turbo V2.5 (Modèle haute qualité et faible latence avec prise en charge multilingue)
  • Eleven Flash V2 (Modèle ultra-rapide optimisé pour une utilisation en temps réel en anglais)
  • Eleven Flash V2.5 (Modèle ultra-rapide optimisé pour une utilisation en temps réel avec prise en charge multilingue)
  • Eleven Monolingual V1

Google Cloud TTS

Voix neuronales de haute qualité avec une prise en charge linguistique étendue :

  • Voix Neural2
  • Voix Studio
  • Voix Wavenet
  • Voix Standard
  • Prise en charge de voix personnalisées
  • Plusieurs langues et paramètres régionaux
  • Prise en charge SSML pour un contrôle précis

Azure TTS

Service de parole cognitive de Microsoft avec des options vocales étendues :

  • Voix neuronales dans plusieurs langues
  • Styles et émotions vocaux
  • Prise en charge de voix personnalisées
  • Prise en charge du balisage SSML

Fonctionnalités clés

  • Compatibilité multiplateforme (Windows, Mac, Android, iOS, Linux, Meta Quest, et plus)
  • Prise en charge de plusieurs fournisseurs d'IA et TTS
  • Prise en charge de modèles locaux via Ollama (aucune clé API requise, confidentialité totale)
  • Réponses de chat en streaming et non-streaming
  • TTS en streaming pour la synthèse et le traitement audio en temps réel
  • Prise en charge des modèles de raisonnement avec sorties de raisonnement et de contenu séparées (DeepSeek, Grok)
  • Synthèse vocale de haute qualité avec une latence minimale
  • Intégration facile avec les Blueprints et le C++ d'Unreal Engine
  • Options de configuration flexibles
  • Prise en charge de 70+ langues avec les modèles ElevenLabs V3
  • Découverte et listage des voix pour Google Cloud et Azure TTS

Prérequis

Pour utiliser le plugin, vous aurez besoin d'informations d'identification d'accès API auprès de l'un des fournisseurs pris en charge :

Pour le traitement audio, vous pouvez implémenter votre propre solution ou utiliser le plugin Runtime Audio Importer, qui peut importer des données audio dans divers formats (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Pour plus d'informations, voir ici.

Ressources supplémentaires

Join our Discord
online · support