Aller au contenu principal

Vue d'ensemble

Documentation Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator est un plugin Unreal Engine multiplateforme qui permet l'intégration transparente de chatbots IA et de services de synthèse vocale directement dans vos projets. Le plugin prend en charge plusieurs fournisseurs d'IA leaders et offre des interactions de chat flexibles avec des modes de réponse en streaming et non-streaming, ainsi qu'une conversion texte-parole de haute qualité avec capacités de streaming.

Fonctionnalités prises en charge

Chat Texte-à-Texte

Intégrez des capacités conversationnelles alimentées par l'IA avec plusieurs fournisseurs leaders.

OpenAI

  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (avec sortie de raisonnement dédiée)

Gemini (Google)

  • Gemini 3.1 Pro Preview
  • Gemini 3 Pro Preview
  • Gemini 3 Flash Preview
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Synthèse Vocale (TTS)

Convertissez du texte en parole naturelle en utilisant les principaux fournisseurs de TTS, avec des options standard et de streaming.

OpenAI TTS

Plusieurs options de voix avec support régulier et streaming :

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modèles :

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Plusieurs modèles avec support régulier et streaming :

  • Eleven V3 (Dernier modèle avec génération de parole humaine et expressive, prend en charge 70+ langues)
  • Eleven TTV V3 (Modèle de conception Text to Voice avec parole humaine et expressive, prend en charge 70+ langues)
  • Eleven Multilingual V2 (Modèle le plus réaliste avec une riche expression émotionnelle)
  • Eleven Turbo V2 (Modèle haute qualité, faible latence optimisé pour l'anglais)
  • Eleven Turbo V2.5 (Modèle haute qualité, faible latence avec support multilingue)
  • Eleven Flash V2 (Modèle ultra-rapide optimisé pour une utilisation en temps réel en anglais)
  • Eleven Flash V2.5 (Modèle ultra-rapide optimisé pour une utilisation en temps réel avec support multilingue)
  • Eleven Monolingual V1

Google Cloud TTS

Voix neuronales de haute qualité avec un support linguistique étendu :

  • Voix Neural2
  • Voix Studio
  • Voix Wavenet
  • Voix Standard
  • Support de Voice personnalisée
  • Multiples langues et paramètres régionaux
  • Support SSML pour un contrôle précis

Azure TTS

Service de parole cognitive de Microsoft avec de nombreuses options de voix :

  • Voix neuronales dans plusieurs langues
  • Styles de voix et émotions
  • Support de voix personnalisée
  • Support de balisage SSML

Fonctionnalités principales

  • Compatibilité multiplateforme (Windows, Mac, Android, iOS, Linux, Meta Quest, et plus)
  • Support de multiples fournisseurs d'IA et de TTS
  • Réponses de chat en streaming et non-streaming
  • TTS en streaming pour la synthèse et le traitement audio en temps réel
  • Support des modèles de raisonnement avec sorties de raisonnement et de contenu séparées (DeepSeek, Grok)
  • Synthèse vocale de haute qualité avec latence minimale
  • Intégration facile avec les Blueprints et le C++ d'Unreal Engine
  • Options de configuration flexibles
  • Support de 70+ langues avec les modèles ElevenLabs V3
  • Liste et découverte des voix pour Google Cloud et Azure TTS

Prérequis

Pour utiliser le plugin, vous aurez besoin d'identifiants d'accès API d'un des fournisseurs pris en charge :

Pour le traitement audio, vous pouvez implémenter votre propre solution ou utiliser le plugin Runtime Audio Importer, qui peut importer des données audio dans divers formats (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Pour plus d'informations, voir ici.

Ressources supplémentaires