Aller au contenu principal

Aperçu

Documentation Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator est un plugin Unreal Engine multiplateforme qui permet l'intégration transparente de chatbots IA et de services de synthèse vocale directement dans vos projets. Le plugin prend en charge plusieurs fournisseurs d'IA leaders et offre des interactions de chat flexibles avec des modes de réponse en streaming et non-streaming, ainsi qu'une conversion texte-parole de haute qualité avec capacités de streaming.

Fonctionnalités prises en charge

Chat Texte-à-Texte

Intégrez des capacités conversationnelles alimentées par l'IA avec plusieurs fournisseurs leaders.

OpenAI

  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-3.5 Turbo
  • GPT-4o
  • GPT-4o Mini
  • GPT-4-32k
  • GPT-4 Turbo
  • GPT-4-1
  • ChatGPT-4o Latest
  • O1 Pro
  • O1
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.5 Sonnet
  • Claude 4 Sonnet
  • Claude 4.1 Opus
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (avec sortie de raisonnement dédiée)

Gemini (Google)

  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212
  • Grok 2 1212
  • Grok Vision Beta

Synthèse Vocale (TTS)

Convertissez le texte en parole naturelle en utilisant les principaux fournisseurs de TTS, avec des options standard et de streaming.

OpenAI TTS

Plusieurs options de voix avec support régulier et streaming :

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modèles :

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Plusieurs modèles avec support régulier et streaming :

  • Eleven V3 (Dernier modèle avec génération de parole humaine et expressive, prend en charge 70+ langues)
  • Eleven TTV V3 (Modèle de conception Texte vers Voix avec parole humaine et expressive, prend en charge 70+ langues)
  • Eleven Multilingual V2 (Modèle le plus réaliste avec une riche expression émotionnelle)
  • Eleven Turbo V2 (Modèle haute qualité, faible latence optimisé pour l'anglais)
  • Eleven Turbo V2.5 (Modèle haute qualité, faible latence avec support multilingue)
  • Eleven Flash V2 (Modèle ultra-rapide optimisé pour une utilisation en temps réel en anglais)
  • Eleven Flash V2.5 (Modèle ultra-rapide optimisé pour une utilisation en temps réel avec support multilingue)
  • Eleven Monolingual V1

Google Cloud TTS

Voix neuronales de haute qualité avec un support linguistique étendu :

  • Voix Neural2
  • Voix Studio
  • Voix Wavenet
  • Voix Standard
  • Support de Voix Personnalisée
  • Multiples langues et paramètres régionaux
  • Support SSML pour un contrôle granulaire

Azure TTS

Service de parole cognitif de Microsoft avec un vaste choix de voix :

  • Voix neuronales dans plusieurs langues
  • Styles vocaux et émotions
  • Support de voix personnalisée
  • Support de balisage SSML
  • Multiples formats de sortie incluant le streaming

Fonctionnalités principales

  • Compatibilité multiplateforme (Windows, Mac, Android, iOS, Linux, Meta Quest, et plus)
  • Prise en charge de plusieurs fournisseurs d'IA et de TTS
  • Réponses de chat en streaming et non-streaming
  • TTS en streaming pour la synthèse et le traitement audio en temps réel
  • Prise en charge des modèles de raisonnement avec des sorties de raisonnement et de contenu distinctes (DeepSeek, Grok)
  • Synthèse vocale de haute qualité avec une latence minimale
  • Intégration facile avec les Blueprints et le C++ d'Unreal Engine
  • Options de configuration flexibles
  • Prise en charge de plus de 70 langues avec les modèles ElevenLabs V3
  • Liste et découverte des voix pour Google Cloud et Azure TTS

Prérequis

Pour utiliser le plugin, vous aurez besoin des identifiants d'accès à l'API d'un des fournisseurs pris en charge :

Pour le traitement audio, vous pouvez implémenter votre propre solution ou utiliser le plugin Runtime Audio Importer, qui peut importer des données audio dans divers formats (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Pour plus d'informations, consultez ici.

Ressources supplémentaires