Zum Hauptinhalt springen

Übersicht

Runtime AI Chatbot Integrator Dokumentation

Runtime AI Chatbot Integrator ist ein plattformübergreifendes Unreal Engine-Plugin, das die nahtlose Integration von KI-Chatbots und Text-to-Speech-Diensten direkt in Ihre Projekte ermöglicht. Das Plugin unterstützt mehrere führende KI-Anbieter und bietet flexible Chat-Interaktionen sowohl mit Streaming- als auch mit Nicht-Streaming-Antwortmodi sowie hochwertige Text-to-Speech-Konvertierung mit Streaming-Funktionen.

Unterstützte Funktionen

Text-zu-Text-Chat

Integrieren Sie KI-gestützte Konversationsfähigkeiten mit mehreren führenden Anbietern.

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (mit dedizierter Reasoning-Ausgabe)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Führen Sie lokale KI-Modelle mit vollständiger Privatsphäre und ohne API-Schlüssel aus:

  • Jedes im Ollama-Bibliothek verfügbare Modell (z. B. Llama 3, Mistral, Gemma, Phi, Qwen und mehr)
  • Benutzerdefinierte und feinabgestimmte Modelle, die lokal gehostet werden

Text-to-Speech (TTS)

Konvertieren Sie Text in natürlich klingende Sprache mit führenden TTS-Anbietern, sowohl mit Standard- als auch mit Streaming-Optionen.

OpenAI TTS

Mehrere Stimmenoptionen mit regulärer und Streaming-Unterstützung:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Modelle:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Mehrere Modelle mit regulärer und Streaming-Unterstützung:

  • Eleven V3 (Neuestes Modell mit menschenähnlicher und ausdrucksstarker Sprachgenerierung, unterstützt 70+ Sprachen)
  • Eleven TTV V3 (Text-to-Voice-Designmodell mit menschenähnlicher und ausdrucksstarker Sprache, unterstützt 70+ Sprachen)
  • Eleven Multilingual V2 (Lebensechtestes Modell mit reichem emotionalem Ausdruck)
  • Eleven Turbo V2 (Hochwertiges, latenzarmes Modell optimiert für Englisch)
  • Eleven Turbo V2.5 (Hochwertiges, latenzarmes Modell mit mehrsprachiger Unterstützung)
  • Eleven Flash V2 (Ultra-schnelles Modell optimiert für Echtzeitanwendungen auf Englisch)
  • Eleven Flash V2.5 (Ultra-schnelles Modell optimiert für Echtzeitanwendungen mit mehrsprachiger Unterstützung)
  • Eleven Monolingual V1

Google Cloud TTS

Hochwertige neuronale Stimmen mit umfangreicher Sprachunterstützung:

  • Neural2-Stimmen
  • Studio-Stimmen
  • Wavenet-Stimmen
  • Standard-Stimmen
  • Unterstützung für benutzerdefinierte Stimmen
  • Mehrere Sprachen und Gebietsschemata
  • SSML-Unterstützung für fein abgestimmte Kontrolle

Azure TTS

Microsofts kognitiver Sprachdienst mit umfangreichen Stimmenoptionen:

  • Neuronale Stimmen in mehreren Sprachen
  • Stimmstile und Emotionen
  • Unterstützung für benutzerdefinierte Stimmen
  • SSML-Markup-Unterstützung

Hauptfunktionen

  • Plattformübergreifende Kompatibilität (Windows, Mac, Android, iOS, Linux, Meta Quest und mehr)
  • Unterstützung für mehrere KI- und TTS-Anbieter
  • Lokale Modellunterstützung über Ollama (kein API-Schlüssel erforderlich, vollständige Privatsphäre)
  • Streaming- und Nicht-Streaming-Chat-Antworten
  • Streaming-TTS für Echtzeit-Audiosynthese und -verarbeitung
  • Reasoning-Modellunterstützung mit separaten Reasoning- und Inhaltsausgaben (DeepSeek, Grok)
  • Hochwertige Sprachsynthese mit minimaler Latenz
  • Einfache Integration mit Unreal Engine Blueprints und C++
  • Flexible Konfigurationsoptionen
  • Unterstützung für 70+ Sprachen mit ElevenLabs V3-Modellen
  • Stimmenauflistung und -erkennung für Google Cloud und Azure TTS

Voraussetzungen

Um das Plugin zu nutzen, benötigen Sie API-Zugangsdaten von einem der unterstützten Anbieter:

Für die Audioverarbeitung können Sie Ihre eigene Lösung implementieren oder das Runtime Audio Importer-Plugin verwenden, das Audiodaten in verschiedenen Formaten (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)) importieren kann. Weitere Informationen finden Sie hier.

Zusätzliche Ressourcen

Join our Discord
online · support