跳至主要内容

概述

Runtime AI Chatbot Integrator 文件

Runtime AI Chatbot Integrator 是一個跨平台的 Unreal Engine 插件,可讓您將 AI 聊天機器人和文字轉語音服務無縫整合到您的專案中。該插件支援多個領先的 AI 供應商,並提供具有串流和非串流回應模式的靈活聊天互動,以及具有串流功能的高品質文字轉語音轉換。

支援的功能

文字對文字聊天

整合由多個領先供應商提供的 AI 驅動對話功能。

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (具有專用推理輸出)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

在本地執行 AI 模型,完全保護隱私且無需 API 金鑰:

  • Ollama 函式庫中可用的任何模型(例如 Llama 3、Mistral、Gemma、Phi、Qwen 等)
  • 本地託管的自訂和微調模型

文字轉語音 (TTS)

使用領先的 TTS 供應商將文字轉換為自然的語音,提供標準和串流選項。

OpenAI TTS

多種語音選項,支援常規和串流:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

模型:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

多種模型,支援常規和串流:

  • Eleven V3(最新模型,具有類人且富有表現力的語音生成,支援 70 多種語言)
  • Eleven TTV V3(文字轉語音設計模型,具有類人且富有表現力的語音,支援 70 多種語言)
  • Eleven Multilingual V2(最逼真的模型,具有豐富的情感表達)
  • Eleven Turbo V2(高品質、低延遲模型,針對英語最佳化)
  • Eleven Turbo V2.5(高品質、低延遲模型,支援多語言)
  • Eleven Flash V2(超快模型,針對即時英語使用最佳化)
  • Eleven Flash V2.5(超快模型,針對即時多語言使用最佳化)
  • Eleven Monolingual V1

Google Cloud TTS

高品質的神經語音,具有廣泛的語言支援:

  • Neural2 語音
  • Studio 語音
  • Wavenet 語音
  • 標準語音
  • 自訂語音支援
  • 多種語言和地區設定
  • 支援 SSML 以進行精細控制

Azure TTS

Microsoft 的認知語音服務,具有廣泛的語音選項:

  • 跨多種語言的神經語音
  • 語音風格和情感
  • 自訂語音支援
  • SSML 標記支援

主要功能

  • 跨平台相容性(Windows、Mac、Android、iOS、Linux、Meta Quest 等)
  • 支援多個 AI 和 TTS 供應商
  • 透過 Ollama 支援本地模型(無需 API 金鑰,完全保護隱私)
  • 串流和非串流聊天回應
  • 用於即時音訊合成和處理的串流 TTS
  • 推理模型支援,具有獨立的推理和內容輸出(DeepSeek、Grok)
  • 高品質語音合成,延遲極低
  • 易於與 Unreal Engine Blueprints 和 C++ 整合
  • 靈活的配置選項
  • 使用 ElevenLabs V3 模型支援 70 多種語言
  • Google Cloud 和 Azure TTS 的語音列表和探索

先決條件

要使用此插件,您需要從其中一個支援的供應商取得 API 存取憑證:

對於音訊處理,您可以實作自己的解決方案,或使用 Runtime Audio Importer 插件,該插件可以匯入多種格式的音訊資料(MP3、WAV、FLAC、OGG VORBIS、OGG OPUS、BINK、RAW (PCM))。如需更多資訊,請參閱此處

其他資源

Join our Discord
online · support