概述

Runtime AI Chatbot Integrator 是一個跨平台的 Unreal Engine 插件,可讓您將 AI 聊天機器人和文字轉語音服務無縫整合到您的專案中。該插件支援多個領先的 AI 供應商,並提供具有串流和非串流回應模式的靈活聊天互動,以及具有串流功能的高品質文字轉語音轉換。
支援的功能
文字對文字聊天
整合由多個領先供應商提供的 AI 驅動對話功能。
OpenAI
- GPT-5.5
- GPT-5.4
- GPT-5.4 Mini
- GPT-5.4 Nano
- GPT-5.3
- GPT-5.2
- GPT-5.1
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-4-1
- GPT-4-1 Mini
- GPT-4-1 Nano
- GPT-4o
- GPT-4o Mini
- GPT-4
- GPT-4 Turbo
- GPT-4-32k
- GPT-3.5 Turbo
- GPT-3.5 Turbo 16k
- ChatGPT-4o Latest
- O1
- O1 Pro
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.8 Opus
- Claude 4.7 Opus
- Claude 4.6 Opus
- Claude 4.6 Sonnet
- Claude 4.5 Haiku
- Claude 4.5 Sonnet
- Claude 4.5 Opus
- Claude 4.1 Opus
- Claude 4 Sonnet
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek V4 Pro
- DeepSeek V4 Flash
- DeepSeek Chat
- DeepSeek Reasoner (具有專用推理輸出)
Gemini (Google)
- Gemini 3.1 Pro
- Gemini 3.1 Flash Light
- Gemini 3.5 Flash
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4.3
- Grok 4.1 Fast Reasoning
- Grok 4.1 Fast Non-Reasoning
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4 0709
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
Ollama
在本地執行 AI 模型,完全保護隱私且無需 API 金鑰:
- Ollama 函式庫中可用的任何模型(例如 Llama 3、Mistral、Gemma、Phi、Qwen 等)
- 本地託管的自訂和微調模型
文字轉語音 (TTS)
使用領先的 TTS 供應商將文字轉換為自然的語音,提供標準和串流選項。
OpenAI TTS
多種語音選項,支援常規和串流:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
模型:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
多種模型,支援常規和串流:
- Eleven V3(最新模型,具有類人且富有表現力的語音生成,支援 70 多種語言)
- Eleven TTV V3(文字轉語音設計模型,具有類人且富有表現力的語音,支援 70 多種語言)
- Eleven Multilingual V2(最逼真的模型,具有豐富的情感表達)
- Eleven Turbo V2(高品質、低延遲模型,針對英語最佳化)
- Eleven Turbo V2.5(高品質、低延遲模型,支援多語言)
- Eleven Flash V2(超快模型,針對即時英語使用最佳化)
- Eleven Flash V2.5(超快模型,針對即時多語言使用最佳化)
- Eleven Monolingual V1
Google Cloud TTS
高品質的神經語音,具有廣泛的語言支援:
- Neural2 語音
- Studio 語音
- Wavenet 語音
- 標準語音
- 自訂語音支援
- 多種語言和地區設定
- 支援 SSML 以進行精細控制
Azure TTS
Microsoft 的認知語音服務,具有廣泛的語音選項:
- 跨多種語言的神經語音
- 語音風格和情感
- 自訂語音支援
- SSML 標記支援
主要功能
- 跨平台相容性(Windows、Mac、Android、iOS、Linux、Meta Quest 等)
- 支援多個 AI 和 TTS 供應商
- 透過 Ollama 支援本地模型(無需 API 金鑰,完全保護隱私)
- 串流和非串流聊天回應
- 用於即時音訊合成和處理的串流 TTS
- 推理模型支援,具有獨立的推理和內容輸出(DeepSeek、Grok)
- 高品質語音合成,延遲極低
- 易於與 Unreal Engine Blueprints 和 C++ 整合
- 靈活的配置選項
- 使用 ElevenLabs V3 模型支援 70 多種語言
- Google Cloud 和 Azure TTS 的語音列表和探索
先決條件
要使用此插件,您需要從其中一個支援的供應商取得 API 存取憑證:
- OpenAI API
- Anthropic API
- DeepSeek API
- Google Gemini API
- xAI Grok API
- ElevenLabs API
- Google Cloud Text-to-Speech API
- Azure Cognitive Services Speech API
- Ollama(本地,無需 API 金鑰)
對於音訊處理,您可以實作自己的解決方案,或使用 Runtime Audio Importer 插件,該插件可以匯入多種格式的音訊資料(MP3、WAV、FLAC、OGG VORBIS、OGG OPUS、BINK、RAW (PCM))。如需更多資訊,請參閱此處。
其他資源
- 在 Fab 上獲取
- 產品網站
- 下載示範 (Windows)
- 下載示範原始檔 (UE 5.6+)
- 影片示範專案導覽
- 插件支援與自訂開發:[email protected](為團隊和組織提供的客製化解決方案)
Join our Discord
online · support