概述

Runtime AI Chatbot Integrator 是一个跨平台的虚幻引擎插件,能够将 AI 聊天机器人和文本转语音服务无缝集成到您的项目中。该插件支持多个领先的 AI 提供商,并提供具有流式和非流式响应模式的灵活聊天交互,以及具有流式功能的高质量文本转语音转换。
支持的功能
文本到文本聊天
集成由 AI 驱动的对话能力,支持多个领先提供商。
OpenAI
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-3.5 Turbo
- GPT-4o
- GPT-4o Mini
- GPT-4-32k
- GPT-4 Turbo
- GPT-4-1
- ChatGPT-4o Latest
- O1 Pro
- O1
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.5 Sonnet
- Claude 4 Sonnet
- Claude 4.1 Opus
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek Chat
- DeepSeek Reasoner (具有专用推理输出)
Gemini (Google)
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
- Grok 2 1212
- Grok Vision Beta
文本转语音 (TTS)
使用领先的 TTS 提供商将文本转换为自然语音,提供标准和流式选项。
OpenAI TTS
多种语音选项,支持常规和流式:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
模型:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
多种模型,支持常规和流式:
- Eleven V3 (最新模型,具有类人且富有表现力的语音生成,支持 70+ 种语言)
- Eleven TTV V3 (文本到语音设计模型,具有类人且富有表现力的语音,支持 70+ 种语言)
- Eleven Multilingual V2 (最逼真的模型,具有丰富的情感表达)
- Eleven Turbo V2 (高质量、低延迟模型,针对英语优化)
- Eleven Turbo V2.5 (高质量、低延迟模型,支持多语言)
- Eleven Flash V2 (超快速模型,针对实时使用优化,适用于英语)
- Eleven Flash V2.5 (超快速模型,针对实时使用优化,支持多语言)
- Eleven Monolingual V1
Google Cloud TTS
高质量的神经语音,具有广泛的语言支持:
- Neural2 语音
- Studio 语音
- Wavenet 语音
- Standard 语音
- 自定义语音支持
- 多种语言和区域设置
- 支持 SSML 以实现精细控制
Azure TTS
微软的认知语音服务,具有广泛的语音选项:
- 跨多种语言的神经语音
- 语音风格和情感
- 自定义语音支持
- 支持 SSML 标记
- 包括流式在内的多种输出格式
主要功能
- 跨平台兼容性(Windows、Mac、Android、iOS、Linux、Meta Quest 等)
- 支持多种 AI 和 TTS 提供商
- 流式和非流式聊天响应
- 用于实时音频合成和处理的流式 TTS
- 支持具有独立推理和内容输出的推理模型(DeepSeek、Grok)
- 高质量语音合成,延迟极低
- 易于与 Unreal Engine Blueprints 和 C++ 集成
- 灵活的配置选项
- 支持 70 多种语言的 ElevenLabs V3 模型
- Google Cloud 和 Azure TTS 的语音列表和发现功能
先决条件
要使用该插件,您需要从以下受支持的提供商之一获取 API 访问凭据:
- OpenAI API
- Anthropic API
- DeepSeek API
- Google Gemini API
- xAI Grok API
- ElevenLabs API
- Google Cloud Text-to-Speech API
- Azure Cognitive Services Speech API
对于音频处理,您可以实现自己的解决方案,或使用 Runtime Audio Importer 插件,该插件可以导入各种格式的音频数据(MP3、WAV、FLAC、OGG VORBIS、OGG OPUS、BINK、RAW (PCM))。更多信息请参见此处。
其他资源
- 在 Fab 上获取
- 产品网站
- 下载演示(Windows)
- 下载演示源文件(UE 5.6)
- Discord 支持服务器
- 视频演示项目演练 ⭐ 新内容
- 定制开发:[email protected](为团队和组织提供量身定制的解决方案)