跳到主要内容

概述

Runtime AI Chatbot Integrator 文档

Runtime AI Chatbot Integrator 是一个跨平台的虚幻引擎插件,能够将 AI 聊天机器人和文本转语音服务无缝集成到您的项目中。该插件支持多个领先的 AI 提供商,并提供具有流式和非流式响应模式的灵活聊天交互,以及具有流式功能的高质量文本转语音转换。

支持的功能

文本到文本聊天

集成由 AI 驱动的对话能力,支持多个领先提供商。

OpenAI

  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-3.5 Turbo
  • GPT-4o
  • GPT-4o Mini
  • GPT-4-32k
  • GPT-4 Turbo
  • GPT-4-1
  • ChatGPT-4o Latest
  • O1 Pro
  • O1
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.5 Sonnet
  • Claude 4 Sonnet
  • Claude 4.1 Opus
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (具有专用推理输出)

Gemini (Google)

  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212
  • Grok 2 1212
  • Grok Vision Beta

文本转语音 (TTS)

使用领先的 TTS 提供商将文本转换为自然语音,提供标准和流式选项。

OpenAI TTS

多种语音选项,支持常规和流式:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

模型:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

多种模型,支持常规和流式:

  • Eleven V3 (最新模型,具有类人且富有表现力的语音生成,支持 70+ 种语言)
  • Eleven TTV V3 (文本到语音设计模型,具有类人且富有表现力的语音,支持 70+ 种语言)
  • Eleven Multilingual V2 (最逼真的模型,具有丰富的情感表达)
  • Eleven Turbo V2 (高质量、低延迟模型,针对英语优化)
  • Eleven Turbo V2.5 (高质量、低延迟模型,支持多语言)
  • Eleven Flash V2 (超快速模型,针对实时使用优化,适用于英语)
  • Eleven Flash V2.5 (超快速模型,针对实时使用优化,支持多语言)
  • Eleven Monolingual V1

Google Cloud TTS

高质量的神经语音,具有广泛的语言支持:

  • Neural2 语音
  • Studio 语音
  • Wavenet 语音
  • Standard 语音
  • 自定义语音支持
  • 多种语言和区域设置
  • 支持 SSML 以实现精细控制

Azure TTS

微软的认知语音服务,具有广泛的语音选项:

  • 跨多种语言的神经语音
  • 语音风格和情感
  • 自定义语音支持
  • 支持 SSML 标记
  • 包括流式在内的多种输出格式

主要功能

  • 跨平台兼容性(Windows、Mac、Android、iOS、Linux、Meta Quest 等)
  • 支持多种 AI 和 TTS 提供商
  • 流式和非流式聊天响应
  • 用于实时音频合成和处理的流式 TTS
  • 支持具有独立推理和内容输出的推理模型(DeepSeek、Grok)
  • 高质量语音合成,延迟极低
  • 易于与 Unreal Engine Blueprints 和 C++ 集成
  • 灵活的配置选项
  • 支持 70 多种语言的 ElevenLabs V3 模型
  • Google Cloud 和 Azure TTS 的语音列表和发现功能

先决条件

要使用该插件,您需要从以下受支持的提供商之一获取 API 访问凭据:

对于音频处理,您可以实现自己的解决方案,或使用 Runtime Audio Importer 插件,该插件可以导入各种格式的音频数据(MP3、WAV、FLAC、OGG VORBIS、OGG OPUS、BINK、RAW (PCM))。更多信息请参见此处

其他资源