概要

Runtime AI Chatbot Integrator は、AIチャットボットとテキスト読み上げサービスをプロジェクトに直接シームレスに統合できる、クロスプラットフォームのUnreal Engineプラグインです。このプラグインは複数の主要なAIプロバイダーをサポートし、ストリーミングおよび非ストリーミングの応答モードによる柔軟なチャット対話と、ストリーミング機能を備えた高品質なテキスト読み上げ変換を提供します。
サポートされる機能
テキスト対テキストチャット
複数の主要プロバイダーによるAI駆動の会話機能を統合します。
OpenAI
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-3.5 Turbo
- GPT-4o
- GPT-4o Mini
- GPT-4-32k
- GPT-4 Turbo
- GPT-4-1
- ChatGPT-4o Latest
- O1 Pro
- O1
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.5 Sonnet
- Claude 4 Sonnet
- Claude 4.1 Opus
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek Chat
- DeepSeek Reasoner (専用の推論出力付き)
Gemini (Google)
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
- Grok 2 1212
- Grok Vision Beta
テキスト読み上げ (TTS)
主要なTTSプロバイダーを使用して、テキストを自然な音声に変換します。標準オプションとストリーミングオプションの両方を利用できます。
OpenAI TTS
複数の音声オプションと通常およびストリーミングサポート:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
モデル:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
通常およびストリーミングサポートを備えた複数のモデル:
- Eleven V3 (人間らしく表現力豊かな音声生成をサポートする最新モデル、70以上の言語をサポート)
- Eleven TTV V3 (人間らしく表現力豊かな音声を設計したテキスト読み上げモデル、70以上の言語をサポート)
- Eleven Multilingual V2 (豊かな感情表現を備えた最も生き生きとしたモデル)
- Eleven Turbo V2 (高品質、低遅延のモデル、英語に最適化)
- Eleven Turbo V2.5 (高品質、低遅延のモデル、多言語サポート)
- Eleven Flash V2 (リアルタイム使用に最適化された超高速モデル、英語用)
- Eleven Flash V2.5 (リアルタイム使用に最適化された超高速モデル、多言語サポート)
- Eleven Monolingual V1
Google Cloud TTS
広範な言語サポートを備えた高品質なニューラル音声:
- Neural2 音声
- Studio 音声
- Wavenet 音声
- Standard 音声
- カスタム音声サポート
- 複数の言語とロケール
- きめ細かな制御のためのSSMLサポート
Azure TTS
Microsoftの認知音声サービス、広範な音声オプション:
- 複数言語にわたるニューラル音声
- 音声スタイルと感情
- カスタム音声サポート
- SSMLマークアップサポート
- ストリーミングを含む複数の出力形式
主な機能
- クロスプラットフォーム互換性(Windows、Mac、Android、iOS、Linux、Meta Questなど)
- 複数のAIおよびTTSプロバイダーのサポート
- ストリーミングおよび非ストリーミングのチャット応答
- リアルタイム音声合成と処理のためのストリーミングTTS
- 推論モデルのサポート(推論とコンテンツ出力を分離)(DeepSeek、Grok)
- 最小限のレイテンシでの高品質な音声合成
- Unreal Engine BlueprintsおよびC++との簡単な統合
- 柔軟な設定オプション
- ElevenLabs V3モデルによる70以上の言語サポート
- Google CloudおよびAzure TTSのための音声一覧表示と検出
前提条件
プラグインを使用するには、サポートされているプロバイダーのいずれかからAPIアクセス資格情報が必要です:
- OpenAI API
- Anthropic API
- DeepSeek API
- Google Gemini API
- xAI Grok API
- ElevenLabs API
- Google Cloud Text-to-Speech API
- Azure Cognitive Services Speech API
オーディオ処理については、独自のソリューションを実装するか、Runtime Audio Importerプラグインを使用できます。このプラグインは様々な形式(MP3、WAV、FLAC、OGG VORBIS、OGG OPUS、BINK、RAW (PCM))のオーディオデータをインポートできます。詳細については、こちらを参照してください。
追加リソース
- Fabで入手
- 製品ウェブサイト
- デモ版ダウンロード(Windows)
- デモソースファイルダウンロード(UE 5.6)
- Discordサポートサーバー
- ビデオデモプロジェクトウォークスルー ⭐ 新着
- カスタム開発:[email protected](チームおよび組織向けのテーラーメイドソリューション)