メインコンテンツまでスキップ

概要

Runtime AI Chatbot Integrator ドキュメント

Runtime AI Chatbot Integrator は、AIチャットボットとテキスト読み上げサービスをプロジェクトに直接シームレスに統合できる、クロスプラットフォームのUnreal Engineプラグインです。このプラグインは複数の主要なAIプロバイダーをサポートし、ストリーミングおよび非ストリーミングの応答モードによる柔軟なチャット対話と、ストリーミング機能を備えた高品質なテキスト読み上げ変換を提供します。

サポートされる機能

テキスト対テキストチャット

複数の主要プロバイダーによるAI駆動の会話機能を統合します。

OpenAI

  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-3.5 Turbo
  • GPT-4o
  • GPT-4o Mini
  • GPT-4-32k
  • GPT-4 Turbo
  • GPT-4-1
  • ChatGPT-4o Latest
  • O1 Pro
  • O1
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.5 Sonnet
  • Claude 4 Sonnet
  • Claude 4.1 Opus
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (専用の推論出力付き)

Gemini (Google)

  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212
  • Grok 2 1212
  • Grok Vision Beta

テキスト読み上げ (TTS)

主要なTTSプロバイダーを使用して、テキストを自然な音声に変換します。標準オプションとストリーミングオプションの両方を利用できます。

OpenAI TTS

複数の音声オプションと通常およびストリーミングサポート:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

モデル:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

通常およびストリーミングサポートを備えた複数のモデル:

  • Eleven V3 (人間らしく表現力豊かな音声生成をサポートする最新モデル、70以上の言語をサポート)
  • Eleven TTV V3 (人間らしく表現力豊かな音声を設計したテキスト読み上げモデル、70以上の言語をサポート)
  • Eleven Multilingual V2 (豊かな感情表現を備えた最も生き生きとしたモデル)
  • Eleven Turbo V2 (高品質、低遅延のモデル、英語に最適化)
  • Eleven Turbo V2.5 (高品質、低遅延のモデル、多言語サポート)
  • Eleven Flash V2 (リアルタイム使用に最適化された超高速モデル、英語用)
  • Eleven Flash V2.5 (リアルタイム使用に最適化された超高速モデル、多言語サポート)
  • Eleven Monolingual V1

Google Cloud TTS

広範な言語サポートを備えた高品質なニューラル音声:

  • Neural2 音声
  • Studio 音声
  • Wavenet 音声
  • Standard 音声
  • カスタム音声サポート
  • 複数の言語とロケール
  • きめ細かな制御のためのSSMLサポート

Azure TTS

Microsoftの認知音声サービス、広範な音声オプション:

  • 複数言語にわたるニューラル音声
  • 音声スタイルと感情
  • カスタム音声サポート
  • SSMLマークアップサポート
  • ストリーミングを含む複数の出力形式

主な機能

  • クロスプラットフォーム互換性(Windows、Mac、Android、iOS、Linux、Meta Questなど)
  • 複数のAIおよびTTSプロバイダーのサポート
  • ストリーミングおよび非ストリーミングのチャット応答
  • リアルタイム音声合成と処理のためのストリーミングTTS
  • 推論モデルのサポート(推論とコンテンツ出力を分離)(DeepSeek、Grok)
  • 最小限のレイテンシでの高品質な音声合成
  • Unreal Engine BlueprintsおよびC++との簡単な統合
  • 柔軟な設定オプション
  • ElevenLabs V3モデルによる70以上の言語サポート
  • Google CloudおよびAzure TTSのための音声一覧表示と検出

前提条件

プラグインを使用するには、サポートされているプロバイダーのいずれかからAPIアクセス資格情報が必要です:

オーディオ処理については、独自のソリューションを実装するか、Runtime Audio Importerプラグインを使用できます。このプラグインは様々な形式(MP3、WAV、FLAC、OGG VORBIS、OGG OPUS、BINK、RAW (PCM))のオーディオデータをインポートできます。詳細については、こちらを参照してください。

追加リソース