Перейти к основному содержимому

Обзор

Runtime AI Chatbot Integrator Documentation

Runtime AI Chatbot Integrator — это кроссплатформенный плагин для Unreal Engine, который обеспечивает бесшовную интеграцию AI-чатботов и сервисов преобразования текста в речь прямо в ваши проекты. Плагин поддерживает несколько ведущих AI-провайдеров и предлагает гибкое взаимодействие с чатом в режимах потоковой и непотоковой передачи ответов, а также высококачественное преобразование текста в речь с возможностью потоковой передачи.

Поддерживаемые возможности

Текст-в-Текст Чат

Интегрируйте возможности для ведения диалогов на основе искусственного интеллекта от нескольких ведущих провайдеров.

OpenAI

  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Latest
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek Chat
  • DeepSeek Reasoner (с выделенным выводом рассуждений)

Gemini (Google)

  • Gemini 3.1 Pro Preview
  • Gemini 3 Pro Preview
  • Gemini 3 Flash Preview
  • Gemini 2.5 Pro
  • Gemini Flash Latest
  • Gemini Flash Lite Latest
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Запускайте локальные AI-модели с полной приватностью и без необходимости в API-ключе:

  • Любая модель, доступная в библиотеке Ollama (например, Llama 3, Mistral, Gemma, Phi, Qwen и другие)
  • Пользовательские и дообученные модели, размещённые локально

Текст-в-Речь (TTS)

Преобразуйте текст в естественно звучащую речь с использованием ведущих TTS-провайдеров, с поддержкой как стандартных, так и потоковых опций.

OpenAI TTS

Несколько вариантов голоса с поддержкой обычного и потокового режима:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Модели:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Несколько моделей с поддержкой обычного и потокового режима:

  • Eleven V3 (Последняя модель с человеческим и выразительным синтезом речи, поддерживает 70+ языков)
  • Eleven TTV V3 (Модель для дизайна "Текст в Голос" с человеческим и выразительным синтезом речи, поддерживает 70+ языков)
  • Eleven Multilingual V2 (Самая реалистичная модель с богатой эмоциональной выразительностью)
  • Eleven Turbo V2 (Высококачественная модель с низкой задержкой, оптимизированная для английского языка)
  • Eleven Turbo V2.5 (Высококачественная модель с низкой задержкой и поддержкой нескольких языков)
  • Eleven Flash V2 (Сверхбыстрая модель, оптимизированная для использования в реальном времени на английском языке)
  • Eleven Flash V2.5 (Сверхбыстрая модель, оптимизированная для использования в реальном времени с поддержкой нескольких языков)
  • Eleven Monolingual V1

Google Cloud TTS

Высококачественные нейронные голоса с обширной языковой поддержкой:

  • Neural2 голоса
  • Studio голоса
  • Wavenet голоса
  • Standard голоса
  • Поддержка Custom Voice
  • Множество языков и локалей
  • Поддержка SSML для детального контроля

Azure TTS

Когнитивный сервис речи от Microsoft с широким выбором голосов:

  • Нейронные голоса на множестве языков
  • Стили голоса и эмоции
  • Поддержка пользовательских голосов
  • Поддержка разметки SSML

Ключевые возможности

  • Кроссплатформенная совместимость (Windows, Mac, Android, iOS, Linux, Meta Quest и другие)
  • Поддержка нескольких AI- и TTS-провайдеров
  • Поддержка локальных моделей через Ollama (не требуется API-ключ, полная приватность)
  • Потоковые и непотоковые ответы в чате
  • Потоковый TTS для синтеза и обработки аудио в реальном времени
  • Поддержка моделей с рассуждениями с раздельным выводом рассуждений и контента (DeepSeek, Grok)
  • Высококачественный синтез речи с минимальной задержкой
  • Простая интеграция с Blueprints и C++ в Unreal Engine
  • Гибкие опции конфигурации
  • Поддержка 70+ языков в моделях ElevenLabs V3
  • Список и обнаружение голосов для Google Cloud и Azure TTS

Предварительные требования

Для использования плагина вам потребуются учетные данные для доступа к API от одного из поддерживаемых провайдеров:

Для обработки аудио вы можете реализовать собственное решение или использовать плагин Runtime Audio Importer, который может импортировать аудиоданные в различных форматах (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Для получения дополнительной информации см. здесь.

Дополнительные ресурсы