Обзор

Runtime AI Chatbot Integrator — это кроссплатформенный плагин для Unreal Engine, который обеспечивает бесшовную интеграцию AI-чатботов и сервисов преобразования текста в речь непосредственно в ваши проекты. Плагин поддерживает несколько ведущих AI-провайдеров и предлагает гибкие возможности чат-взаимодействия как в режиме потоковой, так и непотоковой передачи ответов, а также высококачественное преобразование текста в речь с возможностью потоковой передачи.
Поддерживаемые функции
Чат «Текст-в-Текст»
Интегрируйте возможности диалогов на основе ИИ с несколькими ведущими провайдерами.
OpenAI
- GPT-5.5
- GPT-5.4
- GPT-5.4 Mini
- GPT-5.4 Nano
- GPT-5.3
- GPT-5.2
- GPT-5.1
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-4-1
- GPT-4-1 Mini
- GPT-4-1 Nano
- GPT-4o
- GPT-4o Mini
- GPT-4
- GPT-4 Turbo
- GPT-4-32k
- GPT-3.5 Turbo
- GPT-3.5 Turbo 16k
- ChatGPT-4o Latest
- O1
- O1 Pro
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.8 Opus
- Claude 4.7 Opus
- Claude 4.6 Opus
- Claude 4.6 Sonnet
- Claude 4.5 Haiku
- Claude 4.5 Sonnet
- Claude 4.5 Opus
- Claude 4.1 Opus
- Claude 4 Sonnet
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek V4 Pro
- DeepSeek V4 Flash
- DeepSeek Chat
- DeepSeek Reasoner (с выделенным выводом рассуждений)
Gemini (Google)
- Gemini 3.1 Pro
- Gemini 3.1 Flash Light
- Gemini 3.5 Flash
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4.3
- Grok 4.1 Fast Reasoning
- Grok 4.1 Fast Non-Reasoning
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4 0709
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
Ollama
Запускайте локальные AI-модели с полной конфиденциальностью и без необходимости в API-ключе:
- Любая модель, доступная в библиотеке Ollama (например, Llama 3, Mistral, Gemma, Phi, Qwen и другие)
- Пользовательские и дообученные модели, размещенные локально
Преобразование текста в речь (TTS)
Преобразуйте текст в естественно звучащую речь с помощью ведущих TTS-провайдеров, как в стандартном, так и в потоковом режимах.
OpenAI TTS
Несколько вариантов голосов с поддержкой обычного и потокового режимов:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
Модели:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
Несколько моделей с поддержкой обычного и потокового режимов:
- Eleven V3 (Новейшая модель с человекоподобной и выразительной генерацией речи, поддерживает 70+ языков)
- Eleven TTV V3 (Модель для дизайна «Текст в голос» с человекоподобной и выразительной речью, поддерживает 70+ языков)
- Eleven Multilingual V2 (Наиболее реалистичная модель с богатой эмоциональной выразительностью)
- Eleven Turbo V2 (Высококачественная модель с низкой задержкой, оптимизированная для английского языка)
- Eleven Turbo V2.5 (Высококачественная модель с низкой задержкой и поддержкой нескольких языков)
- Eleven Flash V2 (Сверхбыстрая модель, оптимизированная для использования в реальном времени на английском языке)
- Eleven Flash V2.5 (Сверхбыстрая модель, оптимизированная для использования в реальном времени с поддержкой нескольких языков)
- Eleven Monolingual V1
Google Cloud TTS
Высококачественные нейронные голоса с обширной языковой поддержкой:
- Голоса Neural2
- Голоса Studio
- Голоса Wavenet
- Стандартные голоса
- Поддержка пользовательских голосов
- Несколько языков и локалей
- Поддержка SSML для точного контроля
Azure TTS
Когнитивный речевой сервис Microsoft с обширными голосовыми возможностями:
- Нейронные голоса на нескольких языках
- Стили и эмоции голоса
- Поддержка пользовательских голосов
- Поддержка разметки SSML
Ключевые особенности
- Кроссплатформенная совместимость (Windows, Mac, Android, iOS, Linux, Meta Quest и другие)
- Поддержка нескольких AI и TTS-провайдеров
- Поддержка локальных моделей через Ollama (не требуется API-ключ, полная конфиденциальность)
- Потоковые и непотоковые ответы в чате
- Потоковое TTS для синтеза и обработки аудио в реальном времени
- Поддержка моделей рассуждений с отдельным выводом рассуждений и содержимого (DeepSeek, Grok)
- Высококачественный синтез речи с минимальной задержкой
- Простая интеграция с Blueprints и C++ в Unreal Engine
- Гибкие возможности настройки
- Поддержка 70+ языков с моделями ElevenLabs V3
- Обнаружение и просмотр голосов для Google Cloud и Azure TTS
Предварительные требования
Для использования плагина вам понадобятся учетные данные для доступа к API от одного из поддерживаемых провайдеров:
- OpenAI API
- Anthropic API
- DeepSeek API
- Google Gemini API
- xAI Grok API
- ElevenLabs API
- Google Cloud Text-to-Speech API
- Azure Cognitive Services Speech API
- Ollama (локально, API-ключ не требуется)
Для обработки аудио вы можете реализовать собственное решение или использовать плагин Runtime Audio Importer, который может импортировать аудиоданные в различных форматах (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Для получения дополнительной информации см. здесь.
Дополнительные ресурсы
- Приобрести на Fab
- Веб-сайт продукта
- Скачать демо (Windows)
- Скачать исходные файлы демо (UE 5.6+)
- Видео-обзор демонстрационного проекта
- Поддержка плагина и индивидуальная разработка: [email protected] (индивидуальные решения для команд и организаций)