개요

Runtime AI Chatbot Integrator는 AI 챗봇과 텍스트-음성 변환 서비스를 프로젝트에 직접 원활하게 통합할 수 있게 해주는 크로스 플랫폼 언리얼 엔진 플러그인입니다. 이 플러그인은 여러 주요 AI 제공업체를 지원하며, 스트리밍 및 비스트리밍 응답 모드를 모두 갖춘 유연한 채팅 상호작용과 스트리밍 기능을 갖춘 고품질 텍스트-음성 변환을 제공합니다.
지원 기능
텍스트-텍스트 채팅
여러 주요 제공업체의 AI 기반 대화 기능을 통합합니다.
OpenAI
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-3.5 Turbo
- GPT-4o
- GPT-4o Mini
- GPT-4-32k
- GPT-4 Turbo
- GPT-4-1
- ChatGPT-4o Latest
- O1 Pro
- O1
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.5 Sonnet
- Claude 4 Sonnet
- Claude 4.1 Opus
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek Chat
- DeepSeek Reasoner (전용 추론 출력 포함)
Gemini (Google)
- Gemini 2.5 Pro
- Gemini Flash Latest
- Gemini Flash Lite Latest
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
- Grok 2 1212
- Grok Vision Beta
텍스트-음성 변환(TTS)
주요 TTS 제공업체를 사용하여 텍스트를 자연스러운 음성으로 변환하며, 표준 및 스트리밍 옵션을 모두 제공합니다.
OpenAI TTS
일반 및 스트리밍 지원을 포함한 여러 음성 옵션:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
모델:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
일반 및 스트리밍 지원을 포함한 여러 모델:
- Eleven V3 (70개 이상의 언어를 지원하는 인간 같은 표현력 있는 음성 생성 최신 모델)
- Eleven TTV V3 (70개 이상의 언어를 지원하는 인간 같은 표현력 있는 음성 설계 모델)
- Eleven Multilingual V2 (풍부한 감정 표현을 갖춘 가장 생생한 모델)
- Eleven Turbo V2 (영어에 최적화된 고품질, 저지연 모델)
- Eleven Turbo V2.5 (다국어 지원을 갖춘 고품질, 저지연 모델)
- Eleven Flash V2 (영어 실시간 사용에 최적화된 초고속 모델)
- Eleven Flash V2.5 (다국어 실시간 사용에 최적화된 초고속 모델)
- Eleven Monolingual V1
Google Cloud TTS
광범위한 언어 지원을 갖춘 고품질 신경망 음성:
- Neural2 음성
- Studio 음성
- Wavenet 음성
- Standard 음성
- Custom Voice 지원
- 여러 언어 및 로케일
- 세밀한 제어를 위한 SSML 지원
Azure TTS
광범위한 음성 옵션을 갖춘 Microsoft의 인지 음성 서비스:
- 여러 언어에 걸친 신경망 음성
- 음성 스타일 및 감정
- Custom Voice 지원
- SSML 마크업 지원
- 스트리밍을 포함한 여러 출력 형식
주요 기능
- 크로스 플랫폼 호환성 (Windows, Mac, Android, iOS, Linux, Meta Quest 등)
- 다중 AI 및 TTS 제공업체 지원
- 스트리밍 및 비스트리밍 채팅 응답
- 실시간 오디오 합성 및 처리를 위한 스트리밍 TTS
- 별도의 추론 및 콘텐츠 출력을 통한 추론 모델 지원 (DeepSeek, Grok)
- 최소 지연 시간으로 고품질 음성 합성
- Unreal Engine Blueprints 및 C++과의 쉬운 통합
- 유연한 구성 옵션
- ElevenLabs V3 모델로 70개 이상의 언어 지원
- Google Cloud 및 Azure TTS를 위한 음성 목록 조회 및 탐색
필수 조건
플러그인을 사용하려면 지원되는 제공업체 중 하나로부터 API 액세스 자격 증명이 필요합니다:
- OpenAI API
- Anthropic API
- DeepSeek API
- Google Gemini API
- xAI Grok API
- ElevenLabs API
- Google Cloud Text-to-Speech API
- Azure Cognitive Services Speech API
오디오 처리의 경우, 자체 솔루션을 구현하거나 Runtime Audio Importer 플러그인을 사용할 수 있습니다. 이 플러그인은 다양한 형식(MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM))의 오디오 데이터를 가져올 수 있습니다. 자세한 내용은 여기를 참조하세요.
추가 리소스
- Fab에서 구입하기
- 제품 웹사이트
- 데모 다운로드 (Windows)
- 데모 소스 파일 다운로드 (UE 5.6)
- Discord 지원 서버
- 비디오 데모 프로젝트 둘러보기 ⭐ NEW
- 맞춤형 개발: [email protected] (팀 및 조직을 위한 맞춤형 솔루션)