अवलोकन

Runtime AI Chatbot Integrator एक क्रॉस-प्लेटफ़ॉर्म Unreal Engine प्लगइन है जो आपके प्रोजेक्ट्स में AI चैटबॉट और टेक्स्ट-टू-स्पीच सेवाओं का सीधा एकीकरण सक्षम बनाता है। यह प्लगइन कई प्रमुख AI प्रदाताओं का समर्थन करता है और स्ट्रीमिंग और नॉन-स्ट्रीमिंग दोनों प्रतिक्रिया मोड के साथ लचीली चैट इंटरैक्शन, साथ ही स्ट्रीमिंग क्षमताओं के साथ उच्च-गुणवत्ता वाला टेक्स्ट-टू-स्पीच रूपांतरण प्रदान करता है।
समर्थित सुविधाएँ
टेक्स्ट-टू-टेक्स्ट चैट
कई प्रमुख प्रदाताओं के साथ AI-संचालित संवादी क्षमताओं को एकीकृत करें।
OpenAI
- GPT-5.5
- GPT-5.4
- GPT-5.4 Mini
- GPT-5.4 Nano
- GPT-5.3
- GPT-5.2
- GPT-5.1
- GPT-5
- GPT-5 Mini
- GPT-5 Nano
- GPT-4-1
- GPT-4-1 Mini
- GPT-4-1 Nano
- GPT-4o
- GPT-4o Mini
- GPT-4
- GPT-4 Turbo
- GPT-4-32k
- GPT-3.5 Turbo
- GPT-3.5 Turbo 16k
- ChatGPT-4o नवीनतम
- O1
- O1 Pro
- O3
- O3 Mini
- O4 Mini
Claude (Anthropic)
- Claude 4.8 Opus
- Claude 4.7 Opus
- Claude 4.6 Opus
- Claude 4.6 Sonnet
- Claude 4.5 Haiku
- Claude 4.5 Sonnet
- Claude 4.5 Opus
- Claude 4.1 Opus
- Claude 4 Sonnet
- Claude 4.0 Opus
- Claude 3.7 Sonnet
- Claude 3.5 Haiku
- Claude 3 Opus
DeepSeek
- DeepSeek V4 Pro
- DeepSeek V4 Flash
- DeepSeek Chat
- DeepSeek Reasoner (समर्पित तर्क आउटपुट के साथ)
Gemini (Google)
- Gemini 3.1 Pro
- Gemini 3.1 Flash Light
- Gemini 3.5 Flash
- Gemini 2.5 Pro
- Gemini Flash नवीनतम
- Gemini Flash Lite नवीनतम
- Gemini 2.5 Flash
- Gemini 2.5 Flash Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Grok (xAI)
- Grok 4.3
- Grok 4.1 Fast Reasoning
- Grok 4.1 Fast Non-Reasoning
- Grok 4 Fast Reasoning
- Grok 4 Fast Non-Reasoning
- Grok Code Fast 1
- Grok 4 0709
- Grok 3
- Grok 3 Mini
- Grok 2 Vision 1212
Ollama
पूर्ण गोपनीयता और बिना API कुंजी की आवश्यकता के स्थानीय AI मॉडल चलाएँ:
- Ollama लाइब्रेरी में उपलब्ध कोई भी मॉडल (जैसे, Llama 3, Mistral, Gemma, Phi, Qwen, और अधिक)
- स्थानीय रूप से होस्ट किए गए कस्टम और फ़ाइन-ट्यून किए गए मॉडल
टेक्स्ट-टू-स्पीच (TTS)
मानक और स्ट्रीमिंग दोनों विकल्पों के साथ, प्रमुख TTS प्रदाताओं का उपयोग करके टेक्स्ट को प्राकृतिक-ध्वनि वाले भाषण में बदलें।
OpenAI TTS
नियमित और स्ट्रीमिंग समर्थन के साथ कई आवाज़ विकल्प:
- Alloy
- Ash
- Ballad
- Coral
- Echo
- Fable
- Onyx
- Nova
- Sage
- Shimmer
- Verse
मॉडल:
- TTS-1
- TTS-1-HD
- GPT-4o Mini TTS
ElevenLabs TTS
नियमित और स्ट्रीमिंग समर्थन के साथ कई मॉडल:
- Eleven V3 (मानव-समान और अभिव्यंजक भाषण पीढ़ी वाला नवीनतम मॉडल, 70+ भाषाओं का समर्थन करता है)
- Eleven TTV V3 (मानव-समान और अभिव्यंजक भाषण वाला टेक्स्ट टू वॉयस डिज़ाइन मॉडल, 70+ भाषाओं का समर्थन करता है)
- Eleven Multilingual V2 (समृद्ध भावनात्मक अभिव्यक्ति वाला सबसे यथार्थवादी मॉडल)
- Eleven Turbo V2 (अंग्रेज़ी के लिए अनुकूलित उच्च गुणवत्ता, कम-विलंबता वाला मॉडल)
- Eleven Turbo V2.5 (बहुभाषी समर्थन के साथ उच्च गुणवत्ता, कम-विलंबता वाला मॉडल)
- Eleven Flash V2 (अंग्रेज़ी में रीयल-टाइम उपयोग के लिए अनुकूलित अल्ट्रा-फ़ास्ट मॉडल)
- Eleven Flash V2.5 (बहुभाषी समर्थन के साथ रीयल-टाइम उपयोग के लिए अनुकूलित अल्ट्रा-फ़ास्ट मॉडल)
- Eleven Monolingual V1
Google Cloud TTS
व्यापक भाषा समर्थन के साथ उच्च-गुणवत्ता वाली तंत्रिका आवाज़ें:
- Neural2 आवाज़ें
- Studio आवाज़ें
- Wavenet आवाज़ें
- मानक आवाज़ें
- कस्टम वॉयस समर्थन
- कई भाषाएँ और स्थान
- बारीक नियंत्रण के लिए SSML समर्थन
Azure TTS
व्यापक आवाज़ विकल्पों के साथ Microsoft की संज्ञानात्मक भाषण सेवा:
- कई भाषाओं में तंत्रिका आवाज़ें
- आवाज़ शैलियाँ और भावनाएँ
- कस्टम वॉयस समर्थन
- SSML मार्कअप समर्थन
मुख्य विशेषताएँ
- क्रॉस-प्लेटफ़ॉर्म संगतता (Windows, Mac, Android, iOS, Linux, Meta Quest, और अधिक)
- कई AI और TTS प्रदाताओं के लिए समर्थन
- Ollama के माध्यम से स्थानीय मॉडल समर्थन (कोई API कुंजी आवश्यक नहीं, पूर्ण गोपनीयता)
- स्ट्रीमिंग और नॉन-स्ट्रीमिंग चैट प्रतिक्रियाएँ
- रीयल-टाइम ऑडियो संश्लेषण और प्रसंस्करण के लिए स्ट्रीमिंग TTS
- अलग तर्क और सामग्री आउटपुट के साथ तर्क मॉडल समर्थन (DeepSeek, Grok)
- न्यूनतम विलंबता के साथ उच्च-गुणवत्ता वाला वॉयस संश्लेषण
- Unreal Engine Blueprints और C++ के साथ आसान एकीकरण
- लचीले कॉन्फ़िगरेशन विकल्प
- ElevenLabs V3 मॉडल के साथ 70+ भाषाओं के लिए समर्थन
- Google Cloud और Azure TTS के लिए वॉयस सूची और खोज
पूर्वापेक्षाएँ
प्लगइन का उपयोग करने के लिए, आपको समर्थित प्रदाताओं में से किसी एक से API एक्सेस क्रेडेंशियल्स की आवश्यकता होगी:
- OpenAI API
- Anthropic API
- DeepSeek API
- Google Gemini API
- xAI Grok API
- ElevenLabs API
- Google Cloud Text-to-Speech API
- Azure Cognitive Services Speech API
- Ollama (स्थानीय, कोई API कुंजी आवश्यक नहीं)
ऑडियो प्रसंस्करण के लिए, आप अपना स्वयं का समाधान लागू कर सकते हैं या Runtime Audio Importer प्लगइन का उपयोग कर सकते हैं, जो विभिन्न प्रारूपों (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)) में ऑडियो डेटा आयात कर सकता है। अधिक जानकारी के लिए, यहाँ देखें।
अतिरिक्त संसाधन
- Fab पर प्राप्त करें
- उत्पाद वेबसाइट
- डेमो डाउनलोड करें (Windows)
- डेमो स्रोत फ़ाइलें डाउनलोड करें (UE 5.6+)
- वीडियो डेमो प्रोजेक्ट वॉकथ्रू
- प्लगइन समर्थन और कस्टम विकास: [email protected] (टीमों और संगठनों के लिए अनुकूलित समाधान)