अवलोकन
Runtime MetaHuman Lip Sync एक प्लगइन है जो मेटाह्यूमन और कस्टम कैरेक्टर्स दोनों के लिए रियल-टाइम, ऑफ़लाइन और क्रॉस-प्लेटफ़ॉर्म लिप सिंक सक्षम करता है। यह आपको विभिन्न स्रोतों से ऑडियो इनपुट के जवाब में किसी कैरेक्टर के होंठों को एनिमेट करने की अनुमति देता है, जिसमें शामिल हैं:
- रनटाइम ऑडियो इम्पोर्टर के कैप्चर करने योग्य साउंड वेव के माध्यम से माइक्रोफ़ोन इनपुट
- रनटाइम टेक्स्ट टू स्पीच या रनटाइम एआई चैटबॉट इंटीग्रेटर से सिंथेसाइज़्ड स्पीच
- फ्लोट पीसीएम फॉर्मेट में कोई भी ऑडियो डेटा (फ्लोटिंग-पॉइंट सैंपल्स की एक सरणी)
प्लगइन आंतरिक रूप से ऑडियो इनपुट के आधार पर वि सेम्स (फोनेम्स के दृश्य प्रतिनिधित्व) उत्पन्न करता है। चूंकि यह सीधे टेक्स्ट के बजाय ऑडियो डेटा के साथ काम करता है, प्लगइन अंग्रेजी, स्पेनिश, फ्रेंच, जर्मन, जापानी, चीनी, कोरियाई, रूसी, इतालवी, पुर्तगाली, अरबी और हिंदी सहित बहुभाषी इनपुट का समर्थन करता है। सचमुच कोई भी भाषा समर्थित है क्योंकि लिप सिंक ऑडियो फोनेम्स से उत्पन्न होता है न कि भाषा-विशिष्ट टेक्स्ट प्रोसेसिंग से।
स्टैंडर्ड मॉडल 14 विसेम्स उत्पन्न करता है और एक पूर्वनिर्धारित पोज़ एसेट का उपयोग करके लिप सिंक एनीमेशन करता है। इसके विपरीत, रियलिस्टिक मॉडल (जो केवल मेटाह्यूमन कैरेक्टर्स के लिए है) 250 मॉर्फ टारगेट परिवर्तन उत्पन्न करता है बिना किसी पूर्वनिर्धारित पोज़ एसेट पर निर्भर हुए, जिसके परिणामस्वरूप काफी अधिक यथार्थवादी चेहरे की एनिमेशन होती हैं।