示範專案

為了幫助您快速上手 Runtime MetaHuman Lip Sync，我們提供了兩個可直接使用的示範專案。兩者皆以 Unreal Engine 5.6+ 建置，僅使用藍圖，並可跨平台執行於 Windows、Mac、Linux、iOS、Android 以及基於 Android 的平台（包括 Meta Quest）。

可用示範專案

AI 對話 NPC / 互動式虛擬角色
基本嘴型同步示範

一個 完整的 AI 對話虛擬角色工作流程，結合語音辨識、AI 聊天機器人（LLM）、文字轉語音以及音訊播放與即時嘴型同步——全部在同一個專案中執行。適用於多種使用情境，包括遊戲、互動式資訊站、虛擬製作、博物館裝置、數位助理 以及 訓練模擬。

流程概述

🎤 Microphone → Speech Recognition → 💬 LLM Chatbot → 🔊 Text-to-Speech → 👄 Lip Sync + Playback

影片

快速預覽 (~30 秒)

一個簡短的示範展示。

完整逐步解說

一個詳細的逐步解說，涵蓋設定、配置以及完整的對話流程。

下載

下載封裝示範 (Windows)
下載原始檔 (UE 5.6+)

必要與選用插件

示範專案是模組化的 - 您只需要您想使用的提供者所需的插件。

插件	用途	必要？
Runtime MetaHuman Lip Sync	嘴型同步動畫	✅ 總是
Runtime Audio Importer	音訊擷取與處理	✅ 總是
Runtime Speech Recognizer	離線語音辨識 (whisper.cpp)	✅ 總是
Runtime AI Chatbot Integrator	外部 LLM (OpenAI, Claude, DeepSeek, Gemini, Grok, Ollama) 和/或外部 TTS (OpenAI, ElevenLabs)	🔶 選用
Runtime Local LLM	透過 llama.cpp 進行本地 LLM 推論 (Llama, Mistral, Gemma 等 GGUF 模型)	🔶 選用
Runtime Text To Speech	透過 Piper 和 Kokoro 進行本地 TTS	🔶 選用

選用插件 - 提供者需求

雖然上述每個插件都是個別選用的，但示範需要至少一個 LLM 提供者和至少一個 TTS 提供者才能運作。您可以自由混合搭配 (例如，本地 LLM + ElevenLabs TTS，或 OpenAI LLM + 本地 TTS)。

模組化架構

在 Content 資料夾中，您會找到一個 Modules 資料夾，其中包含三個子資料夾：

Content/
└── Modules/
    ├── RuntimeAIChatbotIntegrator/   ← External LLMs and/or external TTS
    ├── RuntimeLocalLLM/              ← Local LLM via llama.cpp
    └── RuntimeTextToSpeech/          ← Local TTS via Piper/Kokoro

如果您沒有取得一個（或多個）可選外掛，只需刪除對應的資料夾。示範專案的基礎資產（遊戲實例、小工具等）並未直接參考這些模組，因此刪除它們不會導致資產參考錯誤。設定 UI 會自動隱藏任何缺少資料夾的提供者。

備註

此模組化僅適用於 LLM 和 TTS 提供者。語音辨識（Runtime Speech Recognizer）和嘴型同步（Runtime MetaHuman Lip Sync）是基礎示範專案的一部分，且始終為必要。

Modules 資料夾結構

注意

首次啟動時，Unreal 可能會詢問是否要停用任何遺失的可選外掛 - 請點擊是。請確保您也已刪除了對應的 Content/Modules/ 資料夾（見上方說明）。

示範專案佈局

UI 僅供示範用途

下方顯示的使用者介面完全使用 UMG（Unreal Motion Graphics）建置，其目的純粹是為了示範流程 - 語音辨識 → LLM → TTS → 嘴型同步。您可以自由地重新設計樣式或替換它，以符合您專案的視覺設計、控制方案或平台（VR/AR、行動裝置、遊戲主機、資訊站等）。如果某些小工具在您的使用案例中不需要，您也可以直接隱藏它們（例如，將其可見性設為 Collapsed 或 Hidden）。

示範專案主畫面註解總覽

區域	內容
中央	MetaHuman 角色。
左側	四個設定按鈕（語音辨識、AI 聊天機器人、文字轉語音、動畫），詳細說明如下。
中央底部	一個開始錄製按鈕。點擊它以開始語音對話：您的麥克風會被擷取、轉錄、發送給 LLM，回應會透過 TTS 合成，並伴隨嘴型同步播放，全程無需手動操作。
右側中央	一個對話歷史記錄小工具，顯示您與 AI 之間完整的來回對話（包含使用者和助理訊息）。它還包含一個文字輸入欄位，讓您可以直接輸入訊息而無需使用語音辨識，這對於測試、無障礙存取或麥克風不可用時非常有用。

提示

您可以在同一個會話中自由混合兩種輸入模式 - 有些訊息用說的，有些用打的。

設定按鈕

左側的四個設定按鈕會為流程的每個部分開啟專用面板：

1. 設定語音辨識

設定如何擷取和轉錄使用者的語音：

選擇語言
調整語音辨識參數（Whisper 模型設定）
設定 AEC（聲學迴聲消除）
設定 VAD（語音活動偵測）

語音辨識設定畫面

2. 設定 AI 聊天機器人

選擇您的 LLM 提供者並進行設定：

選擇提供者（Runtime AI Chatbot Integrator 或 Runtime Local LLM）
對於外部提供者：授權令牌、模型名稱等
對於本地 LLM：選擇一個 GGUF 模型，設定上下文大小和其他推論參數。您也可以直接從示範專案中在執行階段下載您自己的 GGUF 模型（例如透過 URL），並立即使用，無需重建專案。

提示

提供者下拉選單只會顯示其外掛模組資料夾存在於 Content/Modules/ 中的提供者。

AI 聊天機器人設定 - Runtime AI Chatbot Integrator（外部 LLM）

AI 聊天機器人設定 - Runtime Local LLM（本地 GGUF）

3. 設定文字轉語音

選擇您的 TTS 提供者並設定語音/模型：

選擇提供者（用於 OpenAI/ElevenLabs 的 Runtime AI Chatbot Integrator，或用於本地 Piper/Kokoro 的 Runtime Text To Speech）
選擇語音/模型
調整提供者特定的參數

TTS 設定 - Runtime AI Chatbot Integrator（外部 TTS）

TTS 設定 - Runtime Local Text To Speech（本地 Piper/Kokoro）

4. 設定動畫

控制您的 AI 虛擬角色的視覺效果：

在 3 個預先下載的 MetaHuman 角色（Aera、Ada、Orlando）之間選擇
選擇嘴型同步模型（Standard 或 Realistic）
選擇嘴型同步模型類型 - Highly Optimized、Semi-Optimized 或 Original（請參閱模型類型）
調整處理區塊大小 - 控制嘴型同步推論的執行頻率（請參閱處理區塊大小）
選擇一個在對話期間於 MetaHuman 上播放的閒置動畫

動畫設定畫面

在編輯器中預先設定示範專案

在使用原始碼版本時，您可以直接在編輯器中預先填入預設值，這樣每次執行時就不需要重新輸入數值：

項目	位置
一般設定（嘴型同步模型、閒置動畫、角色類別、語音辨識等）	`Content/LipSyncSTSGameInstance`
外部 LLM / 外部 TTS 設定（Runtime AI Chatbot Integrator）	`Content/Modules/RuntimeAIChatbotIntegrator/RuntimeAIChatbotIntegrator_Provider`
本地 LLM 設定（Runtime Local LLM）	`Content/Modules/RuntimeLocalLLM/RuntimeLocalLLM_Provider`
本地 TTS 設定（Runtime Text To Speech）	`Content/Modules/RuntimeTextToSpeech/RuntimeTextToSpeech_Provider`

跨平台注意事項

示範專案使用的所有外掛都支援 Windows、Mac、Linux、iOS、Android 以及基於 Android 的平台（包括 Meta Quest），因此示範專案也能在所有這些平台上運作。這使其適用於部署在各種環境中 - 從遊戲和桌面資訊站到行動應用程式、獨立 VR 頭戴裝置以及片場虛擬製作設定。

對於效能較弱的裝置（行動裝置、獨立 VR），您可能需要：

使用 Standard 嘴型同步模型 而非 Realistic - 請參閱模型比較
切換到 Highly Optimized 模型類型
增加處理區塊大小以減少 CPU 負載
選擇較小的 LLM / TTS 模型

請參閱平台特定設定以了解 Android、iOS、Mac 和 Linux 上的額外設定步驟。

帶入您自己的角色

示範專案附帶三個範例 MetaHuman 角色（Aera、Ada、Orlando），但您可以匯入自己的 MetaHuman 並在示範專案中使用。

📺 影片教學： 將自訂 MetaHuman 角色加入示範專案

備註

Runtime MetaHuman Lip Sync 外掛本身支援許多超越 MetaHuman 的其他角色系統（基於 ARKit 的角色、Daz Genesis 8/9、Reallusion CC3/CC4、Mixamo、ReadyPlayerMe 等 - 請參閱自訂角色設定指南）。無論您是在建構遊戲 NPC、虛擬主持人、資訊站服務員，還是用於虛擬製作的數位人類，此外掛都能適應您的角色流程。

一個更簡單的示範專案，純粹專注於嘴型同步功能本身，沒有完整的 AI 對話流程。如果您只想看到嘴型同步與各種音訊來源的實際運作情況，這個專案很適合。

精選影片

下載

包含內容

此示範專案展示了基本的嘴型同步工作流程：

麥克風輸入 - 從即時音訊進行即時嘴型同步
音訊檔案播放 - 從匯入的音訊檔案進行嘴型同步
文字轉語音 - 由合成的語音驅動的嘴型同步

必要與可選外掛

外掛	用途	必要？
Runtime MetaHuman Lip Sync	嘴型同步動畫	✅ 必要
Runtime Audio Importer	音訊匯入與擷取	✅ 必要
Runtime Text To Speech	用於 TTS 示範場景的本地 TTS	🔶 可選
Runtime AI Chatbot Integrator	外部 TTS 提供者（OpenAI、ElevenLabs）	🔶 可選

標準嘴型同步模型的注意事項

如果您計劃在任何一個示範專案中使用 Standard 模型（而非 Realistic），您需要安裝 Standard Lip Sync Extension 外掛。請參閱標準模型擴充以了解安裝說明。

需要協助？

如果您在設定或執行示範專案時遇到任何問題，請隨時聯繫：

Join our Discord

online · support

對於客製化開發需求（例如：為示範專案擴展您自己的邏輯、針對特定平台或角色管線進行調整），請聯絡 [email protected]。

可用示範專案​

流程概述​

影片​

快速預覽 (~30 秒)​

完整逐步解說​

下載​

必要與選用插件​

模組化架構​

示範專案佈局​

設定按鈕​

1. 設定語音辨識​

2. 設定 AI 聊天機器人​

3. 設定文字轉語音​

4. 設定動畫​

在編輯器中預先設定示範專案​

跨平台注意事項​

帶入您自己的角色​

精選影片​

下載​

包含內容​

必要與可選外掛​

標準嘴型同步模型的注意事項​

需要協助？​