跳至主要内容

如何使用語音模型

選擇、下載與打包模型

此插件支援多種語言、聲音與品質。您可以透過編輯器中的插件設定,輕鬆下載與管理所需的語音模型。請依照以下步驟選擇、下載並暫存語音模型:

  1. 在編輯器中開啟專案設定,導覽至 Plugins -> Runtime Text To Speech
  2. Available Voice Models to Download 清單中,點擊您想下載的語音模型旁的 Download 按鈕。您可以同時下載多個語音模型。
  3. 下載完成後,模型會出現在清單頂部的 Downloaded Voice Models 區段中,並可在您的專案中使用。
  4. 可選:您可以在文字欄位中輸入文字,然後點擊 Play 按鈕來預覽已下載的語音模型。這會使用選定的語音模型合成並播放文字。此功能有助於在編輯器中測試,以確保語音模型聽起來符合預期。

若要刪除任何已下載的語音模型,請點擊該模型旁的 Delete 按鈕。

所有已下載的語音模型都會與您的專案一起打包,因此為減少專案大小,請刪除不再需要的語音模型。

匯入自訂語音模型

除了預先配置的語音模型外,您還可以匯入自己的自訂語音模型。此插件支援 Piper 與 Kokoro 兩種語音模型格式:

  1. 在插件設定中,點擊畫面頂部的 Import Custom Voice Model 按鈕。
  2. 在出現的對話框中,選擇模型類型(Piper 或 Kokoro)。
  3. 瀏覽並選擇您的模型檔案:
    • 對於 Piper:選擇 ONNX 格式的模型檔案 (*.onnx)
    • 對於 Kokoro:選擇 BIN 格式的風格檔案 (*.bin)
  4. 瀏覽並選擇對應的設定檔 (*.json):
    • 對於 Piper:此檔案包含取樣率、音素映射與推論參數等設定
    • 對於 Kokoro:此檔案包含 tokenizer 配置
  5. 對於 Kokoro 模型,請指定語言代碼(例如:en-us、en-gb-x-rp、fr、es 等)
  6. 點擊 Import 將自訂語音模型新增至您的專案。

自訂語音模型的注意事項

  • Piper 模型:您可以使用自訂訓練的 Piper 語音模型,這在您訓練了自己的語音或需要預設清單中未提供的特定語音時特別有用。ONNX 模型與 JSON 設定檔必須與 Piper 格式相容。

  • Kokoro 模型:此類模型使用雙部分系統:風格檔案(BIN 格式)與共享的 ONNX 模型。當您首次匯入 Kokoro 風格檔案時,插件會自動提供下載所需的 ONNX 模型。

  • 語言代碼:對於 Kokoro 模型,語言代碼對於正確的音素轉換非常重要。常見代碼包括:

    • 美式英語:en-us
    • 英式英語:en-gb-x-rp
    • 西班牙語:es
    • 法語:fr
    • 義大利語:it
    • 巴西葡萄牙語:pt-br
    • 中文(普通話):cmn
    • 印地語:hi
    • 德語:de

自訂語音模型的處理方式與已下載的模型相同,並會與您的專案一起打包。