跳到主要内容

如何使用语音模型

选择、下载与打包模型

本插件支持多种语言、音色和音质。您可以通过编辑器中的插件设置轻松下载并管理所需的语音模型。请按照以下步骤选择、下载并准备语音模型:

  1. 在编辑器中打开项目设置,导航至 插件 -> Runtime Text To Speech
  2. 可下载语音模型 列表中,点击目标语音模型旁的 下载 按钮。支持同时下载多个语音模型。
  3. 下载完成后,模型将出现在列表顶部的 已下载语音模型 区域,并可在项目中使用。
  4. 可选操作:通过在文本框中输入文字并点击 播放 按钮,可预览已下载的语音模型。该功能会在编辑器内合成并播放指定文本,便于测试音效是否符合预期。

要删除已下载的语音模型,点击对应模型旁的 删除 按钮。

所有已下载的语音模型都会随项目打包发布,请及时删除不再需要的模型以减小项目体积。

导入自定义语音模型

除预设语音模型外,您还可以导入自定义语音模型。本插件支持 Piper 和 Kokoro 两种格式的语音模型:

  1. 在插件设置界面顶部点击 导入自定义语音模型 按钮
  2. 在弹出的对话框中选择模型类型(Piper 或 Kokoro)
  3. 浏览并选择模型文件:
    • Piper:选择 ONNX 格式模型文件 (*.onnx)
    • Kokoro:选择 BIN 格式风格文件 (*.bin)
  4. 浏览并选择对应的配置文件 (*.json):
    • Piper:包含采样率、音素映射和推理参数等设置
    • Kokoro:包含分词器配置
  5. 对于 Kokoro 模型,需指定语言代码(如 en-us、en-gb-x-rp、fr、es 等)
  6. 点击 导入 将自定义语音模型添加至项目

自定义语音模型注意事项

  • Piper 模型:可使用自定义训练的 Piper 语音模型,特别适用于需要预设列表中没有的特定音色场景。ONNX 模型与 JSON 配置文件必须符合 Piper 格式要求。

  • Kokoro 模型:采用双文件系统,包含风格文件(BIN 格式)和共享的 ONNX 模型。首次导入 Kokoro 风格文件时,插件会自动提示下载所需的 ONNX 模型。

  • 语言代码:Kokoro 模型的语言代码对音素转换至关重要,常用代码包括:

    • 英语(美式):en-us
    • 英语(英式):en-gb-x-rp
    • 西班牙语:es
    • 法语:fr
    • 意大利语:it
    • 葡萄牙语(巴西):pt-br
    • 中文(普通话):cmn
    • 印地语:hi
    • 德语:de

自定义语音模型与下载的模型具有相同处理方式,会随项目一起打包发布。