如何使用语音模型
选择、下载与打包模型
本插件支持多种语言、音色和音质。您可以通过编辑器中的插件设置轻松下载并管理所需的语音模型。请按照以下步骤选择、下载并准备语音模型:
- 在编辑器中打开项目设置,导航至 插件 -> Runtime Text To Speech。
- 在 可下载语音模型 列表中,点击目标语音模型旁的 下载 按钮。支持同时下载多个语音模型。
- 下载完成后,模型将出现在列表顶部的 已下载语音模型 区域,并可在项目中使用。
- 可选操作:通过在文本框中输入文字并点击 播放 按钮,可预览已下载的语音模型。该功能会在编辑器内合成并播放指定文本,便于测试音效是否符合预期。
要删除已下载的语音模型,点击对应模型旁的 删除 按钮。
所有已下载的语音模型都会随项目打包发布,请及时删除不再需要的模型以减小项目体积。
导入自定义语音模型
除预设语音模型外,您还可以导入自定义语音模型。本插件支持 Piper 和 Kokoro 两种格式的语音模型:
- 在插件设置界面顶部点击 导入自定义语音模型 按钮
- 在弹出的对话框中选择模型类型(Piper 或 Kokoro)
- 浏览并选择模型文件:
- Piper:选择 ONNX 格式模型文件 (*.onnx)
- Kokoro:选择 BIN 格式风格文件 (*.bin)
- 浏览并选择对应的配置文件 (*.json):
- Piper:包含采样率、音素映射和推理参数等设置
- Kokoro:包含分词器配置
- 对于 Kokoro 模型,需指定语言代码(如 en-us、en-gb-x-rp、fr、es 等)
- 点击 导入 将自定义语音模型添加至项目
自定义语音模型注意事项
-
Piper 模型:可使用自定义训练的 Piper 语音模型,特别适用于需要预设列表中没有的特定音色场景。ONNX 模型与 JSON 配置文件必须符合 Piper 格式要求。
-
Kokoro 模型:采用双文件系统,包含风格文件(BIN 格式)和共享的 ONNX 模型。首次导入 Kokoro 风格文件时,插件会自动提示下载所需的 ONNX 模型。
-
语言代码:Kokoro 模型的语言代码对音素转换至关重要,常用代码包括:
- 英语(美式):
en-us
- 英语(英式):
en-gb-x-rp
- 西班牙语:
es
- 法语:
fr
- 意大利语:
it
- 葡萄牙语(巴西):
pt-br
- 中文(普通话):
cmn
- 印地语:
hi
- 德语:
de
- 英语(美式):
自定义语音模型与下载的模型具有相同处理方式,会随项目一起打包发布。