Как использовать голосовые модели
Выбор, загрузка и упаковка моделей
Плагин поддерживает несколько языков, голосов и качеств. Вы можете легко загружать и управлять нужными голосовыми моделями через настройки плагина в редакторе. Следуйте этим шагам для выбора, загрузки и подготовки голосовых моделей:
- Откройте настройки проекта в редакторе и перейдите в Plugins -> Runtime Text To Speech.
- В списке Available Voice Models to Download нажмите кнопку Download рядом с голосовой моделью, которую хотите загрузить. Вы можете загружать несколько голосовых моделей одновременно.
- После завершения загр узки модели появятся в разделе Downloaded Voice Models в верхней части списка и станут доступны для использования в вашем проекте.
- Опционально, вы можете прослушать загруженные голосовые модели, введя текст в текстовое поле и нажав кнопку Play. Это синтезирует и воспроизведёт текст с использованием выбранной голосовой модели. Эта функция полезна для тестирования внутри редактора, чтобы убедиться, что голосовая модель звучит так, как ожидается.
Чтобы удалить загруженные голосовые модели, нажмите кнопку Delete рядом с моделью, которую хотите удалить.
Все загруженные голосовые модели будут упакованы с вашим проектом, поэтому для уменьшения размера проекта удаляйте модели, которые больше не нужны.
Импорт пользовательских голосовых моделей
В дополнение к предустановленным голосовым моделям вы можете импортировать свои собственные. Плагин поддерживает форматы голосовых моделей Piper и Kokoro:
- В настройках плагина нажмите кнопку Import Custom Voice Model в верхней части экрана.
- В появившемся диалоговом окне выберите тип модели (Piper или Kokoro).
- Найдите и выберите файл модели:
- Для Piper: выберите файл модели в формате ONNX (*.onnx)
- Для Kokoro: выберите файл стиля в формате BIN (*.bin)
- Найдите и выберите соответствующий конфигурационный файл (*.json):
- Для Piper: содержит настройки, такие как частота дискретизации, сопоставления фонем и параметры вывода
- Для Kokoro: содержит конфигурацию токенизатора
- Для моделей Kokoro укажите языковой код (например, en-us, en-gb-x-rp, fr, es и т.д.)
- Нажмите Import, чтобы добавить пользовательскую голосовую модель в ваш проект.
Примечания о пользовательских голосовых мо делях
-
Модели Piper: Вы можете использовать пользовательские модели Piper, обученные самостоятельно, что особенно полезно, если вам нужен уникальный голос, отсутствующий в предустановленном списке. Модель ONNX и JSON-конфигурация должны быть совместимы с форматом Piper.
-
Модели Kokoro: Эти модели используют двухкомпонентную систему: файлы стилей (формат BIN) и общую модель ONNX. При первом импорте файла стиля Kokoro плагин предложит автоматически загрузить необходимую модель ONNX.
-
Языковые коды: Для моделей Kokoro языковой код важен для правильного преобразования фонем. Распространённые коды включают:
- Английский (США):
en-us
- Английский (Великобритания):
en-gb-x-rp
- Испанский:
es
- Французский:
fr
- Итальянский:
it
- Португальский (Бразилия):
pt-br
- Китайский (Мандарин):
cmn
- Хинди:
hi
- Немецкий:
de
- Английский (США):
Пользовательские голосовые модели обрабатываются так же, как и загруженные, и будут упакованы с вашим проектом.