Перейти к основному содержимому

Как использовать голосовые модели

Выбор, загрузка и упаковка моделей

Плагин поддерживает несколько языков, голосов и качеств. Вы можете легко загружать и управлять нужными голосовыми моделями через настройки плагина в редакторе. Следуйте этим шагам для выбора, загрузки и подготовки голосовых моделей:

  1. Откройте настройки проекта в редакторе и перейдите в Plugins -> Runtime Text To Speech.
  2. В списке Available Voice Models to Download нажмите кнопку Download рядом с голосовой моделью, которую хотите загрузить. Вы можете загружать несколько голосовых моделей одновременно.
  3. После завершения загрузки модели появятся в разделе Downloaded Voice Models в верхней части списка и станут доступны для использования в вашем проекте.
  4. Опционально, вы можете прослушать загруженные голосовые модели, введя текст в текстовое поле и нажав кнопку Play. Это синтезирует и воспроизведёт текст с использованием выбранной голосовой модели. Эта функция полезна для тестирования внутри редактора, чтобы убедиться, что голосовая модель звучит так, как ожидается.

Чтобы удалить загруженные голосовые модели, нажмите кнопку Delete рядом с моделью, которую хотите удалить.

Все загруженные голосовые модели будут упакованы с вашим проектом, поэтому для уменьшения размера проекта удаляйте модели, которые больше не нужны.

Импорт пользовательских голосовых моделей

В дополнение к предустановленным голосовым моделям вы можете импортировать свои собственные. Плагин поддерживает форматы голосовых моделей Piper и Kokoro:

  1. В настройках плагина нажмите кнопку Import Custom Voice Model в верхней части экрана.
  2. В появившемся диалоговом окне выберите тип модели (Piper или Kokoro).
  3. Найдите и выберите файл модели:
    • Для Piper: выберите файл модели в формате ONNX (*.onnx)
    • Для Kokoro: выберите файл стиля в формате BIN (*.bin)
  4. Найдите и выберите соответствующий конфигурационный файл (*.json):
    • Для Piper: содержит настройки, такие как частота дискретизации, сопоставления фонем и параметры вывода
    • Для Kokoro: содержит конфигурацию токенизатора
  5. Для моделей Kokoro укажите языковой код (например, en-us, en-gb-x-rp, fr, es и т.д.)
  6. Нажмите Import, чтобы добавить пользовательскую голосовую модель в ваш проект.

Примечания о пользовательских голосовых моделях

  • Модели Piper: Вы можете использовать пользовательские модели Piper, обученные самостоятельно, что особенно полезно, если вам нужен уникальный голос, отсутствующий в предустановленном списке. Модель ONNX и JSON-конфигурация должны быть совместимы с форматом Piper.

  • Модели Kokoro: Эти модели используют двухкомпонентную систему: файлы стилей (формат BIN) и общую модель ONNX. При первом импорте файла стиля Kokoro плагин предложит автоматически загрузить необходимую модель ONNX.

  • Языковые коды: Для моделей Kokoro языковой код важен для правильного преобразования фонем. Распространённые коды включают:

    • Английский (США): en-us
    • Английский (Великобритания): en-gb-x-rp
    • Испанский: es
    • Французский: fr
    • Итальянский: it
    • Португальский (Бразилия): pt-br
    • Китайский (Мандарин): cmn
    • Хинди: hi
    • Немецкий: de

Пользовательские голосовые модели обрабатываются так же, как и загруженные, и будут упакованы с вашим проектом.