Список параметров распознавания
Эти параметры могут быть установлены только тогда, когда распознаватель не запущен.
Это не исчерпывающий список параметров, доступных в Whisper. Здесь представлены только самые важные. При необходимости этот список будет обновлен.
Установить параметры распознавания
Устанавливает параметры для распознавания речи. Если вы хотите изменить только определенные параметры, рассмотрите использование индивидуальных функций установки.
Установить параметры по умолчанию для потокового распознавания
Устанавливает параметры по умолчанию, подходящие для потокового распознавания речи.
Установить параметры по умолчанию для непотокового распознавания
Устанавливает параметры по умолчанию, подходящие для непотокового распознавания речи.
Установить количество потоков
Устанавливает количество потоков для распознавания речи. Установите это значение в 0, чтобы использовать количество ядер.
Установить язык
Устанавливает язык для распознавания речи. Он должен поддерживаться выбранной языковой моделью в настройках редактора.
Установка языка в режим Auto снизит точность и производительность распознавания.
Установить перевод на английский
Устанавливает, переводить ли распознанные слова на английский. Если true, языковая модель должна быть многоязычной.
Установить размер шага
Устанавливает размер шага в миллисекундах. Определяет, как часто отправлять аудиоданные для распознавания. Значение по умолчанию - 5000 мс (5 секунд).
Установить без контекста
Устанавливает, использовать ли прошлую транскрипцию (если таковая имеется) в качестве начальной подсказки для декодера.
Установить одиночный сегмент
Устанавливает, необходимо ли принуждать к выводу одиночного сегмента (полезно для потоковой передачи).
Установить максимальное количество токенов
Устанавливает максимальное количество токенов на текстовый сегмент. Используйте 0 для отсутствия ограничения.
Установить ускорение
Устанавливает, ускорить ли распознавание в 2 раза с использованием Phase Vocoder. Установите значение false
, чтобы улучшить качество вывода.
Установить размер аудиоконтекста
Устанавливает размер аудиоконтекста. Установите значение 0
, чтобы улучшить качество вывода.
Установить температуру для увеличения
Устанавливает температуру для увеличения при возврате, когда декодирование не соответствует одному из пороговых значений ниже.
Установить порог энтропии
Устанавливает порог энтропии. Если коэффициент сжатия выше этого значения, считать декодирование неудачным. Подобно "compression_ratio_threshold" OpenAI.
Подавлять пробелы
Устанавливает, нужно ли подавлять пробелы в выводе.
Подавлять несинтаксические токены
Устанавливает, нужно ли подавлять несинтаксические токены в выводе.
Установить размер луча
Устанавливает количество лучей в поиске по лучам. Применимо только тогда, когда температура равна нулю.
Установить начальную подсказку
Устанавливает начальную подсказку для первого окна. Это может быть использовано для предоставления контекста распознаванию, чтобы повысить вероятность правильного предсказания слов, например, для пользовательского словаря или имен собственных.