Перейти к основному содержимому

Список параметров распознавания

Эти параметры можно устанавливать только тогда, когда распознаватель не запущен.

Это не полный список параметров, доступных в Whisper. Здесь представлены только самые важные из них. При необходимости этот список будет обновлен.

Установка параметров распознавания

Устанавливает параметры для распознавания речи. Если вы хотите изменить только отдельные параметры, рассмотрите возможность использования индивидуальных функций установки.

Установка параметров по умолчанию для потокового режима

Устанавливает параметры по умолчанию, подходящие для потокового распознавания речи.

Установка параметров по умолчанию для непотокового режима

Устанавливает параметры по умолчанию, подходящие для непотокового распознавания речи.

Установка количества потоков

Устанавливает количество потоков для распознавания речи. Установите это значение в 0, чтобы использовать количество ядер.

Установка языка

Устанавливает язык для распознавания речи. Он должен поддерживаться выбранной языковой моделью в настройках Editor.

Установка языка в Auto снизит точность и производительность распознавания.

Установка перевода на английский

Устанавливает, нужно ли переводить распознанные слова на английский. Если true, языковая модель должна быть многоязычной.

Установка размера шага

Устанавливает размер шага в миллисекундах. Определяет, как часто отправлять аудиоданные на распознавание. Значение по умолчанию — 5000 мс (5 секунд).

Установка без контекста

Устанавливает, использовать ли предыдущую транскрипцию (если есть) в качестве начального запроса для декодера.

Установка одного сегмента

Устанавливает, нужно ли принудительно использовать одиночный сегмент (полезно для потокового режима).

Установка максимального числа токенов

Устанавливает максимальное количество токенов на текстовый сегмент. Используйте 0 для отсутствия ограничения.

Установка ускорения

Устанавливает, нужно ли ускорять распознавание в 2 раза с помощью Phase Vocoder. Установите как false, чтобы улучшить качество результата.

Установка размера аудиоконтекста

Устанавливает размер аудиоконтекста. Установите как 0, чтобы повысить качество результата.

Установка температуры для повышения

Устанавливает температуру, которую следует увеличить при откате, если декодирование не достигло ни одного из нижеперечисленных порогов.

Установка порога энтропии

Устанавливает порог энтропии. Если коэффициент сжатия выше этого значения, считать декодирование неудачным. Аналогично OpenAI "compression_ratio_threshold"

Установка подавления пустых значений

Устанавливает, нужно ли подавлять появление пустых значений в результатах.

Установка подавления несвязанных с речью токенов

Устанавливает, нужно ли подавлять появление токенов, не относящихся к речи, в результатах.

Установка размера балки

Устанавливает количество beams в beam search. Применяется только если temperature равна нулю.

Установка начального запроса

Устанавливает начальный запрос для первого окна. Это может использоваться для предоставления контекста, чтобы повысить вероятность корректного распознавания слов, например, для пользовательских словарей или имён собственных.

Установка ускорения на GPU

Устанавливает, нужно ли использовать GPU ускорение для распознавания речи (в данный момент применимо только для Windows).

Установка ID GPU-устройства

Устанавливает ID GPU-устройства для распознавания речи. Значение по умолчанию — 0. Это полезно для систем с несколькими GPU, чтобы указать, какой GPU должен использоваться для процесса распознавания. Если указанный ID GPU-устройства недействителен, будет использован первый доступный индекс GPU-устройства.