跳到主要内容

识别参数列表

这些参数只能在识别器未运行时设置。

这不是Whisper提供的参数的详尽列表。这里只展示了最重要的参数。如有必要,此列表会更新。

设置识别参数

设置语音识别的参数。如果您只想更改特定参数,可以考虑使用单独的设置功能。

设置流式默认值

设置适用于流式语音识别的默认参数。

设置非流式默认值

设置适用于非流式语音识别的默认参数。

设置线程数量

设置用于语音识别的线程数量。将此值设置为0以使用核心数。

设置语言

设置用于语音识别的语言。必须由编辑器设置中选择的语言模型支持。

将语言设置为Auto会降低识别的准确性和性能。

设置翻译为英语

设置是否将识别的单词翻译为英语。如果为true,语言模型必须为多语言。

设置步长

设置步长(以毫秒为单位)。决定了多长时间发送音频数据进行识别。默认值为5000毫秒(5秒)。

设置无上下文

设置是否将过去的转录(如果有)用作解码器的初始提示。

设置单段

设置是否强制单段输出(对流式很有用)。

设置最大标记数

设置每个文本段的最大标记数。使用0表示无上限。

设置加速

设置是否使用Phase Vocoder将识别速度提高2倍。将其设置为false以提高输出质量。

设置音频上下文大小

设置音频上下文的大小。将其设置为0以提高输出质量。

设置增加温度

设置当解码未达到以下任一阈值时,回退时要增加的温度。

设置熵阈值

设置熵阈值。如果压缩比高于此值,将解码视为失败。类似于OpenAI的“compression_ratio_threshold”。

设置抑制空白

设置是否抑制输出中出现的空白。

设置抑制非语音标记

设置是否抑制输出中出现的非语音标记。

设置波束大小

设置波束搜索中的波束数量。仅在温度为零时适用。

设置初始提示

设置第一个窗口的初始提示。可以用来提供上下文以提高识别准确性,例如自定义词汇或专有名词。