認識パラメータ一覧
これらのパラメータは、認識器が実行されていない時のみ設定できます。
この一覧はWhisperで利用可能なすべてのパラメータを網羅しているわけではありません。最も重要なものだけがここで公開されています。必要に応じて、このリストは更新されます。
認識パラメータの設定
音声認識用のパラメータを設定します。特定のパラメータのみ変更したい場合は、個別のセッタ関数を使用することを検討してください。
ストリーミングデフォルトの設定
ストリーミング音声認識に適したデフォルトパラメータを設定します。
非ストリーミングデフォルトの設定
非ストリーミング音声認識に適したデフォルトパラメータを設定します。
スレッド数の設定
音声認識に使用するスレッ ド数を設定します。この値を0に設定すると、コア数が使用されます。
言語の設定
音声認識に使用する言語を設定します。Editor設定で選択した言語モデルがサポートしている必要があります。
言語をAutoに設定すると、認識精度とパフォーマンスが低下します。
英語への翻訳設定
認識された単語を英語に翻訳するかどうかを設定します。trueの場合、言語モデルは多言語対応である必要があります。
ステップサイズの設定
ステップサイズ(ミリ秒単位)を設定します。音声データをどの頻度で認識に送るかを決定します。デフォルト値は5000ミリ秒(5秒)です。
No Contextの設定
過去の書き起こし(ある場合)をDecoderへの初期プロンプトとして使用するかどうかを設定します。
シングルセグメントの設定
単一セグメント出力を強制するかどうかを設定します(ストリーミングに便利です)。
最大トークン数の設定
テキストセグメントごとの最大トークン数を設定します。制限を設けない場合は0を使用してください。