인식 매개변수 목록
이러한 매개변수는 인식기가 실행되고 있지 않을 때만 설정할 수 있습니다.
이 목록은 Whisper에서 사용할 수 있는 모든 매개변수를 모두 포함하지 않습니다. 여기에는 가장 중요한 매개변수만 노출됩니다. 필요시 이 목록은 업데이트됩니다.
인식 매개변수 설정
음성 인식을 위한 매개변수를 설정합니다. 특정 매개변수만 변경하려면 개별 설정 함수를 사용하는 것이 좋습니다.
스트리밍 기본값 설정
스트리밍 음성 인식에 적합한 기본 매개변수를 설정합니다.
비스트리밍 기본값 설정
비스트리밍 음성 인식에 적합한 기본 매개변수를 설정합니다.
스레드 수 설정
음성 인식에 사용할 스레드 수를 설정합니다. 이 값을 0으로 설정하면 코어 수를 사용합니다.
언어 설정
음성 인식에 사용할 언어를 설정합니다. 편집기 설정에서 선택한 언어 모델이 지원되어야 합니다.
언어를 자동으로 설정하면 인식 정확도와 성능이 떨어집니다.
영어로 번역 설정
인식된 단어를 영어로 번역할지 여부를 설정합니다. true인 경우, 언어 모델은 다국어를 지원해야 합니다.
단계 크기 설정
단위 크기를 밀리초 단위로 설정합니다. 인식을 위해 오디오 데이터를 얼마나 자주 전송할지 결정합니다. 기본값은 5000 ms (5초)입니다.
컨텍스트 없음 설정
과거 전사를 디코더의 초기 프롬프트로 사용할지 여부를 설정합니다.
단일 세그먼트 설정
단일 세그먼트 출력을 강제할지 여부를 설정합니다 (스트리밍에 유용).
최대 토큰 수 설정
텍스트 세그먼트당 최대 토큰 수를 설정합니다. 제한 없음은 0을 사용하세요.
속도 증가 설정
Phase Vocoder를 사용하여 인식을 2배로 가속할지 여부를 설정합니다. 출력을 개선하려면 false
로 설정합니다.