Runtime Speech Recognizer

Runtime Speech Recognizer 플러그인에 대한 문서입니다.

📄️개요

Runtime Speech Recognizer 문서

Runtime Speech Recognizer 플러그인은 들어오는 오디오 데이터에서 단어를 인식하도록 설계되었습니다. 엔진과 함께 작동하기 위해 약간 수정된 whisper.cpp 버전을 사용합니다. 플러그인을 사용하려면 다음 단계를 따르세요:

모델 선택, 다운로드 및 패키징

이 매개변수들은 인식기가 실행 중이지 않을 때만 설정할 수 있습니다.

이것은 사용 가능한 언어 모델에서 지원하는 전체 언어 목록입니다.

Levenshtein 유사도 계산

이 가이드는 RuntimeSpeechRecognizer 플러그인에서 발생하는 두 가지 일반적인 멈춤 현상에 대한 솔루션을 제시하여 성능 영향을 줄이는 방법을 설명합니다.

언어 모델 스테이징 문제

윈도우용 패키지 데모 프로젝트.

이 플러그인은 플랫폼에 따라 다른 GPU 가속 방법을 사용합니다