개요
Runtime Speech Recognizer
는 실시간 오프라인 음성 인식을 가능하게 하는 크로스 플랫폼 플러그인입니다. Whisper OpenAI 기술을 기반으로 하며, 특히 whisper.cpp 라이브러리를 사용하여 플러그인 설정에서 사전 선택된 여러 언어 모델을 지원합니다.
설치 방법
처음 실행 시 언어 모델을 설치하세요 (자동으로 설치하겠냐는 대화 상자가 나타납니다).
기본 설명
이 플러그인은 whisper.cpp 라이브러리를 기반으로 한 고급 알고리즘을 사용하여 실시간 음성 인식을 제공합니다. 스트림 입력이나 파일 또는 오디오 데이터 버퍼와 같은 비스트림 입력으로 제공된 수신 오디오 데이터를 사전 훈련된 언어 모델과 매치합니다.
Windows에서는 GPU 가속을 위해 Vulkan을 사용하여 인식 과정 을 크게 가속화합니다. 다른 플랫폼에서는 CPU + intrinsics를 사용하여 가속합니다.