본문으로 건너뛰기

개요

Runtime Speech Recognizer Documentation

Runtime Speech Recognizer는 실시간, 오프라인 음성 인식을 가능하게 하는 크로스 플랫폼 플러그인입니다. Whisper OpenAI 기술, 특히 whisper.cpp 라이브러리를 기반으로 하며, 플러그인의 설정에서 사전에 선택된 여러 언어 모델을 지원합니다.

설치 방법

첫 실행 시, 언어 모델을 설치합니다 (자동으로 수행할 것인지 묻는 대화 상자가 나타납니다).

기본 설명

이 플러그인은 whisper.cpp 라이브러리에 기반한 고급 알고리즘을 사용하여 실시간 음성 인식을 제공합니다. 스트림 혹은 비스트림 입력으로 제공되는(예: 파일이나 오디오 데이터 버퍼) 들어오는 오디오 데이터를 사전 학습된 언어 모델과 매칭합니다.

Windows에서 이 플러그인은 GPU 가속을 위해 Vulkan을 사용하여 인식 속도를 크게 향상시킵니다. 다른 플랫폼에서는 CPU와 인트린직을 사용하여 가속화를 수행합니다.

추가 리소스