개요
Runtime Speech Recognizer는 실시간, 오프라인 음성 인식을 가능하게 하는 크로스 플랫폼 플러그인입니다. Whisper OpenAI 기술, 특히 whisper.cpp 라이브러리를 기반으로 하며, 플러그인의 설정에서 사전에 선택된 여러 언어 모델을 지원합니다.
설치 방법
첫 실행 시, 언어 모델을 설치합니다 (자동으로 수행할 것인지 묻는 대화 상자가 나타납니다).
기본 설명
이 플러그인은 whisper.cpp 라이브러리에 기반한 고급 알고리즘을 사용하여 실시간 음성 인식을 제공합니다. 스트림 혹은 비스트림 입력으로 제공되는(예: 파일이나 오디오 데이터 버퍼) 들어오는 오디오 데이터를 사전 학습된 언어 모델과 매칭합니다.
Windows에서 이 플러그인은 GPU 가속을 위해 Vulkan을 사용하여 인식 속도를 크게 향상시킵니다. 다른 플랫폼에서는 CPU와 인트린직을 사용하여 가속화를 수행합니다.
추가 리소스
- Get it on Fab
- Download Demo (Windows)
- Discord 지원 서버
- 비디오 튜토리얼
- 맞춤형 개발: [email protected] (팀 및 조직을 위한 맞춤 솔루션)