개요
Runtime Speech Recognizer는 실시간 오프라인 음성 인식을 가능하게 하는 크로스 플랫폼 플러그인입니다. Whisper OpenAI 기술, 특히 whisper.cpp 라이브러리를 기반으로 하며, 플러그인 설정에서 미리 선택된 다국어 모델을 지원합니다.
설치 방법
첫 실행 시 언어 모델을 설치하세요 (자동으로 설치할지 묻는 대화 상자가 나타납니다).
기본 설명
이 플러그인은 whisper.cpp 라이브러리를 기반으로 한 고급 알고리즘을 사용하여 실시간 음성 인식을 제공합니다. 스트림 또는 비스트림 입력(예: 오디오 파일 또는 버퍼 데이터)으로 제공되는 오디오 데이터를 사전 훈련된 언어 모델과 대조합니다.
Windows에서는 GPU 가속을 위해 Vulkan을 사용하여 인식 프로세스 속도를 크게 향상시킵니다. 다른 플랫폼에서는 CPU + intrinsics를 사용하여 가속합니다.
추가 자료
- Fab에서 구입하기
- 제품 웹사이트
- 데모 다운로드 (Windows)
- Discord 지원 서버
- 비디오 튜토리얼
- 맞춤 개발: [email protected] (팀 및 기관을 위한 맞춤형 솔루션)