개요
Runtime Speech Recognizer는 실시간 오프라인 음성 인식을 가능하게 하는 크로스 플랫폼 플러그인입니다. Whisper OpenAI 기술, 특히 whisper.cpp 라이브러리를 기반으로 하며 플러그인 설정에서 미리 선택된 다중 언어 모델을 지원합니다.
설치 방법
첫 실행 시 언어 모델을 설치하세요 (자동으로 설치할지 묻는 대화 상자가 나타납니다).
기본 설명
이 플러그인은 허가적인 MIT 라이센스로 제공되는 whisper.cpp 라이브러리를 기반으로 한 고급 알고리즘을 사용하여 실시간 음성 인식을 제공합니다. 스트림 또는 비스트림 입력(예: 오디오 파일 또는 버퍼 데이터)으로 제공되는 들어오는 오디오 데이터를 사전 훈련된 언어 모델과 대조합니다.
플러그인은 플랫폼에 따라 다른 GPU 가속 방법을 사용합니다:
- Windows: GPU 가속을 위해 Vulkan을 사용하며 인식 프로세스를 크게 가속화합니다
- Mac 및 iOS: GPU 가속을 위해 Metal을 사용하며 Windows의 Vulkan 가속과 비슷하거나 더 빠른 성능을 제공합니다
- 기타 플랫폼: 가속을 위해 CPU + intrinsics를 사용합니다
추가 리소스
- Fab에서 구입
- 제품 웹사이트
- 데모 다운로드 (Windows)
- Discord 지원 서버
- 비디오 튜토리얼
- 맞춤 개발: [email protected] (팀 및 조직을 위한 맞춤형 솔루션)