개요

Runtime Speech Recognizer는 실시간 오프라인 음성 인식을 가능하게 하는 크로스 플랫폼 플러그인입니다. Whisper OpenAI 기술, 특히 whisper.cpp 라이브러리를 기반으로 하며, 자동 언어 감지 기능과 함께 플러그인 설정에서 미리 선택된 여러 언어 모델을 지원합니다.

설치 방법

첫 실행 시, 언어 모델을 설치하세요 (이 작업을 자동으로 수행하라는 대화 상자가 나타납니다).

기본 설명

이 플러그인은 허가적인 MIT 라이센스로 제공되는 whisper.cpp 라이브러리를 기반으로 한 고급 알고리즘을 사용하여 실시간 음성 인식을 제공합니다. 스트림 또는 비스트림 입력(예: 파일 또는 오디오 데이터 버퍼)으로 제공되는 들어오는 오디오 데이터를 사전 훈련된 언어 모델과 비교합니다. 다국어 모델을 사용할 때 플러그인은 음성 언어를 자동으로 감지하고 인식된 텍스트와 함께 이 정보를 제공할 수 있습니다.

플러그인은 플랫폼에 따라 다른 GPU 가속 방법을 사용합니다:

Windows 및 Linux: GPU 가속을 위해 Vulkan을 사용하여 인식 프로세스를 크게 가속화합니다.
Mac 및 iOS: GPU 가속을 위해 Metal을 사용하여 Windows 또는 Linux Vulkan 가속에 필적하거나 더 빠른 성능을 제공합니다.
기타 플랫폼: 가속을 위해 CPU + 내장 함수를 사용합니다 (Android 또는 Meta Quest에서 네이티브로 실행할 때와 같이 더 느릴 수 있습니다).

추가 리소스

Fab에서 구입하기
제품 웹사이트
데모 다운로드 (Windows)
Discord 지원 서버
비디오 튜토리얼
플러그인 지원 및 맞춤형 개발: [email protected] (팀 및 조직을 위한 맞춤형 솔루션)

설치 방법​

기본 설명​

추가 리소스​

설치 방법

기본 설명

추가 리소스