Visão Geral
O Runtime Speech Recognizer é um plugin multiplataforma que permite o reconhecimento de fala em tempo real e offline. Baseado na tecnologia Whisper da OpenAI, especificamente na biblioteca whisper.cpp, e suporta múltiplos modelos de linguagem pré-selecionados nas configurações do plugin.
Como instalar
Na primeira execução, instale os modelos de linguagem (uma caixa de diálogo aparecerá solicitando que você faça isso automaticamente).
Descrição básica
Este plugin fornece reconhecimento de fala em tempo real usando algoritmos avançados baseados na biblioteca whisper.cpp. Ele compara os dados de áudio recebidos, fornecidos como um fluxo ou entrada não contínua (como um arquivo ou buffer de dados de áudio), com modelos de linguagem pré-treinados.
No Windows, o plugin utiliza Vulkan para aceleração via GPU, o que acelera significativamente o processo de reconhecimento. Em outras plataformas, o plugin usa a CPU + intrínsecos para aceleração.
Recursos Adicionais
- Obtenha no Fab
- Site do produto
- Baixar Demo (Windows)
- Servidor de suporte no Discord
- Tutorial em vídeo
- Desenvolvimento Customizado: [email protected] (soluções personalizadas para equipes & organizações)