Visão Geral
O Runtime Speech Recognizer é um plugin multiplataforma que permite o reconhecimento de fala em tempo real e offline. Baseado na tecnologia Whisper da OpenAI, especificamente na biblioteca whisper.cpp, e suporta múltiplos modelos de linguagem pré-selecionados nas configurações do plugin.
Como instalar
Na primeira execução, instale os modelos de linguagem (uma caixa de diálogo aparecerá solicitando que você faça isso automaticamente).
Descrição básica
Este plugin fornece reconhecimento de fala em tempo real usando algoritmos avançados baseados na biblioteca whisper.cpp, que está disponível sob a permissiva licença MIT. Ele compara os dados de áudio recebidos, fornecidos como um fluxo ou entrada não contínua (como um arquivo ou buffer de dados de áudio), com modelos de linguagem pré-treinados.
O plugin utiliza diferentes métodos de aceleração de GPU dependendo da plataforma:
- Windows: Usa Vulkan para aceleração de GPU, o que acelera significativamente o processo de reconhecimento
- Mac e iOS: Usa Metal para aceleração de GPU, oferecendo desempenho comparável ou até superior à aceleração Vulkan no Windows
- Outras plataformas: Usa CPU + intrínsecos para aceleração
Recursos Adicionais
- Obtenha no Fab
- Site do produto
- Baixar Demo (Windows)
- Servidor de suporte no Discord
- Tutorial em vídeo
- Desenvolvimento Personalizado: [email protected] (soluções sob medida para equipes e organizações)