Runtime Speech Recognizer
Documentação para o plugin Runtime Speech Recognizer.
- Obtenha no Fab
- Site do produto
- Baixar Demo (Windows)
- Servidor de suporte no Discord
- Tutorial em vídeo
- Desenvolvimento Personalizado: [email protected] (soluções sob medida para equipes e organizações)
📄️ Visão Geral
Runtime Speech Recognizer Documentation
📄️ Como usar o plugin
O plugin Runtime Speech Recognizer foi projetado para reconhecer palavras a partir de dados de áudio recebidos. Ele utiliza uma versão ligeiramente modificada do whisper.cpp para funcionar com a engine. Para usar o plugin, siga estes passos:
📄️ Como usar modelos de linguagem
Selecionando, baixando e empacotando modelos
📄️ Lista de parâmetros de reconhecimento
Estes parâmetros só podem ser definidos enquanto o reconhecedor não está em execução.
📄️ Idiomas suportados
Esta é a lista completa de idiomas suportados pelos modelos de linguagem disponíveis.
📄️ Reconhecimento de comandos
Calcular Similaridade de Levenshtein
📄️ Minimizando congelamentos
Este guia aborda duas fontes comuns de congelamento no plugin RuntimeSpeechRecognizer e fornece soluções práticas para mitigar o impacto no desempenho.
📄️ Solução de Problemas
A maioria dos problemas está relacionada ao estágio do modelo de linguagem, o que pode causar problemas na build empacotada. Especificamente, você pode encontrar os seguintes logs:
📄️ Projeto de demonstração
Projeto de Demonstração Empacotado para Windows.
📄️ Como melhorar o desempenho
As plataformas Windows usam Vulkan para aceleração de GPU, o que acelera significativamente o processo de reconhecimento. Em outras plataformas, o plugin usa a CPU + intrínsecos para aceleração. No entanto, você pode melhorar ainda mais o desempenho do plugin seguindo as recomendações abaixo: