Pular para o conteúdo principal

Visão Geral

Runtime Speech Recognizer Documentation

O Runtime Speech Recognizer é um plugin multiplataforma que permite o reconhecimento de fala em tempo real e offline. Baseado na tecnologia Whisper da OpenAI, especificamente na biblioteca whisper.cpp, e suporta múltiplos modelos de linguagem pré-selecionados nas configurações do plugin.

Como instalar

Na primeira execução, instale os modelos de linguagem (uma caixa de diálogo aparecerá solicitando que você faça isso automaticamente).

Descrição básica

Este plugin fornece reconhecimento de fala em tempo real usando algoritmos avançados baseados na biblioteca whisper.cpp. Ele compara os dados de áudio recebidos, fornecidos como um fluxo ou entrada não contínua (como um arquivo ou buffer de dados de áudio), com modelos de linguagem pré-treinados.

No Windows, o plugin utiliza Vulkan para aceleração via GPU, o que acelera significativamente o processo de reconhecimento. Em outras plataformas, o plugin usa a CPU + intrínsecos para aceleração.

Recursos Adicionais