Runtime Speech Recognizer
Documentación para el plugin Runtime Speech Recognizer.
- Obtener en Fab
- Sitio web del producto
- Descargar Demo (Windows)
- Servidor de soporte en Discord
- Tutorial en video
- Desarrollo personalizado: [email protected] (soluciones a medida para equipos y organizaciones)
📄️ Descripción general
Documentación de Runtime Speech Recognizer
📄️ Cómo usar el plugin
El plugin Runtime Speech Recognizer está diseñado para reconocer palabras a partir de datos de audio entrantes. Utiliza una versión ligeramente modificada de whisper.cpp para trabajar con el motor. Para usar el plugin, sigue estos pasos:
📄️ Cómo usar modelos de lenguaje
Selección, descarga y empaquetado de modelos
📄️ Lista de parámetros de reconocimiento
Estos parámetros solo se pueden establecer cuando el reconocedor no está en funcionamiento.
📄️ Idiomas soportados
Esta es la lista completa de idiomas soportados por los modelos de lenguaje disponibles.
📄️ Reconocimiento de comandos
Calcular la Similitud de Levenshtein
📄️ Minimizar congelamientos
Esta guía aborda dos fuentes comunes de congelamiento en el plugin RuntimeSpeechRecognizer y proporciona soluciones prácticas para mitigar el impacto en el rendimiento.
📄️ Solución de problemas
La mayoría de los problemas están relacionados con la preparación del modelo de lenguaje, lo que puede causar problemas en la compilación empaquetada. Específicamente, podrías encontrar los siguientes registros:
📄️ Proyecto de demostración
Proyecto de demostración empaquetado para Windows.
📄️ Cómo mejorar el rendimiento
Las plataformas Windows utilizan Vulkan para la aceleración de la GPU, lo que acelera significativamente el proceso de reconocimiento. En otras plataformas, el complemento usa la CPU + intrinsics para la aceleración. Sin embargo, puedes mejorar aún más el rendimiento del complemento siguiendo las recomendaciones a continuación: