Runtime Speech Recognizer
Documentación para el plugin Runtime Speech Recognizer.
- Obténlo en Fab
- Descargar Demo (Windows)
- Servidor de soporte en Discord
- Tutorial en video
- Desarrollo a medida: [email protected] (soluciones personalizadas para equipos y organizaciones)
📄️ Descripción general
Documentación de Runtime Speech Recognizer
📄️ Cómo usar el plugin
El plugin Runtime Speech Recognizer está diseñado para reconocer palabras a partir de datos de audio entrantes. Utiliza una versión ligeramente modificada de whisper.cpp para trabajar con el motor. Para usar el plugin, sigue estos pasos:
📄️ Cómo usar modelos de lenguaje
Selección, descarga y empaquetado de modelos
📄️ Lista de parámetros de reconocimiento
Estos parámetros solo se pueden establecer cuando el reconocedor no está en funcionamiento.
📄️ Idiomas soportados
Esta es la lista completa de idiomas compatibles con los modelos de lenguaje disponibles.
📄️ Reconocimiento de comandos
Calcular la Similitud de Levenshtein
📄️ Minimizar congelamientos
Esta guía aborda dos fuentes comunes de congelamiento en el plugin RuntimeSpeechRecognizer y proporciona soluciones prácticas para mitigar el impacto en el rendimiento.
📄️ Solución de problemas
La mayoría de los problemas están relacionados con la preparación del modelo de lenguaje, lo que puede causar problemas en la compilación empaquetada. Específicamente, podrías encontrar los siguientes registros:
📄️ Proyecto de demostración
Proyecto de demostración empaquetado para Windows.
📄️ Cómo mejorar el rendimiento
Las plataformas Windows utilizan Vulkan para la aceleración de la GPU, lo que acelera significativamente el proceso de reconocimiento. En otras plataformas, el complemento usa la CPU + intrinsics para la aceleración. Sin embargo, puedes mejorar aún más el rendimiento del complemento siguiendo las recomendaciones a continuación: