Runtime Speech Recognizer
Documentación para el plugin Runtime Speech Recognizer.
📄️ Descripción General
Documentación de Runtime Speech Recognizer
📄️ Cómo usar el plugin
El plugin Runtime Speech Recognizer está diseñado para reconocer palabras de los datos de audio entrantes. Utiliza una versión ligeramente modificada de whisper.cpp para trabajar con el motor. Para usar el plugin, sigue estos pasos:
📄️ Cómo usar modelos de lenguaje
Selección, descarga y empaquetado de modelos
📄️ Lista de parámetros de reconocimiento
Estos parámetros solo se pueden establecer mientras el reconocedor no está en ejecución.
📄️ Idiomas soportados
Esta es la lista completa de idiomas compatibles con los modelos de lenguaje disponibles.
📄️ Reconocimiento de comandos
Calcular la Similitud de Levenshtein
📄️ Minimizar congelamientos
Esta guía aborda dos fuentes comunes de congelamiento en el plugin RuntimeSpeechRecognizer y proporciona soluciones prácticas para mitigar el impacto en el rendimiento.
📄️ Solución de problemas
La mayoría de los problemas están relacionados con la preparación del modelo de lenguaje, lo que puede causar problemas en la compilación empaquetada. Específicamente, podrías encontrar los siguientes registros:
📄️ Proyecto de demostración
Proyecto de demostración empaquetado para Windows.
📄️ Cómo mejorar el rendimiento
Las plataformas Windows utilizan Vulkan para la aceleración por GPU, lo que acelera significativamente el proceso de reconocimiento. En otras plataformas, el plugin utiliza la CPU + intrinsics para la aceleración. Sin embargo, puedes mejorar aún más el rendimiento del plugin siguiendo las recomendaciones a continuación: