Runtime Speech Recognizer
Documentation pour le plugin Runtime Speech Recognizer.
- Obtenez-le sur Fab
- Site web du produit
- Télécharger la démo (Windows)
- Serveur Discord d'assistance
- Tutoriel vidéo
- Développement personnalisé : [email protected] (solutions sur mesure pour les équipes et organisations)
📄️ Aperçu
Documentation du Runtime Speech Recognizer
📄️ Comment utiliser le plugin
Le plugin Runtime Speech Recognizer est conçu pour reconnaître des mots à partir de données audio entrantes. Il utilise une version légèrement modifiée de whisper.cpp pour fonctionner avec le moteur. Pour utiliser le plugin, suivez ces étapes :
📄️ Comment utiliser les modèles de langage
Sélection, téléchargement et packaging des modèles
📄️ Liste des paramètres de reconnaissance
Ces paramètres ne peuvent être définis que lorsque le reconnaisseur n'est pas en cours d'exécution.
📄️ Langues prises en charge
Voici la liste complète des langues prises en charge par les modèles linguistiques disponibles.
📄️ Reconnaissance de commandes
Calculer la similarité de Levenshtein
📄️ Minimiser les gels
Ce guide aborde deux sources courantes de gels dans le plugin RuntimeSpeechRecognizer et propose des solutions pratiques pour atténuer leur impact sur les performances.
📄️ Dépannage
La plupart des problèmes sont liés à la mise en place du modèle de langage, ce qui peut causer des problèmes dans la version packagée. Notamment, vous pourriez rencontrer les logs suivants :
📄️ Projet de démonstration
Projet de démonstration empaqueté pour Windows.
📄️ Comment améliorer les performances
Les plateformes Windows utilisent Vulkan pour l'accélération GPU, ce qui accélère considérablement le processus de reconnaissance. Sur les autres plateformes, le plugin utilise le CPU + intrinsics pour l'accélération. Cependant, vous pouvez encore améliorer les performances du plugin en suivant les recommandations ci-dessous :