Runtime Speech Recognizer

Documentation pour le plugin Runtime Speech Recognizer.

Obtenez-le sur Fab
Site web du produit
Télécharger la démo (Windows)
Serveur Discord d'assistance
Tutoriel vidéo
Développement personnalisé : [email protected] (solutions sur mesure pour les équipes et organisations)

📄️ Aperçu

Documentation du Runtime Speech Recognizer

Le plugin Runtime Speech Recognizer est conçu pour reconnaître les mots à partir de données audio entrantes. Il utilise une version légèrement modifiée de whisper.cpp pour fonctionner avec le moteur. Pour utiliser le plugin, suivez ces étapes :

📄️ Comment utiliser les modèles de langage

Sélection, téléchargement et packaging des modèles

📄️ Liste des paramètres de reconnaissance

Ces paramètres ne peuvent être définis que lorsque le recognizer n’est pas en cours d’exécution.

📄️ Langues prises en charge

Voici la liste complète des langues prises en charge par les modèles linguistiques disponibles.

📄️ Reconnaissance de commandes

Calculer la similarité de Levenshtein

📄️ Minimiser les gels

Ce guide aborde deux sources courantes de gels dans le plugin RuntimeSpeechRecognizer et propose des solutions pratiques pour atténuer leur impact sur les performances.

📄️ Dépannage

La plupart des problèmes sont liés à la mise en place du modèle de langage, ce qui peut causer des problèmes dans la version packagée. Notamment, vous pourriez rencontrer les logs suivants :

📄️ Projet de démonstration

Projet de démonstration empaqueté pour Windows.

📄️ Comment améliorer les performances

Le plugin utilise différentes méthodes d'accélération GPU selon la plateforme