Aperçu
Runtime Speech Recognizer est un plugin multiplateforme permettant la Runtime Speech Recognizer et hors ligne. Basé sur la technologie Whisper d'OpenAI, notamment la bibliothèque whisper.cpp, il prend en charge plusieurs modèles linguistiques présélectionnés dans les paramètres du plugin.
Installation
Lors du premier lancement, installez les modèles linguistiques (une boîte de dialogue apparaîtra pour vous demander de le faire automatiquement).
Description basique
Ce plugin fournit une Runtime Speech Recognizer utilisant des algorithmes avancés basés sur la bibliothèque whisper.cpp. Il compare les données audio entrantes, fournies sous forme de flux ou d'entrée non-stream (comme un fichier ou un tampon de données audio), avec des modèles linguistiques pré-entraînés.
Sous Windows, le plugin utilise Vulkan pour l'accélération GPU, ce qui accélère significativement le processus de reconnaissance. Sur les autres plateformes, le plugin utilise le CPU + intrinsics pour l'accélération.
Ressources supplémentaires
- Obtenez-le sur Fab
- Site web du produit
- Télécharger la démo (Windows)
- Serveur Discord de support
- Tutoriel vidéo
- Développement personnalisé : [email protected] (solutions sur mesure pour les équipes & organisations)