Runtime Speech Recognizer
Dokumentation für das Runtime Speech Recognizer Plugin.
- Auf Fab erhältlich
- Produkt-Website
- Demo herunterladen (Windows)
- Discord-Support-Server
- Video-Tutorial
- Individuelle Entwicklung: [email protected] (maßgeschneiderte Lösungen für Teams & Organisationen)
📄️ Übersicht
Runtime Speech Recognizer Dokumentation
📄️ So verwenden Sie das Plugin
Das Runtime Speech Recognizer Plugin ist dafür ausgelegt, Wörter aus eingehenden Audiodaten zu erkennen. Es verwendet eine leicht modifizierte Version von whisper.cpp, um mit der Engine zu arbeiten. Um das Plugin zu verwenden, folgen Sie diesen Schritten:
📄️ Wie man Sprachmodelle verwendet
Auswahl, Download und Verpackung von Modellen
📄️ Erkennungsparameterliste
Diese Parameter können nur gesetzt werden, während der Erkennungsprozess nicht läuft.
📄️ Unterstützte Sprachen
Dies ist die vollständige Liste der Sprachen, die von den verfügbaren Sprachmodellen unterstützt werden.
📄️ Befehlserkennung
Levenshtein-Ähnlichkeit berechnen
📄️ Minimierung von Einfrieren
Diese Anleitung behandelt zwei häufige Ursachen für Einfrieren im RuntimeSpeechRecognizer-Plugin und bietet praktische Lösungen zur Reduzierung der Leistungsbeeinträchtigung.
📄️ Fehlerbehebung
Probleme beim Staging von Sprachmodellen
📄️ Demo-Projekt
Verpacktes Demo-Projekt für Windows.
📄️ Wie Sie die Leistung verbessern können
Das Plugin verwendet je nach Plattform verschiedene GPU-Beschleunigungsmethoden