Runtime Speech Recognizer
Dokumentacja dla wtyczki Runtime Speech Recognizer.
- Pobierz na Fab
- Strona produktu
- Pobierz Demo (Windows)
- Serwer wsparcia na Discordzie
- Samouczek wideo
- Niestandardowy rozwój: [email protected] (spersonalizowane rozwiązania dla zespołów i organizacji)
📄️ Przegląd
Dokumentacja Runtime Speech Recognizer
📄️ Jak korzystać z wtyczki
Wtyczka Runtime Speech Recognizer została zaprojektowana do rozpoznawania słów z przychodzących danych audio. Wykorzystuje nieco zmodyfikowaną wersję whisper.cpp do pracy z silnikiem. Aby użyć wtyczki, wykonaj następujące kroki:
📄️ Jak używać modeli językowych
Wybieranie, pobieranie i pakowanie modeli
📄️ Lista parametrów rozpoznawania
Te parametry mogą być ustawiane tylko wtedy, gdy rozpoznawanie nie jest uruchomione.
📄️ Obsługiwane języki
Oto pełna lista języków obsługiwanych przez dostępne modele językowe.
📄️ Rozpoznawanie poleceń
Obliczanie podobieństwa Levenshteina
📄️ Minimalizacja zamrożeń
Ten przewodnik omawia dwa powszechne źródła zamrożeń w pluginie RuntimeSpeechRecognizer i dostarcza praktyczne rozwiązania mające na celu złagodzenie wpływu na wydajność.
📄️ Rozwiązywanie problemów
Większość problemów jest związana z etapowaniem modelu językowego, co może powodować problemy w spakowanej wersji. Mianowicie, możesz napotkać następujące logi:
📄️ Projekt demonstracyjny
Spakowany projekt demonstracyjny dla Windows.
📄️ Jak poprawić wydajność
Wtyczka wykorzystuje różne metody akceleracji GPU w zależności od platformy