Runtime Speech Recognizer
Runtime Speech Recognizer 外掛程式的文件。
- 在 Fab 上取得
- 產品網站
- 下載示範 (Windows)
- 影片教學 (舊版影片)
- 外掛支援與客製化開發:[email protected](為團隊與組織提供的量身解決方案)
Join our Discord
online · support
概述
Runtime Speech Recognizer 文件
如何使用插件
Runtime Speech Recognizer 插件旨在從傳入的音訊資料中辨識單詞。它使用略微修改過的 whisper.cpp 版本來與引擎協作。若要使用此插件,請遵循以下步驟:
如何使用語言模型
選擇、下載與打包模型
辨識參數列表
這些參數只能在辨識器未運行時設定。
支援的語言
以下是可用語言模型所支援的完整語言清單。
指令辨識
計算 Levenshtein 相似度
最小化凍結
本指南探討 RuntimeSpeechRecognizer 插件中兩個常見的凍結來源,並提供實用解決方案以減輕效能影響。
疑難排解
語言模型暫存問題
示範專案
Windows 封裝示範專案。
如何提升效能
此插件根據不同平台使用不同的 GPU 加速方法:在 Windows 和 Linux 上使用 Vulkan,在 Mac 和 iOS 平台上使用 Metal,這些方法能顯著加快辨識過程。在其他平台上,插件則使用 CPU 搭配內建指令集進行加速。不過,您可以透過以下建議進一步提升插件的效能: