Runtime Speech Recognizer

Runtime Speech Recognizer 外掛程式的文件。

📄️概述

Runtime Speech Recognizer Documentation

Runtime Speech Recognizer 插件旨在從傳入的音訊資料中辨識單詞。它使用略微修改過的 whisper.cpp 版本來與引擎協作。若要使用此插件，請遵循以下步驟：

選擇、下載與打包模型

這些參數只能在辨識器未運行時設定。

以下是可用語言模型所支援的完整語言清單。

計算 Levenshtein 相似度

本指南探討 RuntimeSpeechRecognizer 插件中兩個常見的凍結來源，並提供實用解決方案以減輕效能影響。

語言模型暫存問題

Windows 封裝示範專案。

此插件根據不同平台使用不同的 GPU 加速方法：在 Windows 和 Linux 上使用 Vulkan，在 Mac 和 iOS 平台上使用 Metal，這些方法能顯著加快辨識過程。在其他平台上，插件則使用 CPU 搭配內建指令集進行加速。不過，您可以透過以下建議進一步提升插件的效能：