跳至主要内容

概述

Runtime Speech Recognizer 是一個跨平台插件，能實現即時、離線的語音辨識。基於 Whisper OpenAI 技術，特別是 whisper.cpp 函式庫，並支援插件設定中預先選擇的多種語言模型，具備自動語言偵測功能。

如何安裝

首次執行時，安裝語言模型（系統會自動彈出對話框要求您執行此操作）。

基本描述

此插件採用基於 whisper.cpp 程式庫的先進演算法，提供即時語音辨識功能，該程式庫採用寬鬆的 MIT 授權。它能比對以串流或非串流形式（如音訊檔案或緩衝區）輸入的音訊資料，並與預先訓練的語言模型進行匹配。使用多語言模型時，插件可自動偵測口語語言，並將此資訊連同辨識出的文字一同輸出。

此插件根據平台使用不同的 GPU 加速方法：

Windows 和 Linux：使用 Vulkan 進行 GPU 加速，這能顯著加快識別過程
Mac 和 iOS：使用 Metal 進行 GPU 加速，提供與 Windows 或 Linux Vulkan 加速相當甚至更快的效能
其他平台：使用 CPU 和內在函數進行加速（例如在 Android 或 Meta Quest 上原生執行時，可能會較慢）

其他資源

在 Fab 上取得
產品網站
下載示範版 (Windows)
影片教學 (舊版影片)
外掛程式支援與自訂開發：[email protected]（為團隊與組織量身打造的解決方案）

Join our Discord

online · support

如何安裝
基本描述
其他資源