概述
Runtime Speech Recognizer 是一个跨平台插件,可实现实时离线语音识别。基于 Whisper OpenAI 技术,特别是 whisper.cpp 库,并支持在插件设置中预选的多种语言模型。
安装方法
首次运行时需安装语言模型(将自动弹出对话框提示安装)。
基本描述
该插件通过基于 whisper.cpp 库的高级算法提供实时语音识别功能。它能将输入的音频数据(以流或非流形式提供,如文件或音频数据缓冲区)与预训练的语言模型进行匹配。
在 Windows 平台上,插件使用 Vulkan 进行 GPU 加速,可显著提升识别速度。在其他平台上,则使用 CPU + 内部指令集进行加速。
其他资源
- 在 Fab 上获取
- 产品官网
- 下载演示版 (Windows)
- Discord 支持服务器
- 视频教程
- 定制开发: [email protected](为团队和组织提供定制解决方案)