概览
Runtime Speech Recognizer 是一个跨平台插件,可实现实时、离线的语音识别。基于 Whisper OpenAI 技术,特别是 whisper.cpp 库,并支持在插件设置中预选的多种语言模型。
如何安装
首次运行时,安装语言模型(会自动弹出一个对话框提示您这样做)。
基本描述
此插件基于 whisper.cpp 库的先进算法提供实时语音识别。它将提供的流式或非流式输入(如文件或音频数据的缓冲区)的音频数据与 预训练的语言模型进行匹配。
在 Windows 平台,该插件使用 Vulkan 进行 GPU 加速,这大大加快了识别过程。在其他平台,插件使用 CPU + intrinsics 进行加速。
额外资源
- 在 Fab 上获取
- 下载演示(Windows)
- Discord 支持服务器
- 视频教程
- 定制开发:[email protected](为团队和组织量身定制的解决方案)