概述
Runtime Speech Recognizer 是一个跨平台插件,使实时、离线语音识别成为可能。基于 Whisper OpenAI 技术,特别是 whisper.cpp 库,并在插件的设置中支持多个语言模型。
如何安装
第一次运行时,请安装语言模型(将出现一个对话框,询问您是否自动执行此操作)。
基本描述
该插件使用基于 whisper.cpp 库的高级算法提供实时语音识别。它将流输入或非流输入(如音频数据文件或缓冲区)与预训练语言模型进行匹配。
在 Windows 上,该插件使用 Vulkan 进行 GPU 加速,大大加快了识别过程。在其他平台上,该插件使用 CPU + 内嵌指令进行加速。