Runtime Speech Recognizer
Runtime Speech Recognizer插件的文档。
- 在Fab上获取
- 产品网站
- 下载演示版 (Windows)
- Discord支持服务器
- 视频教程
- 定制开发: [email protected] (为团队和组织提供定制解决方案)
📄️ 概述
Runtime Speech Recognizer 文档
📄️ 如何使用该插件
Runtime Speech Recognizer 插件旨在从传入的音频数据中识别词语。它使用了稍作修改的 whisper.cpp 版本以适配引擎。使用该插件请遵循以下步骤:
📄️ 如何使用语言模型
选择、下载和打包模型
📄️ 识别参数列表
这些参数只能在识别器未运行时设置。
📄️ 支持的语言
以下是可用语言模型支持的全部语言列表。
📄️ 命令识别
计算 Levenshtein 相似度
📄️ 最小化卡顿
本指南讨论了RuntimeSpeechRecognizer插件中两种常见的卡顿来源,并提供了实际解决方案,以减轻性能影响。
📄️ 故障排除
大多数问题与语言模型的阶段有关,这可能在打包构建中引发问题。具体而言,您可能会遇到以下日志:
📄️ 演示项目
适用于 Windows 的打包演示项目。
📄️ 如何提升性能
该插件根据平台使用不同的GPU加速方法:Windows上使用Vulkan,Mac和iOS平台使用Metal,这能显著加快识别过程。在其他平台上,插件使用CPU+内部指令集进行加速。不过,您还可以通过以下建议进一步提升插件性能: