Runtime Speech Recognizer
Runtime Speech Recognizer 插件文档。
- 在 Fab 上获取
- 下载演示 (Windows)
- Discord 支持服务器
- 视频教程
- 定制开发:[email protected](为团队和组织提供定制解决方案)
📄️ 概览
Runtime Speech Recognizer 文档
📄️ 如何使用插件
Runtime Speech Recognizer 插件旨在识别来自输入音频数据 的单词。它使用了 whisper.cpp 的一个稍作修改的版本来与引擎配合工作。要使用该插件,请按照以下步骤操作:
📄️ 如何使用语言模型
选择、下载和打包模型
📄️ 识别参数列表
这些参数只能在识别器未运行时设置。
📄️ 支持的语言
以下是当前可用语言模型支持的完整语言列表。
📄️ 命令识别
计算 Levenshtein 相似度
📄️ 最小化卡顿
本指南讨论了RuntimeSpeechRecognizer插件中两种常见的卡顿来源,并提供了实际解决方案,以减轻性能影响。
📄️ 故障排除
大多数问题与语言模型的阶段有关,这可能在打包构建中引发问题。具体而言,您可能会遇到以下日志:
📄️ 演示项目
适用于 Windows 的打包演示项目。
📄️ 如何提升性能
Windows 平台使用 Vulkan 进行 GPU 加速,这显著提升了识别过程的速度。在其他平台上,该插件使用 CPU + intrinsics 进行加速。然而,您可以通过以下建议进一步提高插件的性能: