Runtime Speech Recognizer

Runtime Speech Recognizer 插件文档。

📄️概述

Runtime Speech Recognizer 文档

Runtime Speech Recognizer 插件旨在从传入的音频数据中识别词语。它使用了略微修改版的 whisper.cpp 来与引擎协同工作。要使用该插件，请按照以下步骤操作：

选择、下载和打包模型

这些参数只能在识别器未运行时设置。

这是可用语言模型支持的完整语言列表。

计算莱文斯坦相似度

本指南讨论了RuntimeSpeechRecognizer插件中两种常见的卡顿来源，并提供了实际解决方案，以减轻性能影响。

语言模型部署问题

适用于 Windows 的打包演示项目。

该插件根据平台使用不同的 GPU 加速方法：在 Windows 和 Linux 上使用 Vulkan，在 Mac 和 iOS 平台上使用 Metal，这显著加快了识别过程。在其他平台上，插件使用 CPU + 内部函数进行加速。然而，您可以通过遵循以下建议进一步提升插件的性能：