انتقل إلى المحتوى الرئيسي

نظرة عامة

Runtime Speech Recognizer Documentation

Runtime Speech Recognizer هو إضافة متعددة المنصات تتيح التعرف على الكلام في الوقت الفعلي دون اتصال بالإنترنت. يعتمد على تقنية Whisper من OpenAI، وتحديدًا مكتبة whisper.cpp، ويدعم نماذج لغوية متعددة محددة مسبقًا في إعدادات الإضافة.

كيفية التثبيت

عند التشغيل الأول، قم بتثبيت النماذج اللغوية (ستظهر نافذة حوار تطلب منك القيام بذلك تلقائيًا).

الوصف الأساسي

توفر هذه الإضافة التعرف على الكلام في الوقت الفعلي باستخدام خوارزميات متقدمة تعتمد على مكتبة whisper.cpp. تقوم بمطابقة بيانات الصوت الواردة، سواء كانت على شكل تدفق أو مدخلات غير متدفقة (مثل ملف أو مخزن مؤقت لبيانات الصوت)، مع النماذج اللغوية المدربة مسبقًا.

على نظام Windows، تستخدم الإضافة Vulkan لتسريع العملية بواسطة وحدة معالجة الرسوميات (GPU)، مما يزيد من سرعة التعرف بشكل كبير. على المنصات الأخرى، تستخدم الإضافة وحدة المعالجة المركزية (CPU) مع تقنيات التسريع المضمنة.

موارد إضافية