Performansı nasıl iyileştirirsiniz
Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır: Windows'ta Vulkan, Mac ve iOS platformlarında Metal kullanılır ve bu da tanıma sürecini önemli ölçüde hızlandırır. Diğer platformlarda, eklenti hızlandırma için CPU + intrinsics kullanır. Ancak, aşağıdaki önerileri takip ederek eklentinin performansını daha da iyileştirebilirsiniz:
-
Ses Aktivite Tespiti (VAD) Kullanın
Tanıyıcının yanıt verme hızını artırmak için Ses Aktivite Tespiti kullanmanız şiddetle tavsiye edilir; bu, kullanıcı konuşmayı bıraktığında sabit zaman aralıkları beklemek yerine konuşmayı hemen tanıma için göndermenizi sağlar. Bu amaçla özellikle Silero VAD önerilir. Detaylı uygulama talimatları için Ses Aktivite Tespiti belgelerine bakın.
-
Adım Boyutunu Azaltın
Varsayılan olarak, adım boyutu 5000 ms (5 saniye)'dir, yani ses verisi yakalama sırasında her 5 saniyede bir tanınır. Ses verisini daha sık tanımak istiyorsanız, adım boyutunu örneğin 500 ms (0.5 saniye) gibi bir değere düşürebilirsiniz. Ancak, VAD aktifse (ki genellikle sabit aralıklara ihtiyaç duyan özel gereksinimleriniz yoksa önerilir), adım boyutunu azaltmaya güvenmemek tavsiye edilir. Sesle Etkinleştirilmiş Komut Tanıma veya Son Tampon İşleme ile Otomatik Başlatılan Ses Tanıma gibi tipik kurulumlarda VAD kullanırken, konuşma zaten kullanıcı konuşmayı bıraktığında tanınacaktır.
-
Daha Küçük Bir Dil Modeli Kullanın
Model boyutunu azaltmak ve performansı artırmak için
Tiny Quantized (Q5_1)
gibi daha küçük bir dil modeli kullanmayı düşünebilirsiniz. Bir dil modeli nasıl seçileceğine dair talimatlar burada bulunabilir. -
Tanıma Durumu Yönetimini Optimize Edin
Mikrofon girişiyle çalışırken, konuşma tanıyıcının gereksiz durdurulmasından ve başlatılmasından kaçının. Kaynakların yeniden tahsis edilmesini gerektiren
StopSpeechRecognition
veStartSpeechRecognition
'ı sıkça çağırmak yerine, ses girişini doğrudan kontrol etmeyi düşünün. Örneğin, yakalanabilir ses dalgası ile, tanıma iş parçacığını aktif tutarken ses akışını yönetmek içinStopCapture
veStartCapture
kullanın.