Ana içeriğe geç

Performansı nasıl iyileştirirsiniz

Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır: Windows'ta Vulkan, Mac ve iOS platformlarında Metal kullanılır ve bu da tanıma sürecini önemli ölçüde hızlandırır. Diğer platformlarda, eklenti hızlandırma için CPU + intrinsics kullanır. Ancak, aşağıdaki önerileri takip ederek eklentinin performansını daha da iyileştirebilirsiniz:

  1. Ses Aktivite Tespiti (VAD) Kullanın

    Tanıyıcının yanıt verme hızını artırmak için Ses Aktivite Tespiti kullanmanız şiddetle tavsiye edilir; bu, kullanıcı konuşmayı bıraktığında sabit zaman aralıkları beklemek yerine konuşmayı hemen tanıma için göndermenizi sağlar. Bu amaçla özellikle Silero VAD önerilir. Detaylı uygulama talimatları için Ses Aktivite Tespiti belgelerine bakın.

  2. Adım Boyutunu Azaltın

    Varsayılan olarak, adım boyutu 5000 ms (5 saniye)'dir, yani ses verisi yakalama sırasında her 5 saniyede bir tanınır. Ses verisini daha sık tanımak istiyorsanız, adım boyutunu örneğin 500 ms (0.5 saniye) gibi bir değere düşürebilirsiniz. Ancak, VAD aktifse (ki genellikle sabit aralıklara ihtiyaç duyan özel gereksinimleriniz yoksa önerilir), adım boyutunu azaltmaya güvenmemek tavsiye edilir. Sesle Etkinleştirilmiş Komut Tanıma veya Son Tampon İşleme ile Otomatik Başlatılan Ses Tanıma gibi tipik kurulumlarda VAD kullanırken, konuşma zaten kullanıcı konuşmayı bıraktığında tanınacaktır.

  3. Daha Küçük Bir Dil Modeli Kullanın

    Model boyutunu azaltmak ve performansı artırmak için Tiny Quantized (Q5_1) gibi daha küçük bir dil modeli kullanmayı düşünebilirsiniz. Bir dil modeli nasıl seçileceğine dair talimatlar burada bulunabilir.

  4. Tanıma Durumu Yönetimini Optimize Edin

    Mikrofon girişiyle çalışırken, konuşma tanıyıcının gereksiz durdurulmasından ve başlatılmasından kaçının. Kaynakların yeniden tahsis edilmesini gerektiren StopSpeechRecognition ve StartSpeechRecognition'ı sıkça çağırmak yerine, ses girişini doğrudan kontrol etmeyi düşünün. Örneğin, yakalanabilir ses dalgası ile, tanıma iş parçacığını aktif tutarken ses akışını yönetmek için StopCapture ve StartCapture kullanın.