Ana içeriğe geç

Performansı nasıl iyileştirirsiniz

Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır: Windows ve Linux'ta Vulkan, Mac ve iOS platformlarında Metal kullanılır ve bu yöntemler tanıma sürecini önemli ölçüde hızlandırır. Diğer platformlarda, eklenti hızlandırma için CPU + intrinsics kullanır. Ancak, aşağıdaki önerileri izleyerek eklentinin performansını daha da iyileştirebilirsiniz:

  1. Ses Aktivite Tespiti (VAD) Kullanın

    Tanıyıcının yanıt hızını iyileştirmek için Ses Aktivite Tespiti kullanmanız şiddetle tavsiye edilir. Bu, kullanıcı konuşmayı bıraktığında konuşmayı sabit zaman aralıkları beklemek yerine hemen tanıma için göndermenizi sağlar. Bu amaçla özellikle Silero VAD önerilir. Ayrıntılı uygulama talimatları için Ses Aktivite Tespiti belgelerine bakın.

  2. Adım Boyutunu Azaltın

    Varsayılan olarak, adım boyutu 5000 ms (5 saniye)'dir, yani ses verisi yakalama sırasında her 5 saniyede bir tanınır. Ses verisini daha sık tanımak istiyorsanız, adım boyutunu 500 ms (0.5 saniye) gibi bir değere düşürebilirsiniz. Ancak, VAD aktifse (ki bu genellikle sabit aralıklara ihtiyaç duyan özel gereksinimleriniz yoksa önerilir), adım boyutunu azaltmaya güvenmemek tavsiye edilir. Sesle Etkinleştirilen Komut Tanıma veya Son Tampon İşleme ile Otomatik Başlatılan Ses Tanıma gibi tipik kurulumlarda VAD kullanırken, konuşma zaten kullanıcı konuşmayı bıraktığında tanınacaktır.

  3. Daha Küçük Bir Dil Modeli Kullanın

    Model boyutunu azaltmak ve performansı iyileştirmek için Tiny Quantized (Q5_1) gibi daha küçük bir dil modeli kullanmayı düşünebilirsiniz. Bir dil modeli nasıl seçileceğine dair talimatları burada bulabilirsiniz.

  4. Tanıma Durumu Yönetimini Optimize Edin

    Mikrofon girişiyle çalışırken, konuşma tanıyıcının gereksiz durdurulmasından ve başlatılmasından kaçının. Kaynakların yeniden tahsisini gerektiren StopSpeechRecognition ve StartSpeechRecognition çağrılarını sık sık yapmak yerine, ses girişini doğrudan kontrol etmeyi düşünün. Örneğin, yakalanabilir ses dalgası ile, tanıma iş parçacığını aktif tutarken ses akışını yönetmek için StopCapture ve StartCapture kullanın.