Ana içeriğe geç

Tanıma parametreleri listesi

Bu parametreler yalnızca tanıyıcı çalışmıyorken ayarlanabilir.

Bu, Whisper'da mevcut olan parametrelerin kapsamlı bir listesi değildir. Yalnızca en önemli olanlar burada açığa çıkarılmıştır. Gerektiğinde bu liste güncellenecektir.

Tanıma Parametrelerini Ayarla

Konuşma tanıma için parametreleri ayarlar. Yalnızca belirli parametreleri değiştirmek istiyorsanız, bireysel setter fonksiyonlarını kullanmayı düşünün.

Akış Varsayılanlarını Ayarla

Akış konuşma tanıma için uygun varsayılan parametreleri ayarlar.

uyarı

Bu fonksiyon daha önce uygulanmış tüm parametrelerin üzerine yazar. Akış varsayılanlarını temel yapılandırma olarak kullanmanız gerekiyorsa, özel parametrelerinizi ayarlamadan önce bunu çağırdığınızdan emin olun.

Akış Dışı Varsayılanları Ayarla

Akış dışı konuşma tanıma için uygun varsayılan parametreleri ayarlar.

uyarı

Bu fonksiyon daha önce uygulanmış tüm parametrelerin üzerine yazar. Akış dışı varsayılanlarını temel yapılandırma olarak kullanmanız gerekiyorsa, özel parametrelerinizi ayarlamadan önce bunu çağırdığınızdan emin olun.

İş Parçacığı Sayısını Ayarla

Konuşma tanıma için kullanılacak iş parçacığı sayısını ayarlar. Çekirdek sayısını kullanmak için bu değeri 0 olarak ayarlayın.

Dili Ayarla

Konuşma tanıma için kullanılacak dili ayarlar. Editör ayarlarında seçilen dil modeli tarafından desteklenmelidir.

Dili Otomatik olarak ayarlamak, tanıma doğruluğunu ve performansını düşürecektir.

Algılanan Dili Al

Son tanımadan algılanan dili alır. Dili bir enum değeri olarak döndürür.

Not: Bu fonksiyon yalnızca tanıma gerçekleştirildikten sonra çalışır. Dil algılama başarısız olduysa veya gerçekleştirilmediyse Otomatik döndürür. Bu, hangi dilin gerçekten tanındığını belirlemek için Otomatik dil algılamayı kullanırken özellikle kullanışlıdır.

Dil Kodunu Al

Bir dil enum değerini dil kod dizgisine dönüştürür (örn., En -> "en", Fr -> "fr", De -> "de").

Dil Tam Adını Al

Bir dil enum değerini dilin tam adına dönüştürür (örn., En -> "English", Fr -> "French", De -> "German").

İngilizce'ye Çevir'i Ayarla

Tanınan kelimelerin İngilizce'ye çevrilip çevrilmeyeceğini ayarlar. Doğru ise, dil modeli çok dilli olmalıdır.

Adım Boyutunu Ayarla

Milisaniye cinsinden adım boyutunu ayarlar. Ses verisinin tanıma için ne sıklıkta gönderileceğini belirler. Varsayılan değer 5000 ms (5 saniye)dir.

Bağlam Yok'u Ayarla

Geçmiş transkripsiyonun (varsa) kod çözücü için başlangıç istemi olarak kullanılıp kullanılmayacağını ayarlar.

Tek Segment'i Ayarla

Tek segment çıktısını zorlayıp zorlamayacağını ayarlar (akış için kullanışlıdır).

Maksimum Token'ı Ayarla

Metin segmenti başına maksimum token sayısını ayarlar. Sınır olmaması için 0 kullanın.

Hızlandır'ı Ayarla

Faz Vokoder kullanarak tanımayı 2x hızlandırıp hızlandırmayacağını ayarlar. Çıktının kalitesini iyileştirmek için false olarak ayarlayın.

Ses Bağlam Boyutunu Ayarla

Ses bağlamının boyutunu ayarlar. Çıktının kalitesini iyileştirmek için 0 olarak ayarlayın.

Artırılacak Sıcaklığı Ayarla

Kod çözme aşağıdaki eşiklerden herhangi birini karşılamadığında geri dönüş yaparken artırılacak sıcaklığı ayarlar.

Entropi Eşiğini Ayarla

Entropi eşiğini ayarlar. Sıkıştırma oranı bu değerden yüksekse, kod çözmeyi başarısız olarak değerlendir. OpenAI'ın "compression_ratio_threshold"ına benzer

Boşluğu Bastır'ı Ayarla

Çıktılarda görünen boşlukların bastırılıp bastırılmayacağını ayarlar.

Konuşma Dışı Token'ları Bastır'ı Ayarla

Çıktılarda görünen konuşma dışı token'ların bastırılıp bastırılmayacağını ayarlar.

Işın Boyutunu Ayarla

Işın aramasındaki ışın sayısını ayarlar. Yalnızca sıcaklık sıfır olduğunda uygulanabilir.

Başlangıç İstemini Ayarla

İlk pencere için başlangıç istemini ayarlar. Bu, kelimeleri doğru tahmin etme olasılığını artırmak için tanımaya bağlam sağlamak için kullanılabilir, örn. özel kelime dağarcıkları veya özel isimler.

Etkili isteme stratejileri hakkında daha fazla ayrıntı için Whisper İsteme Kılavuzu'na bakın.

GPU Hızlandırmasını Ayarla

Konuşma tanıma için GPU hızlandırmasının kullanılıp kullanılmayacağını ayarlar (şu anda yalnızca Windows'ta uygulanabilir).

GPU Cihaz Kimliğini Ayarla

Konuşma tanıma için kullanılacak GPU cihaz kimliğini ayarlar. Varsayılan değer 0'dır. Bu, tanıma işlemi için hangi GPU'nun kullanılması gerektiğini belirtmek için birden fazla GPU'ya sahip sistemlerde kullanışlıdır. Belirtilen GPU cihaz kimliği geçersizse, bunun yerine ilk mevcut GPU cihaz indeksi kullanılacaktır.