Tanıma parametreleri listesi
Bu parametreler yalnızca tanıyıcı çalışmıyorken ayarlanabilir.
Bu, Whisper'da mevcut olan parametrelerin kapsamlı bir listesi değildir. Yalnızca en önemli olanlar burada gösterilmiştir. Gerekirse bu liste güncellenecektir.
Tanıma Parametrelerini Ayarla

Konuşma tanıma için parametreleri ayarlar. Yalnızca belirli parametreleri değiştirmek istiyorsanız, bireysel ayarlayıcı işlevlerini kullanmayı düşünün.
Akış Varsayılanlarını Ayarla

Akış konuşma tanıma için uygun varsayılan parametreleri ayarlar.
Akışsız Varsayılanları Ayarla

Akışsız konuşma tanıma için uygun varsayılan parametreleri ayarlar.
İş Parçacığı Sayısını Ayarla

Konuşma tanıma için kullanılacak iş parçacığı sayısını ayarlar. Çekirdek sayısını kullanmak için bu değeri 0 olarak ayarlayın.
Dili Ayarla

Konuşma tanıma için kullanılacak dili ayarlar. Editör ayarlarında seçilen dil modeli tarafından desteklenmelidir.
Dili Otomatik olarak ayarlamak, tanıma doğruluğunu ve performansını düşürecektir.
Algılanan Dili Al

Son tanımadan algılanan dili alır. Dili bir enum değeri olarak döndürür.
Not: Bu işlev yalnızca tanıma gerçekleştirildikten sonra çalışır. Dil algılama başarısız olduysa veya gerçekleştirilmediyse Otomatik değerini döndürür. Bu, özellikle Otomatik dil algılama kullanırken hangi dilin gerçekte tanındığını belirlemek için kullanışlıdır.
Dil Kodunu Al

Bir dil enum değerini dil kod dizgisine dönüştürür (örn., En -> "en", Fr -> "fr", De -> "de").
Dil Tam Adını Al

Bir dil enum değerini dilin tam adına dönüştürür (örn., En -> "English", Fr -> "French", De -> "German").
İngilizce'ye Çevir'i Ayarla

Tanınan kelimelerin İngilizce'ye çevrilip çevrilmeyeceğini ayarlar. Doğru ise, dil modeli çok dilli olmalıdır.
Adım Boyutunu Ayarla

Milisaniye cinsinden adım boyutunu ayarlar. Ses verisinin tanıma için ne sıklıkta gönderileceğini belirler. Varsayılan değer 5000 ms (5 saniye) dir.
Bağlam Kullanmama'yı Ayarla

Geçmiş transkripsiyonun (varsa) kod çözücü için başlangıç istemi olarak kullanılıp kullanılmayacağını ayarlar.
Tek Segment'i Ayarla

Tek segment çıktısını zorlayıp zorlamayacağını ayarlar (akış için kullanışlıdır).
Maksimum Token Sayısını Ayarla
Metin bölümü başına maksimum token sayısını ayarlar. Sınırsız için 0 kullanın.
Hızlandırmayı Ayarla

Tanımanın Phase Vocoder kullanılarak 2 kat hızlandırılıp hızlandırılmayacağını ayarlar. Çıktının kalitesini artırmak için false olarak ayarlayın.
Ses Bağlamı Boyutunu Ayarla

Ses bağlamının boyutunu ayarlar. Çıktının kalitesini artırmak için 0 olarak ayarlayın.
Artırılacak Sıcaklığı Ayarla

Aşağıdaki eşiklerden herhangi birini karşılamak için kod çözme başarısız olduğunda geri dönüş yaparken artırılacak sıcaklığı ayarlar.
Entropi Eşiğini Ayarla

Entropi eşiğini ayarlar. Sıkıştırma oranı bu değerden yüksekse, kod çözmeyi başarısız olarak değerlendirir. OpenAI'ın "compression_ratio_threshold" değerine benzer.
Boşlukları Bastırmayı Ayarla

Çıktılarda görünen boşlukların bastırılıp bastırılmayacağını ayarlar.
Konuşma Dışı Token'ları Bastırmayı Ayarla

Çıktılarda görünen konuşma dışı token'ların bastırılıp bastırılmayacağını ayarlar.
Işın Boyutunu Ayarla

Işın aramasındaki ışın sayısını ayarlar. Yalnızca sıcaklık sıfır olduğunda uygulanabilir.
Başlangıç İstemini Ayarla

İlk pencere için başlangıç istemini ayarlar. Bu, tanımanın kelimeleri doğru tahmin etme olasılığını artırmak için bağlam sağlamak üzere kullanılabilir, örneğin özel kelime dağarcıkları veya özel isimler.
GPU Hızlandırmayı Ayarla

Konuşma tanıma için GPU hızlandırmanın kullanılıp kullanılmayacağını ayarlar (şu anda yalnızca Windows'ta uygulanabilir).
GPU Cihaz Kimliğini Ayarla

Konuşma tanıma için kullanılacak GPU cihaz kimliğini ayarlar. Varsayılan değer 0'dır. Bu, birden fazla GPU'ya sahip sistemlerde hangi GPU'nun tanıma işlemi için kullanılması gerektiğini belirtmek için kullanışlıdır. Belirtilen GPU cihaz kimliği geçersizse, bunun yerine ilk kullanılabilir GPU cihaz dizini kullanılacaktır.