Tanıma parametre listesi
Bu parametreler yalnızca tanıyıcı çalışmıyorken ayarlanabilir.
Bu, Whisper'da mevcut olan parametrelerin kapsamlı bir listesi değildir. Yalnızca en önemli olanlar burada gösterilmiştir. Gerekirse bu liste güncellenecektir.
Tanıma Parametrelerini Ayarla
Konuşma tanıma için parametreleri ayarlar. Yalnızca belirli parametreleri değiştirmek istiyorsanız, bireysel setter fonksiyonlarını kullanmayı düşünün.
Akış Varsayılanlarını Ayarla
Akış konuşma tanıma için uygun varsayılan parametreleri ayarlar.
Akışsız Varsayılanları Ayarla
Akışsız konuşma tanıma için uygun varsayılan parametreleri ayarlar.
İş Parçacığı Sayısını Ayarla
Konuşma tanıma için kullanılacak iş parçacığı sayısını ayarlar. Çekirdek sayısını kullanmak için bu değeri 0 olarak ayarlayın.
Dil Ayarla
Konuşma tanıma için kullanılacak dili ayarlar. Editör ayarlarında seçilen dil modeli tarafından desteklenmelidir.
Dili Otomatik olarak ayarlamak, tanıma doğruluğunu ve performansını düşürecektir.
İngilizceye Çevir Ayarla
Tanınan kelimelerin İngilizceye çevrilip çevrilmeyeceğini ayarlar. Doğru ise, dil modeli çok dilli olmalıdır.
Adım Boyutunu Ayarla
Milisaniye cinsinden adım boyutunu ayarlar. Tanıma için ne sıklıkla ses verisi gönderileceğini belirler. Varsayılan değer 5000 ms (5 saniye)dir.
Bağlam Kullanma Ayarla
Önceki transkripsiyonun (varsa) kod çözücü için başlangıç istemi olarak kullanılıp kullanılmayacağını ayarlar.
Tek Segment Ayarla
Tek segment çıktısı zorlanıp zorlanmayacağını ayarlar (akış için kullanışlıdır).
Maksimum Token Sayısını Ayarla
Metin segmenti başına maksimum token sayısını ayarlar. Sınırsız için 0 kullanın.
Hızlandırma Ayarla
Phase Vocoder kullanarak tanımayı 2x hızlandırıp hızlandırmayacağını ayarlar. Çıktının kalitesini artırmak için false
olarak ayarlayın.
Ses Bağlam Boyutunu Ayarla
Ses bağlamının boyutunu ayarlar. Çıktının kalitesini artırmak için 0
olarak ayarlayın.
Artırılacak Sıcaklığı Ayarla
Kod çözme aşağıdaki eşiklerden herhangi birini karşılamadığında geri dönüş yapılırken artırılacak sıcaklığı ayarlar.
Entropi Eşiğini Ayarla
Entropi eşiğini ayarlar. Sıkıştırma oranı bu değerden yüksekse, kod çözme işlemini başarısız olarak değerlendir. OpenAI'ın "compression_ratio_threshold" değerine benzer.
Boşlukları Bastır
Çıktılarda boşlukların gösterilip gösterilmeyeceğini ayarlar.
Konuşma Dışı Tokenları Bastır
Çıktılarda konuşma dışı tokenların gösterilip gösterilmeyeceğini ayarlar.
Işın Boyutunu Ayarla
Işın aramasındaki ışın sayısını ayarlar. Sadece sıcaklık sıfır olduğunda uygulanabilir.
Başlangıç İstemi Ayarla
İlk pencere için başlangıç istemini ayarlar. Bu, tanımanın kelimeleri doğru tahmin etme olasılığını artırmak için bağlam sağlamak amacıyla kullanılabilir, örneğin özel kelime dağarcıkları veya özel isimler.
GPU Hızlandırmayı Ayarla
Konuşma tanıma için GPU hızlandırma kullanılıp kullanılmayacağını ayarlar (şu anda sadece Windows'ta uygulanabilir).
GPU Aygıt Kimliğini Ayarla
Konuşma tanıma için kullanılacak GPU aygıt kimliğini ayarlar. Varsayılan değer 0'dır. Bu, birden fazla GPU'ya sahip sistemlerde hangi GPU'nun tanıma işlemi için kullanılacağını belirtmek için kullanışlıdır. Belirtilen GPU aygıt kimliği geçersizse, bunun yerine ilk mevcut GPU aygıt indeksi kullanılacaktır.