Ana içeriğe geç

Tanıma parametre listesi

Bu parametreler yalnızca tanıyıcı çalışmıyorken ayarlanabilir.

Bu, Whisper'da mevcut olan parametrelerin kapsamlı bir listesi değildir. Yalnızca en önemli olanlar burada gösterilmiştir. Gerekirse bu liste güncellenecektir.

Tanıma Parametrelerini Ayarla

Konuşma tanıma için parametreleri ayarlar. Yalnızca belirli parametreleri değiştirmek istiyorsanız, bireysel setter fonksiyonlarını kullanmayı düşünün.

Akış Varsayılanlarını Ayarla

Akış konuşma tanıma için uygun varsayılan parametreleri ayarlar.

Akışsız Varsayılanları Ayarla

Akışsız konuşma tanıma için uygun varsayılan parametreleri ayarlar.

İş Parçacığı Sayısını Ayarla

Konuşma tanıma için kullanılacak iş parçacığı sayısını ayarlar. Çekirdek sayısını kullanmak için bu değeri 0 olarak ayarlayın.

Dil Ayarla

Konuşma tanıma için kullanılacak dili ayarlar. Editör ayarlarında seçilen dil modeli tarafından desteklenmelidir.

Dili Otomatik olarak ayarlamak, tanıma doğruluğunu ve performansını düşürecektir.

İngilizceye Çevir Ayarla

Tanınan kelimelerin İngilizceye çevrilip çevrilmeyeceğini ayarlar. Doğru ise, dil modeli çok dilli olmalıdır.

Adım Boyutunu Ayarla

Milisaniye cinsinden adım boyutunu ayarlar. Tanıma için ne sıklıkla ses verisi gönderileceğini belirler. Varsayılan değer 5000 ms (5 saniye)dir.

Bağlam Kullanma Ayarla

Önceki transkripsiyonun (varsa) kod çözücü için başlangıç istemi olarak kullanılıp kullanılmayacağını ayarlar.

Tek Segment Ayarla

Tek segment çıktısı zorlanıp zorlanmayacağını ayarlar (akış için kullanışlıdır).

Maksimum Token Sayısını Ayarla

Metin segmenti başına maksimum token sayısını ayarlar. Sınırsız için 0 kullanın.

Hızlandırma Ayarla

Phase Vocoder kullanarak tanımayı 2x hızlandırıp hızlandırmayacağını ayarlar. Çıktının kalitesini artırmak için false olarak ayarlayın.

Ses Bağlam Boyutunu Ayarla

Ses bağlamının boyutunu ayarlar. Çıktının kalitesini artırmak için 0 olarak ayarlayın.

Artırılacak Sıcaklığı Ayarla

Kod çözme aşağıdaki eşiklerden herhangi birini karşılamadığında geri dönüş yapılırken artırılacak sıcaklığı ayarlar.

Entropi Eşiğini Ayarla

Entropi eşiğini ayarlar. Sıkıştırma oranı bu değerden yüksekse, kod çözme işlemini başarısız olarak değerlendir. OpenAI'ın "compression_ratio_threshold" değerine benzer.

Boşlukları Bastır

Çıktılarda boşlukların gösterilip gösterilmeyeceğini ayarlar.

Konuşma Dışı Tokenları Bastır

Çıktılarda konuşma dışı tokenların gösterilip gösterilmeyeceğini ayarlar.

Işın Boyutunu Ayarla

Işın aramasındaki ışın sayısını ayarlar. Sadece sıcaklık sıfır olduğunda uygulanabilir.

Başlangıç İstemi Ayarla

İlk pencere için başlangıç istemini ayarlar. Bu, tanımanın kelimeleri doğru tahmin etme olasılığını artırmak için bağlam sağlamak amacıyla kullanılabilir, örneğin özel kelime dağarcıkları veya özel isimler.

GPU Hızlandırmayı Ayarla

Konuşma tanıma için GPU hızlandırma kullanılıp kullanılmayacağını ayarlar (şu anda sadece Windows'ta uygulanabilir).

GPU Aygıt Kimliğini Ayarla

Konuşma tanıma için kullanılacak GPU aygıt kimliğini ayarlar. Varsayılan değer 0'dır. Bu, birden fazla GPU'ya sahip sistemlerde hangi GPU'nun tanıma işlemi için kullanılacağını belirtmek için kullanışlıdır. Belirtilen GPU aygıt kimliği geçersizse, bunun yerine ilk mevcut GPU aygıt indeksi kullanılacaktır.