Genel Bakış

Runtime Speech Recognizer, gerçek zamanlı, çevrimdışı konuşma tanımayı sağlayan çapraz platform bir eklentidir. Whisper OpenAI teknolojisine, özellikle de whisper.cpp kütüphanesine dayanır ve otomatik dil algılama yetenekleriyle eklenti ayarlarında önceden seçilmiş birden fazla dil modelini destekler.

Nasıl Kurulur

İlk çalıştırmada, dil modellerini yükleyin (bunu otomatik olarak yapmanızı isteyen bir iletişim kutusu görünecektir).

Temel Açıklama

Bu eklenti, izin verici MIT lisansı altında kullanılabilen whisper.cpp kütüphanesine dayalı gelişmiş algoritmalar kullanarak gerçek zamanlı konuşma tanıma sağlar. Gelen ses verilerini (bir akış veya akış olmayan giriş olarak sağlanan, örneğin bir dosya veya ses verisi tamponu) önceden eğitilmiş dil modelleriyle eşleştirir. Çok dilli modeller kullanırken, eklenti konuşulan dili otomatik olarak algılayabilir ve bu bilgiyi tanınan metinle birlikte sağlayabilir.

Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır:

Windows ve Linux: Tanıma sürecini önemli ölçüde hızlandıran GPU hızlandırma için Vulkan kullanır
Mac ve iOS: Windows veya Linux Vulkan hızlandırmasına kıyasla daha hızlı olmasa bile benzer performans sunan GPU hızlandırma için Metal kullanır
Diğer platformlar: Hızlandırma için CPU + intrinsics kullanır (Android veya Meta Quest gibi platformlarda yerel olarak çalıştırıldığında daha yavaş olabilir)

Ek Kaynaklar

Fab'dan Edinin
Ürün web sitesi
Demo İndir (Windows)
Discord destek sunucusu
Video eğitimi
Eklenti Desteği & Özel Geliştirme: [email protected] (takımlar ve organizasyonlar için özel çözümler)

Nasıl Kurulur​

Temel Açıklama​

Ek Kaynaklar​

Nasıl Kurulur

Temel Açıklama

Ek Kaynaklar