Genel Bakış

Runtime Speech Recognizer, gerçek zamanlı, çevrimdışı konuşma tanımayı sağlayan çapraz platform bir eklentidir. Whisper OpenAI teknolojisine, özellikle de whisper.cpp kütüphanesine dayanır ve otomatik dil algılama yetenekleriyle eklenti ayarlarında önceden seçilmiş birden fazla dil modelini destekler.
Nasıl Kurulur
İlk çalıştırmada, dil modellerini yükleyin (bunu otomatik olarak yapmanızı isteyen bir iletişim kutusu görünecektir).
Temel Açıklama
Bu eklenti, izin verici MIT lisansı altında kullanılabilen whisper.cpp kütüphanesine dayalı gelişmiş algoritmalar kullanarak gerçek zamanlı konuşma tanıma sağlar. Gelen ses verilerini (bir akış veya akış olmayan giriş olarak sağlanan, örneğin bir dosya veya ses verisi tamponu) önceden eğitilmiş dil modelleriyle eşleştirir. Çok dilli modeller kullanırken, eklenti konuşulan dili otomatik olarak algılayabilir ve bu bilgiyi tanınan metinle birlikte sağlayabilir.
Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır:
- Windows ve Linux: Tanıma sürecini önemli ölçüde hızlandıran GPU hızlandırma için Vulkan kullanır
- Mac ve iOS: Windows veya Linux Vulkan hızlandırmasına kıyasla daha hızlı olmasa bile benzer performans sunan GPU hızlandırma için Metal kullanır
- Diğer platformlar: Hızlandırma için CPU + intrinsics kullanır (Android veya Meta Quest gibi platformlarda yerel olarak çalıştırıldığında daha yavaş olabilir)
Ek Kaynaklar
- Fab'dan Edinin
- Ürün web sitesi
- Demo İndir (Windows)
- Discord destek sunucusu
- Video eğitimi
- Eklenti Desteği & Özel Geliştirme: [email protected] (takımlar ve organizasyonlar için özel çözümler)