Genel Bakış

Runtime Speech Recognizer, gerçek zamanlı, çevrimdışı konuşma tanımayı sağlayan çapraz platform bir eklentidir. Whisper OpenAI teknolojisine, özellikle de whisper.cpp kütüphanesine dayanır ve eklenti ayarlarında önceden seçilmiş, otomatik dil algılama yeteneklerine sahip birden fazla dil modelini destekler.
Nasıl Kurulur
İlk çalıştırmada, dil modellerini yükleyin (bunu otomatik olarak yapmanızı isteyen bir iletişim kutusu görünecektir).
Temel Açıklama
Bu eklenti, izin verici MIT lisansı altında kullanılabilen whisper.cpp kütüphanesine dayanan gelişmiş algoritmalar kullanarak gerçek zamanlı konuşma tanıma sağlar. Gelen ses verilerini (bir akış veya akış olmayan giriş olarak sağlanan, örneğin bir dosya veya ses verisi tamponu) önceden eğitilmiş dil modelleriyle eşleştirir. Çok dilli modeller kullanırken, eklenti konuşulan dili otomatik olarak algılayabilir ve bu bilgiyi tanınan metinle birlikte sağlayabilir.
Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır:
- Windows: Tanıma sürecini önemli ölçüde hızlandıran GPU hızlandırma için Vulkan kullanır
- Mac ve iOS: Windows Vulkan hızlandırmasıyla karşılaştırılabilir, hatta daha hızlı olabilen performans sunan GPU hızlandırma için Metal kullanır
- Diğer platformlar: Hızlandırma için CPU + intrinsics kullanır (Android veya Meta Quest'te yerel olarak çalıştırıldığında olduğu gibi daha yavaş olabilir)
Ek Kaynaklar
- Fab'da Edinin
- Ürün web sitesi
- Demo İndir (Windows)
- Discord destek sunucusu
- Video eğitimi
- Eklenti Desteği & Özel Geliştirme: [email protected] (takımlar ve kuruluşlar için özel çözümler)