Genel Bakış
Runtime Speech Recognizer, gerçek zamanlı, çevrimdışı konuşma tanıma sağlayan çapraz platform bir eklentidir. Whisper OpenAI teknolojisine, özellikle de whisper.cpp kütüphanesine dayanır ve eklenti ayarlarında önceden seçilmiş birden fazla dil modelini destekler.
Nasıl kurulur
İlk çalıştırmada, dil modellerini yükleyin (bunu otomatik olarak yapmanızı isteyen bir iletişim kutusu görünecektir).
Temel açıklama
Bu eklenti, izin verici MIT lisansı altında kullanılabilen whisper.cpp kütüphanesine dayanan gelişmiş algoritmalar kullanarak gerçek zamanlı konuşma tanıma sağlar. Gelen ses verilerini (bir akış veya akış olmayan girdi olarak sağlanan, örneğin bir dosya veya ses verisi tamponu) önceden eğitilmiş dil modelleriyle eşleştirir.
Eklenti, platforma bağlı olarak farklı GPU hızlandırma yöntemleri kullanır:
- Windows: GPU hızlandırma için Vulkan kullanır, bu da tanıma sürecini önemli ölçüde hızlandırır
- Mac ve iOS: GPU hızlandırma için Metal kullanır, Windows Vulkan hızlandırmasıyla karşılaştırılabilir, hatta daha hızlı performans sunar
- Diğer platformlar: Hızlandırma için CPU + intrinsics kullanır (Android veya Meta Quest gibi platformlarda yerel olarak çalıştırıldığında daha yavaş olabilir)
Ek Kaynaklar
- Fab'dan edinin
- Ürün web sitesi
- Demo İndir (Windows)
- Discord destek sunucusu
- Video eğitimi
- Özel Geliştirme: [email protected] (ekipler ve organizasyonlar için özelleştirilmiş çözümler)