Lista parametrów rozpoznawania
Te parametry mogą być ustawiane tylko wtedy, gdy rozpoznawanie nie jest uruchomione.
Nie jest to wyczerpująca lista parametrów dostępnych w Whisper. Udostępniono tu tylko najważniejsze z nich. W razie potrzeby lista ta zostanie zaktualizowana.
Ustaw parametry rozpoznawania
Ustawia parametry rozpoznawania mowy. Jeśli chcesz zmienić tylko określone parametry, rozważ użycie indywidualnych funkcji ustawiających.
Ustaw domyślne dla strumieniowania
Ustawia domyślne parametry odpowiednie dla strumieniowego rozpoznawania mowy.
Ustaw domyślne dla niestrumieniowego
Ustawia domyślne parametry odpowiednie dla niestrumieniowego rozpoznawania mowy.
Ustaw liczbę wątków
Ustawia liczbę wątków do użycia w rozpoznawaniu mowy. Ustaw tę wartość na 0, aby użyć liczby rdzeni.
Ustaw język
Ustawia język używany do rozpoznawania mowy. Musi być obsługiwany przez wybrany model językowy w ustawieniach Edytora.
Ustawienie języka na Auto zmniejszy dokładność i wydajność rozpoznawania.
Ustaw tłumaczenie na angielski
Ustawia, czy rozpoznane słowa mają być tłumaczone na język angielski. Jeśli prawda, model językowy musi być wielojęzyczny.
Ustaw rozmiar kroku
Ustawia rozmiar kroku w milisekundach. Określa, jak często wysyłać dane audio do rozpoznania. Domyślna wartość to 5000 ms (5 sekund).
Ustaw brak kontekstu
Ustawia, czy używać przeszłej transkrypcji (jeśli istnieje) jako początkowego promptu dla dekodera.
Ustaw pojedynczy segment
Ustawia, czy wymuszać wyjście w postaci pojedynczego segmentu (przydatne przy strumieniowaniu).
Ustaw maksymalną liczbę tokenów
Ustawia maksymalną liczbę tokenów na segment tekstu. Użyj 0, aby nie było limitu.
Ustaw przyspieszenie
Ustawia, czy przyspieszyć rozpoznawanie 2x przy użyciu Phase Vocoder. Ustaw na false
, aby poprawić jakość wyjścia.
Ustaw rozmiar kontekstu audio
Ustawia rozmiar kontekstu audio. Ustaw na 0
, aby poprawić jakość wyjścia.
Ustaw temperaturę do zwiększenia
Ustawia temperaturę do zwiększenia podczas wycofywania się, gdy dekodowanie nie spełnia któregokolwiek z poniższych progów.
Ustaw próg entropii
Ustawia próg entropii. Jeśli współczynnik kompresji jest wyższy niż ta wartość, traktuj dekodowanie jako nieudane. Podobne do "compression_ratio_threshold" od OpenAI.
Ustaw Wyciszanie Pustych Znaków
Ustawia, czy wyciszać pojawianie się pustych znaków w wynikach.
Ustaw Wyciszanie Tokenów Niewerbalnych
Ustawia, czy wyciszać pojawianie się tokenów niewerbalnych w wynikach.
Ustaw Rozmiar Wiązki
Ustawia liczbę wiązek w przeszukiwaniu wiązkowym. Dotyczy tylko sytuacji, gdy temperatura wynosi zero.
Ustaw Początkowy Prompt
Ustawia początkowy prompt dla pierwszego okna. Może być używany do zapewnienia kontekstu dla rozpoznawania, aby zwiększyć prawdopodobieństwo poprawnego przewidzenia słów, np. niestandardowe słowniki lub nazwy własne.
Ustaw Akcelerację GPU
Ustawia, czy używać akceleracji GPU do rozpoznawania mowy (obecnie dotyczy tylko systemu Windows).
Ustaw ID Urządzenia GPU
Ustawia ID urządzenia GPU do użycia w rozpoznawaniu mowy. Wartość domyślna to 0. Przydatne w systemach z wieloma GPU, aby określić, które GPU powinno być używane w procesie rozpoznawania. Jeśli podane ID urządzenia GPU jest nieprawidłowe, zostanie użyty pierwszy dostępny indeks urządzenia GPU.