Przejdź do głównej zawartości

Lista parametrów rozpoznawania

Te parametry mogą być ustawiane tylko wtedy, gdy rozpoznawanie nie jest uruchomione.

Nie jest to wyczerpująca lista parametrów dostępnych w Whisper. Udostępniono tu tylko najważniejsze z nich. W razie potrzeby lista ta zostanie zaktualizowana.

Ustaw parametry rozpoznawania

Ustawia parametry rozpoznawania mowy. Jeśli chcesz zmienić tylko określone parametry, rozważ użycie indywidualnych funkcji ustawiających.

Ustaw domyślne dla strumieniowania

Ustawia domyślne parametry odpowiednie dla strumieniowego rozpoznawania mowy.

Ustaw domyślne dla niestrumieniowego

Ustawia domyślne parametry odpowiednie dla niestrumieniowego rozpoznawania mowy.

Ustaw liczbę wątków

Ustawia liczbę wątków do użycia w rozpoznawaniu mowy. Ustaw tę wartość na 0, aby użyć liczby rdzeni.

Ustaw język

Ustawia język używany do rozpoznawania mowy. Musi być obsługiwany przez wybrany model językowy w ustawieniach Edytora.

Ustawienie języka na Auto zmniejszy dokładność i wydajność rozpoznawania.

Ustaw tłumaczenie na angielski

Ustawia, czy rozpoznane słowa mają być tłumaczone na język angielski. Jeśli prawda, model językowy musi być wielojęzyczny.

Ustaw rozmiar kroku

Ustawia rozmiar kroku w milisekundach. Określa, jak często wysyłać dane audio do rozpoznania. Domyślna wartość to 5000 ms (5 sekund).

Ustaw brak kontekstu

Ustawia, czy używać przeszłej transkrypcji (jeśli istnieje) jako początkowego promptu dla dekodera.

Ustaw pojedynczy segment

Ustawia, czy wymuszać wyjście w postaci pojedynczego segmentu (przydatne przy strumieniowaniu).

Ustaw maksymalną liczbę tokenów

Ustawia maksymalną liczbę tokenów na segment tekstu. Użyj 0, aby nie było limitu.

Ustaw przyspieszenie

Ustawia, czy przyspieszyć rozpoznawanie 2x przy użyciu Phase Vocoder. Ustaw na false, aby poprawić jakość wyjścia.

Ustaw rozmiar kontekstu audio

Ustawia rozmiar kontekstu audio. Ustaw na 0, aby poprawić jakość wyjścia.

Ustaw temperaturę do zwiększenia

Ustawia temperaturę do zwiększenia podczas wycofywania się, gdy dekodowanie nie spełnia któregokolwiek z poniższych progów.

Ustaw próg entropii

Ustawia próg entropii. Jeśli współczynnik kompresji jest wyższy niż ta wartość, traktuj dekodowanie jako nieudane. Podobne do "compression_ratio_threshold" od OpenAI.

Ustaw Wyciszanie Pustych Znaków

Ustawia, czy wyciszać pojawianie się pustych znaków w wynikach.

Ustaw Wyciszanie Tokenów Niewerbalnych

Ustawia, czy wyciszać pojawianie się tokenów niewerbalnych w wynikach.

Ustaw Rozmiar Wiązki

Ustawia liczbę wiązek w przeszukiwaniu wiązkowym. Dotyczy tylko sytuacji, gdy temperatura wynosi zero.

Ustaw Początkowy Prompt

Ustawia początkowy prompt dla pierwszego okna. Może być używany do zapewnienia kontekstu dla rozpoznawania, aby zwiększyć prawdopodobieństwo poprawnego przewidzenia słów, np. niestandardowe słowniki lub nazwy własne.

Ustaw Akcelerację GPU

Ustawia, czy używać akceleracji GPU do rozpoznawania mowy (obecnie dotyczy tylko systemu Windows).

Ustaw ID Urządzenia GPU

Ustawia ID urządzenia GPU do użycia w rozpoznawaniu mowy. Wartość domyślna to 0. Przydatne w systemach z wieloma GPU, aby określić, które GPU powinno być używane w procesie rozpoznawania. Jeśli podane ID urządzenia GPU jest nieprawidłowe, zostanie użyty pierwszy dostępny indeks urządzenia GPU.